羅 彪
功能,是指事物或方法所發揮的有利作用,即功效。大數據支持國防動員決策功能,是指大數據在國防動員決策中發揮的效能或作用。大數據能夠快速提煉國防動員海量數據,形成信息、知識優勢,并將之導入國防動員的決策領域和關鍵環節,改進決策模式,提高決策質量和水平,助力提升國防動員能力。
關于大數據功能,不同學者有不同的觀點,這些觀點源于不同的角度,且具有不同的特點。西方學者和研究機構不僅指出大數據的實證價值,并從實踐應用中認識到大數據對決策過程的改進作用。20世紀中期,美國學者愛德華茲·戴明認為,“除了上帝,任何人都必須用數據來說話”。IBM資深大數據專家杰夫·喬納斯也提出了同樣的觀點,“讓數據說話”。全球著名管理咨詢公司麥肯錫在其報告中指出,“復雜分析能顯著地改進決策過程”。
基于大數據發展及其廣泛應用,我國學者對大數據的基本功能及其衍生出來的附屬功能進行了描述和分析。國務院《促進大數據發展行動綱要》從戰略層面對大數據的功能給予定位,賦予大數據“推動經濟轉型發展”“重塑國家競爭優勢”“提升政府治理能力”的功能,并將數據界定為“國家基礎性戰略資源”。鄒振寧、榮希君等從軍事角度指出大數據技術的軍事指揮價值,主要包括提高五種能力:情報獲取能力、輔助決策能力、作戰控制能力、偵察攻擊能力、網絡安全能力。胡鍵則從大數據基本功能的角度,闡述大數據在促進公共管理變革中的重要功能,包括數據收集功能、數據管理功能、數據分析功能、數據挖掘和數據重組功能、預測功能。肖慶文、李鈺等對大數據普遍衍生功能進行高度概括,認為大數據主要有以下幾種較為常用的功能:一是追蹤,即追蹤、追溯任何一個互聯網或物聯網的記錄,形成真實的歷史軌跡;二是識別,在對各種因素全面追蹤的基礎上,通過定位、對比、篩選,可以實現精準識別,尤其是對語音、圖像、視頻進行識別;三是畫像,通過對同一主體不同數據源的追蹤、識別、匹配,形成更立體的刻畫和更全面的認識;四是提示,在歷史軌跡、識別和畫像基礎上,預測未來趨勢及重復出現的可能性,當某些指標出現預期變化或超預期變化時給予提示、預警;五是匹配,在海量信息中精準追蹤和識別,利用相關性、接近性等進行篩選對比,更有效率地實現供需匹配,該功能是互聯網約車、租房、金融等共享經濟新商業模式的基礎;六是優化,按距離最短、成本最低等給定的原則,通過各種算法對路徑、資源等進行優化配置。
無論是西方研究機構還是我國學者的研究成果,對于我們研究大數據支持國防動員決策功能都具有重要的參考價值。
大數據是數據資源,也是技術手段,大數據的這種本質屬性,直接決定了大數據支持國防動員決策的基本功能,即決策數據采集、決策數據存儲、決策數據分析等居于主要地位的功能。這是大數據在國防動員決策中根本的、基礎的,且是恒常的、穩定的功能。
數據采集是指通過RFID射頻數據、傳感器數據、社交網絡交互數據及移動互聯網數據等方式獲得各種類型的結構化、半結構化(或稱之為弱結構化),以及非結構化的海量數據①http://www.szcomtop.com/fastar/news/20161206/news151926.html。國防動員決策大數據的主要來源,包括政府數據、軍事數據、網絡數據及傳感器數據等。傳統的國防動員決策數據采集來源單一,且存儲、管理和分析數據量也較小,大多可采用關系數據庫和并行數據倉庫處理。而大數據時代的國防動員決策數據采集,來源廣泛、數據量巨大,且數據類型豐富,包括結構化、半結構化、非結構化的數據,必須采用分布式數據庫才能有效存儲和處理。相較于傳統的數據采集,大數據時代的國防動員決策,面對的是海量、多源、異構的數據。這些特點決定了國防動員決策數據的有效采集必須借助大數據采集技術。應用比較廣泛的大數據采集技術主要包括以下三種。
1.系統日志采集技術。主要是通過地方和軍隊國防動員業務信息平臺收集業務日志數據,供離線或在線的分析系統使用。比較成熟的采集工具有Chukwa、Flume、Scribe等。它們均采用分布式架構,能滿足海量、高速的日志數據采集要求。
2.網絡數據采集技術。即通過“網絡爬蟲”或網站公開API等方式從政府政務網、軍隊寬帶網、公共數據網等平臺上獲取國防動員數據信息的過程。其支持圖片、音頻、視頻等文件的采集,且附件與正文可自動關聯,可將非結構化數據、半結構化數據從網頁中提取出來,并存儲為統一的本地結構化數據文件。
3.其他數據采集技術。對于國防動員領域中的同期性數據,可借助物聯網傳感設備等硬件采集;保密性要求較高的數據,可使用特定系統接口等相關方式采集。
大數據時代,國防動員決策數據容量呈爆炸式增長。從數據存儲的發展趨勢來看,一方面,對數據存儲量的需求越來越大;另一方面,對數據的有效管理提出了更高的要求。國防動員決策大數據對存儲設備的容量、讀寫性能、可靠性、擴展性都提出了更高的要求,需要充分考慮功能集成度、數據安全性、數據穩定性、系統可擴展性、性能及成本等各方面的因素。
大數據的存儲及處理不僅在于規模大,更要求傳輸及處理的響應速度快。提到數據存儲技術,就離不開數據庫技術。從目前的發展趨勢看,數據庫主要分為關系型數據庫、非關系型數據庫、數據庫緩存系統3種類型。傳統的國防動員決策數據通常使用關系型數據庫MYSQL和Oracle等來存儲。
由于國防動員決策大數據數據來源多樣、應用算法繁多、結構化程度不同、數據格式多樣,傳統的數據庫存儲技術已無法適應國防動員決策大數據的存儲。為了解決國防動員領域大規模數據集合、多重數據種類、來源和格式帶來的挑戰,非關系型NoSQL數據庫發揮了明顯作用。包括鍵值存儲數據庫、列存儲數據庫、圖形數據庫以及文檔型數據庫等類型。當前,主流的非關系型數據庫有Redis、Bigtable、HBase、Neo4j等。
決策數據分析,就是通過詳細研究和概括總結決策數據,從中提取有價值信息并形成結論的過程。將有價值的國防動員決策數據整合成國防動員決策信息,這是國防動員決策數據分析的核心內容。相對傳統的國防動員決策數據分析,大數據分析技術主要有以下幾種。
1.可視化分析,即數據圖表化。在分析國防動員決策大數據時,最基本的要求就是對數據進行可視化分析,就是將結構或非結構數據轉換成適當的可視化圖表,然后將隱藏在數據中的信息直接展現在各級決策者面前。根據不同的數據展示和分析需求,可使用指示卡、計量圖、餅圖、柱狀圖、拆線圖、地圖、GIS地圖、詞云、雷達圖、漏斗圖等圖形來展示數據。比較經典的可視化分析工具有Tableau、Excel、Gephi等。
2.數據挖掘算法。數據挖掘就是從大量數據中挖掘知識的過程。作為一種深層次的數據分析方法,能夠揭示事物隱藏的規律性,使決策者對狀態把握和趨勢預測更為科學準確,成為正確決策的重要參考。一般來說,數據挖掘側重解決四類問題:分類、聚類、關聯和預測,重點在尋找模式和規律。數據分析的理論核心就是數據挖掘算法,數據挖掘算法多種多樣,其中比較經典的算法有:C4.5、K-Means、SVM、CART、KNN等,不同的算法基于不同的數據類型和格式,會呈現出不同特點。
3.預測性分析。大數據分析最重要的應用領域之一就是預測性分析。預測性分析結合了許多高級分析功能,包括特別統計分析、預測建模、數據挖掘、文本分析、實體分析、機器學習等。從海量決策數據中挖掘出其特點,幫助我們了解和把握國防動員的現狀,并確定下一步的行動方案,從依靠猜測進行決策轉變為依靠科學預測進行決策。
4.語義引擎。語義技術為大數據的有效分析提供了一種技術途徑。語義引擎是語義技術最直接的應用,它從檢索詞語所表達的語義層次上來認識和處理用戶的檢索請求,可以讓國防動員決策的參謀人員從繁瑣的搜索條目中解放出來,更快、更準、更全面地獲得國防動員決策數據分析所需的信息,從而提高數據分析質量和效率。
大數據在國防動員決策中的派生功能,即指由基本功能引發出來的處于從屬地位的功能,包括現狀分析、需求預測、決策優化、智能匹配等。
現狀分析。現狀分析是決策的基礎。國防動員決策的一個重要環節就是搞清楚決策事項的現狀,基于現狀再制定下一步的行動方案。通過國防動員大數據分析,可對各領域國防動員的現狀進行分析,把握其基本狀態,從而使相關決策者了解本領域國防動員的基本情況。同時,可通過大數據挖掘和可視化分析,準確掌握各領域國防動員戰略任務的完成情況,并以此衡量國防動員整體運行狀態。
需求預測。國防動員決策實質上就是實現國防動員資源與軍事需求的精準匹配。預測軍隊的軍事需求是國防動員決策的重要前提。通過國防動員大數據分析,可全面、快速準確預測軍事需求。大數據使我們能夠獲得按照既定規則、分層、分類、分級的國防動員數據集合,在這個數據集合中,國防動員需求預測可用的數據能夠相互印證、彼此交互,能以靈活推拉、智能重組的數據塊(群)形式存在。在預測國防動員需求時,大數據可以綜合現實與歷史數據進行智能融合與分析判斷,盡可能深入分析挖掘數據的信息附加值,找尋關聯數據的內在規律,并結合國防動員需求的影響因素和國防動員各領域的實際情況,最終提供更精準的趨勢結論和國防動員需求預測報告。
決策優化。大數據不僅能夠優化國防動員決策流程,更能促進國防動員決策體系內各系統的融合,為優化國防動員決策提供實時、全面、準確的信息服務。大數據資源能夠拓展國防動員決策信息的來源渠道,為優化決策方案,輔助決策實施提供更全面的信息支持。具備大數據思維的國防動員決策者能夠充分認識大數據的功能,發揮大數據對決策的支持作用。精通業務、技術過硬的國防動員大數據人才能夠運用大數據采集、存儲、挖掘和可視化分析等關鍵技術,輔助支持決策制定、決策實施以及決策評估等重要環節。基于大數據的國防動員決策支持系統,能夠為國防動員決策者提供全方位、多層次的決策支持和知識服務。
智能匹配。主要體現在兩個方面:一是決策方案與決策庫之間的匹配;二是動員資源與軍事需求之間的匹配。通過參與國家應急救援和組織實戰化國防動員演練,采集優化信息化戰爭條件下各國國防動員決策案例等,生成海量的國防動員決策案例大數據庫;運用大數據采集和分析手段,結合實戰化條件下國防動員決策的要素構成,智能提取國防動員決策案例的特征屬性,優化設計決策案例表示結構。在科學計算決策案例屬性、結構和整體相似度的基礎上,充分運用大數據挖掘算法,完成國防動員決策與大數據庫中決策案例的智能匹配。國防動員決策體系中的參謀系統,運用大數據技術分析動員需求組成情況、動員資源分布情況,預測動員時間、規模和質量等情況,并將這些決策支持信息輸入信息系統。信息系統能夠基于動員資源與軍事需求的智能匹配,自動生成最優動員方案。
大數據在國防動員決策中的功能,就是解決“大數據在國防動員決策中能干什么”的問題。一般來說,大數據在國防動員決策中的功能,往往指向大數據在國防動員決策中已經產生或者將會產生的結果,尤其是指大數據在國防動員決策中所引起的變化,所發生的作用。大數據時代,只有充分認清大數據支持國防動員決策的核心功能,優化設計大數據支持國防動員決策系統,才能將數據優勢迅速轉化為決策優勢,以信息化條件下高精度、高效率、高質量的國防動員決策,在應戰、應急和服務經濟社會建設中發揮更大的作用。
[1] 鄒振寧,榮希君.大數據時代作戰指揮理論創新研究[M].北京:藍天出版社,2014.
[2] 陸嘉恒.大數據挑戰與NoSQL數據庫技術[M].北京:電子工業出版社,2013.