巴志超,李 綱,,安 璐,,毛 進
(1.武漢大學 信息管理學院,武漢 430072; 2.武漢大學 信息資源研究中心,武漢 430072)
國家安全是一個國家的基本利益,涉及國家獨立、政治穩定、經濟發展以及社會和諧等諸多方面戰略性問題,是維護國家穩定和實現民族振興的重要保障。在經濟全球化、政治多極化、文化多元化、社會信息化的大背景下,我國國家安全呈現出復雜化、多元化、動態化和綜合化的特點[1-2]:外部安全與內部穩定問題相互交織,傳統安全和非傳統安全挑戰相互疊加,國家安全的戰略決策與重大事件應對決策并存。近年來,國家安全的常見與非常見問題也日益凸現,發生諸如新疆暴力恐怖襲擊案、香港“占領中環”運動及南海仲裁案等事件,嚴重威脅著國家安全與社會穩定。在此背景下,國家安全管理成為維持國家穩定、提高國際影響力的必要前提和重要舉措。
隨著大數據時代的到來,大數據的技術先進性、空間開放性等特征也給國家安全數據與信息處理方式帶來根本性變革,如何綜合開發與利用國家安全大數據成為各國之間搶占國家安全戰略制高點的關鍵[3]。習近平總書記在2017年12月8日舉辦的中共中央政治局第二次集體學習會議上著重強調“大數據是信息化發展的新階段,要推動實施國家大數據戰略,推進數據資源整合和開放共享,加快建設數字中國”。在2015年7月1日通過的《中華人民共和國國家安全法》中也明確指出“開展情報信息工作,應當充分地運用現代科學技術手段,加強對情報信息的鑒別、篩選、綜合和研判分析”。對國家安全大數據綜合信息的集成與分析,成為國家安全決策依據、行動支持以及效果評估的基本前提和重要內容[4]。其主要是以海量的國家安全大數據為分析對象,以國家安全管理戰略決策需求為導向,利用云計算、物聯網、大數據技術等工具,通過國家安全管理的大數據化、網絡化、協同化以及集成化,實現國家安全管理的模式創新,形成以大數據為驅動力的新型信息處理模式,從而進一步豐富、完善和健全國家安全管理的理論體系,推動國家安全管理決策的科學化、結構化。
本文正是在國家安全管理的宏觀目標下,以物理世界、信息空間和人類社會三元世界所構成的國家大數據認知研究和融合分析為出發點,探究實現政府安全管理部門業務流程和數據分離的信息管理方法,結合三元世界中有關國家安全管理戰略理論的構建思想以及信息-物理-社會融合系統(Cyber-Physical-Society Systems, CPSS)中的協同感知、系統建模等技術與方法,研究三元世界下面向國家安全大數據綜合信息集成應用架構及實現路徑。
國家安全主要涵蓋政治安全、軍事安全、經濟安全、社會安全、信息安全及資源安全等眾多傳統安全和非傳統安全領域,其大數據除表現出基本的“4V”特點外,還具有交織性、超維性和協同性等新特點[5]。由于國家安全事件具有復雜性且機理不明、相關資源交叉且匯集無序、關系解析分散且相對孤立等特點,導致國家安全大數據也呈現多領域、跨模態以及復雜時空交互的特征,其碎片化地分布在信息空間、物理世界以及人類社會三元空間中,以結構化、半結構化以及非結構化形式存在著,并以極快的速度在多種異構網絡中不斷生成、更新與變化。政府本身作為最大的數據擁有者和國家安全管理的執行者[6],迫切需要有效地運用這些大數據實施對各種可預見和難以預見的風險治理。然而,政府當前卻面臨著管理變革與數據流動需求的諸多不適應性,由于頂層設計不完善、部門協同治理不足、整合與分析技術短板、缺乏統一元數據標準以及開放與共享過程中供給與需求脫節等問題,導致現有的國家安全大數據呈現出若干“數據圍墻”和“信息孤島”現象。
另外,由于政府安全管理部門的業務應用與數據管理并未真正地實現剝離,導致業務系統運行效率較低,安全相關數據資源開發利用不足與無序濫用的現象并存[7]。因此,我們單純地將大數據與政府傳統治理理念簡單嫁接,只會固化現有的工作流程與組織結構。針對海量、多樣和快變的國家安全大數據,政府需要對分散在信息空間、物理世界和人類社會三元空間下的安全大數據進行協同感知與獲取,建立一個數據共享和互相操作的框架,通過將數據作為連接橫向分工制與縱向科層制之間的關系紐帶,從而消除“部門壁壘”與“數據壁壘”,實現從單一機構應用到跨部門協同再到社會參與的公共應對、治理的轉變。
國家安全大數據的信息集成過程主要包括協同感知與獲取、信息組織以及信息融合等步驟。因此,按照信息處理的基本流程,其基礎理論包括三元世界理論、數據質量與可信度評估理論、信息組織理論及融合理論等。首先,三元世界理論為國家安全大數據信息集成與分析提供數據來源與信息獲取的理論指導。早在2006年美國科學院(NAS)在發布的《美國競爭力計劃》中首次提出將信息-物理融合系統(Cyber-Physical Systems,CPS)列為重要的研究項目,其主要內容是通過信息空間與物理世界的二元融合,實現計算、通信和控制技術與物理系統的有機融合與深度協作[8]。隨著互聯網+、云計算以及物聯網等技術的發展,信息與物理系統得以進一步融合與貫通,網絡與人類社會實現無縫聯合,形成了更為復雜的人、機器與信息融合一體化的系統,即信息-物理-社會融合系統(Cyber-Physical-Social System,CPSS)[9]。國家安全大數據正是以各種復雜關聯形式分布在人、機、物高度融合的三元世界中,實現全面動態地獲取國家安全大數據,建立一種面向三元世界的協同感知系統。而目前主要集中研究物理與網絡空間[10]、物聯網與社會網絡形成的社會物聯網(Social Internet of Things,SIoT)[11]、社交網絡與傳感網絡之間的協同感知架構體系[12]等,從數據來源角度看,對三元世界信息感知獲取的研究寬度和深度還有待進一步拓展。
數據質量是指對于特定任務,數據能夠滿足任務需求的程度。對數據質量的評估是面向國家安全大數據綜合信息集成的必要環節,主要包括對數據規模、數據結構、數據時效以及數據價值密度等多方面評估。針對數據質量評估過程[13]、控制標準[14]、評估方法[15]以及整體框架[16]等已開展較為廣泛與深入的研究。而信息可信度作為數據質量評估中一項重要內容,是對信源、信息內容本身及信息處理過程或媒介的可信程度進行判斷[17]。數據質量與可信度評估對于國家安全決策至關重要,不僅在于信息的復雜性和收集難度,更在于低質量的信息會給國家安全帶來嚴重的不良后果。而目前我國缺乏對國家安全大數據進行控制與評估的完整體系,未給出一個關于數據質量控制規范的、科學的體系模型,很難應用于實際中解決國家安全數據質量問題。
信息組織是采用一定科學方法與規則對信息進行序化、優化和美化,以保證信息有效利用和交換共享的組織。現有研究主要從泛在網絡、Web2.0及大數據環境等視角出發,從組織對象、組織內容、組織方式及用戶需求等角度分析信息組織在新環境下的特點和新方式[18],但面向國家安全大數據綜合信息組織研究有待進一步探索。因此,面向國家安全大數據的綜合信息組織和深度序化方法也需要進一步研究,以建立針對不同類型國家安全大數據的統一描述標準和表示模型。而信息融合旨在通過對分布式傳感器等多源數據的組合互補以減少信息的不確定性或模糊性[19]。在大數據集成環境下,信息融合是將多源異構信息進行關聯和綜合,從而得到更加全面、精準、簡明一致的信息處理過程。與傳統先有模式后有對象的數據庫不同,目前大數據集成對象是先有對象后有模式的“數據湖”,需通過自底向上方式實現集成,即大數據融合[20]。
國家安全大數據信息集成技術與方法主要包括數據獲取、信息集成與融合、信息分析、信息交換與共享等。由于國家安全大數據具有開放、移動、交織、時空動態、多維度及碎片化等特點[21],國家安全大數據集成需要借助大數據智能識別、傳感與適配技術,對在線、離線的國家安全大數據進行采集,以元數據驅動方式實現對國家安全大數據的抽取、轉換和加載。現有研究針對國家安全大數據的信息集成與融合,主要借助本體、圖數據模型等技術,實現對國家安全大數據結構化、語義化組織與集成,并通過對傳感器、圖像等多模態信息進行融合[22],或利用本體進行知識聚合與分享實現國家安全問題分析[23]。但囿于缺乏統一的國家安全數據關聯方式與規則,數據集成與語義化融合研究有待深入。
國家安全大數據的綜合分析要求面向國家安全戰略需求,運用合理的信息分析方法,對國家安全部門及社會層面的安全大數據進行關聯整合,從而為國家安全管理和戰略決策提供有效信息支持。數據挖掘和知識管理方法在國土安全領域、反恐怖主義活動中扮演重要角色[24],采用文本挖掘、語義分析、模式識別等方法對網絡輿情信息進行分析和挖掘,有利于加強政府對公共危機和公共安全的管理[25]。部分學者利用頻繁子圖挖掘、社交網絡分析預測等方法分析國家安全事件趨勢和關聯[26],如中國科學院自動化所利用人工社會-計算實驗-并行執行(ACP)的方法構建“天網工程”,實現輿情實時監控、分析和預警[27]。大數據的發展為信息分析提供資源保障和技術支持,也促進信息分析理論與方法的革新,逐漸形成以相關關系為基礎的大數據分析模式。而國家安全大數據的獲取、集成、融合與分析等工作的落腳點,更加聚焦于國家安全部門對分析后的國家安全大數據的信息交換與共享。從宏觀層面上,我國實現對國家安全大數據信息資源的有效整合和統一管理、建立統一標準的數據交換、存儲與共享方式,有利于實施更為專業化地國家安全大數據挖掘分析,進而支持國家安全部門做出科學有效的國家安全管理預測與決策。
目前,針對國家安全的大數據信息集成應用與實踐現狀主要包括四個方面:國家安全大數據信息集成系統構建、面向特定領域安全的信息集成與分析模型構建、面向國家安全的大型知識庫構建以及網絡信息治理機制建設。當前多個國家已將信息集成系統應用于國家安全領域中,如美國國家安全平臺、俄羅斯危機研判及反應中心、波蘭INSIGMA事件報告系統(ERS)和國家急救通知系統(SPR)等。國內中國地質環境監測院部署地質環境數據集成服務系統,有效集成基礎地質、地理等空間數據及地質災害、礦山地質等不同類型調查與監測數據[28]。此外,信息集成在水污染和氣候災害等公共安全問題上也發揮重要作用,如建立水污染預警信息管理系統[29]和垂直一體化全球觀測系統[30]等。
面向特定領域安全的信息集成與分析主要通過建立應用性模型,并與信息集成與分析框架、系統相結合,實現對特定領域安全的信息集成與分析任務[31-33]。如相關學者針對煤礦安全構建風險評估預測模型,實現對井下安全環境等級的實時預測[32];構建洪水風險不確定性分析框架,并與洪水風險評估模型相結合,提高洪水風險評估準確度等[33]。國家安全知識庫的構建是將國家安全相關知識進行結構化、系統化與集成化,從而形成結構合理、存取方便、服務高效的知識庫體系,以提供更加快速便捷的訪問、檢索與推理手段。如相關學者構建的基于大數據的反恐情報知識庫,實現了對恐怖分子與組織的監控與行為預測[34];構建的國家健康信息數據倉儲庫,保障了醫療信息的安全與患者的隱私問題[35]等。而面向國家安全的網絡信息治理機制建設,也成為保障國家安全的重要任務。在政務信息方面,建立了健全科學高效的政府信息發布機制[36];在輿情大數據監管方面,建立健全了政府網絡輿情監管體系,通過立法革新和協同合作等完善了依法治理模式[37];在輿情治理方面,構建出以政府為主體的網絡輿情治理體系,創新輿情治理范式[38]等。相關研究主要探索與網絡信息監管相關的制度建設以及理念創新,但并未落實到輿情大數據治理的技術細節。另外,當前網絡輿情治理實踐尚停留在政府主導下的政策導向層面,著眼于國家安全視角下的網絡安全保障、網絡虛擬社會現狀感知的輿情監測等。然而,網絡輿情治理是一個復雜系統工程,需要嵌入具體事務的治理體系,更加偏重輿情大數據的集成與分析,而不能僅限于各領域的分散應用。
本文結合國家安全大數據信息集成相關理論、技術與實踐應用,探討一種面向三元世界的國家安全大數據綜合信息集成應用架構。
首先,大數據作為聯系物理世界、信息空間和人類社會的紐帶,為三元世界的交互與融合提供可行路徑。同時,三元世界的理論建構思想以及CPSS的系統建模方法也為國家安全管理的大數據集成與分析提供理論參考和技術借鑒。在國家安全管理的宏觀社會目標下試圖將二者進行融合,實現對國家安全大數據的綜合信息集成。區別于以往研究更多地側重于技術層次、組織結構、服務應用等單一方面的集成分析,本文依據現有國家安全管理模式,利用信息資源規劃方法對有關國家安全的信息和業務流程進行梳理,從宏觀角度提煉出通用的信息集成應用模型。
該應用架構的基本思想是:首先,以物理世界、信息空間和人類社會三元世界所構成的國家安全大數據為研究對象,把握相關數據資源類型、分布空間、表現形式等特征,結合國家安全管理部門的戰略信息需求,在不影響相關機構原有基本業務邏輯基礎上,對物理世界、人類社會中國家安全數據進行采集。其次,識別泛在網絡中關鍵節點和鏈路,將其作為任務與數據的關聯接口,基于數據探針實現數據和任務需求的智能匹配與獲取。最后,將感知到的國家安全大數據映射到信息空間中,實現信息的萃取精煉、序化組織、交換共享、語義融合及信息分析等處理,并把數據處理結果反饋給執行決策的關鍵節點,實現業務邏輯與數據管理的分離。該應用架構將國家安全管理部門與社會層面的信息進行整合與分析,為物理世界、人類社會中的預警、處置、研判等決策行為提供信息支持,如圖1所示。
三元世界的邏輯關系表現為:物理世界與人類社會空間中的元素或數據通過協同感知與交換共享傳輸到信息空間中,信息空間則通過對數據進行組織、融合與分析,進而反向指導物理世界和人類社會中的決策行為。物理世界和人類社會既是信息空間的數據來源,也是信息空間分析結果的應用場景,三者間相互耦合交融,共同形成一個有機整體。同時,三者又是相對獨立的內聚模塊,信息空間形成從數據獲取、信息組織、信息融合到信息服務的內循環,物理世界和人類社會則是該數據循環關聯的外部實體和負反饋形成的重要成因。三元世界理論為實現國家安全大數據的綜合信息集成提供了有效視角。本文提出借助三元世界理論,將物理時空數據、社會輿情數據整合到以往相關安全部門,用于輔助國家安全管理決策的管理信息數據中,既是對大數據環境下國家安全管理研究的理論創新,也是對信息資源管理領域在大數據應用中的實踐擴展。另外,本文在構建的應用架構數據處理層面,提出通過識別網絡中的關鍵節點和鏈路,借助數據探針對三元世界中的國家安全數據進行協同感知與獲取,能夠在對業務系統影響最小的情況下實現元數據的無縫抽取和采集,同時也實現數據處理對國家安全業務流程動態化和差異化的適應,使得信息空間對現實世界的映射不再是單一、直接的對應關系,而是建立在數據處理基礎之上具象化的邏輯呈現。

圖1 三元世界國家安全信息集成的邏輯架構
國家安全大數據綜合信息集成理論框架的構建,有利于形成以大數據為驅動力的國家安全管理模式,推動具體實施過程中國家安全大數據信息集成應用創新,為國家安全管理的風險評估與綜合研判、安全防控與協同應對、決策體系構建等提供實時高效的信息支持。本文所提出的信息集成應用架構主要目標,希望真正實現政府安全管理部門的業務邏輯與數據管理的分離,促進政府安全管理部門業務系統的高效運行以及國家安全相關數據資源的開發利用,從而改變過去單個部門業務系統的碎片化狀況,提高信息共享與業務協同能力,贏取“數據共享”的優勢格局;試圖在提升數據相對于業務獨立程度的基礎上,通過數據獲取、信息組織與信息融合等操作,有效串聯國家安全信息處理的“物化”動作和狀態,快速形成面向特定國家安全事件或機構的數據解決方案。
在提出信息集成理論框架基礎上,我們還需要進一步探索面向國家安全大數據綜合信息集成的實現路徑。下面主要結合信息集成與分析的流程,研究面向國家安全的戰略信息需求分析、信息組織與融合、信息整合分析與示范系統應用等內容。
準確把握國家安全管理的戰略信息需求是開展后續信息集成與分析工作的關鍵,也是評估國家安全管理活動實施效果的重要標準。在當前大數據環境下,國家安全信息需求呈現出多樣化、精準化和專業化特點,信息需求主體、內容、方式與結構也表現出差異化和動態化特征。實現國家安全戰略信息的需求分析,需要結合國家安全管理戰略信息需求的服務對象、服務類型、業務功能,整合的大數據資源,明確國家安全管理部門業務過程與戰略信息需求的關聯關系,通過對國家安全管理業務過程的形式化描述構建業務-信息關聯模型,探究面向國家安全管理業務過程的戰略信息需求識別方法。同時,也需要進一步對非結構化、半結構化和結構化的戰略信息需求進行語義化描述,采用框架表示法等實現對不同類型的需求進行規范和統一表達。另外,在資源有限前提下,無法對不同的國家安全戰略信息需求同等對待,安全信息需求的重要性優先級也需要被研究。根據國家安全管理業務過程中相關元素的安全目標,建立從業務過程決策目標到戰略信息需求的優先級轉換規則,確定與業務過程相對應的戰略信息需求的重要性或優先級,以標記信息需求優先獲得滿足的次序。
另外,面向不同業務過程識別出的戰略信息需求之間往往存在著重復甚至不一致,需要對識別出的戰略信息需求進行分析和整合,根據業務過程的時間相關、功能相關、目標相關等,建立戰略信息需求一致性機制,以消除不同信息需求之間存在的沖突。同時,不同戰略信息需求也存在著共性和差異性,我們需要探究國家安全管理領域中戰略信息需求的共性和變化性之間的關系,研究一般性戰略信息需求的描述形式、分析流程和方法,獲取一組具有足夠復用性的信息需求,并對其進行選擇和抽象,構建出通用的領域需求模型,從而根據國家安全領域戰略信息的需求特征,設計、選擇和優化對應的國家安全戰略信息采集方案。另外,也需要考慮戰略信息需求的差異性和特殊性,從國家安全管理具體活動情境出發,建立從領域需求模型到個性化需求的映射機制,通過對不同階段、不同決策主體需求特征、類型和內容等分析,設計多階段、多決策主體的戰略信息個性化需求模型,如圖2所示。

圖2 國家安全管理的戰略信息需求分析過程
國家安全信息是以結構化、半結構化及非結構化形式碎片化地分布在信息空間、物理世界和人類社會三元世界中,需要對其進行關聯映射與協同感知,才能實現國家安全大數據信息的融合與分析。本文以三元世界的國家安全大數據的認知研究為目標,以事件、任務和目標的主體需求為驅動,在泛在網協同架構下通過明確國家安全信息存在的多種異構網絡,提出一種包含數據探針、數據倉庫、數據沙盒等功能模塊的多維數據收集、存儲管理與服務的蜂巢系統,如圖3所示。
首先,識別多種異構網絡中的關鍵節點和關鍵鏈路,并在關鍵節點和鏈路上分布式部署數據探針,以實現數據的探測和采集。數據探針是根據預先制訂的策略收集相關數據、執行一種或多種網絡測量動作并獲取網絡數據和性能參數的實體,是一種模塊化、可定制的數據探查器和汲取器,能夠適應業務系統、為數據存儲提供原生的數據匯聚支持。基于數據探針抽取式及推送式的數據采集方式,可在對業務系統影響最小的情況下實現數據的實時采集。其次,將數據探針獲取的數據推送到數據總線進行解密及登記處理,并通過數據分發傳輸到數據存儲的核心倉庫內,通過離線、在線HDFS對數據進行分門別類存儲。然后,對存儲的國家安全大數據進行特征提取和質量控制,探究適用于不同類型國家安全大數據的多尺度特征提取和結構解析方法,從時間域、空間域和時空域視角對時空數據、輿情數據及管理數據等相關安全數據的多尺度特征、過程描述、傳遞模式以及相互作用進行分析,實現對國家安全大數據的多尺度結構以及演化過程的特征解析、維度透視和過程重建。
國家安全大數據的多尺度特征提取后,結合特征之間的同一性、包容性、交叉性和排斥性等相互關系,按照統一的科學規則與方法進行形式序化、內容序化以及相關性序化等,實現對國家安全信息的有效組織,并將序化的信息存儲于數據蜂巢內部的數據沙盒(Sandbox)。數據蜂巢是由若干數據沙盒組成,而每一個數據沙盒間都是相對獨立、互不干擾,數據沙盒內部提供的數據是完整生態鏈,可以滿足一項任務需求。各個模塊緊密聯系則構成了蜂巢系統,其可在不干擾原有業務系統運行基礎上實現多中心、多集群和多系統的數據匯聚。蜂巢系統通過數據探針進行數據無縫收集匯聚工作,匯聚后的數據通過數據倉庫進行數據存儲及數據加工,提取成為獨立的數據沙盒為用戶進行個性化服務,從而提供分布式匯聚、可伸縮大數據存管、隨需提取的完整數據生命流程解決方案,為上層大數據展示、分析及業務系統提供統一的數據支撐。
信息融合是指在信息有效序化基礎上,從分布式、多層次結構的蜂巢系統中提取與決策主體需求相關的國家安全信息集并進行不一致性、不完全性和冗余性處理,從而形成更加完整、更少沖突、更少不確定的信息組合[35]。針對多模態信息集成服務而言,現有研究無法有效融合多模態信息中的多態語義[36],未能有效解決多模態信息的底層特征與高層語義之間的“語義鴻溝”問題。多義性和多態性是多模態信息的固有特性,在信息融合過程中,不同模態的相容互補性能夠減小單模態信息與綜合多模態信息之間產生的語義偏差。同時,多模態信息融合還要求在同一層次上各模態之間通過橫向融合實現多模態信息的有效協同和利用,以及每種模態在不同層次之間通過縱向關聯實現特征之間的映射與支持,從而形成規模化的立體數據處理。因此,結合語義技術對多模態信息進行多維度、多層次深度描述,構建以實體、關系和事件為核心的結構化語義描述體系,能夠完成多模態信息的底層特征與高層語義之間的相互映射,并借助結構化描述體系中的高層語義指導性以及多模態信息環境的上下文信息,可實現語義層次多模態信息融合。

圖3 三元世界下國家安全大數據協同感知
同時,國家安全多源信息融合過程主要包括信息實體、信息源及政府、事件、環境等要素之間的融合。在對多源信息特征要素進行提取基礎上,可從不同融合要素及其相關作用關系角度開展對國家安全多源信息的融合。根據對輸入信息的抽象或者融合輸出結果不同,從信息邏輯語義、語法結構以及形式表示等層面,設計針對不同層面信息融合規則和算法,構建自底而上的“數據級-特征級-決策級”融合模式,如圖4所示。另外,多源信息融合本身尚未形成完整的理論框架、廣義有效的融合模型以及綜合體系,構建的信息融合模型也往往缺乏統一的數學理論規范規則和系統評價平臺,通常只是依托于某種數據組織方式,可移植性較弱。因此,需要對信息融合過程中的融合規則、融合算法及融合效果等進行可信度評估,構建多源信息融合的可信度評估指標體系,針對多源信息融合在國家安全管理中的具體應用,建立精準、全面的面向國家安全管理領域的信息融合可信度評估框架。
信息分析是數據驅動管理決策的重要環節,分析方法與技術的選擇影響著管理決策的科學性與合理性。國家安全大數據信息分析的研究,需要建立在一定的科學研究方法和工具基礎之上,而構建國家安全大數據信息分析范式是開展相關研究的理論基礎和實踐規范[37-38],其在系統性、研究途徑以及功能等方面都表現出不同于其他范式的獨特內涵和解釋力,而目前尚未形成針對國家安全大數據統一的信息分析范式。因此,我們需要考慮國家安全大數據信息分析范式的特殊性和變革性,立足于國家安全管理的現有研究框架,尋求構成國家安全信息分析的符號和概念體系,探究國家安全大數據的信息轉化過程和信息結構演變,將管理科學、信息科學以及情報學等理論的相關概念、邏輯和研究成果向國家安全領域進行合理延伸,從概念體系、問題范圍以及分析方法等多角度闡釋戰略信息在國家安全管理中的作用和意義,探討針對國家安全信息分析的理論前提、框架和推理結構,構建面向國家安全大數據的信息分析范式。

圖4 國家安全大數據多源信息融合模式
構建信息分析范式的目標是形成獨立的面向國家安全領域大數據的信息分析方法,它并不意味著否定或反駁已有的研究成果,而是通過借鑒其他學科或理論的研究成果和方法,促進國家安全領域信息分析規范化、標準化,完善國家安全管理的研究體系。同時,通過對信息資源整合形成的資源庫、知識庫等進行深度挖掘與分析,借助數據挖掘、模型預測、可視化交互等手段,構建面向服務、組件化的可配置數據分析引擎。采用模組化平臺架構和插件式函數模型封裝方法,依據任務方案將集成的不同處理服務組件組成面向粗細粒度不同的大數據知識服務業務類型,將服務與信息資源進行關聯綁定,以供不同業務模型進行調用和可視化;并進一步通過設計面向智慧服務和自主需求的動態與可定制數據分析模型,構建出從戰略理論分析到隱性知識發現、從模型擬合到數據挖掘、從邏輯推理到關聯規則制定的國家安全大數據信息分析框架。
面向國家安全大數據信息集成系統的構建主要包括國家安全信息集成系統的概念模型,以及面向特定部門、特定任務的應用示范系統的構建。首先,從國家安全管理的問題描述及戰略需求出發,依照信息集成與分析流程,明確系統所涉及各子模塊的主要目標、功能及相互關系,制定對各子模塊的管理機制和控制方式。進一步按照分布式可擴展的層次體系架構對各子模塊集成,實現對國家安全信息集成與分析系統概念模型的構建。其次,以信息-物理-社會融合系統(CPSS)的系統建模方法及基于三元協同(協同感知、協同分析、協同服務)系統開發架構為指導,依據“基礎—保障—目標”對系統的技術層次、業務流程、組織層次及服務層次進行封裝和集成,結合國家安全管理實際應用為場景,構建面向特定部門、特定任務的應用示范系統。
以發生的香港“占中”事件為例,依據本研究提出的國家安全大數據綜合信息集成應用架構和實現路徑,構建面向香港“占中”事件的多維數據收集、存儲管理與服務系統,如圖5所示。首先,基于統一的數據、集群監控系統對政府安全管理部門、電子地圖、通信基站及社交媒體等有關該事件的數據進行一體化地監控和預警,借助數據探針模式針對不同的外部數據源和數據接口,感知和獲取動態數據如道路車流數據、人員流動分布數據、附近商圈的建筑情況和客流信息等,以及相關靜態數據如參與者信息、政府存儲的管理數據和基礎設施數據等,實現對該事件態勢的實時監控和預警。然后,按照業務需要及數據拓撲、屬性、關系等類型,將各類數據進行相應轉換與處理,并實現數據的序化組織、交換共享及語義融合等操作,經過數據挖掘構建面向特定功能的數據沙盒,如存儲用于呈現區域熱力圖、交通熱力圖、人員關系圖譜和道路車流分析的相關數據,以直接面向業務提供相應的數據服務。數據探針、數據倉庫系統以及數據蜂巢的有機組合,能夠實現不同業務系統之間的數據整合、多維數據的分類存儲以及按需的數據沙盒構建、提取等功能,從而完成數據整個生命服務周期。最后,通過設計面向服務與可配置的數據分析引擎,實現對事件道路車輛分析、人員流動分析以及事件態勢控制等,為國家安全戰略提供智力支撐,針對威脅國家安全事件做好全方位的策略應對。
當前,我國國家安全的內涵和外延比歷史上任何時候都要豐富,時空領域比歷史上任何時候都要寬廣,內外因素也比歷史上任何時候都要復雜,其不僅涉及到深刻復雜的科學技術問題、政策選擇問題及體制機制問題,還需要多學科之間的深度融合,著力探究面向國家安全管理的關鍵科學問題,力圖從理論、方法、技術、平臺、戰略、政策和系統等方面,為構建國家安全管理支撐體系提供良好思路和實施建議,為提升國家安全管理保障能力提供強大的科技支撐和政策選項。然而,大數據時代國家安全管理所面臨的新挑戰給國家安全管理體制變革與范式轉型帶來諸多新要求,在此背景下,本文從以下幾個方面提出應對策略:
1. 轉變傳統數據“治理”思維,提升國家安全大數據管理水平。大數據時代的到來及國家數據共享政策的出臺,對數據全方位地主動推送、互通共享形成倒逼機制,也對傳統部門之間的條塊縱向分割管理體制及碎片化、孤島型、煙囪式的管理格局提出挑戰。由于原有部門系統之間的信息數據相當程度處于靜態沉睡封閉狀態,致使國家安全大數據存在“數據不夠用、數據不可用、數據不會用、數據不敢用”現象,政府的管理理念和運作方式無法適應于數據化決策,大數據在國家安全管理中也無法有效得到統籌與應用。政府管理部門需要轉變原有各自為政、畫地為牢的數據“治理”思維,優化政府數據管理體制機制,增加政府數據資源的管理深度,努力破除分割封閉的“數據孤島”,贏取“數據共享”的優勢格局。
2. 推動信息集成技術應用與創新,有效化解國家安全現實問題。大數據依靠先進技術與方法作支撐,在技術上的把控力對大數據的開發與應用發揮至關重要作用。而目前我國構筑的大數據計算平臺中數據管理較為分散,存在著由于“技術壁壘”導致的數據整合水平較低、數據輸出質量界定模糊、數據關聯價值攫取不足等問題。因此,政府需要積極引導各類具備分析大數據能力的智庫建設,突破大數據關鍵和核心技術,提升大數據處理的分析萃取和監控能力。另外,需要進一步利用數據挖掘、深度學習、增強學習等先進技術揭示國家安全大數據的深層模式與規律,深度挖掘大數據資源潛在價值。在有效盤活大數據資源的同時,合理規范數據的應用,運用大數據解決國家安全的現實問題,深入研究當前大數據環境下國家安全問題,尋求符合我國國情的有對性的方法措施,有效應對大數據給國家安全帶來的挑戰。
3. 統建標準規范與共享機制,強化面向國家安全的大數據平臺建設。實現從單一機構應用到跨部門協同再到社會參與公共治理的轉變,完成對不同部門數據匯集的無縫整合,需要制定大數據技術、協議及標準等相關規范及統一政府、企業與智庫建設的數據編碼、處理、共享與交換標準。國家安全大數據的整合與處理,并不是簡單地將所有數據進行匯聚和開放,而需要重新塑造完整的國家安全大數據信息鏈、業務鏈,對國家安全大數據統一進行采集、處理、分析與精準應用,秉承“一步到位”的服務理念,構建可視化、情景化、規模化與精準化的一體式國家安全智能信息綜合服務平臺,實現針對傳統部門服務模式從碎片化向集中式轉變,從而為構建情報靈、判斷準、反應快的國家安全管理主動防控體系提供有效的信息支撐。

圖5 面向香港“占中”事件的多維數據收集、存儲管理與服務系統
4. 完善國家安全管理決策的頂層設計,構建重大國家安全事件的新型管理機制。一方面,需要研究國家安全事件管理機制及決策體系設計的基礎科學問題,分析事件管理機制等共性問題,特別涉及多部門協同、多層級貫通、跨區域聯動、政府與社會協同、信息共享等難題。另一方面,也需要研究面向國家安全事件提供決策支持為目標的理論、方法等基礎科學問題,包括國家安全風險管理與綜合研判理論與方法、國家安全協同應對與輔助決策理論與方法以及面向國家安全管理的決策體系設計等。這些內容與國家安全大數據的綜合信息集成與分析相輔相成,共同組成了國家安全管理的決策體系研究的基礎科學問題。
5. 把握國家安全大數據信息集成的具體實施路徑,推進集成應用架構的實踐落地。任何一個國家安全大數據決策問題都非單一行業、單一來源數據支持可以解決,需要構架面向特定區域的應用示范系統,解決跨領域、多部門之間的國家安全問題。城市安全體系是國家安全的重要組成部分,加強城市數據治理是響應國家安全大數據戰略和提出中國方案的必要舉措。可從數字城市空間構建和面向重大國家安全特定事件的集成分析兩個層面探討國家安全大數據信息集成的具體實施路徑。一是以“數字城市空間”構建作為應用示范,支撐和解決以城市為區域對象的國家安全問題。通過實施“城市數據畫像工程”勾畫城市社會的復雜面相,運用情報工程和大數據資源規劃理論與方法,從靜態和動態視角感知和整合城市大數據資源,從基礎環境建設、城市創新能力、經濟產業狀況和社會公共服務等方面對城市數據畫像進行分面建模,形成若干涵蓋關鍵領域的城市指征,實現城市在不同分面上的“數描”。二是面向重大國家安全的特定事件問題,通過建立面向國家安全特定事件的多維數據收集、存儲管理與服務系統,實現不同業務系統之間的數據有機整合、多維數據的分類存儲以及按需的數據沙盒構建、提取等功能,完成數據的整個生命服務周期。