■ 尹江輝
隨著信息技術、網絡技術、大數據技術等先進技術的迅猛發展,人類已經從信息化時代逐步邁入智能化時代。數據作為智能化所不可或缺的基礎支撐,已經成為推動經濟社會發展、科技進步與軍事變革的重要戰略資源;同時,大數據技術也成為智能化時代的主要推動力之一,是人工智能技術集的核心關鍵技術。當前,世界各國都在搶占大數據的軍事制高點。大數據技術的快速發展與廣泛應用對于軍事情報理論研究與實踐工作產生了深遠的影響,如何應對影響從而贏得未來的競爭與挑戰值得深入思考。
大數據(Big Data)概念早已出現,2008 年,《自然》推出以大數據為主題的???,探討了大數據帶來的科研形態的變化,認為“以數據為準繩的理念指導,以及強大的計算能力支撐,正在驅動著一次科學研究方法論的革命?!币恍<覔颂岢隽恕按髷祿抢^實證實驗、理論推導、建模仿真之后,科學研究的第四范式”等觀點[1]。
大數據是指具有規模龐大、類型多樣、處理時效緊、數據來源可靠性低等綜合屬性的數據集合。大數據通常具有“4V”特征[2]:一是數據規模龐大(Volume),一般在TB、PB 乃至EB;二是數據類型多樣性(Variety),信息種類多,并以數字、表格、網頁、圖片、視頻等結構化、半結構化、非結構化等形態存在,數據關聯度較低;三是數據處理要求響應速度快(Velocity),數據流高速產生,并需要快速、持續地實時傳輸與處理;四是數據價值密度低(Value),規模巨大與類型多樣帶來了高價值低密度特點,增加了挖掘難度。
大數據的核心與內涵:一是確實“數據很大”。這是一個基本前提,沒有大量的數據不能稱為大數據。二是大數據種類多源、相互關聯、具有整體性。大數據的數據主體并不是單一的結構化數據,而是來源廣泛、種類繁多的多媒體數據。大數據的“關鍵”不僅僅是“大”,更在于“多源”以及多源數據之間的聯系,這樣就可以多方印證。三是大數據還要體現出價值是否被“挖出”和利用。大數據的關鍵難點在于缺乏好的數據挖掘、分析算法,制約著能否從數據中挖掘出有價值的內容。
目前,大數據技術與工具取得了長足的發展,形成了比較完善的大數據處理生態體系,包括大規模分布式計算技術、內存計算技術、流處理技術等;相應的軟件產品包括大數據批處理計算軟件Hadoop、快速分析軟件Spark、流處理軟件Storm 等。這些軟件與傳統的數據庫相比,能夠有效滿足針對大數據的存儲、管理、分析與處理需求,在可伸縮性、健壯性、計算性能與成本上具有明顯優勢。
隨著軍事信息化的高速發展,戰場廣布的雷達、電子戰裝備等傳感器無時無刻不在產生著海量的空情、陸情、海情等情報數據,以往困惑決策者的戰場感知與情報獲取能力已經得到了極大的提升。同時,由于戰場偽裝、情報欺騙等敵方對抗原因,以及數據類型、數據精度等裝備能力差異,通過各類手段形成的數據洪流實際上包羅萬象、內容繁雜、虛實混雜、真偽難辨,具有高價值低密度等大數據典型特點。如何從軍事情報大數據中挖掘與提煉出準確、高價值的情報信息,挑戰著軍事情報分析系統、分析人員與決策者的能力,成為迫切需要解決的問題。
通過大數據技術升級改造軍事情報分析系統至關重要。2017 年4 月,美國防部啟動“Maven 計劃”(即算法戰跨功能團隊),用于加速美軍對人工智能與機器學習技術的集成,通過快速認知戰場態勢大數據,自動生成支援作戰行動的情報產品。該計劃首先將開發用于目標探測、識別與預警的計算機視覺算法,提高對無人機所收集全動態視頻的處理、利用與分發能力,減輕人力負擔。具備戰場態勢感知、全域信息融合、數據深度挖掘、機器自動處理、多源情報印證的軍事情報分析系統,將成為決策者實施精準決策、快速決策的重要支撐工具。
近年來,開源情報(OSINT)的重要性與地位得到了情報界的廣泛認可。相比于傳統的情報手段,開源情報具有信息來源廣泛、收集信息成本低廉、共享程度高、敏感情報資產暴露風險低等獨特優勢。據統計,開源情報提供情報界使用信息的80%~95%。Google 地球提供的地理空間情報(GEOINT)比大多數政府提供的地理信息數據更詳細、更真實。
尤其是隨著互聯網技術、大數據技術的發展,門戶網站、個人網站、博客、推特、微信等媒介的泛濫,“互聯網+大數據”為情報分析人員提供了新的且更為豐富的情報來源與分析手段。通過國際互聯網公開渠道獲取的信息,在經過分布式數據采集、自動機數據過濾、聯合多維數據關聯分析等大數據技術處理之后,能夠快速、實時生成各種類型的情報信息,并以可視化的方式展現給決策者與情報分析人員。
大數據時代的到來使內嵌人工智能算法的智能化系統不斷拓展和延伸分析人員的人類智能成為現實,在情報來源更加多源、高價值情報獲取處理更加困難的同時,也給從業人員帶來了新的挑戰。軍事情報人員不僅要研究掌握新興的開源情報獲取與分析方法、大數據分析的商用現代工具,還要發揮人的主觀能動性、創造性,才能真正成為大數據時代要求的軍事情報人才,才能更好地從大數據中“洞察”真實情況,指導決策與行動。
為了充分利用大數據技術分析開源情報、秘密情報,更高層次的跨界復合情報分析人才團隊得以成立,不僅僅局限于軍事人員和信息技術人員,還包括人文科學家、語言學家、地理學家、心理學家、經濟學家以及金融學家等各界頂尖人才,以擴寬與提升團隊在政治、經濟、軍事戰略、科學技術、人文、生態等領域的知識、能力。美國的大數據挖掘公司帕蘭提爾科技公司(Palantir Technologies)為美國追捕本·拉登、敘利亞反恐、掃毒禁毒等行動,提供了眾多極為重要的情報分析,起到了關鍵作用。該公司的聯合創始人、現任CEO Alex Karp獲得了哲學博士學位,卻完全不懂編程與數據分析。但是,他能夠將來自人文、經濟、統計學、計算機等領域的眾多頂尖人員,打造成一個復合型大數據團隊,不斷獲得來自美國國防部、中央情報局、空中客車集團的大項目,充分體現了跨界復合高層次人才對于軍事情報的重要作用。
大數據前沿理論與關鍵算法等基礎研究水平的高低,將直接決定著大數據技術的發展上限,也直接決定著軍事情報的發展潛力與水平。當前,我國在機器學習、深度挖掘、信息融合等大數據技術的基礎研究領域與國外先進水平尚有一定差距,嚴重制約了我國大數據技術的可持續發展。大數據核心技術的自主性、安全性、可靠性,將是我國數據安全的根本保證。我國需要將推動大數據的基礎理論創新與發展上升到國家戰略層面,立足長遠需求,科學籌劃部署,不斷加強技術積累。應支持國內條件較好的單位協力開展研究,不斷加大大數據領軍人才培養、引進力度,重點加快大數據框架、AI 芯片、智能挖掘算法、CPU、GPU 等軟硬件關鍵技術突破,在大數據的存儲設備和技術方面實現自主可控,進一步縮小我國與強國在大數據和軍事情報等領域的差距。
認真研究大數據技術帶來的革命性變化,充分挖掘并保護大數據中蘊含的情報價值。一方面要加強對大數據情報來源的甄別,充分掌握和利用社交媒體等平臺,通過數據篩選、清洗實現情報可視化。合理利用現成商用工具,如機器學習和自然語言處理工具等,根據軍事情報特定目的和需求設計大數據情報分析處理系統,確保適配并為軍事情報帶來更大的價值,提高工作效率。另一方面,要做好數據開源的控制和防護,盡可能地切斷敵對勢力通過國際互聯網等對我國敏感信息的窺探與收集的開源情報渠道。加強基于生物特征的個人隱私加密技術、面向大數據的數據加密技術、可信計算技術等網絡安全防護技術,完善社交網絡數據收集與應用相關法律、法規,綜合運用技術、政策、法律與標準等手段保證國家信息基礎設施數據和個人隱私行為特征敏感數據的安全。
建設軍事強國、情報強國的關鍵在于人才,高層次人才是軍事情報領域的核心競爭力。要下大力氣解決大數據軍事情報高端人才培養、使用和團隊建設問題。要為高端人才創造良好的政策環境、科研環境與工作環境,并從薪酬待遇、發展前景等多個方面加大力度吸引、留住國內甚至國際頂尖人才。要做好大數據、互聯網、人工智能、心理學、經濟學、法學等多學科交叉融合,推動政府、高校、科研機構、企業與軍事部門在大數據軍事情報領域的對接協作,軍民融合形成合力,形成規模,才能有所突破,參與國際競爭。
[1] 胡曉峰.戰爭科學論[M].北京:科學出版社,2019.
[2] 郭繼光,黃勝.基于大數據的軍事情報分析與服務系統架構研究[J].遠望周刊,2017,12(4):389-393,413.