安輝 顧麗娜 劉劍
摘要:闡述基于互聯網采集獲取軍事開源情報的目的任務、采集內容和采集原則,根據不同的軍事應用需求,分析開源情報的采集策略,分別從信息源和信息內容角度,對開源情報數據資源的可靠性評估進行研究,為建設基于互聯網大數據的開源軍事情報系統、運用情報數據支撐作戰指揮決策提供研究思路與方法。
關鍵詞:軍事情報;采集策略;數據可靠性
開源情報是美國情報界重要的情報收集類別之一,與人力情報、信號情報、圖像情報、技術情報、測量與特征情報共同構成了一個完備的情報收集體系。據國際情報專家的估計,目前西方發達國家的國家情報40%到95%都是以開源情報的形式獲取的。在信息化時代,海量的信息和資料被數據化,共享于網絡空間,成為軍事情報富礦資源。在信息技術的支持下,從互聯網獲取開源軍事情報數據,可以對全球范圍內的信息資源施行24小時的持續搜集, 并通過對這些數據進行分析和處理得到情報信息產品,可以快速填充情報地圖,找出情報空白,在一定程度上能對秘密情報進行相互印證和補充。
一、互聯網開源軍事情報采集任務和內容
(一)互聯網開源軍事情報采集的目的
軍事情報的研究成果是指揮作戰的重要保證,在軍事斗爭中,所有情報活動的目的都只有一個——知彼。充分占有情報,不僅會為掌握戰場主動權創造必要條件,也會為充分發揮指揮謀略在軍事競爭中作用奠定基礎。根據軍事的特定任務和情報需要,從互聯網獲取開源情報信息,在廣泛收集和積累有關資料的基礎上,運用科學方法和技術手段,對情報材料進行鑒別、整編,通過分析、對比、判斷、綜合等邏輯思維和聚類、分類、語義分析、神經網絡關聯等技術過程,揭示研究對象的本質規律和相互聯系,從本質上講,就是要最大限度地揭示情報價值,滿足軍事斗爭對需要。
(二)互聯網開源軍事情報采集的任務
軍事情報數據支撐是指揮員下定決心的基礎,并不局限于受領任務之后和下定決心之前,而是貫穿于指揮決策的全過程。信息化條件下戰爭作戰空間覆蓋范圍廣,涉及領域多,戰場環境更加復雜,軍事情報采集任務更加艱巨。從互聯網開展采集整編作戰對象或潛在作戰對象的作戰力量、裝備建設、作戰能力、軍事演習、預設戰場自然環境、氣候周期變化等相關情況報道,基于主題情報需求進行數據分析、追蹤監測、整編處理、分析評估、趨勢預警,獲取敵方技術與裝備的重要戰技指標,有利于針對性地進行作戰訓練,提高部隊作戰能力,為指揮決策提供情報數據支撐。
(三)互聯網開源軍事情報采集的內容
作為軍事指揮綜合信息服務敵情、我情、戰場環境數據的有益補充,從互聯網收集軍事情報數據為指揮員綜合研判、指揮決策提供了大數據支撐,視角上應著眼戰略、戰役、戰術三個層次。戰略層視角,收集有關國家的軍事戰略和軍事力量,包括當前世界政治形勢與主要大國的政治動向、綜合國力、部隊建設力量甚至作戰區域社會經濟等信息;戰役層視角,收集敵方部隊敵軍企圖、實際作戰指揮與協調能力、作戰力量編成、作戰方法應用、作戰保障能力等信息;戰術層視角要收集敵方戰術指揮官情況、戰斗序列、兵力部署、武器裝備參數等信息。
二、互聯網開源軍事情報采集原則
(一)基于情報收集任務主題的針對性原則
互聯網是一個公開的信息發布、傳播和交流的平臺,軍事情報廣泛分布于整個網絡空間,軍事信息的發布者既有政府部門、軍隊部門,也有各科研機構、高校院所,甚至是公司企業和個人言論。正由于軍事情報來源的廣泛性、多樣性特征,信息冗余污染嚴重,信息質量參差不齊,情報拾取難度較大。因此,要制訂互聯網軍事情報采集方案,設定情報采集目的,可預設多個情報采集主題,與軍事情報需求的內容、功能、流程相適應,形成結構合理、層次清晰的軍事情報采集目錄清單,提高軍事情報采集獲取效能。
(二)基于情報應用的綜合性原則
存儲于互聯網絡的軍事信息涵蓋了不同歷史時期、國家和地區的靜態軍事信息和動態軍事信息,涉及與軍事情報有關的政治、經濟、軍事、科技、社會、人文、地理及自然氣候等各個專業領域,在時間和空間上跨度大。因此要基于實際軍事問題的應用需求,設計具有可操作性的情報采集手段。一是收集情報的內容要體現一定的軍事效益;二是按照一定規則形成體系,既要全面反映,又要重點突出;三是以宏觀分析方法為依據,通過演繹和歸納,反映軍事情報的內在聯系;四是把握整體性、系統性和靈活性,需針對不同的軍事目的采取相應的方法。
(三)基于情報溯源的動態性原則
網絡的本質是信息公開和共享,信息傳播速度快,更新快,信息零散保存不完整,而現代戰爭的快速反應、快速決策、快速實施對軍事情報提出了更高的時效性要求。一方面要突出對重點國家、重點人物、重點地域的情報進行重點時段的重點采集;另一方面需要將不同時間、不同國家的數據和以往戰爭的軍事情報數據結合,進行合乎邏輯地分析,互相補充、互相印證,使得“情報拼圖”更加清晰、完整,挖掘出深層次的聯系,從而辨別真偽,提高情報的準確性和可靠性。
三、互聯網開源軍事情報采集策略
(一)目標網站定向抓取策略
根據既定軍事情報任務需求,確定情報研究的主題,制訂軍事情報采集整編方案,選取典型情報來源網站,框定情報數據獲取范圍,基于主題設置采集匹配的關鍵要素、要素間的關聯關系和關聯程度,運用網絡爬蟲在目標網站中采集獲取情報數據。主要是針對網站的新聞熱點、重要人物報道、重大事件動態、武器裝備研發試射等描述性信息、靜態及動態網頁數據實時采集和定時段抓取,形成情報任務關聯綜合數據信息庫,采用大數據技術手段進行整編,形成主題情報資源目錄,為指揮決策提供情報資料信息服務。
(二)關鍵目標溯源追蹤抓取策略
根據關鍵目標情報任務,制訂軍事情報采集整編方案,基于目標主題設置采集匹配的關鍵要素、要素間的關聯關系和關聯程度,運用搜索引擎在互聯網網站群中采集獲取情報數據。一是進行關鍵詞關聯搜索和語義目標搜索,借助時間序列分析、相關性分析等定性和定量相結合的情報分析方法,對多源采集的半結構化和非結構化等異構情報數據,按目標主題需求進行過濾、去重、篩選;二是運用語義分析方法,對數據中的人物、地點、時間、事件、武器裝備、環境等關鍵要素信息進行智能提取,形成被描述對象的標簽屬性體系;三是采用聚合分類技術,將零亂的、彼此孤立的、無序的情報數據資料加工成相互關聯的情報信息,使數據資料變得系統化、有序化,整編為精準全面的情報數據產品。
四、互聯網開源軍事情報信息可靠性評估
可靠性包含專業性和真實性兩層含義,在進行可靠性評估時, 應分別對應于互聯網開源情報的信息源和信息內容,開展相互獨立而又相互關聯的綜合評估。
(一)信息源可靠性評估
從互聯網收集獲取情報信息,信息源就是特定的網站,要從網站的組織特征、頁面特征和價值特征三個方面進行評估。(1)組織特征,信源網站有無網站備案,是否由一個合法組織來管理運營,該網站有無管理監督機構,該組織的專業性如何,網站信息提供者資質是否符合軍事情報信息采集要求。(2)網頁特征,網頁內容主體是否會圍繞某領域、某主題展開報道和論述,內容上是否以方便閱讀作為報道目標,頁面的商業性內容與主體內容是否明確區分開,網頁鏈接是否為死鏈,其鏈接是否指向可靠性較低的信息源。(3)價值特征,網站相關報道能否持續更新,是否滿足軍事需求,與情報主題內容相關的數據量能否滿足技術手段運用。
(二)信息內容可靠性評估
從互聯網采集獲取的公開信息要成為情報信息,必須避免單一信息來源帶來的片面性,采集多渠道來源的大量情報數據,通過運用相應技術手段有意識地發現、辨別、篩選和確認,需從信息內容合理性、邏輯可靠性、對比可靠性等方面進行評估。(1)信息內容合理性,所表述的事件內容是否在當時的政治、經濟、社會、軍事背景下合乎形勢,人物姓名是否含糊不清,所言有無斷章取義,行文是否直截清晰準確。(2)邏輯可靠性,信息本身是否存在邏輯沖突和邏輯錯誤。
(3)對比可靠性,既要對信息源內部的連續報道與已經證實的事件和得到的結論之間進行對比,也要進行信息源之間的相互印證,與其他來源的信息進行對比分析,能否與其他來源的信息相互佐證,是否與其他來源的信息沖突。
五、結語
任何開源信息都是具體活動的征兆,或是不為人知的活動所引發的聯動效應。要樹立大情報觀念,重視開源情報在軍事領域的基礎性價值,在信息化、網絡化、數字化的社會背景下,從互聯網采集獲取開源軍事情報,建立多源情報大數據體系,將各渠道、各領域的情報信息進行整編、關聯、印證分析、分類展現,在運用情報數據支撐指揮決策方面發揮重要作用。
【參考文獻】
[1]沈固朝,趙小康.國外公開源情報研究及其對我們的啟迪[J].圖書情報工作,2011.
[2]趙科.網絡環境下公開軍事情報的收集途徑研究[J].圖書館工作與研究,2008(6):54-57.
[3]李月麗.論軍事情報作戰[J].情報雜志,2017(7):
99-100.