劉海燕 朱銘銘



收稿日期:2023-09-02
DOI:10.19850/j.cnki.2096-4706.2024.06.018
摘? 要:戰場信息網是人員、設備、武器平臺等互聯互通的復雜網絡,戰場信息網信息群的發現確定,可以進一步定位敵方的戰場部署和指揮關系,為作戰決策提供更詳細的情報支持。在以往的研究中大多以發現拓撲結構為重點對戰場信息網進行分析,文章探索利用節點的屬性信息進行信息群發現,首先搭建一個虛擬的戰場信息網,模擬戰場上的情報群和指控群以及其他信息群通信,通過抓取不同信息群節點數據包提取數據特征來構建節點數據集;然后搭建DNN模型以數據特征作為輸入,對節點的信息群屬性進行判斷;最后搭建一個虛擬戰場信息網,使用訓練后的DNN模型對節點所屬信息群進行判斷。
關鍵詞:信息群;數據特征;深度學習
中圖分類號:TP393? 文獻標識碼:A? 文章編號:2096-4706(2024)06-0078-04
Information Group Discovery Technology of Battlefield Information Network
Based on Deep Neural Networks
LIU Haiyan, ZHU Mingming
(Army Academy of Armored Forces of PLA, Beijing? 100072, China)
Abstract: The battlefield information network is a complex network of personnel, equipment, weapon platforms and so on, and the discovery and determination of the battlefield information network information group can further locate the enemy's battlefield deployment and command relationship and provide more detailed intelligence support for operational decision-making. In the past research, most of the battlefield information network analysis focuses on the discovery of topology, this paper explores the use of node attribute information for information group discovery, first builds a virtual battlefield information network, simulates the battlefield intelligence group, accusation group and other information group communication, and construct node data set by capturing different information group node data packets to extract data features. Then, a DNN model is built to judge the information group attributes of nodes by using data characteristics as input. Finally, a virtual battlefield information network is built, and the trained DNN model is used to determine the information group to which the node belongs.
Keywords: information group; data characteristics; Deep Learning
0? 引? 言
網絡社區是指內部連接緊密,而外部稀疏的群體結構?;ヂ摼W社區可以以用戶的共同興趣、教育背景等為分割標準,如論壇、微信群等。社區發現技術為了解、監視、控制乃至運用各種網絡起到了至關重要的作用。
以互聯網技術為基礎的戰場信息網,鏈接多維戰場空間的各類作戰單元,支持對戰場的全面掌控。復雜網絡都存在著普適的局部聚集特征,戰場信息網也不例外。戰場信息網中不同通信節點擔負的通信任務不同,節點的流量特征也不同,可以將具有相同流量特征的節點集合命名為信息群。
信息化作戰中,發現敵方戰場信息網信息群可以得到重要節點和通信流向甚至是整個信息網的部署關系,有助于監視、控制、切斷、打擊破壞相關節點。本文借鑒互聯網社區發現技術,研究設計戰場信息網信息群發現技術。
1? 網絡社區發現方法分析
社區檢測研究最早是從子圖分割問題演化來的[1],最傳統的社區發現算法是圖分割算法,即將社區看作密集子圖結構,而社區發現就是將網絡中的節點分配到多個已經預先定義好規模的社區中,并使處在社區間的邊數最小。聚類法將社區看作一組內容相似的節點集合,定義結點的相似度,使用聚類方法進行社區發現。分裂法進行社區發現將社區之間的連接視為有最高通信流量的邊,然后將其刪除?;谧V分析的社區發現算法的基本依據是,在同一個社區內的節點其特征向量近似。將節點對應的矩陣特征向量看成空間坐標,將網絡節點映射到多維向量空間,然后運用傳統的聚類算法將它們聚集成社區?;谀K度優化的社區檢測算法認為,較高的模塊度值應該對應較好的網絡劃分。其中,模塊度是優化的目標函數,它表示所有被劃分到同一個社區的邊所占的比例,再減除掉完全隨機情況時被劃分到同一個社區的邊所占的比例。三種常用的近似最優算法包括貪心技術、模擬退火[2]、極值最優[3]。動態社區檢測算法則隨著時間流逝的過程動態更新節點的社區劃分。基于深度學習的社區發現[4],將網絡的拓撲結構和屬性作為神經網絡的輸入,其中網絡拓撲結構可用鄰接矩陣表示,網絡的屬性可以用特征矩陣表示,神經網絡的輸出就是發現的一組社區。
傳統的社區發現研究認為每個節點歸屬于一個社區。而在現實的網絡中,一個節點可以同時歸屬于不同的社區,例如在社交網絡中,某人同時屬于不同的微信群。重疊社區的發現比較具有挑戰性。
現有的社區發現算法,主要依賴網絡拓撲結構來發現社區,但社區的形成除了與節點間拓撲結構有關外,還受到節點自身相關屬性信息的影響。本文提出的基于流量特征的戰場信息網信息群發現,借鑒了互聯網社區發現的思路,運用深度神經網絡挖掘通信節點數據流量的特征,并基于該特征判斷節點所屬的信息群。
2? 基于流量特征的節點信息群屬性判別
2.1? 信息群節點流量特征分析
戰場信息網是多作戰平臺聯合、協作的紐帶,貫穿整個作戰進程。戰場信息具有海量性、多源性、異構性和動態性等特點。一般地,為了使戰場信息形成規范、語義一致,需要對戰場信息進行統一表示[5]。面向任務的格式化戰場信息表示是結合消息編碼、消息字典以及消息格式于一體的信息表示的方法,通過約定格式化消息及處理規則實現多系統互連互通,典型代表是美軍戰場信息網中各種數據鏈消息標準。
數據鏈以通信網絡為紐帶,以信息處理為核心將戰場態勢感知系統、火力打擊系統等作戰要素有機相連,實現各軍兵種作戰部隊與武器平臺之間的信息交互和態勢共享[6]。不同數據鏈具有不同的傳輸方式和信息格式[7],目前美軍數據鏈分為三類:態勢感知數據鏈,用于多平臺之間信息的交換,主要是傳輸格式化報信息,可以傳輸各類指揮控制信息,包括作戰指令、戰場態勢分析、戰略規劃等,實現指揮員之間的信息共享和指揮控制,通常采用的快速、簡單、對實時性要求不太高的簡短報文進行傳輸[8-10];情報數據鏈傳輸圖像和信號情報,支持多種類型的情報信息傳遞,具有高速、高效、實時不間斷的特點[11,12];其他專用數據鏈,如武器協同數據鏈,是武器打擊專用信息交換數據鏈。
由此可以看出,不同信息鏈路中的節點由于其主要任務不同,傳輸數據的種類、頻率、格式等都不同,因此,可以挖掘不同信息群節點傳輸數據的流量特征,并據此根據節點的流量來判斷節點的信息群屬性,這對識別戰場信息網中通信節點的關系和任務有重要作用。
2.2? 基于流量特征的節點信息群屬性識別方法
在戰場信息網中,基于流量特征判斷節點的信息群屬性,其基本思路包括如下三步,一是搭建與實際戰場信息網相似的網絡環境,運行與真實作戰數據鏈類似的數據傳輸任務,捕獲不同信息群節點傳輸的網絡數據包,并提取數據包特征。二是搭建節點信息群屬性判別的深度神經網絡模型,以捕獲的網絡數據特征數據集為樣本對模型進行訓練。三是構建虛擬戰場信息網,利用訓練的深度神經網絡模型,基于實時捕獲的數據包特征,對節點的信息群屬性進行判別,并將網絡的信息群識別結果進行展示。
2.3? 基于流量特征的節點信息群屬性識別方法的實現
2.3.1? 節點的流量數據抓取
在模擬戰場信息網中,模擬偵察機回傳偵察信息來獲取情報鏈路數據,模擬指揮節點對下級發送指控報文來獲取指控鏈路數據。為了統一時間計算標準,以1分鐘為時間長度,在情報鏈路上的不同節點提取6 000條數據,指控鏈路上不同的節點提取20 000條數據,不屬于上述鏈路的節點上提取10 000余條數據。
2.3.2? 節點的流量特征提取
基于pyshark分析網絡協議,創建事件循環,異步處理數據包,以抓取數據包與上一個數據包時間間隔、捕獲幀的增量、與第一個數據包的時間間隔、數據包標識符號、數據包的大小、IP數據包總長度作為數據特征,自動化提取特征構造數據集。為每個樣本標注節點信息群屬性標簽,用0代表“情報群”,1代表“指控群”,2代表“其他”。數據集xlsx文件如圖1所示。
2.3.3? 基于流量特征的節點信息群屬性模型構建
基于構造的數據集,搭建深度神經網絡模型,通過多分類方法構造節點的信息群屬性判定模型。此模型共三層,在輸入層和隱藏層1之間有64個閾值;隱藏層1和隱藏層2之間有32個閾值;輸出層和隱藏層2之間有3個閾值。對數據集進行切分,將80%的數據作為訓練集,用20%的數據作為測試集。
圖1? 數據集文件
創建判定模型model = Sequential(),添加具有ReLU激活函數的全鏈接層,最后添加基于softmax激活函數的輸出層,以進行三分類:
model.add(Dense(64,input_dim=X_train.shape[1],activation="relu"))
model.add(Dense(32,activation="relu"))
model.add(Dense(3,activation="softmax"))
model.compile(loss="categorical_crossentropy",optimizer="adam",metrics=["accuracy"])
訓練模型迭代200次,每次32個樣本數據進行訓練,并將10%的訓練數據分配為驗證數據對模型進行評估。訓練集和驗證集的loss曲線、acc曲線如圖2、圖3所示??梢钥闯龃擞柧毮P椭杏柧毤万炞C集都已經收斂且兩者之間相差非常小,模型的擬合度很好。
圖2? 損失變化曲線
圖3? 準確率變化曲線
對此模型使用驗證集進行評估,其中情報群樣本精確率為0.984 375,召回率為1,F1-score指標為0.99;指控群樣本精確率為1,召回率為0.98,F1-score指標為0.99;其他信息群樣本精確率為1,召回率為1,F1-score指標為1。通過評估可以得到該模型對于每個測試集樣本的預測都比較準確。
2.3.4? 基于流量特征的信息群發現
基于訓練得到判定模型后,可以實時對任何節點的信息群屬性進行識別。隨機在一些節點間運行模擬的偵察情報通信和指控信息通信,在任一節點上抓取600條數據包,提取節點的流量特征,將特征與節點的IP地址一起保存。將節點的數據去除ip地址,得到predict_data,利用模型model計算預測結果predict_res。
predict_res = model.predist(predict_data)
將預測的標簽與原始數據的ip地址列合并,作為判定結果保存。
3? 實驗過程及結果顯示
使用VMware虛擬機軟件,搭建一個虛擬戰場信息網測試網,虛擬了13個通信節點。利用不同信息群節點傳輸數據的流量特征在虛擬機間運行模擬通信,抓取不同鏈路節點數據并針對抓包后的文件自動提取數據特征轉化為表格模式,搭建深度神經網絡模型,通過多分類方法對節點信息群屬性的模型進行訓練,形成訓練模型,最后搭建虛擬戰場信息網進行通信,對不同節點抓取數據包,用訓練模型進行判斷,將抓取數據包的IP地址和標簽進行結合,得到判定結果文件。
識別每個ip的標簽值,如果此ip是情報群節點標簽值為0,標簽值是指控群節點則標簽值1,屬于第三種信息群標簽值為2,同時處于多種信息群的節點在其ip后有相對應的標簽值,如ip地址為192.168.1.40同時處于情報群和指控群,對應的標簽值為{0,1},最后利用標簽值進行顏色映射。
情報群節點通過綠色表示,指控群節點通過藍色表示,第三種信息群使用紅色表示,同時處于情報群和指控群的節點通過黃色表示,同時處于指控群和第三種信息群的節點通過橘色表示,同時處于三種信息群的節點通過紫色表示。通過圖4可以直接得到各節點在戰場信息網中所屬信息群,以及處于多個信息群的重要節點。
圖4? 節點信息群屬性顯示
4? 結? 論
本文研究設計了一種根據結點數據流特征判斷其信息群屬性的方法。搭建虛擬戰場信息網對不同信息群節點的流量進行分析,提取不同的特征,基于深度學習方法判斷節點所處的信息群。在此過程中運用深度神經網絡多分類法,基于流量特征形成訓練模型,對網絡節點的信息群屬性進行判斷,最后用不同顏色呈現信息群分類結果。通過該圖能夠快速判斷網絡節點處于不同的信息群以及該節點的重要性。該方法可以拓展應用到更多種類信息群的判定,以及基于不同特征的信息群劃分中。該方法缺點是需要捕獲流量數據,基于流量特征構建模型并進行判斷,因此該方法還需要其他網絡攻防技術的支持。
參考文獻:
[1] 潘磊.若干社區發現算法研究 [D].南京:南京大學,2014.
[2] 李眩,童百利,方婷婷.基于模擬退火思想的最優最差蟻群算法求解的TSP問題 [J].山西師范大學學報:自然科學版,2023,37(2):22-27.
[3] BetterBench.模擬退火算法(SA)、遺傳算法(GA)、布谷鳥算法(CS)、人工蜂群算法(ABC)學習筆記---附MATLAB注釋代碼 [EB/OL].(2021-04-09).https://zhuanlan.zhihu.com/p/363411887.
[4] 張茹.基于深度學習的社區發現和影響力分析 [D].西安:西安電子科技大學,2020.
[5] 潘積遠,高亮. 戰場信息組織管理現狀及其發展趨勢 [J].物聯網技術,2015,5(6):81-83.
[6] 科普中國-軍事科技前沿.美軍為何密集測試戰術數據鏈系統 [EB/OL].(2021-10-27).https://junshi.gmw.cn/2021-10/27/content_35290154.htm.
[7] 張沛,王志國,王震.美國空軍數據鏈體系發展現狀及建設方向 [J].指揮信息系統與技術,2023,14(1):8-14.
[8] 劉紅軍,徐永勝.美軍戰術數據鏈報文格式及其特點 [J].中國電子科學研究院學報,2006(3):291-295.
[9] 張繼永.基于作戰任務的數據鏈網絡規劃模型 [J].數字技術與應用,2020,38(5):71-72.
[10] 方秀花,姚瑞芳.FBCB2系統的作戰應用及未來發展 [J].火力與指揮控制,2006(3):1-4.
[11] 周??。探?軍隊信息保障體系建設及技術發展研究綜述 [J].計算機與數字工程,2016,44(9):1790-1795.
[12] 張沛,王志國,王震.美國空軍數據鏈體系發展現狀及建設方向 [J].指揮信息系統與技術,2023,14(1):8-14.
作者簡介:劉海燕(1970.03—),女,漢族,河北遵化人,教授,博士,研究方向:網絡信息安全和信息通信;朱銘銘(1991.08—),女,漢族,山東濰坊人,碩士在讀,研究方向:通信網絡。