張天赫,彭紹雄,鄒強,王棟
(海軍航空工程學院,山東 煙臺 264001)
在戰場態勢分析中,敵方的戰術意圖[1]是指揮員決策的重要依據之一,對敵方戰術意圖判斷的準確性和及時性將直接影響我方作戰指揮決策的正確性和有效性。傳統作戰中,主要依靠人為判斷的戰術意圖[2]識別過程已經不能適應現代戰場上的信息化作戰需要,迫切需要智能化手段來實現戰術意圖的識別。
在美國國防部JDL實驗室2004年發布的最新數據融合層次模型[3-4]中,意圖識別作為高層數據融合過程成為戰場態勢評估和威脅評估中的重要組成部分。21世紀以來,隨著數據融合技術的發展,該技術已經成為國內外軍事決策領域研究的焦點。
軍事中的戰術意圖識別領域[5],也就是依據從各種信息源得到的信息,結合敵方兵力的部署、戰場環境的分析、敵方戰斗編隊和戰場警戒程度、我方所承擔的作戰任務,來識別敵方戰術意圖和作戰計劃的過程。
現有的各種方法難以對軍事目標的戰術意圖的進行有效的識別和推理。為此,本文研究提出了基于無監督學習神經網絡模型[6],嘗試對潛艇對空戰術意圖識別問題給出另一種解決思路。
競爭神經網絡[7]是一種典型的、應用非常廣泛的無監督學習神經網絡,其結構如圖1所示。競爭神經網絡由輸入層和競爭層組成。與RBF等神經網絡類似,輸入層僅實現輸入模式的傳遞,并不參與實際的運算。競爭層的各個神經元以相互競爭的形式來贏得對輸入模式的響應,最終只有一個神經元贏得勝利,并使與該獲勝神經元相關的各連接權值和閥值向著更有利于其競爭的方向發展,而其他神經元對應的權值和閾值保持不變。
自組織特征映射(self-organizing feature mapping,SOFM)神經網絡[8]是Kohonen于1981年提出的。其主要思想是在學習過程中逐步縮小神經元之間的作用鄰域,并根據相關的學習規則增強中心神經元的激活程度,從而去掉各神經元[9]之間的側向連接,以達到模擬真實大腦神經系統“近興奮遠抑制”的效果。
如圖2所示,SOFM神經網絡的結構與競爭神經網絡的結構類似,是一個由輸入層和自組織特征映射層(競爭層)組成的兩層網絡。在SOFM神經網絡中,不僅與獲勝神經元對應的權值和閾值得到調整,其鄰近范圍內的其他神經元也有機會進行權值和閥值調整,這在很大程度上改善了網絡的學習能力和泛化能力。
(1) 網絡初始化[10]
如圖1所示,輸入層由R個神經元構成,競爭層由S1個神經元構成。為不失一般性,設訓練樣本的輸入矩陣為
式中:pij為第j個訓練樣本的第i個輸入變量;Q為訓練集樣本數,并記
pi=(pi1,pi2,…,piQ),i=1,2,…,R.
則網絡的初始連接權值為
IW1,1=(ω1,ω2,…,ωR)S1×R,
式中:
網絡的初始閾值為
同時,在學習之前需初始化相關參數。設權值的學習速率為α,閾值的學習速率為β,最大迭代次數為T,迭代次數初始值N=1。
(2) 計算獲勝神經元
隨機選取一個訓練樣本p,根據
(1)
設競爭層第k個神經元為獲勝神經元,則應滿足
(2)
(3) 權值、閾值更新
神經元k對應的權值和閾值分別按照
(3)
b1=e1-ln[(1-β)e1-ln b1+β×a1]
(4)
(5)
(4) 迭代結束判斷
若樣本還沒有學習完,則再另外隨機選取一個樣本,返回步驟(2)。若N SOFM神經網絡與競爭神經網絡的算法相似,僅在權值調整部分有較大差異。 (1) 網絡初始化 (2) 計算獲勝神經元 與競爭神經網絡采取相同的方式。 (3) 權值更新 根據 (6) 獲勝神經元k及其鄰域Nc(t)內的所有神經元進行權值更新。 (4) 學習速率及鄰域更新 獲勝神經元及其鄰域內的神經元權值更新完成后,在進入下一次迭代前,需要更新學習速率及鄰域,即 (7) (8) 式中:「x?表示對x向上取整。 (5) 迭代結束判斷 與競爭神經網絡采取相同的方式。 本文給出了一種結合特征參數識別和事件檢測的潛艇對空戰術意圖識別方法[11],由于潛艇在執行任務過程中,空中目標的意圖識別意義重大,直接決定了其是否發現我方潛艇,進而知曉是否對我方采取行動。而利用目標特征參數(如目標編隊組成(聲納信息)、區域警戒程度、距離、運動角度)[12]與作戰態勢及目標的戰術意圖息息相關。本文選取了攻擊、搜潛、驅離、巡邏4種戰術意圖[13]作為輸出變量。其中基本目標信息和作戰區域警戒程度如表1,2所示。 表1 基本目標信息 表2 編隊目標信息 當雙方在某區域相遇時,區域的警戒程度對作戰雙方是否會采取更加激烈的應對手段起到重要的作用,其區域警戒程度與戰術意圖之間的模擬關系[14]如表3,4所示。 表3 作戰區域警戒程度 表4 警戒程度與戰術意圖間的關系 編隊的構成越復雜則其戰術意圖越具有攻擊性,表5選取了典型的編隊構成情況,其對應關系[15]如表5所示。 表5 目標類型與目標戰術意圖之間的關系Table 5 Relationship between target type and target tactical intention 目標對潛艇的威脅程度隨著距離的減下而越來越大,表6設定了雙方距離閾值[16]及其對應的戰術意圖。當反潛直升機與反潛巡邏機和潛艇作用距離在2 000 km以上時,潛艇較難探測到目標,且目標對潛艇不構成威脅,因此不進行討論。 表6 目標距離與目標戰術意圖之間的關系Table 6 Relationship between target distance and target tactical intention 目標運動角度越小,其威脅越大,表7設定了目標運動角度的閾值及其對應的戰術意圖。 由上述表格,專家評估給出每組數據對應的目標戰術意圖,目標戰術意圖由數字1,2,3,4分別表示攻擊、搜潛、驅離及巡邏。現采集到某類型數據樣本39組,由于獲取的樣本數量較少,為保證建立的模型具有較好的泛化能力,這里從每個戰術意圖組內選出4個樣本作為測試集,余下的35個樣本作為訓練集。其中部分樣本數據由表8給出。 表7 目標運動角度與目標戰術意圖間的關系Table 7 Relationship between target motion angle and target tactical intention 表8 部分系統訓練樣本 為了減少輸入變量間的變化較大(不屬于同一數量級)對模型性能的影響,在模型建立之前對輸入變量進行歸一化處理。下面將系統訓練樣本進行歸一化處理[17],歸一化使用Matlab自帶的歸一化函數mapminmax進行歸一化處理,歸一化后的部分訓練樣本數據見表9。 實際的戰術意圖[18]用y來表示,獲勝神經元編號(競爭神經網絡)用x1來表示,獲勝神經元編號(SOFM神經網絡)用x2來表示,由于網絡在訓練的過程中采取的是隨機抽取訓練樣本的方法,因此每次運行的結果都會有所不同。某次的運行結果如表10所示。從表10中不難發現以下幾點: (1) 對于競爭神經網絡,第1種目標戰術意圖與競爭層第2個神經元相對應;第2種戰術目標與競爭層第2個神經元相對應(僅有第18號樣本對應的是競爭層的第4個神經元);第3種軍事目標與競爭層第4神經元相對應;第4種軍事目標與競爭層的第1個神經元相對應(僅有第28號樣本對應的是競爭層的第4個神經元)。因此對于第1,2,3,4種軍事目標依次對應的獲勝神經元是第2,2,4,1神經元,據此對應關系推斷,可以發現測試集中36,37,38,39號樣本分類正確。 表9 部分歸一化后的系統訓練樣本 表10 競爭神經網絡與SOFM神經網絡預測結果對比 (2) 對于SOFM神經網絡[19],第1種目標戰術意圖對應的獲勝神經元編號為4,7,8;第2種目標戰術意圖對應的獲勝神經元編號為3,6,7,11,12,14,15;第3種目標戰術意圖對應的獲勝神經元編號為2,9,10,13,14,16;第4種目標戰術意圖對應的獲勝神經元編號為1,2,5。據此對應關系可以發現測試集中除了第38號樣本,其余3個樣本對應的獲勝神經元編號在訓練集中對應的獲勝神經元編號集合內,因此,可以判定其正確率為75%。 注意到,若測試集中某個樣本的預測獲勝神經元編號為7,則難以斷定其屬于第1種目標戰術意圖或是第2種目標戰術意圖。同理,若測試集中某個樣本的預測獲勝神經元編號為14,則同樣難以預測其屬于第2種目標戰術意圖或是第3種目標戰術意圖。圖3為神經元網絡拓撲學結構圖,代表本次仿真生成神經元的結構。 這里需要強調,若測試集中的某個樣本的預測獲勝神經元編號從未出現過訓練次數(本文未出現該情況),則難以圈定其屬于哪一類樣本。因為在訓練的過程中,其神經元從未贏得獲勝機會,一直處于抑制狀態,即成為所謂的“死”神經元。 圖4中神經元的編號方式是從左至右,從上至下,神經元編號逐漸增加,即左下角的神經元編號為1,右上角的神經元編號為16,而神經元編號與其獲勝次數間的具體映射關系如表11所示。 圖5表示競爭層鄰近神經元的連接情況,灰色的表示神經元節點,紅線表示神經元之間有連接。 圖6為競爭層各個神經元與其周圍鄰近神經元間的距離分布圖,相鄰神經元間填充區域的顏色表示2個神經元間的距離遠近程度。顏色越深(越接近黑色),表明神經元間的距離越遠。從圖中可以看出5號與6號神經元之間的距離較遠。同時,從表9可以看出5,6號獲勝的神經元分別對應第4,2種目標戰術意圖,這表明不同類別的神經元之間距離較遠。同理可以觀察到,同一類別對應的獲勝神經元之間的距離較近,例如在第1種目標戰術意圖所對應的4,7,8神經元間的距離就較近,其余類別的目標戰術意圖分析方法類似,此處不再贅述。 圖7表示每個輸入向量和競爭層神經元之間的權重連接情況。權值最小的顏色塊為藍色,權值為0的顏色塊為黑色,權值最大的顏色塊為紅色。 神經元編號12345678獲勝次數22115133神經元編號910111213141516獲勝次數21523211 圖8為輸入數據與權重圖,其將輸入的向量用綠色的圓點標注,并通過每個神經元的權重向量和用紅線連接的相鄰神經元顯示出SOM如何分類輸入空間[20]。 從表10及分析結果可以看出,與競爭神經網絡相比,SOFM神經網絡的性能更好,泛化能力更強。這是因為,競爭神經網絡在學習時,每次僅有一個神經元贏得獲勝機會,只有獲勝神經元的權值得到調整,而SOFM神經網絡雖然每次亦只有一個神經元贏得獲勝機會,但其及其鄰近范圍內的神經元對應的權值同時進行修正,朝著更有利于其獲勝的方向調整。同時,SOFM神經網絡逐漸縮小其鄰域范圍,逐漸“排斥”鄰近的神經元。這種“協作”與“競爭”相結合的模式使得其性能更加優越。 潛艇在水下面對復雜多變的戰場環境,尤其受到來自空中目標的威脅,及時準確的判斷空中目標的意圖,對我方決策者采取合理應對措施,提高潛艇的生存概率都具有重要意義。下一步,將增加競爭層中“死”神經元,增加其閾值的調整幅度,進一步提升模型的準確性。 參考文獻: [1] 秦富童,岳麗華,萬壽紅.應用BP神經網絡的目標識別效果評估[J].計算機工程與應用,2010,46(5):148-156. QIN Fu-tong,YUE Li-hua,WAN Shou-hong.Performance Evaluation in Automatic Target Tecognition Using BP Neural Network[J].Computer Engineering and Applications,2010,46(5):148-156. [2] 葛順,夏學知.用于戰術意圖識別的動態序列貝葉斯網絡[J].系統工程與電子技術,2014,36(1):76-83. GE Shun,XIA Xue-zhi.DSBN Used for Recognition of Tactical Intention[J].Systems Engineering and Electronics,2014,36(1):76-83. [3] JOHANSSON F,FALKMAN G.Implementation and Integration of a Bayesian Network for Prediction of Tactical Intention into Ground Target Simulator[C]∥Proc.of the 9th International Conference on Information Fusion,2006:1-7. [4] TIAN Yu,ZHANG Ai-qun.Simulation Environment and Guidance System for AUV Tracing Chemical Plume in 3-Dimensions [C]∥2010 2nd International Asia Conference on Informatics in Control,Automation and Robotics,2010:407-411. [5] 蘇琦,于敬人,金國棟.一種潛艇對水面艦艇編隊攻擊意圖建模方法[J].四川兵工學報,2014,35(9):147-149. SU Qi,YU Jing-ren,JIN Guo-dong.A Modeling Method of Attack Intention of Submarine for Vessel Formation[J].Sichuan Ordnance Journal,2014,35(9):147-149. [6] 錢江,許江湖.基于BP神經網絡的空中目標威脅排序[J].現代防御技術,2001,29(6):56-58. QIAN Jiang,XU Jiang-hu.Threat Sequencing for Aerial Target Based on BP Neural Network[J].Modern Defence Technology,2001,29(6):56-58. [7] 何隆玲,胡桂明,李維維,等.基于PSO-RBF神經網絡的雷達目標識別[J].現代防御技術,2014,42(5):115-120. HE Long-ling,HU Gui-ming,LI Wei-wei,et al.Rader Target Recognition Based on PSO-RBF Neural Network[J].Modern Defence Technology,2014,42(5):115-120. [8] KANG Hai-yan,LI Chen.Research and Design on Personalized DL Based on J2EE[C]∥2008 IEEE Pacific-Asia Workshop on Computational Intelligence and Industrial Application.Wuhan,China:IEEE,2008:527-531. [9] 劉偉偉,胡興平,盧曉敏,等.基于SOFM神經網絡的SAR圖像目標識別[J].現代防御技術,2016,44(4):56-60. LIU Wei-wei,HU Xing-ping,LU Xiao-min,et al.SAR Image Target Recognition Method Based on SOFM Neural Network[J].Modern Defence Technology,2016,44(4):56-60. [10] 朱波,方立恭,張小東.基于貝葉斯網絡的空中目標意圖識別方法[J].現代防御技術,2012,40(2):109-113. ZHU Bo,FANG Li-gong,ZHANG Xiao-dong.Intention Assessment to Aerial Target Based on Bayesian Network[J].Modern Defence Technology,2012,40(2):109-113. [11] DONG Y K,KWAE H Y,JU H K,et al.Prediction of Leak Flow Rate Using Fuzzy Neural Networks in Severe Post-LOCA Circumstances[J].IEEE Trans.on Nuclear Science,2014,61(6):3644-3652. [12] WAI R J,MUTHUSAMY R.Fuzzy Neural Network Inherited Sliding-Mode Control for Rodot Manipulator Including Actuator Dynamics[J].IEEE Trans.on Neural Networks and Learning Systems,2013,24(2):274-287. [13] 陳紹順,王君.基于前向型神經網絡的空襲目標類型識別模型[J].現代防御技術,2002,30(2):57-60. CHEN Shao-shun,WANG Jun.Model of Air Striking Targets Type Recognition Based on Forward Neural Network[J].Modern Defence Technology,2002,30(2):57-60. [14] WU G D,HUANG P H.A Vectorization Optimization Method Based Type-2 Fuzzy Neural Network for Noisy Data Classification[J].IEEE Trans.on Fuzzy Systems,2013,21(1):1-15. [15] 吳文龍,黃文斌,劉劍.潛艇對水面艦艇編隊攻擊意圖推理研究[J].火力與指揮控制,2010,35(9):101-105. WU Wen-long,HUANG Wen-bin,LIU Jian.The Researching on the Inference about Fleet’s Attack Intention by the Submarine[J].Fire Control&Command Control,2010,35(9):101-105. [16] 陳浩,任卿龍,滑藝,等.基于模糊神經網絡的海面目標戰術意圖識別[J].系統工程與電子技術,2016,38(8):1847-1853. CHEN Hao,REN Qing-long,HUA Yi,et al.Fuzzy Neural Network Based Tactical Intention Recognition for Sea Targets[J].Systems Engineering and Electronics,2016,38(8):1847-1853. [17] HATAKEYA N,FURUTA K.Bayesian Network Modeling of Operator’s Intent Inference[C]∥IEEE 7th Human Factors Meeting,2002:55-60. [18] 陸光宇,丁迎迎.水下平臺對敵意圖識別技術研究[J].指揮控制與仿真,2012,34(6):100-102. LU Guang-yu,DING Ying-ying.Study on Intention Recognition to Foe of Underwater Platform[J].Command Control &Simulation,2012,34(6):100-102. [19] CARVALHO R N,COSTA P C G,LASKEY K B,et al.PROGNOS:Predictive Situational Awareness with Probabilistic Ontologies[C]∥Proceedings of the 13th International Conference on Information Fusion,Edin-Burgh,UJ,Jul.,2010:214-218. [20] CARVALHO R N.PO:Represention and Modeling Methodology[D].Virginia:George Mason University,2011.2.2 SOFM學習算法


3 實驗分析











4 結束語