王家鑫,王瑞琪,孟海波,藺紅明,陳天群
(1.海裝駐上海地區某部,上海 201109;2.上海機電工程研究所,上海 201109)
在目前日益緊張的國際局勢中,制海權一直是大國之間博弈的重點,海上艦艇編隊的進攻與防御體系的建立是掌握制海權的關鍵,也是各國一直以來研究的重點。在海上作戰時,防空反導一直是主要防御手段,防空導彈自20世紀50 年代問世以來,就引起了世界各國的高度關注。在進入21世紀后,隨著技術的不斷進步與更新迭代,海上防空體系與高強度空襲體系間的對抗強度愈發激烈,如何識別敵方來襲目標的攻擊意圖是提升海上防空反導攔截效率的必要手段。在當下信息化戰爭時代,海上戰場環境日益復雜,在軍事需求和信_息技術雙輪驅動下,海上艦艇編隊作戰針對來襲目標攻擊意圖識別是目前態勢分析領域研究的熱點,是防空反導作戰中指揮控制決策[1]的重要依據。戰場的復雜性、瞬時性的影響使得作戰指揮控制系統在短時間內無法處理大量戰場信息,指戰員無法做出最優決策,因此需要智能化作戰指揮控制系統輔助指戰員決策。智能化輔助決策系統提供的分析結果和預測模型可以提高指戰員的決策效率與準確性,提升指揮控制質量。隨著分布式殺傷、馬賽克戰、頻譜戰等新型作戰樣式與新型武器的應用,強敵海上作戰體系具備較強的多域體系作戰和網絡中心作戰能力,對我國領海安全構成重大威脅。強敵新型作戰概念與方式的運用,增加了海上防空反導指戰員對于來襲目標攻擊意圖的識別在短時間內做出準確判斷的難度,對作戰指揮控制的戰略戰術安排產生了至關重要的影響。
目標攻擊意圖識別是通過量化分析來襲目標的各項參數指標,以此判斷來襲目標可能鎖定打擊的我方艦艇,進而輔助防空反導指戰員根據敵方作戰意圖制定作戰決策,從而提高防空反導攔截效率以及減少我方艦艇作戰損耗。根據目標的攻擊意圖生成合理的防空反導攔截方案是防空作戰的重要組成部分。由于分析過程會受到未知與不確定因素的影響,現有模型的預測準確率得不到很好的驗證。現有研究主要基于模板匹配[2]、專家經驗模型[3-4]、層析分析法等[5-6]、彈道預測等[7],嚴重依賴專家經驗生成的權重系數,不僅過于主觀,也不適用新的作戰樣式。
2016年提出使用神經網絡自適應學習能力[8],從訓練數據中提取特征規則并用于目標攻擊意圖識別[9-10]。此方法能夠解決先驗知識及專家經驗不足情況下分析與識別目標攻擊意圖的難點[11],但是由于采用了簡單的BP(反向傳播算法)算法,不僅收斂速度慢,而且容易達到局部最優,無法收斂到最優解。2018年有學者使用深度神經網絡對空中目標的作戰意圖進行識別,采用了Adam 優化器和ReLu(rectified linear unit)[12-20]激活函數,但是存在Relu激活函數在學習率較大的情況下容易導致神經元壞死的問題,同時Adam 優化器在這類問題可能出現無法收斂到最優解的問題。
文中提出了一種針對深度神經網絡優化后的預測模型[13-14],分析了來襲目標對我方單個目標的打擊概率,綜合考慮各項參數量化分析結果得出來襲目標的攻擊意圖識別,有效解決以往評估方法的不足[17]。文中采用GeLUs[18]激活函數(Gaussian error linear units)作為激活函數解決梯度爆炸和梯度消失問題,并提升模型訓練速度。同時采用AdaMod優化算法(adaptive and momental bound)[15]加快模型收斂,并解決了Adam 模型可能無法收斂到最優解的問題。文中采取的方法可以更好地解決在先驗知識不足的情況下識別目標攻擊意圖的問題。
現有的海上防空反導攻擊意圖提取方法存在特征識別單一,不能充分利用獲取到的目標信息,信息深度挖掘不夠,導致對攻擊意圖的深層次分析不足,攻擊意圖識別的穩定性與準確度都不夠,導致往往攻擊意圖識別出來的結果給與決策者一個錯誤的判斷或者根本沒法使用。如何挖掘現有目標信息的各個屬性參數信息,是目前攻擊意圖識別的難點,文中從多個角度對攻擊意圖特征進行提取。
針對敵方來襲目標的攻擊行為會遵從一定的規則:搜索目標、發現目標、鎖定目標、打擊目標。來襲目標不同的作戰行動與攻擊行為表現為目標態勢信息的改變,直觀表現為目標的各項運動參數及狀態發生變化,可以用來識別其攻擊意圖。敵方來襲目標在搜索目標和發現目標階段往往無法識別其攻擊意圖,直到其鎖定目標并實行打擊過程階段,其攻擊意圖才有明顯的特征。由于敵方來襲目標的攻擊意圖的顯現是一個動態的過程,在不同的階段會有不同的特征表象,僅依賴某時刻的目標態勢信息識別其攻擊意圖具有片面性和不確定性。
充分識別來襲目標特征屬性,了解目標的特殊屬性與攻擊意圖,以達到充分挖掘信息的目的,可以依據不同階段,各個特征點屬性不同來得到不同的數據集,可以更好地優化屬性得到更理想的結果。
由于敵方來襲目標的意圖和狀態間存在特定的聯系,文中根據專家經驗選取了部分參數:目標坐標(x,y,z)、目標速度Vt、速度方向φt、目標加速度at、加速度方向φt、目標俯沖角θt,目標徑向速度Vr,目標徑向到達時間Tr,我方艦艇坐標((xi,yi,zi)i∈1,…,k,k為我方編隊艦艇數量)。文中選取艦艇數量為5的典型編隊配置,訓練樣本數據集(data)的每一項為5*25形狀。根據訓練樣本數據集在不同階段得到的特征不同,但是攻擊意圖識別的結果相同,就可以優化模型參數,提取其重要特征,以達到相對較好的結果,為攻擊意圖的預測提供有效的數據訓練基礎。
文中選取的特征數據均為數值數據,可以使用神經網絡直接處理。由于數據在各評價指標下的性質不同,通常具有不同量綱和數量級,為保證結果可靠性,加快數據收斂速度,以及降低奇異數據的對算法的敏感度,需要對原始數據進行歸一化處理。數據的歸一化是將數據按比例縮放到一個特定區間,將數據統一映射到[0 1]區間上。設MinA和MaxA分別是屬性A的最小值和最大值,將A的一個原始值x映射到區間[0 1]的值x′的公式如下:
式(1)用于模型訓練的數據集中的數據全部進行歸一化處理。轉化后用于模型的學習數據為矩陣A(n),矩陣A(n)的行數為5,列數為25,歸一化處理后的A(n)為:
在未來智能化時代,戰場數據呈現海量形態,智能化的指揮與輔助決策手段將被廣泛運用,作戰空間由物理域、信息域向認知域加速拓展,對指揮控制的精確性、時效性、實用性提出了更高的要求。由于戰場環境復雜,信息量巨大,敵方攻擊行為和作戰樣式不斷涌現并且復雜多變,僅依賴領域專家難以在短時間對目標信息進行分析。以下兩種數據來源可用于生成目標攻擊意圖識別標簽:
1)由真實作戰或實戰演練數據提供的來襲目標攻擊意圖記錄;
2)由領域專家根據不同的態勢判斷敵方目標的攻擊意圖;
如圖1所示,典型水面艦艇編隊配置如下,每艘艦艇都擁有相應編號。

圖1 水面艦艇編隊配置

圖2 深度神經網絡結構圖
樣本數據對應的攻擊意圖轉化后用于模型學習的標簽數據為矩陣S(n),由專家識別或記錄后標記的矩陣為:
其中數據的索引值對應艦艇編號,數值1代表攻擊意圖識別分析結果識別對應編號的艦艇被敵方鎖定攻擊,數值0代表未被鎖定。來襲目標攻擊意圖的識別結果同樣為格式相同,數據不同的矩陣,數值為0~1之間的概率值。經過one-hot處理后生成的識別結果與標簽數據完全一致。
傳統基于來襲目標攻擊意圖特征識別來輔助指揮者決策的方法,是需要大量的領域內專家經驗對來襲目標攻擊意圖特征的權重、先驗概率等進行先驗量化,明確目標攻擊意圖特征之間的對應關系,但是戰場形式一旦發生變化,此種方法會由于缺乏靈活性與自由度,往往會導致指揮者決策失誤,這是基于先驗知識確定來襲目標攻擊意圖特征的最大不足。
而深度神經網絡可以在領域專家先驗知識不足條件下,通過自身訓練得到來襲目標攻擊意圖特征之間的規則。針對傳統的神經網絡算法在更新網絡節點權值時收斂速度慢、容易陷入局部最優的問題,通過引入GeLUs激活函數和AdaMod優化算法,設計了基于深度神經網絡的來襲目標攻擊意圖識別模型。
人工神經網絡由稱為神經元的簡單元素構成,這些元素具有真實值,乘以權重,然后通過非線性激活函數運行。深度神經網絡(DNN)具有多個處理輸入的神經元 “隱藏層”,隱藏層中的每個神經元都會接收部分輸入變量,然后將其結果傳遞給下一層,網絡可以學習非常復雜的功能。深度學習網絡更準確,隨著添加更多的神經元層可以進一步提高準確性。只要有足夠的計算能力,神經網絡就能夠學習任何函數的形狀。神經網絡的優點是對于高維問題非常有效,能夠處理變量之間的復雜關系,可以更好的提取數據特征,在領域專家先驗知識不足的條件下根據態勢數據進行訓練,用于來襲目標攻擊意圖識別。強大的調整選項可防止過擬合(over-fitting)和擬合不足(under-fitting),防止領域專家的主觀性對訓練結果產生影響。
深層神經網絡存在梯度消失和梯度爆炸的問題,都是因為網絡層數太深而引發的梯度反向傳播中的連乘效應,其連乘后結果變得很小導致梯度消失。Sigmoid激活函數[19]在深層神經網絡中極大概率會引起梯度消失,還有很小的概率出現梯度爆炸。常用的Relu激活函數解決了梯度消失的問題,但是可能導致神經元死亡,權重無法更新。近期的Leaky-ReLU 解決了Relu中的神經元死亡問題,但是其中的超參數α需要人工調整。后期的PReLU 和RRelu激活函數都是針對超參數α進行優化調整[12]。ELUs是試圖將激活函數的平均值接近零,從而加快學習的速度。同時通過正值的標識來避免梯度消失的問題。
為改善深層神經網絡的性能,需要一種新的激活函數模型,使其在學習過程中,能同時對激活函數的陡度,位置及映射范圍進行調節,降低深層神經網絡存在梯度消失和梯度爆炸的問題發生率,且具有更強的自我修復能力,提高模型的擬合能力與收斂速度。
GeLUs是一個新的激活函數,它引入了隨機正則的思想,直觀上更加符合高斯分布,實驗效果強于Relus。GELUs不僅解決了深層神經網絡的梯度消失和爆炸問題,同時對于模型的擬合能力和收斂速度起著至關重要的重用,公式如下:
其中:Φ(x)指的是x的高斯正態分布的累積分布。
式(2)可近似表示為:
其中:σ的選擇比較關鍵。
深度學習通常需要大量時間和計算機資源進行訓練,這也是困擾深度學習算法發展的主要原因。優化算法可以使用更少資源并使得模型收斂更快,從根本上提高了機器學習的速度和有效性。Adam 算法就是以為快速收斂為目的而設計的。自適應矩估計(Adam)是一種在神經網絡中被廣泛采用的優化器,是一種對隨機目標函數執行梯度優化的算法。由于Adam 算法梯度的對角縮放(diagonal rescaling)的不變性,適用解決大規模參數以及稀疏梯度的非穩態問題。Adam 算法只需要一階梯度和很小的內存,通過第一第二梯度的估計來計算不同參數的自適應學習速率。此外Adam 算法的超參數可以直觀的解釋,不需要大量調參。
由于Adam 算法的收斂性較差,為了保證更優的結果,文中采用了名為AdaMod的優化算法,這是一種基于Adam的改進優化器,可以在訓練的同時計算自適應學習率的指數長期平均值,根據長期平均值對學習率進行修剪,去除過高的學習率。相比Adam 優化器,AdaMod能夠從訓練開始就控制自適應學習率的變化,無需預熱。AdaMod優化器不僅能夠使用更少資源加快模型收斂,同時也不需要進行大量調參就可以使模型得到一個穩定可靠的結果。
AdaMod算法比Adam 算法多出的第九步操作St=β3st-1+(1-β3)ηt,其中β3定義了記憶長度。定義了當前平滑值和過去 “長期記憶”(long-term-memory)的關系,之后從當前學習率ηt中選擇最小值從而剔除高學習率。當β3=0時,AdaMod等價于Adam。
訓練深度神經網絡模型并輸入目標態勢對目標攻擊意圖進行識別,步驟如下:
1)從數據記錄系統中提取目標參數,經轉換后提取目標特征數據,并根據作戰實際結果記錄以及領域專家對結果的判斷生成標簽,數據結構形如[0,1,0,0,0]。其中被敵方鎖定的我方艦船標記為1。
2)將數據集隨機打亂,并采用10折交叉驗證(Crossvalidation)進行訓練。實現方式為將初始樣本分割為10個子樣本,其中10%的子樣本作為測試集,其余90%樣本用于訓練。交叉驗證重復10次,每個子樣本驗證一次。
3)調整深度神經網絡結構,設置隱藏層數和節點數。
4)輸入訓練數據到構建的好的神經網絡中,并調整參數。在計算資源充足的情況下并行調試多個模型,選取最優的模型迭代優化。
5)將待識別目標特征數據輸入訓練完成的模型,對敵方目標攻擊意圖做出預測。
不同的參數和超參數設置決定了模型的精確度。在普通的模型中,由于剛開始訓練時,模型的權重(weight)是隨機初始化的,此時若選擇較大的學習率,可能帶來模型的不穩定。通常會選擇預熱(Warmup)學習率的方式,在最初訓練的幾個epoches中使用較小的學習率,在預熱的小學習率下,模型可以慢慢趨于穩定,等模型相對穩定后再選擇預先設置的學習率進行訓練,使得模型的收斂速度更快,模型效果更佳。文中采用了AdaMod優化器,它的優點是對學習率超參數不敏感,訓練曲線更平滑,并且不需要預熱(Warmup)。從圖3可以看到即使學習率相差兩個量級,也能收斂到同一個結果。而其他的優化器例如Adam,如果不預熱,效果可能非常差,不能保證達到可用標準。基于此特點,設置神經網路的學習率α=0.05,超參數β1=0.9,β2=0.99,β3=0.999,平滑項ε=10-7。

圖3 不同學習率下AdaMod優化器的精確度
實驗結果表明,通過對模型進行并行訓練得到在迭代次數為200次左右時,設置神經網路的學習率α=0.05的模型表現最好。
此外,神經網絡隱藏層結構層數的設計會影響模型識別的準確度。圖4與圖5分別使用了不同層級的神經網絡結構層數來驗證使用AdaMod優化器的模型對來襲目標攻擊意圖識別的準確率。從圖中可以看到在訓練次數50 次之后,使用AdaMod優化器的模型驗證的準確率基本趨于穩定。隱藏層設置為3層的準確度相比于隱藏層設置為1層的準確度更加的穩定于準確。當然,如果隱藏層設置的層數越多,其預測的準確度與穩定性也開始下降。原因是層數越多,節點越多,雖然在訓練模型上的效果越好,但隨之帶來模型過擬合問題,會造成穩定性變差,準確度下降。

圖4 三層節點神經網絡準確率

圖5 五層節點神經網絡準確率
為驗證最終模型的精確度,將原數據集再次隨機打亂,并抽取前90%作為訓練樣本,剩余的10%數據作為測試樣本。將訓練樣本作為模型輸入并用測試樣本檢測模型精確度,測試結果如圖6所示。在迭代次數為250次的情況下,模型的準確率高于98.4%。從識別結果可以得出結論,該深度神經網絡模型在現有樣本的條件下可以有效識別來襲空中目標的攻擊意圖,同時模型準確率高于98%,識別可靠性高。

圖6 訓練后的模型準確率
實驗中所提出的激活函數和優化器配置對比基于單層BP神經網絡模型,普通深度神經網絡模型,Sigmiod激活函數與Adam 優化器深度神經網絡模型,ReLu激活函數與Adam 優化器深度神經網絡模型的識別效果對比如圖7所示。

圖7 不同模型準確度對比
由圖7可知,文中提出的GELUs激活函數與AdaMod優化器改進的深度神經網絡模型在同樣的數據集上能得到比其他模型更好的識別效果。其中使用Adam 優化器的深度神經網絡模型特定學習率參數設置下收斂存在問題,出現了無法收斂的情況。在不預熱的情況下,模型準確率過低,如圖8所示。作為對比,文中提出的深度神經網絡模型不存在無法收斂到最優解的問題,同時收斂的速度更快,識別效果更好。在保證精度問題的同時,還解決了訓練數據量不足的情況下,其他模型訓練結果不理想的情況。

圖8 無預熱情況下模型準確度對比
通過上述的模型分析與實驗對比可以發現,文中提出的GELUs激活函數對神經網絡具有更好的泛化能力,可以需要更少的訓練樣本,得到更好的預測效果,而AdaMod優化器讓模型有了更好的收斂性與收斂速度,只需要一個較小的樣本集對模型進行訓練,就可以讓敵方空襲目標意圖識別結果穩定可靠、準確率高。
故此,采用AdaMod優化器與深層神經網絡GeLUs激活函數的來襲目標攻擊意圖識別模型有以下幾個特點:
1)模型魯棒性性好,結果輸出穩定;
2)收斂速度快,樣本集需求少;
3)攻擊意圖特征提取充分,數據挖掘比較完全;
4)模型訓練結果可靠性高,準確度高。
當然,由于戰場態勢千變萬化,戰場信息錯綜復雜,受神經網絡各參數的初始化數據影響較大,小樣本集的訓練可能會有所偏差,所以此模型有待進一步的改進與提高。
文中結合了敵方空襲目標意圖識別問題的特點,提出采用自適應學習率的深度神經網絡來解決特征數據龐大,領域專家知識不足條件下的攻擊意圖識別問題。
文中選擇了當前較為新穎同時效果更好的GeLUs激活函數和AdaMod優化器對深度神經網路模型進行優化,最大程度降低了初始學習率設置對模型的影響,提高了模型收斂速度,降低訓練時間,同時提高了模型識別效果。此外,文中設計的模型對訓練樣本的數量要求更低,解決了當前樣本不足的難點。
深度神經網絡模型能夠很好地對來襲目標攻擊意圖進行識別,有著優異的準確性和可靠性。同時實驗結果顯示,該模型的表現由于其他常用模型,解決了使用Adam 模型可能出現無法收斂到最優解的問題。