顧云濤 李旭輝
(1.海軍裝備部西安代表局 西安 710068)(2.中國船舶集團有限公司第七〇五研究所 西安 710077)
反魚雷魚雷是為了保護自身平臺安全,以毀傷來襲的水面及水下武器為目標的防御型魚雷。反魚雷魚雷作戰效能是指魚雷在規定作戰條件下實施作戰指令,考慮敵火力威脅、生存等戰場因素,由反魚雷魚雷戰術技術性能指標及作戰使用方法所決定的完成命中毀傷來襲魚雷任務程度的度量[1~3]。在環境復雜的水下作戰區域,預估反魚雷魚雷的作戰效能是我方水下綜合防御系統制定對抗策略、籌劃作戰方案的重要依據,也能輔助指揮員進一步分析戰場態勢、評估目標威脅。
軍事作戰領域的作戰效能預估從20世紀60年代至今一直以來是各界學者研究的熱點,目前已經形成了以專家評估法[4]、矩陣解析法[5~6]、模擬仿真法[5]以及神經網絡法[7]等眾多理論技術為基礎的理論體系。文獻[4]運用模糊層次分析法對潛艇魚雷武器系統進行作戰效能評估,對系統的各指標的影響權重進行定量描述,降低了專家打分的主觀性,確定了兩型魚雷的作戰效能。文獻[5]與文獻[6]依據WSEIAC方法構建了定量評估系統作戰效能的基本模型。該方法考慮了多種影響因素、通過求解矩陣得到較為準確的評估值,但在復雜作戰過程中的計算時間復雜度較高。模擬仿真方法是通過構建數學仿真模型,模擬整個作戰過程,還原真實作戰場景,研究作戰效能的方法。文獻[7]與文獻[8]建立了帶傘空投魚雷系統的六自由度模型、空中彈道模型、落點解算模型等,分析了投雷高度、速度和角度對魚雷落點的影響。文獻[9]與文獻[10]提出了基于BP神經網絡的魚雷作戰效能模糊綜合評價模型,客觀地再現了專家的知識、經驗和直覺思維,并驗證了方法的可行性和有效性。
在智能化方法中,深度學習是一種深層的機器學習模型,通過隱藏層的多次非線性映射和堆疊,可以在復雜、多維的原始數據提煉計算出非常抽象的高維特征來幫助完成分類、識別和預測問題。貝葉斯網絡是一種采用概率理論在網絡節點上進行推理計算參數間的因果關系和影響度,用已知的觀測證據節點去推測未知隱藏節點的一種方法。
深度神經網絡模型(Deep Neural Network,DNN)是基于感知機模型、神經網絡模型的擴展,其特點是包含多層隱藏層結構,通過增加網絡深度來提高模型的特征提取和抽象能力。按不同位置劃分,深度神經網絡可以分為輸入層、隱藏層和輸出層。層與層之間的結構是全連接的,也就是說第i層的每一個神經元節點都和第i+1層的每一個神經元節點相連。深度神經網絡的最小單元結構由一個線性關系和激活函數σ(z)構成。深度神經網絡正向傳播通過隱藏層、輸出層得到預測值和Loss損失,利用梯度下降等優化算法反向傳播不斷迭代更新網絡參數,得到符合Loss損失函數閾值的最終預測值Lables。深度神經網絡模型如圖1所示。

圖1 深度神經網絡模型
超參數的選擇和調節會對深度神經網絡的性能產生重要的影響。深度神經網絡中超參數主要包括隱藏層層數、Loss損失函數、優化算法、激活函數和學習率等。
隱藏層層數是深度神經網絡與神經網絡之間的最核心的差異,隱藏層數目的增加能夠提高網絡處理非線性問題的能力[11]。在本文背景中,來襲魚雷目標水下環境復雜、態勢估計誤差大,因此適當提高網絡隱藏層層數能夠提升網絡性能。損失函數是計算樣本的預測結果與真實標記之間的誤差函數。常用的損失函數包括均方誤差損失函數和交叉熵損失函數等。優化算法的主要作用是更新和計算影響模型訓練和模型輸出的網絡參數,來尋找損失函數的最優值。典型的優化算法包括Adam算法、隨機梯度下降算法等。激活函數使得深度神經網絡能夠加入非線性因素,因此網絡可以更好地處理非線性的問題。激活函數主要包括sigmoid函數、tanh函數和relu函數等。學習率是指在優化算法中更新網絡權重的幅度大小。過大的學習率訓練速度快,但可能會造成模型不收斂,無法尋找到Loss函數的最優值;過小的學習率則會導致訓練速度較慢。學習率一般設置為0.01、0.001或0.0001。
貝葉斯網絡[12](Bayesian Network,BN)的基本理論為貝葉斯理論,是目前不確定知識和概率推理領域中最有效的理論模型之一。貝葉斯理論是采用概率分析統計方法和圖論在網絡節點上進行推理計算,用已知的觀測節點去推算未知隱藏節點的一種方法。
貝葉斯網絡結構是一個有向無環圖,以每個隨機事件為網絡節點,隨機事件之間的因果邏輯關系為網絡的邊,節點之間的條件概率表示事件間的不確定關系,表示為,其中V表示貝葉斯網絡的節點集合,E表示隨機事件之間的邏輯關系,P表示了隨機事件之間的條件概率分布。貝葉斯網絡推理的貝葉斯公式可以表示為

其中,vi表示網絡結構中的任一節點,Pa(vi)表示節點vi的父節點,P(v1,v2,···,vn)表示子節點的聯合概率分布。
貝葉斯網絡參數學習是利用給定的網絡拓撲結構G和訓練樣本集D,利用先驗知識,確定貝葉斯網絡模型各節點處的條件概率分布。常見的參數學習方法包括最大似然估計(Maximum Likelihood Estimation,MLE)和貝葉斯估計方法(Bayesian Estimation,BE)。
對反魚雷魚雷作戰效能預估是基于一系列的來襲目標行動特征推理獲得,以目標特征、反魚雷魚雷打擊方式和作戰效能為輸入輸出節點,將節點之間的邏輯關系構建成為網絡拓撲結構。對反魚雷魚雷作戰效能預估取決于來襲魚雷目標距離、目標方位、目標速度、目標航向、報警條件、反魚雷魚雷發射數量、射擊方式等因素,然后推理出反魚雷魚雷的作戰效能。
依托報警聲納等偵查手段的觀測得到敵方目標運動要素屬性,包括目標距離、目標方位、目標速度、目標航向因素。發射數量包括單雷發射和雙雷齊射兩種。射擊方式主要存在三種模式。
考慮到反魚雷魚雷的作戰目標是毀傷來襲魚雷,執行任務的結果只有“成功毀傷來襲魚雷”和“未毀傷來襲魚雷”兩種互斥的可能性。因此,本文以“命中概率”表示反魚雷魚雷對抗魚雷的作戰效能,以單次“命中”或“未命中”為樣本數據標簽訓練模型。
構建深度神經網絡預測模型如圖2所示,模型的輸入層包括目標距離、目標方位、目標速度、目標航向、反雷發射數量、射擊方式六個維度;模型的隱藏層搭建30層神經元,每一層使用sigmoid激活函數來將神經元輸出映射到(0,1)之間,同時增加網絡的非線性問題的處理能力;模型的輸出為反魚雷魚雷的命中概率。

圖2 深度神經網絡預測模型
深度神經網絡的超參數取值如表1所示。為了提高預測準確率和降低算法的時間復雜度,通過參數調優,深度神經網絡層數設定為30層,網絡最大訓練次數設定為1000次,訓練目標設定為0.001,學習率設為0.01,尋優算法選取隨機梯度下降算法(Stochastic Gradient Descent),損失函數選取交叉熵損失函數。

表1 深度神經網絡超參數設定
對于貝葉斯網絡而言,由于反魚雷魚雷效能預估問題中來襲魚雷目標距離、目標方位、目標航向、目標航速、發射數量、射擊方式為證據節點,而命中概率為觀測節點,因此無需額外添加其他隱含節點,構建貝葉斯網絡預測模型如圖3所示。

圖3 貝葉斯網絡預測模型
由于報警聲納探測到的敵方目標運動要素屬性為連續數值,而基于貝葉斯網絡進行推理需要對節點變量建立隸屬度函數進行定性分類的模糊處理。因此需要對連續型的目標運動要素進行定性分類。
目標距離為敵方目標與我方目標在地理空間距離,假設在t時刻目標距離為St,由以下公式生成相對位置信息的判定指標,將其分為{近、中、遠}。

與目標距離同理,將目標方位、目標航向、目標航速分別定性分類為{迎面攻擊、側面攻擊、尾追攻擊}、{航跡趨近、航跡偏離、航跡遠離}、{低速、中速、快速}。報警條件、發射數量和射擊方式為離散型變量,其狀態空間分別為{主動報警條件、被動報警條件}、{單雷發射、雙雷齊射}和{射擊方式1、射擊方式2、射擊方式3}。
為了驗證深度神經網絡預測模型和貝葉斯網絡預測模型的正確性,本文建立了反魚雷魚雷全彈道數字仿真系統平臺來仿真模擬反魚雷魚雷對抗來襲魚雷的防御作戰流程,采用數學仿真方式對反魚雷魚雷攔截概率進行仿真分析計算。反魚雷魚雷數字仿真平臺設計實現了反魚雷魚雷和來襲魚雷運動學、動力學、自導檢測及彈道模型、本艦運動模型等數學模型。
利用仿真平臺模擬想定態勢,設定本艦向北勻速直航運動,假設在T時刻魚雷報警聲納在某方位和某距離上探測到有來襲魚雷,來襲魚雷目標運動四要素齊全。為了模擬真實作戰場景,同時泛化數據樣本,對目標距離、目標方位、目標速度和目標航向使用估計值,估計值為真實值加上高斯分布的白噪聲誤差。仿真想定態勢示意圖如圖4所示。

圖4 仿真想定態勢示意圖
為了滿足智能化方法大樣本的數據要求,本文通過上述方法模擬仿真構建了864種不同的想定態勢,每種態勢下統計1000次仿真結果。仿真數據的狀態空間如表2所示。為了測試模型的有效性,對樣本數據按照7∶1.5∶1.5的比例分割為訓練集、驗證集和測試集。部分訓練數據如表3所示。

表2 仿真數據狀態空間

表3 部分訓練樣本數據
對訓練數據統一做歸一化處理后,通過深度神經網絡預測模型1000輪的迭代訓練,個數據集在訓練過程中的Loss損失函數變化曲線如圖5所示。由圖可知,在整個訓練過程中,隨著迭代次數的增加,訓練集、驗證集和測試集的Loss損失函數呈明顯的下降趨勢。在800輪迭代后,各數據集的損失函數趨于收斂,穩定在約0.265處。由此可以說明,深度神經網絡訓練效果優秀,模型訓練完成后不存在過擬合和欠擬合問題。

圖5 各數據集Loss損失函數變化曲線
網絡訓練完成后,對0.15比例的訓練集進行測試,得到訓練集的混淆矩陣結果如表4所示。從表可以看出,深度神經網絡預測模型在訓練集上的綜合準確率達到了88.7%,模型11.3%的主要錯誤產生于將未命中樣本預測為命中。綜合來看,深度神經網絡預測模型對于反魚雷魚雷作戰效能預測問題具有良好的分類和識別能力。

表4 深度神經網絡在測試集上的表現
建立貝葉斯網絡預測模型如圖3所示,首先通過樣本訓練數據和最大似然估計算法學習網絡節點之間的條件概率參數。然后通過統計測試集的測試結果,得到混淆矩陣如表5所示。從表中可以看出,貝葉斯網絡預測模型在訓練集上的綜合準確率僅有50.61%。從各類樣本的預測結果可以分析得到,貝葉斯網絡并不能對測試數據進行有效的區分和識別。

表5 貝葉斯網絡在測試集上的表現
綜上所述,對于反魚雷魚雷作戰效能預測問題,相較之下,深度神經網絡預測模型準確率高,預測效果良好。而貝葉斯網絡由于本身算法的局限性,對于本文作戰效能預測等典型非線性復雜問題的分類和識別能力較弱。
本文針對反魚雷魚雷作戰效能預估問題,提出并對比實現了深度神經網絡和貝葉斯網絡來預估反魚雷魚雷的命中概率。從魚雷報警聲納可探測的評估指標、反魚雷魚雷的打擊方式為基礎,主要包括目標運動四要素、報警條件、發射數量和射擊方法,考慮其對魚雷命中概率的影響。首先基于反魚雷魚雷數字仿真平臺,構建了86.4萬組反魚雷魚雷防御作戰的大樣本數據集;在此基礎上,設定深度神經網絡超參數和貝葉斯網絡結構,并構建深度神經網絡和貝葉斯網絡預測模型。通過對測試集識別結果進行分析,深度神經網絡模型能夠較好地預估反魚雷魚雷的作戰效能,輔助指揮員進行作戰方案籌劃和部署。