張 露,蘇 雨*,張 科,郭正玉
(1. 西北工業大學 航天學院,西安 710072; 2. 中國空空導彈研究院,河南 洛陽 471009;3. 航空制導武器航空科技重點實驗室,河南 洛陽 471009)
近年來,隨著科學技術的迅猛發展,現代戰場上的戰爭已經變為高新技術的戰爭,戰爭模式從原來以地面機械化戰爭為主的模式轉變成由高新技術支持的空戰為主。巡航導彈因為體積小、重量輕、便于隱蔽和發射等特點在戰場上得到廣泛應用,其大部分飛行時間處于巡航狀態,靠發動機克服前進阻力在大氣層內飛行,具有突防能力強、機動性能好、命中精度高、摧毀力強等優點,能夠有效地對敵方目標進行打擊。但隨著各類反導系統的發展,巡航導彈的生存能力受到了極大的威脅,導彈的突防打擊能力面臨嚴峻的考驗,傳統的導彈進攻方式難以實現現代化戰爭中的打擊目的。因此,針對導彈突防工作進行研究已經成為當前戰場上迫切需要解決的問題。
在導彈突防工作研究中,第一步就是對于攔截彈攔截點的預測,預測攔截點(Predicted Interception Point,PIP) 對于巡航導彈有效躲避攔截彈攻擊、成功攻擊目標地點有著重要意義,而只有準確預測了敵方的攔截點,才能確定我方利用什么方法,在何時何地進行突防并將其摧毀。
因此,國內外研究人員針對導彈攔截點預測問題開展了研究工作。目前,攔截點預測方法主要有基于彈目運動方程建立攔截幾何的數值模型求解、加入導引方法利用迭代方式進行求解等。田憲科等以在空空導彈中廣泛使用的破片式戰斗部為例,建立了彈目相對運動模型求解攔截點,通過控制變量法,利用MATLAB進行仿真,分析了導彈攔截點的影響因素。Zarchan對于采用脈沖機動方式的導彈提出基于Lambert問題求解預測攔截點的方法。謝經緯等基于跨大氣層反導攔截的背景,建立了某種攔截彈的動力學模型,對于給出的“脈沖”攔截彈模型,利用Lambert問題數值求解來獲得預測攔截點,并利用攔截彈射表不斷更新預測攔截點。Song等設計了一種類似于用于根部定位的Newton-Raphson方法,通過簡單的迭代來實現攔截點的預測。Ann等通過軌跡優化技術獲得了可實現的預測攔截點范圍,并提出適當的PIP選擇方案以攔截目標。但上述對于PIP的研究工作存在作戰假設場景過多、適用性不強、魯棒性較差、攔截點預測精度較低等問題。
深度學習最早可以追溯到1958年Rosenblatt提出的感知機。近些年由于計算機性能的大幅度提升,深度學習更是迎來了蓬勃的發展。深度學習具有自適應性強、魯棒性好、容錯性高、適用于非線性問題以及訓練后的網絡有毫秒級響應等特點。其在導彈作戰領域,包括導彈參數預測、導彈發射條件優化、導彈軌跡預測等方向都有很多應用。相對于傳統預測方法,基于深度學習的PIP方法更適用于現代戰場高動態、強干擾的環境對導彈突防帶來的挑戰。因此,國內外學者開展了基于深度學習方法的導彈突防方法研究。南英等利用深度強化學習,提出一種彈道導彈突防控制方法,訓練結果表明此方法能夠有效地對彈道導彈終端最優突防模型進行逼近。楊子成等利用DNN網絡,以攔截彈主動段關機時參數作為輸入,建立預測模型,實現對攔截點和攔截時間的預測。Lee等以神經網絡為基礎,提出一種高速計算反彈道導彈系統的預測攔截點算法,大大減少了目標軌跡實時預測所需要的計算時間。Wang等建立了兩層的深度神經網絡,用于預測導彈飛行軌跡。上述基于深度學習的方法要比傳統方法魯棒性更強,限制條件較少。但從實驗結果可以看出,使用簡單DNN網絡在面對復雜的導彈飛行時序數據時,效果并不是特別理想,且可能出現梯度爆炸或梯度消失等問題。
為了克服上述問題,本文提出了一種基于長短時記憶 (Long Short-Term Memory, LSTM)神經網絡的導彈攔截點預測方法。在對導彈機動軌跡關鍵參數進行遍歷的基礎上,利用LSTM網絡研究導彈機動軌跡數據中的規律性變化特點。隨后,基于LSTM神經網絡強大的時間序列分類與預測能力,設計智能化的方法實現對軌跡簇的分類,其更適用于時序軌跡序列,并且解決了DNN和RNN中存在的梯度爆炸問題; 利用神經網絡預測方法實現對特定飛行軌跡的預測與評估,從而實現提前掌握空戰戰場態勢變化,根據攔截彈的前一段時間運動狀態來求解攔截點時刻以及攔截點位置,獲得攻擊主動權。
本文采用比例導引法來描述導彈-目標相對運動。比例導引法是指導導彈飛行速度矢量轉動角速度和目標視線角變化率成比例的導引方法。其結合了追蹤法和平行接近法的優點,也消除了這兩種方法原有的一些缺點,是自動制導中目前最常用的方法。相比于其他導引方法,比例導引法可以得到較為平滑的彈道,并且導彈擁有足夠的機動能力。只要參數調節合適,就可以實現對目標的準確打擊。因此,使用比例導引法生成神經網絡所需要的彈道庫。
彈目相對運動關系示意圖如圖1所示。

圖1 彈目相對運動關系Fig.1 Missile-target relative motion relationship
導彈-目標的相對運動關系如下:

(1)
式中:為導彈速度矢量;為目標的速度矢量;為彈目相對距離;為視線角;為比例系數,又稱導航比;和分別為導彈速度向量、目標速度向量與目標線之間的夾角,亦稱為前置角;和分別為導彈速度向量、目標速度向量與基準線之間的夾角。
研究中,定義攔截朝向目標方向運動為“正方向”,巡航彈飛行方向運動為“負方向”。
攔截彈的運動學模型如下:

(2)
式中:為重力加速度;,,為攔截彈的三維空間位置;為彈道傾角;為彈道偏角;和分別為導彈縱向和側向平面的過載,根據式(2)可以獲得攔截巡航彈的彈道。
在有監督深度學習中,最重要的部分就是數據集。因為目前對于導彈攻防對抗系統還沒有公開的數據集,所以通過仿真計算多種攔截彈彈道數據,并將其作為數據集用以訓練神經網絡模型。
以某型號巡航導彈作為進攻彈,某型號防空導彈作為攔截彈,攔截彈發射點為原點固定點,并隨機生成服從均勻分布的不同彈道傾角(∈(40°,51°))和不同發射速度下的攔截彈道。巡航導彈沿預設彈道勻速直線飛行。攔截彈每一組不同的傾角和速度初始設定值作為初始發射條件,對每條彈道分別進行攻防仿真,一共生成960條標準彈道。
攔截彈在不同速度、不同傾角情況下發射時所生成的彈道如圖2所示。數據集中的全部彈道如圖3所示。

圖2 不同初始條件下的彈道圖Fig.2 Ballistic diagram under different initial conditions

圖3 基礎數據集Fig.3 Basic data set
在敵我對抗雙方作戰流程中,攔截彈需要在導引頭給出的引導信息下對姿態和發動機進行控制,從而實現對來襲導彈的精準打擊。對于進攻彈來說,只要在對方攔截彈的末制導階段,準確預測其攔截點和攔截時刻,就能提前對導彈未來彈道進行規劃,從而躲避攔截彈的探測范圍或機動打擊范圍,實現突防。
為了準確預測攔截彈的攔截時間和攔截點信息,需要進攻方探測設備對攔截彈進行準確的探測跟蹤,獲取攔截彈的位置、速度等信息。目前常用的導彈導引頭能夠獲取敵方導彈的視線角、視線角速度、彈目相對距離、彈目相對速度信息,通過這些信息就可以計算出敵我對抗雙方的相對位置等信息。本文利用LSTM神經網絡對導彈攔截點進行預測。
LSTM神經網絡是一種改進的循環神經網絡(Recurrent Neural Network,RNN),最初由Hochreiter和Schemidhuber于1997年提出,主要是為了解決RNN對長序列樣本訓練過程中的梯度消失和梯度爆炸問題。LSTM模型是RNN模型的一個變種,主要用于解決RNN對長期依賴信息學習能力缺乏的問題。與RNN不同,LSTM在每個神經元中引入了3個“門”結構:輸入門、遺忘門和輸出門,通過對3個門的控制來實現對歷史信息的記錄,從而在更長的序列中有更好的表現。圖4所示為LSTM模型的結構示意圖,其中:-1和分別代表-1時刻和時刻的細胞狀態;-1和分別代表-1時刻和時刻的隱藏層狀態。

圖4 LSTM模型結構示意圖Fig.4 LSTM model structure diagram
LSTM的關鍵是Cell的狀態。在整個網絡中,各Cell之間只存在少量的線性交互過程,時序序列的歷史信息在整個網絡結構中傳遞時很容易被保存。
所提出的攔截點預測模型如前文所述。模型輸入為攔截彈3個位置參數,,的時序序列,模型的輸出值為攔截點的類型,通過此輸出得到攔截點的坐標(,,)和攔截時刻。設計的網絡輸入層節點為3,輸出層節點為1,表示輸出此時軌跡的類別。攔截點預測模型示意圖如圖5所示。

圖5 攔截點預測模型示意圖Fig.5 Schematic diagram of interception point prediction model
此外,為了提高網絡對非線性時序序列預測問題的擬合能力,在各隱藏層后加入了激活函數,以解決線性模型中表達能力不足的問題。
常用的激活函數有sigmoid函數、線性整流函數 (Rectified Linear Unit,ReLU)、雙曲正切函數(tanh) 等。相比于其他兩種函數,線性整流函數更符合本文所提神經網絡的需求,能夠更加有效地解決梯度下降和反向傳播問題,同時也避免了梯度爆炸和梯度消失問題。
本文提出了一個兩層LSTM模型,網絡結構如圖6所示,具體參數如表1所示。

表1 攔截點預測網絡結構

圖6 攔截點預測網絡結構Fig.6 Interception point prediction network structure
在網絡結構都確定之后,需要選擇恰當的損失函數和優化器對網絡進行訓練。損失函數表示預測值和標簽值之間的誤差大小,優化器是用于加速神經網絡訓練的加速方法。
(1) 損失函數的選擇
采用交叉熵(Cross Entropy)函數作為損失函數,用來判斷預測值與真實值之間的誤差:

(3)
式中:()為真實分布;()為非真實分布。
(2) 優化器的選擇
神經網絡的基本訓練方法是梯度下降法,即讓損失函數按梯度搜索方法找到最小值。目前常用的方法有SGD,Adagrad,RMSProp和Adam等。本文選擇SGD作為優化器,相對于其他的優化方法,該方法更適用于大數據集的訓練。
根據前文所得到的彈道數據集,記錄每條彈道軌跡的數據點,共960條彈道。在彈目相對運動剛開始時,敵我雙方距離過遠,我方探測器很難探測到敵方攔截彈。因此,取攔截彈的軌跡坐標從第900個點開始,第1 600個點作為結束。將軌跡的前900~1 600個點作為神經網絡模型的時序輸入,將攔截點坐標分為8類。對得到的樣本數據進行預處理,用其中720條彈道,占總數75%的數據作為神經網絡的訓練集,另外240條彈道,占總數25%的數據作為測試集。
數據的預處理首先是野值剔除,即在實驗之前剔除樣本中某些測量的異常數據值,以減少實驗成本。第二步是數據的歸一化處理。本文數據集中的數據值往往都比較大,這會給計算造成較大的負擔,因此,需要對目標的位置信息進行歸一化處理,通過恰當的變化使得神經網絡的輸入、輸出限制在[-1,1]之間,從而減少數據中極大值和極小值對神經網絡預測的影響,同時還能夠提高神經網絡的運算速度。
彈道數據歸一化的數學描述如下:

(4)
式中:為樣本值;為樣本值最小值;為樣本值最大值;為歸一化之后的樣本值。
網絡結構、訓練數據、損失函數都已經設定,接下來要開始對網絡進行訓練。針對所提出的網絡,采用以下設置進行訓練:訓練次數為400輪,每一輪訓練迭代1次,初始學習率設置為0.1,在100輪訓練之后變為0.01,最小批次為128,在單CPU上進行訓練。
整個預測網絡訓練流程圖如圖7所示。

圖7 訓練流程示意圖Fig.7 Training process diagram
將神經網絡預測輸出與原測試數據集的標簽進行對比,可得到攔截時間與攔截點的誤差,如表2~3所示。

表2 測試集上攔截時間誤差

表3 測試集上攔截點距離誤差
圖8~9分別為測試集中攔截時間誤差分布概率和時間誤差分布。從圖中可以看出,測試集的時間誤差分布在0.1~0.5 s,均值為0.3 s。

圖8 測試集時間誤差分布概率Fig.8 Distribution probability of time errors in test set
圖10~11分別為測試集中攔截點距離誤差分布概率和距離誤差分布。從圖中可以看出,攔截點距離誤差分布在20~180 m,均值為102 m,距離誤差在合理范圍內。從結果分析可知,數據集上攔截點預測誤差與攔截時間誤差分布比較均勻,而且相對于彈目距離來說較小,對于后續的突防工作幾乎沒有影響,在精度上符合預期。

圖9 測試集時間誤差具體分布Fig.9 Specific distribution of time errors in test set

圖10 測試集距離誤差分布概率Fig.10 Distribution probability of distance errors in test set

圖11 測試集距離誤差具體分布Fig 11 Specific distribution of distance errors in test set
將所提出的基于LSTM的攔截彈預測模型與其他方法進行對比,結果如表4所示。圖12為3個不同網絡訓練過程中測試集loss的變化曲線; 圖13為3個網絡訓練過程中測試集準確率變化曲線。從圖中可以看出,DNN網絡和RNN網絡對本文的數據集訓練結果并不理想,分類精度不夠高,訓練過程中loss變化趨勢也比較亂,甚至出現梯度消失或梯度爆炸問題。與之相反,本文所提出的LSTM網絡在處理導彈軌跡時序數據時效果很好,能夠在極少的迭代次數下收斂,并且準確率和loss的變化趨勢要更加理想。從測試集的結果可以看出,本文提出的網絡結構預測精度要高,對時序序列處理效果更好。這是因為相比于DNN和RNN,LSTM有3個門(輸入門、遺忘門、輸出門)結構,其中遺忘門能夠對歷史信息進行處理、保存或者丟棄,從而能夠找到數據中的時序相關信息并避免可能出現的梯度消失和梯度爆炸的問題。

表4 實驗結果對比

圖12 測試集loss變化對比Fig.12 Comparison of loss accuracy changes in test set

圖13 測試集準確率變化對比Fig.13 Comparison of accuracy changes in test set
為進一步分析所設計的網絡模型的適用性,增加了樣本集以外的文本數據集進行分析。在此,使用了IMDB數據集。此數據集包含50 000條偏向明顯的影評,其中25 000條作為訓練集,25 000條作為測試集,標簽為積極(pos)和消極(neg)兩種。使用LSTM模型與兩種對比算法對此數據集進行分類。
對IMDB數據集測試集分類結果如表 5所示。圖14為3個不同網絡訓練過程中訓練集準確率變化曲線; 圖15為3個網絡訓練過程中訓練集loss的變化曲線; 圖16為3個不同網絡測試集準確率變化曲線; 圖17為3個網絡測試集loss的變化曲線。從實驗可以看出,DNN網絡在訓練時正確率和loss的變化相比于本文方法都十分理想,收斂也很快。但是在測試集上的準確率比本文模型低了近20%。很容易就能看出,DNN在處理復雜文本數據時出現了嚴重的過擬合現象,而LSTM則沒有。RNN網絡沒有明顯的過擬合現象,但觀察訓練過程,其效果沒有LSTM好,而且分類精度也沒有LSTM高。這是因為DNN中不存在對時序信息處理的結構,因而其效果最差。而RNN可以存儲時序序列歷史信息,能在一定程度上改善時序序列處理效果,但對于長時間依賴序列,其仍存在一定缺陷。LSTM提出的網絡使用了LSTM網絡結構,其門結構能夠選擇性地對數據進行處理,所以更適用于存在時間依賴性數據的處理任務。從上述分析可知,本文模型相比于其他兩個網絡,在文本分類數據集上也能有一定的應用。

圖17 測試集loss變化對比Fig.17 Comparison of loss changes in test set

表5 測試集分類精度對比

圖14 訓練集準確率變化對比Fig.14 Comparison of accuracy changes in train set

圖15 訓練集loss變化對比Fig.15 Comparison of loss changes in train set

圖16 測試集準確率變化對比Fig.16 Comparison of accuracy changes in test set
本文主要研究了巡航導彈突防過程中針對攔截彈的攔截時間和攔截點預測問題。相比于傳統的建模方法,神經網絡具有自學習與自適應性強、魯棒性強和容錯率高、適用于非線性問題等特點,而其中LSTM網絡又能很好地解決神經網絡中對于長時間依賴序列容易出現的梯度消失或梯度爆炸問題。因此,本文采用基于LSTM網絡的有監督學習方法,實現對于攔截彈攔截點和攔截時間的預測。將本文方法與現有方法對比可以看出,本文方法更加適用于長時序序列的預測問題,且能夠在更少的迭代次數下得到較高的預測精度。
從實驗結果可以看出,本文所提出的攔截點預測模型,無論是從預測精度還是適用性都要優于已有的模型,能夠更好地實現對攔截點和攔截時間的預測。這為后續的導彈突防工作提供了良好的理論和技術基礎。