楊子成,鮮勇,李少朋,任樂亮,張大巧
(火箭軍工程大學作戰(zhàn)保障學院,西安 710025)
導彈防御系統(tǒng)的建立和發(fā)展,對彈道導彈的生存能力產(chǎn)生了嚴重威脅。隨著針對彈道導彈各飛行分段的反導體系日益成熟,彈道導彈的作戰(zhàn)效能受到制約、突防難度大大增加。由于彈道導彈與反導系統(tǒng)的攻防對抗是體系對抗,具有參與要素多、系統(tǒng)建設(shè)昂貴、難以實彈對抗檢驗的特點,針對攻防對抗進行仿真研究是研究武器系統(tǒng)作戰(zhàn)效能、論證作戰(zhàn)方案的重要手段[1]。基于仿真的中段突防研究也是近年來彈道導彈突防研究的重點領(lǐng)域,已有相當多的研究成果。
地基攔截彈(Ground-based Interceptor,GBI)是中段反導動能殺傷武器,用于攔截在大氣層外中段飛行的彈道導彈彈頭,攔截實現(xiàn)方式采取直接碰撞。GBI由大氣層外殺傷器(Exo-atmospheric Kill Vehicle,EKV)和助推火箭2部分組成,目前已經(jīng)進行多次反導攔截試驗。在2017年5月,美國使用GBI進行了一次洲際導彈反導攔截試驗,從加利福尼亞范登堡空軍基地發(fā)射的GBI攔截彈準確攔截一枚從太平洋中部馬紹爾群島里根試驗場起飛的洲際彈道導彈,反導試驗取得成功[2-3]。
GBI攔截彈在主動段關(guān)機后,主要依靠慣性自由飛行,在紅外導引頭發(fā)現(xiàn)目標后,引導EKV對來襲彈頭進行攔截。由于導引頭的探測距離有限,如果選擇合適時機進行機動規(guī)避攔截區(qū)域,使得地基雷達無法及時更新彈頭運動信息來引導GBI進行中段修正,從而使EKV在關(guān)機前導引頭沒有探測到來襲彈頭,則成功實現(xiàn)了突防。因此,在對攔截導彈進行威脅評估后,預測高威脅的攔截彈與來襲洲際導彈的相遇時間和攔截位置,可為機動規(guī)避提供決策依據(jù)。
國內(nèi)外已經(jīng)有不少學者對預測攔截點(Predicted Intercept Point,PIP)問題進行了相關(guān)研究。PIP問題求解對于攔截彈中制導以及中末制導交接班成功,進而準確命中目標有著重要的意義。對于防空導彈、空空導彈等戰(zhàn)術(shù)導彈,常采用基于簡化的運動模型建立攔截幾何,使用解析方法求解攔截點[4];或者是加入導引通過迭代計算導彈運動學彈道來預測攔截點[5]。攔截幾何解析法求解方便,但是誤差較大;而迭代算法精度較高,但計算周期較長[6]。
對于彈道導彈中段攔截的PIP問題,Zarchan[7]提出了適用于采用脈沖方式機動的攔截彈的基于Lambert問題求解的PIP計算方法。由于攔截彈在主動段的飛行狀況比較復雜,采用Lambert數(shù)值解算求解PIP問題的方法僅適用于攔截彈自由段飛行過程。針對Lambert問題求解PIP方法的缺陷,謝經(jīng)緯和陳萬春[8]提出蒙特卡羅仿真建立攔截射表,進行插值來得到對應(yīng)的PIP方法。Song等[9-11]提出基于神經(jīng)網(wǎng)絡(luò)的導彈狀態(tài)信息與最佳制導指令映射關(guān)系,并建立獨立的待飛時間預測網(wǎng)絡(luò),將目標軌道簡化為開普勒軌道,通過預測得到的待飛時間得到PIP。
以上PIP問題求解都是立足于防御方角度,求解PIP用于攔截彈諸元計算或中制導。本文求解PIP用于彈道導彈對攔截彈的機動規(guī)避,從進攻方可獲取的攔截彈信息入手,建立PIP預測模型。此外,為便于彈載計算機實現(xiàn)在線解算,求解PIP的方法計算量不應(yīng)過大。神經(jīng)網(wǎng)絡(luò)在模式識別、預測評估、圖像等領(lǐng)域已經(jīng)廣泛運用,在解決非線性問題方面也具有明顯的優(yōu)勢。另外,神經(jīng)網(wǎng)絡(luò)可以在線下對數(shù)據(jù)集進行學習,訓練好的網(wǎng)絡(luò)結(jié)構(gòu)可以實現(xiàn)在線上實時輸出結(jié)果。因此,本文采用基于神經(jīng)網(wǎng)絡(luò)的監(jiān)督學習算法,在線下通過攻防仿真得到大量樣本作為神經(jīng)網(wǎng)絡(luò)訓練的數(shù)據(jù)集,通過對仿真數(shù)據(jù)集學習,根據(jù)攔截彈的狀態(tài)信息線上求解攔截時間與攔截點的坐標信息。
中段攔截對抗示意圖如圖1所示。中段攻防模型主要包括彈道導彈飛行仿真模塊、GBI飛行仿真模塊、指揮控制模塊和預警探測模塊[12]。本文研究主要涉及彈道導彈飛行仿真模塊、GBI飛行仿真模塊。

圖1 中段攔截對抗示意圖Fig.1 Schematic diagram of midcourse interceptionand confrontation
1)彈道導彈飛行仿真模型
彈道導彈中段飛行時,主要受地球引力、科氏慣性力和牽連慣性力。動力學方程為


式中:i=x,y,z;Pi、Ri、Gi、Fei、Fci分別為導彈所受推力、空氣動力、地球引力、牽連慣性力、科氏慣性力在發(fā)射坐標系中的分量;m為導彈當前質(zhì)量。
3)紅外預警衛(wèi)星探測模型
采用紅外預警衛(wèi)星對處于主動段的導彈進行探測跟蹤,獲取到的導彈的狀態(tài)信息存在一定的誤差。根據(jù)紅外預警衛(wèi)星的探測精度,建立誤差模型來模擬衛(wèi)星探測過程中存在的誤差。
采用正態(tài)分布生成隨機探測誤差,誤差服從N(0,σ)。因此,誤差模型為

根據(jù)公開資料分析,中段攔截系統(tǒng)的工作流程如下:
1)彈道導彈點火起飛后,防御方先通過高軌紅外預警衛(wèi)星識別導彈尾焰的紅外信號,低軌紅外預警衛(wèi)星對導彈進行跟蹤,并發(fā)出導彈來襲預警信息。
2)紅外預警衛(wèi)星將信號傳輸至負責信息處理的地面站和指控中心,指控中心對數(shù)據(jù)進行處理并確定來襲導彈大致飛行方向和攻擊目標,從而對來襲導彈進行目標識別并進行威脅評估。
3)來襲導彈釋放彈頭并拋撒誘餌,在來襲彈頭進入前置部署雷達的探測范圍后,預警雷達跟蹤、探測彈頭的位置、速度等信息,并將獲取的信息傳輸給陸基精密雷達,并由陸基精密雷達對彈頭進行跟蹤,獲取更精確的信息。
4)指控中心進行諸元計算,制定火力分配方案,并將任務(wù)指令下發(fā)至火力單元;火力單元在接收到發(fā)射指令后發(fā)射GBI進行攔截。
5)GBI助推火箭關(guān)機后釋放EKV,指控中心根據(jù)陸基精密雷達獲取的來襲彈頭的信息,發(fā)出中制導指令,修正飛行彈道。
6)海基X波段雷達(Sea-based X band radar,SBX)發(fā)現(xiàn)來襲彈頭及誘餌,并嘗試從誘餌中識別區(qū)分出彈頭。
7)在紅外導引頭捕獲到來襲彈頭后,EKV在自身攜帶的紅外導引頭引導和姿軌控發(fā)動機控制下,對來襲彈頭進行直接碰撞殺傷。
8)指控中心根據(jù)陸基跟蹤雷達探測的信息和EKV發(fā)回的信息進行綜合研判,確定攔截是否成功,并決定是否展開后續(xù)攔截。
對中段攔截系統(tǒng)的作戰(zhàn)流程進行分析,由于EKV需要在紅外導引頭的引導和姿軌控發(fā)動機推力作用下摧毀目標。如果可以在GBI主動段關(guān)機后,準確預測攔截時間和攔截點,為提前規(guī)劃彈道進行機動提供決策依據(jù),避開EKV紅外導引頭的探測范圍或姿軌控發(fā)動機的最大可機動范圍,從而實現(xiàn)突防。
為了獲取預測攔截時間和預測攔截點所需的GBI信息,需要進攻方的探測設(shè)備對GBI實施探測、跟蹤,獲取位置、速度等信息。本文考慮采用紅外預警衛(wèi)星,在GBI發(fā)射后識別GBI助推火箭尾焰的紅外信號,并對GBI跟蹤、識別。
為使建立的模型能夠準確地預測攔截時間和攔截點坐標,需要分析預測模型所需要的輸入?yún)?shù)。由于攔截時間和攔截點是彈道導彈和GBI雙方運動產(chǎn)生的結(jié)果,輸入?yún)?shù)必須包含攻防雙方的信息。
進攻方通過紅外預警衛(wèi)星獲取的GBI信息僅有GBI在主動段飛行的位置、速度和點火時刻、主動段關(guān)機時刻。根據(jù)式(4),GBI在主動段關(guān)機后,飛行彈道模型相對簡單,因此采用GBI在主動段的關(guān)機時刻的位置、速度及關(guān)機時刻作為輸入?yún)?shù)。
因為在實際中,進攻方實際上只知道己方彈道導彈的相關(guān)坐標系,所以作為輸入?yún)?shù)的GBI的位置、速度都應(yīng)在彈道導彈的相關(guān)坐標系下描述。此外,GBI的位置、速度在彈道導彈相關(guān)坐標系下描述,能夠體現(xiàn)彈道導彈與GBI之間的相對關(guān)系。
經(jīng)分析,GBI的位置、速度采用在彈道導彈發(fā)射系下的坐標值描述。GBI主動段的關(guān)機時刻也采用相對于彈道導彈發(fā)射時刻的時間來描述。
攔截時間預測模型如圖2所示。該模型輸入?yún)?shù)為:GBI主動段關(guān)機時刻位置xs、ys、zs,速度vxs、vys、vzs(彈道導彈發(fā)射系下),關(guān)機時刻ts(相對于彈道導彈發(fā)射時刻),共7個參數(shù);模型的輸出值為攔截時刻tp,是7輸入1輸出模型。

圖2 攔截時間預測模型示意圖Fig.2 Schematic diagram of intercept time prediction model
攔截點預測模型如圖3所示。該模型輸入?yún)?shù)為:GBI主動段關(guān)機點位置xs、ys、zs,速度vxs、vys、vzs(彈道導彈發(fā)射系下),關(guān)機時刻ts(相對于彈道導彈發(fā)射時刻),共7個參數(shù);模型的輸出值為攔截點坐標xp、yp、zp共3個參數(shù),是7輸入3輸出模型。

圖3 攔截點預測模型示意圖Fig.3 Schematic diagram of intercept point prediction model
監(jiān)督學習、無監(jiān)督學習等基于數(shù)據(jù)驅(qū)動的學習算法是人工智能、機器學習領(lǐng)域的重要算法。無監(jiān)督學習與有監(jiān)督學習都依賴于數(shù)據(jù)集,數(shù)據(jù)集是影響算法學習效果的重要影響因素,而兩者的區(qū)別在于監(jiān)督學習采用的數(shù)據(jù)集的樣本有具體的標簽。
神經(jīng)網(wǎng)絡(luò)是一種典型的基于數(shù)據(jù)驅(qū)動進行學習的人工智能算法[13-14]。本文采用基于神經(jīng)網(wǎng)絡(luò)的監(jiān)督學習算法從數(shù)據(jù)中學習經(jīng)驗,通過中段攻防對抗仿真制作數(shù)據(jù)集,并以神經(jīng)網(wǎng)絡(luò)的訓練方式實現(xiàn)數(shù)據(jù)驅(qū)動下的監(jiān)督學習,從而實現(xiàn)在線預測。
網(wǎng)絡(luò)結(jié)構(gòu)采用多層感知器(Multilayer Perceptron,MLP),MLP包括輸入層、隱藏層和輸出層[15]。其中,隱藏層包括多個全連接層(Fullconnected layer,F(xiàn)C)和激活函數(shù)。
攔截時間預測模型輸入為(xs,ys,zs,vxs,vys,vzs,ts),輸出為tp。因此,預測網(wǎng)絡(luò)的輸入層節(jié)點數(shù)為7,輸出層節(jié)點數(shù)為1。
如果隱藏層中只有全連接層,那么整個網(wǎng)絡(luò)仍然是線性網(wǎng)絡(luò),這會使得網(wǎng)絡(luò)難以解決非線性的問題[16],為了提高網(wǎng)絡(luò)對非線性問題的擬合能力,在隱藏層中引入激活函數(shù)。
常用的激活函數(shù)包括sigmoid函數(shù)、雙曲正切函數(shù)tanh和線性整流函數(shù)(Rectified Linear Unit,ReLU)。
相比于sigmoid激活函數(shù)和tanh激活函數(shù),ReLU激活函數(shù)的優(yōu)點有:加速隨機梯度下降法的收斂速度,且計算方法更加簡單,只需要一個閾值過濾就可以得到結(jié)果,而不需要進行復雜的運算。
線性整流函數(shù)ReLU的計算方法為

攔截時間預測網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示,網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表1所示。

表1 攔截時間預測網(wǎng)絡(luò)結(jié)構(gòu)Table 1 Intercept time prediction networ k str uctur e

圖4 攔截時間預測網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Intercept time prediction network structure
網(wǎng)絡(luò)采用5層隱藏層,隱藏層激活函數(shù)采用線性整流函數(shù)。
攔截點預測模型輸入為(xs,ys,zs,vxs,vys,vzs,ts),輸出為(xp,yp,zp)。因此,預測網(wǎng)絡(luò)的輸入層節(jié)點數(shù)為7,輸出層節(jié)點數(shù)為3。
攔截點預測網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示,網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表2所示。

表2 攔截點預測網(wǎng)絡(luò)結(jié)構(gòu)Table 2 Intercept point pr ediction network structure

圖5 攔截點預測網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Intercept point prediction network structure
網(wǎng)絡(luò)采用5層隱藏層,隱藏層激活函數(shù)采用線性整流函數(shù)。
監(jiān)督學習依賴于數(shù)據(jù)集,本文采用中段攻防仿真系統(tǒng)進行紅藍攻防對抗仿真,將仿真數(shù)據(jù)作為訓練樣本,并將大量仿真得到的樣本構(gòu)成數(shù)據(jù)集。
采用某型洲際彈道導彈作為進攻導彈,發(fā)射點為確定點,目標點在經(jīng)度(x-5°,x+5°)、緯度(y-5°,y+5°)范圍內(nèi)采用均勻分布隨機生成,x、y分別為西經(jīng)經(jīng)度值和北緯緯度值。每一個目標點對應(yīng)一條標準彈道,共隨機生成10萬條標準彈道,對每條彈道分別進行攻防仿真。記錄GBI攔截彈相對于彈道導彈坐標系的關(guān)機點參數(shù)和關(guān)機時間,作為訓練樣本的輸入量;將攔截時間和攔截點坐標作為訓練樣本的標簽。得到共計10萬個樣本,并對樣本進行數(shù)據(jù)預處理,選擇70%的樣本組成訓練集,另外30%的樣本作為測試集。
數(shù)據(jù)預處理主要是對數(shù)據(jù)進行歸一化處理,將數(shù)據(jù)映射到[0,1]之間的范圍。由于發(fā)射系位置坐標值在106數(shù)量級,速度坐標值在103數(shù)量級,不進行歸一化處理對損失函數(shù)計算、梯度下降非常不利,從而影響神經(jīng)網(wǎng)絡(luò)的訓練效果。
歸一化處理公式如下:

式中:x為樣本值;xmin為樣本值最小值;xmax為樣本值最大值;xnormlization為歸一化后的樣本值。
在網(wǎng)絡(luò)結(jié)構(gòu)確定后,還需要確定損失函數(shù)和優(yōu)化器,對網(wǎng)絡(luò)進行訓練。損失函數(shù)表示預測值與標簽值之間的誤差大小[17],優(yōu)化器是求解損失函數(shù)最小值的優(yōu)化算法。
1)損失函數(shù)選擇
本文采用均方誤差(Mean Square Error,MSE)作為損失函數(shù),用來判斷預測值與真實值之間的誤差:

式中:M 為神經(jīng)網(wǎng)絡(luò)輸出維度;^yi為預測值;yi為真實值。
2)優(yōu)化器選擇
在神經(jīng)網(wǎng)絡(luò)訓練中的優(yōu)化算法稱為優(yōu)化器,一般是在梯度下降法的基礎(chǔ)上改進而來。常見的優(yōu)化器包括隨機梯度下降(SGD)、AdaGrad、RMSProp、Adam等。本文選擇Adam作為優(yōu)化器,相比經(jīng)典的優(yōu)化器存在收斂速度慢、學習率固定的問題,Adam具有自適應(yīng)調(diào)整學習率、對網(wǎng)絡(luò)參數(shù)的魯棒性強的特點[18]。
網(wǎng)絡(luò)參數(shù)θ的優(yōu)化算法如下[19]:

式中:s、t分別為一階矩、二階矩估計值;ρ1、ρ2為矩估計的指數(shù)衰減速率,取值范圍在區(qū)間[0,1)內(nèi);g為關(guān)于網(wǎng)絡(luò)參數(shù)θ的梯度。
對式(9)得到的結(jié)果進行修正:

采用上述方法對預測網(wǎng)絡(luò)進行訓練,當損失函數(shù)低于閾值后完成訓練,其他訓練參數(shù)如表3所示。

表3 預測網(wǎng)絡(luò)訓練參數(shù)Table 3 Prediction networ k tr aining parameter s
攔截時間與攔截點預測流程如圖6所示。圖7、圖8分別為攔截時間預測網(wǎng)絡(luò)、攔截點預測網(wǎng)絡(luò)的訓練過程。

圖6 攔截時間與攔截點預測流程Fig.6 Flowchart of prediction of intercept time and intercept point

圖7 攔截時間預測網(wǎng)絡(luò)訓練過程Fig.7 Intercept time prediction network training process

圖8 攔截點預測網(wǎng)絡(luò)訓練過程Fig.8 Intercept point prediction network training process
預測網(wǎng)絡(luò)訓練好后,還需要對網(wǎng)絡(luò)的效果進行驗證。將測試集的輸入量輸入訓練好的網(wǎng)絡(luò)的權(quán)重矩陣中,將網(wǎng)絡(luò)輸出的結(jié)果與原測試集中的輸出值進行比較,從而驗證預測網(wǎng)絡(luò)的有效性。
將網(wǎng)絡(luò)模型輸出預測的結(jié)果與原測試集中的攔截時間進行比較,得到攔截時間預測誤差如表4所示。

表4 攔截時間預測誤差Table 4 Prediction error of intercept time
圖9為攔截時間預測網(wǎng)絡(luò)預測值誤差的統(tǒng)計直方圖,圖10為部分樣本預測值誤差折線圖,圖11為攔截時間預測誤差箱型圖。

圖9 攔截時間預測誤差統(tǒng)計直方圖Fig.9 Histogram of intercept time prediction error

圖10 攔截時間部分樣本預測誤差Fig.10 Intercept time partial sample prediction error

圖11 攔截時間預測誤差箱型圖Fig.11 Error box plot of intercept time prediction
攔截時間預測值誤差平均值為0.2240 s,最大值為1.4675 s,神經(jīng)網(wǎng)絡(luò)得到的結(jié)果能夠較準確地預測GBI的攔截時刻,從而進一步得到GBI的待飛時間,用于下一步的彈道導彈中段突防規(guī)劃。
將網(wǎng)絡(luò)模型輸出預測的結(jié)果與原測試集中的攔截點坐標進行比較,得到攔截點坐標預測誤差如表5所示。

表5 攔截點坐標預測誤差Table 5 Prediction error of intercept point’s coordinates
圖12~圖14為攔截點坐標預測網(wǎng)絡(luò)各坐標軸方向坐標值預測值誤差的統(tǒng)計直方圖,圖15~圖17為部分樣本坐標值預測誤差折線圖,圖18為攔截點預測誤差柱狀圖,圖19為攔截點預測坐標軸誤差箱型圖。

圖12 X軸方向攔截點坐標預測誤差統(tǒng)計直方圖Fig.12 Histogram of X-axis intercept point’s coordinate prediction error

圖13 Y軸方向攔截點坐標預測誤差統(tǒng)計直方圖Fig.13 Histogram of Y-axis intercept point’s coordinate prediction error

圖14 Z軸方向攔截點坐標預測誤差統(tǒng)計直方圖Fig.14 Histogram of Z-axis intercept point’s coordinate prediction error

圖15 X軸方向攔截點坐標部分樣本預測誤差Fig.15 X-axis intercept point’s coordinate partial sample prediction error

圖16 Y軸方向攔截點坐標部分樣本預測誤差Fig.16 Y-axis intercept point’s coordinate partial sample prediction error

圖17 Z軸方向攔截點坐標部分樣本預測誤差Fig.17 Z-axis intercept point’s coordinate partial sample prediction error

圖18 各方向攔截點坐標預測誤差柱狀圖Fig.18 Bar chart of error in different directions of intercept point prediction coordinate axis

圖19 各方向攔截點坐標預測誤差箱型圖Fig.19 Error box plot in different directions of intercept point prediction coordinate axis
攔截點的預測值在距離上的誤差平均值為2016.48 m,誤差最大值為9255.64 m,由于GBI紅外導引頭的探測距離在200 km左右[20],遠遠大于預測誤差,預測誤差對下一步突防規(guī)劃帶來的影響較小,精度滿足需要。
將包含誤差的攔截彈主動段關(guān)機參數(shù)作為彈道計算的初始狀態(tài),使用四階龍格庫塔法進行積分,將脫靶量取得最小值時的攔截彈坐標作為積分計算結(jié)果的攔截點。從圖20可以看出,預測網(wǎng)絡(luò)的預測結(jié)果對于存在誤差的關(guān)機參數(shù)彈道計算的結(jié)果在精度上具有一定的優(yōu)勢。

圖20 神經(jīng)網(wǎng)絡(luò)預測結(jié)果與彈道仿真結(jié)果的比較Fig.20 Comparison of neural network prediction results and trajectory simulation results
本文主要研究了在中段突防過程中針對GBI關(guān)機參數(shù)預測攔截時間和攔截點的問題。由于神經(jīng)網(wǎng)絡(luò)具有強大的擬合非線性問題的特點,本文采用基于神經(jīng)網(wǎng)絡(luò)的監(jiān)督學習算法,實現(xiàn)從攻防對抗仿真數(shù)據(jù)中獲取預測攔截時間和攔截的能力。首先,基于彈道導彈中段攻防對抗仿真得到的結(jié)果,構(gòu)建了訓練數(shù)據(jù)集。然后,進行神經(jīng)網(wǎng)絡(luò)的訓練,并根據(jù)結(jié)果進行調(diào)整。最后,確定網(wǎng)絡(luò)結(jié)構(gòu)和訓練參數(shù)。
測試集的仿真驗證表明,訓練得到的網(wǎng)絡(luò)能夠準確預測攔截時間和攔截位置,證明了預測方法的有效性。實現(xiàn)了在洲際彈道導彈、GBI攔截彈發(fā)射點固定,洲際彈道導彈的目標點在一定的作戰(zhàn)區(qū)域范圍內(nèi)變化的作戰(zhàn)想定下,根據(jù)進攻方紅外預警衛(wèi)星探測數(shù)據(jù)對攔截時間、攔截點信息進行在線預測。預測的攔截時間和攔截點可用于下一步突防規(guī)劃研究當中。