李明杰, 周池軍, 雷虎民, 邵 雷, 駱長鑫
(空軍工程大學防空反導學院, 陜西 西安 710051)
再入滑翔目標是當前世界各國臨近空間領域研究的重點。該類目標可在臨近空間內進行遠距離再入滑翔,具有飛行速度快、作戰空域廣、突防能力強等特點[1],現有防御系統對其尚不具備攔截能力。因此,發展針對該類目標的攔截技術具有重要的戰略意義[2]。軌跡預測作為攔截技術的重要支撐,可以為基于預測命中點的攔截彈提供發射決策和中制導終端約束[3],是目前亟待突破的關鍵技術。
當前針對再入滑翔目標的軌跡預測方法還十分有限,按照其預測機理,主要分為機動模式辨識、攻擊意圖推斷和控制參數估計3種類型。
在基于機動模式辨識的軌跡預測方面,Ferreira[4]及Chen等[5]對平衡滑翔的長周期運動進行了分析,并將跳躍滑翔利用劉維爾變換及廣義多尺度理論方法擬合為震蕩曲線,給出了跳躍次數的公式;Vinh等[6-7]分析了高超聲速目標常攻角條件下的跳躍滑翔和平衡滑翔的二階近似解,但解的方式較為復雜;Lu[8]將升力體飛行器的準平衡滑翔狀態看作正則攝動問題,將準平衡滑翔縱向軌跡分解為平衡滑翔與高階項的組合,并分析了真實解與低階解的誤差。韓春耀等[9]針對再入滑翔目標的平衡滑翔機動模式,分析了平衡滑翔模式的軌跡解析方程,通過對關鍵參數的求解實現了對平衡滑翔軌跡的預測;程云鵬等[10]通過分析目標機動模式,生成相應的訓練集,訓練支持向量機分類器并結合擴展卡爾曼濾波算法實現了目標的軌跡預測。以上方法僅針對部分模式具有較好的軌跡預測效果,而利用訓練集或網絡的訓練方法缺乏一定的模型基礎,可能會降低目標的預測精度。
攻擊意圖對于提高預測精度具有重要作用,在飛機的軌跡預測方面得到了廣泛應用[11-12]。針對再入滑翔目標,張凱等[13]從構建預測模型、修正預測誤差、辨識制導規律和推斷目標意圖4個方面討論了再入滑翔目標軌跡預測的關鍵技術,提出了結合狀態信息和攻擊意圖的軌跡預測思路。在此基礎上[14],在假定目標必對要地進行攻擊的前提下,基于貝葉斯理論推導目標機動模式,根據蒙特卡羅采樣實現了軌跡預測;Hu等[15]利用自回歸模型實現了機動規律辨識,同時利用目標意圖結合貝葉斯理論推導了狀態迭代公式,并可根據效果選擇預測方式。以上方法結合意圖信息對預測模型進行修正,有效地實現了軌跡預測,但由于使用了采樣方法進行迭代預測,往往預測用時較長,難以滿足軌跡快速預測的要求。
以上兩類方法需要獲取目標的機動模式或攻擊意圖等先驗信息,在先驗信息不準確的條件下預測效果欠佳。在此條件下,可以基于控制參數估計進行軌跡預測。翟岱亮等[16]基于目標氣動受力模型,通過仿真分析得到了一組變化規律較為簡單的控制參數,對于HTV-2模型具有較好的預測效果;李世杰等[17]針對文獻[16]中參數規律不易預測的問題,提出了新的控制參數,通過仿真驗證了預測的優化效果;韓春耀等[18]建立了再入滑翔目的簡化動力學模型,在此基礎上得到控制參數的解析形式,實現了軌跡預測。以上方法均對模型進行了有效分析,通過估計控制參數的變化規律,結合模型積分外推實現了軌跡預測,但預測方法缺乏與數據的關聯,只通過簡單的控制參數擬合,預測精度有限。
而隨著深度學習技術的日益發展,利用深度網絡進行復雜函數擬合具有十分良好的效果。特別地,循環神經網絡網絡及長短期記憶(long and short term memory, LSTM)網絡[19],在時序特征提取與規律學習上具有很好的效果[20]?;谏疃壬窠浘W絡的軌跡預測方法也被廣泛地應用于行人、飛機軌跡預測領域[21-22]。目前,也已有部分學者將時序網絡應用于再入滑翔目標的軌跡預測領域。蔡遠利等[23]設計了基于LSTM網絡的彈道分類與預測器,實現了純數據驅動非彈道目標的軌跡預測;Xie等[24]設計了一種基于雙通道雙向門循環單元(gate recurrent unit, GRU)網絡,生成了預測數據集,實現了對高速目標的軌跡預測。以上方法的預測效果較好,但與模型的結合程度不高,且數據集缺乏濾波處理。
本文對再入目標運動模型及運動約束進行分析,提出了針對不同模式的快速軌跡生成方法,構建了軌跡數據集,并將控制參數與深度時序網絡結合,建立了智能軌跡預測架構,通過修正末點位置和濾波參數,預測控制參數變化,結合模型積分外推,實現了軌跡預測。仿真結果表明,本文所設計的算法能夠達到較高的預測精度,優于當前其他主流算法。
在忽略地球自轉影響的前提下,再入滑翔目標運動模型可表示為
(1)

(2)
由于再入滑翔目標具有非合作性,防御方無法準確獲知目標的模型參數。因此,無法事先將得知的相關參數合并,得到新的控制參數。在此基礎上對控制參數進行估計,是軌跡預測的有效手段。

(3)

(4)
為便于分析,在論文后續部分將式(3)對應的運動模型表示為fξ,式(4)對應的運動模型表示為fK。
通常條件下,再入滑翔目標存在多種機動模式,主要包括平衡滑翔、跳躍滑翔、擺動機動和轉彎機動等典型機動模式,各機動模式的定義及控制方程可參考文獻[25-26]。
為了給后續的智能軌跡預測算法提供有效軌跡數據,本節提出了快速軌跡生成方法,生成了大量機動模式軌跡,構建了軌跡數據集。
由于再入滑翔目標初始速度較高,所以其在初始階段往往使用大攻角飛行,從而減小目標熱流密度以滿足約束。而目標為了達到最大射程,往往需要采用最大升阻比進行滑翔。基于此,本文采用航天飛機常使用的攻角模型[27],用于縱向跳躍滑翔的軌跡生成:
(5)
式中:αK表示最大升阻比對應的攻角值;v1,v2分別為目標用最大升阻比飛行時超出約束與未超出約束的速度極值點。
各模式機動軌跡的生成流程如圖1所示。在軌跡生成過程中,首先根據不同機動模式選取相應的控制方程,然后給定初始狀態和控制量初值,根據控制方程及攻角走廊[20]計算相應時刻的控制量,通過積分獲得軌跡。
本文以高性能機動再入飛行器(high performance maneuvering reentry vehicle, HPMARV)[28]為研究對象,在給定初始與終止狀態的條件下,變更初始參數,生成多種機動軌跡,如圖2和圖3所示。其中,圖2為擺動跳躍軌跡,圖3為轉彎平衡軌跡,其對應參數如表1所示。圖2和圖3中a,b,c表示不同初始參數條件下的生成軌跡。從圖2與圖3可以看出,軌跡均可實現預設的橫縱向機動,且滿足相應的攻角走廊約束。單條軌跡的生成時間約為2~3 s,可滿足大量訓練軌跡的生成要求。

圖1 軌跡數據快速生成流程Fig.1 Rapid generation process of trajectory data

圖2 擺動跳躍機動軌跡及攻角變化Fig.2 Weaving skip maneuvering trajectories and variation of attack angle

圖3 轉彎平衡機動軌跡及攻角變化Fig.3 Turning equilibrium maneuvering trajectories and variation of attack angle

表1 仿真參數設置
為實現對再入滑翔目標的準確預測,需要分析其控制參數的變化規律。轉彎跳躍機動模式下多條軌跡的控制參數變化規律如圖4和圖5所示。當目標機動較為復雜時,由于控制參數與運動狀態具有復雜的非線性關系,所以無法通過簡單函數擬合各控制參數的變化規律,實現準確的軌跡預測;另一方面,在同一機動模式下,不同軌跡的控制參數的變化規律具有一定相似性,所以可以利用時序網絡,通過學習控制參數的時序特點進行軌跡預測。
LSTM網絡是為了解決長期的時序問題而專門設計的,不同于普通的循環神經網絡結構,其只有一個簡單的tanh函數,一個LSTM網絡結構單元包含3個門結構:遺忘門、輸入門和輸出門,以實現信息的保護控制,其結構如圖6所示。

圖4 轉彎跳躍模式下KD,β,KL的變化規律Fig.4 Variation law of KD,β,KL in turning skip mode

圖5 轉彎跳躍模式下ξv,ξt,ξc 參數的變化規律Fig.5 Variation law of ξv,ξt,ξc in turning skip mode

圖6 LSTM網絡結構Fig.6 Structure of LSTM network

本文設計的智能軌跡預測框架如圖7所示,包括末點修正網絡、參數修正網絡及預測網絡三部分。

圖7 基于控制參數的智能軌跡預測算法結構Fig.7 Structure of intelligent trajectory prediction algorithm based on control parameters
(1) 末點修正網絡φl(·)
利用積分預測軌跡時,積分初始狀態對預測精度有很大的影響。將原始數據及觀測數據代入末點修正網絡,用于精確修正觀測末點位置。網絡使用大小為[6,128,2]的LSTM網絡及[128,6]的全連接網絡進行訓練。即將觀測到的歸一化6維狀態序列So(ts:tl)代入到具有2層128中間節點的LSTM網絡學習其時序關系,之后代入全連接網絡進行降維,用于得到修正末點狀態Sl。
(2) 參數修正網絡φm(·)

(3) 參數預測網絡φp(·)

(1) 數據歸一化
首先對軌跡進行跟蹤,獲取相應的跟蹤數據。在跟蹤數據的基礎上,利用濾波算法對數據進行處理得到濾波數據。為了加快網絡收斂速度,本文將觀測數據及濾波數據進行歸一化處理,即利用所有軌跡的原始數據獲取各類數據的上、下限值Xmax,Xmin,將數據歸一化處理
(6)
通過此操作,將數據轉化為[0,1]之間,方便網絡進行訓練。
(2) 末點位置修正


(7)
(3) 參數修正與預測
Kp=φp(φm(Kf(ts),…,Kf(tl)))=
(8)
ξp=φp(φm(ξf(ts),…,ξf(tl)))=
(9)
式中:Kp與ξp分別表示兩種控制參數的預測結果;t1表示預測初始時刻;tn表示預測終止時刻。
(4) 積分外推預測
根據運動模型fK及fξ,使用四階龍格庫塔法積分獲取預測軌跡Spk及Spξ:
SpK=fK(KP,Sml)=[HpK(t1:tn),φpK(t1:tn),

(10)
Spξ=fξ(ξP,Sml)=[Hpξ(t1:tn),φpξ(t1:tn),

(11)
上述網絡均使用均方根誤差(root-mean-square error, RMSE)計算網絡損失,網絡結構總損失為
l=lfm+lm+lp
(12)
式中:lfm表示末點修正網絡損失;lm表示修正網絡損失;lp表示預測網絡損失,形式如下:
(13)
式中:Smli表示批次中第i個修正末點位置;Soli表示批次中第i個觀點末點位置;N表示批次數目;Kmi表示批次中第i個修正控制參數序列;Kfi表示批次中第i個濾波控制參數序列;Kpi表示批次中第i個修正控制參數序列;Kdi表示批次中第i個生成控制參數序列。
(1) 仿真條件
本文仿真分析采用Matlab+Python的軟件環境,網絡搭建使用Pytorch框架,硬件配置為Inter i7處理器和Geforce 2080ti顯卡。
(2) 數據集設置
本文使用第2節的軌跡生成方法,生成數量為20 000條的軌跡數據集。對軌跡進行濾波處理[29],雷達位置為(0.4 rad,0 rad,100 m)。假設雷達的觀測誤差符合[(30 m)2,(0.1°)2,(0.1°)2]的高斯分布,將所有軌跡的400~600 s數據生成觀測數據集及濾波數據集,以其400~750 s的原始數據作為相應網絡的標簽,用于訓練和測試末點修正網絡、參數修正網絡及參數預測網絡。
(3) 訓練條件
各網絡以100條軌跡為1個批次,共訓練1 000個回合。優化器使用自適應矩估計(adaptive moment estimation, ADAM)優化器,訓練學習率在前10個回合為0.001,之后調整為0.000 1。
(4) 誤差定義
本文選取預測的平均誤差(average error of spatial distance, AESD)、最終誤差(final error of spatial distance, FESD)以及最大誤差(maximal error of spatial distance, MESD)作為誤差指標,計算公式如下:
AESD=
(14)
FESD=
(15)
MESD=
(16)

后續將基于控制參數ξv,ξt,ξc及KD,β,KL的智能軌跡預測算法分別稱為LSTM-VTC與LSTM-DBL算法。
(1) 末點修正效果
使用控制參數進行積分外推,雖然可以有效減少預測狀態量并簡化預測模型,但其對積分狀態的起點精度要求很高,如果濾波結束后末點位置與真實位置差距較大,尤其是角度差距較大(例如平衡滑翔和縱向小機動滑翔軌跡,θ接近于0),會使傾角符號發生改變,從而導致軌跡預測產生很大的誤差。在研究過程中,使用末點修正網絡對濾波結果的末點狀態進行修正,其積分效果對比如圖8所示。
從圖8可以看出,當末點位置不進行修正時,由于角度誤差較大,導致軌跡積分發生了較大的偏差。尤其是在高度方向上,由于初始傾角的偏差導致了方向的錯誤,再加上目標速度很大,導致軌跡產生很大的誤差。經過末點修正,盡管初始點位置仍有誤差,但是因為減少了角度誤差,使得預測得到的軌跡保持了正確的趨勢,誤差整體較小。
(2) 參數修正效果
由于濾波參數與原始參數存在一定的誤差且存在波動,為了提高軌跡預測的最終效果,對其進行進一步修正是十分必要的。以轉彎跳躍機動條件下的軌跡預測為例,濾波結果、修正結果與原始數據的對比效果如圖9和圖10所示。

圖8 末點修正網絡結果Fig.8 Result of last point modification network

圖9 KD,β,KL參數濾波及修正結果Fig.9 Filtering and modification result of parameters KD,β,KL

圖10 ξv,ξt,ξc參數濾波及修正結果Fig.10 Filtering and modification result of parameters ξv,ξt,ξc
圖9和圖10分別代表控制參數為KD,β,KL與ξv,ξt,ξc的參數修正與相應預測效果。從圖中可以看出,盡管進行了濾波處理,但是由于預測時時間步長較大,兩組控制參數都存在較大波動,距離原始控制參數有較大偏差。為了提高目標預測精度,引入了對濾波控制參數進行修正的參數修正網絡,網絡處理后控制參數更加準確,說明訓練后的網絡可以在大量數據中通過學習擬合出目標濾波參數與生成參數的映射關系;另一方面,因為濾波數據本身存在抖動,所以修正參數在前期仍然存在一定的波動現象。
有無濾波參數網絡各模式下的預測效果如圖11和表2所示。圖11依次表示擺動跳躍、擺動平衡、轉彎跳躍及轉彎平衡機動的預測指標變化。AESD,FESD,MESD表示具有修正網絡的預測誤差值,AESDf,FESDf,MESDf表示沒有修正網絡的預測誤差值。從圖11可以看出,針對兩組控制參數,使用濾波網絡后其整體預測結果都有很大提升。部分條件下,由于積分初始位置不準確,可能存在濾波參數在短時域條件下預測精度更高的情況。對比表2結果,兩組控制參數算法針對平衡機動的預測效果均好于跳躍機動,這是因為平衡機動的參數變化更加平滑;擺動機動的預測效果好于轉彎機動,這是因為擺動機動的橫向運動范圍相較于跳躍機動更小,更易預測;對比兩組控制參數的預測效果,KD,β,KL的預測效果要比ξv,ξt,ξc更精確。結合文獻[16]分析,說明該控制參數更能體現目標的橫縱向軌跡預測效果。

圖11 有無濾波參數修正網絡結果對比圖Fig.11 Comparison result with or without filtering parameters modification network

表2 有無修正網絡150 s預測誤差
(3) 預測誤差分析
根據兩種參數的預測方法效果繪制相應的預測誤差管道,如圖12和圖13所示。從圖12和圖13可以看出,各機動模式下,隨著預測時間增加,誤差管道逐漸變寬。尤其在轉彎跳躍機動模式下,其管道的橫縱向擴張相較于其他機動模式都更加迅速。這主要有兩個方面的原因:一是復雜機動下控制參數變化規律更加非線性化,網絡辨識參數的誤差更大;二是由于復雜機動下預測軌跡的初始積分位置不準確,導致誤差的累積效應更加劇烈,預測誤差范圍逐漸增大。
(4) 氣動誤差影響分析
再入滑翔目標在臨近空間滑翔時,由于大氣誤差和隨機風的影響,大氣密度可能存在攝動。而通常條件下,當再入滑翔目標高度大于50 km時,大氣密度幾乎不變;當高度等于30 km時,大約存在不超過3%的偏差[30]。以此,本文在目標軌跡生成時給大氣密度增加3σ置信區域為3%的隨機誤差。在4種機動模式下,目標的預測效果如圖14及圖15所示。

圖12 LSTM-DBL誤差管道Fig.12 Error pipe of LSTM-DBL

圖13 LSTM-VTC誤差管道Fig.13 Error pipe of LSTM-VTC

圖14 大氣密度誤差下各機動模式預測軌跡Fig.14 Predicted trajectories in different maneuvering modes with atmospheric density error

圖15 大氣密度誤差下控制參數預測效果Fig.15 Prediction results of control parameters with atmospheric density error
從圖15可以看出,盡管大氣誤差及隨機風擾動會給目標的控制參數帶來擾動,但是本文提出的兩種方法均可以估計擾動下的控制參數的變化規律,并對軌跡進行有效預測。另一方面,對平衡滑翔軌跡進行預測時,由于大氣擾動導致目標初始位置預測產生誤差,會使目標在縱向不再完全符合平衡滑翔條件,使得預測軌跡在縱向產生一定的跳躍,從而在一定程度上影響預測精度。
(5) 與主流方法對比效果
將本文方法與文獻[17]中KD,β,KL參數函數擬合方法、文獻[16]ξv,ξt,ξc中參數函數擬合方法及單純的LSTM網絡預測軌跡進行對比,各類軌跡的預測效果如圖16所示。

圖16 各機動模式下軌跡預測效果Fig.16 Trajectoris prediction results with different maneuvering modes
從圖16可以看出,本文提出的LSTM-DBL及LSTM-VTC方法與純LSTM網絡相比,誤差更小、預測精度更高。這是因為純LSTM網絡方法,沒有對目標模型進行分析,每個時刻的預測狀態量之間僅通過網絡建立了時序關系,缺乏與運動模型的耦合;而通過對比發現文獻[16]和文獻[17]方法的預測偏差較大,表明預測時段的控制參數變化并不遵從簡單的函數規律,直接對濾波參數進行擬合,對模型機動變化產生了誤判,從而導致預測結果不準確。
各預測算法的精度及速度對比結果如表3所示。由表3可知,本文提出的LSTM-DBL算法在多種機動模式下的預測精度均為最高,各模式下的AESD不超過1.4 km,最大距離誤差不超過2.5 km。通過分析網絡用時,純LSTM網絡相較于LSTM-DBL方法速度更快。

表3 不同預測方法對比結果

續表3
本文針對各機動模式下控制參數變化規律的復雜性,提出了基于控制參數的再入滑翔目標智能軌跡預測算法。首先利用攻角走廊設計了快速軌跡生成方法,構建了軌跡數據集;借助LSTM時序網絡,設計了精確末點位置的末點修正網絡,修正了濾波參數的參數修正網絡及預測參數變化的預測網絡,共同構成智能軌跡預測框架,結合目標控制參數運動模型積分外推實現了軌跡預測。仿真結果表明,在單次預測用時不超過0.015 6 s的條件下,各模式軌跡預測的平均誤差不超過1.4 km,最大誤差不超過2.5 km;在大氣偏差條件下,通過仿真分析,驗證了該方法針對各類機動均具有一定的魯棒性。