邵 雷,雷虎民,張大元
(1.空軍工程大學 防空反導學院,陜西 西安,710051;2.中國人民解放軍95983部隊,甘肅 酒泉,732750)
在針對臨近空間高超聲速目標的攔截過程中,為提高攔截彈對目標的殺傷性能,通常采用“中制導+末制導”的復合制導方式[1]。為保證攔截彈進入末制導后具有良好的制導控制性能,一方面希望中制導階段能量消耗盡量少,保證攔截彈在末制導階段具有對抗目標機動的足夠能量;另一方面,也希望在中制導結束時具有合理的交匯條件,為末制導提供良好的初始條件[2]。這些需求對中制導段彈道設計構成了嚴格約束,因此,中制導段彈道的合理設計對于改善攔截彈的飛行品質,提高武器系統的最終制導控制性能均具有重要作用,中制導階段彈道優化設計成為攔截彈總體設計的一項重要內容。
中制導彈道優化本質上是一類受約束最優控制問題,通常可分為直接法和間接法[3]兩類求解方法。其中,間接法以Pontryagin極小值原理為出發點,利用一階必要性條件將彈道優化問題轉化為兩點邊值問題[4]。通過求解該問題得到相對精確的彈道優化結果,但這種方法通常推導過程繁瑣,同時收斂域小,對初值要求高,很難直接得到優化結果[5]。直接法采用參數化方法(Runge-Kutta法[6],Hermit-Simpson法,偽譜法[7-8]等)將連續空間的優化問題離散化為非線性規劃(NLP)問題,并通過數值方法(梯度下降法、動態規劃法、直接打靶法、微分包含法等)求解獲得最優軌跡。這種方法求解精度相對較低,但過程簡單,同時收斂較快,經過參數化處理后,可廣泛采用各種非線性尋優和智能優化算法求解,也是近年來的主要研究方法[9]。
這些研究均針對攔截彈中制導彈道進行離線設計,能夠有效提高復合制導攔截武器的制導控制性能。但不管是直接法還是間接法,本質都是根據狀態方程以及約束條件求解滿足指標需求的優化彈道,實際均為開環過程。然而臨近空間高超聲速目標通常具有較快的速度和較大的機動范圍,這種特性將導致中制導約束條件發生較大變化甚至無法滿足末制導需求,離線設計的優化彈道將難以保證武器系統的整體制導控制性能。為此,一些學者提出了在線生成軌跡的方法。文獻[10]采用奇異攝動技術求解兩點邊值問題,實現中制導律在線解算;文獻[11-12]根據擬平衡滑翔條件分別基于速度與航程,速度-阻力關系等內在機理,采用開關方式對飛行器載入軌跡進行修正,在線生成軌跡,但精度較差,且無法保證最優性。文獻[13]則采用在線優化的方法開展研究,通過在線對飛行器參數、狀態誤差等的估計,利用在線軌跡優化算法實現軌跡的在線生成。但這種彈道優化方法往往非常耗時,難以在攔截彈上實時進行彈道優化。基于此,本文充分利用離線優化彈道,采用彈道數據庫和神經網絡相結合的方法設計中制導彈道生成方法。
彈道優化計算一般采用攔截彈質點運動模型[14]:
(1)
式中:m,S為導彈質量和參考面積;v為導彈速度;F為發動機推力;θ為彈道傾角;q為動壓;g為重力加速度;Cx,Cy分別為阻力系數和升力系數,其中:
(2)

在實際飛行過程中“考慮到彈道的穩定性”,通常對控制變量進行如下約束:
αmin≤α≤αmax
(3)
qmin≤q≤qmax
(4)
nmin≤n≤nmax
(5)
式中:n為過載。
在設計攔截彈飛行彈道時,不僅要保證導引頭能夠穩定跟蹤目標,同時也希望攔截彈與目標相遇時具有較高的速度。為此,在中制導優化過程中,通常以末端速度最大為優化指標建立指標函數:
(6)

中制導彈道設計實際上是求解最優控制量α與中制導結束時間tf,使得由攔截彈運動方程組確定的系統,在滿足給定的約束條件下的性能指標最優。對于該問題當前已有較多算法,這里不再贅述。
在實際彈道設計過程中,為兼顧末制導特性以及攔截彈整體彈道特性,通常以目標預測遭遇點作為攔截彈中制導彈道優化的終端約束進行彈道優化設計,通過離線彈道優化得到攔截彈的中制導優化彈道[14]。然而,受到遭遇點預測精度的影響,遭遇點位置往往不完全準確;同時,目標遭遇點在實際攔截過程中也將隨著目標的運動不斷發生變化,特別是在針對高速目標的攔截過程中,其變化范圍可能較大,為保證攔截彈整體制導性能,必須使中制導彈道能夠隨著遭遇點的變化而不斷修正,導致中制導彈道的末端約束條件不斷發生變化。
考慮到彈道優化通常較為耗時,難以直接進行在線優化求解,為充分利用離線計算的優化彈道,本文采用基于網格劃分所形成的彈道數據庫和BP神經網絡相結合的方法設計中制導彈道在線生成方法。該方法的基本思想:首先,以攔截彈的中制導調整能力為基礎,對目標空域采用網格劃分方法形成彈道終端約束網格點,并以這些網格點為基礎設計離線彈道,構建針對各個網格點的優化彈道數據;其次,利用優化彈道數據構成訓練樣本,對BP神經網絡進行訓練,得到能夠覆蓋目標運動空域的BP神經網絡模型,進而利用該模型在線生成彈道。攔截彈發射后,按照一定的周期修正預測遭遇點,構成中制導彈道末端約束條件,根據裝訂的BP神經網絡模型實時形成優化彈道指令。基本流程如圖1所示。

圖1 網絡工作流程
圖1中,利用神經網絡對網格劃分所生成彈道數據庫進行逼近,實現該區域彈道的在線生成,在線生成彈道的質量將主要取決于網格劃分所產生彈道數據庫與神經網絡訓練的泛化能力。
對預測區域進行網格劃分,首先必須建立預測區域參數空間,本文根據中制導終端約束的維度構建參數空間。假定約束維度為d維,對每個維度按照一定的方法進行網格劃分,可以得到d維變量的遞增集合:



P可表示為如下所有各個維度劃分的組合,即
以網格空間P中的每一個元素為約束,離線求解式(6)中的優化問題,即可得到針對該網格空間所確定區域的一系列優化彈道數據,每一條彈道數據對應于一個網格劃分約束點。
利用這些網格及其對應的彈道構成彈道數據空間。本文利用神經網絡對數據空間的逼近特性,通過訓練實現對彈道數據庫的逼近。結合攔截彈運動模型,以縱向平面為例,選擇攔截彈速度、彈道傾角、X坐標與預測交接點X坐標差值、Y坐標與預測交接點Y坐標差值,作為神經網絡的輸入變量,攔截彈的需用攻角作為輸出變量,構成BP神經網絡;同時,為保證一定精度,選擇一定數量的網絡隱層。在訓練過程中,按照一定的間隔從優化彈道數據庫中選擇彈道數據,作為相應輸入、輸出數據,并按照網絡訓練算法實現網格訓練。網絡訓練示意圖如圖2所示,圖中,(xeq,yeq)為期望交接班位置,αc為參考攻角指令,α′c為實際攻角指令。
研究表明,網格劃分間隔不能過大,同時一個網絡負責的區域也應該在一定范圍內,否則會因為訓練樣本過大導致預測精度不高;另一方面,網格劃分間隔不能過小,過小將生成過多的網格點,進而使得彈道數據庫的數量大增,降低軌跡生成的效率,同時也不利于網絡訓練。因此,網格劃分間隔需要根據攔截彈的中制導段調整能力進行合理選取。一種網格劃分示意圖如圖3所示。

圖2 網絡訓練示意圖

圖3 網格劃分示意圖
考慮到本文的重點在于設計一種彈道在線生成方法,具體的BP網絡訓練已有較多適用算法,這里不再贅述。
采用與文獻[14]相同優化條件進行仿真,通過仿真實驗驗證本文設計中制導彈道生成方法的有效性。
假定預測遭遇點區域如圖4所示,對該區域進行網格劃分,通過彈道優化設計形成優化彈道數據庫。

圖4 仿真區域示意圖
按照示意圖4中對該區域的網格劃分,可以得到4個邊界點P1,P2,P3,P4,以各個點的坐標為終端約束進行彈道優化,可以得到各條彈道控制量,如表1所示,表中,αc,k(k=1,…,5)為針對給定的各遭遇點采用直接法優化得到的最優控制量(攻角)。
以表1中的各個預測遭遇點坐標以及相應的控制量形成各條優化彈道,構成彈道數據庫;采用2.2節中的方法構建神經網絡,并對其進行訓練。為提高訓練效果,可先對數據進行歸一化處理,訓練過程如圖5所示,圖中,橫坐標N為訓練次數,縱坐標為無量綱誤差lge。由圖5知,經過135次訓練可以達到0.000 1的誤差要求。

表1 訓練點和最優控制量

圖5 MATLAB下BP神經網絡訓練過程
為驗證3.3節中神經網絡模型用于軌跡生成的性能,通過兩個方面的仿真實驗分別對其復現訓練彈道的能力與應對終端約束變化的能力進行檢驗。
①仿真實驗一:訓練彈道復現能力分析。
為分析神經網絡模型復現訓練樣本彈道的能力,選擇訓練樣本中遭遇點P1為目標,同時假定在中制導過程中該遭遇點不再發生變化,仿真結果如圖6所示。

圖6 預測命中點不變時的彈道計算結果
從圖6中2種方式生成的彈道曲線、速度曲線以及彈道傾角曲線的對比可以看出,神經網絡模型在線生成的彈道相比離線優化彈道,具有相似的彈道特性,而且精度較高,這表明神經網絡模型對訓練彈道具有較好的逼近特性。
②仿真實驗二:訓練彈道調整能力分析。
當針對高速、高機動目標進行攔截時,預測遭遇點的變化將不容忽視,這就要求攔截彈在攔截過程中具有較強的中制導段彈道調整能力。為驗證預測遭遇點發生變化時彈道的調整能力,假定在攔截彈中制導過程中,預測遭遇點由P1變為P3,仿真結果如圖7所示。

圖7 預測命中點切換時的彈道計算結果
圖7中,優化軌跡1是以遭遇點P1為終端約束得到的優化彈道,優化軌跡2是以遭遇點P3為終端約束得到的優化彈道。從圖7中2種方式生成的彈道曲線、速度曲線以及彈道傾角曲線的對比可以看出,中制導過程中,神經網絡模型生成的彈道首先按照P1遭遇點對應的彈道,當遭遇點發生變化后,彈道逐漸由軌跡1調整為軌跡2,并在到達約束遭遇點P3時與軌跡2保持趨近一致。這表明通過神經網絡模型能夠實現中制導彈道的在線調整,同時彈道的調整目標與新約束下優化彈道一致逼近,這也驗證了本文設計中制導彈道生成方法具有一定的優化特性。
需要注意的是,遭遇點變化帶來的攻角突變可能引起攔截器控制失穩,在具體實現時需要采取一定的平滑措施,保證控制量的平滑過渡。
為改善攔截彈中制導性能,提高攔截彈彈道品質,本文將網格劃分與神經網絡相結合,提出了一種中制導彈道生成方法。該方法基于攔截彈調整能力對攔截區域進行網格化劃分,以各個網格點為約束,采用數值優化方法生成多條離線彈道,構建彈道數據庫;利用BP神經網絡對非線性函數的逼近特性,通過網絡訓練實現BP網絡對彈道數據庫的覆蓋,構建神經網絡模型,實現對攔截彈在給定區域優化軌跡的覆蓋。仿真研究表明,神經網絡模型能夠較好地適應中制導終端約束條件的變化,且精度較高,具有較強的借鑒意義。本文方法可為攔截彈中制導彈道的在線調整提供思路與參考。