陳萬春,于 琦,楊 勁,余文斌,楊 良
(北京航空航天大學宇航學院,北京,102206)
升力體飛行器是一種使用運載火箭助推,利用高升阻比特點在大氣層內遠距離高速滑翔的飛行器,與傳統彈道導彈相比,具有機動范圍廣、飛行軌跡不確定性強、敵地面雷達探測距離短等優點,因而成為目前的研究熱點問題。但是,升力體飛行器的飛行環境惡劣,力熱約束強,其彈道規劃和制導難度較大。
常規再入制導律首先需要規劃再入走廊,在走廊內規劃一條滿足終端條件的參考軌跡[1],但由于無法抑制由高升阻比引起的弱阻尼長周期彈道振蕩,無法可靠導引以CAV為代表的高升阻比飛行器[2]。為了滿足升力體飛行器起滑條件,對助推段與滑翔段交班誤差要求嚴格,因此對助推段制導律提出了較高要求。為保證對敵方目標的有效打擊,還需要滿足反攔截約束。
陳萬春教授及其團隊在飛行動力學和制導領域工作20余年,在再入彈道優化、再入機動反攔截彈道規劃與制導等方面完成多項研究,提出一系列適應再入任務的理論方法[3]。本文針對升力體飛行器彈道規劃和制導中的難題,歸納總結研究團隊近年取得的重要成果。
升力體飛行器滑翔段彈道具有長周期、弱阻尼振蕩的特性,在彈道谷底時動壓和熱流容易超過力熱約束且大幅增加控制難度。因此期望滑翔彈道是一條平滑無振蕩的軌跡,即平穩機動滑翔彈道。在彈道規劃時,發現通過改變初始狀態,可以得到平穩機動滑翔彈道,如圖1所示[4]。

圖1 不同初始狀態下的滑翔彈道 Fig.1 Glide Trajectories with Different Initial States
如果只通過調整初始狀態獲得平穩滑翔彈道,則對初始狀態有極高的精度要求,幾乎無法實現。因此需要設計一種控制方法,使其在有初始狀態偏差的情況下,彈道也能迅速收斂到平穩滑翔彈道,稱之為彈道阻尼控制技術(Trajectory Damping Control Technique,TDCT)。
1.2.1 自然穩定滑翔彈道阻尼控制技術
自然穩定滑翔彈道阻尼控制技術的控制機理是將彈道傾角γ與平穩滑翔彈道傾角SGγ的偏差作為反饋項添加到基準攻角 bslα與基準傾側角 bslσ中,以改變升力在鉛垂方向上的分量來影響高度變化,最終使得彈道穩定在平穩滑翔彈道傾角附近[5,6]。利用彈道阻尼控制技術得到的指令攻角為αcmd= αbsl+ kγcosσbsl(γSG-γ),指令傾側角為σcmd= σbsl- kγsinσbsl(γSG- γ )α1。其中,kγ是反饋增益系數。彈道阻尼控制技術可以有效抑制自然穩定滑翔彈道的振蕩,見圖2。

圖2 自然穩定滑翔彈道阻尼控制結果 Fig.2 Natural-stable Glide Trajectories with TDCT
1.2.2 自然不穩定滑翔彈道阻尼控制技術
針對自然不穩定彈道(如氣動輔助變軌機動滑翔彈道),進一步引入高度H與平穩滑翔高度 SGH的偏差ΔH 作為反饋項,得到縱向升力系數的反饋其中 kf1, kf2與當前的高度、速度等飛行狀態相關;ξ,ω根據極點配置法確定。當不采用彈道阻尼控制時,由于飛行速度大于第一宇宙速度,在科式力的作用下,飛行器高度迅速上升直至逃逸出大氣層;當采用彈道阻尼控制時,飛行高度將穩定到平穩滑翔高度附近[7],見圖3。

圖3 自然不穩定滑翔彈道阻尼控制結果 Fig.3 Natural-unstable Glide Trajectories with TDCT
利用彈道阻尼控制技術可以實現平穩機動滑翔,進而根據滑翔彈道動力學特性推導空間彈道解析解。研究解析解既可以避免大量的數值積分、實現快速彈道規劃,對于滑翔彈道飛行機理研究也具有重要意義。
1.3.1 忽略地球自轉的彈道解析解
通過對不考慮地球自轉的再入運動模型進行適當的簡化和線化[8],得到了一個以縱向升阻比1/L D和橫向升阻比2/L D為關鍵控制參數的線性時變系統,然后通過基于矩陣譜分解的LTV系統解析法解決了橫程與航向角耦合的問題,獲得了可以預測縱程xD、橫程xC和廣義航向角ψ~的三維空間再入彈道解析解。設E為當前能量,E0為初始能量,eR為地球半徑,μ為引力常數,ki和 f (E0)與L1/D相關, F (E ,E0)與E和L2/D相關。則解析解的簡化形式為

1.3.2 考慮地球自轉的彈道解析解
為了補償地球自轉的影響,將由地球自轉引起的慣性力與氣動力組合為等效氣動力,然后采用等效縱、

式中 XYCS-2= [xD,xC,,t]T,t為飛行時間;k =fk( L1D , L2D ,φ ,ψ ,ωe)為系數矩陣,與當前飛行狀態、升阻比剖面和地球自轉角速度ωe等相關。XYCS-2的詳細表達式可見文獻[9~10]。對于1萬多公里的航程,該解析解的相對位置誤差和飛行時間相對誤差在3%以內。
1.3.3 大橫程機動滑翔彈道解析解
在前期的解析解研究中,往往會忽略部分縱、橫向耦合因素,假設飛行器保持在射面附近飛行。為提高大橫程機動下解析解精度,需要充分考慮縱、橫向運動耦合的影響,通過采用攝動法對非線性降階動力學系統進行分階處理,進而解析求解分階子系統得到高精度的滑翔彈道解析解,表達形式為

圖4中給出了7個不同射向的算例。升力體飛行器以約60°大小的傾側角進行大橫程機動時,最大橫程接近4000 km。與彈道仿真結果相比,而無地球自轉解析解(YCS-1)和考慮地球自轉解析解(YCS-2)的橫程最大相對誤差超過45%,而大橫程機動解析解(YCS-3)的精度大幅提升,橫程相對誤差小于1%。

圖4 大橫程機動解析解精度驗證 Fig.4 Verification of Accuracy of the Analytical Solutions
1.3.4 星際航行返回滑翔再入解析解
以月球返回再入任務為例,飛行器再入速度可接近第二宇宙速度。對于高升阻比飛行器,可以通過在大氣層內的長遠距離滑行來消耗能量,與傳統的二次再入彈道相比,這種再入方式峰值過載更小,更適合載人飛行任務。如圖5所示,這種星際航行返回平穩滑翔再入彈道可分為拉起段和滑翔段,其中滑翔段又可分為3個階段:自然不穩定滑翔、跨模態滑翔、自然穩定滑翔。

圖5 星際航行返回平穩滑翔再入彈道示意 Fig.5 Sketch of the Special Re-entry Flight Scheme
在拉起段,升力將飛行器拉起至合適的高度以平穩切換至滑翔段;在自然不穩定滑翔階段,飛行器以大于第一宇宙速度的速度大小飛行,縱向升力向下以平衡科氏力等作用;在跨模態滑翔階段,飛行器在第一宇宙速度附近飛行,并且會經歷升力方向從向下到向上的飛行模態變化;自然穩定滑翔段為常規的再入平穩滑翔階段。針對上述各個階段,目前均已推導了高精度的彈道解析解[7,10~13]。
高升阻比再入飛行器滑行距離遠,橫向機動能力強,具備禁飛區規避能力。本章主要介紹基于解析解的平穩滑翔在線彈道規劃與制導方法:基于縱程解析解規劃縱向升阻比剖面以滿足能量管理需求,基于橫程解析解規劃傾側反轉點以規避禁飛區和滿足終端橫程約束。利用彈道阻尼控制技術抑制彈道振蕩。
本節介紹一種反轉次數漸增的傾側反轉點解析迭代規劃策略[9]:a)在首次規劃中僅根據終端橫程要求安排兩次反轉;b)逐個檢測所有有效禁飛區約束滿足情況:如果不滿足某一個禁飛區約束,則進入c;如果滿足,則保留原有反轉點;c)基于解析解調整或增加傾側反轉點以規避禁飛區;d)重新規劃后續的反轉點以滿足終端橫程要求。當出現無法全部規避的情況時,優先規避威脅等級較高的禁飛區,并且在每處理完一個禁飛區約束之后就立即考慮終端橫程約束規劃后續的反轉點,這樣有利于防止軌跡為了規避禁飛區而偏離目標太遠,從而導致最終無法抵達目標。
為了檢驗制導律的效果,這里提供2個算例:算例1中,飛行器需要面對16個半徑為200 km的小型禁飛區;算例2中,飛行器需要規避3個半徑為500~800 km不等的大型禁飛區。仿真結果如圖6所示,飛行器成功規避所有禁飛區。

圖6 繞禁飛區仿真結果 Fig.6 Simulation Results of No-fly Zone Avoidance
本節介紹基于時間解析解的多飛行器協同再入彈道規劃與制導方法[10]。由于飛行時間和縱程都與縱向升阻比相關,這里將原本的常值縱向升阻比部分設計為線性縱向升阻比,從而增加一個關鍵剖面參數,并利用縱程解析解和時間解析解規劃縱向升阻比剖面關鍵參數,從而在滿足能量管理要求的同時控制飛行時間。
為展示協同制導律具備應對復雜情況的能力,圖7給出了繞64個隨機分布禁飛區(半徑均為200 km)的協同再入飛行算例。飛行器V1~V3的初始高度為80 km,初始速度為7100 m/s,初始時間誤差為30 s。終端誤差如表1所示,從中可以看出協同再入制導律可以在保證終端精度的前提下很好地實現時間協同。

圖7 繞64個隨機分布禁飛區的再入協同飛行 Fig.7 Simulation Results of Coordinate Flight with 64 No-fly Zones

表1 協同制導終端誤差 Tab.1 Terminal Error for Cooperative Guidance
為充分發揮橫向機動能力,本節介紹一種基于強化學習的智能橫程機動再入協同制導方法[14]。在縱向制導中,仍然采用基于縱程解析解的制導策略,以滿足射程要求。在橫向制導中,基于強化學習,尋找滿足期望的最佳傾側反轉策略,以實現飛行時間協同,其算法結構如圖8所示。

圖8 DQN算法結構 Fig.8 Structure Diagram of DQN Algorithm
在訓練好的智能體的基礎上,開展仿真試驗,結果如圖9所示。將本節的制導算法稱為“解析-智能制導”,2.2節的制導律稱為“純解析制導”。從圖9中可以看出:針對不同再入任務,基于DQN的橫向智能決策器擺脫了原來基于規則的橫向制導邏輯約束,具備自主智能調節反轉策略的能力和良好的任務適應性。通過較少的傾側反轉次數使得末段橫向機動范圍擴大約1000 km,令再入彈道橫向設計具有更多的可能性。

圖9 智能橫程機動協同制導地面軌跡 Fig.9 Ground Tracks for Multi-vehicle Cooperative Attack
與零控脫靶量相比,標控脫靶量是指當飛行器采用任意已知控制律時,導彈和目標最終錯過的距離。在此基礎上,每一項終端約束的偏差均可視為廣義標控脫靶量,可以大幅提升制導律的適應性。
3.1.1 助推段高精度彈道解析解
為快速計算廣義標控脫靶量[15,16],推導助推段高精度彈道解析解。根據泰勒展式,將彈道解析解分解為零控基準解、非零攻角增量解和非零側滑角增量解,再使用攝動法分別求解。解析解的形式可表示為

式中 X =[V ,γ, h,ψ]T;α和αsqu為插值節點處攻角和其平方組成的向量;β和squβ為插值節點處側滑角和其平方組成的向量;1αX~5αX,1βX和 2βX為系數矩陣。
3.1.2 助推段多約束在線彈道規劃方法
在進行標控攻角曲線設計時,需滿足終端彈道傾角和高度約束。考慮如下性能泛函:

利用Gauss積分將性能泛函中的積分項進行離散,使用序列二次規劃,可以求解插值節點處的攻角向量。最后,通過拉格朗日插值得到標稱攻角。
為了滿足終端速度及彈道偏角約束,設計如下標控側滑角曲線:

式中0β,m為待優化參數,可利用牛頓迭代法求解。
3.1.3 助推段多約束在線最優制導律
當飛行中存在擾動時,為了提升終端精度,還需設計助推段在線最優制導律。第1級程序轉彎段可使用文獻[17]中的方案。在制導段中,根據最優控制理論,可以推導得到最優制導律形式為

式中 Δ hf, Δγf, ΔVf, Δψf為廣義標控脫靶量;Nh, Nγ,VN,Nψ為制導系數。
為了驗證所提出的助推段制導律的效果,設終端彈道傾角為0°,終端高度可變,仿真結果如圖10所示。當使用不同終端高度約束時,所得彈道簇與鵝頭較為類似(見圖10a),因此稱之為鵝頭彈道。

圖10 助推段制導律仿真結果 Fig.10 Simulation Results of Guidance Law in Boost Phase

續圖10
偽譜法因其不需要推導復雜的協態方程、對初值不敏感、具有指數收斂性質等優點,被廣泛應用于最優控制問題的求解中。但偽譜法還存在收斂速率無理論證明、計算量大無法在線應用等難題。本節將介紹偽譜法收斂速率的理論證明方法和線性偽譜廣義標控脫靶量制導方法,解決了上述難題。
3.2.1 偽譜法收斂性國際公開問題證明
自2006年起,Hager教授[18]開始對偽譜法收斂性證明問題進行研究,并將問題歸結為狀態、控制、協態和其最優解之差的范數需滿足下式:
教師可結合上述問題與實際教學情況向學生提出:“三角形與直角坐標系具有哪些特殊的性質與特征?”等問題。其中教師的主要活動為結合實際問題提出科學的疑問,并讓中等生對相應的問題進行解答。學生對問題進行回答期間若不完整,教師則應進行相應的補充與說明。其主要目的是讓學生利用對以往數學知識的復習,使學生在解答這一函數動點問題期間可更好地想起以往學習的數學知識,并為其解題創造良好的條件。

進一步可歸結為四類微分矩陣存在最大范數邊界,由于證明難度太大,Hager教授于2015年將其作為數學公開問題發布。文獻[18]中,通過推導歐式范數的解析表達式給出了Gauss配點和Radau配點下矩陣范數邊界值的嚴格證明,攻克了這一國際計算數學公開問題,使該長達13年懸而未結的問題得到最終解決。
3.2.2 基于線性偽譜法滑翔段廣義標控脫靶量在線最
優制導律
在本節中,將介紹線性偽譜模型預測控制方法(Linear Pseudospectral Model Predictive Control, LPMPC)[19,20]。其主要由4部分組成,分別是積分預測、擬線性化、線性偽譜求解和控制解析修正,流程如圖11所示。該制導律的效果如圖12所示。

圖11 線性偽譜制導律流程 Fig.11 Flowchart of LPMPC

圖12 線性偽譜制導律仿真結果 Fig.12 Simulation Results of LPMPC
為了檢驗該制導方法規避禁飛區的效果,開展如圖13所示的仿真試驗。10個升力體飛行器從不同的起點攻擊3個目標,滑翔段中存在24個禁飛區約束。從圖13中可以看出,10個飛行器均能規避全部禁飛區。

圖13 繞多禁飛區線性偽譜制導律仿真結果 Fig.13 Simulation Results of LPMPC with Mutiple No-fly Zones
對于末段彈道而言,無法通過繞飛規避敵末段攔截系統。常用的反攔截機動設計方法有2種:選擇合適的方向側向繞飛;通過最優機動反攔截。
該方法是將空間彈道分解為縱平面彈道和水平面彈道,分別使用幾何曲線獨立設計得到的。當使用不同終端速度約束時,所得彈道簇與蝴蝶較為類似(見圖14),因此稱之為蝴蝶彈道。為了驗證此類彈道的反攔截能力,使用PAC-3型攔截彈進行攔截仿真,攔截概率如表2所示。從表2中可以看出當落點偏角為-90°時,攔截概率可以縮小到0.1%。但受限于幾何彈道的特點,當落點傾角確定后,落點偏角和落速相互耦合,無法獨立調節。

圖14 用于攔截仿真的蝴蝶彈道 Fig.14 Butterfly Trajectories for Intercept Simulation

續圖14

表2 蝴蝶彈道對抗PAC-3攔截概率表 Tab.2 Penetration Probabilities of Butterfly Trajectories Against PAC-3
4.1.2 同時滿足落角和落速約束的末段制導律
為了同時滿足落角和落速約束,我們將制導律的形式分解為兩部分[21],即:acmd= aTSG+aspeed。其中,aTSG是彈道整形制導律生成的制導指令,其可以導引飛行器從預定方向命中目標,speeda是終點速度控制方案生成的機動指令,其控制飛行器做適當的橫向機動,以調節終點速度大小。
為了導引飛行器從期望方向命中目標,這里采用文獻[22]提出的彈道整形制導律,如式(9)所示:

式中 C1,C2為制導律系數,其余各變量的定義可見文獻[22]。使用譜分解方法可以求得加速度指令的廣義解析公式,并據此可得制導律系數穩定域,如圖15所示,可以保證終端指令收斂到0。

圖15 彈道整形制導律系數穩定域 Fig.15 The Stability Domain of the Guidance Coefficients
終點速度控制方案產生加速度指令speeda方向在當地水平面內并垂直于包含速度矢量的縱平面,形式為

式中 kvf>0,用于控制飛行器橫向機動幅度,從而調 節終點速度,可由割線法求解;0ψ為初始航向角為初始視線方位角。
為驗證制導律的效果,給出了與傳統彈道整形制導律對比的仿真結果,如圖16所示,可以看出,所提出的制導律對終端速度和終端攻角的控制效果更好。

圖16 彈道整形制導律仿真結果 Fig.16 Simulation Results of Trajectory-shaping Guidance
4.2.1 多對象、多段、多約束反攔截彈道優化
為了反映較為復雜的攻防對抗場景,同時考慮進攻彈、攔截彈、打擊目標3個對象,將攻防對抗時序分為彈目交戰、攔截彈指令飽和、對地攻擊等3個不同階段,考慮熱流、過載、動壓、攔截彈動力學等約束,建立多對象、多段、多約束最優控制問題[23]。綜合考慮反攔截性能、精確打擊性能、控制平滑性能設計性能泛函,使用Radau偽譜法求解該最優控制問題,即可得到最優反攔截彈道。
為了驗證最優機動彈道的優越性,與垂直S機動彈道進行對比,兩種機動的控制曲線如圖17所示。最優機動的攔截彈脫靶量為234.6 m,垂直S機動的攔截彈脫靶量為119.7 m,可見最優機動的反攔截效果更好。

圖17 數值最優機動和程序機動對比 Fig.17 Comparison between Numberical Optimal Maneuver and Program Maneuver
4.2.2 基于脫靶量級數解的最優機動反攔截策略
由于Radau偽譜法計算量較大,不適合在線應用。利用伴隨法,經過推導可得當目標階躍機動時,使用比例導引律的攔截彈的脫靶量解析解為[24,25]

式中 k為衰減常數;n為需計算的項數;dn為系數。
最優機動的目的是使攔截彈脫靶量最大,因此最 優 反 攔截控制律可表 示為其中,tgo為剩余飛行時間。
為驗證所提出最優制導律的性能,開展如圖18所示的攻防對抗仿真。從圖18中可以看出最優機動的反攔截效果明顯。而當使用階躍機動或蛇形機動等機動時,無法保證反攔截可靠性。

圖18 基于脫靶量級數解的最優機動結果 Fig.18 Optimal Maneuver based on Power Series Solution of Miss Distance
綜上:a)階躍機動只有在彈目相對距離較短時可以產生與最優機動相同的效果,但機動時機的選擇是關鍵。b)以蛇形機動、方波機動為代表的等周期機動在交戰時間較長時,被攔截的機會也較多。c)數值最優機動和基于脫靶量級數解的最優機動都展現了最優機動是非等周期機動,只要制導時間足夠長,最優機動的脫靶量可達階躍機動數倍,但脫靶量解析解和機動變號時機是關鍵。
本文針對升力體飛行器彈道規劃和制導中遇到的難題,總結了研究團隊近年來提出的相關重要成果。在本文的基礎上,為進一步提升反攔截效能,今后將深入開展體系對抗環境下的升力體飛行器作戰運用方法研究。