雷虎民, 周 覲, 翟岱亮, 張大元, 王華吉, 李寧波
(1. 空軍工程大學防空反導學院, 陜西 西安 710051;2. 中國人民解放軍95948部隊, 甘肅 酒泉 732750)
?
基于二階變分的中制導最優彈道修正
雷虎民1, 周 覲1, 翟岱亮1, 張大元2, 王華吉1, 李寧波1
(1. 空軍工程大學防空反導學院, 陜西 西安 710051;2. 中國人民解放軍95948部隊, 甘肅 酒泉 732750)
針對反臨近空間高超聲速目標攔截作戰過程中的中制導彈道的規劃與修正問題,設計了一種最優彈道修正算法。首先分析了在中制導階段進行彈道規劃與彈道修正的必要性,基于龐特里亞金最小值原理給出了基準最優彈道滿足的一階必要性條件,其次將一階必要性條件進行二階變分,得到控制量的修正量,利用基準彈道數據,通過逆向積分,將協態變量的偏差量表示為終端約束修正量以及狀態變量偏差量的表達式,從而有效解決了協態變量偏差量的獲取問題,最后進行了多種情形下的數字仿真,對所提算法進行驗證并與高斯偽譜法(Gauss pseudospectral method, GPM)進行對比。結果表明,該方法不僅具有較高的求解精度,并且其求解效率遠高于GPM,有利于彈上在線實現。
中制導; 彈道修正; 二階變分; 最優控制
近年來,臨近空間高超聲速飛行器的飛速發展對我國戰略防御以及國土防空構成了嚴峻威脅,研究反臨近空間高超聲速目標的先進制導控制技術迫在眉睫。反臨近空間高超聲速目標作戰的難點主要體現在以下兩個方面:①臨近空間高超聲速目標飛行速度一般超過馬赫數5,可攔截窗口小,這就要求攔截彈具備較高的飛行速度。另外,攔截彈從地面發射到臨近空間進行作戰,飛行空域變化較大,這些都對攔截彈的方案彈道提出了多種約束條件。傳統的導引規律,如比例導引等已經很難適用,必須根據相關優化理論對攔截彈道進行離線設計,以滿足各種約束條件。②臨近空間高超聲速目標具有較高的機動能力,攔截彈發射前的遠距離探測對于其飛行軌跡難以進行精確的跟蹤與預測,必須借助攔截彈的彈上設備進行抵近探測,對其軌跡進行不間斷的跟蹤、校正與預測,對預測命中點等信息進行調整更新。而攔截彈與目標較大的相對速度造成攔截過程非常短暫,末制導階段更是轉瞬即逝,這就要求攔截彈在中制導階段必須具備一定的在線彈道修正與規劃能力。
目前有關中制導彈道規劃與修正的研究文獻并不是很多,文獻[1]借鑒比例導引方法的思想研究了一種廣義最優中制導方法,將中制導末端速度以及預測命中點位置作為約束條件,分別設計了時變的速度誤差項系數以及位置誤差項系數,但對于過程約束并沒有深入考慮。文獻[2]應用粒子群優化方法,基于地形/威脅模型研究了無人機的航路規劃問題。文獻[3-4]首先將彈目運動模型進行線性化,借鑒彈道成型制導思想設計了最優制導律,然后考慮實際的非線性彈目運動模型,增加了攔截彈的末端角度約束,應用龐特里亞金最小值原理推導了最優彈道模型,應用高斯偽譜法解算出最優彈道。文獻[5]以導引頭視角為約束條件,研究了帶有角度約束的中制導律,憑借一定的導引頭視角閾值,將攔截彈彈道分為中制導以及末制導過程,仿真結果驗證了其方法的有效性。文獻[6]采用遺傳算法對中制導彈道規劃進行了求解。文獻[7]針對粒子群優化方法收斂速度慢,序列二次規劃方法對初值敏感并且容易陷入局部最優的缺點,將兩種優化方法進行了整合,首先采用粒子群優化方法對最優化問題進行求解,當最優解收斂到一定閾值或迭代超過特定次數后,采用序列二次規劃方法,將粒子群優化結果作為其初值,繼續求解得到全局最優解。仿真結果表明,所設計的方法具有很好的魯棒性及時效性。文獻[8-9]采用模型靜態預測規劃的方法對中制導彈道規劃問題進行了研究,模型靜態預測規劃基于離散化以后的系統狀態方程,將最優彈道基礎上產生的擾動量作為誤差項,在最優彈道附近進行泰勒級數展開,通過迭代求解一次性得到最優控制量的補償項,算法具有高效性及快速性的特點,雖然文章主要針對中制導彈道規劃問題求解,但對于彈道修正方法同樣具有一定的借鑒意義。文獻[10]應用變時域鄰域最優控制理論研究了月球飛行器的軌道修正問題。首先應用龐特里亞金最小值原理,將離線解算得到最優軌道相關矩陣存儲在彈載計算機中,當終端約束條件發生變化時,將變化量作為擾動值代入到最優解的哈密爾頓方程以及狀態方程中,假設Clebsch-Legendre條件成立,則可以一步求解,得到原最優控制基礎上需要補償的控制量,仿真結果驗證了其所提算法的有效性。然而其應用對象為剩余時間變化的情況,對于反臨近空間高超聲速目標作戰情形中,目標在固定的探測頻率下的預測軌跡變化導致的攔截彈終端位置修正以及姿態修正問題并不能很好的適用。
以上研究大部分側重于對于彈道的重新規劃,針對由當前時刻的彈道狀態、終端期望狀態以及攔截彈狀態方程構成的彈道優化問題,應用優化算法再次大范圍尋優求解,完全舍棄了原有基準彈道的數據。事實上,當調整后的終端期望狀態與原來的期望狀態變化不大的情況下,可以利用原有的基準最優數據快速生成一條滿足終端約束的優化軌跡[10],本文以此為出發點,通過對基準彈道的一階最優性條件進行二階變分,設計出了一種新的中制導最優彈道修正算法。
1.1 攔截彈運動模型
為研究方便并不失一般性,考慮如下縱向平面內的攔截彈質點運動模型[11]:
(1)
(2)

(3)

(4)
式中,V表示攔截彈速度;P表示作用在攔截彈上的推力。設定為在開始的20.3 s內為常值92.794 kN,燃料燃燒速度為34.796 2 kg/s[12],之后發動機關機,推力保持為零。q表示動壓;S表示參考面積;g表示重力加速度;θ為彈道傾角;m為攔截彈質量;x,y分別為導彈在大地慣性坐標系下的位置;Cx,Cy分別為阻力系數以及升力系數,可以分別表示為馬赫數Ma和攻角α的函數:
(5)
(6)

1.2 彈道優化模型
以t0表示初始時刻,終端時刻tf設定為攔截彈和目標的預測交會時刻,為保證攔截彈的直接碰撞殺傷效果,一般以終端時刻的速度最大作為優化指標J,即
J=φ(V(tf),tf)=-Vf
(7)
終端時刻的預測命中點坐標表示為(xf,yf),同時為了在交接班時刻攔截彈能夠達到合適的姿態,使得導引頭成功探測捕獲目標,設定終端時刻的彈道傾角目標值為θf。那么終端約束條件可以表示為

(8)
式中,0表示具有相應維度的全零矩陣。
在臨近空間高速飛行的攔截彈將經歷一系列惡劣的環境條件[13],與傳統在大氣層內飛行的攔截彈相比,其對于彈道的約束更加苛刻,需要考慮各種復雜約束條件,為了保證彈道的穩定性以及可實現性,對控制量進行如下約束:
‖α‖≤αmax
(9)
式中,αmax為最大攻角。
中制導的彈道優化模型可以表述為,尋找一系列容許控制量u=α,使之滿足系統動態方程式(1)~式(4),終端約束式(8),以及過程約束式(9),同時使得指標函數式(7)達到最優。

(10)

然后將終端約束條件引入最優性指標中得到增廣的優化指標J′:

(11)

(12)
(13)
(14)
(15)

(16)

間接法雖然具有較高的求解精度,但是其收斂域比較小,推導最優解的過程較為復雜和繁瑣,并且協態變量的初值設置難以準確估計,這些都限制了其在最優控制問題求解中的應用。
直接法通過把狀態變量離散化,將連續的最優控制問題轉換成為離散的非線性規劃問題,然后通過非線性規劃求解算法得到最優解,與間接法相比,直接法的收斂域更加寬廣,近年來興起的高斯偽譜法(Gausspseudospectralmethod,GPM)就屬于直接法中的一種。已證明[15]應用GPM得到的最優解滿足一階最優性條件式(12)~式(16),并且對于協態變量也能夠精確獲得,從而確保了其求解的精度。本文中利用GPM方法求解得到基準最優彈道數據,以上標*進行表示。

首先,對式(12)~式(16)進行二階變分,可以得到:
(17)
(18)
(19)
(20)
(21)
如果?2H/?u2在整個飛行過程中非奇異,那么根據式(19)可以得到控制量的修正量δu的表達式為
(22)
從式(22)中可以看出,只要知道系統狀態量的偏差δX和協態量的偏差δλ,根據基準最優彈道數據,就可以確定控制量的修正量δu,使之滿足最優性條件。但是在實際工程應用過程中,狀態量的偏差δX可以通過安裝在攔截彈上的傳感器或地面探測設備解算得到,而對于協態量的偏差δλ,并沒有有效的方法進行測量或估計,所以必須對其進行進一步的推導,表示成為可以得到的狀態量。
將式(22)代入到式(17)和式(18)中,狀態量偏差δX和協態量偏差δλ的動態方程可以表示為

(23)
(24)
式中
(25)
(26)
(27)

δλ(t)=S(t)δX(t)+R(t)dν
(28)

(29)


(30)
(31)
將式(28)代入到式(23)中可以得到

(32)
將式(32)代入到式(30),與式(24)連立,可以得到變量S(t)和R(t)需要滿足動態方程為
(33)
(34)
同理,將式(32)代入到式(31)中,可以得到變量Q(t)需要滿足動態方程
(35)
將式(28),式(29)和式(20),式(21)進行比較可以得到變量S(t),R(t)和Q(t)的終端約束條件
(36)
(37)
Q(tf)=0
(38)
根據變量S(t),R(t)和Q(t)的終端約束條件式(36)~式(38)以及動態方程式(33)~式(35),對其進行逆向積分一直到初始時刻t0,根據式(29)可以解算得到dν的表達式為

(39)
將式(39)代入到式(28)中,可以得到初始時刻的協態量偏差δλ(t0):

(40)

將式(40)得到的協態量的偏差δλ(t0)作為初值,利用式(24)進行前向積分,就可以得到此后時刻的協態量偏差δλ,進而通過式(22)就可以得到任意時刻的控制量的修正量δu。
中制導最優彈道修正算法框圖如圖1所示,其運算步驟如下:
步驟 1 根據當前目標信息設定終端狀態約束,根據GPM方法求解彈道優化問題,得到基準最優彈道數據,儲存在彈載存儲設備中;
步驟 2 對于目標狀態進行不間斷更新、預測,對預測命中點等信息進行修正,如果彈道終端約束狀態發生較大變化,則轉入步驟3,否則在此步驟進行循環;


圖1 中制導最優彈道修正算法框圖Fig.1 Block of the optimal midcourse trajectory modification
為驗證本文提出的中制導最優彈道修正算法的有效性,開展以下2種情形下的數字仿真。仿真中的基準彈道通過GPM Matlab程序包GPOPS計算得到,中制導彈道的初始和終端約束如表1所示。

表1 中制導彈道的初始和終端約束
情形 1 此情形下的攔截想定為,在發動機工作階段,攔截彈按照基準彈道飛行,發動機關機后無動力飛行階段,對終端預測命中點進行修正,保持終端橫坐標不變,高度提高2 km,即預測命中點修正為(88 000 m,37 000 m),終端彈道傾角約束θf為3°保持不變,將彈道修正算法得到的仿真結果與GPM得到的結果進行對比,如圖2~圖5所示。

圖2 情形1中的修正彈道Fig.2 Curves of the modified trajectory in scenario one

圖3 情形1中的速度曲線Fig.3 Curves of the velocity in scenario one
從圖2中可以看到,由本文提出的最優彈道修正算法得到的彈道以及由GPM得到的彈道都能夠很好地滿足改變以后的終端約束條件,并且兩種方法得到的彈道非常相近,約有80%以上部分發生重疊,在證明有效性的同時證明了本文方法的最優性。從圖3中可以看到,調整以后的速度曲線與基準的速度曲線能夠很好的重合,并未發生很大的變化,從而證明了最優彈道修正算法能夠在滿足終端約束的條件下確保優化指標保持一定的最優性。圖4給出了彈道傾角的變化曲線,由于對終端的彈道傾角約束未做改變,最優彈道修正算法能夠有效控制其收斂到原來的約束值。從圖5中的控制量比較可以發現,最優彈道修正算法得到的修正量整體比較平滑,易于彈上的實現。表2給出了本文方法和GPM消耗時間的對比,從中可以看出,本文方法的計算效率是GPM方法的43倍,能夠快速準確得到最優修正彈道,主要原因是,本文方法能夠根據已有的基準彈道數據進行計算,而不需要如GPM一樣舍棄原有的基準彈道數據,再次進行大范圍的參數尋優,從而有效節約了時間,有利于彈道的實時計算更新。

圖4 情形1中的彈道傾角曲線Fig.4 Curves of the flight path angle in scenario one

圖5 情形1中的控制量曲線Fig.5 Curves of the control commands in scenario one

方法消耗時間/s本文方法0.04高斯偽譜法1.73


圖6 情形2中的修正彈道Fig.6 Curves of the modified trajectory in scenario two

圖7 情形2中的速度曲線Fig.7 Curves of the velocity in scenario two
從圖6中可以看出,最優彈道修正算法得到的修正彈道總體比較平滑,滿足了調整以后的終端狀態約束,具有較高的求解精度。從圖7中可以看出,調整以后的速度曲線基本保持了基準彈道的最優性指標,圖8給出了彈道傾角變化曲線終端的彈道傾角達到4°,與約束值θf相差1°,基本能夠滿足指標要求。從圖9給出的控制量曲線可以看出,控制指令基本比較平穩,只有在第二次修正時刻出現了比較大的跳變,總體上能夠滿足彈上實現的需求。

圖8 情形2中的彈道傾角曲線Fig.8 Curves of the flight path angle in scenario two

圖9 情形2中的控制量曲線Fig.9 Curves of the control commands in scenario two
本文通過對基準最優彈道的一階最優性條件進行二階變分,推導得到了一種最優彈道修正算法。針對反臨近空間高超聲速目標攔截作戰過程中終端約束條件發生變化的情況下,該方法能夠利用基準最優彈道數據解算得到最優的修正彈道,所得結果不僅具有較高的精確性,而且避免了傳統優化方法的大范圍再次尋優求解,有效節省時間,利于彈上的在線實現。
[1] Morgan R W, Noseck A P. Generalized optimal midcourse guidance[C]∥Proc.ofthe53rdIEEEConferenceonDecisionandControl, 2014: 260-264.
[2] Kamyar B, Taheri E. Aircraft optimal terrain/threat-based trajectory planning and control[J].JournalofGuidance,Control,andDynamics, 2014,37(2):466-483.
[3] Indig N, Ben-Asher J Z, Farber N. Near optimal spatial midcourse guidance law with an angular constraint[J].JournalofGuidance,Control,andDynamics, 2014,37(1):214-223.
[4] Indig N, Ben-Asher J Z, Sigal E. Near-optimal minimum time guidance under a spatial angular constraint in atmospheric flight[C]∥Proc.oftheAIAAGuidance,Navigation,andControlConference, 2015:1-29.
[5] Erer K, Tekin R, Ozgoren M K. Look angle constrained impact angle control based on proportional navigation[C]∥Proc.oftheAIAAGuidanceNavigationandControlConference, 2015:1-11.
[6] Cribbs H B. Genetics-based trajectory discovery for tactical missiles[C]∥Proc.oftheAIAA1stIntelligentSystemsTechnicalConference, 2004:1-6.
[7] Wang F B, Dong C H. Fast intercept trajectory optimization for multi-stage air defense missile using hybrid algorithm[J].ProcediaEngineering, 2013, 67: 447-456.
[8] Dwivedi P N, Bhattacharya A, Padhi R. Suboptimal midcourse guidance on interceptors for high-speed targets with alignment angle constraint[J].JournalofGuidance,Control,andDynamics, 2011,34(3):860-877.
[9] Halbe O, Raja R G, Padhi R. Robust reentry guidance of a reusable launch vehicle using model predictive static programming[J].JournalofGuidance,Control,andDynamics, 2014,37(1):134-148.
[10] Pontani M, Cecchetti G, Teofilatto P. Variable-time-domain neighboring optimal guidance applied to space trajectories[J].ActaAstronautica, 2015,115:102-120.
[11] Zhang D Y, Lei H M, Wu L, et al. A trajectory tracking guidance law based on the sliding mode variable structure control[J].SystemsEngineeringandElectronics, 2014, 36(4):721-727.(張大元,雷虎民,吳玲,等. 基于滑模變結構的彈道跟蹤制導律設計[J].系統工程與電子技術, 2014,36(4):721-727.)
[12] Muzumdar D V. Guidance laws for a short-range attack missile[D]. Austin: University of Texas,1995.
[13] Zhang D Y, Lei H M, Shao L, et al. Interceptor trajectory programming for near space hypersonic target[J].JournalofNationalUniversityofDefenseTechnology, 2015,37(3):91-96.(張大元,雷虎民,邵雷,等. 臨近空間高超聲速目標攔截彈彈道規劃[J].國防科技大學學報,2015, 37(3):91-96.)
[14] Yang X X, Yang H X, Wang P. Overview of pseudo-spectral method and its application in trajectory optimum design for flight vehicles[J].JournalofNationalUniversityofDefenseTechnology, 2015,37(4):1-8.(楊希祥,楊慧欣,王鵬.偽譜法及其在飛行器軌跡優化設計領域的應用綜述[J].國防科技大學學報,2015, 37(4):1-8.)
[15] Benson D A, Huntington G T, Thorvaldsen T P, et al, Direct trajectory optimization and costate estimation via an orthogonal collocation method[J].JournalofGuidance,Control,andDynamics, 2006, 29(6):1435-1440.
Midcourse guidance optimal trajectory modification using the second variation
LEI Hu-min1, ZHOU Jin1, ZHAI Dai-liang1, ZHANG Da-yuan2, WANG Hua-ji1, LI Ning-bo1
(1.AirandMissileDefenseCollege,AirForceEngineeringUniversity,Xi’an710051,China;2.Unit95948ofThePLA,Jiuquan732750,China)
Aiming at the problem of the midcourse trajectory generation and modification in the interception against hypersonic targets in near space, a novel optimal trajectory modification algorithm is designed. Firstly, the demand for trajectory generation and trajectory modification in the midcourse phase is analyzed. The first order necessary conditions for the nominal optimal trajectory are given based on the Pontryagin minimization theory. Secondly, the first order necessary conditions are further differentiated to second variation to acquire the control modifications. The difficulty of the co-states deviations acquisition is solved by reversely integrating using the nominal trajectory information to get the expression with the terminal constraints modifications and the current states derivations. Finally, digital simulations under different scenarios are carried out to testify the effectiveness of the proposed algorithm and the results are compared with those given by the Gauss pseudospectral method (GPM). Simulations results show that the algorithm has the merits of high precision and efficiency than the GPM, which is preferable for the online realization.
midcourse guidance; trajectory modification; second variation; optimal control
2016-04-13;
2016-10-19;網絡優先出版日期:2016-10-27。
國家自然科學基金(61573374, 61503408);航空科學基金(20150196006)資助課題
TJ 765
A
10.3969/j.issn.1001-506X.2016.12.19
雷虎民(1960-),男,教授,博士后,主要研究方向為飛行器制導與控制技術。
E-mail:hmleinet@21cn.com
周 覲(1989-),男,博士研究生,主要研究方向為空天攔截器導航、制導與控制。
E-mail:zhoujindr@yahoo.com
翟岱亮(1987-),男,博士研究生,主要研究方向為空天攔截器導航、制導與控制。
E-mail:quietzdl@126.com
張大元(1986-),男,博士,主要研究方向為空天攔截器導航、制導與控制。
E-mail:dayuanyjs@163.com
王華吉(1989-),男,博士研究生,主要研究方向為空天攔截器導航、制導與控制。
E-mail:whj20081744@163.com
李寧波(1992-),男,碩士研究生,主要研究方向為空天攔截器導航、制導與控制。
E-mail:904116103@qq.com
網絡優先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20161027.1557.010.html