李爽,江涌,李君龍,張奕群
(1.北京電子工程總體研究所,北京 100854; 2.中國航天科工集團(tuán) 防御技術(shù)研究院,北京 100854)
大氣層內(nèi)目標(biāo)攔截彈末制導(dǎo)側(cè)窗探測技術(shù)的采用對中末制導(dǎo)交班提出特殊要求。除此之外,中制導(dǎo)過程還要受到氣動熱、過載、動壓、迎角等對狀態(tài)和輸入的約束。針對中末制導(dǎo)交班約束,文獻(xiàn)[1-2]分別研究了基于虛擬目標(biāo)的LQR(linear quadratic regulator)中制導(dǎo)律和虛擬目標(biāo)的位置參數(shù)設(shè)置方法。攔截彈在該導(dǎo)引律作用下可以在中制導(dǎo)末端滿足側(cè)窗視場和交班高度等要求,為中末制導(dǎo)交班提供良好的條件。但是,LQR不能處理控制和狀態(tài)約束,并且在處理環(huán)境的多變性方面缺少預(yù)見性。
模型預(yù)測控制(model predictive control,MPC)憑借其特有的滾動時域優(yōu)化和多步預(yù)測措施,在保證系統(tǒng)的魯棒性和穩(wěn)定方面顯示著巨大的優(yōu)越性[3]。尤其是其顯式處理狀態(tài)和輸入約束的功能使其在有約束系統(tǒng)領(lǐng)域受到推崇,目前已經(jīng)應(yīng)用到航天飛機(jī)、衛(wèi)星姿態(tài)控制等領(lǐng)域[4]。文獻(xiàn)[5-7]提出了適用于各類采用慣性彈道與非慣性彈道的再入飛行器的預(yù)測制導(dǎo)律的設(shè)計方法,但此類方法只針對確定目標(biāo),主要用于再入階段的系統(tǒng)不確定性。文獻(xiàn)[8]通過迭代優(yōu)化,不斷修正控制模型參數(shù),保證飛行器順利進(jìn)入末制導(dǎo)。然而,MPC的滾動優(yōu)化所要求的繁重的計算量阻礙其在快速取樣系統(tǒng)中的推廣。針對此問題,文獻(xiàn)[9]提出牛頓-辛普森模型預(yù)測控制(Newton-Raphson MPC,NRMPC),通過將部分在線計算轉(zhuǎn)嫁到離線過程,大大降低了在線計算量。文獻(xiàn)[10-12]又對NRMPC進(jìn)行了改進(jìn),使MPC在快速取樣系統(tǒng)中的廣泛應(yīng)用成為可能。
基于上述研究成果,本文先設(shè)計出針對虛擬目標(biāo)的常系數(shù)次最優(yōu)制導(dǎo)律,再通過對控制信號引入有限維擾動,建立雙模閉環(huán)反饋控制系統(tǒng),再通過模型擴(kuò)展和在線優(yōu)化問題幾何意義的分析,引入牛頓-辛普森算法完成在線計算,以提高計算效率。
針對大氣層內(nèi)目標(biāo)攔截彈的側(cè)窗探測對中末制導(dǎo)交班的特殊要求,文獻(xiàn)[1-2]提出一種虛擬目標(biāo)的設(shè)置方法,如圖1所示,虛擬目標(biāo)T′相對于實際目標(biāo)T靜止,攔截彈以虛擬目標(biāo)位置和速度所決定的終端彈道角σh和終端視線角qh與T′交會時,實際目標(biāo)正好落在攔截彈導(dǎo)引頭的給定視場位置,且相對于實際目標(biāo)的瞬時脫靶量為0。這一交會過程構(gòu)成中制導(dǎo)過程,其彈道可以很好地滿足中末制導(dǎo)交班的特殊要求。

圖1 攔截彈與虛實目標(biāo)位置示意圖Fig.1 Sketch map of interceptor,virtual and actual targets position
由圖1得攔截彈與虛擬目標(biāo)的相對運動方程
(1)
(2)
η=σ-q,
(3)
ηT′=π-σT′-q.
(4)


(5)
式中:

x1(th)=0,x2(th)=0,th為交點時間。
假設(shè)攔截彈在中制導(dǎo)過程中的熱約束、過載和動壓等約束適當(dāng)處理后,可以簡化成下面的一般形式
Hx≤h.
(6)
為了保證閉環(huán)攔截系統(tǒng)的穩(wěn)定性和自適應(yīng)性,應(yīng)該采用時變反饋控制律制導(dǎo)。又由于系統(tǒng)存在嚴(yán)格的控制和狀態(tài)約束,因此采用能顯式處理多變量約束的模型預(yù)測控制方法。若直接對非線性系統(tǒng)(5)提出預(yù)測控制,在線計算量太大,難以在快速取樣系統(tǒng)中實現(xiàn)。為了保證系統(tǒng)的可行性和穩(wěn)定性,并減小在線計算量,這里提出雙模預(yù)測中制導(dǎo)律,整個控制策略如圖2所示[9]。

圖2 雙模預(yù)測控制模型Fig.2 Model of dual mode predictive control
反饋控制系統(tǒng)的前N步構(gòu)成模1,采用約束條件下的優(yōu)化自由控制律,通過這N步的控制,使N+1時刻的狀態(tài)進(jìn)入x的集合εx內(nèi);N步之后構(gòu)成模2,采用常系數(shù)反饋控制,即
模1u=Kxk+c,Hx≤h,k=1,2,…,N,
(7)
模2u=Kxk,xk∈εx,k=1,2,…,N.
(8)
這里的εx定義為模2中的常系數(shù)反饋控制律下的可行不變集,即εx內(nèi)的所有狀態(tài)均滿足約束(可行性),且只要k時刻xk∈εx,則xk+1∈εx成立(不變性)。反饋控制律擬采用下面的次最優(yōu)制導(dǎo)律。

式中:p=v/vt。

式(5)中的參數(shù)矩陣變?yōu)?/p>
取二次性能指標(biāo)函數(shù)
(9)

應(yīng)用最優(yōu)控制理論,可得系統(tǒng)的最優(yōu)制導(dǎo)律
u=-R-1BTPx.
(10)
解Riccati方程
P(t)B(t)R-1BT(t)P(t)-Q(t),
(11)
P(t)的終端條件P(tf)=C。
式(11)可以分解為下面2個方程
(12)
(13)
W(t)和Y(t)的終端條件為
W(tf)=I,
Y(tf)=C.
Riccati矩陣微分方程的解為
P(t)=Y(t)W-1(t).
(14)
u=k1x1+k2x2,
(15)
式中:k1和k2的值隨c1和c2的取值而不同。
根據(jù)對制導(dǎo)過程中可用過載和導(dǎo)引頭視線偏差角的要求,一般情況下,k1可取值0.05~0.2,k2可取值2~6,k1的值越大,交接段導(dǎo)引頭視線偏差角越小,但是如果k1過大,則會增大中制導(dǎo)末端的預(yù)測脫靶量。k2的取值規(guī)律及作用類似于比例導(dǎo)引。

xk+1=Adxk+Bduk,
Ad=TA+I,Bd=TB,
uk=Kxk,
(16)
式中:T為采樣時間。
終端狀態(tài)約束xtf為0的情況下,式(9)中的指標(biāo)函數(shù)簡化為
(17)
式中:xk+i,uk+i表示預(yù)測狀態(tài)和輸入向量。
為了保證過程約束得到滿足,如圖2所示,在次優(yōu)化狀態(tài)反饋控制信號上引入擾動項ck+i|k,i=1,…,N,于是雙模預(yù)測控制律可以表述為
(18)
相應(yīng)的閉環(huán)系統(tǒng)
xk+1=Φdxk+Bdck|k,
(19)
式中:Φd=Ad+BdK。
式(19)又可以擴(kuò)展成自治狀態(tài)空間模型
(20)
式中:m表示Bd的行數(shù);E表示Nm×Nm維的單位矩陣的前m行。若存在關(guān)于z的可行不變集Ez,定義如下
(21)
則由Schur補(bǔ)定理知,Qz滿足下面2個約束:
(1) 不變性

(22)
(2) 可行性

(23)
i=1,…,p,

(24)

(25)

min lg det(SQzST)-1,
s.t. (22),(23).
(26)
只要N足夠大,就可以得到滿足式(22),(23)的Qz,于是, 只要f滿足z∈Ez,預(yù)測軌跡的可行性和不變性便得到滿足。
K和Qz確定之后,在整個導(dǎo)引過程中不再改變,因此其計算過程可以離線執(zhí)行。擾動項ck+i|k專門用來保證預(yù)測軌跡的可行性和不變性。K確定之后,在線優(yōu)化過程中的目標(biāo)函數(shù)(17)可以簡化為
J(f)=fTf.
(27)
于是可得下面的導(dǎo)引控制步驟:

在線計算:在每個采樣時刻執(zhí)行優(yōu)化
(28)
通過式(18)執(zhí)行f的第1個元素ck|k,下一時刻重新優(yōu)化f。
在每個采樣時刻,x已知的情況下,式(28)定義了一個關(guān)于f的橢球面,記為εf。上述優(yōu)化問題的解若存在,從幾何意義上說應(yīng)當(dāng)是從原點到橢球面εf的最短距離向量,記為f*,則f*既與εf相交,又與εf在相交點處的切面垂直,即f*既滿足式(28),又滿足
f=λ(Q22f+Q21x).
(29)
合并式(29)中關(guān)于f的項,得
f=λΓQ21x,Γ=(I-λQ22)-1.
(30)
代入式(28)得關(guān)于λ的方程

(31)
λ是τ(λ)的唯一負(fù)實根(另一實根為正,對應(yīng)的f具有從原點到εf的最遠(yuǎn)距離)。因此可以用牛頓-辛普森方法求解。于是在線計算問題概括為
(1)f=0滿足式(28)時,取f*=0;
(2) 否則,用牛頓-辛普森方法求解式(31)得λ,代入式(28)得f*。
目標(biāo)選擇高超聲速巡航導(dǎo)彈,平均飛行Ma數(shù)為6,與水平方向成175°。攔截彈平均Ma數(shù)為7.5。雙模預(yù)測中制導(dǎo)律啟動時,目標(biāo)位置(500,40)km,攔截彈位置(120,30) km,迎著目標(biāo)平飛。要求中末制導(dǎo)交班距離L=60 km,目標(biāo)相對于攔截彈導(dǎo)引頭的視線與彈軸夾角ξ*=9°。另外要求中制導(dǎo)過程輸入不大于0.02 rad/s。
由文獻(xiàn)[1]中的方法生成的虛擬目標(biāo)起始位置為(460,44) km,飛行速度與實際目標(biāo)相同。

圖3和圖4分別給出2.1中的常系數(shù)導(dǎo)引律和2.2中的雙模預(yù)測導(dǎo)引律下的攔截彈道軌跡和輸入曲線。結(jié)果顯示,雙模預(yù)測制導(dǎo)能夠很好地保證閉環(huán)系統(tǒng)的可行性,并使整體性能指標(biāo)得到進(jìn)一步優(yōu)化,其中常系數(shù)次優(yōu)化導(dǎo)引律的實際性能指標(biāo)為0.016 2,雙模預(yù)測導(dǎo)引律0.010 1。

圖3 攔截彈道軌跡Fig.3 Missile trajectories for interceptor

圖4 輸入曲線Fig.4 Curve for inputs
本文針對大氣層內(nèi)目標(biāo)攔截彈既要滿足末制導(dǎo)側(cè)窗探測對中制導(dǎo)末端時刻,彈目相對距離和位置的要求,又要滿足飛行過程中的過載、動壓等約束的問題提出了雙模預(yù)測制導(dǎo)律。該導(dǎo)引律通過引入有限維輸入擾動量保證了閉環(huán)系統(tǒng)的可行性和穩(wěn)定性,同時實現(xiàn)對性能指標(biāo)的進(jìn)一步優(yōu)化。仿真結(jié)果證明該導(dǎo)引律可以很好地保證過程約束得以滿足,并且可以有效減小性能指標(biāo)值。研究預(yù)測制導(dǎo)在攔截彈中制導(dǎo)過程的應(yīng)用具有重要的理論價值和實踐意義。
參考文獻(xiàn):
[1] 李爽, 江涌, 張奕群, 等. 基于虛擬目標(biāo)的大氣層內(nèi)攔截彈中制導(dǎo)律研究[J]. 航天控制, 2013, 31(3): 27-32.
LI Shuang, JIANG Yong, ZHANG Yi-qun, et al. Research on Midcourse Guidance Law for Interceptor in Atmosphere Based on Virtual Target[J]. Aerospace Control, 2013, 31(3): 27-32.
[2] 李爽, 江涌, 李君龍, 等. 中制導(dǎo)虛擬目標(biāo)的定位參數(shù)研究[J]. 現(xiàn)代防御技術(shù), 2013, 41(3): 48-52.
LI Shuang, JIANG Yong, LI Jun-long, et al. Research on Location Parameters of Virtual Target for Midcourse Guidance[J]. Modern Defence Technology, 2013, 41(3): 48-52.
[3] MAYNE D Q,RAWLINGS J B, RAO C V, et al. Constrained Model Predictive Control: Stability and Optimality[J]. Automatica, 2000, 36(9): 789-813.
[4] KEVICZKY T, BALAS G J. Receding Horizon Control of an F-16 Aircraft: a Comparative Study[J]. Control Engineering Practice, 2006, 14(9): 1023-1033.
[5] 鄭立偉, 荊武興, 張燕. 基于高斯問題的近最優(yōu)再入預(yù)測制導(dǎo)方法研究[J]. 航天控制, 2006, 24(1): 39-42.
ZHENG Li-wei, JING Wu-xing, ZHANG Yan. The Sub-Optimal Prediction Guidance Algorithm for the Reentry Vehicle Based on the Gauss Equation[J]. Aerospace Control, 2006, 24(1): 39-42.
[6] ASHOK J, SIVAN K. Predictor-Corrector Reentry Guidance Algorithm with Path Constraints for Atmospheric Entry Vehicle[J]. Journal of Guidance, Control and Dynamics, 2007, 30(5): 1307-1308.
[7] 張軍, 肖余之, 畢貞法. 基于多模型預(yù)測的再入飛行器制導(dǎo)方法[J]. 航空學(xué)報, 2008, 29(5): 20-25.
ZHANG Jun, XIAO Yu-zhi, BI Zhen-fa. Guidance Method Based on Multi-Model Prediction for Reentry Vehicle[J]. Acta Aeronautica et Astronautica Sinica, 2008, 29(5): 20-25.
[8] 呼衛(wèi)軍, 楊業(yè), 周軍. 基于外部信息源的臨近空間飛行器中制導(dǎo)研究[J]. 航天控制, 2010, 28(2): 23-29.
HU Wei-jun, YANG Ye, ZHOU Jun. Research of Midcourse Guidance Based on External Information Source for Near Space Vehicle[J]. Aerospace Control, 2010, 28(2): 23-29.
[9] KOUVARITAKIS B, ROSSITER J A, SCHUURMANS J. Efficient Robust Predictive control[J]. IEEE Transactions on Automatic Control, 2000, 45(8): 1545-1549.
[10] KOUVARITAKIS B, CANNON M,ROSSITER J A. Who Needs QP for Linear MPC anyway[J]. Automatica, 2002, 38(5): 879-884.
[11] LI Shuang, KOUVARITAKIS B, CANNON M. Improvements in the Efficiency of Linear MPC[J]. Automatica, 2009, 46(1): 226-229.
[12] KOUVARITAKIS B, LI Shuang, CANNON M.A Linear Search Improvement of Efficient MPC[J]. Automatica, 2010, 46(11): 1920-1924.