朱戰霞,馬巖,毛正陽,唐必偉
(1.西北工業大學 航天學院,陜西 西安710072;2.航天飛行動力學技術國家級重點實驗室,陜西 西安710072)
滿足成本和性能要求是航天器設計的基本原則,為了降低發射成本,總是力求航天器質量盡可能輕。一般地,燃料占質量的相當比例,因此應盡可能使航天器執行任務所需的燃料最少。對于大氣層外動能攔截器,從平臺發射之后,在制導控制系統作用下,攔截器飛達目標并對目標實施直接碰撞殺傷。攔截過程中燃料消耗取決于控制系統性能和所采用的制導方案,燃料最省的制導方案可以有效減少攔截器質量,從而降低地面發射成本。然而基于視線坐標系建立的動能攔截器末制導段動力學模型雖然物理意義明顯,但卻具有強非線性特性,導致經典制導律設計方法不適用,同時考慮到目標躲避機動及各類偏差和外擾,致使滿足攔截精度要求的制導律設計困難。
為了解決以上問題,國內外不少學者進行了研究。其中針對非線性系統最優制導問題,狀態相關黎卡提方程法(SDRE)[1]不失為一種有效的解決方法,相對于傳統最優反饋制導律求解HJB(Hamilton-Jacobi-Bellman)方程十分困難的情況,SDRE非線性次優制導律求解簡單,控制精度高,已有學者將該方法應用于制導律設計中。賈正望等[2]針對防空導彈的二維制導問題,設計了基于SDRE法的末制導律。文獻[3]設計了一種基于SDRE法的最優滑模制導律。文獻[4-5]基于SDRE控制理論,采用θ-D法求解次優控制律,分別針對航天器伴隨軌道控制問題和三維空間彈目攔截問題進行了研究。雖然SDRE法可以用于非線性系統,但是當系統存在不確定項或者干擾項時,應用該方法求解最優解非常困難。
滑模控制具有對參數攝動的不變性和對外界干擾的魯棒性,也在末制導律設計中得到了應用[6-9]。但是滑模控制的原理導致抖振問題不可避免,抖振會造成控制量在正負之間頻繁切換,導致該方法工程實施困難。
本文以動能攔截器攔截大氣層外大機動目標為對象,考慮系統非線性和不確定干擾,充分利用以上兩種方法的特點,提出并研究了結合SDRE法和滑模法的末制導律設計方法。
在視線坐標系[10]下建立攔截器與目標之間的相對運動模型[11]:

式中:r為視線坐標系下的攔截器和目標的相對距離;qε為視線傾角;qβ為視線偏角;atx,aty,atz為目標機動加速度矢量在視線坐標系三軸上的分量;amx,amy,amz為攔截器加速度矢量在視線坐標系三軸上的分量。
為了方便控制系統設計,將式(1)改寫成狀態方程的形式,設

則有:

式中:x為狀態量;u為攔截器控制量;將目標機動視為干擾量δ,它們都是隨時間的變化量。B(x)矩陣及C(x)矩陣為控制量u及干擾量δ的系數矩陣,是狀態量x的函數。
以上狀態方程中,視攔截器-目標的相對距離、視線傾角及視線偏角為被控狀態量,既能完整地表達相對接近問題,又不會引入絕對坐標信息,簡化了數值解算的復雜度。顯見,該方程為非線性方程,其中的目標機動項為不確定項,因此該方程表示的系統是帶有不確定干擾項的非線性系統。
一般地,考慮擾動及不確定項的非線性系統狀態方程可表示如下:

式中:系統狀態量x∈Rn;控制量u∈Rm;f(x),g(x)為由狀態量x組成的非線性系統的函數。假設系統(3)中的不確定項,則系統可以表示為:


式中:a0,a1為正常數;‖˙‖表示歐幾里德范數。
對于式(4)所描述的系統,本文考慮充分利用SDRE法和滑模控制的特點進行最優控制的設計。首先,不考慮干擾,即在δ=0的情況下基于SDRE理論求解系統的解。然后在此基礎上,考慮不確定干擾項,即δ≠0,采用滑模控制進行補償。具體過程如下。
假設δ=0,非線性系統的狀態方程為:

令u=ucon,并稱ucon為標稱系統(不考慮干擾)的最優控制量。取系統(6)的控制能量消耗最小作為性能指標,即

式中:Q(x)∈Rn和R(x)∈Rm為系統性能指標中含有狀態量x項的權重矩陣,Q(x)為半正定矩陣,R(x)為正定矩陣。
基于SDRE理論,即基于狀態量的黎卡提方程的思想,將非線性動力學方程轉換為系數矩陣含有狀態量的狀態方程,其與LQR控制具有同樣的魯棒性。將式(6)中的f(x)表示為A(x)x,將g(x)表示為B(x),則狀態方程就可表示為基于SDRE理論的狀態方程:

系數矩陣 [A(x) B(x)]對于x逐點可控,則滿足最優性能指標的最優控制ucon為:
其中矩陣P(x)通過以下黎卡提矩陣代數方程求得:

對于SDRE法設計過程中的可控性問題,選擇合適的系數矩陣A(x)對系統的可控性有比較大的影響。如果對于任意狀態量,系統中[A(x) B(x)]需逐點可控,令S4=[B(x) A1(x)B(x) …,即有 rank(S4)=n,則本文所設計的非線性魯棒系統可控。
以上結果是在δ=0的情況下得到的,下面考慮當δ≠0的情況。
為了補償非線性系統(4)中的不確定項,選擇控制律為:

式中:uunc為針對系統外擾及參數不確定性的滑模控制補償量。若求得式(11),即可得到考慮干擾的最優制導律,前面已經設計具有最優性能的控制ucon,因此這里需要設計補償量uunc。
基于滑模控制思想,首先選擇滑模面為:

本文設計積分滑模面如下所示:

這里,G(x)∈Rm×n,G(x)B(x)滿秩非奇異,不考慮系統外擾動,當t=0時,s(0,x(0))=0,這樣系統運動點總是從滑模面出發,對s求導:


與基于SDRE設計的最優控制相比,式(9)和式(15)完全相同,這也證明了本文選擇的滑模面是魯棒最優的。
考慮系統外擾項,選擇uunc為:

式中:參數η為正常數。

將式(4)代入,得:

將式(16)代入式(18),得:



本文研究的末制導問題中,C(x)=-B(x),則:

考慮式(5),得:

分析式(22),s的1-范數‖s‖1是大于0的,則-η‖s‖1<0,有‖s‖ < ‖s‖1,則式(22)中后半項,則,證明了系統的穩定性。
針對攔截器末制導律設計問題,應用以上方法時,首先需要將狀態方程式(2)改寫為如下形式:

由于在視線方向不用控制,因此式(23)的前兩式在仿真中只需參加循環計算,則狀態量變為x=,去掉前兩式后,式(23)各系數矩陣的表達式為:


則可以直接利用本文方法進行末制導律的設計,其中兩個系數矩陣R和Q設計如下:

為了驗證本文設計的末制導律的性能,在相同條件下,將仿真結果與以下自適應滑模末制導律比較[12]:

體現制導性能的主要參數就是視線角變化率和脫靶量,前者與攔截過程中需用過載相對應,后者說明了攔截精度。仿真計算得到基于SDRE法的非線性魯棒滑模末制導律的脫靶量為0.132 5 m,燃料消耗為11.906 kg,而自適應滑模末制導律的脫靶量為0.416 8 m,燃料消耗為12.983 kg,表明本文所提出并設計的末制導律脫靶量更小,制導精度更高,且燃料消耗更少。圖1和圖2給出兩種制導律下的視線傾角變化率和視線偏角變化率。其中,ASMG代表自適應滑模末制導律;OSMG代表本文設計的基于SDRE法的非線性魯棒滑模最優末制導律。

圖1 視線傾角變化率Fig.1 Changing rate of line of sight lnclination angle

圖2 視線偏角變化率Fig.2 Changing rate of line of sight deflection angle
由圖1和圖2可以看出,基于SDRE法的非線性魯棒滑模末制導律的視線角速率在前段變化較快且很快減小并逐漸趨于較小的值,說明彈道前段充分利用了機動性而彈道末段比較平直,有利于精確控制以減小脫靶量。
在末制導段進行蒙特卡洛打靶仿真,誤差源及其誤差選值范圍和分布規律如表1所示,打靶次數n=100次。其中正態分布N(0,σ2),選取均值為0,標準差σ=0.5。兩種末制導律下,蒙特卡洛打靶的脫靶量分別如圖3和圖4所示。

表1 誤差源及其分布規律Table 1 Distribution of error sources

圖3 自適應滑模末制導律脫靶量分布Fig.3 Missed distance of ASMG

圖4 非線性魯棒滑模最優末制導律脫靶量分布Fig.4 Missed distance of OSMG
統計結果為:ASMG法的CEP誤差為0.225 m,脫靶量均方差為0.030 5 m;OSMG法的CEP誤差為0.138 2 m,脫靶量均方差為0.008 55 m。進一步說明了基于SDRE法的非線性魯棒滑模最優末制導律脫靶量更小,制導精度更高。
在保證制導精度的前提下,攔截器燃料消耗的減少對于其總體優化設計以及航天器作為有效載荷從地面發射時的成本減小意義重大。本文正是基于此考慮,研究了基于SDRE法解決非線性系統的理論基礎,并將滑模變結構控制與其結合,設計了基于SDRE法的非線性魯棒滑模末制導律,仿真結果表明了該制導律的可用性和優越性能。
[1] Tayfun Cimen.State-dependent riccati equation(SDRE)control:a survey[C]//Proceedings of the 17th International Federation of Automatic Control World Congress.Seoul,South Korea,2008:3761-3775.
[2] 賈正望,穆育強,郭治.基于SDRE方法的制導律設計與仿真研究[J].系統仿真學報,2010,22(1):135-143.
[3] Seyyed Sajjad Moosapour,Ghasem Alizadeh,Sohrab Khanmohammadi,et al.A novel nonlinear robust guidance law design based on SDRE technique[J].International Journal of Aeronautical and Space Science,2012,13(3):369-376.
[4] 羅建軍,周文勇,袁建平.基于θ-D非線性控制方法的伴隨軌道控制[J].中國空間科學技術,2009,4(2):1-7.
[5] 王祥,方群.一種基于θ-D次優控制的三維末制導律設計[J].西北工業大學學報,2012,30(2):196-200.
[6] Babu K R,Sarmah J G.,Swamy K N.Switched bias proportional navigation for homing guidance against highly maneuvering targets[J].Journal of Guidance,Control,and Dynamics,1994,17(6):1357-1363.
[7] 郭建國,周軍.基于雙冪次趨近律的變結構末制導律[J].飛行力學,2010,28(5):55-58.
[8] 湯一華,陳士櫓,徐敏,等.基于Terminal滑模的動能攔截器末制導律研究[J].空軍工程大學學報,2007,8(2):22-25.
[9] 時建明,王潔,劉少偉.大氣層外末段攔截變結構制導律設計[J].電光與控制,2009,16(11):92-97.
[10]范玉潔.空間攔截器制導與控制技術研究[D].南京:南京航空航天大學,2012.
[11] Chen Chun-Hone,Liang Yew-Wen,Liaw Der-Cherng,et al.Design of midcourse guidance laws via a combination of fuzzy and SMC approaches[J].International Journal of Control,Automation,and Systems,2010,8(2):272-278.
[12]周荻.尋的導彈新型導引規律[M].北京:國防工業出版社,2002:6-9.