陳 辰,呂躍勇,馬廣富,王潤馳
(哈爾濱工業大學控制科學與工程系,哈爾濱150001)
基于神經網絡的RLV再入段有限時間自適應姿態控制
陳 辰,呂躍勇,馬廣富,王潤馳
(哈爾濱工業大學控制科學與工程系,哈爾濱150001)
針對可重復使用運載器(RLV)再入段的姿態控制問題,提出了一種基于神經網絡的有限時間自適應姿態跟蹤控制方法。首先,在傳統RLV建模的基礎上將模型不確定性、耦合及擾動力矩分離作為復合擾動;然后,利用徑向基神經網絡(RBFNN)對其在線估計并在標稱控制器中進行動態前饋補償;最后,利用終端吸引子改進控制器實現了對期望狀態的有限時間跟蹤,并通過引入魯棒項降低了RBFNN估計誤差對控制精度的影響。設計的姿態控制器無需獲知精確的氣動數據與擾動范圍而僅需某飛行狀態下的標稱值。仿真結果表明提出的控制方法對RLV再入姿態跟蹤具有較好的控制效果。
可重復使用運載器;神經網絡;自適應估計;有限時間穩定
RLV等高超聲速飛行器再入返回過程中跨越臨近空間,由于這一區域氣壓和大氣密度變化劇烈,加之高速飛行引起飛行器表面燒蝕和變形,因此很難通過地面試驗獲得準確的氣動特性數據[1]。伴隨飛行狀態的改變,飛行器動力學特性變化顯著,各通道間耦合特性、模型不確定性對控制系統影響也愈發明顯,這些都為再入段姿態控制系統的設計帶來了更多的挑戰[2]。
對于上述非線性問題,自適應控制[3]和擾動觀測器是處理系統不確定性以及提高魯棒性的常用方法。文獻[3]結合高超聲速飛行器特征模型,設計了全通道自適應控制器。文獻[4]將自適應與反步控制相結合,實現了對不確定項未知邊界的估計,并引入魯棒項進一步抑制了擾動。非線性擾動觀測器[5]、滑模擾動觀測器[6]與反步控制、最優控制相結合能夠有效抑制復合擾動,提高系統動態性能。
神經網絡估計技術具備對任意非線性連續函數的智能逼近能力,可以對外界干擾、非線性動態等系統不確定性進行有效估計;神經網絡控制策略不依賴于系統擾動或不確定性的閾值具有更好的魯棒性和容錯性,且采用權值自適應律可以實時調整控制器參數從而保證網絡的逼近性能,因此在飛行控制系統設計中得到了廣泛應用[7]。文獻[8]將自適應RBF用于逼近模型不確定性部分,結合動態面控制方法實現了航跡角軌跡跟蹤控制;文獻[9]采用神經網絡干擾觀測器對動態逆誤差進行在線逼近并補償。文獻[10] 基于神經網絡觀測器對氣動建模誤差進行補償,并以F-16氣動模型為例驗證了姿態控制系統的有效性。文獻[11]將單隱層神經網絡與自適應律相結合來修正動態逆的近似誤差,在輸入飽和條件下設計了姿態控制器。
需要指出,上述方法均易受到神經網絡估計誤差的影響,且僅能保證系統漸近穩定,收斂時間較長,不利于處理RLV的快時變特性。相比之下,有限時間控制能夠使系統在有限時間內收斂,具有良好的快速性和抗擾動性,對于處理RLV的快時變特性具有明顯優勢[12]。文獻[13]基于高階滑模控制技術設計時標分離條件下的內外環控制器,解決了存在參數不確定性和外界擾動的再入姿態有限時間控制問題。文獻[14]針對系統不確定性和外界擾動設計了準連續高階滑模姿態控制器,實現了對制導指令的有限時間跟蹤。終端滑模面中的終端吸引子[15]是使系統具備有限時間收斂特性的主要原因,以此為基礎的終端滑模控制方法在有限時間控制領域得到了廣泛研究。
基于上述研究,本文提出了一種基于RBF神經網絡的RLV再入姿態自適應魯棒控制方案。首先將未建模動態,不確定項,耦合影響,參數攝動等擾動轉化為復合擾動,建立了用于控制器設計的 RLV 再入姿態模型;然后,設計了RBF神經網絡自適應估計器,對復合擾動進行在線估計并前饋補償;最后,針對神經網絡估計誤差引入終端吸引子與魯棒項,提出了一種改進的有限時間神經網絡魯棒姿態控制器,使系統跟蹤誤差有限時間收斂。數值仿真驗證了本文所提出控制策略的有效性。
忽略地球自轉影響,再入段RLV姿態模型為[1]:
(1)
(2)
式中:Ω=[αβμ]T,α,β和μ分別為攻角,側滑角和傾側角;ω=[ωxωyωz]T,ωx,ωy和ωz分別是滾轉角速率,偏航角速率和俯仰角速率;δ=[δeδaδr]T,δe,δa和δr分別為左右升降舵副翼和方向舵偏角。fs=[fαfβfμ]T以及ff=[fωxfωyfωz]T具體表達式如下:
(3)
(4)
式中:X,Y和Z分別為阻力、升力和側向力,l,m和n分別為滾轉、偏航和俯仰力矩。V為飛行器速率,S為參考面積,b為翼展長度,M為飛行器質量,Ix,Iy和Iz分別為三軸的轉動慣量。Xcg為參考力矩中心到重心距離,θ為彈道傾角,q=0.5ρV2為動壓,ρ為大氣密度。gs1,gs2,gf為3×3的矩陣,具體表達式為:
(5)
(6)
(7)
式中:gi,j為氣動系數項,具體參數見文獻[1]。在一般研究中,由于角速度變量響應較快而角度動態響應較慢,因此式(1)常被稱為外環或慢回路,式(2)常被稱為內環或快回路。
由式(1)~(4)可以看出,高超聲速飛行器再入飛行姿態動力學模型具有復雜非線性、三通道強耦合的特點。由于已知真實飛行試驗數據的不足,很難建立精確的數學模型,因此控制器設計應該充分考慮系統的不確定性以及擾動對控制系統的影響。為此對模型做如下數學變換,以外環慢回路模型為例,由于未建模動態參數攝動及不確定性主要包含于fs(Ω)中,因此用fs(Ω)+Δfs(Ω)表示,其中Δfs(Ω)為不確定項。假設ds為外環擾動項。則方程(1)等效為:
(8)
式中:h1(t)=Δfs(Ω)+gs2δ+ds,u1=gs1ω。
對于內環快回路模型,主要存在力矩擾動,系統未建模動態、氣動參數的不確定性,主要包含在ff(Ω,ω)中,因此用ff(Ω,ω)+Δff(Ω,ω)表示。對于內環的控制輸入矩陣gf由于很難精確獲知舵的氣動特性,因此我們用標稱值gf0來近似,df為內環擾動項,于是得到內環面向控制的動態模型
(9)
式中:h2(t)=Δff(Ω,ω)+(gf-gf0)δ+df,u2=gf0δ。至此,得到了用于本文神經網絡控制器設計的再入姿態運動方程。
姿態控制的主要目的為實現對期望姿態角指令Ωd的跟蹤。根據時標分離原則,對外環回路設計所需要的姿態角速率指令ωc,稱為慢回路控制器;再對內環回路設計控制舵偏量δ,稱為快回路控制器。通過合理設計內外環增益,保證滿足時標分離條件,則在慢回路控制器設計時可忽略快回路動態特性,對ωc和δ分別獨立設計。系統控制結構如圖 1 所示。由動力學模型(1)~(2)式可知,雙環的控制器設計過程類似,因此以外環控制器設計為例給出設計過程。
為方便系統穩定性分析,給出如下引理及定義,
引理1[12]. 考慮如下系統:
假設存在連續可微函數V(x):u→R滿足下列條件:
1.V(x)為正定函數,
2.存在正實數c>0和α∈(0,1),以及一個包含原點的開鄰域U0∈U,使得下列條件成立:

引理2[16]. 對于任意實數li∈R,i=1,…,n,0
引理3[17]. 根據RBF神經網絡的局部特性,徑向基函數網絡在有足夠多的節點,且有適當構建的節點中心及中心寬度的情況下,能夠對任意連續函數Q(X)在有界閉集ΩX內任意逼近,存在如下表達式:

定義如下吸引子函數:
2.1 神經網絡姿態控制器設計
首先對系統(8)設計如下的標稱控制器:
(10)
式中:e=Ω-Ωd為姿態角跟蹤誤差,增益值ks為:
ks=diag(ks,α,ks,β,ks,μ),ks,α,ks,β,ks,μ>0
(11)

(12)
(13)
從式(13)可以看出,控制器的構成只需要系統標稱模型,降低了對飛行器模型精確度的要求。
2.2RBF神經網絡控制系統穩定性分析
為了分析系統的穩定性,根據RBF神經網絡對連續非線性函數具有全局任意精度逼近的能力,給出如下假設:


首先,構造如下Lyapunov函數:
(14)
(15)
對式(14)求導可得:
(16)
將式(13)代入式(8),可得系統誤差動態方程:
(17)
代入式(16),可得
(18)
ks為正定對稱陣,因此存在正定矩陣P,Q滿足如下Lyapunov方程
(19)
結合式(18)可知:
(20)
(21)
設計如下神經網絡自適應律:
(22)
代入式(21)可得:
(23)

(24)
由式(24)可知,Q的最小特征值越大,P的最大特征值越小,系統跟蹤誤差e的收斂半徑越小,跟蹤精度越高。同時從收斂域可以看出,較大的神經網絡逼近誤差η0也會加大誤差收斂半徑,因此有必要對控制器進行改進,提高控制器對神經網絡逼近誤差的魯棒性。
2.3 有限時間RBF神經網絡姿態控制器設計
從第2.2節分析過程可知,跟蹤誤差指數收斂但存在穩態誤差,當神經網絡逼近誤差較大時必將惡化系統的跟蹤效果,因此為了加快系統狀態的跟蹤速度達到有限時間穩定,并且消除系統穩態誤差,設計新的控制器:
(25)
式中:
v1是為實現有限時間穩定而引入的終端吸引子,v2為魯棒控制項,用于消除權值估計誤差產生的逼近誤差。ks1,ks2為增益矩陣,定義如下:ks1=diag(ks1,α,ks1,β,ks1,μ),ks2=diag(ks2,α,ks2,β,ks2,μ),ksi,α,ksi,β,ksi,μ>0,i=1, 2。
(26)
利用Lyapunov方法對采用新控制器(25)式作用下的系統進行穩定性分析。
第一步:首先選取如下Lyapunov函數:
(27)
對上式求導可得:
(28)
將誤差動態(26)代入式(28),經過與式(16)~(23)類似的數學推理方法可得:
(29)
當取參數滿足條件:λmin(Pks2)≥η0λmax(P)時可得
(30)
即系統全局穩定。
第二步:定義如下Lyapunov函數:
(31)
對上式求導并結合誤差方程(26)式,可得
(32)
進一步數學處理,可得
(33)
(34)
由引理2可知
(35)
從以上分析過程可知,在控制器式(25)作用下,系統誤差有限時間收斂至零,消除了神經網絡逼近過程中穩態誤差對控制系統的影響。同理,根據時標分離原則,針對快回路式(9)設計神經網絡有限時間控制器:
δ*=δ+vω1+vω2
(36)
式中:
(37)
(38)
其中,τ為濾波參數。vω1和vω2表達式如下:

(39)
內環控制器中神經網絡自適應律設計為:
(40)
γ2>0,kf 0,kf 1,kf 2分別為內環增益,反饋控制項系數和魯棒控制項系數,kf 0=diag(kf 01,kf 02,kf 03),kf 1=diag(kf11,kf12,kf13),kf 2=diag(kf 21,kf 22,kf 23),kfij>0,i=0,1,2,j=1,2,3。

[18]中的飛行器模型基礎參數。合理選擇RLV仿真初始條件:h(0)=50km,α(0)=0°,β(0)=0° ,μ(0)=0°,[ωx0ωy0ωz0]=[0 0 0]Trad/s。控制器參數選取如表1所示,以滿足系統穩定性要求。

表1 控制系統參數
標稱值gf0取為:
神經網絡節點取為6個,節點中心選為0,初始化RBF神經網絡輸出矩陣為0。
內環擾動項表達式如下:
(41)
系統攻角和傾側角輸入指令為幅值10°的方波信號,由于飛行器BTT的轉彎要求,側滑角指令設置為0°。
考慮內環擾動(41)式情況下系統響應如圖2和圖3所示,圖2為對期望姿態角的跟蹤曲線,對比未加補償控制器,可以看出帶有神經網絡補償的兩種控制器對于方波信號均具有較好的跟蹤效果,改進控制律FTRBFNN在跟蹤時間和精度上都有很大提升,跟蹤誤差幅值小于0.1,通道之間解耦效果更好,控制性能進一步提升。從兩種控制器作用下的系統控制輸入圖3可以看出,控制輸入均在執行機構限幅之內,有效實現了再入姿態跟蹤控制。控制輸入舵偏角中峰值的出現是由于方波信號的不連續造成,實際系統中對指令信號會進行濾波和平滑處理,這里僅給出最苛刻的跟蹤仿真分析。
圖4為神經網絡對內環擾動的觀測值,從圖中可以看出,神經網絡能夠快速對擾動進行觀測,并且在放寬RBF參數條件下,觀測器存在觀測誤差,RBFNN和FTRBFNN兩種控制器作用下,RBFNN觀測效果基本一致,對比圖2可以得出,引入魯棒項的FTRBFNN能夠消除誤差的影響,有效提高擾動環境下的姿態控制精度,具有更好的控制性能。
本文針對RLV再入飛行的姿態控制問題,提出一種基于RBF神經網絡的有限時間自適應控制方法。該方法能夠利用RBF神經網絡對由系統不確定性、動力學耦合項和干擾形成的復合擾動進行自適應估計,控制器設計只需使用系統標稱值而無需精確的氣動模型參數,極大減小了對系統精確模型的依賴,簡化了控制器設計。進一步引入的終端吸引子和魯棒控制項則在賦予系統有限時間收斂特性的同時,進一步降低了自適應估計誤差對控制精度的影響。仿真結果表明,本文提出的基于RBF神經網絡的有限時間自適應控制器能夠快速無超調地跟蹤期望指令,控制系統具有較好的魯棒性。
參 考 文 獻
[1] 李惠峰. 高超聲速飛行器制導與控制技術[M]. 北京: 宇航出版社, 2012.
[2] 張天翼, 周軍, 郭建國. 高超聲速飛行器魯棒自適應控制律設計 [J]. 宇航學報, 2013, 34(3): 384-388. [ZhangTian-yi,ZhouJun,GuoJian-guo.Astudyonrobustadaptivecontrolmethodforhypersonicvehicle[J].JournalofAstronautics. 2013, 34(3): 384-388.]
[3] 杜立夫, 黃萬偉, 劉曉東, 等. 考慮特征模型的高超聲速飛行器全通道自適應控制 [J]. 宇航學報, 2016, 37(6): 711-719. [DuLi-fu,HuangWan-wei,LiuXiao-dong,etal.Whole-channeladaptivecontrolforhypersonicvehicleconsideringcharacteristicmodel[J].JournalofAstronautics. 2016, 37(6): 711-719.]
[4] 王芳, 宗群, 田栢苓, 等. 基于魯棒自適應反步的可重復使用飛行器再入姿態控制[J]. 控制與決策, 2014, 29(1): 12-18. [WangFang,ZongQun,TianBai-ling,etal.Robustadaptiveback-steppingflightcontroldesignforreentryRLV[J].ControlandDecision, 2014, 29(1): 12-18.]
[5] 余光學, 李惠峰.RLV抗擾動非線性最優控制器設計[J]. 控制與決策, 2015, 30(3): 513-519. [YuGuang-xue,LiHui-feng.Anti-disturbancenonlinearoptimalcontrollerdesignforRLV[J].ControlandDecision. 2015, 30(3):513-519.]
[6] 程路, 姜長生, 都延麗, 等. 基于滑模干擾觀測器的近空間飛行器非線性廣義預測控制[J]. 宇航學報, 2010, 31(2): 423-431. [ChengLu,JiangChang-sheng,DuYan-li,etal.TheresearchofSMDObasedNGPCmethodforNSVcontrolsystem[J].JournalofAstronautics. 2010, 31(2): 423-431]
[7] 周麗, 姜長生, 錢承山. 一種基于神經網絡的快速回饋遞推自適應控制[J]. 宇航學報, 2008, 29(6): 1888-1894. [ZhouLi,JiangChang-sheng,QianCheng-shan.Afastadaptivebacksteppingmethodbasedonneuralnetworks[J].JournalofAstronautics. 2008, 29(6): 1888-1894.]
[8]GuoY,LiuJ.Neuralnetworkbasedadaptivedynamicsurfacecontrolforflightpathangle[C].The51stIEEEConferenceonDecisionandControl,Hawill,USA, 2012, 8350(2): 5374-5379.
[9] 陳謀, 鄒慶元, 姜長生, 等. 基于神經網絡干擾觀測器的動態逆飛行控制[J]. 控制與決策, 2008, 23(3): 283-287. [ChenMou,ZouQing-yuan,JiangChang-sheng,etal.Dynamicalinversionflightcontrolbasedonneuralnetworkdisturbanceobserver[J].ControlandDecision,2008, 23(3): 283-287.]
[10]LeeT,KimY.Nonlinearadaptiveflightcontrolusingbacksteppingandneuralnetworkscontroller[J].JournalofGuidance,Control,andDynamics, 2012, 24(4): 675-682.
[11]JohnsonEN,CaliseAJ.Limitedauthorityadaptiveflightcontrolforreusablelaunchvehicles[J].JournalofGuidance,Control,andDynamics, 2003, 26(6): 906-913.
[12] 丁世宏, 李世華. 有限時間控制問題綜述[J]. 控制與決策, 2011, 26(2): 161-169. [DingShi-hong,LiShi-hua.Asurveyforfinite-timecontrolproblems[J].ControlandDecision, 2011, 26(2): 161-169.]
[13] 范金鎖, 張合新, 張明寬, 等. 基于自適應二階終端滑模的飛行器再入姿態控制[J]. 控制與決策, 2012, 27(3): 403-407.[FanJin-suo,ZhangHe-xin,ZhangMing-kuan,etal.Adaptivesecond-orderterminalslidingmodecontrolforaircraftre-entryattitude[J].ControlandDecision, 2012, 27(3): 403-407.]
[14] 王婕, 宗群, 田栢苓, 等. 基于擬連續高階滑模的高超聲速飛行器再入姿態控制[J]. 控制理論與應用, 2014, 31(9): 1166-1173.[WangJie,ZongQun,TianBai-ling,etal,Reentryattitudecontrolforhypersonicvehiclebasedonquasi-continuoushighorderslidingmode[J].ControlTheory&Applications, 2014, 31(9): 1166-1173.]
[15]ZakM.Terminalattractorsinneuralnetworks[J].NeuralNetworks, 1989, 2(4): 259-274.
[16]YuSH,YuXH,ShirinzadehB,etal.Continuousfinitetimecontrolforroboticmanipulatorswithterminalslidingmode[J].Automatica, 2005, 11(41): 1957-1964.
[17]ParkJH,SandbergIW.Universalapproximationusingradial-basis-functionnetworks[J].NeuralComputation, 2008, 3(2): 246-257.
[18] 王建華, 劉魯華, 湯國建. 高超聲速飛行器俯沖段制導與姿控系統設計[J]. 宇航學報, 2016, 37(8): 964-973. [WangJian-hua,LiuLu-hua,TangGuo-jian.Guidanceandattitudecontrolsystemdesignforhypersonicvehicleindivephase[J].JournalofAstronautics, 2016, 37(8): 964-973.]
通信地址:黑龍江省哈爾濱市香坊區一匡街2號,哈爾濱工業大學科學園2B棟322室
電話:(0451)86418320-322
E-mail:chenchen@hit.edu.cn
呂躍勇(1983-),男,助理研究員,主要從事導航、制導與控制、編隊飛行控制方面研究。本文通信作者。
通信地址:黑龍江省哈爾濱市香坊區一匡街2號,哈爾濱工業大學科學園2B棟322室(150001)
電話:(0451)86418320-322
E-mail:lvyy@hit.edu.cn
(編輯:張宇平)
Neural Network Based Finite-Time-Stable Adaptive Attitude Control for RLV Reentry
CHEN Chen, LV Yue-yong, MA Guang-fu, WANG Run-chi
(Department of Control Science and Engineering, Harbin Institute of Technology, Harbin 150001, China)
A neural network based finite-time-stable adaptive attitude control strategy for a reusable launch vehicle (RLV) reentry is proposed. Firstly, the traditional RLV dynamic model is improved by separating out the uncertainty, coupled dynamic and disturbance together as combined disturbance. Then, adaptive estimation for the combined disturbance based on radical basis function neural network (RBFNN) is introduced into a nominal controller as feed-forward compensation. Moreover, the terminal attractor is used to improve the controller so that the desired system state could be tracked in finite time, and a robust control function is also introduced so as to reduce the impact on control accuracy from the error of RBFNN estimation. Only the nominal parameters of the system rather than the precise value and bounds of disturbance are utilized for the proposed controller. Finally, the effectiveness of the controller is demonstrated by the numerical simulations.
Reusable launch vehicle; Neural network; Adaptive estimation; Finite time stable
2016-05-21;
2016-11-29
國家自然科學基金(61673135, 61603114,61403103)
V448.2
A
1000-1328(2017)03-0279-08
10.3873/j.issn.1000-1328.2017.03.008
陳 辰(1987-),男,博士生,主要從事飛行器姿態控制,魯棒非線性控制。