管宇,趙石磊,張迎春,賈慶賢
(1.哈爾濱工業大學衛星技術研究所,哈爾濱150001;2.哈爾濱理工大學軟件學院,哈爾濱150040)
隨著以完成高精度和高穩定度為航天任務的小衛星概念的提出和應用,對衛星姿態控制系統的可靠性和安全性提出了更高的要求.由于在軌衛星長期工作在失重、高低溫等惡劣環境下,而且衛星部件故障具有不可修復性,因此,研究衛星姿控系統的容錯控制對提高衛星在軌自主運行可靠性有著重要的理論意義和應用價值.
目前,針對衛星容錯控制方法的研究在理論和應用上都取得了一定的研究成果[1-4].例如,Cai[5]針對受外部干擾作用以及推力器失效故障的航天器姿態跟蹤問題,設計了一種自適應姿態容錯控制器.Hou[6]基于控制有效因子設計了兩級Kalman濾波器的故障診斷系統,實現了對衛星姿態控制系統傳感器和執行器故障的有效估計.現有智能容錯控制方法大多利用神經網絡方法[7-8],通過對權值的自動調節來實現自適應容錯控制,但由于神經網絡存在權值在線調節復雜,網絡結構難于確定等缺點,在很大程度上限制了其應用.核學習方法[9-10]能逼近任意非線性函數,且能夠利用所謂的“核技巧”通過內積運算來越過非線性映射,從而避免了維數災難以及因“降維”所導致的性能下降問題,已被廣泛地應用于非線性系統參數辨識、控制等領域,也為非線性故障的診斷及容錯控制提供了新的途徑.
文獻[11]采用內模控制原理,給出了多狀態時滯系統的容錯控制器設計方法,但沒有考慮非線性情況下的容錯控制問題.文獻[9]將多核學習支持向量機方法應用于變壓器故障診斷,但沒有進一步考慮故障的補償.本文針對衛星模型存在的非線性和外部干擾特性,考慮傳感器和執行機構存在故障的姿態控制問題,在充分利用星上硬件冗余條件基礎上,提出一種將在線核學習方法與自適應內模控制相結合的容錯控制方法.該方法在繼承自適應內模控制優點的同時,引入了一種基于正交匹配追蹤思想的在線核學習算法,利用所提出的在線學習算法來補償原系統的逆模型,有效地保證了故障后原系統與補償后的逆模型保持逆的關系,使得故障后系統能夠有效地跟蹤輸入信號,達到自適應容錯控制的目標.最后,將該方法應用于衛星的姿態控制.
衛星非線性動力學模型方程為

式中:φ、θ、ψ分別為參考坐標系的3個姿態角:滾轉角、俯仰角和偏航角,ωo為軌道角速度,Ix、Iy、Iz為各軸的轉動慣量,Tx、Ty、Tz分別為3個軸上的控制量,即執行機構產生的控制力矩,Tdx、Tdy、Tdz分別為3個軸上的外部干擾力矩.
考慮非線性系統u(t)=[TxTyTz]T∈R為系統輸入,y(t)=[φ θ ψ]T∈R為系統輸出,R為有界緊集,系統輸入輸出階次分別為m和n(m≤n).則動力學模型可描述為

式中:F(g)是定義在R上關于各變量連續的非線性函數,且滿足線性增長性條件,即存在正常數ηi(1≤i≤m+n)使下式成立.

針對由微分方程描述的衛星非線性系統,先利用在線核學習算法求得其逆系統,再將逆系統與原非線性系統復合成偽線性系統引入內模控制中,實現故障后系統的自適應容錯控制.系統結構如圖1所示,其中內模控制中內部模型為理想的α階積分環節,內模控制器為濾波器與模型逆的乘積,偽線性系統的輸入為u,輸出為y*,閉環系統的參考輸入為r,輸出為y,d為干擾力矩.基于核學習算法的在線補償模塊用于辨識系統發生故障時產生的變化:無故障時,誤差值小于算法所設定的門限,辨識算法不啟動.故障發生時,逆系統與原系統輸出之間的誤差變大,核學習算法利用力矩差值作為目標函數進行在線學習,對故障狀況下的系統進行補償.

圖1 基于在線補償的IMCFig.1 IMC based on online compensation
設圖1中偽線性系統的傳遞函數為G(s),內部模型為Gm(s),內模控制器為GIMC(s).由于非線性建模誤差的存在,G(s)可看成若干線性定常系統組成的模型集合π,在頻域中可描述為

引理1 對于單位負反饋控制系統,具有建模誤差的被控對象傳遞函數為 Gp(s),其模型為Gm(s),控制器傳遞函數為Gc(s),則保證閉環系統穩定的充要條件為

定理1 對于圖1所描述的內模控制系統,保證閉環系統穩定的充要條件為

證明:由圖1可知系統的閉環傳遞函數為

其等效開環傳遞函數為

從而,可以得到單位負反饋系統控制器的傳函:

式(1)由引理1可得

顯然可得

證畢.
本文所設計的自適應容錯控制系統中的內模控制器為GIMC(s)=F(s)(s),代式(2)有

當衛星系統出現故障后,系統模型發生未知變化,要精確求得系統的逆模型難以實現.本文提出了一種基于正交匹配追蹤的在線核學習算法,通過輸入輸出樣本辨識出逆系統的結構,對故障后逆系統進行補償.

圖2 基于在線補償的辨識結構Fig.2 Identification structure based on online compensation
假設非線性系統Σ:u→y的動力學模型可用一個輸入到輸出的非線性映射算子θ表示為


式中:yinv為可微函數為逆映射算子.

本文采用基于正交匹配追蹤的在線核學習算法補償故障后偽線性系統的α階積分逆系統.
假設H為信號空間,集合D為N維希爾伯特空間中的向量集合,定義目標函數f∈H的一個最優估計為[,通過參數 αn,gγn∈D 的選擇使殘差函數‖f-~f‖最小化.匹配追蹤就是在集合D中尋找最能準確表示f內積結構的子集來線性表示f函數,利用D在空間上的正交映射來連續估計f函數.對于f的k階模型可分解為

式中:Rkf表示第k次估計后的殘差.
由k階估計模型更新到k+1階時,表示為


式中:<γk,xn> =0,n=1,2,…,k.
利用輔助模型方程(5),可以表示由k階模型,更新到k+1階估計模型的形式,且表示為

匹配追蹤算法的思想是尋找xnk+1∈D/Dk,使得

如果|<Rkf,xnk+1> |<δ,δ>0,則算法終止.輔助方程中bk可以通過求解方程Vk=Akbk獲得,δ>0確保了Ak的非奇異性,可得bk=(Ak)-1Vk,其中

將在線核學習方法引入正交匹配追蹤算法可以分解成以下3個問題:
2)基向量的取舍:使新樣本加入集合Dk中的計算的問題.當一個新的樣本被觀測到后,由于在線算法在每個時刻獲得的觀測量不可能都與集合Dk中的向量正交,因此這里分2種情況來求解
情況1 新觀測樣本xk+1經映射后不能被集合Dk中的映射樣本{φ(x1),φ(x2),…,φ(xs)}線性表示,即 < γk,φ(xn)> ,γk≠0 時.式中:表示系數向量n=1,2,…,k.

情況2 新觀測樣本xk+1經映射后的φ(xk+1)能夠被集合Dk中映射樣本{φ(x1),φ(x2),…,φ(xs)}線性表示,即 γk≈0 時,根據 Backfitting 算法[13],需要對整個表達式進行更新,更新式可以寫成:

3)核矩陣的遞歸計算:為了能夠減少在線計算量,這里給出2種情況下核矩陣的迭代方程,以減少在線計算量.根據上述的2種情況:
情況1 新觀測量xk+1映射后的φ(xk+1)能線性表示,不需要更新集合 Dk時,(Ak+1)-1=(Ak)-1.
情況2 新觀測量xk+1映射后的φ(xk+1)不能線性表示時,即Ak+1≠Ak,可通過下面的公式迭代計算得到(Ak+1)-1:

綜合上述分析,基于正交匹配追蹤的在線核學習算法可表述為:
初始化:選取參數 v,δ(v,δ>0),令

1)獲得新樣本(xk+1,yk+1);
2)如果|<Rkf,xk+1> |<δ,返回1),獲取新本;否則,計算 bk+1=(Ak)-1kk+1,δk+1=~kk+1-
若 δk+1< v,則按照式 (7)計算 αk+1,且(Ak+1)-1=(Ak)-1,Dk+1=Dk;
否則,按照式(8)計算 αk+1,并更新(Ak+1)-1,Dk+1=Dk∪{xk+1}.
3)返回1),獲取新樣本.
為了驗證本文中提出的自適應容錯控制方法的有效性,將在線補償的偽線性系統引入到內模控制中,并應用Matlab/Simulink軟件分別對系統傳感器和執行機構故障進行了仿真分析,衛星的轉動慣量為 Ib=diag(1.977,2.466,2.577),kg·m2.衛星的執行機構選為反作用飛輪,且外部干擾力矩分別為Tdx=A0(3cosω0+1),Tdy=A0(1.5sin ω0t+3cosω0t),Tdz=A0(3sin ω0t+1),其中,A0=1.5 ×10-5N·m為干擾力矩幅值.衛星初始值設定為ω0=0.001 105 8,rad/s初始角度誤差為[-0.18,-0.74,0.22],rad; 初 始 角 速 度 誤 差 為[0.008 727 8,-0.009 831 3,-0.004 362 2],rad/s.
由于涉及的故障為時間t的函數,因此輸入中加入了時間因素并對輸入輸出進行歸一化處理,且選取高斯核函數的寬度取為σ=1,在線辨識方法參數選為 δ=0.001,v=0.001.另外,內模控制中的濾波器選取二型濾波器,為了減小控制量,濾波器參數設置為λf=1,使系統能夠完全抑制階躍和斜坡擾動.
假設x軸傳感器在t=100 s時姿態角發生大小為1 rad階躍型故障,而其他傳感器正常工作,仿真結果如圖3所示.

圖3 傳感器故障下容錯控制仿真結果Fig.3 Simulation results of fault-tolerant control system with sensor failure
可見,x軸傳感器發生故障時,由于采用內模控制方法,系統能夠自適應地調節傳感器故障,故障消失后,系統仍能有效跟蹤輸入,故障并不影響輸出,因此不需要在線補償調整.
假設x軸反作用飛輪在t=50∶150 s時發生大小為0.5 sin t(N·m)的故障,而其他反作用飛輪正常工作.由于考慮的執行機構故障為非線性故障且為時間t的函數,因此,仿真中在線辨識模型的輸入部分加入了時間因素,仿真結果如圖4所示.可見,執行器發生故障時,逆模型已不能正確表示故障后的系統逆模,造成輸出偏差較大,在線補償算法啟動,對系統逆模型誤差進行補償,補償后的系統能夠有效跟蹤輸入,衛星的指向精度降低于0.2°.


圖4 執行機構故障下容錯控制仿真結果Fig.4 Simulation results of fault-tolerant control system with actuator failure
針對衛星存在外部干擾力矩影響和傳感器、執行機構存在失效故障的問題,本文提出了一種基于在線核學習算法補償的自適應容錯控制方法.該方法通過辨識干擾所造成的模外動態誤差,可有效補償故障后系統的逆模型,使之能夠準確地表達故障系統的逆.并且,將故障后逆模型與原系統組成的偽線性系統引入衛星姿態系統的內模控制進行仿真驗證,仿真結果表明該方法在保證系統一定性能品質的情況下,能夠實現故障的容錯控制,具有一定的應用前景.
[1]GAO Z F,JIANG B,SHI P.Sensor fault estimation and compensation for microsatellite attitude control systems[J].International Journal of Control Automation and Systems,2010,8(2):228-237.
[2]JIN J,KO S,RYOO C K.Fault tolerant control for satellites with four reaction wheels[J].Control Engineering Practice,2008,16(10):1250-1258.
[3]VARMA S,KUMAR K D.Fault tolerant satellite attitude control using solar radiation pressure based on nonlinear adaptive sliding mode[J].Acta Astronautica,2010,66(3):486-500.
[4]HENRY D.Fault diagnosis of microscope satellite thrusters using H-infinity/H-filters[J].Journal of Guidance,Control,and Dynamics,2008,31(3):699-711.
[5]CAIW C,LIAO X H,SONG Y D.Indirect robustadaptive fault-tolerant control for attitude tracking of spacecraft[J].Journal of Guidance,Control,and Dynamics,2008,31(5):1456-1463.
[6]HOU Q,CHENG Y H,LU N Y,et al.Study on FDD and FTC of satellite attitude control system based on the effectiveness factor[C]//2nd International Symposium on Systems and Control in Aerospace and Astronautics.Shenzhen,China,2008:1096-1101.
[7]朱大奇,孔敏.基于平衡學習的CMAC神經網絡非線性滑模容錯控制[J].控制理論與應用,2008,25(1):81-86.ZHUDaqi,KONGMin.Fault-tolerant controlofnonlinear system based on balanced learning CMAC neural network[J].Control Theory& Applications,2008,25(1):81-86.
[8]趙峻,孫偉,王雪松.基于神經網絡的非線性系統軌跡線性化自適應容錯控制[J].控制與決策,2011,26(6):902-906.ZHAO Jun,SUNWei,WANG Xuesong.Adaptive fault-tolerant control of nonlinear systems using trajectory linearization based on neural network[J].Control and Decision,2011,26(6):902-906.
[9]尹玉娟,王媚,張金江,等.一種自主核優化的二值粒子群優化-多核學習支持向量機變壓器故障診斷方法[J].電網技術,2012,36(7):249-254.YIN Yujuan,WANGMei,ZHANG Jinjiang,et al.An autonomic kernel optimization method to diagnose transformer faults bymulti-kernel learning supportvector classifier based on binary particle swarm optimization[J].Power System Technology,2012,36(7):249-254.
[10]SONG H Z,ZHONG L,HAN B.Structural damage detection by integrating independent component analysis and support vector machne[J].International Journal of Systems Science,2006,37(13):961-967.
[11]吳軍生,翁正新,田作華,等.基于廣義內模控制的時滯系統主動容錯控制設計[J].上海交通大學學報,2009,43(3):417-421.WU Junsheng,WENG Zhengxin,TIAN Zuohua,et al.Active fault tolerant control design for time-delay systems based on generalized internal model control[J].Journal of Shanghai Jiaotong University,2009,43(3):417-421.
[12]PATIY C,REZAIIFAR R.Orthogonal matching pursuit:recursive function approximation with applications to wavelet decomposition[C]//Proceedings of the Twenty-seventh Asilomar Conference on Signals Systems and Computers.Pacific Grove,USA,1993,40-44.
[13]PASCAL V,YOSHUA B.Kernel matching pursuit[J].Machine Learning,2002,48(1/2/3):165-187.