殷澤陽,羅建軍,,魏才盛,王嘉文
1. 西北工業大學 航天學院,西安 710072 2. 西北工業大學 航天飛行動力技術重點實驗室,西安 710072
隨著航天技術的發展與應用,越來越多的航天器被發射進入地球軌道,并在任務完成后成為非合作航天器,對在役航天器的安全造成巨大威脅[1]。使用服務航天器利用抓捕裝置(如機械臂等)對非合作航天器進行抓捕并形成剛性組合體,隨后利用服務航天器上的姿態運動執行器對其進行姿態接管控制,為處理非合作航天器提供了新的解決方案[2]。對非合作航天器進行姿態接管后,可為其提供軌道和姿態控制,進而實現在軌位置保持、軌道修正、姿態機動、拖曳離軌等操作,因而具備重要的理論研究意義和工程應用價值[3-4]。
針對非合作航天器捕獲后的組合體姿態接管控制,目前已有一些研究工作。按照對參數信息的了解程度,大體可以分為4類:參數已知、參數辨識后已知、參數近似已知和參數完全未知4種。參數已知的方法中,針對機械臂抓捕非合作目標后的組合體穩定控制問題,劉厚德等[5]基于機器人動力學提出了組合體航天器姿態穩定協調控制方法,利用機械臂特性對非合作目標進行協調控制。文獻[2,6]利用狀態相關里卡迪方程方法設計姿態穩定最優控制器,并利用θ-D方法對最優控制器進行快速求解。然而在實際工況中我們往往無法獲得系統的精確參數,因此基于精確系統參數的控制方法在應用中很受局限。第2類控制方法使用辨識算法對系統參數進行在線辨識,并假設辨識后的參數可靠。文獻[7-8]利用機器人動力學特性對非合作目標慣量矩陣進行參數辨識。韋文書等[9]則利用反饋信息,利用自適應規劃方法對非合作航天器的質量特性和慣量矩陣信息進行辨識,并利用滑模控制方法對組合體進行穩定控制。但是,基于辨識方法的組合體控制方法往往計算量比較大,很難在線快速實現;此外,當非合作目標存在姿態力矩輸入時,上述辨識過程也很難實現。第3類方法假設非合作目標參數近似已知,并使用自適應控制方法實現在線自適應控制。文獻[4,10]利用動態逆方法對組合體航天器進行姿態接管控制,并在控制器中加入自適應因子,來應對參數不確定性對系統的影響。這類控制方法能夠對參數不確定性具有一定的魯棒性,但當參數變化范圍大或者劇烈時變時,其控制性能有限。第4類方法假設非合作航天器參數完全未知,目前相關文獻較少。文獻[11]將無模型預設性能控制方法應用于航天器的姿態跟蹤控制上,并設計了與慣量矩陣無關的控制器。但其模型轉化方法存在缺陷,會導致控制器奇異;此外其控制器并非完全無模型的,還需要系統的部分參數。綜上,對非合作目標進行姿態接管控制仍存在很多挑戰。首先,由于目標航天器是非合作的,因此其動力學參數應是完全未知的。基于參數的控制方法在實際工況下無法獲得理想的結果。另外,非合作目標還可能存在時變的參數不確定性,甚至可能存在服務航天器未知的姿態輸入力矩,這要求控制器具有極強的魯棒性。最后,絕大多數控制方法對于其控制結果均不含有先驗估計,姿態軌跡收斂過程無法預先得知,在復雜的空間環境中容易發生碰撞、失穩等情形。
本文針對參數完全未知、存在時變不確定性和非合作控制力矩的組合體航天器系統的姿態接管控制問題,基于預設性能控制理論提出一種無需參數辨識的無奇異預設性能控制方法。在建模方面,將傳統的姿態跟蹤運動模型轉化為不含奇異項的拉格朗日型姿態跟蹤運動模型;在控制器設計方面,利用跟蹤微分器構造了不包含角速度信息的廣義狀態量,進而結合預設性能框架設計了無需辨識的預設性能控制器,并證明了系統狀態在控制器的作用下滿足預設的性能范圍;在控制分配方面,使用基于序列二次規劃的動態控制分配算法進行高效的分配,保證控制系統的低復雜度;在仿真方面,設計了兩組仿真實驗,驗證了本文方法對外部干擾、時變不確定性和目標產生的非合作力矩的魯棒性。區別于此前的姿態接管控制方法[2-10],本文的控制方法具有如下3方面的優勢:① 本文允許組合體參數(慣量矩陣信息)完全未知,可以應對絕大多數的組合體航天器控制問題;② 本文可以對組合體姿態的收斂軌跡邊界進行提前預設,并能保證系統在預設性能范圍內進行收斂穩定,能夠從理論上保證組合體航天器系統的性能和安全;③ 本文不包含復雜的參數辨識過程,計算復雜度低,適合在線應用。
本文所探討的組合體航天器系統(圖1)由可視為剛體的服務航天器、構型可變的非合作目標,以及兩個空間機械臂組成[6,12]。其中,左臂有nL個關節,右臂有nR個關節,每個關節均為一個自由度。在實際控制任務中,往往期望服務航天器接管非合作目標的姿態運動,并使組合體跟蹤期望的姿態運動軌跡進行姿態運動。本文采用修正羅德里格斯參數(MRP)誤差σe=[σe1σe2σe3]T∈R3來描述接管控制過程中組合體航天器的姿態MRP與期望MRP間的關系。其定義為[13-14]

圖1 兩機械臂組合體航天器系統示意圖Fig.1 Illustration of combined spacecraft with two arms

(1)

假設1MRP誤差σe在控制過程中是精確可知的。
注1當組合體航天器的本體坐標系與追蹤航天器本體坐標系的三軸指向定義相同時,組合體航天器的姿態定義和確定方法與原追蹤航天器是相同的,因此假設1是合理的。

(2)
式中:ω=[ω1ω2ω3]T、ωd=[ωd1ωd2ωd3]T和ωe=[ωe1ωe2ωe3]T分別為組合體航天器的真實角速度、期望角速度和角速度誤差,且滿足ωe=ω-ωd;ω0為組合體航天器的軌道角速率;
矢量R3的定義為
叉乘算子[·×]對于任意三維向量?=[?1?2?3]T定義為
矩陣Geσe∈R3×3的定義為
(3)
式中:I3×3為三維單位矩陣。值得注意的是,矩陣Ge(σe)為非奇異矩陣,且當σe有界時其也為有界矩陣。

(4)
組合體航天器的主動控制力矩矢量為

(5)
文獻[6]嚴謹地推導了組合體航天器的慣量矩陣J∈R3×3的解析形式,具體如下:
(6)


針對式(2)所示的組合體航天器姿態跟蹤運動模型,可作出如下合理假設:
假設2[14]機械臂的所有關節在完成非合作目標抓捕后鎖死,服務航天器及機械臂的構型在姿態接管控制過程中保持不變。
假設3非合作目標的慣量矩陣在接管控制過程中完全未知,且可能由于非合作目標的構型改變發生變化。
假設4由于測量條件的限制,在接管控制過程中,組合體航天器的角速度ω及角速度誤差ωe未知。

假設6非合作目標在被接管過程中不配合服務航天器的控制,存在有界的非合作控制輸入un。
假設7組合體航天器系統存在有界外部干擾力矩d。
文獻[11]首次將預設性能控制方法應用于航天器的姿態控制中,但其模型轉化方法存在理論缺陷:由于模型轉化方法的不恰當,姿態運動方程在歐拉角為±180°時發生奇異,進而導致控制器中存在奇異項,嚴重時甚至會導致系統失穩。本文提出了一種針對MRP誤差的非奇異拉格朗日型模型轉化方法。
基于式(2)和式(3),通過代數運算可以得到如下所示的拉格朗日型模型:
(7)
式中:
(8a)
(8b)
(8c)
很容易證明,在假設2~7下,上述拉格朗日型模型滿足如下性質:
性質1矩陣Aσe滿足對稱正定性,且當MRP誤差σe有界時,Aσe及其逆矩陣A-1σe均滿足有界性。


MRP誤差σe及角速度誤差ωe是控制器設計中的核心狀態信息。然而在很多情況下,由于電力供應的約束及傳感器精度和造價的限制,往往無法獲得控制器所需的精確角速度信息,也就無法求得角速度誤差信息[15]。因此,近年來無角速度測量信息的航天器姿態控制理論成為一個重要研究方向。考慮到基于運動學的角速度觀測方法理論復雜,工程應用繁瑣[15],因此文獻[16-17]中基于全狀態反饋的預設性能控制方法無法直接進行工程應用。

(9)
式中:v1i與v2i為跟蹤微分器的狀態量;0<μ0<1,μ1>0與μ2>0為微分器的可調參數。


(10)
注2文獻[18]的定理3指出,當微分器的輸入量(即本文的姿態信息)存在隨機干擾噪聲時,微分器能夠對噪聲進行濾波降噪,使得微分器的狀態v1i逼近于σei的真值。因此,在實際工程應用中,若遇到姿態傳感器存在噪聲的情形,可以使用v1i近似替代姿態信息σei,從而降低噪聲的影響。為保證理論的嚴謹性,在本文的理論證明部分仍然假設姿態信息σei是精確可知的,只分析微分器跟蹤誤差ξi對控制器的影響。

z(t)=σe(t)+λv2(t)
(11)

基于上述討論,結合文獻[16-17]中預設性能控制的概念,本文的控制目標可以總結如下:
針對式(7)所示的組合體航天器姿態誤差拉格朗日型模型,在無需具體系統參數的前提下設計一種魯棒控制器,使得
1) 廣義狀態量z(t)及MRP誤差σe始終保持有界。
2) 廣義狀態量z(t)的每一維狀態量zi(t) (i=1,2,3)至少以指數速度收斂。
3) 廣義狀態量z(t)的每一維狀態量zi(t)(i=1,2,3)最終將收斂到用戶預設的穩定域內。
預設性能控制理論通過對系統狀態量設置性能邊界,進而約束狀態量的收斂軌跡[16-17]。針對廣義狀態量zi(t)(i=1,2,3),可設計如下所示的上下界邊界約束:
-αi(t) (12) 式中:αi(t):R+→R+為預設性能函數(PPF)。PPF約束下的狀態量可通過圖2進行闡釋。為了綜合考慮系統的穩態和瞬態性能,PPF可設計為如下指數遞減的正值函數: (13) 圖2 PPF約束下的廣義狀態量示意圖Fig.2 Illustration of extended states under PPF 對于任意變量?(t),定義單調遞增的一一映射函數h(?):-1,1→R為 h?=tanh-1? (14) 基于該一一映射函數,可以構建無約束的映射狀態變量s=[s1s2s3]T∈R3: sizi(t),αi(t)=hzi(t)/αi(t) (15) 為了簡潔性,后文中將sizi(t),αi(t)簡寫為si(t)。通過上述映射,將廣義狀態量zi(t)在區間-αi(t),αi(t)內的約束控制問題轉化為si(t)的無約束控制問題。 對映射狀態量求導可以得到 (16) 式中:θi(t):=θisi(t)=tanhsi(t);ri(si(t),t)=(?θi(t)/?si(t))αi(t),且 將式(7),式(11)代入式(16),可以得到 (17) 式(17)也可以整理為 (18) 基于上述討論,可設計如下所示的姿態接管非奇異預設性能控制器: (19) 式中:k>0為控制器的可調增益,可任意選定。 從上述控制器中可以看出,區別于文獻[11]中的姿態預設性能控制器,本文所設計的控制器計算過程中不包含任何的系統參數信息(慣量矩陣信息),是真正的無模型預設性能控制器;再者,控制器中不包含任何可能導致奇異的項,控制性能穩定;此外,區別于文獻[11]中的增益設計,其增益必須足夠大才能保證控制系統穩定,而本文中的控制增益可任意選定;最后,控制器形式非常簡潔,計算的過程中不含任何參數辨識過程或復雜的迭代過程,是一種低復雜度的無辨識控制方法。 首先給出穩定性分析所需要的一個定義與兩個相關的引理。 定義1[19]考慮如下所示初值有界的系統: (20) 式中:x(t)∈Rn;fx(t),t:Rn×R+→Rn為局部可積的非線性函數;初值邊界ζx為一非空開集。若該非線性系統某個解的所有右擴展均不是該系統的解,則定義該解為系統式(20)的最大解。 引理1[19]針對非線性系統式(20),對于任意tmax>0,給出系統在時間區間0,tmax上存在唯一的最大解x(t)∈ζx的一個充分條件:非線性函數fx(t),t在時間區間0,tmax上對于任意x(t)∈ζx均保持連續,且滿足局部Lipschitz條件。 基于上述定義和引理,本文給出如下定理: (21) 在時間區間0,tmax上構造系統關于映射狀態量s的李雅普諾夫函數V=sTs/2。對該李雅普諾夫函數展開可得 (22) (23) 和 (24) 結合式(22)~式(24),可以得到 (25) 將式(19)中的控制器代入式(25)有 (26) 進而考慮逆映射θi(t):=θisi(t)= tanhsi(t)。由于tanhsi(t)在-∞,+∞到-1,1間也為單調遞增的一一映射,顯然可以得到: θi(t)∈-tanhρ,tanhρ∈-1,1 (27) tmax=+∞ (28) 最后我們將證明MRP誤差σe始終保持有界。考慮廣義狀態量z(t)的定義式(10),該式可以寫為 (29) 式中:wi=1/λi。對式(29)積分可以得到 (30) 將式(27)代入式(30)可以得到 (31) 綜上,定理1證明完畢。 在實際控制中,式(19)計算得到的組合體航天器理想的三軸控制力矩u,要通過4個反作用飛輪的力矩uw共同作用實現,即式(5)。為解決反作用飛輪可能發生飽和的情形,同時兼顧計算效率,本文采用基于序列二次規劃的動態控制分配算法[20]解算實際力矩uw。令反作用飛輪的控制力滿足如下上下界約束: -umax≤uwi(t)≤umaxi=1,2,3,4 (32) 則動態控制規劃問題可以描述為如下所示序列二次規劃的形式: (33a) (33b) 為提高計算效率,在當前執行器最優集均不發生飽和現象時,即最優集ζu內的uw(t)均滿足約束條件(32)時,式(33a)存在如下所示解析解: (34) 式中: (35) 通過該解析解可以高效地計算出最優飛輪控制力矩uw(t)。 在本節中,為了驗證姿態接管無辨識控制器式(19)的有效性,本文設計了兩組仿真如下:在5.1節中,為了驗證預設性能算法的有效性和性能優勢,本文在存在強外部干擾和時變不確定性的條件下進行仿真,并與文獻[6]中改進狀態相關里卡迪方程控制方法和傳統的PID控制方法進行性能對比。在5.2節中,為了驗證控制器對非合作輸入的魯棒性,假設非合作目標存在以保持初始姿態為目標的非合作控制輸入,驗證本文方法對該非合作輸入的魯棒性。 本文采用與文獻[6]相同的組合體航天器參數進行數值仿真,采用本文控制器式(19)與文獻[6]中提出的改進狀態相關里卡迪方程控制方法(典型的基于模型參數的控制方法),以及傳統的PID控制方法進行對比仿真。具體仿真參數設置為:服務航天器在完成抓捕過程后,左側機 組合體航天器的初始瞬時歐拉角設置為[20°-20°15]T(初始MRPσ(0)=σ0=[0.087 5-0.087 50.065 5]T),初始角速度ω(0)和期望角速度ωd(t)均設置為0。 4個反作用飛輪的慣量均設置為Jwi=0.338 kg·m2(i=1,2,3,4);飛輪的控制輸入約束邊界為umax=1 N·m;飛輪的構型矩陣H設置為 文獻[6]在仿真中并未考慮干擾的影響,本節為模擬外部干擾的作用,組合體航天器的外部干擾力矩設計為 (36) 在服務航天器抓捕非合作目標形成組合體后,盡管服務航天器及其機械臂構型不發生變化,可視為剛體,但是非合作目標可能存在服務航天器未知的構型改變,進而導致組合體系統的參數發生改變。為模擬非合作目標構型的變化,本節假設組合體航天器的慣量矩陣存在時變的強不確定性,來驗證控制器對不確定性的魯棒性。具體為 J=J0+diag(500,400,300)· (1-cos(0.5t)) kg·m2 (37) 式中: J0=diag672.9,4 002.5,4 238.9 kg·m2 (38) 值得注意的是:本文提出的控制器和PID控制器對于J和J0是完全未知的,本文假設文獻[6]中的方法已知J0。 跟蹤微分器的參數設置為與文獻[18]相同:μ0=0.2,μ1=6和μ2=30。預設性能邊界函數相關的參數設計為 (39) 控制器相關的參數設置為 k=1,λ=diag(20,20,20) (40) 在本節仿真中,假設非合作目標不存在姿態控制,被動接受服務航天器的接管控制。仿真結果見圖3和圖4。 圖3給出了3種方法中MRP誤差隨時間的變化圖。從圖3(a)中可以看出,MRP誤差在本文提出的控制器作用下快速地收斂,并且收斂軌跡始終位于預設的性能邊界以內,滿足用戶的預設要求。從圖3(a)的子圖中可以得到:系統進入穩態后,穩態誤差極小,MRP誤差保持在2×10-5以內(姿態角誤差約為4×10-3(°)),系統成功收斂于預設的穩定域內。而文獻[6]方法(圖3(b))的求解過于依賴系統的數學模型,當本文的仿真引入強外部干擾式(36)和時變不確定性式(37)后,該方法的性能不再優秀,存在一定的穩態誤差,系統性能遜于本文提出的方法,并不適合于慣量矩陣完全未知的非合作目標姿態接管控制問題。PID控制器(圖3(c))作用下的系統收斂速度更為緩慢,且存在較大的穩態誤差。 圖4給出了姿態接管控制中3種方法的反作用飛輪的控制輸入力矩隨時間的變化圖。從圖中可以得到:本文方法航天器的控制力矩穩定且幅值較小,極少出現輸入飽和的情形,且對外部干擾和不確定性具有較強的補償作用。文獻[6]中的方法缺乏對模型的認知,對外部干擾和不確定性的補償作用十分有限。PID控制方法不但控制精度很低,在控制初期還出現了嚴重的控制飽和現象,十分不利于工程實現。 圖3 MRP誤差隨時間變化圖Fig.3 Variation of MRP error with time 圖4 飛輪控制力矩隨時間變化圖Fig.4 Control input of reaction wheels with time 除慣量矩陣未知和存在時變強不確定性外,非合作目標的非合作性還體現在其可能存在服務航天器未知的非合作姿態控制輸入,且該控制輸入的量級可能遠大于外部干擾,與服務航天器控制輸入量級相等或略小,這不但會影響系統的穩態精度,甚至會影響系統的穩定性。 本節假設非合作目標的控制目標是保持其初始姿態,即施加控制輸入,保證非合作目標保持在初始姿態σ0=[0.087 5-0.087 50.065 5]T上。為完成該控制目標,假設非合作目標會對組合體施加如式(41)所示非合作控制力矩(通過PD控制策略實現姿態保持): (41) 式中:kp為比例增益參數,在仿真中設置為kp=15;kd為微分增益參數,設置為kp=50。此外,假設非合作控制輸入un滿足如下輸入飽和約束,即 -0.8≤uni(t)≤0.8i=1,2,3 (42) 值得注意的是,服務航天器反作用飛輪的輸入uw飽和約束為 -1≤uwi(t)≤1i=1,2,3,4 (43) 該非合作輸入與服務航天器的控制能力相近,對組合體的接管控制提出了嚴峻的挑戰。 組合體航天器的其他參數及控制器參數設置與5.1節相同。仿真結果見圖5和圖6。 圖5給出了仿真過程中,非合作輸入力矩隨時間的變化圖。從該圖中可以看出,隨著非合作目標被迫遠離初始姿態,非合作目標施加的非合作輸入力矩越來越大,并很快達到飽和上下界±0.8 N·m。考慮到組合體執行器反作用飛輪的飽和上下界僅為±1.0 N·m,該非合作輸入對控制器的魯棒性提出了很高的要求。 圖6(a)給出了非合作控制輸入作用下,MRP誤差隨時間的變化圖。與不包含非合作輸入的MRP誤差結果圖(圖3(a))相比,MRP誤差收斂速度有所減緩,但仍處于預設的性能范圍以內。由于非合作輸入的存在,系統的穩態誤差有所增加,從2×10-5提升到2×10-4(姿態誤差角約為4×10-2(°)),但仍處于預設的穩定域以內。值得注意的是,MRP誤差的收斂速度和穩態誤差仍可以通過調整預設性能函數的參數進一步提升和減小。 圖6(b)給出了姿態接管控制中控制力矩隨時間的變化圖。盡管存在式(41)所示的強非合作輸入,且非合作輸入大部分時間均處于飽和約束邊界,但反作用飛輪能夠對非合作輸入起到較強的補償作用,保證系統收斂的瞬態和穩態誤差。 圖5 非合作控制輸入隨時間變化圖Fig.5 Variation of non-cooperative control input with time 圖6 MRP誤差和飛輪控制力矩隨時間變化圖(5.2節)Fig.6 Variation of MRP error and control input of reaction wheels with time (Section 5.2) 上述仿真結果說明本文所提出的控制器對非合作控制輸入并不敏感,具有極強的魯棒性。 1) 針對參數未知、存在時變不確定性和非合作控制輸入的組合體航天器系統的姿態接管控制問題,構造了不含奇異項的姿態跟蹤拉格朗日型系統,保證后續控制器設計的連續性和穩定性。 2) 提出了一種無需參數辨識的預設性能控制方法,證明了組合體系統變量的穩定性和有界性,并通過仿真結果表明:所提出的控制器能夠保證系統狀態量以預設的收斂速度收斂于預設的穩定域內,且對外部干擾、時變參數不確定性及非合作目標的未知姿態控制輸入具有很強的魯棒性。




3 控制器穩定性分析

















4 基于序列二次規劃的動態控制分配

5 仿真分析
5.1 組合體航天器姿態接管控制對比仿真分析








5.2 對非合作控制輸入的魯棒性分析



6 結 論