殷春武 佟 威 何 波
西安建筑科技大學信息與控制工程學院,西安 710055
航天器在執行空間任務時,必須保證其姿態穩定,但受環境和航天器自身運動的影響,航天器的姿態常會發生偏移,姿態跟蹤控制器主要用于航天器的姿態穩定控制。航天器一方面受導航帶寬及角速度陀螺量程的限制,存在角速度有界約束,另一方面,航天器附件的形狀改變(如機械臂伸展、太陽帆展開)會帶動其質心偏移,導致姿態控制系統中的參數發生未知攝動。因此,研究存在角速度有界約束、參數攝動及外部干擾等約束下的姿態跟蹤控制,具有重要的實際工程應用價值。
學者在不同的假設條件下,采用非線性控制理論和方法,設計了不同的航天器姿態跟蹤控制器[1-5],其中滑模控制因其對參數攝動的強魯棒性,被廣泛應用于干擾上界已知條件下的姿態跟蹤控制器設計[1-2]。實際工程應用中,轉動慣量攝動和外部干擾的上界均不可能預先知道,因此,航天器動力學方程的干擾上界已知的假設并不成立。為解決航天器動力學方程的干擾上界未知的問題,學者利用自適應技術[3-4]或智能逼近技術[5-6]對上界未知干擾進行估計或補償,設計自適應姿態跟蹤控制器,解決了航天器姿態控制系統中存在未知參數攝動的問題。但這些自適應姿態控制器在設計過程中,并沒有考慮角速度有界的約束問題,且控制器結構較為復雜,無形中會增加航天器的故障率。因此,考慮角速度有界約束和簡化控制器結構,提升姿態控制器的魯棒性是本文的主要研究目的。
航天器角速度有界約束是當前學者關注的熱點問題[7-9]。為滿足角速度有界約束,學者主要采用障礙李雅普諾夫函數設計姿態控制器,但仿真結果顯示,該控制器下的航天器角速度會不斷振蕩,影響航天器姿態收斂的動態品質。為解決角速度收斂震蕩的問題,本文將通過規劃角速度變化軌跡,使角速度平滑收斂到0,提升姿態收斂的動態品質。
反演控制具有設計便利的優勢,本文對反演控制進行簡化,根據航天器姿態控制系統的特點,給出一種雙環跟蹤控制策略。為提升控制器的魯棒性,將極限學習機逼近技術和滑??刂萍夹g用于雙環姿態跟蹤控制器的設計中。在雙環跟蹤控制過程中,最關鍵的問題是要求實際角速度在有限時間內精確跟蹤上預設虛擬角速度,因此將有限時間控制用于本文姿態跟蹤控制器的設計。終端滑模控制因具有較好的魯棒性和抗干擾性,被廣泛應用于非線性系統的有限時間控制器設計中[10]。本文將構建一個基于角速度跟蹤誤差的非奇異終端滑模面,使角速度跟蹤誤差在有限時間內收斂到0。設計極限學習機逼近未知攝動部分,構造自適應姿態控制器,最終實現整個閉環系統的漸近穩定性。該控制策略解決了航天器角速度有界的約束問題,簡化了控制器結構,使航天器對參數攝動和外部干擾具有較強的魯棒性,保證航天器的姿態收斂軌跡具有較優的動態品質。

基于單位四元數{q0,q}={q0,q1,q2,q3}的航天器姿態運動學方程為

(1)

考慮外部干擾的姿態動力學方程為:
(2)
式中,J=JΤ∈R3×3為轉動慣量陣,設J0為名義轉動慣量,ΔJ為轉動慣量攝動量,則J=J0+ΔJ。d∈R3為干擾力矩;u∈R3為控制力矩;ω×為ω=[ω1,ω2,ω3]Τ的反對稱矩陣

(3)

q(t)→0,ω(t)→0
(4)
在設計控制器前,先給出如下引理。
引理1[12]:如果存在正定Lyapunov函數及參數λ1>0,λ2>0和0<α<1滿足:

(5)
則系統狀態能夠在有限時間內到達原點,且到達時間為:

(6)

機器學習方法能有效提升擬合精度,結合實際的生物習性等,學者提出了一系列的機器學習方法,早期的機器學習方法有人工神經網絡(BP),支持向量機(SVM),但是實際工程應用中發現,BP神經網絡計算復雜,SVM擬合速度很慢,而基于神經網絡提出的極限學習機(Extreme Learning Machine ,ELM)通過隨機產生隱層結點參數,再利用計算的外權決定輸出,大大簡化了傳統神經網絡復雜的迭代過程,在保證高精度擬合的基礎上降低了外權的運算量[14]。下面給出極限學習機的建模原理。


(7)
其中,ai=[ai1,ai2,…,ain]Τ∈Rn是第i個隱含層結點連接所有n個輸入結點的連接權重向量;wi=[wi1,wi2,…,wim]Τ∈Rm是第i個隱含結點連接所有m個輸出結點的連接權重向量,其中ai·xj表示向量ai和向量xj的內積。
經過對N個樣本的不斷學習則有如下線性矩陣方程成立:
HW=Y
(8)
其中,


H一般稱為神經網絡隱含層輸出矩陣,其中H的第i個列是第i個關于輸入x1,x2,…,xN的隱含層結點輸出。
雙環姿態跟蹤控制器的結構圖如圖1。其主要思想是將航天器姿態動力學系統(1)和(2)分解為2個獨立的子系統—內環和外環。將子系統(1)中的ω看作輸入,設計虛擬控制器ωv,使子系統(1)跟蹤上期望姿態qd。再將ωv看作子系統(2)的期望軌跡,設計控制器u,使子系統(2)在有限時間內精確跟蹤上ωv,形成有限時間雙環跟蹤控制策略。
為滿足航天器角速度有界的物理限制,提升姿態收斂速度,對子系統(1)設計虛擬角速度:
ωv=-ωTtanh(k1q)
(9)
式中,ωT>0為ωv的最大允許值;tanh(·)為雙曲正切函數,常數k1>0。
設Lyapunov函數V1(q)=(q0-1)2+qΤq,則

(10)
將式(1)中的ω用ωv代替,有

(11)
根據Lyapuno穩定性理論容易推出,當t→∞時,q0→1,q→0。
下面設計控制器u使ω有限時間內跟蹤上ωv。定義實際角速度ω與虛擬角速度ωv的跟蹤誤差 :
e=ω-ωv
(12)

圖1 自適應雙環跟蹤控制結構圖
定義非奇異終端滑模面為:

(13)

定理1: 考慮動力學系統(2),則由式(12)和(13)確定的非奇異終端滑模面滿足σ=0時,系統能夠在有限時間內收斂于{e≡0}。



(14)


(15)
下面基于滑模面(13)設計姿態控制器。


(16)


(17)


(18)
設計非奇異終端滑模雙環跟蹤自適應姿態控制器和自適應更新律為:

(19)

(20)

(21)

定理2:針對存在外部干擾的航天器動力學系統式(2),姿態控制器式(19)和自適應律式(20)和(21)能保證系統式(2)漸近收斂到滑模面σ=0。
綜合以上分析,可得到如下定理。
定理3: 航天器姿態動力學系統式(1)和(2)在姿態控制器式(19)和自適應律式(20)和(21)下全局漸近穩定,且當t→∞時,q(t)→0,ω(t)→0。
該證明過程同文獻[15]。
注:當采用反演控制設計控制器時,需要構建Lyapunov函數V5=V1+V4,反演控制器為

(22)
式(22)比式(19)多了一項σ(σσΤ)-1(qΤe)。通過該項可以得到,在滑模面上時,控制力矩將達到∞。
航天器在完成對非合作目標的抓捕過程中,其轉動慣量會從初始轉動慣量J0開始,產生非線性攝動。其中攝動量ΔJ的變化特性可表示為[15]:

(23)
其中:λ1(t)為機械臂伸展過程中轉動慣量增長速度。λ2為抓捕非合作目標后轉動慣量突增比例,實際抓捕過程中,該參數未知,但有界。λ3(t)為機械臂回收過程中轉動慣量遞減速度。T0和T1分別為抓捕目標時間和完成機械臂回收時間。
外部干擾d為(單位:N·m,ωΔ=0.1)

式中,3rectpuls(t-T0,0.1)表示航天器在抓捕非合作目標瞬間,受到非合作目標的反帶動,會產生一個持續0.1s的瞬間方波強干擾。
采用ELM逼近中,隱層節點個數為6,激活函數為
仿真時間為80s,仿真參數見表1。
圖2~5分別為航天器姿態角變化曲線、控制力矩曲線、實際角速度與預設虛擬角速度的變化曲線及滑模面的變化曲線。
圖2顯示,基于非奇異終端滑模雙環跟蹤姿態控制器,航天器的姿態角呈指數收斂到0。在第20s抓捕非合作目標的瞬間,被控系統出現0.1s的方波瞬態強干擾下,圖3中的控制力矩有一個相對較大的波動,圖5中的滑模面也在第20s有個突變,但姿態收斂軌跡沒有發生任何改變,說明本文控制器能使抓捕航天器的姿態快速穩定,具有較強的魯棒性和抗強干擾能力。

表1 航天器仿真參數

圖2 姿態角變化趨勢

圖3 控制力矩變化曲線

圖4 ω和ωv軌跡曲線

圖5 滑模面的軌跡

對存在轉動慣量攝動、外部干擾和角速度有界約束的航天器姿態控制,給出了一種有限時間雙環跟蹤控制策略。
1)先對運動學方程預設有界虛擬角速度,并將該虛擬角速度作為動力學方程的期望軌跡,設計姿態控制器,使動力學方程的角速度輸出在有限時間內精確跟蹤上預設虛擬角速度,并按照虛擬角速度軌跡收斂到0,滿足了航天器對角速度有界的物理約束;
2)構建了非奇異終端滑模面,當跟蹤誤差到達滑模面,其能在有限時間內收斂到0。基于非奇異終端滑模面設計了魯棒姿態控制器,使實際角速度在有限時間內精確跟蹤上期望角速度;
3)采用極限學習機技術對含未知轉動慣量的部分進行逼近,設計自適應律估計逼近誤差和外部環境干擾構成的復合干擾,增強了姿態控制器的魯棒性,擴大了該控制器的使用范圍。實際仿真結果顯示,對瞬間產生的外部強干擾,該控制器也具有較好的控制效果。