夏冬冬,岳曉奎
1. 西北工業大學 航天飛行動力學技術國家級重點實驗室,西安 710072 2. 西北工業大學 航天學院,西安 710072
由于空間任務的日益頻繁和深入,各國都相繼開展或實施了在軌服務技術研究。具體研究任務形式有:對報廢航天器的離軌操作,對失效航天器的在軌維修,對燃料耗盡航天器的在軌加注等等。總之,航天器的在軌服務成為目前航天技術必須面對和亟需解決的一個關鍵課題[1]。
為了對目標航天器進行在軌服務,通常服務航天器首先需要捕獲目標航天器。在捕獲前服務航天器需要能夠與目標航天器同步運動,以便對接;捕獲后兩者的組合體可能需要穩定或者重定向等[2],這些都需要控制航天器姿態和角速度能夠跟蹤上一個預定的參考軌跡。但是,由于燃料的消耗、航天器構型的變換或模塊的轉移以及對目標的捕獲組成雙星復合系統等,都會造成系統的慣性特性(質量、質心、轉動慣量矩陣)等發生較大變化,并且這個變化通常事先是未知的[3]。因此,本文研究慣性參數未知的航天器姿態跟蹤控制具有重大的實際意義。
針對被控對象中含有參數不確定的模型,自適應控制由于不需要被控對象的先驗信息而得到了廣泛的研究[4]。傳統的自適應控制方法是基于等價確定性(Certainty Equivalence, CE)[3-5]原則而設計的。但是由于CE方法中參數估計更新律是通過Lyapunov函數導數中干擾項的精確抵消而來的,導致其更新律中不含有自身的負反饋項。參數估計誤差和跟蹤誤差的直接耦合,造成了系統閉環性能的下降。
針對該問題,Astolfi等[6-7]開創性提出了一種非等價確定性(Non-Certainty Equivalence, Non-CE)理論:浸入與不變(Immersion and Invariance, I&I)理論。通過在參數估計中增加一項關于狀態的修正項,從而間接將未知參數引入到參數估計動態當中。通過合理設計,可以把參數估計誤差動態與其自身直接建立起聯系,這在CE方法中是做不到的。但是,由于理論上,獲得修正項的具體形式需要求解一個偏微分方程(Partial Differential Equation, PDE)。對于一階系統,方程的解析解總是存在并很容易通過積分求解;但對于高階系統,方程有解析解需要滿足比較嚴格的條件,在實際情形中一般不滿足,通常被稱為“可積分性障礙(Integrability Obstacle)”,這使得其應用受到極大的限制[8-11]。
針對該障礙,Seo和Akella[8-9]提出了一種基于濾波方法(Filter-based)的控制器,通過巧妙構造一個指數收斂的增廣濾波系統,然后通過增廣濾波狀態設計修正項和控制器,使得整個閉環系統具有I&I理論的特點,從而間接地避免了求解PDE。雖然該方法給I&I控制器設計提供了一種新的思路,但是缺點是低通濾波器降低了系統的帶寬;并且對增廣系統濾波,會導致閉環系統的階數急劇增加,大大加重了計算負擔。
Karagiannis等[11-12]開創性地將動態放縮法(Dynamic Scaling)運用到I&I 控制器設計當中,該方法考慮參數回歸矩陣不滿足可積條件,通過引入狀態濾波器,按照一定方式替換掉回歸矩陣中的積分變量使得其可積并得到其近似解,然后運用動態放縮技術將近似解和真解之間誤差部分消除。由于動態放縮法相比于Seo和Akella[8-9]提出的增廣濾波法,只需對被積狀態設計濾波器,因此明顯地降低了閉環系統的階數,優勢比較突出,吸引了一大批研究者的關注[13-18],極大推進了I&I理論的發展。但是,基于動態放縮法的控制器設計過程中,動態放縮因子為單調遞增函數,盡管能夠證明有界,但是事先并不知會增大到多大;而控制器和濾波器動態反饋增益系數與放縮因子的平方呈線性關系,這些因素會導致控制器反饋增益很大,可能會出現不希望的瞬態特性。
Yang等[17]首次將動態放縮法的I&I理論運用到航天器的姿態控制模型中。針對參數回歸矩陣不可積的困難,通過添加一個補償矩陣使其可積,然后利用構造的角速度濾波器或者參考角速度信號來抵消補償矩陣的影響,并用動態放縮技術將其影響消除。并且針對動態放縮因子單調遞增所帶來“高增益”控制現象,通過使用“三標量動態(three scalar dynamics)”方法構造一個動態調節系數,使遞減的調節系數中和放縮因子的增長。雖然該文章也提出了基于動態放縮法I&I控制器,但是需要額外設計標量動態,并且需要事先知道慣性矩陣的最小特征值的下界,這給實際應用帶來了困難。
Wen等[18]同樣將動態放縮法和I&I方法應用在姿態跟蹤模型上,采用的是文獻[11]中的回歸矩陣改造技巧,但是創新地提出了修正縮放因子和附加調節系數動態,使得控制器中不需要慣量矩陣最小特征值,也能約束縮放因子在一個事先確定的上界內。但是該方法只是將反饋增益與縮放因子從平方線性關系修正到呈線性關系,仍需要調節系數來中和縮放因子的增長。
目前國內相關的研究[19-23]只是將I&I理論結合一些backstepping或者滑模控制方法應用到一些較簡單的實際模型中。所考慮的模型都是可以拆分成一維的子系統的級聯形式,此時的PDE可以直接通過積分求解,不存在不可解的問題。而本文中姿態控制、機械臂等強耦合非線性多維系統并不能直接利用I&I方法進行設計,因為其PDE并不能直接積分求解,國內文獻在這方面并沒有深入研究。
本文針對航天器姿態跟蹤控制模型,采用I&I理論,提出了一種新的參數回歸矩陣改造方式,解決了“可積分性障礙”。通過引入全新的縮放因子形式,利用動態放縮技術證明了矩陣改造帶來的誤差不影響閉環系統的穩定性,并且設計的姿態跟蹤自適應控制器不需要縮放因子信息,也不需要慣量矩陣的最小特征值信息,有效地減小了閉環系統復雜度和閉環系統階數,并且保證了跟蹤誤差的漸近收斂。
本文結構如下:第1節對本文所研究的問題進行了詳細描述;第2節對本文提出的矩陣改造方法進行了介紹,并依據該方法給出了一種新的I&I姿態跟蹤控制律;且第2節用Lyapunov方法證明了所設計控制器的穩定性;第3節通過數值仿真,將本文設計的控制器與CE方法的控制器和Filter-based方法的控制器進行了對比分析,表明了本文設計方法的有效性和優越性;最后,在第4節中對相關研究內容作了簡單總結。
航天器姿態跟蹤問題中,通常會涉及到3個坐標系:慣性坐標系FI、本體坐標系FB和期望坐標系FD。由于姿態控制只考慮本體坐標系的相對方位,而不考慮其質心的位置,所以以上3個坐標系均以航天器質心O為原點。其中,慣性坐標系作為基準坐標系,本體坐標系和期望坐標系的姿態均是相對于慣性坐標系而言;本體坐標系與航天器固連,其坐標軸的方位也就代表了航天器的方位;期望坐標系是一個引入的假想坐標系,坐標軸的相對方位由要跟蹤的期望方位確定。坐標系的示意圖如圖1所示。姿態跟蹤的任務就是控制航天器,使其固連的本體坐標系與期望坐標系重合。

圖1 坐標系示意圖
本文采用全局無奇異的四元數來描述剛體的姿態動力學方程
(1)
(2)


由四元數q得到的從FI到FB的坐標變換矩陣為
(3)
(4)
從FD到FB的坐標變換矩陣為
(5)
角速度跟蹤誤差為
ωe=ω-Reωd=ω-Ω
(6)
式中:Ω=Reωd為ωd在本體坐標系中表達的期望角速度。
這里不加推導地給出航天器姿態跟蹤的動力學模型為[17-18]
(7)
(8)
(9)

由于J為實對稱常量矩陣,可以寫為
J包含6個未知參數,可以設未知參數向量為
為了方便后面控制器的設計,將式(9)改造為
(10)
式中:kq>0和kω>0分別為姿態誤差反饋增益系數和角速度誤差反饋增益系數,為待定常數;根據線性參數化性質:
Wθ=-ω×Jω+Jω×Ω-JΩd+J(kqqev+kωωe)
(11)
式中:W=W(ω,qev,Ω,Ωd)∈R3×6為參數回歸矩陣。
考慮如下形式的控制器設計:
(12)

(13)


根據I&I方法,參數估計一般由2項組成,因此考慮如下的參數估計形式:
(14)

(15)

(16)
為了保證閉環系統最終收斂到流形面M上,需要求解一個偏微分方程,從而得出修正項β的具體形式
(17)
但是,式(17)有解的條件是WT∈R6×3為雅克比矩陣,即

(18)

(19)
式(19)是一個很強的限制條件,在強耦合非線性系統中,參數回歸矩陣一般不滿足該條件。在本文航天器姿態跟蹤模型中,由式(11)得到的參數回歸矩陣WT由于叉乘矩陣ω×的存在,使得WT不滿足式該條件,也即式(17)不可解。因此,按照傳統I&I控制器設計方法在這里遇到了極大的阻礙。
觀察式(11)并將其分解為
Wθ=J(kqqev-kωΩ-Ωd)+kωJω+
(-ω×Jω+Jω×Ω)=
(W1+W2+W3)θ
(20)
對于Jx=M(x)θ,可得其參數回歸矩陣形式為
(21)

W1=M(kqqev-kωΩ-Ωd),W2=kωM(ω)
(22)
(23)
(24)

(25)

(26)

(27)
式中:kf為濾波器反饋增益,是一個待定的變量。那么,可以將修正項β(ω,φ)設計為
β(ω,φ)=γ(β1+β2+β3)
(28)
并且有
(29)

為了后續敘述的簡潔性和嚴謹性,首先給出L2和L∞范數的定義。

則稱f(t)是平方可積的,或稱f(t)∈L2;若其∞-范數滿足:
則稱f(t)是有界的,或稱f(t)∈L∞。
接下來,根據以上內容,可以得出以下定理。
定理1對于航天器系統(7)~系統(9),在慣量矩陣完全未知的條件下,若控制器(12)中參數估計由式(15)和式(28)組成;需要的反饋增益分別為
kq=1+δq,kω=1.5+δω
(30)
kf=1+δd+δf
(31)
式中:δq,δω,δf>0為任意正常數;δd為一個動態增益,其動態為
(32)


證明參見以下分析過程。
為了方便以下的穩定性證明,定義如下的縮放參數估計誤差:
(33)
式中:R為縮放因子,由輔助縮放因子r確定,其定義式為
(34)
式中:jm為慣量矩陣J的最小特征值;f(r)為上界縮放為1的某一飽和函數,例如雙曲正切函數、反正切函數、sigmoid函數等。輔助縮放因子r的動態為
(35)
注意到,若選取r(0)>0,不管f(r)是雙曲正切函數、反正切函數,還是sigmoid函數,都能保證f(r)>0和f′(r)>0;并且根據f(r)的有界性,存在某一合適常數C,可以保證lnf(r)+C>0。因此,式(35)總是有意義的。
通過式(32)和式(33),可得以下2個性質:
(36)

jmf(r)
(37)
對式(31)求導,并利用式(27)和式(34)可得
(38)
若選擇以縮放參數估計誤差z為變量的Lyapunov函數為
(39)
對式(39)求導,結合式(38)和楊不等式,得到

(40)
首先考慮以下Lyapunov函數:
(41)
(42)
注意到,式(30)自動滿足kq+kω>0.5,從而式(42)的正定性得到保證。
分別對式(38)和式(39)求導得到
(43)
R(qev+ωe)TJ-1Wz
(44)
定義如下Lyapunov函數:
(45)
對式(45)求導,并結合式(30)、式(31)、式(38)、式(43)和式(44)得到


(46)

(47)
接著定義如下Lyapunov函數:
(48)
(49)
對以上Lyapunov函數求導,可得
(50)

(51)
最后定義總的Lyapunov函數為
V=Vc+Vf+VR
(52)
根據式(46)、式(50)和式(51)的結果,對式(52)求導得
(53)

經過以上分析過程,有以下幾點改進和創新值得說明一下:

(54)
這在CE控制方法中是保證不了的,也是I&I控制方法相對于CE方法的一大改進。
注2本文通過設計一種新穎的縮放因子式(34),使得其滿足性質式(37)。而通過飽和函數f(r)的引入,使得控制器增益中不再含有r2或者r,這在文獻[12-18]中是做不到的。并且注意到,根據飽和函數f(r)的有界性,控制器中不再需要縮放因子R和r的信息,縮放因子的引入只是為了穩定性的證明,這是對已有基于動態放縮法I&I控制器的一大突破。
注3從式(48)發現,通過在濾波器增益式(31)kf中添加動態項式(32)δd,使得增益式(31)中不再需要Lipschitz常數L,從而避免了復雜的矩陣推導來確定L的過程,例如文獻[17-18]中的推導過程。
對所設計的自適應跟蹤控制器進行仿真,驗證本文所提出設計方案的有效性和優越性。仿真中,慣量矩陣J取為
被跟蹤的期望角速度軌跡設定為
ωd(t)=[0.3(1-e-0.01t2)cost+te-0.01t2(0.08π+
初始條件設定為
被跟蹤的期望姿態可以根據初始姿態和期望角速度得出。控制器的常數參數設定為:kp=10,kd=20,δf=0.5。

得到的仿真曲線如圖2所示。







圖2 各項參數隨時間變化曲線

總之,本組仿真算例證明了本文所提出的跟蹤控制器的有效性,并且增大調節增益γ、λ值能夠一定程度加快閉環跟蹤誤差的收斂。但是,需要指出的是,盡管γ、λ值能夠使得閉環系統更快地收斂,但是實際應用中并不是γ,λ值越大越好。這是因為本文的控制器和仿真均是基于姿態和角速度能夠實時精確測量的假設,而實際情況中可能存在測量噪聲、高頻干擾以及未建模動態的影響,更大的γ,λ值將增大系統的帶寬,使其更容易受到這些影響。所以,在實際應用中,應該綜合閉環系統的快速性和魯棒性,對γ,λ值進行合理的選定。
為了驗證本文所設計控制器的優越性,該組仿真將比較CE-based控制器[5]、Filter-based控制器[8]和本文提出的控制器的跟蹤性能。為了保證對比的公平性,首先通過調節各控制器的反饋增益,保證3種控制器在理想情況下(慣量矩陣已知)跟蹤誤差的漸近收斂速度一致,然后,設定慣量矩陣未知,通過數值仿真,得到的跟蹤性能曲線如圖3所示。
從圖3(a)和圖3(b)可以看到,本文提出的控制器相比于CE-based和Filter-based控制器有更快的收斂速度和更高的跟蹤精度。從圖3(c)發現,初始過渡階段,CE-based控制器和Filter-based控制器所需的控制量非常大,并且有著非常嚴重的瞬態,在穩態階段,Filter-based控制器所需的控制量和本文提出的已經基本趨于相同了,但是CE-based控制器所需的控制量更大,這也可以從圖3(a)和圖3(b)可以看出,CE-based控制器的穩態時閉環跟蹤誤差比較大,并存在一定的振蕩,這會額外消耗一定的控制量。
造成這樣的原因主要有:首先,從控制器設計原理上,本文所提控制器和Filter-based控制器都是基于非等價確定性原則(Non-CE-based)設計的,相對于CE-based控制器在原理上就具有優越性,因為CE-based控制器只是單純地將Lyapunov函數中關于參數不確定項抵消掉,并且只要參數估計沒有收斂到真值,閉環系統就會一直存在一個外干擾附加到理想系統上;其次本文提出的控制器中濾波系數kf中的動態增益在系統運行過程中使得系統等效控制增益變大,加快了閉環系統向理想系統(流形面上的等效系統)的收斂。并且Filter-based控制器將狀態、回歸矩陣和控制量均進行一階低通濾波構造出一個指數收斂的増廣狀態,這嚴重增大了閉環系統的階數和復雜性,在計算上造成很大負擔并且引入了很多的舍入誤差,并且指數收斂増廣狀態的初值必須根據其他狀態初值來設置使其為零,不然不就會有一個指數收斂的外干擾附加在理想系統上,因此本文所提控制器相對于Filter-based控制器更加簡潔和高效。



圖3 跟蹤性能隨時間變化曲線
綜上,對于跟蹤精度要求高和燃料有限且寶貴的航天在軌服務任務來說,本文所提出的控制器相對于CE-based控制器和Filter-based控制器有著不可比擬的優勢。
在工程應用中,系統中會不可避免地存在一些干擾,例如外界干擾、測量誤差等。為了驗證本文設計控制器的魯棒性,在原有的系統模型(9)中加入有界外干擾:
d=



圖4 控制誤差范數和隨時間變化曲線

圖5 控制力矩范數隨時間變化曲線

圖6 估計誤差范數隨時間變化曲線
總之,通過該組仿真可以看出,本文設計的控制器存在有界外干擾時,仍能保證閉環系統的有界收斂,只是之前的漸近穩定品質已經喪失了,但仍可將跟蹤誤差控制在零附近的一個很小鄰域內,表明控制器具有一定的魯棒性。
本文針對慣性參數不確定情況下航天器的姿態跟蹤,基于浸入與不變方法設計了一種自適應控制器。首先分析了浸入與不變理論應用在航天器姿態跟蹤動力學模型,存在偏微分方程不存在解析解的問題;然后針對該問題,本文提出了一種矩陣改造方法,使得參數回歸矩陣滿足可積條件,并通過引入一種全新的縮放因子,采用動態放縮法證明了矩陣改造前后的誤差對閉環系統的影響可以消除;最后根據本文提出的矩陣改造方案設計出了一種新的I&I姿態自適應跟蹤控制器,保證了跟蹤誤差的漸近收斂。文章的創新之處在于采用全新的縮放因子,使得控制器執行過程中不需縮放因子信息,也不需要慣量矩陣的先驗信息;并且在濾波器反饋增益中加入動態自適應增益項,使得不需要去確定矩陣范數上界,總之本文設計控制器相比于已有的基于動態放縮法的I&I控制器具有更簡單的形式和更低的閉環系統階數。文章最后通過數值仿真驗證和對比得出了本文設計控制器的有效性和優越性。總之,本文的設計思想和方法對參數不確定的自適應控制器設計具有一定的指導和借鑒意義。