徐 揚, 韓明仁, 邵 將, 羅德林
(1. 西北工業大學民航學院, 陜西 西安 710072; 2. 北京控制工程研究所, 北京 100089;3. 錢學森空間技術實驗室, 北京 100094; 4. 哈爾濱工業大學衛星技術研究所, 黑龍江 哈爾濱 150001;5. 廈門大學航空航天學院, 福建 廈門 361102)
衛星小型化是當前空間技術發展的重要方向之一,由于小型衛星具備體積小、質量輕、成本低且生產周期短等特點,能夠節省將其送入軌道的燃料,因而整個壽命剖面中花費的總成本能夠大為縮減[1]。由于衛星體積小,不能搭載過多的設備,造成了其功能的單一,且無法獨立完成多種任務。因此,將多個小型衛星集成為一個虛擬大衛星,構成一個完整的集群系統,通過相互配合與合作用于執行復雜的任務。例如,多個小型衛星清理空間垃圾[2],以及空間站在軌組裝等[3]。上述問題可以歸結為多智能體系統的協同控制問題。一致性是多智能體控制的基本問題[4-5],然而在實際應用中,多智能體系統有時需要進行分組達到某種對稱的狀態,本文的主要研究內容便是圍繞該問題展開。
瑞典控制工程教授Altafini在第51屆IEEE決策與控制會議上最先提出多智能體系統對抗一致性的概念[6],其指出通信拓撲圖可以用權重為負的邊來表示個體之間的對抗關系,進而將系統分成兩組。同時,設計出一階線性系統的對抗一致性控制算法,使得多個一階線性系統收斂到絕對值相等且符號相反的兩種狀態,實現了對抗一致性。文獻[7]將對抗一致性問題由兩組推廣到4組,并進行了相關的數值仿真和驗證。此外,文獻[8]分別研究了一階和二階線性系統的多組對抗一致性控制算法,且討論了時滯帶來的影響。然而,衛星的動力學和運動學模型為二階非線性系統[9],針對不同的姿態描述方法,可以列出不同的二階非線性剛體姿態動力學方程。文獻[10]中采用一組廣義坐標,研究了帶有動態領航者的多歐拉-拉格朗日(E-L)系統的機械臂分布式協調跟蹤控制問題。Ren采用修正型羅德里格斯參數(modified Rodriguez parameters,MRPs)[11]分別討論了有、無參考輸入兩種情況下具有領航者的剛體姿態同步與跟蹤問題。文獻[12]使用四元數描述,引入了一個速度觀測器,通過設計跟蹤時變參考姿態的控制方案,實現沒有參考輸入的情況下姿態達到控制的一致。陳志明等人以分布式衛星的姿態同步為目標[13],設計了用歐拉四元數表述的衛星姿態一致性算法,采用PWM控制法控制衛星噴氣系統實現姿態變換,但是四元數描述衛星姿態存在奇異的情況。Sun等人基于反演控制思想,討論由多個雙連桿機械手組成的多E-L系統在有向拓撲下的分布式協同跟蹤問題[14]。梁曉龍等人針對具有固定拓撲結構的無人機集群,通過引入參考編隊向量,設計了固定時間的一致性協議,使無人機集群能夠在固定時間內達到狀態一致[15]。黃偉等人基于最優控制理論,研究了導彈編隊控制一致性算法,使編隊能夠在實現固定編隊構型的同時趨于速度一致[16]。此外,文獻[17-20]中對非線性系統的對抗一致性、分組一致性做了相關研究。文獻[21-22]分別研究了線性系統的對抗一致性、分組一致性。對于存在通信時延的情況,文獻[23-25]采用牽制控制、Delta算子設計了解決方法。文獻[26-30]中針對具有時變通信拓撲的多智能體系統的對抗一致性問題進行了相關的討論。文獻[31-33]中研究了多智能體系統的多部分對抗一致性問題。文獻[34-36]則討論了在通信網絡存在干擾或者網絡被攻擊情況下的多智能體對抗一致性問題。上述研究中,涉及姿態的研究采用的剛體姿態描述方法有歐拉角、軸/角、旋轉矩陣、四元數、羅德里格斯參數、MRPs等。
考慮姿態描述時會引入奇異性問題,而四元數并不是姿態描述的最小實現。因此,本文采用MRPs進行剛體姿態的描述,用3個參數即可描述姿態,同時不存在奇異性問題[37]。使用E-L動力學和運動學方程[38]對單個衛星建模,將每個衛星看成在空間中自由運動的剛體,研究其姿態的對抗一致性[39],解決了通過一致性算法不能使衛星集群的姿態達到對稱狀態的問題。姿態對抗一致性應用到航天領域,主要貢獻在于衛星集群編隊任務中,比如利用多個衛星組成合成孔徑雷達或空間干涉儀[40-41],需要衛星集群編隊對于被觀測地區維持對稱的指向。文獻[42]中研究了衛星在軌維護的任務,其中失控衛星的消旋也需要兩個提供在軌維護服務的衛星以對稱的姿態從兩個方向對服務對象進行抓取,也涉及了姿態的對抗一致性的問題。
本文選取MRPs作為描述衛星集群系統姿態的參數,設計了一致性控制算法,使系統的姿態參數通過控制算法最終達到數值相等的狀態;并構造出一種獨特的Lyapunov函數,進行了嚴格的穩定性證明;在所得一致性控制算法的基礎上,引入對抗關系通信拓撲對控制算法進行再設計,提出了一種能夠實現系統姿態對抗一致性的新型且穩定的控制算法。
本文采用無向圖來描述系統中各個衛星之間的通信,該圖也被稱為通信拓撲圖[43]。
通信拓撲圖可表示為
G=(V,E)
(1)
式中:G表示包含n個節點的無向圖;V為無向圖中節點的集合;E表示無向圖中邊的集合。通信拓撲圖的鄰接矩陣為
An=[aij]∈Rn×n
(2)
在集群系統中,個體之間存在合作和對抗兩種關系。衛星i與衛星j為合作關系時,通信拓撲圖中對應的邊為正值,即aij>0;個體之間為對抗關系時,通信拓撲圖中對應的邊為負值,即aij<0。邊(i,j)的權值重用aij的大小來表示,如果沒有給出通信拓撲圖中邊的權重的實際意義,可以將aij的絕對值設定為1。當研究一致性問題時,個體之間不應存在對抗關系,即通信拓撲圖中所有邊的權重為正值;當研究對抗一致性問題時,個體之間應當存在對抗關系,即通信拓撲圖中邊的權重可正可負。
MRPs定義[44]為
(3)
式中:n∈R3為歐拉軸;θ∈R為歐拉角;σ∈R3表示當前姿態是相對于基準坐標系繞n軸旋轉θ角度之后得到的。MRPs中,n為一個單位向量,其三維坐標的平方和應為1,而θ的取值范圍為[0,2π),衛星的姿態控制分為被動姿態控制和主動姿態控制,被動姿態控制一般只有一個軸是穩定可控的,用一根軸即可描述衛星姿態,且指向精度不高,所以這里討論主動姿態控制衛星,即三軸穩定的姿態控制方式,其姿態可用MRPs描述。
利用MRPs表示第i個衛星剛體姿態運動學和動力學方程[44]為
(4)
(5)
式中:
σi為第i個衛星的MPRs;ωi∈R3為角速度;Ji∈R3×3為慣性張量矩陣;τi∈R3為控制力矩;σ為向量積算子。
令σ=[abc]T,其中a、b、c為平方和為1的任意有理值,表示MRPs的三維分量,則σ×定義為
(6)
相對MRPs[44]定義為
(7)
式中:R(σi,σj)和σij為相對MRPs,用來表示第i個衛星和第j個衛星之間的姿態偏差,R(·,·)∈R3。
如果σi和σj分別滿足姿態運動學方程:
(8)
(9)
則σij滿足運動學方程:
(10)
式中:
ωij=ωi-A(σij)ωj
(11)
(12)
而相對MRPs具有如下性質:①σii=0;②σij=-σji。
由MRPs表示的衛星剛體姿態運動學和動力學方程經過變換可轉化成E-L方程的形式[9],具體如下:
(13)
式中:
Hi(σi)=(F-1)T(σi)JiF-1(σi)
(14)
(15)
為了突出MRPs表示的剛體姿態動力學方程具有轉化成E-L方程的能力,方便與其他研究成果聯系對比,本節中引用了參考文獻[9]中的內容,通過式(13)~式(15),體現了MRPs表示的剛體姿態動力學方程和E-L方程之間具有可以相互轉化的關系。
當每個衛星的MRPs中的3個元素都達到相同值時,所有衛星的姿態就達到了一致性。其數學描述為
(16)
本文首先研究一致性控制問題,故衛星集群系統中不存在互為對抗關系的個體。而對抗一致性控制問題將在本文第3節進行描述。
姿態一致性控制算法可以設計為
(17)
式中:τi為控制力拒,在三軸穩定衛星的姿態控制中,以輪控為主,反作用飛輪或控制力矩陀螺分別以某種構型安裝在衛星的3個自由度上,τi即為3個飛輪或陀螺輸出的合力矩,在實際控制中只需要轉化成與之大小對應的電信號即可;ωi×Jiωi是為了消除姿態動力學方程中與之符號相反的項,以達到簡化證明過程的目的;K是正增益常數,其取值影響系統的動態性能,如果K取值過大,則輸出控制力矩較小,系統達到穩定的時間過長,如果K取值過小,則系統可能出現振蕩,影響系統穩定性,一般取值為[1, 3]。
在本節中研究的是姿態一致性問題,默認了系統中不存在互為對抗關系的個體,因而在通信拓撲圖中不存在權重為負的邊,即aij>0。若要實現一致性控制,要求衛星間通信拓撲圖的最小生成樹包含所有衛星節點,即其通信拓撲圖是連通圖[43]。
研究對象為非線性系統,不能用線性系統穩定性的證明方法來證明其穩定性,所以本文采用Lyapunov第二法來證明系統的穩定性。
首先,求得系統的平衡點:將一致性控制律式(17)代入式(5),原動力學方程變為式(4)和如下形式:
(18)
由式(4)和式(18)可以看出,當σi=σj且ωi=0時,系統達到平衡狀態,為系統達到一致性時的狀態。
使用Lyapunov第二法的第一步是要構造Lyapunov函數。其可以看成是一個能量函數,若是系統的能量趨于減小,那么系統是趨于穩定的,即函數若為負定,則可以證明系統的穩定性。Lyapunov函數并沒有固定的構造方法,經過仔細分析和選取指標,可將該系統的Lyapunov函數可以構造為
(19)
對式(20)求導,可得
(20)
式中:
(21)
將式(18)與式(21)代入式(20),可得
(22)
式中:
(23)
將式(24)代入式(23),可得
(24)

本節中研究的系統模型與第2節一致,但衛星之間的通信網絡有所不同,其引入了互為對抗關系的衛星個體。
設n個衛星的集合為H={h1,h2,…,hn},其可以被劃分成H1和H2兩個子集,H1∪H2=H。其中,在子集內部衛星之間的關系為合作的,而子集之間衛星的關系為對抗的。衛星之間通信拓撲圖G(H)中邊的權重用aij表示:
(25)
且通信拓撲圖G(H)是結構平衡的,即G(H)中所有循環路徑上邊的權重之積為正值。
當所有衛星中的一部分的MRPs達到了相同的數值,而其余與之為對抗關系的衛星的MRPs達到了前一部分的相反數時,實現了姿態的對抗一致性。如圖1所示,紅藍兩組衛星集群系統實現了姿態對抗一致性,共同對于地面雷達進行實時監控。其數學描述為

圖1 衛星集群系統姿態對抗一致性示意圖Fig.1 Demonstration of attitude antagonistic consensus of satellite swarm system
(26)
式中:σ0為系統的對抗一致性穩定點。
在一致性控制算法的基礎上,設計如下的對抗一致性算法:
(27)
式中:aij的取值可正可負。
設定所有衛星的MRPs所組成的向量為
S=[σ1,σ2,…,σn]
(28)
定義一個標準變換矩陣為
(29)
式中:di={±1}。
利用標準變換矩陣對S向量進行標準變換,使S中的部分元素變為原值的相反數:
(30)
式中:di的取值為
(31)
即系統中一組衛星的MRPs不變,另一組的MRPs變為之前的相反數。將式(30)和式(31)代入式(4)和式(5),可得
(32)
(33)



(34)

(35)
此時,衛星的角加速度為
(36)
式(37)與式(19)相同,所以由一致性控制算法的證明過程可知,在此種情況下,衛星的MRPs狀態會趨于一致且穩定。也就是說,屬于同一組的衛星在對抗一致性算法的控制下,最終所得的姿態會趨于一個穩定的狀態。


(37)

(38)
此時,
(39)
式(40)與式(37)形式相同,區別在于相對MRPs的輸入值變為了原值的相反數。因而,一致性算法中的所有MRPs均變為了相反數,故式(40)最終趨于的穩定值也變為原值的相反數。
經過以上討論,再結合一致性算法的證明可知,在進行標準變換后,對抗一致性控制算法使互為對抗關系的兩組MRPs趨于互為相反數的兩個值,即實現對抗一致性。對MRPs向量進行標準變換,只改變了計算過程中部分MRPs的符號,并不會影響最終的穩定值,標準變換是對MRPs數值本身的變化,而不對公式進行改變。
經上述證明過程,還可知衛星姿態的對抗一致性控制算法最終穩定值的大小,與初始MRPs向量進行標準變換后應用一致性控制算法最終達到的穩定值的大小相同。
本節對上文所提的姿態對抗一致性控制算法進行數值仿真,以便驗證所提算法的正確性。
設定集群系統中的衛星數量為4個,且均為中低軌道對地三軸穩定衛星,其中1號和2號衛星間是合作關系,為第1組;3號和4號衛星間是合作關系,為第2組。第1組和第2組衛星之間互為對抗關系,系統通信拓撲如圖2所示。

圖2 衛星集群系統通信拓撲圖Fig.2 Communication topology of satellite swarm system
通信拓撲圖的鄰接矩陣為

4個衛星的初始MRPs為
4個衛星的慣性張量矩陣為
由于衛星繞地球運動,所以其空間環境的干擾力矩也呈周期變化,對于中低軌道衛星,其主要空間環境力矩為氣動力矩、重力梯度力矩以及地球磁場力矩[45],干擾力矩可以通過辨識的方法獲得[46],也可綜合表示為
式中:ω0為衛星在軌運行的軌道角速度;D=[Dx,Dy,Dz]為干擾系數,其大小由衛星的外形和軌道參數決定,一般取值為
Di=10-5~10-7,i=x,y,z
假設衛星的軌道參數為:軌道高度a=800 km,偏心率e=0,軌道傾角為55°,其平均軌道角速度約為0.001 rad/s。
在仿真中,取Di(i=x,y,z)=10-5,K=2,同時假設4個衛星的初始角速度均為0,用Matlab進行仿真,所得結果如圖3和圖4所示。

圖3 衛星的MRPs隨時間變化曲線Fig.3 Curves of satellites MRPs varies with time

圖4 衛星的角速度隨時間變化曲線Fig.4 Curves of satellites angular velocity varies with time
圖3為4個衛星的MRPs隨時間變化的曲線,可知其三維坐標均穩定在了兩個互為相反數的數值附近。MRPs中包含歐拉軸n與歐拉角θ,其意義為:當前剛體的姿態是相對于基準坐標系繞n軸旋轉θ之后得到的。歐拉角θ取值恒為正,也就是說剛體繞歐拉軸旋轉的方向固定,此時互為相反數的MRPs之間的區別為歐拉軸的方向相反。若一個MRPs代表的當前姿態為基準坐標系繞n軸順時針旋轉θ,那么MRPs的相反數代表的當前姿態為基準坐標系繞-n軸順時針旋轉θ,即繞n軸逆時針旋轉θ。
因此,此時衛星集群系統的狀態為:1號和2號衛星相對于基準坐標系繞歐拉軸順時針旋轉某個角度;3號和4號衛星相對于基準坐標系繞歐拉軸逆時針旋轉了某個角度。最終,4個衛星的姿態實現了兩兩關于零值對稱的狀態,也就是實現了姿態的對抗一致性。同時,圖4表明了衛星最終的角速度均為0,狀態穩定得以實現。由于輪控存在輸出飽和的情況,輸出的控制力矩不能過大,故圖5給出了各個衛星實現上述姿態機動時,反作用飛輪或控制力矩陀螺輸出的合力矩情況。可以看到,輸出的力矩均控制在比較小的范圍內,未達到反作用飛輪或控制力矩陀螺的飽和輸出,且動態特性能夠得到保證。

圖5 衛星的控制力矩隨時間變化曲線Fig.5 Control torque time curves of satellites
針對4個衛星選取不同的初始MRPs,能夠分別獲得如圖6~圖8所示的MRPs變化曲線、角速度變化曲線以及控制力矩變化曲線。可以得出,在不同初始條件下,所設計的控制律仍然能夠使得衛星集群系統最終達到姿態的對抗一致。

圖6 另一組衛星的MRPs隨時間變化曲線Fig.6 Curves of another satellites MRPs varies with time

圖7 另一組衛星的角速度隨時間變化曲線Fig.7 Curves of another satellites angular velocity varies with time

圖8 另一組衛星的控制力矩隨時間變化曲線Fig.8 Curves of another satellites control torque varies with time
本文將對抗一致性拓展到了非線性系統,用MRPs描述剛體的姿態,首先對多剛體姿態一致性問題進行了控制算法的設計,并構造Lyapunov函數,經過一系列的變換,成功證明了控制算法的穩定性。隨后,在已經設計出的控制算法的基礎上,對算法進行改進,設計出姿態的對抗一致性控制算法,并采用標準變換方法,對整個系統進行了分類討論,證明了其穩定性。并且,多個衛星的姿態通過分布式的對抗一致性控制算法能夠使系統達到具有對稱性的兩種穩定狀態。同時,算法是穩定的,且控制算法最終穩定值的大小,與初始MRPs向量進行標準變換后應用一致性控制算法最終達到的穩定值的大小相同。最后,設計Matlab程序進行數值仿真,驗證了理論的正確性。除衛星的姿態對抗一致性外,航天器的交會對接、編隊重構、空間對抗等任務則涉及編隊衛星的位置對抗性,需要以Clohessy-Wiltshire(C-W)方程或者相對軌道根數描述相對運動方程。后續也可以引入位姿參考向量,研究基于姿軌一體化的衛星編隊實現期望位置和姿態同時分組對抗一致性的控制方法。
本文只是在理論層面對衛星集群的姿態對抗一致性控制提出一種穩定可行的控制算法,在工程實現和應用上還需進一步驗證。同時,本文研究需要在衛星集群中衛星初始姿態不盡相同的前提下開展,在此條件下,應用本文中的對抗一致性控制算法,能夠使初始姿態混亂的衛星集群,達到一種有序的對稱狀態。