劉將輝,李海陽
(國防科技大學空天科學學院,長沙 410073)
近年來,航天器失聯事件不斷發生,如歐空局的Envisat衛星于2012年4月8日與地面失去了聯系,印度發射的通信衛星GSAT- 6A于2018年3月31日進行最后一次軌道機動時與地面失去了聯系。失聯航天器一般處于低速無控制的自由翻滾狀態,對在軌航天器的安全造成嚴重威脅。如果能對失控翻滾目標進行在軌維修檢查、燃料加注和捕獲,則具有重要的意義[1-3]。面向失控翻滾目標的逼近是實施上述任務的基礎,追蹤器需要對失控翻滾目標進行精確的位置跟蹤和姿態同步。失控翻滾目標的非合作特性,大大增加了逼近過程的難度[4-5]。
針對這一問題,研究人員提出了各種非線性的控制方法[6]。文獻[7]采用Smith模糊控制、文獻[8]采用滑模控制、文獻[9]采用人工視場法、文獻[10]采用反饋線性法來設計航天器的相對運動。假設目標衛星的運動學是完全已知的,文獻[11]設計了一種控制律,并給出了最優性準則,使跟蹤器沿著所設計的軌跡向翻滾目標移動,直到兩者之間保持相對靜止。文獻[12]利用逆動力學直接方法和非線性規劃求解器序列梯度恢復算法研究了兩個模擬航天器間協同對接策略的最小能量問題,并給出了一種近最優的制導策略。文獻[13]基于雙四元數的非線性和角速度反饋實現了追蹤器對目標器的姿態同步。文獻[14]闡述了具有通用目標的動力學和制導、導航與控制(GNC)方案,測試了基于線性二次型調節器(LQR)的位置跟蹤控制器和角速度約束的比例微分(PD)姿態跟蹤控制器。在有限時間控制和自適應控制策略的基礎上,文獻[15]實現了兩航天器間的有限時間姿態同步與跟蹤控制。采用狀態相關的Riccati方程控制,文獻[16]實現了兩航天器間運動耦合的平動和旋轉運動。文獻[17]將滑模控制與逆最優控制相結合,考慮兩航天器間的平移與姿態耦合,設計了魯棒逆最優位置姿態控制器。文獻[18]利用偽普法求得了追蹤器與翻滾目標逼近的最小時間和最小能量消耗的最優軌跡。文獻[19-20]針對非合作目標具有建模不確定性的問題,提出了一種具有標準可測信息的魯棒自適應控制方法。文獻[21-22] 應用模型預測控制器來控制追蹤器逼近翻滾目標。文獻[23]提出了一種基于非線性優化的運動規劃方法,將安全成本放在首位,為追蹤器接近非合作目標衛星提供一個安全的接近軌道。然而,多數文獻存在以下不足:追蹤器和目標器之間的相對位置和相對姿態耦合不完整,甚至忽略耦合作用;一般將標稱軌跡或標稱姿態單獨設計以便對位置或姿態單獨進行控制。設計參數的時候未考慮未建模動態和參數不確定性,甚至忽略外界擾動。
相比多層前饋反向傳播(BP)網絡,徑向基函數(Radical basis function,RBF)網絡具有良好的泛化能力,網絡結構簡單,避免不必要的和冗長的計算。RBF神經網絡能夠在一個緊湊集合任意精度下,逼近任何非線性函數[24]。滑模控制中,由于建模不確定性需要切換增益,這就容易造成抖振。本文在姿軌一體化模型中,考慮姿態和軌道耦合效應,設計標稱軌跡和標稱姿態,將滑模控制結合RBF神經網絡逼近用于非線性系統的控制中,采用神經網絡實現模型未知部分的自適應逼近。神經網絡自適應律通過Lyapunov方法導出,通過自適應權重的調節保證整個閉環系統的穩定性和收斂性。仿真結果表明,本文所設計的神經網絡自適應滑模控制器能夠使追蹤器快速、安全地逼近失控翻滾目標器,整個控制過程中無抖振問題,追蹤器輸出力矩和控制加速度連續平滑。


圖1 相對運動坐標系統Fig.1 Relative motion coordinate system
在目標航天器軌道坐標系下,選用非線性的T-H方程描述追蹤航天器與目標航天器的相對運動[25]
(1)
(2)
(3)
其中,n為目標航天器的平均軌道角速度,e為目標航天器軌道偏心率。由式(1)可得到如下形式的非線性軌道相對運動方程
(4)
式中:
根據剛體動量矩定理,可得到航天器姿態動力學方程
(5)
其中,J為航天器的轉動慣量,ω為航天器姿態運動角速度矢量,τc為航天器姿態控制力矩,τd為航天器所受的外部未知有界干擾力矩,τg為航天器所受的重力梯度力矩,τg表達式為
(6)

(7)
由于追蹤航天器與失控翻滾目標航天器進行姿態同步旋轉的過程中存在大角度機動,為避免姿態控制中出現奇異,本文使用四元數描述航天器的姿態運動。下面基于誤差四元數推導追蹤航天器和目標航天器的相對姿態動力學模型。
設航天器當前姿態四元數為q,期望姿態四元數為qd,誤差四元數qe的表達式為
(8)

(9)

設追蹤器當前的角速度矢量為ω,期望的姿態角速度矢量為ωd,角速度誤差矢量為ωe,其表達式為
ωe=ω-Meωd
(10)
(11)
其中,
(12)
式中:G=ωe+Meωd。

(13)
對式(13)兩邊求導可得
(14)
基于誤差四元數,由式(14)可得到如下形式的航天器相對姿態動力學方程
(15)
式中:


(16)
式中:


根據本文對目標器軌道坐標系的定義,由慣性坐標系OEXEYEZE至目標器軌道坐標系OTXTYTZT的姿態轉移矩陣MIG為
(17)
式中:
(18)

(19)

(20)
(21)
(22)

(23)
(24)
(25)

(26)
其中,
(27)
式中:

(28)
(29)
(30)
(31)

考慮系統中存在未建模動態及參數不確定性,由式(16)得到進一步的姿軌一體化模型
(Cd3+ΔC3)+C4(u+d)
(32)

(33)

(34)
基于式(34)所建立的姿軌一體化動力學模型,通過控制輸入u來對追蹤器逼近過程進行控制。取
(35)
式(34)寫成狀態方程的形式為

(36)

e=X1-Xd
(37)
(38)
滑模函數設計為

(39)
其中,c為滑模函數系數,c=diag(c1,…,c7),ci>0,i=1,2,…,7。則
(40)


(41)
(42)

(43)
由于
(44)

定義Lyapunov函數為
(45)
其中,γ>0。
于是
(46)
設計控制律為
(47)
其中,η=diag(η1,…,η7),ηi>0,i=1,2,…,7, sgn(s)=[sgn(s1),…,sgn(s7)]T,則
(48)
其中,κ=[η1,…,η7]T,取ηi>|εi|max,i=1,2,…,7,自適應律為
(49)

假設目標航天器在空間中處于失控翻滾狀態,且不存在軌道機動。考慮J2項攝動和大氣阻力的影響,仿真采用高精度數值積分軌道模型。目標航天器的軌道六根數為:a=6739200 m,e=0.005,i=51.6°,Ω=315°,ω=41°,f=320°。追蹤器在距目標器質心15 m時對目標器進行逼近,終端逼近位置距目標器質心1 m,逼近期間假設追蹤器和目標器的轉動慣量不隨時間而變化。


表1 仿真參數Table 1 Simulation parameters
設追蹤器受到的外部有界攝動加速度ad和外部有界攝動力矩τd分別為[26]
(50)
(51)
式(50)和(51)中,ωo為追蹤器軌道角速度,{ad1,ad2,ad3}與{τd1,τd2,τd3}滿足均值為0且方差為υ=10-5高斯分布N(0,υ)。RBF神經網絡滑模控制器參數如表2所示。

表2 神經網絡滑模控制器參數Table 2 Neural network sliding mode control parameters
需要說明的是,表2中的高斯基參數pj和bj由網絡輸入X1和X2的實際范圍來設計,本文采用了嘗試法,并沒有進行最優化處理。仿真結果如圖2~圖7所示。

圖2 誤差四元數、位置偏差和速度偏差Fig.2 Error quaternion, relative position and relative velocity


圖3 追蹤器的控制力矩和控制加速度Fig.3 Control torque and control acceleration of the chaser

圖4 三維空間中追蹤器與目標逼近點的相對位置Fig.4 Relative position of the chaser and approach point in three-dimensional space
圖3為追蹤器的控制力矩和控制加速度變化曲線。在神經網絡自適應滑模控制器的作用下,追蹤器x與z方向輸出的控制力矩變化較小,y方向輸出的控制力矩較大,一段時間之后,各方向的控制力矩趨向于0,這是因為追蹤器已經跟上了目標器的姿態,追蹤器和目標器一起做相同的姿態運動。當完成姿態捕獲后,后續所需的控制力矩極小;追蹤器需要將其質心位置始終保持在逼近點的軸線上,初始時刻,追蹤器距逼近點較遠,所以初期所需的控制加速度較大。隨著兩者的距離逐漸減小,其控制加速度呈現振蕩減小的趨勢,最后趨向于0。整個過程中,控制力矩和控制加速度較為平緩,沒有出現抖振現象,神經網絡自適應滑模控制器成功克服了傳統滑模控制器抖振特性的影響。
圖4為追蹤器與逼近點的三維相對位置的變化曲線,與常規交會對接任務最后逼近段的準直線相對運動軌跡不同。由于目標航天器處于失控翻滾狀態,追蹤器逼近軌跡始終位于目標器體坐標系x軸上,所以追蹤器三維相對運動為同步指數減速逼近曲線。

圖5 f(x)和估計值Fig.5 f(x) and the estimation

圖6 f(x)和估計值Fig.6 f(x) and the estimation

圖7 f(x)和估計值Fig.7 f(x) and the estimation

為了說明所設計控制器的優越性,將RBF神經網絡滑模控制器與傳統滑模控制器進行對照。在沒有RBF神經網絡自適應條件下,式(47)在傳統滑模控制中可表示為
(52)


圖8 滑模控制器下的誤差四元數、位置偏差和速度偏差Fig.8 Error quaternion, relative position and relative velocity under sliding mode control

圖9 滑模控制器下的追蹤器的控制力矩和控制加速度Fig.9 Control torque and control acceleration of the chaser under sliding mode control
通過將圖8~圖9與圖2~圖3對比可知,傳統滑模控制器完成姿態同步需要約56 s,比RBF神經網絡滑模控制器慢21 s。傳統滑模控制器下的控制力矩和控制加速度出現了明顯的抖振現象,初始控制加速度比RBF神經網絡滑模控制器下的更大。
本文研究了逼近失控翻滾目標的相對軌道和相對姿態的六自由度耦合控制問題,建立了兩航天器相對運動的六自由度耦合的一體化模型,對逼近翻滾目標的標稱軌跡和標稱姿態進行了分析和設計。考慮外部干擾、系統不確定性以及滑模控制中的抖振等因素,推導了六自由度逼近的神經網絡自適應滑模控制器并給出了穩定性證明。仿真結果表明,該控制器能夠有效克服系統不確定因素的影響。追蹤器按照設計的標稱軌跡對目標實現了快速逼近,保證了逼近過程的安全性。控制過程中產生的控制力矩和控制加速度連續平滑,克服了抖振問題。