靳 鍇,何文志,宗 茂,李思男
(1.中國電子科技集團公司第五十四研究所,河北 石家莊 050081;2.河北省無人系統智能測控信息技術重點實驗室,河北 石家莊 050081)
空間交會任務規劃是航天器完成空間在軌服務的基礎,包括對衛星進行在軌裝配、故障維修、燃料加注、模塊更換、技術升級以及輔助機構展開等。其中,航天器在軌服務與維護的對象主要包括失效衛星、失控航天器和空間垃圾等空間非合作目標,由于空間非合作目標在信息層面上不溝通、機動行為上不配合,導致非合作目標的交會軌跡規劃與合作目標不同,需要對任務中的不確定因素進行辨識與處理。文獻[1]通過對370篇相關學術論文的研究,梳理和總結了航天器服務有關技術發展的前沿性和待解決的問題,并明確指出:過去的20年里已成功實現了許多在軌服務任務,但是大多是針對合作性目標,而對非合作目標的在軌操作仍是一個具有多種技術挑戰的研究領域,尤其是在考慮不確定因素下的智能魯棒交會任務規劃問題亟待解決。
傳統的交會任務規劃將相對運動模型視為確定性系統,不考慮其中存在的不確定性因素,通過優化方法得到最優交會任務。而在實際的交會過程中,存在包括導航制導與控制不確定性、環境不確定性、未建模動態以及參數不確定性等因素,導致交會精度無法保證。針對不確定性問題,專家學者們開展了大量研究,文獻[2]梳理了深度不確定環境下決策分析的研究現狀,總結了問題的特征和難點,分類闡述了主要方法的起源與發展、核心思想、實現步驟和典型應用。文獻[3-4]采用蒙特卡洛方法,在不同坐標系下對高斯分布的不確定性傳播進行分析。文獻[5]研究了線性協方差(Linear Covariance,LinCov)理論用以分析導航誤差對軌跡偏差的影響。文獻[6-7]采用統計線性化(Statistical Linearization,SL)的方式對導彈的碰撞概率進行了分析,這種方法要求概率密度函數已知且非線性較弱。文獻[8-9]提出了狀態轉移張量(State Transition Tensors, STTs)方法,通過初始不確定性的解析映射求解局部非線性的高階泰勒展開,從而得到不確定性的預測模型。文獻[10]采用多項式混沌(Polynomial Chaos,PC)方法,對隨機微分方程的解進行逼近,從而實現對不確定性的描述。文獻[11-12]采用高斯混合模型(Gaussian Mixture Model,GMM)方法,分別對考慮太陽光壓影響下的軌道確定問題以及氣動阻力對不確定性傳播的影響進行了分析。文獻[13-14]研究了一種基于微分代數理(Differential Algebra,DA)建立非線性不確定預測模型的方法,該方法能夠避免復雜的偏微分計算與數值逼近。文獻[15]總結了現有的線性與非線性系統不確定性預測方法,對各種方法進行全面綜述,將不確定性傳播方法分類。文獻[16-18]采用協同進化與自適應方法,對衛星軌道部署與路徑規劃進行了研究,所提出方法在惡劣通信環境下有效。以上研究僅是對已知的不確定因素進行了預測,而沒有對不確定因素進行辨識與處理。
本文面向空間非合作目標在軌服務的特點和需求,綜合考慮空間非合作目標在信息層面上不溝通、機動行為上不配合、觀測受限以及不確定性因素影響,研究了一種基于長短時記憶(Long-Short Term Memory,LSTM)與預設性能控制(Prescribed Performance Control,PPC)的交會任務規劃方法,實現智能自主、安全可靠的航天器交會任務,通過仿真驗證了方法的有效性。
在地心慣性坐標系中,服務航天器和目標航天器軌道動力學方程為:
(1)
(2)
(3)
(4)
式中,r為航天器位置矢量;v為航天器速度矢量;μ為地球引力參數;f為作用于航天器上的除推進力與中力引力以外的其他全部力帶來的加速度;F為服務航天器上的控制力;m為航天器質量;下標c表示服務航天器;下標t表示目標航天器。
聯立式(1)~式(4),可以得到服務航天器與目標航天器相對運動動力學方程在慣性坐標系中的表達式:
(5)
式中,p為相對位置矢量。將上述方程轉換到目標航天器軌道坐標系中,重力場一階近似,并轉換為標量形式,可得到:
(6)
(7)
(8)
式中,θ為真近點角;[px,py,pz]T為相對位置矢量在LVLH坐標系下的投影;fx,fy,fz為服務航天器的控制輸入。假設航天器運行于近圓軌道,此時式(6)~式(8)可以轉化為:
(9)
(10)
(11)
式中,nt為目標航天器軌道角速度。
PPC方法最早由希臘數學者提出,該方法的核心思想是對受控系統的狀態誤差預先設計邊界包絡,通過性能包絡的收斂特性來描述受控系統的瞬態響應與穩態性能,然后基于邊界包絡設計控制器。PPC包含3個步驟:首先,針對控制對象的系統狀態誤差設計性能約束函數;然后,引入對等映射函數將有約束空間同胚映射到無約束空間;最后,在映射得到的新空間內設計控制器,實現預設性能的控制。預設性能原理如圖1所示。

圖1 預設性能原理Fig.1 Principle diagram of prescribed performance
考慮多輸入多輸出(Multiple-Input Multiple-Output,MIMO)系統形式,將式(9)~式(11)表示為簡化形式:

(12)
PPC的核心思想是對受控系統的狀態誤差預先設計邊界包絡,通過性能包絡的收斂特性來塑造受控系統的瞬態響應與穩態性能。
定義:一個光滑函數,ρ:R+→R+,如果該函數滿足:
①ρ(t)為始終為正值的減函數;
② limt→∞ρ(t)=ρ∞>0,
則認為函數ρ(t)為PPC的一個性能函數。
這種性能函數并不唯一,而是具有多種形式。本文采用如下形式的性能函數:
ρ(t)=(ρ0-ρ∞)exp(-lt)+ρ∞,
(13)
式中,ρ0,ρ∞,l均為正實數,ρ0,ρ∞分別為初始時刻與穩定時刻的最大允許誤差值,l為設計參數,決定控制系統收斂速度。該形式的ρ(t)滿足PPC性能函數定義。
為考慮超調量問題,利用預設性能函數,對性能函數進行如下約束:
(14)
式中,δi為常實數,滿足0≤δi≤1。在初始時刻,0<|ei(t)|<ρi(0)。引入常值δi,可以在誤差接近零時,不會出現較大的超調量,始終小于δiρi(0)。因此通過調節ρi(t)與δi,可以決定系統邊界誤差。
在工程實際中,由于不確定因素與航天器突發故障,如執行機構、太陽能帆板故障等,難以對模型進行精確建模,模型不確定性嚴重影響著控制的精度。雖然靜態PPC控制結構簡單,無需對控制系統的動力學模型進行準確獲取,但是其對于動力學模型不確定性的魯棒性和自適應性具有一定的局限性。因此,為了控制的魯棒性和自適應性,基于模型性的控制律是首選。因此,采用LSTM實現不確定因素辨識。
LSTM是一種改進的循環神經網絡,通過設計合理的輸入門、遺忘門(Forget Gate)和輸出門(Input Gate),并通過記憶單元(Memory Cell)對狀態信息進行記憶來逼近非線性動力學,將原有的短時記憶提高為長時間的記憶,從而能夠更好地利用時序信息,對微分方程描述的動力學系統具有更好的擬合效果。LSTM單元結構如圖2所示。

圖2 LSTM單元結構Fig.2 LSTM unit structure
LSTM有4個輸入和1個輸出:第1個輸入是普通的特征值輸入;第2個輸入控制輸入信號門是否打開;第3個輸入控制遺忘門是否打開;第4個輸入控制輸出門是否打開;輸出為普通輸出。
記憶單元為1個前饋神經網絡。主要分為3層:第1層為輸入層;第2層為隱含層;第3層為輸出層。各層神經元接收上一層的輸出,并經過激勵函數輸出到下一層。LSTM 的一個特點是數據學習的循環型,在每一循環中,神經元接收輸入和前一步的輸出,作為本次循環的輸入。
根據LSTM原理,在交會任務不確定因素模型辨識的過程中,構建如圖3所示的LSTM控制流程,補償不確定因素與應對執行機構故障的影響。

圖3 LSTM示意Fig.3 LSTM schematic diagram
輸入信號ut為航天器t時刻任務指令,輸出信號pt為航天器相對狀態,輸入門控制信號為it,輸出門控制信號為ot,遺忘門控制信號為ft,隱含層控制信號為gt,h(·)為sigmoid激勵函數。
根據圖3,輸出狀態、記憶狀態可以表示為:
pt=ot×h(ct),
(15)
ct=ft×ct-1+it×gt,
(16)
式中,
it=h(Wiut+Nipt-1),
(17)
ft=h(Wfut+Nfpt-1),
(18)
gt=h(Wgut+Ngpt-1),
(19)
ot=h(Wout+Nopt-1),
(20)
(21)
學習矩陣包括輸入權重W和循環權重N,可表示為:
W=[Wi,Wf,Wg,Wo]T∈R4n×(m+1),
(22)
N=[Ni,Nf,Ng,No]T∈N4n×n,
(23)
式中,n,m分別為神經網絡中隱含單元個數與輸入變量長度。學習矩陣的數據樣本可在航天器在軌運行過程中獲取。
利用上文所述理論對非合作目標交會最終逼近段進行控制器設計,設計基于LSTM-PPC的任務規劃原理如圖4所示。

圖4 LSTM-PPC 的任務規劃原理Fig.4 LSTM-PPC mission planning principle diagram
根據PPC控制方法,依據式(14)與交會任務,定義如下嚴格遞減的正值預設性能函數:
ρ(t)=(e0-ereq)exp(-lt)+ereq,
(24)
式中,l為由交會任務收斂速度要求與執行機構性能共同決定的正常數;e0為交會任務的初始誤差;ereq為任務的精度需求。
為了方便考慮超調量與無約束轉化問題,設計誤差映射函數:
S()
(25)
針對相對動力學模型,定義如下所示的誤差矩陣:
E(t)=r+λv,
(26)
式中,常值矩陣λ=diag(λ1,λ2,λ3)為設計值。
設計控制率為:
u=ua-sign(G)(ηa|ua|+ηb|ub|)RTE,
(27)
(28)
(29)

為了驗證方法的有效性,對包含不確定因素的航天器交會任務規劃進行仿真驗證。目標航天器軌道參數為高度h=400 km ,軌道傾角i=0.52 rad,偏心率e=0。目標航天器面質比為A/m=0.02 m2/kg,大氣密度ρ=1.23e1.38×10-4h,阻力系數Cd=1,擾動加速度與執行機構故障參數如表1所示。

表1 擾動加速度與執行機構故障參數Tab.1 Disturbance acceleration and actuator failure parameters
交會任務為初始相對狀態x0=(20 m,-200 m,-20 m,0 m/s,0 m/s,0 m/s),期望末端相對狀態xf=(0 m,0 m,0 m,0 m/s,0 m/s,0 m/s),任務時間tf=200 s。
設計包含4層隱含層單元的LSTM,利用反向傳播法得到LSTM參數用以描述不確定因素與執行機構誤差補償。設計任務參數e0=200,ereq=10-3,l=0.025,λ=diag(12,35,12),k=30,δD=0.1,nf=0.25,ηa=0.25,ηb=0.25。
仿真結果如圖5~圖7所示。由圖5(a)可以看出,采用本文方法在不確定因素以及執行機構故障的情況下,服務航天器的運動狀態仍然能夠在預設的性能約束內沿對接軸高精度地接近目標航天器,完成交會任務。地心方向、切向和法向的誤差均能按照預設瞬態性能在200 s時趨近于零,使服務航天器沿對接軸高精度、平穩接近目標航天器。由圖5(b)可以看出,傳統PID方法沒有考慮性能約束,在瞬態上收斂過程無法以給定誤差范圍收斂,且未進行不確定性因素辨識,最終收斂精度上有較大誤差(米級),控制性能無法滿足任務要求。由圖6(a)中的任務控制指令曲線可以看出,本文方法整個逼近過程中執行機構控制平滑,控制加速度始終小于0.1 m/s2,滿足約束條件。由圖6(b)可以看出,傳統PID方法給出的任務控制指令相對較大,且難以快速穩定,增加了任務的燃料消耗。由圖7可以看出,本文方法交會軌跡能沿對接走廊高精度到達終點,而傳統PID方法交會軌跡精度較差。

(a) 本文方法

(b) PID控制方法圖5 預設性能包絡下相對運動狀態Fig.5 Relative motion state enveloped under LSTM-PPC

(a) 本文方法

(b) PID控制方法圖6 任務指令Fig.6 Mission instructions

圖7 交會任務軌跡Fig.7 Rendezvous mission trajectory
本文針對存在不確定因素的空間非合作目標交會任務規劃問題,研究了一種基于LSTM與PPC的智能魯棒任務規劃方法。該方法能夠通過LSTM對不確定因素進行辨識,同時利用PPC對航天器的交會任務中的軌跡進行瞬態與穩態性能的設計,能夠有效地抑制不確定因素影響,提高航天器交會精度。通過與典型的控制方法進行數值仿真對比可以得出:針對非合作目標這種存在強不確定性、強干擾和未知機動等特點的特殊對象,傳統PID方法雖然具有較強的穩定性,但其任務規劃性能很差,無法保證追蹤航天器的安全和精度;本文提出的LSTM-PPC方法不僅能夠對系統信息和不確定性在線辨識,還能夠保證系統狀態滿足實際工程預設的性能范圍,具有較強的理論意義和工程應用價值。