董凱凱,羅建軍,馬衛華,*,高登巍,譚龍玉,3
1. 西北工業大學 航天學院,西安 710072
2. 中國兵器工業第203研究所,西安 710065
3. 上海航天控制技術研究所,上海 201109
與空間目標的交會是對空間飛行器在軌服務的前提,也是當前空間技術領域的研究熱點[1]。近年來,交會任務由針對空間合作目標發展到針對空間非合作目標。由于空間非合作目標在信息層面上不溝通、機動行為上不配合,對非合作目標的在軌操作仍是一個具有多種技術挑戰的公開研究領域。其中最大的挑戰是如何實現服務飛行器安全、可靠地與目標飛行器交會與接近。受非合作目標的信息不完備、不準確等因素影響,系統的標稱狀態與實際狀態之間不可避免地存在偏差。因此,在軌跡規劃與控制過程中需考慮服務飛行器燃料消耗和交會時間約束,以及交會過程中算法的魯棒性。
在空間目標交會的軌跡規劃與控制方面,最優或次優軌跡一般是在考慮實際工程約束(如控制能力、速度和交會走廊等約束)的同時,通過最小化指標函數得到的,其中指標函數一般表征燃料消耗和控制精度等[2]。在早期的研究中,羅亞中[3]和Tang等[4]考慮了開環模式下的導航和控制偏差,分別基于NSGA-II和物理規劃等多目標優化算法,考慮燃料消耗、交會時間和軌跡魯棒性等最優性指標對交會軌跡進行了設計。然而,文獻[3-4]的軌跡規劃采用的傳統直接法容易陷入局部極小值。Boyarko等[5]考慮了避障和交會精度約束,采用龐德里亞金最小-最大原則建立最優化模型,進而規劃燃料最少和時間最優的軌跡。但文獻[5]不適用于存在控制約束和路徑約束的最優化問題。耿遠卓等[6]針對單推力航天器交會對接中的軌跡規劃與控制問題,提出基于李雅普諾夫函數的滑模控制算法。然而,滑模控制算法固有的抖動現象使其難以應用于具有高精度要求的軌跡規劃與控制任務。Lu和Liu[2]考慮交會走廊、推力和羽流等約束,把非線性最優規劃問題轉化為序列二階錐規劃(SOCP)問題,進而求解得到燃料最優的軌跡;Biggs和Caubet[7]、Romano等[8]采用逆動力學方法進行軌跡規劃,把軌跡參數化為高階多項式,然后求解非線性優化問題得到最優軌跡。不過文獻[2,7-8]中的方法需要耗費過多的計算資源,不能在線實時軌跡重規劃。當外界環境發生變化或目標飛行器存在機動時,規劃的軌跡可能是不安全的。高斯偽譜方法(Gaussian Pseudospectral Method,GPM)以其較少參數和較高精度的優勢被認為是最具潛力的應用于實時最優控制問題的一種全局優化方法[9-10],因此一些學者基于GPM設計交會軌跡并取得了很好的研究成果[11-13]。Chu等[11]基于GPM設計交會軌跡和失效航天器進行交會,考慮了避障約束和交會過程中的不確定性。羅淑貞等[12]針對復雜多約束條件下翼傘系統的軌跡優化問題,基于GPM進行軌跡規劃,仿真結果表明相比已有的混沌粒子群優化算法,該方法具有較好的最優性和較高的精度。Jiang等[13]基于GPM和強化學習方法設計了進入火星大氣及在其表面降落過程中最優的軌跡,仿真表明了該方法的有效性。
模型預測控制(Model Predictive Control,MPC)方法具有顯式處理多約束、滾動在線優化應對不確定性因素的魯棒性,且可實現制導與控制的一體化設計,從而成為航天器多約束自主交會軌跡規劃與控制領域的研究熱點。文獻[14-19]針對不同的交會任務,分別或同時考慮推力、速度和交會走廊等約束及軌跡的魯棒性等,采用MPC方法進行軌跡規劃與控制。為提高算法的魯棒性,文獻[20-21]針對不同的任務需求,采用Tube-based MPC方法進行航天器近距離交會的軌跡規劃與控制,仿真表明該算法結果優于經典的MPC方法。上述研究均采用以目標星的軌道坐標系(當地水平當地垂直坐標系,Local Vertical Local Horizon,LVLH)、線性相對動力學模型、線性約束和二次型指標函數的處理思想,在MPC的框架下求解。然而實際應用中,在LVLH坐標系下進行軌跡規劃與控制需把追蹤星的星載相機和雷達測得的相對距離和相對速度等導航信息從視線坐標系轉化到LVLH坐標系。這不僅會增加計算量,轉化過程中也存在誤差。更重要的是對于翻滾目標而言,對接軸方向是時變的,采用LVLH坐標系從對接軸方向接近目標星會對控制器的設計帶來很大不便。因此,Li和Zhu[22]以目標星為原點,基于視線坐標系,考慮交會過程中的推力和交會精度等約束,直接利用視線坐標系下的導航信息在非線性MPC框架下進行軌跡規劃與控制。但文獻[22]采用非線性MPC進行軌跡規劃時只規劃了當前時刻以后的若干步軌跡,因此并不是全局的軌跡規劃。
針對當前研究中基于LVLH坐標系引起的導航信息轉換誤差、計算量大的問題,以及在視線坐標系下基于MPC進行軌跡規劃的非全局最優等問題,本文著眼于在視線坐標系下考慮多約束和不確定性情況,設計全局最優、可控可達的軌跡,并且實現實時、在線和穩定跟蹤控制。鑒于基于GPM的軌跡規劃具有精度高、收斂速度快和全局最優等特點,線性時變模型預測控制(Linear Time-Varying MPC,LTVMPC)方法具有方便處理多約束和不確定性、實現對非線性系統跟蹤等優良性能,因此基于GPM和LTVMPC理論提出了雙層MPC算法。
首先,根據視線坐標系下相對動力學模型,以控制能量消耗和誤差最小為性能指標,考慮非線性動力學約束、推力約束和初末端約束,把軌跡優化問題轉化為以控制量為優化變量的控制問題;其次,利用GPM方將最優控制問題轉化為易于求解的全局非線性規劃問題,在MPC框架下求解得到標稱最優軌跡;再次,在標稱軌跡附近線性化得到隨標稱軌跡變化的狀態轉移矩陣;最后,考慮實際工程中的多約束和不確定性,設計LTVMPC算法對標稱軌跡進行跟蹤,在保證跟蹤精度和最優性的同時,避免非合作目標不機動時軌跡的重規劃,進而保證算法在線實時運行,并且采用滾動優化的方式提高算法的魯棒性。根據提出的雙層MPC算法,設計相關仿真實驗,進一步驗證本文算法的有效性。
研究的重點放在驗證提出算法的有效性,并和文獻[22]中的傳統MPC方法相比較,同時鑒于追蹤星多在軌道面內接近非合作目標,因此只考慮軌道面內交會的情形。
定義如下坐標系:
1) 軌道坐標系(LVLH)為F0{O0-x0y0z0},O0定義為目標星的幾何中心,y0軸沿目標星軌道半徑方向由地心指向目標星,x0軸在軌道面內和y0軸垂直并且和速度方向成銳角,z0軸垂直于軌道面并且和x0軸與y0軸構成右手法則。
2) 視線坐標系為Flos{ρ,θ},如圖1所示,原點為LVLH坐標系的原點O0,視線距離ρ為從目標星中心到追蹤星的距離,視線角θ為向量ρ和x0軸正向的夾角,在軌道坐標系x0O0y0平面內,由x0軸順時針轉向向量ρ為正。

圖1 視線坐標系
根據文獻[22],針對偏心率小于0.1的目標軌道,如果近距離交會時間短,在視線坐標系下追蹤星和目標星的相對動力學方程為
(1)


(2)
式中:t為時間變量;A和B分別為系統狀態轉移矩陣和控制輸入矩陣,A(x)∈R4×4和B∈R4×2可表示為
(3)
式中:u為控制加速度,u=[Fρ,Fθ]T/mC;d∈R4×1為外界干擾或測量誤差等不確定性。追蹤星的目標狀態設置為xd=[x1d,x2d,0,0]T,和文獻[22]一致。
MPC是一種先進的控制框架/方法,能根據系統的當前狀態和動力學模型預測系統未來的狀態,然后通過求解一個帶有約束的開環最優控制問題獲得當前時刻的最優軌跡和相應的最優控制序列,只把最優控制序列的第一個控制輸入作用系統,滾動優化。它的優勢是能同時處理工程中的各種約束,并且能通過滾動優化的方式改善控制性能[23]。
雙層MPC進行軌跡規劃與控制的核心思想是利用GPM算法精度高、收斂速度快的特點進行全局最優的軌跡規劃,以及利用LTVMPC算法適用于非線性系統、對不確定性具有魯棒性的特點進行跟蹤控制,可以達到全局、在線和自主軌跡規劃以及穩定控制的目的。第1層MPC用于全局軌跡規劃,以控制能量消耗和誤差最小為性能指標,考慮控制加速度約束和初末端約束,采用GPM在MPC框架下求解得到標稱軌跡。需要說明的是,在本層軌跡規劃中并沒有特意考慮交會走廊走廊約束,主要原因是本層軌跡規劃分成兩部分,首先讓視線角收斂到期望狀態,視線距離收斂到安全距離,然后沿著期望視線角直線接近目標星,最終到達期望視線距離,由此隱式地考慮了交會走廊約束;第2層MPC用于跟蹤控制,首先在標稱軌跡附近線性化,得到隨標稱軌跡變化的狀態轉移矩陣,然后基于誤差系統建立優化模型,最后采用LTVMPC對標稱軌跡進行跟蹤。
文獻[22]采用非線性模型預測控制(NMPC)的方法進行軌跡規劃與控制,求解得到的軌跡是有限時域內指標最優的軌跡,并非全局最優的軌跡。軌跡規劃的目的是得到全局最優或近似最優的軌跡,并且所規劃的軌跡滿足動力學和控制等工程約束,從而使控制器能夠跟蹤上規劃的軌跡,即規劃的軌跡是可控、可達的。
針對非線性系統式(2),在求解最優或近似最優的標稱軌跡時,定義指標函數:

uT(t)Ru(t))dt
(4)
式中:t0和tf分別為任務開始時間和任務結束時間;Q和R分別為狀態和控制權重矩陣,且均為正定矩陣。在實際工程中控制加速度一般是有上限的,記為umax。因此控制加速度約束可以表示為
(5)
式中:umax=[u1maxu2max]T;E2為2階單位矩陣。另外,系統一般滿足狀態約束:
(6)
式中:xmax為系統狀態的上限,xmax=[x1maxx2maxx3maxx4max]T;E4為4階單位矩陣。為滿足任務要求的精度,終端狀態應滿足終端約束:
(7)
式中:xfmax為終端狀態的上限,xfmax=[x1fmaxx2fmaxx3fmaxx4fmax]T。
這樣,全局最優軌跡規劃問題可以描述為非線性最優控制問題ΨNOC,即在滿足約束式(5)~ 式(7)的同時,尋找使得指標函數最小的狀態軌跡x*和控制輸入序列u*:
(8)

采用LTVMPC方法對標稱軌跡xref和uref進行跟蹤。由于視線距離和視線角量級相差較大,而兩者的跟蹤誤差(實際狀態和標稱軌跡的差值)量級相差較小,因此基于誤差狀態設計控制器。
考慮到本文方法適用于一般的非線性系統,因此首先介紹一般非線性系統LTVMPC的設計方法。
對于一般連續的非線性系統,首先對它進行離散化,得到離散的非線性系統:
x+=f(x,u)
(9)
受到的不等式約束為
h(x,u)≤0
(10)

(11)
(12)
(13)

(14)


(15)
根據式(9),xi,k+1和xi,k存在關系
xi,k+1=f(xi,k,ui,k)
(16)

Ai,kΔxi,k+Bi,kΔui,k
(17)

Bi,kΔui,k=Ai,kΔxi,k+Bi,kΔui,k+ri,k
(18)

(19)
由式(10)可知,(Δxi,k,Δui,k)滿足不等式約束:
(20)
把采用LTVMPC對標稱軌跡進行跟蹤問題轉化為二次規劃(QP)問題,定義指標函數QPMPC為跟蹤精度和控制加速度增量的二次型指標:
(21)
在每一個時刻i,假設此時的狀態為xi,在存在初始約束式(15)、動力學約束式(18)和路徑約束式(20)(包括避障、控制加速度等約束)的情況下,求解最優控制序列Δui=[Δui,0,Δui,1,…,Δui,N-1]T使指標函數式(21)最小,可求解QP問題得到
Δxi,k+1=Ai,kΔxi,k+Bi,kΔui,k+ri,k
k=0,1,…,N-1
Ci,kΔxi,k+Di,kΔui,k+hi,k≤0
k=0,1,…,N-1
(22)
(23)
然后,把控制輸入ui作用到系統,得到新的狀態xi+1,滾動優化。由于每一時刻的求解都用到當前時刻的測量信息,因此提出的控制方法屬于反饋控制方法。
綜上,設計的全局軌跡規劃與控制的雙層MPC算法如圖2所示。考慮到非合作目標不是一直在機動,因此在其不機動時可不進行軌跡的重規劃,采用LTVMPC直接跟蹤最優軌跡,在保證有限時域內軌跡最優的同時,進一步減小了計算量,有利于算法實時在線實施。

圖2 雙層MPC算法框圖
值得注意的是,在考慮的如式(2)所示的非線性系統中Ai,k和Bi,k可表示為
(24)

假設目標星運行在半長軸為104km、偏心率為0.1的橢圓軌道上,其軌道六要素如表1所示。目標星的初始位置在近地點處,在追蹤星后方80 m 處。由于研究的是航天器超近距離交會,因此追蹤星和目標星受到的攝動力基本一致。假設兩個方向采用連續推力,最大控制加速度設為0.1 m/s2[7],仿真周期設為300 s,仿真步長設為0.1 s。權重矩陣參數如表2[22]所示。

表1 目標星仿真參數

表2 權重矩陣參數[22]
追蹤星初始位置位于目標星正前方80 m,初始視線角為0°,即ρ0=80 m、θ0=0°。軌跡規劃的目標是分別沿90°、180°和270°的末端視線角接近目標星,考慮發動機工作冗余能力,規劃的最大控制加速度umax小于實際發動機最大推力加速度,取為0.08 m/s2。出于安全和后續的操作考慮,軌跡規劃的終點是對接軸幾何中心,位于目標星本體正前方1 m處。
為安全接近目標星并提高視線角的控制精度,把軌跡規劃分成兩部分,首先讓視線角θ收斂到期望狀態θd,視線距離收斂到安全距離(取ρs=10 m),然后沿期望視線角θd直線接近目標星,最終到達期望視線距離ρd。基于GPM求解軌跡規劃問題,并和文獻[22]采用的MPC方法對比。文獻[22]采用有限時域最優的軌跡規劃與控制方法把追蹤星控制到期望狀態,屬于局部軌跡規劃與控制方法。
圖3描述了追蹤星分別沿90°、180°和270°接近目標星時設計的軌跡和采用文獻[22]中MPC方法計算得到的軌跡。可看出采用本文方法設計的軌跡在燃料消耗和交會時間方面明顯優于傳統的MPC方法(具體分析見3.2節)。這是由于采用基于GPM的軌跡規劃是全局最優的,因此相對于傳統MPC方法更省燃料。另外,優化計算在MATLAB 環境下編程,計算機CPU為2.5 GHz/Core i5-4200M、內存為8 G,規劃一次耗時約為20 s。

圖3 采用本文方法和傳統MPC方法設計的跟蹤軌跡
采用設計的LTVMPC算法對3.1節得到的標稱軌跡進行跟蹤,預測時域Ns=5,控制時域Nu=4,采樣周期為Ts=0.1 s。鑒于跟蹤控制和規劃運動中的控制加速度總和不大于實際發動機最大推力加速度,因此跟蹤控制中的最大控制加速度Δumax取為0.02 m/s2,控制周期為0.1 s。由于控制周期為0.1 s,因此實時性的指標設置為求解一次控制指令的時間不超過0.05 s。
為分析純算法和存在不確定性時控制器的性能,分別針對這兩種工況進行仿真驗證分析。
3.2.1 不考慮不確定時的交會仿真驗證
在不考慮不確定性時,首先驗證算法的全局最優性和跟蹤精度。設定任務完成的標志為系統狀態進入誤差帶,即|ρ-ρd|≤0.01 m、|θ-θd|≤0.01°,并且此后系統的狀態一直維持在誤差帶中。
表3為沿90°、180°和270°接近目標星情況下采用提出的方法和傳統MPC方法計算的燃料消耗對比。可看出在燃料消耗方面,設計的基于GPM和LTVMPC的雙層MPC方法比文獻[22]中采用的傳統MPC方法節省30%以上的燃料。表4為沿90°、180°和270°視線角接近目標星情況下采用提出的方法和傳統MPC方法交會時間的對比。可看出在交會時間方面,提出的方法顯著優于傳統MPC方法,采用本文方法的交會時間大約是采用傳統MPC方法交會時間的50%。

表3 燃料消耗

表4 交會時間


圖4 追蹤星相對狀態曲線

圖5 追蹤星沿90°視線角方向的接近軌跡(LVLH坐標系)
對非線性系統來說,其狀態轉移矩陣是和標稱軌跡上狀態相關的。為提高跟蹤精度使用LTVMPC算法對標稱軌跡進行跟蹤,同時在目標不機動時離線計算預測時域內的狀態轉移矩陣,進一步減小了在線計算量,可保證算法在線自主實施。為保證交會的安全分成兩部分對軌跡設計,因而圖5(b)中追蹤器的軌跡在y軸上的投影出現雙峰現象。

圖7為采用3.1節方法規劃的軌跡及LTVMPC算法對規劃軌跡進行跟蹤得到的實際軌跡在平面LVLH坐標系下的投影。從圖6(a)和圖7可看出,采用提出方法得到的跟蹤軌跡和所規劃的軌跡以很高精度重合,并且隨距離減小跟蹤精度越來越高,這說明規劃的軌跡是可控可達的,同時跟蹤精度滿足任務要求。圖8為追蹤星控制加速度變化曲線,從圖6和圖8可看出大概在100 s時追蹤器完成交會任務,且控制加速度滿足工程約束。

圖6 跟蹤誤差曲線

圖7 本文方法設計的軌跡和實際跟蹤軌跡

圖8 控制加速度曲線
3.2.2 考慮不確定性時的交會仿真驗證
由于研究的是航天器超近距離交會,因此追蹤星和目標星受到的相對J2攝動力很小,另外大氣阻力加速度幅值大概是引力加速度幅值的0.4×10-5倍[24],量級也非常小,因此考慮的不確定性主要包括交會過程中的測量誤差和控制加速度偏差。根據交會精度要求[25],視線距離測量誤差設置為均值為0、標準差為0.1 m的白噪聲,視線角測量誤差設置為均值為0、標準差為0.05°的白噪聲。控制加速度偏差設置為標稱值的10%。設定任務完成的標志為系統狀態進入誤差帶,即|ρ-ρd|≤0.1 m、|θ-θd|≤0.05°,并且此后系統的狀態一直維持在誤差帶中。在存在上述不確定性時,圖9(a)~圖9(d)分別給出了追蹤星視線距離、視線角、視線速度和視線角速度的跟蹤誤差隨時間變化的曲線。從圖9可看出,在存在不確定性時大概在90 s時系統的狀態進入誤差帶。

圖9 考慮不確定性時跟蹤誤差曲線
圖10描述了存在不確定性時控制加速度隨時間變化的曲線。由于不確定性的存在,控制加速度存在“抖震”現象,但由于標稱控制加速度及偏差都是有界的,因此實際的控制加速度仍滿足控制飽和約束。

圖10 考慮不確定性時的控制加速度曲線
3.2.3 LTVMPC與傳統LQR方法的比較
先采用軌跡規劃方法對軌跡進行規劃,再利用線性二次型調節器(Linear Quadratic Regulator,LQR)等控制方法實現對軌跡的跟蹤是一種傳統的方法。因此將雙層MPC方法和GPM+LQR方法相比較,以驗證本文算法的優越性。由于LQR方法不能顯式地處理約束,而在實際交會任務中的推力一般是有上限的,因此采用LQR方法有可能違反控制飽和約束。控制加速度上限設置為0.1 m/s2,圖11(a)和圖11(b)為采用傳統LQR方法對設計的軌跡進行跟蹤的控制加速度曲線,可看出采用LQR方法約在55 s時控制加速度違反控制約束,說明設計的LTVMPC算法在軌跡跟蹤方面優于傳統LQR方法。圖11(c)和圖11(d)為交會的過程中存在和3.2.2節中相同的不確定性時,采用傳統的LQR方法對設計的軌跡進行跟蹤的控制加速度曲線。可看出存在不確定性時采用LQR方法嚴重違反控制飽和約束。這充分說明采用設計的LTVMPC方法不僅能夠處理控制飽和等多約束,而且對不確定性具有魯棒性。

圖11 采用LQR方法時的控制加速度曲線
另外,LTMPC方法采用和規劃層GPM相同的計算平臺,求解一次控制指令耗時約0.04 s,能滿足實時性的要求。
1) 針對目前空間非合作目標交會中存在的在LVLH坐標系下導航信息轉換帶來的誤差問題和基于視線坐標系進行軌跡規劃中的非全局最優等問題,基于GPM的軌跡規劃具有精度高、收斂速度快和全局最優等特點,且LTVMPC方法具有能方便處理多約束、不確定性和跟蹤非線性系統的優良性能,提出了基于GPM和LTVMPC的雙層MPC算法。
2) 在軌跡規劃層面考慮控制飽和及終端等約束,同時以控制精度最優和能量消耗最少為指標函數建立優化模型,基于GPM將最優控制問題轉化為易于求解的全局非線性規劃問題,在MPC框架下求解得到全局指標最優的、可控和可達的標稱軌跡,從而適用于全局大范圍非線性最優規劃的情形。
3) 在軌跡跟蹤控制層面,考慮交會過程中存在的不確定性和多約束設計LTVMPC算法對標稱軌跡進行追蹤,避免了存在不確定性時軌跡的重規劃,進一步減小了計算量,保證算法在線自主實施。同時,在燃料消耗和交會時間方面,提出的方法均顯著優于傳統的MPC方法,在處理控制飽和等工程實際約束方面優于傳統的LQR方法。另外,由于LTVMPC算法采用滾動優化的方式,因此對交會過程中存在的不確定性具有魯棒性,適用于與非合作目標交會的情形。