郭聰,陳楊,貝超
(北京電子工程總體研究所,北京 100854)
面向空間非合作目標附著的制導控制律設計*
郭聰,陳楊,貝超
(北京電子工程總體研究所,北京 100854)
以實現對空間非合作目標表面附著的同時保證與其相對速度為0(“零距零速”附著)為目標,首先規劃了附著任務的燃料最優軌跡,推導了主動飛行器動力學模型中的最優性一階必要條件,用間接法求解多約束下的燃料最優附著問題。然后,提出了用滑模變結構控制追蹤燃料最優軌跡的“零距零速”附著控制方法,結合了燃料最優控制和滑模控制的優點,是一種近似燃料最優的反饋控制方法。仿真算例表明,該方法可有效克服初始誤差和建模誤差,同時實現近似燃料最優,具有一定的可行性和工程應用價值。
零距零速;非合作目標;燃料最優;極大值原理;滑模控制;指數趨近律
隨著在軌衛星數量迅速增長,在軌維護任務的需求不斷上升,牽引了相關技術的研究開展。針對合作目標的相關技術已進入工程應用階段,針對非合作目標的相關研究仍處于關鍵技術攻關階段。其中,如何處理具有非合作屬性的在軌失效衛星就是一個十分棘手的問題。
非合作目標的在軌服務難度要遠大于合作目標,以失效衛星為例,這類目標通常會繞其最大慣量主軸自旋[1],自旋角速度一般大于1(°)/s[2]。對非合作自旋目標的在軌服務策略主要有以下2種[3]:第1種是保持主動飛行器的相對位姿不動,采用機械臂等降低目標飛行器的轉動角速度后進行操控;第2種是對主動飛行器施加控制,使其與目標飛行器姿態同步后進行操控。顯然,后一種策略具有較高的安全性和可行性。執行在軌維護的前提是完成對目標的抵近以及可靠連接,其中主動飛行器制導控制技術是關乎大局的關鍵技術。在目標抵進過程的軌道運動領域,文獻[4-5]采用在主動飛行器軌道系中的模型,其中文獻[4]考慮了機動規避的情況用Lyapunov最小-最大方法設計控制律。文獻[6-7]則采用了在主動飛行器視線系中的相對運動模型,其中文獻[7]在文獻[6]的基礎上,控制律設計中采用了滑模控制和自適應控制的方法。文獻[8]則在目標飛行器軌道系中建模,并設計了非線性反饋姿態控制律以及基于最優實時閉環反饋法的軌道控制律。在實現兩飛行器之間的姿態同步控制領域,文獻[9]采用了反饋控制和最優控制的方法,文獻[10]則采取了前饋和反饋相結合的控制方法,文獻[11]針對空間機器人捕獲自由漂浮航天器的問題,設計了相對位置和姿態的同步控制算法,文獻[12]中研究了針對于翻滾目標交會的最優控制問題。
主動飛行器向目標飛行器的接近過程對于在軌服務無疑是非常重要的一個過程,對于各類空間任務來說,接近過程的燃料消耗是工程實際中最關心的因素之一,此外設計的控制系統抵抗因目標非合作屬性導致的擾動的能力是另一大關注點。本文在工程實際需求的牽引下,以針對非合作目標的“零距零速”附著任務為背景,在目標飛行器本體坐標系中建立主動飛行器動力學模型,采用間接法求解多約束條件下的燃料最優問題,將結果作為標稱軌跡;進一步引入滑模變結構控制跟蹤該最優軌跡,實現一種近似燃料最優的反饋控制。本文采用的方法在在軌服務領域公開發表的文獻中尚未見報道,該方法能夠為背景任務的開展提供一定的參考。
1.1坐標系定義
任務起始時,主動飛行器與目標飛行器已經相當接近,通過主動飛行器上搭載的多模探測系統可直接獲取到與目標飛行器的相對位置、速度信息,以及目標飛行器的自旋角速度等信息,故直接利用2個飛行器之間的相對運動參數設計制導控制規律,從而能夠獲得滿足附著任務需求的相對位置精度。在研究空間飛行器環繞地球運行的經典二體問題時,在軌空間飛行器以地心慣性坐標系作為參考系。然而,在建立環繞地球飛行的2飛行器之間的相對運動模型時,不能再采用地心慣性坐標系,而需要引進新的坐標系。為方便研究主動飛行器對非合作的目標飛行器的相對運動,常用的坐標系為目標飛行器軌道坐標系或者主動飛行器視線坐標系。但在此類坐標系中,大多把目標飛行器看做一個質點,沒有考慮附著點在坐標系中的具體位置,更沒有考慮到目標自旋對附著點跟蹤的影響。
定義目標飛行器固連坐標系,原點O位于目標飛行器的整體質心處,3個坐標軸OXb,OYb,OZb與目標飛行器本體固連,其中OZb沿飛行器的最大慣量主軸方向,通常來說,典型的非合作目標如失效航天器等均繞其最大慣量主軸自旋。OXb,OYb沿目標飛行器的其他2個慣量主軸方向。因此,目標飛行器旋轉角速度可表示為ω=(0,0,ω)T。
1.2動力學模型
在自旋角速度遠大于軌道角速度、目標飛行器軌道周期遠大于任務周期這2個“遠大于”的基礎上,可以合理的忽略軌道角速度,只考慮目標自旋角速度在2飛行器相對運動模型起作用,顯然目標飛行器相對于慣性空間的加速度也是一個小量,可以被忽略。
在目標飛行器本體系中,簡化發動機推力模型,主動飛行器的動力學方程為
(1)
式中:r為目標本體系中主動飛行器的位置矢量;ω為目標飛行器的自旋角速度;T為主動飛行器發動機推力值;m(t)為主動飛行器的瞬時質量;α為描述主動飛行器發動機推力方向的單位矢量;f為綜合考慮攝動加速度、目標飛行器可能存在的規避機動加速度、系統外部輸入的干擾以及模型不確定部分等,形成的總的不確定等效性加速度項。在式中,發動機推力幅值T和推力方向α是控制量。
將動力學方程式(1)寫成更為具體的分量形式,且由本文先前所述,在目標本體坐標系中ω=(0,0,ω)T,一并代入式(1)可得

(2)
在規劃“零距零速”附著任務的燃料最優軌跡時,暫不考慮建模過程中的各種干擾和誤差導致的等效加速度項f,主動飛行器的動力學方程簡化為
(3)
將動力學方程式寫為狀態方程形式

(4)
式中:Isp為發動機比沖;g0為海平面重力加速度。
本問題中,初始時刻記為t0,初始狀態約束為
r(t0)=r0,v(t0)=v0,m(t0)=m0.
(5)
終端時刻記為tf,終端狀態約束為
r(tf)=rf,v(tf)=0.
(6)
為了使任務過程中的燃料消耗最少,性能指標選取終端型性能指標[13],并設計如下的具體形式:
J=-λ0m(tf),
(7)
式中:λ0為初值歸一化乘子[14]。

(8)
燃料最優控制問題的Hamilton函數為
(9)

(10)
式(4)所描述的7維狀態方程和式(10)所描述的7維協態方程,組成了本文中最優控制問題的正則方程,該14維微分方程組是求解本問題的關鍵。
根據Pontryagin極大值原理,所求得的最優控制律應使Hamilton函數取極值。Hamilton函數中與控制量(發動機推力幅值T和推力方向α)有關的項
(11)
整理得
(12)
為使Hamilton函數取極值,要使式(12)盡量小。
式中:T是非負的,括號中第2項的取值恒為正,括號中第1項因為推力方向α的形式不確定而無法確定大小及正負。故在設計α時,既要考慮能夠使式的值盡量小,又能夠盡量兼顧表達形式簡潔。
于是,選取如下推力方向控制策略

(13)
即推力方向α總是與速度協態變量λv反向。
將式(13)代入式(12),有

(14)
式中:

(15)
設主動飛行器發動機提供的最大推力為Tmax,則該發動機提供的推力值區間為[0,Tmax]。以使Hamilton函數取極小值為目標,對式(14)的取值情況做如下討論:
當ρ>0時,為使式(14)取值盡量小,T取下界即T=0;
當ρ<0時,為使式(14)取值盡量小,T取上界即T=Tmax。
即形成如下的推力幅值控制策略
(16)
采用式(16)描述的推力幅值策略,主動飛行器的發動機只工作于其推力區間的2個邊界值上,即滿推力狀態和零推力狀態,故又稱bang-bang控制。ρ為開關函數,它的值決定了發動機的開啟或關閉。相應的,主動飛行器的軌道將分為T=Tmax的滿推段和T=0的滑行段。
綜上,由Pontryagin極大值原理分析確定了如下的最優控制律:最優推力幅值為bang-bang控制,而推力方向總與速度協態變量的方向相反,最優控制律的具體形式以及開關函數見式(13),(16)和(15)。
由于末端質量m(tf)自由,質量協態變量的末端值要滿足橫截條件
(17)
至此,最優控制問題已轉化為兩點邊值問題。共有8個約束方程需要滿足,即式(6)表示的固定的末端位置速度約束、式(17)表示的末端橫截條件約束以及式(8)表示的歸一化乘子約束條件。
3.1滑模控制律設計
在求得燃料最優著陸軌跡之后,將其作為標稱值,設計滑模變結構控制器跟蹤最優軌跡,實現對空間非合作目標近似燃料最優的“零距零速”附著。
記主動飛行器燃料最優標稱運動軌跡的x,y和z分量分別為ξ,η和ζ,其實際運動軌跡的三軸分量分別為x,y,z。以x方向為例,定義主動飛行器在x方向對最優軌跡的跟蹤誤差為
ex=x-ξ.
(18)

(19)
式中:常數cx>0。
對式(19)求導,有

(20)
由系統動力學方程式推導得到其在x軸方向上的分量方程為

(21)
將式(21)代入式(20),并選擇指數趨近律

(22)
式中:-kxsx為指數趨近項,kx值決定了收斂速度的大小,該項能夠保證當滑動變量sx離滑模面較遠時,系統狀態能夠盡快向滑動模態轉移。-εxsgnsx為等速趨近項,此項存在的必要性是由于單純的指數趨近無法保證運動點在有限時間內到達切換面,導致切換面上也就不存在滑動模態,因而增加此項使得當s接近于0時,趨近速度為εx而不是0,有效保證有限時間內可達。εx為表示系統的運動點趨近切換面s=0的速率,εx越大,趨近速度越快,但同時運動點到達滑模面(切換面)的時刻將具有較大的速度,從而導致系統的抖動增大,俗稱“抖振”現象[15]。sgn為符號函數,表達式為
(23)
為了避免滑模控制中的“抖振”現象,可以用飽和函數sat代替式(22)表示的符號函數
(24)
式中:Δsx是為了避免“抖振”而設定的邊界。
對于國家出臺的一系列政策以及一些試行建議和措施,我國公民可以積極參與,聽一些民主政治會議,并在會議上提出自己的意見和建議,以此來不斷優化政策和措施,為我國的民主政治建設貢獻力量,不斷推動我國社會的民主建設,促使社會的不斷發展。
將式(21),(22)代入式(20),并用飽和函數sat代替式(22)表示的符號函數,整理后得到x方向的控制加速度為
εxsatsx-kxsx-fx,
(25)
式中:fx為總的不確定等效加速度項的x軸分量。由于事先只能估算fx的范圍,無法預測準確的值,其在控制加速度中不能出現。故有
εxsatsx-kxsx.
(26)
同理,重復上述步驟,可設計得到y方向和z方向的控制加速度
εysatsy-kysy;
(27)
εzsatsz-kzsz.
(28)
在本文所定義的目標本體坐標系中,可知ω=(0,0,ω)T,代入式(26)~(28)可得
εxsatsx-kxsx,
(29)
εysatsy-kysy,
(30)

(31)
利用滑模控制律(29)~(31)將主動飛行器的運動約束在末端時間約束下的燃料最優軌跡附近,不僅對建模不確定性和初始擾動的敏感性大大降低,同時在任務約束下可最大限度的降低主動飛行器的燃料消耗,實現一種近似燃料最優的閉環反饋控制。
在計算機仿真過程中,標稱軌跡的位置、速度信息可直接對末端時間約束下的燃料最優軌跡插值得到。將燃料最優軌跡中的位置、速度函數作為被插值的樣本函數,很容易得到Lagrange插值多項式,公式結構緊湊,該方法在理論分析和工程應用中得到廣泛應用。
3.2控制律的Lyapunov穩定性分析
為了判斷存在擾動時系統的穩定性,以x方向為例進行分析。
取Lyapunov函數
(32)
求導得
(33)
將動力學方程(21)以及控制律(29)代入式(33),有
(34)
假設擾動項fx是有界的,滿足
|fx|≤Dx,Dx≥0.
(35)
進一步,取
εx≥Dx,
(36)
于是有
(37)
即,系統在x方向上的運動是漸近穩定的[15]。
4.1末端時間約束下的燃料最優問題算例
以本文背景任務為算例,由于本文在目標固連本體系中描述主動飛行器的運動軌跡,且目標飛行器存在一定的自旋角速度,使主動飛行器相對與目標飛行器存在一個由目標自旋導致的相對速度,該相對速度可由如下公式計算得到
v=ωr.
(38)
假設目標飛行器軌道高度為800 km,其自旋角速度為2 (°)/s;主動飛行器的質量為50 kg,發動機比沖300 s,發動機推力80 N;主動飛行器在目標本體坐標系中的初始相對位置約束為(0,-1.0,0)km,初始相對速度約束為(-0.034 9,0,0)km/s,末端相對位置約束為(0.001,0.001,0.001)km,末端相對速度約束為(0,0,0)km/s,任務時間約束設定為60 s。
本文在采用協態變量歸一化方法生成協態變量后,協態變量的初始設計范圍縮小到(0,1)開區間內,使得對協態變量初值的猜測更加容易。采用Fortran的四階龍格-庫塔求解器遞推求解得到主動飛行器的實時運動參數,進一步采用非線性方程求解器hybrd1對問題涉及的非線性約束方程組進行迭代求解,經過多次迭代求得終端時間約束下燃料最優的附著軌跡,如圖1~3所示。

圖1 末端時間約束下的燃料最優軌跡位置曲線Fig.1 Position curve of fuel-optimal trajectory with time constraint

圖2 末端時間約束下的燃料最優軌跡速度曲線Fig.2 Velocity curve of fuel-optimal trajectory with time constraint

圖3 末端時間約束下的燃料最優軌跡推力曲線Fig.3 Fuel-optimal trajectory thrust curve with time constraint
算例中,燃料最優軌跡需要消耗的主動飛行器推進劑質量約0.589 1 kg。
4.2跟蹤燃料最優軌跡的滑模變結構控制問題算例
將燃料最優軌跡算例作為標稱值,采用滑模控制器對該標稱軌跡進行跟蹤。在滑模控制的參數值選取上,由于本例中建模不確定性造成的加速度數量級較小,小于10-1m/s2,故算例中等速趨近項參數選取(10-3,10-3,10-3),指數趨近項系數k選取(0.2,0.2,0.2),滑模面系數c取值(1,1,1)。
4.2.1 無初始誤差情況
沒有初始誤差的情況下,仿真結果如圖4~6所示。

圖4 無初始誤差情況下對最優軌跡的位置跟蹤誤差Fig.4 Position tracking error of optimal trajectory without initial error

圖5 無初始誤差情況下對最優軌跡的速度跟蹤誤差Fig.5 Velocity tracking error of optimal trajectory without initial error

圖6 無初始誤差時飛行過程中發動機的推力變化Fig.6 Thrust variation of engine during flight without initial error
分析上述圖中結果,飛行過程中的位置、速度誤差的數量級均在10-3以下,說明設計的滑模控制律能夠對先前規劃的燃料最優軌跡進行高精度跟蹤。采用滑模控制的實際飛行軌跡產生的燃料消耗約0.612 1 kg,接近燃料最優軌跡給出的最優值,實現了近似燃料最優的反饋控制。
4.2.2 存在初始誤差情況
在真實任務場景中,因為定軌誤差的存在,導致主動飛行器在初始時刻的位置、速度與規劃的標稱軌跡初始點的位置、速度存在偏差。
在仿真中,將主動飛行器的初始位置、速度均加入誤差,其中初始位置誤差Δr=(0.1,0.1,0.01)km,初始速度誤差Δv=(0.001,0.001,0.001)km/s。需要說明的是:為了驗證控制律的有效性以及更明顯的反應出控制律的控制效果,初始誤差的取值均比實際情況要大。相應的仿真結果如圖7~9所示。

圖7 存在初始誤差情況下對最優軌跡的位置跟蹤誤差Fig.7 Position tracking error of optimal trajectory with initial error

圖8 存在初始誤差情況下對最優軌跡的速度跟蹤誤差Fig.8 Velocity tracking error of optimal trajectory with initial error
如圖,在滑模控制律的作用下,主動飛行器在飛行過程中克服了初始誤差。圖9為滑模控制下的飛行過程發動機推力變化。由于初始誤差取值較大,導致主動飛行器在飛行開始階段修正初始誤差、回到標稱軌跡這一過程的燃料消耗較大,最終實際消耗推進劑約0.67 kg,大于無初始擾動情況的0.612 1 kg和末端時間約束下的燃料最優策略情況的0.589 1 kg。
需要指出的是,在實際工程中,發動機開機時的推力近似為常值(不考慮誤差)。所以,計算機仿真得到的連續變化的推力需要進一步調制成發動機多次開關機的常值推力形式。這就要求主動飛行器攜帶多種不同推力的發動機,以保證末端附著精度。常值推力調制的方法國內外已有較多相關研究,本文受篇幅所限不再贅述。
本文基于固連于目標飛行器的目標本體坐標系建立主動飛行器動力學模型,提出了一種滑模變結構控制跟蹤燃料最優軌跡的閉環反饋控制方法。該方法將燃料最優控制與滑模變結構控制相結合,通過理論分析和仿真結果表明:該方法在繼承了滑模變結構控制快速響應、對參數變化及擾動不敏感的特點的同時,還能使得燃料消耗近似最少。此方法對于具體工程應用具有一定的參考意義。
[1] 劉智勇,何英姿.慢旋非合作目標接近軌跡規劃[J].空間控制技術與應用,2010,12,36(6):6-10.
LIU Zhi-yong,HE Ying-zi.Slowly Rotating Non-Cooperative Target Proximity Trajectory Planning[J].Aerospace Control and Application,2010,12,36(6):6-10.
[2] MATSUMOTO S,DUBOWSKY S,JACOBSEN S,et al.Fly-by Approach and Guidance for Uncontrolled Rotating Satellite Capture[C]∥AIAA Guidance,Navigation,and Control Conference and Exhibit,Austin,Texas:AIAA,2003:5745.
[3] 耿云海,盧偉,陳雪芹.在軌服務航天器對失控目標的姿態同步控制[J].哈爾濱工業大學學報,2012,44(1):1-6.
GENG Yun-hai,LU Wei,CHEN Xue-qin.Attitude Synchronization Control of On-Orbit Servicing Spacecraft with Respect to Out-of-Control Target[J].Journal of Harbin Institute of Technology,2012,44(1):1-6.
[4] 盧山,徐世杰.非合作目標的自主接近控制律[J].中國空間科學技術,2008(5):7-10.
LU Shan,XU Shi-jie.Autonomous Proximity Control Law for Non-Cooperative Targets[J].Chinese Space Science and Technology,2008(5):7-10.
[5] 車汝才,張洪華.跟蹤空間非合作目標的追蹤星相對軌道設計研究[C]∥全國第十二屆空間及運動體控制技術學術年會論文,北京,2006:362-367.
CHE Ru-cai,ZHANG Hong-hua.Research on Relative Orbit Design for Tracking Non-Cooperative Targets[C]∥The 12th Annual Conference on Space and Motion Control Technology,Beijing,2006:362-367.
[6] 張大偉,宋申民,裴潤,等.非合作自主交會對接動態障礙物躲避模糊制導[J].航天控制,2010(5):51-57.
ZHANG Da-wei,SONG Shen-min,PEI Run,et al.Non-Cooperative Autonomous Rendezvous and Docking Dynamic Obstacle Avoidance Fuzzy Guidance[J].Aerospace Control,2010(5):51-57.
[7] 張大偉.飛行器自主交會對接制導與控制方法研究[D].哈爾濱:哈爾濱工業大學航天學院,2010.
ZHANG Da-wei.Research on Guidance and Control of Autonomous Rendezvous and Docking of Spacecraft[D].Harbin:School of Astronautics HIT,2010.
[8] 盧山,徐帷,劉宗明,等.面向高軌飛行器的在軌操控技術[J].宇航學報,2014(4):425-431.
LU Shan,XU Wei,LIU Zong-ming,et al.On-Orbit Control Technology for High Altitude Spacecraft[J].Journal of Astronautics,2014(4):425-431.
[9] NAKASUKA S,FUJIWARA T.New Method of Capturing Tumbling Object in Space and Its Control Aspects[C]∥Proceedings of the 1999 IEEE International Conference on Control Applications,Piscataway:IEEE,1999:973-978.
[10] TSUDA Y,FUJIWARA T,NAKAMURAT,et al.The Attitude Control for Motion Synchronization to Capture Free-Flying Object[C]∥Proceedings of the 8 ISAS Workshop on Astrodynamics and Flight Mechanics.Tokyo:ISAS,1998:348-354.
[11] WELSH S J,SUBBARAO K.Adaptive Synchronization and Control of Free-Flying Robots for Capture of Dynamic Free-Floating Spacecrafts[C]∥AIAA/AAS Astrodynamics Specialist Conference and Exhibit,Reston:AIAA,2004:5298.
[12] BOYARKOG,YAKIMENKOD,ROMANOM.Formulation and Analysis of Matching Points of Interest in Two Spacecraft for Optimal Rendezvous[C]∥AIAA Guidance,Navigation,and Control Conference,Reston:AIAA,009:5669.
[13] 王青,陳宇,張穎昕,等.最優控制——理論、方法與應用[M].北京:高等教育出版社,2011.
WANG Qing,CHEN Yu,ZHANG Ying-xin,et al.Optimal Control:Theory ,Method and Applications[M].Beijing:Higher Education Press,2011.
[14] 蔣方華,李俊峰,寶音賀西.平滑技術與開關函數檢測方法在燃料最優控制中的應用[C]∥全國第十四屆空間及運動體控制技術學術年會論文集,四川,2010.
JIANG Fang-hua,LI Jun-feng,BAOYIN He-xi.Application of Smoothing Technique and Switching Function Detection Method in Fuel-Optimal Control[C]∥Proceedings of the 14th Annual Conference on Space and Motion Control Technology,Sichuan,2010.
[15] 劉金琨.滑模變結構控制Matlab仿真[M].北京:清華大學出版社,2012.
LIU Jin-kun.Matlab Simulation of Sliding Mode Variable Structure Control[M].Beijing:Tsinghua University Press,2012.
DesignofGuidanceControlLawforSpaceNon-CooperativeTargetAttachment
GUO Cong,CHEN Yang,BEI Chao
(Beijing Institute of Electronic System Engineering,Beijing 100854,China)
In order to achieve the goal of attaching the surface of the non-cooperative target while relative velocity is zero, the following research has been done. Firstly, the fuel optimal trajectory of the task is programmed. The first order necessary conditions of the optimal dynamic model of active vehicle are derived and indirect method is used for solving the optimal fuel adhesion problem with multiple constraints. Then, a “zero distance and zero velocity” adhesion control method is proposed with sliding mode control to track the fuel optimal trajectory. This method combining the advantages of fuel optimal control and sliding mode control is a kind of approximate optimal feedback control method. Simulation example shows that this method can effectively overcome the initial error and model error, and achieve approximate fuel optimal. This method has certain feasibility and engineering application value.
zero distance zero velocity;non-cooperative target;fuel optimization;maximum principle;sliding mode control;exponential approach law
2017-02-21;
2017-03-10
有
郭聰(1991-),男,北京人。碩士生,主要從事空間飛行器總體方向研究。
通信地址:100854 北京142信箱30分箱E-mail:guocong1991@foxmail.com
10.3969/j.issn.1009-086x.2017.05.013
V448.233;TP391.9
A
1009-086X(2017)-05-0078-09