梁 斌,高學海,,潘 樂,仇 越(.哈爾濱工業大學控制科學與工程系,5000哈爾濱;.深圳航天東方紅海特衛星有限公司,58054廣東深圳)
編隊接近非合作目標PSO多脈沖制導方法
梁 斌1,高學海1,2,潘 樂2,仇 越2
(1.哈爾濱工業大學控制科學與工程系,150001哈爾濱;2.深圳航天東方紅海特衛星有限公司,518054廣東深圳)
為解決地球靜止軌道(GEO)非合作目標遠距離自主接近中的雙視線導航約束以及制導精度問題,提出了一種雙星編隊接近的粒子群優化(PSO)多脈沖制導方法,該方法將C-W雙脈沖制導律轉化為帶中途修正的多脈沖制導律,然后將時間固定的多脈沖燃料消耗最優問題轉化為帶雙視線夾角約束和制導精度約束的多目標優化問題,接著將帶約束的多目標優化問題轉化為PSO規劃問題并給出規劃算法.通過在不同條件下的對比仿真驗證結果表明,該方法能夠有效的完成對非合作目標遠距離的制導.
編隊接近;多脈沖;PSO;非合作目標;空間機器人
利用空間機器人對地球靜止軌道航天器進行在軌服務是近年來航天高技術領域研究的熱點[1-2].要完成對目標航天器在軌服務,空間機器人必須具備自主交會接近的能力.尤其是在遠距離階段,受到相對導航設備作用距離的限制,并且目標航天器多為非合作目標(即空間機器人和目標航天器之間沒有信息交換),空間機器人只能采用視覺測量系統進行相對導航.因此,空間機器人對非合作目標航天器的遠距離制導與控制是研究的一個重點.
在低地球圓軌道,當兩個航天器相對距離遠小于軌道半長軸時,兩者之間的相對制導律通常采用C-W方程;并且基于C-W方程的時間固定燃料最省優化算法已很成熟[3-4].文獻[5-6]給出了基于遺傳算法的最優雙脈沖制導方法.然而,在GEO軌道,空間機器人對目標航天器的遠距離交會接近段一般超過上百千米,傳統單視線相對導航的可觀測度低,導航結果偏差較大[7],受此影響空間機器人對目標航天器的相對制導精度較差.文獻[8-9]給出了一種基于雙視線的相對導航方法,該方法通過兩個空間機器人形成測量基線對目標航天器進行相對導航,提高了相對導航的可觀測度和測量精度.文獻[10]給出了基于C-W方程的近距離交會接近的多脈沖優化遺傳算法,由于遺傳算法各染色體之間相互交換信息,該方法收斂速度較慢.PSO算法從隨機解出發,通過迭代尋找最優解,通過適應度來評價解的品質,沒有遺傳算法的“交叉”和“變異”操作,通過追隨當前搜索到的最優值來尋找全局最優,相比遺傳算法規則更為簡單、實現容易、精度高、收斂快[11-13].針對上述問題,文中首先給出了兩個空間機器人編隊接近非合作目標的相對動力學模型;其次推導了多脈沖C-W制導的狀態轉移方程;然后分別給出了兩個空間機器人帶約束的多脈沖優化問題;接著給出了兩個空間機器人的PSO多脈沖優化算法,并通過數學仿真對該方法的可行性和有效性進行校驗.
1.1 雙星編隊接近模型
雙星編隊接近非合作目標的測量模型如圖1所示,雙星編隊接近系統由操作空間機器人和監視空間機器人組成.編隊接近系統與非合作航天器的軌道共面,操作空間機器人與非合作航天器的軌道高度相同,監視空間機器人的軌道高度略低于非合作航天器.在自主接近的遠距離階段,操作空間機器人、監視空間機器人與非合作目標之間形成三角相對運動關系.LCT為非合作目標在操作空間機器人中的視線方向;LMT為非合作目標在監視空間機器人中的視線方向;θ為兩視線方向的夾角;TCM為操作空間機器人在監視空間機器人中相對運動矢量.

圖1 編隊接近非合作目標模型
1.2 相對動力學方程
在近圓軌道,設有兩個航天器分別為目標航天器和追蹤航天器,當兩個航天器之間的相對距離遠小于軌道半長軸時,兩個航天器之間的相對動力學方程可以用C-W方程來描述[3]:

其中:x,y,z為追蹤航天器在目標航天器坐標系下的相對位置;n為目標航天器的軌道角速率;ax,ay,az為除地球引力加速度外,作用在兩航天器的加速度.
設兩個航天器之間的相對運動狀態為

在沒有外力加速度的作用下,相對運動狀態轉移方程為X(t)=Φ(t)X(0).其中:X(0)為初始狀態;Φ(t)為狀態轉移矩陣;X(t)為t時刻狀態.狀態轉移矩陣中,S表示正弦函數,C表示余弦函數.

為更好的描述相對運動過程中相對位置和速度的變化,將相對運動轉移方程改寫為分別與位置、速度相關的方程:

2.1 雙脈沖C-W制導
雙脈沖C-W制導是在初始相對狀態時刻,對追蹤航天器施加第一個速度脈沖Δv0,追蹤航天器按C-W方程運動,經時間t后,對追蹤航天器施加第二個速度脈沖Δvt,達到兩個航天器期望的相對位置和速度.在這里假定施加速度脈沖的時間很短,可忽略不計.由兩航天器的相對運動狀態方程可以得到相對位置的轉移方程為rt=t)r0+t)v0.該方程說明,給定相對轉移時間t,由于相對初始位置不能發生突變,那么t時刻的相對位置僅與初始時刻的相對速度有關.初始時刻的相對速度可表示為
v0=Φr-v1(t)rt-Φr-v1(t)Φrr(t)r0.也就是給定了t時刻期望的相對位置rt、施加速度脈沖前的相對運動狀態[r0,v-0]T(由相對導航得到),則初始時刻施加的第一個速度脈沖為

同樣,相對運動速度的狀態轉移方程為vt=+.若給定了t時刻期望的相對速度v+t,則在t時刻施加的第二個速度脈沖為

通過兩個速度脈沖Δv0和Δvt,經過C-W制導,追蹤航天器可以達到期望的相對位置和速度.然而,在GEO軌道遠距離接近非合作目標過程中,追蹤航天器和目標航天器之間的相對距離可以達到100~200 km及以上,C-W制導方程將存在較大的誤差,且遠距離相對導航的誤差也較大,僅采用雙脈沖制導的方式,將很難達到期望的制導與控制精度.因此,需采用具有中途修正的多脈沖C-W制導方法.
2.2 多脈沖C-W制導
采用多脈沖制導方式,提高GEO軌道遠距離接近過程中的C-W制導精度.假定多脈沖制導的速度脈沖個數為N≥2,速度脈沖的施加時刻為ti(i=0,1,2,…,N-1),根據雙脈沖制導的相對運動狀態轉移方程可得:

上述方程中,t0=0,t=tN-1,0=[0,0,0]T.將上述每個時間段的相對運動狀態轉移方程順序依次帶入下一個方程,可以得到多脈沖制導的相對運動轉移方程為:

利用狀態轉移矩陣的性質,多脈沖制導狀態轉移方程可以改寫為

至此,推導了多脈沖制導的狀態轉移方程,下面將依據該相對運動狀態方程推導雙星編隊接近多脈沖制導的PSO優化方法.
利用編隊接近系統實現對GEO軌道非合作目標的遠距離自主交會接近.編隊接近系統中,操作空間機器人主要實現對非合作目標的交會接近與服務操作;監視空間機器人主要輔助操作空間機器人實現相對導航以及對非合作目標服務操作的繞飛監視.在遠距離接近非合作目標過程中,操作空間機器人主要進行多脈沖制導,以達到期望的相對位置和速度;而監視空間機器人不僅要進行多脈沖制導,并且在制導過程中要使雙視線的夾角滿足約束要求.因此,為降低優化參數的維數,進行分布優化.操作空間機器人進行帶制導精度約束的多脈沖優化,并將優化結果傳輸給監視空間機器人;監視空間機器人進行帶制導精度約束和雙視線夾角約束的多脈沖優化.
3.1 操作空間機器人多脈沖優化問題
通過相對導航得到操作空間機器人與空間非合作目標的初始相對運動狀態[,給定轉移時間Ct和期望的最終相對運動狀態=[根據多脈沖狀態轉移方程,操作空間機器人固定時間的多脈沖燃料最省優化問題的目標函數為

由于相對導航誤差和控制誤差的影響,操作空間機器人不能真正達到期望的最終相對運動狀態,因此,增加最終狀態位置精度的約束函數:

那么,操作空間機器人的多脈沖制導優化問題轉化為帶約束的非線性最優問題.為簡化優化問題,引入罰函數轉化為不帶約束的非線性優化問題,得到新的優化目標函數為

其中:CMP(Cy)即為罰函數,CM為罰因子.
3.2 監視空間機器人多脈沖優化問題

與操作空間機器人相同,監視空間機器人最終狀態位置精度的約束函數:

其中:Mrf為實際的相對位置,由相對導航得到;MR為可容許的位置誤差.
文獻[8-9]中給出雙星編隊之間的基線影響雙視線導航的可觀測性,該問題可轉化為雙視線之間的夾角問題.為保證接近過程中能夠實現相對導航,兩個空間機器人與空間非合作目標的視線夾角必須大于最小約束條件θ.因此,監視空間機器人增加第二個約束函數:

其中:“·”為矢量點乘;LMT為監視空間機器人到空間非合作目標視線的歸一化方向數;LCT為操作空間機器人到空間非合作目標視線的歸一化方向數;Cy為操作空間機器人的優化結果,通過星間鏈路傳輸給監視空間機器人,與操作空間機器人相同,為簡化優化問題,引入罰函數轉化為不帶約束的非線性優化問題,得到新的優化目標函數為

其中MM和MM為罰因子.12
3.3 粒子群優化算法
與遺傳優化算法類似,粒子群優化算法基于群迭代,通過問題空間中的一組粒子尋找最優解.不同于遺傳算法的是粒子群優化算法不需要進行交叉和變異操作,強調的是粒子之間的協作關系.因而,粒子群算法較遺傳算法更快速收斂且執行簡單.
多脈沖優化問題中的待優化變量為脈沖時刻和三個軸方向的速度增量,若實施N次脈沖,則待優化變量個數為4 N個.假定yi是粒子群中的一個粒子,D=4N是一個粒子中變量維數,np是粒子群中粒子的個數,Nmax是粒子群優化算法的最大迭代次數.那么,粒子群優化算法流程如下:
1)根據待優化變量的范圍,隨機初始化一組粒子群,并給出粒子的隨機變化速率,即

3)計算粒子的局部最優適應度值,以及局部最優適應度的位置,即

4)計算粒子群的全局最優適應度值,以及全局最優適應度的位置,即

其中:ω為速度變化的慣性權重,權重值越大,全局搜索能力越強,權重值越小,局部搜索能力越強;c1和c2是速度的運動軌跡,數值越小,將遠離目標最優值,數值越大,可能產生尋優突變;Rand()是0到1之間的隨機數值函數;Ymax是每個待優化變量的最大值.
6)重復2)到5)的步驟,直到達到最大迭代次數或者全局最優適應度的位置Pg_best滿足精度要求.
上述6個步驟給出了粒子群優化算法,對于操作空間機器人和監視空間機器人,兩個適應度函數的形式有所不同,都由多脈沖狀態轉移方程確定,操作空間機器人的適應度函數為

通過不同條件下的數學仿真,對本文提出的編隊接近非合作目標的PSO多脈沖制導方法的可行性和有效性進行校驗.仿真1:單空間機器人雙脈沖制導;仿真2:兩空間機器人帶約束的編隊接近PSO多脈沖制導.假定空間機器人與非合作目標在同一個軌道平面內,采用HPOP建立航天器的軌道動力學模型,作為相對運動動力學的輸入,以提高模型精度;采用雙視線相對導航,導航的相對位置誤差為δr=1 km,相對速度誤差為δv=0.2 m/s;空間機器人的速度控制誤差為δΔv=0.05Δv;交會接近時間為18 000 s;最終接近位置誤差為R=2 km;文獻[8]在LEO軌道進行仿真,相對距離為70 km,仿真兩視線夾角的最大值為5°.本文為GEO軌道遠距離接近,相對距離約200 km,根據文獻[8]中的結果,初步確定兩空間機器人視線夾角約束為θ>15°.
操作空間機器人與非合作目標的初始相對位置與速度、最終相對位置與速度分別為

兩空間機器人進行編隊接近空間非合目標前,首先完成初始的編隊構型,形成測量基線,即監視空間機器人要保證兩視線夾角滿足導航要求,可轉化為監視空間機器人初始位置的優化問題.那么,監視空間機器人與非合作目標的初始相對速度、最終相對位置與速度分別為

兩空間機器人以及非合作目標航天器的初始軌道要素如表1所示.

表1 航天器軌道參數
4.1 單空間機器人雙脈沖制導
在初始條件下,操作空間機器人采用雙脈沖制導的方法接近非合作目標航天器.利用文中給出的雙脈沖速度增量計算方法得到初始時刻的速度增量和最終時刻的速度增量分別為

在上述速度增量控制下,操作空間機器人的最終位置誤差受相對導航精度和速度控制精度影響.在給出的隨機誤差變化范圍內,采用蒙特卡羅方法對最終位置誤差進行統計.經過500次計算,位置誤差統計結果如圖2所示.采用雙脈沖制導X軸方向的最大位置誤差超過7 km;Z軸方向的最大位置誤差超過10 km.位置誤差已經超出了2 km的容許范圍.得出結論,在遠距離交會接近段采用C-W雙脈沖制導方法難以達到期望的相對位置.因此,需要在接近過程中增加速度脈沖,提高制導的精度.下面對本文提出的編隊接近的PSO多脈沖制導方法進行仿真驗證.

圖2 雙脈沖制導誤差統計
4.2 兩空間機器人編隊接近PSO多脈沖制導
在兩空間機器人遠距離交會接近非合作目標的過程中增加一個速度脈沖以提高相對制導的精度.利用文中給出的方法進行PSO三脈沖優化制導,待優化的變量為:y=(t0,Δv0,t1,Δv1,t2,Δv2).由于t0=0,t2=18 000;同時,速度增量Δv1和Δv2可以通過下面公式計算得到:

由于進行軌道面內的交會接近,假定Y軸方向的速度增量為零.那么,操作空間機器人的待優化變量可以簡化為

式中:ΔCV0∈[0,20]m/s,Cα∈[0,2π]rad,Ct1∈[0,18 000]s.由于監視空間機器人在接近過程中,需要保持兩視線夾角θ>15o.轉化為監視空間機器人的初始相對位置優化問題,待優化變量變為

式中:ΔMV0∈[0,20]m/s,Mα∈[0,2π]rad,Mt1∈[0,18 000]s,Mx0∈[150,200]km,Mz0∈[-60,-40]km.給出操作空間機器人與監視空間機器人的PSO優化算法參數設置如表2所示.

表2 PSO算法參數
根據上述條件,利用本文提出的PSO多脈沖制導算法進行計算,得到操作空間機器人與監視空間機器人的參數優化結果如圖3~4和表3所示.
受導航誤差和控制誤差的影響,單次優化結果是次優的,因此,進行10次優化取平均.操作空間機器人與監視空間機器人的PSO多脈沖制導參數優化結果如表3所示.

圖3 操作空間機器人全局最優適應度值

圖4 監視空間機器人全局最優適應度值

表3 PSO多脈沖制導優化參數結果
利用上述PSO多脈沖制導優化結果進行交會接近仿真,結果如圖5和圖6所示.由圖可看出夾角最小值為17.2°,滿足約束條件要求.由兩空間機器人的運動軌跡顯示最后都到達位置且均滿足誤差允許的范圍.結果表明本文的編隊接近非合作目標的PSO多脈沖制導方法有效.

圖5 兩視線夾角變化曲線

圖6 兩空間機器人運動軌跡
1)在高軌非合作目標遠距離雙視線相對導航的基礎上,提出了雙星編隊接近的多脈沖制導方法,保證雙視線導航正常實施,并實現對非合作目標的交會接近.同時,采用多脈沖制導克服了由于C-W方程近似誤差引起的制導偏差.仿真結果表明本文的多脈沖制導能夠達到位置誤差允許的范圍之內.
2)設計了基于PSO的多脈沖優化方法,在固定時間燃料最優問題中,引入了最終位置誤差約束和操作空間機器人與監視空間機器人的視線夾角約束.采用罰函數,將帶約束的最優問題轉化為不帶約束的非線性優化問題.給出了具體的PSO算法,仿真結果表明編隊接近的PSO多脈沖優化算法有效.
3)本文的PSO算法中,罰函數的罰因子為固定值,下一步工作將研究動態罰因子對算法的影響以及改進方法;同時,將進一步展開雙視線夾角的最優問題方面的研究.
[1]ELLERY A,KREISEL J,SOMMER B.The case for robotic on?orbit servicing of spacecraft:spacecraft reliability is a myth[J].Acta Astronautica,2008,63(5/6):632-648.
[2]梁斌,徐文福,李成,等.地球靜止軌道在軌服務技術研究現狀與發展趨勢[J].宇航學報,2010,31(1):1-13.
[3]FEHSE W.Automated Rendezvous and Docking of Spacecraft[D]. Washington DC:Cambridge Aerospace Series,2003.
[4]GOODMAN J L.History of space shuttle rendezvous and proximity operations[J].Journal of Spacecraft and Rockets,2006,43(5):994-959.
[5]YOUNG H K,DAVID B S.Optimal spacecraft rendezvous using genetic algorithms[J].Journal of Spacecraft and Rockets,2002,39(6):859-865.
[6]王華,唐國金.用遺傳算法求解雙沖量最優交會問題[J].中國空間科學技術,2003,23(11):26-30.
[7]李九人,李海陽,唐國金,等.基于僅測角的自主交會相對導航策略研究[J].中國科學:技術科學,2011,41(9):1197-1204.
[8]王楷,陳統,徐世杰.基于雙視線測量的相對導航方法[J].航空學報,2011,32(6):1084-1091.
[9]CHEN Tong,XU Shi Jie.Double line?of?sight measuring relative navigation for spacecraft autonomous rendezvous[J]. Acta Astronautica,2010,67(3/4):122-134.
[10]李晨光,肖業倫.多脈沖C-W交會的優化方法[J].宇航學報,2006,27(2):172-176.
[11]李寧.粒子群優化算法的理論分析與應用研究[D].武漢:華中科技大學,2006.
[12]張喆,孟慶春,薛任,等.一種非線性約束優化的微粒群新算法[J].哈爾濱工業大學學報,2006,38(10):1716-1718.
[13]BAI Qing Hai.Analysis of particle swarm optimization algorithm[J].Computer and Information Science,2010,3(1):180-184.
(編輯 張 宏)
Formation proximity of GEO non?cooperative target based on PSO multiple impulses guidance law
LIANG Bin1,GAO Xuehai1,2,PAN Le2,QIU Yue2
(1.Department of Control Sciences and Technology,Harbin Institute of Technology,150001 Harbin,China;2.Shenzhen Aerospace Dongfanghong HIT Satellite Ltd.,518054 Shenzhen,Guangdong,China)
To improve the guidance precision of far range autonomous proximity of non?cooperative target under double line?of?sights(LOS)navigation in geostationary orbit(GEO),a formation proximity method is proposed by using particle swarm optimization(PSO)multiple impulses guidance law.More specifically,this method transforms the two impulses C-W guidance law into multiple impulses C-W guidance law with mid?correction.Then,the multiple impulses of fixed?time fuel optimal problem is presented under the constraints,and a PSO algorithm with two fitness functions is introduced to solve the multi?objective optimization problem with constraints of guidance precision and double LOS.Numerical simulations are studied to verify effectiveness and feasibility of the PSO algorithm of multiple impulses guidance under different conditions.
formation proximity;multiple impulses;PSO;non?cooperative target;space robot
V423.4
A
0367-6234(2015)10-0007-06
10.11918/j.issn.0367?6234.2015.10.002
2014-06-15.
國家自然科學基金(61175098).
梁 斌(1969—),男,教授,博士生導師.
高學海,xuehaigao@163.com.