劉東興,周 旭
(中國電子科技集團 第54研究所,石家莊 050081)
近年來,在軌服務技術作為一項新興技術受到較多關注,在維護空間在軌目標(如在軌航天器、空間碎片)方面應用頻率較高。在軌服務技術可以分為在軌維護、在軌組裝、在軌救援、在軌加注、在軌監測和輔助變軌等6類。從原理上講,任何種類的在軌服務,都是一個軌道規劃和優化的空間目標交會過程,即服務航天器進行軌道機動和規劃,逼近目標航天器,進而完成在軌服務[1-7]。
常見的路徑規劃問題是指在有障礙物的工作環境中,依據某些優化準則(如能量消耗最少、路程最短、任務時間短等),在運動空間中尋找一條從起始狀態到目標狀態,可以避開障礙物的最優或者接近最優的路徑[8]。目前全局路徑規劃算法有可視法、柵格法、神經網絡算法、序列二次規劃法等方法,這些方法各有優點,但均存在一定的局限性,容易陷入局部最優[9]。遺傳算法是一種通過模擬自然選擇和生物進化過程搜索最優解的方法,在求解較為復雜的組合優化問題時,具有算法魯棒、靈活、不易陷入局部最優等優點[10-11]。雖然遺傳算法使用交叉、變異等算子可以從全局角度出發搜索最優解,但是遺傳算法求解時間與染色體基因等算子數目呈指數增長的關系,這對選擇染色體的編碼形式和遺傳算法的求解效率產生較大程度的限制,同時局部搜索能力較差,易產生“超級個體”,形成早熟現象。
為此本文構建出一種混合遺傳算法[12-14],兼顧全局和局部兩個角度,將遺傳算法的全局搜索能力與模擬退火算法較強的局部搜索能力相結合,進行算法設計,從而使搜索得到的個體更加接近最優解。同時提高遺傳算法的求解效率,避免遺傳算法早熟和模擬退火算法搜索速度慢的問題。
本文搭建了航天器在相對軌道的運動模型,從而得到服務航天器從起始時刻到目標時刻繞飛小衛星的動態運動模型。在此動態環境模型的基礎上對混合遺傳算法進行設計,通過仿真實驗證明了該算法在動態環境中軌道規劃的有效性,并且算法求解效率遠高于標準遺傳算法。
若干個小衛星圍繞目標航天器進行相對運動時,服務航天器穿過小衛星繞飛區域與目標航天器交會,進行在軌服務。為了避免與小衛星發生碰撞或相互影響,服務航天器要與小衛星要保持一定的安全距離。綜上,在考慮路徑安全、任務時間、燃料消耗、總路程等約束條件后,進行軌道路徑規劃,尋找一條服務航天器到目標航天器的最優機動軌道路徑。
為便于研究和描述服務航天器、小衛星、目標航天器的位置,當兩個航天器距離較近時,可以假定其中一個航天器是固定不動的。如圖1所示,建立以目標航天器質心為原點的航天器本體軌道坐標系(相對軌道參考坐標系)[15-16]。

圖1 航天器本體軌道坐標系
在圓形軌道中,相對運動方程就是希爾方程:
(1)
在式(1)中,ω=2π/T是圓形目標軌道的角頻率,mc是服務航天器的質量。
服務航天器的運功會收到加速度γx,y,z=Fx,y,z/mc的影響。方程組(1)是線性微分方程組,可以通過拉普拉斯變換求解。因為服務航天器和目標航天器之間的距離與它們距離地球中心的距離比較小,在這一條件下,W.HClohessy和R.S.Wiltshire從希爾方程中導出了相對運動方程的線性解(W.HClohessy & R.S.Wiltshire 1960)。為了簡化對各種軌道模型的討論,假定推進機具有脈沖特性,即速度變化是階躍的,并且假定在研究的時間間隔內,γx,y,z都是常數,得出的運動方程(C-W方程):
(2)

根據C-W方程可知,若已知的初始狀態及單位質量作用力,就可以通過相對軌道動力學模型,推算出任意時刻航天器(服務航天器、小衛星)在相對軌道中的位置和速度。
服務航天器通過Lambert轉移實現沿各個坐標系軸方向上的軌道改變和轉移。通過求解C-W方程得到:
(3)
綜上,每次施加脈沖的大小可以由式(3)得出[17-19]。
染色體編碼采用簡明、直觀、可行性強的可變長實數形式[20]。假設服務航天器實施軌道機動的時刻分別為(t1,t2,…,tn),實施軌道機動的位置分別為(F1,F2,…,Fn),Fn是一個三維矢量,分別表示服務航天器在參考坐標系三個方向的位置,因此服務航天器每條軌道機動的路徑可編碼為(t1,F1,t2,F2,…,tn-1,Fn-1,tn,Fn)。
隨機產生N個個體(即N條路徑),每個個體記為Pj,j=1,2,…,N。個體長度l,也同樣在約束區間下隨機產生。為避免隨機路徑中的返回部分,對每個個體Pj的坐標值降序排列(F1x>F2x>…>Fnx>F1y>F2y>…>Fny,>F1z>F2z>…>Fnz)
以增加初始種群的可行性。
3.3.1 優化安全性
為了避免服務航天器與伴飛小衛星發生碰撞或相互影響,在任務的任意時刻應避免服務航天器與任一伴飛小衛星的絕對距離小于伴飛小衛星的安全半徑。建立如下約束軌道安全性的適應度函數:
(4)
其中:
Φji為由繞飛小衛星的安全半徑形成的球形安全范圍;lji表示第j條軌道機動路徑中服務航天器從ti時刻到ti+1時刻的相對坐標矢量;若該軌道機動路徑沒有穿過任一伴飛小衛星的安全范圍,ηji的值賦為1,否則賦為0。如此,fit1(Pj)的值越大,該路徑的安全性越高[21-22]。
3.3.2 優化脈沖變軌次數
服務航天器每次進行軌道機動都需要施加脈沖,軌道機動次數越多,施加脈沖越多,進而燃料消耗越多。建立如下約束軌道機動次數的適應度函數:
fit2(Pj)=Nj
(5)
其中:Nj表示第j條路徑中服務航天器的軌道機動次數。如此,fit2(Pj)值越小,服務航天器的能量消耗越少。
3.3.3 優化總路程
在軌服務過程中,服務航天器的軌道總路程越短,一定程度上可以減少任務時間和節省燃料。建立如下約束總路程的適應度函數:
fit3(Pj)=
(6)
其中:(xji,yji,zji)表示第j條路徑ti時刻服務航天器在相對軌道坐標系中的坐標;d((xji,yji,zji),(xji+1,yji+1,zji+1)表示第j條路徑ti時刻至ti+1時刻的機動軌道長度。如此,fit3(Pj)的值越小表明該路徑的總路程越短。
3.3.4 優化任務時間
在軌服務任務要在一定時間內完成。時間越短,特定時間內服務航天器的服務目標數量越多。建立如下約束任務時間的適應度函數:
fit4(Pj)=Tj
(7)
其中:Tj表示服務航天器沿第j條路徑所消耗的時間。如此,fit4(Pj)值越小,任務消耗時間越少。
3.3.5 優化燃料消耗
服務航天器每次機動軌道方向不同,導致各個方向所需的速度變化量不同,這直接影響到燃料的消耗。若軌道路徑比較平滑,則變軌所需燃料越少。建立如下約束燃料消耗的適應度函數:
(8)
其中:Δvji表示第j條路徑第i次施加脈沖時服務航天器的速度變化量。如此,fit5(Pj)值越小,服務航天器第j條路徑燃料消耗越少。
3.3.6 綜合適應度函數
對上述各個優化目標函數運用線性函數進行歸一化處理,形成綜合適應度函數:
(9)
如此,fit(Pj)值越大,個體越優良。
3.4.1 選擇算子
采用輪盤賭(比例選擇)的選擇方式,
其基本思想是:各個個體被選中的概率與其適應度大小成正比。具體步驟如下:
1)計算每個個體適應度值fit(Pj);
2)計算每個個體遺傳到下一代種群的概率ρj;
(10)
3)產生隨機數M,M∈[0,1];
4)若M滿足式(11),則第j個個體被選中;
(11)
3.4.2 交叉算子
由于染色體編碼方式是可變長度編碼,所以采用單點交叉的方式,如圖2所示。具體操作為:
1)根據交叉概率和隨機位置確定交叉的兩個染色體的交叉位置;
2)進行交叉操作;
3)交叉后的染色體坐標降序排列,避免路徑環繞。

圖2 染色體交叉操作示意圖
3.4.3 變異算子
染色體變異采用均勻的變異方式,具體步驟如下:
1)根據變異概率確定變異的染色體;
2)隨機確定進行變異基因的位置;
3)為了避免路徑環繞,在變異基因前后開區間內,按照均勻分布方式隨機生成變異后基因的值,完成變異操作。
3.4.4 退溫函數
退溫函數是模擬退火算法理論中重要一環。研究表明,降溫速度越慢,獲得高質量解的概率就越大,但耗時增加,極大影響了求解效率。因此,設計溫度參數t,根據溫度高低,控制下降速度。在溫度高時快速下降,溫度低時緩慢下降,達到兼顧模擬退火算法的局部搜索能力和求解的質量、效率的目的[23]。
本文算法設計的降溫操作如式(12):
tk+1=λtk
(12)
其中:t為溫度參數,λ為退溫速率0<λ<1。
3.4.5 Metropolis接收準則
假設問題的當前解為si,其中目標函數為g(si);在控制參數為t時,該問題產生了新解sj,其對應的目標函數為g(si)。若g(si)≥g(sj),則接收新解si,并將其替換問題的前解si;否則,按照式(13)對當前解si進行轉換:若P>Random[0,1],則接收新解sj;否則,保持當前解si不變。
(13)
混合遺傳算法的流程如圖3所示。

圖3 混合遺傳算流程圖
算法步驟如下:
1)初始化群體,參數設定:種群規模N、交叉概率Pc、變異概率Pm、溫度控制參數的初始值t0、退溫速率λ、進化代數k;
2)計算適應度函數值,進行個體評價;
3)根據個體評價,進行選擇運算;
4)對染色體進行交叉運算、變異運算、精英選擇運算;
5)進行模擬退火運算,對新個體進行接受運算,以概率P為標準,直至Metropolis抽樣穩定;
6)判斷解是否滿足算法終止條件,若滿足,轉步驟8),否則轉步驟7);
7)令k=k+ 1,進行降溫運算tk+1=λtk,轉步驟2);
8)輸出全局最優解。
仿真場景設置:空間某目標航天器周圍有8顆小衛星在其相對軌道進行繞飛,服務航天器要機動到目標航天器進行在軌服務。以目標航天器為參考,建立相對軌道參考坐標系。8個小衛星在參考坐標系中的運動模型如圖4所示,目標航天器與小衛星的初始軌道參數分別如表1、表2所示。

圖4 小衛星在參考坐標系中的運動模型

表1 目標航天器軌道參數

表2 編隊小衛星相對軌道初始狀態
仿真基本參數設置:以Matlab為程序運行平臺,服務航天器在相對軌道參考坐標系中的狀態起點(單位:m)設為(6 000,10 000,10 000),目標航天器位置為(0,0,0),初始種群規模為200,交叉概率為0.8,變異概率為0.02,精英選擇比例為0.02,溫度控制參數t的初始接收概率為0.12,退溫速率λ=0.92。最大進化次數為1 000代;
仿真結果如圖5~8所示。其中,圖5~7是利用本文混合遺傳算法求解結果圖,用來驗證本文算法的有效性;圖8是在同樣場景算法參數設置下,利用標準遺傳算法求解的求解效率圖,與圖7作比較,用來驗證本文提出的混合遺傳算法在求解效率上要優于標準遺傳算法。
圖5為用混合遺傳算法求解得到的最優機動軌道路徑,整個過程服務航天實施軌道機動6次,脈沖施加時間及大小如表3所示。圖中陰影部分為伴飛小衛星在整個任務過程中形成的球形安全區域。如圖5所示,服務航天器的最優機動軌道路徑與小衛星的球形安全區域沒有任何一處重疊,其驗證了本文算法求解結果符合軌道安全性的約束,且軌道路徑相對平滑,說明服務航天器每次軌道機動幅度較小,脈沖施加較小,滿足節省燃料的需求。

-:最優機動軌道路徑;*:軌道起點;o:軌道終點圖5 利用混合遺傳算法求得的最優路徑

圖6 最優軌道中各小衛星與服務航天器的絕對距離與安全半徑的差隨任務時間的變化

圖7 混合遺傳算法進化代數與適應值變化過程

圖8 標準遺傳算法進化代數與適應值變化過程

表3 服務航天器軌道機動的脈沖施加時間及大小
圖6為在整個任務過程中,最優機動軌道路徑中的服務航天器與各小衛星的絕對距離與其安全半徑的差隨時間的變化。如圖所示,8個沒有負值的距離差值曲線表明,服務航天器的機動軌道路徑完全避開了小衛星的安全區,驗證了圖5的結果。并且從圖6可以看出,在第380 s時服務航天器與目標航天器交會,同樣場景設置下比文獻[22]中的425 s提升了45 s。
圖7為混合遺傳算法在1 000次迭代過程中種群綜合適應度函數值與當前最大適應度值的變化。如圖所示,算法進化到第200代之后,最優解趨于穩定,尋找到最優機動軌道路徑,驗證了本文算法的收斂性與穩定性。
圖8為標準遺傳算法在1 000次迭代過程中種群適應值當前最大適應度值的變化。如圖所示,算法進化到600代之后,最優解才趨于穩定。相同場景參數設定下,混合遺傳算法求解效率比標準遺傳算法提高了約兩倍,求解效率提高顯著。
如表4所示,與參考文獻中所用的標準遺傳算法求解效果相比,本文算法規劃出的最優軌道路徑綜合性能更突出。1)路徑變軌次數少;2)任務時間較短;3)本文算法求解效率上比參考文獻中的標準遺傳算法提高了兩倍。正如表 4 所示,同樣場景參數設置下用標準遺傳算法,迭代到600次,才能出現穩定最優解;用混合遺傳算法,算法進化到200代就出現穩定最優解;4)本文提出的混合遺傳算法,先利用遺傳算法強大的全局搜索能力在全局范圍內尋找最優解,然后利用模擬退火算法在局部再次優化最優解,算法搜索到的最優軌道路徑可靠性更佳。

表4 標準遺傳算法與混合遺傳算法同一場景同樣參數下效果比較
針對在軌服務技術中空間航天器交會的軌道規劃問題,本文以服務有小衛星伴飛的目標航天器為場景,通過把遺傳算法較強的全局搜索能力和模擬退火算法較強的局部搜索能力整合,提出了一種混合遺傳算法,來求解最優機動軌道路徑。在軌道路徑的安全性、可靠性、可行性和任務時間、燃料消耗、總路程等約束條件下建立綜合適應度函數,并且對遺傳算子、精英選擇方法、退溫函數、Metropolis接受準則等方面進行了設計。
算法仿真結果表明,本文提出的混合遺傳算法不僅能搜索優化出一條滿足安全性、可靠性、可行性和任務時間短、燃料消耗少、總路程短等約束條件下的最優機動軌道路徑,并且算法的求解效率遠高于參考文獻中的標準遺傳算法。綜上,本文提出的混合遺傳算法求解效率更高,最優解可靠性、可行性、綜合性等更優,更適合在空間復雜場景模型下進行軌道路徑規劃。