黃 成,王 濤,許家忠
(哈爾濱理工大學自動化學院,哈爾濱 150080)
空間交會與接近任務是指追蹤星抵近飛行至另一個空間目標附近,并完成諸如繞飛、在軌操作、對接等操作的整個過程,根據目標星能否提供導航信息,可以將其分為合作與非合作兩類。相比合作式情形,非合作目標的交會與接近在空間監測與服務、深空探測等領域具有更廣闊的應用前景,但由于缺乏信息溝通,存在更大的挑戰性。為了執行復雜多樣的非合作目標近距離操作任務,航天器路徑規劃成為該研究領域的一項關鍵技術。目前約有1 900顆在軌航天器與15 000枚空間碎片存在于外太空[1],采用有效的航天器路徑規劃技術可以保證在不發生碰撞的情況下找到一條從當前位置到達目標位置的最優路徑,同時滿足消耗燃料最少、飛行時間最短等[2]要求。否則,航天器在飛行過程中可能發生碰撞事件或出現燃料不足等問題,導致操作任務不能正常進行。
目前路徑規劃方法大致分為兩類,一類是以可視圖法、單元分解法[3]、隨機采樣法[4]、人工勢場法等為代表的傳統算法,另一類則是以A*算法[5-6]、遺傳算法[7-8]、粒子群算法[9]、蟻群算法等為代表的啟發式算法。文獻[10]為解決無人駕駛飛機在避障條件下的路徑規劃問題,提出了一種實時避碰算法,該算法所規劃出的路徑能夠避免碰撞,并且能夠保證最小安全距離。文獻[11] 針對傳統人工勢場法存在局部極小值以及目標不可達的問題,提出一種增加逃逸力因數的人工勢場法。文獻[12]基于粒子群優化方法提出了大角度姿態機動時航天器在多種約束下的路徑規劃算法。文獻[13]針對空間在軌操控機器人的路徑規劃問題,提出一種基于拓鄰域搜索的蟻群算法,該算法可以有效地規劃出機器人全局路徑。然而,隨著環境系統復雜性及任務難度的增加,傳統算法難以取得理想的效果,而常規啟發式算法也存在局部最優、收斂速度慢以及效率低等問題。
Yang[14]于2010年基于群體智能提出蝙蝠算法(Bat algorithm, BA),這是一種可以搜索全局最優解的啟發式優化算法,與其他群智能優化算法相比結構相對簡單、全局搜索能力較強、參數較少,因此更適用于解決要求運算速度更快、環境適應性更強、性能更優的路徑規劃問題。文獻[15]提出一種在蝙蝠算法中融入黃金正弦算法解決移動機器人路徑規劃問題的方法,該方法具有較快的收斂能力以及全局搜索能力。文獻[16]針對水下機器人避障的路徑優化問題,通過線性漸變、高斯柯西變異以及界限隨機重置機制等策略來改進蝙蝠算法,該方法使得水下機器人規劃的路徑更短、更平滑。文獻[17]提出了一種基于改進蝙蝠算法的移動機器人路徑規劃方法,該方法平衡了算法的全局尋優與局部探索能力,提高了算法的收斂速度與尋優精度。蝙蝠算法也常用于求解連續型的優化問題,在調度問題[18]、函數優化[19]、故障診斷[20]、圖像識別等方面有著廣泛的應用。然而,標準蝙蝠算法存在易陷入局部極值、后期收斂速度慢等缺點,限制了其在復雜、快速收斂性任務中的實際應用,為了改善上述缺點,拓展其應用領域,需要對標準蝙蝠算法進行優化。
普遍情況下,研究者常采用傳統直線或者圓弧分段插值的方法來解決路徑規劃的優化問題,但這些方法構造出來的移動路徑會產生較多的轉折點,因此能夠導致路徑曲線出現連續性以及平滑性較差的問題。而采用三次樣條插值方法對目標路徑進行優化,可以避免路徑產生較多的轉折點,從而擬合出一條連續且平滑的曲線。因此本文以文獻[17]中的方法為理論基礎,提出一種新的改進蝙蝠算法,進一步提高算法的尋優能力,并結合改進編碼方式的三次樣條插值算法對航天器路徑進行三維規劃。
綜合考慮近程導引段任務特點及其對路徑規劃算法尋優性能的需求,本文將優化后的蝙蝠算法和三次樣條插值方法相結合,提出一種收斂速度更快、路徑更短的航天器路徑規劃方法。主要創新點為:1)引入Circle混沌映射進行種群初始化,有效地解決了初始解聚集等問題;2)位置更新時進行位置限定,同時在全局搜索階段引入自適應隨機動態擾動系數,在局部搜索階段融入柯西分布的逆累積分布函數,實現了算法權重的動態變化,并增加了種群變異機制;3)融合分段隨機的反向學習策略,調節了算法的搜索范圍,進一步擴大了蝙蝠種群的多樣性。
地心慣性坐標系OXYZ、軌道坐標系o1x1y1z1以及目標星本體坐標系o2x2y2z2之間的關系如圖1所示。其中地心作為地心慣性坐標系的原點O,X軸在赤道平面內,并且指向春分點;Z軸沿著地球自轉軸并指向北極;Y軸滿足右手定則。軌道坐標系原點o1為參考星的質心,x1軸沿地心指向參考星質心;y1軸在參考星所在的軌道平面內,與x1軸相垂直,并且指向運動方向;z1軸通過右手定則進行確定。目標星本體坐標系原點o2為目標星的質心,3個正交慣性的目標星主軸分別為x2,y2,z2。

圖1 坐標系定義Fig.1 Coordinate system definition
為了方便計算數據,本文以軌道坐標系作為航天器的相對運動參考坐標系。該坐標系中的參考星可以是真實的航天器,也可以是人為虛構出來的航天器,因此本文以路徑規劃開始時的航天器作為該坐標系的參考星。
① 算法中的聲波頻率更新式為:
fi=fmin+(fmax-fmin)×β
(1)
② 速度更新式為:
(2)
③ 全局位置更新式為:
(3)

④ 局部搜索的位置更新式為:
Xnew=Xold+εAt
(4)
式中:Xnew為蝙蝠個體的新位置;Xold為當前蝙蝠個體的位置;ε∈[-1,1],且為一個隨機數;At是當前蝙蝠種群所有個體的平均響度。
⑤ 聲波響度更新式為:
(5)
⑥ 脈沖發射頻率更新式為:
(6)

在標準蝙蝠算法與文獻[17]提出的PTRBA算法中,初始蝙蝠種群的選取存在隨機且分布相對不均勻的問題,因此容易產生全局搜索能力不強,收斂速度較慢[21]以及陷入局部最優解的問題。為了解決這一問題,提高算法的搜索能力,本文將Circle混沌映射算子引入到蝙蝠算法中。原Circle混沌映射的表達式為
(7)
式中:a=0.2,b=0.5,但這種Circle混沌映射值的分布依然不均勻,在[0.15,0.6]之間的取值較為集中,如圖2(b)所示。因此本文對原Circle混沌映射進行改進,得到帶有改進Circle混沌映射的種群初始化表達式:

圖2 Circle混沌映射值分布圖Fig.2 Circle chaos map value distribution

圖3 CPTDBA算法流程圖Fig.3 Flow chart of CPTDBA algorithm
(8)
式中:Xn代表第n只蝙蝠個體的初始位置,n=1,2,…,Npop-1,Npop為蝙蝠的種群數量。
由圖2對比可知,(a)~(b)圖中原Circle混沌值在[0.15,0.6]之間分布的較為集中,而(c)~(d)圖中改進Circle混沌值分布的相對均勻,因此,引入改進Circle混沌映射對種群進行初始化有利于擴大蝙蝠種群的多樣性,從而提高蝙蝠算法的尋優性能,避免算法過度早熟的問題。
(9)
λ=W+ξ×B(b1,b2)
(10)
式中:t是當前蝙蝠種群的迭代次數;Tmax是蝙蝠種群的最大迭代次數;W為自適應權重策略協調收斂因子,能夠平衡全局尋優和局部探索的能力,提高算法的搜索精度;ξ∈[0.1,0.5]上均勻分布的隨機數;B(b1,b2)表示服從貝塔分布的隨機數,本文中取b1=1,b2=2。加入服從貝塔分布的隨機數后,蝙蝠算法有機會取得較大的權值,能夠使得權重進行動態的變化,從而使蝙蝠算法的收斂速度得到提高。因此在全局位置更新式中引入自適應隨機動態擾動系數,可以提高算法全局尋優的能力。全局位置更新式修改為
(11)
標準蝙蝠算法在局部位置更新時,由于位置更新式(4):Xnew=Xold+εAt中的ε∈[-1,1]為隨機數,因此蝙蝠種群在局部搜索時具有隨機性,不容易尋找到局部最優解。本文采用柯西分布的逆累積分布函數對蝙蝠種群進行變異,利用柯西分布具有“尾巴”長的特點,擴大蝙蝠個體的變異范圍。同時,當蝙蝠種群進行柯西逆累積分布函數變異時,蝙蝠個體將采用螺旋行走的方式進行局部尋優,因此能夠避免蝙蝠種群進行盲目變異,從而提高局部搜索的能力。柯西逆累積分布函數式(12)所示,蝙蝠局部搜索的位置更新式修改為式(13)。
(12)
(13)
式中:Xnew為蝙蝠個體新位置;Xold為當前蝙蝠個體位置;當前蝙蝠種群所有個體的平均響度為At;κ∈[0,1]均勻分布的隨機數,所以tan(π×(κ-1/2))具有正切隨機探索的能力,可以使蝙蝠個體在當前局部最優解附近進行搜索,并且使得算法跳出局部最優,從而避免蝙蝠算法盲目搜索,使局部尋優探索機制更加準確。
如果蝙蝠算法在解空間中陷入了局部最優,那么算法在后期進行尋優時精度就會降低,因此,本文提出一種分段隨機的反向學習策略。文獻[22]中定義了在n維空間中,點P(x1,x2,…,xn)的反向解為:
(14)
式中:xi∈[ai,bi],i=1,2,3,…,n。結合式(14),得到如式(15)、(16)所示的分段隨機反向解:
(15)
(16)

設區間[a,b]內的n+1個點,把區間分為n個形如[(x0,x1),(x2,x3),…,(xn-1,xn)]的小區間,其中x0=a,xn=b。每個小區間內的曲線都是1個三次多項式,而三次樣條插值函數S(x)滿足以下條件:
1)S(x)=yi,i=0,1,2,…,n;
2)在每個小區間[xi,xi+1]內,S(x)=S(xi)都是1個三次方程;
3)S(x),S′(x),S″(x)連續。
三次樣條插值函數在每段小區間內的形式可構造成如下形式:
Si(x)=aix3+bix2+cix+di,i=0,1,2,…,n-1
從Si(x)形式可以看出,每個小區間內有4個未知數(ai,bi,ci,di)。而區間[a,b]內共有n個小區間,所以整個三次樣條插值函數(17)共有4n個待定系數。因此求解這些待定系數,就需要構造4n個方程。
S(x)=ax3+bx2+cx+d
(17)
首先,區間內所有的點xi均滿足插值條件,即式(18),共n+1個方程。除端點外,其余n-1個點均滿足式(19),共2(n-1)個方程,而加上兩個端點分別滿足第1個和第n個三次方程的條件,共2n個方程。其次,n-1個插值點的S(x)是一階可導且連續的,即滿足式(20),共n-1個方程。另外,S(x)也是二階可導且連續的,即滿足式(21),同樣地,共n-1個方程。
S(xi)=yi,i=0,1,2,…,n
(18)
S-(xi)=S+(xi),i=1,2,…,n-1
(19)
S′-(xi)=S′+(xi),i=1,2,…,n-1
(20)
S″-(xi)=S″+(xi),i=1,2,…,n-1
(21)
此時共有4n-2個方程,再補充兩個方程就可以得到S(x),這兩個方程常用以下邊界條件來補充:
1)自然邊界:S″(x0)=S″(xn)=0,即指定端點二階導數等于0;
2)固定邊界:S′(x0)=A,S′(xn)=B,即指定端點一階導數;
3)周期邊界條件:端點處的函數值或導數值滿足周期條件。
通過式(18)~(21)以及上述任意兩個邊界條件就可以求解出式(17)中的待定系數(ai,bi,ci,di),因此便能得到三次樣條插值函數的表達式S(x)。
由于本文求解的是航天器的三維路徑,屬于空間規劃問題,需要進行空間的三次樣條插值。根據投影法中,投影到兩個平面上的兩條曲線可以確定出唯一一條空間曲線的原理,本文采用投影法,將空間問題轉化成平面問題進行解決。即利用投影法,結合求解平面三次樣條插值的方法,計算形如式(22)的空間三次樣條插值函數。
z=S(x,y)=a0+a1x+a2x2+a3x3+
b0+b1y+b2y2+b3y3
(22)
即把空間曲線S(x,y)投影到xoy平面和xoz平面上分別進行平面三次樣條插值。本文根據式(17)構造出xoy平面和xoz平面上的三次樣條插值函數式(23)、(24),并分別求解出對應的平面三次樣條插值函數y與z。
y=a1x3+b1x2+c1x+d1
(23)
z=a2x3+b2x2+c2x+d2
(24)
將式(22)~(24)聯立求解,就能得到空間三次樣條插值函數S(x,y),然后通過結合混合蝙蝠算法就能夠規劃出航天器的三維路徑曲線。
在三次樣條插值中,每個大區間[aj,bj]之間的連接處可稱為路徑節點,而每個小區間[xi,xi+1]之間的連接處則稱為插值點。路徑節點就相當于整條路徑上最大的轉向次數,通常情況下,3~5次轉向就可以避開所有障礙物到達目標位置。粒子的編碼就是路徑節點的坐標位置,可以根據當前的環境進行選擇。本文提出一種基于升序排列的路徑節點進行三次樣條插值編碼設計的方法。
假設通過蝙蝠算法得到j個坐標為(x1,y1,z1),…,(xj,yj,zj)的路徑節點,并且xj,yj,zj均進行對應的升序排列。已知路徑起點與終點的坐標分別為(x0,y0,z0)、(xm,ym,zm),通過三次樣條插值,在區間[x0,x1,…,xj,xm]、[y0,y1,…,yj,ym]以及[z0,z1,…,zj,zm]上分別構造n個插值點,就可以得到n個形如(X1,Y1,Z1),…,(Xn,Yn,Zn)的三維插值點坐標,將起點、插值點、路徑節點以及終點進行連線,便可以得到航天器最優的三維路徑。通過將路徑節點進行升序排列,避免了連線過程中曲線彎曲交織、彎曲程度較大等問題,減少了不必要路徑的產生,從而提高了算法的運行效率。
緊緊圍繞黨的號召和黨建工作加強文化建設。積極貫徹落實黨中央和部黨組總體部署,深入開展黨的群眾路線教育實踐活動,制定出臺了《水利部綜合事業局貫徹中央八項規定實施細則》《水利部綜合事業局工作規則》等多項重要制度。深入基層開展調查研究,設立局長接待日,從數百條群眾建議和意見中,梳理出共計6大方面的59條急需解決的重要事項,并利用局黨委會、局長辦公會、專題辦公會、工作例會以及專項協調會等一系列會議,逐項消化解決突出重點、難點、熱點問題,切實答復廣大職工的關切,密切全局職工干群關系,為全局穩定健康發展提供思想保障和政治保障。
航天器在規劃三維路徑時需要滿足以下條件:
1)能夠躲避障礙物,并且不能產生碰撞;
2)航天器消耗的燃料最少、飛行時間最短,即規劃的三維路徑最短。
本文就上述兩個條件進行適應度函數的構建。適應度函數表達式如下:
F=L(1+ω×η)
(25)
式中:L為將起點、插值點、路徑節點以及終點進行連線的曲線長度,計算式為(26)。ω為避障系數,選取合適的值可以剔除穿越障礙物的路徑,本文通過實驗對比,決定取ω=1 000。η為標志變量,初始值為0,計算結果與障礙物相關。
L=
(26)
式中:(Xi,Yi,Zi)為第i個插值點的坐標。為了方便計算適應度函數,本文將障礙物設置成圓形,個數為N,因此η的計算形式可如下所示:
η=η+Average(θk)
(27)
(28)
(29)
式中:k=1,2,…,N,i=1,2,…,n;dki為當前路徑上第i個插值點與第k個障礙圓心的距離,而dk則表示n個dki組成的集合,(Xrk,Yrk,Zrk)為第k個障礙的圓心坐標;θk為標志變量數值集合;rk為第k個圓形障礙的半徑。當路徑穿過第k個障礙物時,θki>0,反之,θki=0;若整條路經均未穿過第k個圓形障礙,則集合θk內的數θki均為0。η為累加值,當整條路經均未穿過障礙時,η=0,否則,η>0。
步驟 1.初始化種群規模Npop、聲波頻率最大值fmax和最小值fmin、速度Vi、聲波響度Ai、脈沖發射頻率ri以及迭代總次數Tmax。確定路徑起始點(x0,y0,z0)和終止點(xm,ym,zm),設定圓形障礙物個數N、圓心(Xr,Yr,Zr)以及半徑r,并根據當前航天器所處環境中障礙物的個數確定路徑節點個數j以及插值點個數n。
步驟 3.根據蝙蝠所在位置,參考分段隨機反向學習計算式(15)、(16),求出對應的反向解。
步驟 4.將上述求得的xj,yj,zj坐標分別進行升序排列,根據式(22)計算出空間三次樣條插值函數S(x,y),并利用S(x,y)求出n個插值點的坐標(X1,Y1,Z1),…,(Xn,Yn,Zn)。
步驟5.利用式(26)求出路徑長度L,并利用式(27)~(29)計算出標志變量η的值,從而判斷路徑是否穿過圓形障礙。
步驟 6.利用式(25)計算出適應度函數的值以及步驟3中反向解的適應度值。
步驟7.比較當前蝙蝠個體位置與其對應反向解的適應度值大小,若前者大于后者,則用反向解代替當前蝙蝠個體的位置。
步驟 8.利用式(1)、(2)、(11)、(13)進行蝙蝠個體頻率fi、速度Vi以及位置Xi的更新,并對更新后的Xi進行位置限定,將其固定在[Xmin,Xmax]范圍內;并利用式(5)、(6)進行蝙蝠個體響度Ai、脈沖發射頻率ri的更新。
步驟 9.排列適應度值,找出位置最優解。
步驟10.在迭代次數Tmax內循環執行步驟3~8。
步驟11.輸出航天器最短的三維路徑。
為了保證某些參數設置的合理性,保證后續實驗的正常進行,本文通過三種對比試驗,確定了標志變量ω的取值、限定位置[Xmin,Xmax]的范圍以及路徑節點升序排列的可行性。同時,為保證提出的CPTDBA算法在求解航天器三維路徑問題上的有效性和準確性,本文將CPTDBA算法與文獻[17]中提出的具有反向學習和正切隨機探索的蝙蝠算法PTRBA、標準蝙蝠算法BA以及標準粒子群算法PSO,在簡單和復雜兩種環境下進行對比實驗。
為了減少其他因素對本文實驗的干擾,CPT-DBA、PTRBA、BA、PSO 4種算法均在Python 3.9軟件平臺進行仿真運行。本文分別在簡單環境與復雜環境中對航天器三維路徑進行對比實驗,其中部分參數值的設置保持一致,如4種算法的種群數量Npop=150,迭代總次數Tmax=100,3種蝙蝠算法的聲波頻率最大值fmax=5 kHz、最小值fmin=0 kHz,聲波響度Ai=0.5 dB,脈沖發射頻率ri=0.25 kHz,響度衰減系數α=0.3,脈沖發射頻率增強系數γ=1。
為了確定對航天器三維路徑規劃影響較大的參數,即確定標志變量ω的取值、限定位置[Xmin,Xmax]的范圍以及路徑節點升序排列的可行性,提高算法尋優能力,找到符合條件的最短路徑,本文分別對其進行了相應的對比實驗。而為了使對比結果更具有代表性以及說服力,本文將在復雜環境下以CPTDBA算法為例進行實驗,實驗結合路徑曲折程度、種群收斂速度以及運行30次后路徑平均解、最短路徑解、最長路徑解等因素進行綜合分析,從而確定出相關參數的取值。
1)標志變量ω
令ω=10,ω=100,ω=1 000,這3種取值都能規劃出航天器最短路徑,且路徑長度差距不大,但ω=1 000時路徑不存在碰撞,路徑曲折程度最小,收斂速度最快,最優解和陷入局部最優的次數也最小。因此,本文設定ω=1 000。
2)限定位置[Xmin,Xmax]
分[1, 7], [0.5, 7.5], [0.1, 7.9]3種情況進行對比,其中3種位置限定均能規劃出無碰撞的航天器三維路徑,但[0.1, 7.9]迭代速度較快,陷入局部最優的次數較少,最優解分布較為均勻,路徑曲折程度、路徑平均解以及最短路徑解也均優于其他兩種情況。因此,本文設置限定位置的范圍為[0.1,7.9]。
3)路徑節點升序排列的可行性
分為路徑節點排序和路徑節點未排序兩種路徑情況,其中兩種路徑情況都能規劃出符合條件的航天器三維路徑,但路徑節點排序時的路徑曲折程度小,迭代速度快,且路徑平均解、最短路徑解以及最長路徑解都要優于未排序時的結果。因此,本文對插值的路徑節點進行升序排列。
單目標系統分別在簡單環境和復雜環境兩種情況下,對4種算法進行三維路徑規劃的對比實驗,設定路徑起始點為(0, 0, 0),終止點為(8, 8, 8)。在簡單環境下設置空間障礙物個數N=6,路徑節點個數j=3,在復雜環境下設置空間障礙物個數N=11,路徑節點個數j=4,且兩種情況下三次樣條插值點個數n均為100。由上述確定參數的對比實驗可知,標志變量ω=1 000,限定范圍為[0.1, 7.9],且路徑節點進行升序排列。兩種路情況下的對比實驗結果如圖4及表1所示。

表1 兩種路徑情況下4種算法的最優路徑情況對比Table 1 Comparison of optimal path conditions of four algorithms under two path conditions

圖4 兩種路徑情況下4種算法的路徑對比圖Fig.4 Path comparison of four algorithms under two path conditions
由圖4(a)~(b)可知,4種算法在兩種路徑情況下都能夠規劃出航天器最短三維路徑,但CPTDBA算法規劃出的路徑曲線更為光滑,路徑的曲折程度相對較小,特別是在復雜環境下該結果尤為明顯。
從圖4(c)~(d)中可以明顯的看出,在兩種環境下,本文提出的混合蝙蝠算法CPTDBA收斂速度均要優于另外3種算法,并且最優解也均小于另外3種算法,這是因為在全局搜索階段加入的自適應隨機動態擾動系數可以使算法的權重發生動態變化,從而提高算法收斂速度以及尋優能力。在圖4(c)~(d)中也可以看出CPTDBA算法能夠快速逼近最優解,并且陷入局部最優解的時間較短,能夠快速跳出局部最優,這是因為在局部搜索階段引入的柯西分布的逆累積分布函數避免了算法盲目搜索,從而提高了局部搜索能力,使得算法能夠及時跳出局部最優。
在兩種路徑情況下,每種算法獨立運行30次后,CPTDBA算法的最優解分布較為均勻,在簡單和復雜兩種環境下的變動范圍分別為(0, 0.15)與(0, 0.35),而另外3種算法的最優解分布變動范圍較大,最小變動范圍也在(0, 0.5)之間,在復雜環境下該結果更加明顯。這是因為CPTDBA算法利用Circle混沌映射的方法對種群進行了初始化,避免了初始種群分布不均勻的問題,擴大了初始種群的多樣性,使得算法較為穩定,進一步提高了算法的尋優性能。
如表1所示,每種算法獨立運行30次后,兩種路徑情況下CPTDBA算法的路徑平均解分別為14.296 6 m、14.393 1 m,要小于另外3種算法,并且路徑最優(最優解小于其他算法)次數以及路徑最差(最優解大于其他算法)次數均要優于另外3種算法。這是因為采用的隨機分段的反向學習策略進一步擴大了種群的多樣性,提高了尋優精度與收斂速度,并且平衡了全局尋優與局部探索的能力,因此能夠讓算法更加穩定。
多目標系統的三維路徑在規劃時不僅要求航天器不能與空間障礙物發生碰撞,并且航天器與航天器之間也不能發生碰撞。針對上述要求,本文基于虛擬障礙物[23]思想,提出一種以插值點構造虛擬障礙物進行航天器多目標三維路徑規劃的方法,該方法具體流程如下:
步驟1.首先利用上述算法規劃出第1個航天器的三維路徑,然后利用第1條路徑的插值點,從第1個插值點開始,以m個插值點之間的距離為直徑,并以m個插值點間的中心坐標為圓心,人工虛擬出第1個空間圓形障礙,其余n-m個插值點以此類推,可虛擬出M個障礙。
步驟2.此時環境中共有N+M個障礙,在此環境下再規劃出第2個航天器的三維路徑。由于第1個航天器路徑已經人工虛擬成障礙物,所以規劃出的第2條路徑不會發生碰撞。
步驟3.基于上述思想,以此類推,規劃出多目標系統中所有航天器的三維路徑。
多目標系統同樣也是在簡單和復雜兩種環境下對4種算法進行對比實驗,不同的是多目標系統在兩種環境下又根據起止點的異同分為四種情況,因此每種算法都有8種運算環境。同理,算法中標志變量為ω=1 000,限定范圍為[0.1, 7.9],路徑節點進行升序排列。在簡單環境下設置空間障礙物個數N=4,在復雜環境下設置空間障礙物個數N=9,其余參數與單目標系統相同。本文只給出復雜環境情況下的實驗結果圖,簡單環境情況下只給出表格結果。4種算法的實驗結果如下所示:

從圖5中可以看出,4種算法都能夠根據要求規劃出相應的三維路徑,并且多目標之間未發生碰撞,路徑較為光滑,未出現過多曲折,這是因為碰撞參數以及位置限定范圍取值較為合理,并且路徑節點進行了升序排列,降低了路徑發生彎曲折疊的可能性。而本文改進的CPTDBA算法規劃出的路徑在躲避空間障礙物的同時,更靠近不考慮碰撞而直接連接起點和終點的最優直線,路徑更加平滑,路徑整體彎曲程度小于其他3種算法,即使因躲避障礙物而引起的路徑彎曲程度也要比其他算法小。CPTDBA算法規劃出的30次路徑最優解與其他3種算法對比來說變動范圍相對較小,分布也相對均勻,這是因為初始化階段的Circle混沌映射、全局搜索階段的自適應動態擾動系數以及局部探索階段的柯西分布的逆累積分布函數使得算法種群具有多樣性,讓算法能夠快速向最優目標靠近,并且能夠提高算法整體尋優性能以及穩定性。
表2、表3是每種算法在不同路徑情況下獨立運行30次的最優路徑情況,從表中可以看出,本文提出的混合蝙蝠算法除了因隨機參數變動過大導致少數機器人最優解偏大以外,大部分的機器人平均解、總路徑平均解、總路徑解最優(最優解小于其他算法)次數以及總路徑解最差(最優解大于其他算法)次數均要優于另外3種算法,這是因為采用Circle混沌映射初始化種群以及引入隨機分段反向學習方法,提高了種群的多樣性,平衡了算法全局尋優以及局部探索的能力,更有力的證明了本文提出的混合蝙蝠算法與三次樣條插值結合的航天器三維路徑規劃方法的可靠性。

表2 復雜路徑下4種算法的最優路徑情況對比Table 2 Comparison of optimal path conditions of the four algorithms under complex paths

表3 簡單路徑下4種算法的最優路徑情況對比Table 3 Comparison of optimal path conditions of the four algorithms under simple paths
本文將混合蝙蝠算法與三次樣條插值結合研究了非合作交會與接近任務中近程導引段三維路徑最優規劃問題,研究成果及結論總結如下:
1)混合蝙蝠算法能夠增強蝙蝠種群的多樣性,可以使算法更容易跳出局部最優,能夠平衡算法全局尋優與局部探索的能力,并且可以讓算法收斂速度更快,結果更加穩定;三次樣條插值算法能夠讓規劃出來的航天器三維路徑曲線更加光滑。
2)仿真結果表明,所提出的三維路徑規劃方法能夠在同等約束情況下使得航天器飛行路徑更短,從而保證航天器消耗的燃料變少,能夠解決近程導引段航天器三維路徑最優規劃問題,提高了非合作交會與接近任務的安全性和自主性。