基于相對成像時刻編碼遺傳算法的敏捷成像衛星任務規劃

2022-01-18 11:21:54郭延寧李傳江李文博馬廣富

宇航學報 2021年11期

關鍵詞：規劃

韓鵬,郭延寧,李傳江,李文博,馬廣富

(1.哈爾濱工業大學控制科學與工程系,哈爾濱 150001；2.北京控制工程研究所,北京 100190；3.空間智能控制技術重點實驗室,北京 100190)

0 引言

敏捷成像衛星是指具有三軸快速姿態機動能力的對地觀測衛星,近年來,已成為各國競相研發的新一代對地觀測衛星,目前,已投入使用的型號包括美國的WorldView系列,法國的Pleiades星座以及我國發射的“高景”系列衛星等[1-2]。觀測范圍廣、靈活性強的特點使其獲得了比傳統的對地觀測衛星更高的效率。觀測能力的提高也對衛星的管控與任務規劃帶來了挑戰,要想充分發揮敏捷衛星的優勢,必須有高效可靠的任務規劃與調度系統[3-4]。

相比于非敏捷衛星,敏捷衛星增加了俯仰和偏航兩個自由度的姿態機動能力,因此對目標的時間窗口更長,觀測、推掃的方式也更加多樣。傳統成像衛星對目標點的可見時間窗較短,因此其觀測時刻固定,而敏捷衛星對點目標進行凝視觀測時,由于目標可見時間窗口的增加,不同的成像時刻將對應不同的姿態,在觀測序列固定時,成像時刻的變化會導致觀測序列對姿態轉移時間約束的滿足性發生變化,從而導致觀測收益和觀測能耗的變化。并且,對于時間窗口重合的目標點,觀測時刻的變化也會導致觀測序列的變化。觀測序列與成像時刻的互相影響與耦合為任務規劃與調度問題的建模與求解帶來了較大困難。

近年來,國內外許多學者都針對敏捷成像衛星的任務規劃調度問題展開了相關研究。一些用以描述敏捷衛星任務規劃問題的數學模型相繼提出,例如基于“邏輯約束”的背包模型[5],整數規劃模型[6-7],基于復雜網絡理論的規劃模型[8],混合整數規劃模型[9-10],約束滿足模型[11-12]等。以上文獻的規劃模型中大多只考慮了時間窗口增加而帶來的觀測序列多樣性,卻鮮有考慮成像時刻和姿態轉移方式對任務收益及衛星資源變化的影響,只將觀測序列或每個目標點是否被觀測作為決策變量的模型對問題的描述是不夠完整的。另外,衛星在對多點目標進行連續觀測時,需進行快速姿態轉移,不同目標間姿態轉移時間約束是任務規劃問題中必須考慮的一項關鍵約束條件[2]。然而,已有研究一般將衛星姿態轉移時間約束視為勻速運動,姿態轉移要么保守性強,要么可能導致觀測任務無法按照規劃結果完成。因此,趙琳等[13]基于衛星姿態運動模型,以時間最優為指標,利用高斯偽譜法完成對姿態轉移時間約束的檢查,但其在規劃模型建立時主要基于旅行商問題模型,需保證待觀測目標點全部觀測,不能對目標點進行選擇和取舍。針對該問題,文獻[14]基于動態旅行商問題建立了任務規劃模型,但仍未考慮長規劃周期下,衛星對目標點存在多個可見時間窗口的情況。

元啟發式算法是一類多用于復雜優化問題中的智能化算法,近年來也被應用于敏捷衛星任務規劃問題的求解中,如禁忌搜索[15]、差分進化算法[16]、蟻群算法[14]、遺傳算法(Genetic algorithm,GA)[13-14,17-22]等。其中遺傳算法由于流程簡單,收斂速度快等特性,應用最為廣泛。遺傳算法求解時,編碼解碼方式設計以及有針對性的算法改進措施是影響求解結果的關鍵因素[4]。已有文獻中,大多采用符號編碼方法,利用基因型表征衛星對目標點的觀測序列完成對決策變量的編碼過程。該編碼方式具有直觀易懂,迭代搜索效率高的特點,但無法完成對觀測時刻的搜索優化,在解碼時通常通過一定的規則得到目標點的觀測時刻,這可能會使得算法在優化過程中丟失優質解。為此,文獻[14]設計了一種將觀測序列與觀測時刻混合的二維編碼偽譜遺傳算法,能夠同時完成對目標觀測序列與觀測時刻的優化與求解；文獻[19]同樣設計了一種將觀測時間窗和觀測時刻結合的二維雜合編碼。通過二維編碼可以將規劃模型中的觀測時間窗口與觀測時刻兩決策變量同時進行優化,能夠保證完整的搜索空間。但二維實數編碼方式在交叉、變異過程中容易產生不符合取值約束的染色體,需要設計復雜的約束檢查和調整規則,或設計全新的遺傳算子,容易導致求解效率降低。

本文同樣以遺傳算法作為敏捷成像衛星任務規劃問題的基本求解算法,并嘗試針對上述文獻中存在的局限性加以改進。文章的主要貢獻如下：

1)在任務規劃問題構建中,綜合考慮對地凝視成像點目標觀測收益與衛星姿態轉移期間能耗,構建了衛星任務規劃優化目標。特別地,在單次姿態轉移過程進行了能量最優化求解。

2)在任務規劃問題求解中,提出了一種基于相對成像時刻編碼的自適應遺傳算法(Relative imaging time coding based adaptive genetic algorithm,RITC-AGA)。通過一維實數編碼完成對兩個決策變量編碼,既可保證對決策變量有完整搜索空間,也能保證在遺傳算子迭代過程中不產生不符合取值約束的染色體。利用該編碼還可解決長觀測周期下衛星對目標有多個時間窗口情況下的任務規劃問題。同時,設計了參數自適應變化的交叉和變異算子,可提高算法收斂速度,并使其不易陷入局部最優。

1 敏捷成像衛星任務規劃問題

1.1 變量定義

首先對建模過程中用到的參數變量進行定義：

C={c1,c2,...,cn}:待規劃目標點集合,ci表示第i個目標,n表示目標點的數量。

lgt_ci=[Bi,Li,hi]Τ:ci的經緯高坐標。

tsi:ci的開始成像時刻。

di:ci的觀測時長。

wi=Lidi:ci的觀測收益,Li為目標觀測優先級。

si:ci的觀測狀態,若si=1代表ci將被觀測,si=0表示不被觀測。

Q={ci,cj,ck,…}:任務觀測序列。

T={tsi,tsj,tsk,…}:任務觀測序列Q對應的開始成像時刻,

u=[u1,u2,u3]T:衛星三軸輸出力矩。

rs=[rx,ry,rz]T:衛星在地心慣性系的位置矢量。

1.2 任務規劃問題構建

任務規劃問題構建包含三個元素,分別是：指標函數、約束條件和決策變量。下面進行詳述。

1)指標函數

在敏捷衛星執行多目標觀測任務過程中,一方面要提升觀測收益,另一方面也要降低姿態轉移和凝視觀測產生的能耗。不失一般性,這里假設cj是ci的后續觀測目標。因此,構建如下指標函數:

(1)

指標函數由兩部分組成,前一部分表示觀測ci所獲收益,后一部分表示衛星執行觀測任務時的姿態轉移能耗,包括衛星由觀測ci到cj的姿態轉移能耗及衛星跟蹤觀測目標cj的能耗。κ為能耗代價權重。其中,衛星進行不同目標點之間的姿態轉移能耗與各軸輸出的姿控力矩及姿態轉移時長有關。衛星跟蹤觀測目標cj過程中的能耗包括衛星姿態凝視跟蹤能耗和相機凝視成像的能耗兩部分,為簡化問題將其設定為與時間相關線性函數。k為其常系數。

2)決策變量

取所有目標點觀測狀態si及被觀測目標點開始成像時刻tsi為決策變量,其中i=1,2,……,n。

3)約束條件

a)衛星軌道動力學約束:

(2)

式中:μ為一常量?？紤]衛星軌道固定且已知,在執行觀測任務過程中不進行軌道機動。衛星軌道動力學約束通常用于求解衛星在任意時刻的位置。

b)衛星姿態轉移控制力矩約束:

|ui|≤um,i=1,2,3

(3)

其中:um為衛星最大控制力矩。

c)衛星姿態轉移時間約束:

(4)

該約束由衛星當前位置rs、慣性姿態qs、衛星控制力矩u、cj的經緯高坐標lgt_cj、cj開始成像時刻tsj等因素相關,具體求解方法將在下節詳細敘述。

d)相鄰任務開始成像時刻約束:

(5)

衛星姿態從指向目標點ci機動至指向cj對cj進行觀測時,其姿態轉移結束時刻不得晚于預定對sj觀測的開始時刻。

e)目標觀測時間窗口約束:

(6)

衛星對任意目標點的觀測開始時刻必須在其可見時間窗口內。

f)目標觀測次數約束:

ci≠cj, ?ci,cj∈Q,i,j=1,…,n

(7)

上式表示觀測序列中任意兩個目標點不能相同,亦即每個目標點只需被觀測一次。

g)目標觀測時長約束:

di≡const,i=1,…,n

(8)

此處考慮每個目標點的凝視觀測時長固定,有效觀測時長少于預定觀測時長則收益為0。

2 目標間姿態轉移最小能耗估算

2.1 衛星凝視觀測期望姿態確定

考慮衛星在執行觀測任務期間無軌道機動,即衛星位置可由約束條件a)唯一確定,同時地球自轉角速度恒定,目標點在慣性系的位置[xi,yi,zi]T可通過目標的經緯度坐標lgt_ci經過地心固連系和地心慣性系之間轉換得到。因此,由衛星與目標相對位置可得衛星指向目標的期望姿態。

如圖1所示,衛星在t0時刻完成對目標點ci的觀測,考慮載荷軸沿本體軸z軸指向目標點ci,對應慣性姿態四元數為qs=[q0,q1,q2,q3]T,若獲得可行解使得衛星在t1時刻使得本體軸z軸觀測目標點cj,因此衛星需在[t0,t1]時段內完成姿態機動。要判斷是否能在預定時間完成姿態機動,首先需要確定終端姿態。由于沒有觀測視角的限制,因此終端姿態只有本體z軸是固定的,x軸與y軸的指向任意,無法唯一確定衛星姿態。因此,以最小化兩目標間姿態機動角度為目的,本文設計了一種凝視觀測期望姿態確定方法。

圖1 衛星姿態機動示意圖Fig.1 Sketch of satellite attitude maneuver

設t1時刻衛星和目標點cj的位置矢量分別為res和re_cj,則衛星指向目標cj的慣性矢量可表示為:

rs_cj=re_cj-res

(9)

為了將rs_cj變換到t0時刻的衛星本體坐標系下,考慮如下由四元數描述的方向余弦矩陣:

(10)

(11)

進而可得t0時刻rs_cj在本體坐標系下的投影:

(12)

(13)

(14)

進一步,便可得到t1時刻的姿態四元數：

(15)

至此,可建立衛星對目標成像時刻與觀測姿態的唯一關系,若給出一組目標觀測狀態和成像時刻的可行解,便可唯一確定衛星在整個觀測過程中的姿態序列。通過調整和優化兩決策變量可以改變序列之間的機動角度,進一步可以改變觀測收益和目標間姿態機動的能耗。

2.2 能量最優姿態機動

由于在規劃模型的指標函數中包含對姿態轉移過程能量的優化,因此,需要在兩觀測目標間滿足約束條件d)的情況下確定姿態機動能量最優解。

考慮如下衛星姿態運動學與動力學模型:

(16)

其中:ω=[ω1,ω2,ω3]T表示衛星慣性姿態角速度。I=diag(I1,I2,I3)代表三軸轉動慣量。

指標函數：

(17)

狀態與輸出約束：

(18)

式中:q0和qf分別代表衛星在上一目標點觀測結束的期望姿態和下一目標點觀測開始的期望姿態,tf表示衛星姿態從上一目標轉移至下一目標點的轉移時間。由于姿態運動方程具有強非線性,上述問題的求解需借助非線性優化算法?？紤]非線性優化過程復雜,求解耗時較長,且受初值影響較大等問題,不適于求解本文描述的復雜規劃問題的子問題。因此,本文嘗試通過將模型線性化,結合傳統最優控制的極小值原理進行求解。

考慮將衛星簡化為一球體,其繞任意軸旋轉的轉動慣量均為常值,沿各軸的控制力矩也假定一致。實際任務中,為不失保守性,可令Ir=max{I1,I2,I3}。給定衛星初末姿態下的能量最優姿態機動為繞歐拉軸旋轉的過程?；谝陨戏治?可得到簡化后的衛星姿態動力學方程：

(19)

式中:θ,ω,ur分別為沿歐拉軸的角度、角速度和力矩,對應有如下能量最優姿態機動問題。

指標函數：

(20)

狀態與輸出約束：

ω(0)=0,ω(tf)=0

(21)

θ(0)=0,θ(tf)=θr

(22)

|ur|≤umax

(23)

其中:歐拉軸e=[ex,ey,ez]T,并且有|e|=1以及沿歐拉軸的轉角可通過已知的初末姿態四元數唯一確定。沿歐拉軸的最大輸出力矩umax

(24)

由最優控制理論可知,當初末狀態下的角速度均為0時,單次姿態機動對應的tf必須為固定值,否則該能量最優控制問題無解。對于待觀測的相鄰兩目標點ci,cj,假設姿態機動過程完全符合約束條件d),則有0

對于上文描述的最優控制問題,利用極小值原理可以得到能量最優控制

(25)

協態變量

(26)

其中策略1稱為線性控制,策略2和3稱為“飽和-線性-飽和”控制,兩類控制策略中輸出力矩隨時間變化的示意圖如圖2所示。

圖2 能量最優控制下沿歐拉軸控制力矩輸出變化Fig.2 Energy optimal control torque along Euler axis

對于策略1,可得能量最優解為:

(27)

其中:終端時刻tf需滿足:

(28)

以策略2為例,設兩次控制切換時刻分別為th,tf-th,可得能量最優解為:

(29)

其中:

(30)

終端時刻tf需滿足的邊界條件為:

(31)

進一步,當機動角度θr固定,th=tf/2時,有

(32)

此時,控制策略變為“飽和-飽和”控制,中間的線性控制段消失,此時的控制形式為終端時間任意的時間最優控制解,此時能耗為

(33)

根據以上分析,在衛星姿態機動開始時刻姿態與位置已知,目標位置已知,觀測時刻固定的情況下,姿態機動角度θr固定,此時姿態機動g耗時存在下界

(34)

此時,約束條件c)被轉化為不等式約束。

進一步,根據式(5)可知,在滿足約束d)的情況下,允許的時間取值范圍為:

(35)

根據式(34)～(35),給出的可行解若要同時滿足約束條件c)d),則應保證

(36)

其中:θr的求解過程在2.1節中敘述。

3 基于相對成像時刻編碼的自適應遺傳算法

3.1 編碼與解碼規則設計

遺傳算法中,將待求解問題的可行解從其解空間轉換到遺傳算法所能處理的搜索空間的轉換方法稱為編碼。編碼規則的設計對遺傳算法的求解效率有至關重要的作用。解碼過程與編碼過程相對,即將染色體表示的搜索空間通過固定的規則轉換為實際優化問題的決策變量,進而通過決策變量完成遺傳算法中適應度函數的計算,便于整個遺傳算法迭代流程的進行。

本文設計了一種基于相對開始成像時刻的實數編碼方式。將每個目標點相對于其時間窗口的開始成像時刻作為基因,對于目標點個數為n的觀測任務,可利用n個基因構成一個染色體。這樣便保證了遺傳算法在迭代過程中產生的可行解始終滿足約束條件f)。解碼過程基于每個基因點位對應目標點的時間窗口,得到其實際開始成像時刻,若目標點的開始觀測時刻導致其觀測時長不滿足約束條件g),則代表其不進行觀測。這樣通過一維實數編碼方式便可實現對目標觀測狀態和成像時刻兩個決策變量的編碼與優化求解。

目標點擁有多個時間窗口時,需要完成對時間窗口的選擇,這時,對于每個目標點對應的基因點位,設定其取值范圍為所有時間窗持續時間的總和。對于解碼過程,首先將基因點位的取值按順序減去目標時間窗口時長,當得到的結果為負時,此時對應的時間窗口即為目標點的開始成像時刻所在的時間窗口。

基于以上分析,可以得到編碼過程的步驟：

2)對每個基因點位,在取值范圍內生成隨機數作為其初始值,將所有基因點位結合成為一個染色體(個體),此時對某一條染色體的編碼完成。

3)反復執行步驟2),直到染色體數量等于設定的最大染色體數量,完成初始染色體的編碼。

同樣地,也可得到單條染色體解碼的基本步驟：

1)對于目標點ci,對應基因點位取值為tri,令j=1,t=tri;

3)判斷t的取值,若t≥0,則令循環變量j增1,并返回至步驟2)；若t<0,則轉到步驟4)；

5)反復執行步驟1)～4)直到染色體中每個個體都得到絕對成像時刻；

7)依據得到的每個目標點的絕對開始成像時刻的早晚,對目標點進行排序,得到觀測序列,完成解碼。

表1給出了一組目標點可見時間窗口的示例數據,根據示例數據可以得到編碼解碼過程如圖3所示,圖中陰影的基因點位表示對應目標點不被觀測。

表1 目標點時間窗口示例Table 1 Example of time windows of point targets

圖3 編碼與解碼過程示意圖Fig.3 Sketch of encoding and decoding process

相比于已有文獻[13,14,17-21]中的編碼方式,本文所述的編碼方式有如下優勢：

1)編碼方式簡單：不同于文獻[13,19]中采用的二維編碼方式,本文僅通過一維編碼即可同時完成對兩個決策變量從解空間到搜索空間的完整映射,顯著降低了遺傳算子設計時的復雜度。

2)迭代效率高：不易產生無效的可行解。對于時間窗口相鄰且不存在重疊的目標點,其觀測順序必定是確定的。若采用現有的基于觀測序列的符號編碼方式,在進行迭代過程中會出現時間窗口靠后的目標點順序位于時間窗口靠前的目標點,這樣就造成了無效的可行解。對于基于相對成像時刻的編碼方式便不存在這類問題,在遺傳算法執行過程中,其對于觀測序列的迭代優化只存在于相互重合的時間窗口對應的目標點之間,對于不重合的時間窗口,只進行成像時刻的優化。

3)適用于長規劃周期,衛星多軌道圈次,目標多時間窗口的情況。目標點存在多個時間窗口時,首先需要完成對時間窗的選擇,利用本文的編碼方式,通過調整基因點位的取值便能完成時間窗口的選擇。而基于觀測序列的符號編碼方式較難完成對時間窗口的選擇。

3.2 遺傳算子設計

3.2.1選擇算子

選擇算子采用精英保留策略和輪盤賭轉法(Roulette wheel selection,RWS)。

精英保留策略是指保留每一代中染色體適應度函數值最大的,即適應度函數值最高的染色體一定會被選中,遺傳至下一代。

對于其他染色體,則采用輪盤堵轉法確定其是否被選中。首先計算該染色體在整個中群眾被選中的概率和累計概率,表示為：

(37)

(38)

式中:Pi為第i個染色體被選中的概率；Qi為第1個染色體到第i個染色體的累計概率。N為種群中染色體數量。之后產生一個隨機數r∈(0,1),其滿足Qi-1

3.2.2自適應交叉算子

交叉算子采用部分映射交叉法(Partial-mapped crossover,PMC)。具體做法為,對于待交叉的兩個個體,隨機確定兩個基因點位,將兩個點位之間的基因進行調換,即完成交叉操作,如圖4所示。對于種群中相鄰的兩個染色體,以交叉概率Pc進行交叉操作。Pc的大小基于染色體的適應度值在一定范圍內自適應變化,由式(39)確定：

(39)

其中,Pc1和Pc2分別代表交叉概率的上界和下界,在算法迭代開始時設定。為進行交叉的兩個染色體中的較大的適應度值,Favg和Fmax分別代表種群中的平均適應度值和最大適應度值。式(39)表示對于種群中適應度較小的個體,采用較大的交叉概率,從而增加搜索效率,加快尋優進度。

3.2.3自適應變異算子

變異算子中,首先根據變異概率Pm確定染色體是否發生變異,對于發生變異的染色體,隨機選取一個基因點位,然后生成該基因取值范圍內隨機數進行替代即可,如圖5所示。

圖5 變異過程Fig.5 Mutation process

Pm同樣基于染色體的適應度值在一定范圍內自適應變化,由式(40)確定：

(40)

其中:Pm1和Pm2分別代表交叉概率的上界和下界,在算法迭代開始時設定。式(40)表示,對于適應度較高的個體,采取較高的變異概率,防止其陷入局部最優,使得算法在迭代末期仍具有一定的尋優能力,而由于精英保留策略的存在,較高的變異概率不會破壞已有的最優個體。

3.3 適應度函數計算

通常情況下,遺傳算法的優化目標是使適應度函數達到極小值,結合式(1)表征的指標函數,可定義適應度函數如下：

(41)

設通過遺傳算子迭代得到的染色體解碼后得到的可行解對應的觀測序列和觀測時刻集分別為Q′,T′,根據3.1節可知,可行解Q′,T′滿足約束條件(e)(f)(g),但不一定滿足其他約束條件,需基于第2節所述的方法,以約束條件(a)(b)為以滿足的條件,對約束條件(c)(d)進行檢查。對于序列中相鄰的兩目標點ci,cj若兩目標點間的姿態機動時間不滿足約束條件(c)(d),則默認刪除觀測序列Q′中的后序任務,即目標點cj,及其在T′中對應的成像時刻tsj。通過對Q′的遍歷完成約束檢查,最后得到滿足所有約束條件的觀測序列與觀測時刻Q,T進行適應度函數計算。

綜上,可以得到RITC-AGA求解敏捷成像衛星任務規劃問題的基本流程如圖6所示：

圖6 RITC-AGA流程圖Fig.6 Flow chart of RITC-AGA

4 任務規劃典型算例

4.1 單一時間窗口下的任務規劃

本節主要考慮衛星在較短的任務執行時段,對待觀測目標點最多只有一個可見時間窗口下的可行性驗證。仿真采用個人PC完成,CPU型號為Intel Core i5-8300H@2.3 GHz,內存為8 GB。

首先選取中國境內的25個城市作為待觀測目標點,規定每個目標點固定觀測時長為10 s,將目標分成1～3級優先級,劃分結果見表2。衛星軌道為太陽同步軌道,衛星的具體參數由表3給出。仿真過程中RITC-AGA的各項參數見表4。仿真結果如圖7、表5所示。

表5 對我國境內25個城市進行觀測的任務規劃結果(部分)Table 5 Task planning results of 25 cities in China (part)

圖7 RITC-AGA得到的觀測軌跡Fig.7 Observation trajectory obtained by RITC-AGA

表2 各目標點(城市)的優先級Table 2 Priority of each point target(city)

表3 衛星參數Table 3 Satellite parameters

為進一步測試本文算法的性能,繼續設計了目標點數量分別為25、50、75、100,四組不同規模下的仿真實驗,并與基于序列編碼的遺傳算法(SGA)、基于混雜編碼的量子遺傳算法[19](HQGA)、啟發式蟻群算法[12](HACO)進行對比。其中,HQGA在處理姿態機動過程相關約束和姿態機動路徑采用本文第2節敘述的方法,SGA和HACO采用文獻[12]敘述的姿態約束檢查與姿態機動路徑確定方法。四種算法的參數設定由表4給出。仿真時間設定為24 Dec 2018 04∶00∶00——24 Dec 2018 04∶50∶00,目標點均勻分布在衛星在此段時間的星下點軌跡周圍并保證衛星對每個目標都可見,目標點的優先級隨機設定為1～3。衛星參數與上述實驗相同,每組仿真場景運行50次,選取平均指標函數值、平均任務完成數量、單個任務平均能耗、算法平均運行時間作為評估指標。仿真對比結果見表6。

表4 算法參數Table 4 Algorithm parameters

由表6可知,在問題規模相同的情況下,RITC-AGA相比其他三種方法總能得到更高的收益,驗證了本文所設計算法的優越性。進一步,對比三種不同編碼方式的遺傳算法可知,在種群數量和迭代次數相同的情況下,基于相對觀測時刻編碼的遺傳算法在解決衛星任務規劃問題時擁有較好的迭代效率,在完成任務數量和指標函數值上總是優于剩下兩者。特別地,SGA在問題規模增加時,指標函數值并未明顯增加,但任務完成率急劇下降,這是因為基于序列編碼方式在迭代時會產生大量的無效序列,問題規模增加時,無效序列所占比例會大幅增加,降低搜索效率。而RITC-AGA則是直接在時間域上進行搜索,對于時間窗不重疊的目標,其觀測的先后順序固定,此時通過時間域的搜索優化機動能耗；對于時間窗口重合的目標,則是通過對觀測時刻的調整而調整前后的觀測順序,因而極大的增加了搜索效率,能夠得到更加優質的結果。

表6 單時間窗口下的4種算法優化結果對比Table 6 Comparison of optimization results of four algorithms under single time window scenarios

對比單個任務平均能耗可知,RITC-AGA與HQGA結果相近,明顯優于SGA和HACO。這是因為,SGA和HACO中,上層算法僅針對觀測序列進行優化,序列確定后,將觀測時刻固定在每個目標點的最早可達時刻,并采用“最大加速-最大減速”的方式進行姿態機動,而本文則是通過線性化的姿態動力學方程和能量最優理論對姿態機動約束檢查和能耗估計,同時RITC-AGA、HQGA均可對觀測時刻進行進一步優化,因此,會得更低的機動能耗。

對比四種算法運行時間可知,SGA算法在各類場景中運行時間均為最短,但問題規模增加時,其解的質量急劇下降。HACO在問題規模較小時運行時間較短,但問題規模增加時,其運行時長也急劇增加,在星載計算機算力受限的環境下難以應用。RITC-AGA在求解質量和運行時間上達到了互相平衡,能較好地適用于實際工程。

4.2 多時間窗口下的任務規劃

相同規模的目標觀測問題,若規劃時長增加,衛星在規劃時段內對目標通常有多個可見時間窗口,則決策變量的解空間也會有所增加。若算法有較強的尋優能力,得到規劃結果應優于在單時間窗口下的規劃結果。因此,本節將設置與4.1節中相同的任務場景,將任務時間進一步增加,以驗證基于相對成像時刻編碼的遺傳算法在多時間窗口下的適用性。

保持衛星和算法參數不變,將仿真時長設為一天,此時衛星可以對某些目標有多個可見時間窗口。首先以4.1節中觀測我國25個城市的仿真場景為例,進行遺傳算法在衛星對目標有多個時間窗口情況下的仿真效驗,結果如圖8、表7所示。需要注意的是,衛星在仿真時段內會多次經過中國上空,相鄰兩次經過中國上空的時間間隔較大,因此,需要將連續進行的觀測任務按照衛星過境的次數劃分為不同的階段執行,劃分依據為前后兩任務的時間間隔大于衛星運行的軌道周期,本算例中,觀測任務被劃分為3個階段,見表7。

圖8所示為RITC-AGA得到的觀測軌跡,在任務執行時段內,衛星共有三次經過我國上空,目標點的時間窗口數量最多為三個,因此,整個規劃結果被分為三個觀測階段完成。表7給出了部分任務規劃結果,最終任務完成率為100%,指標函數值為422.7648。三個階段中觀測的目標點數量分別為10、7、8,各階段內的觀測任務數量基本均衡。與圖7中衛星對目標只有一個時間窗口的情況相比,任務完成率提高了16%,指標函數收益增加了14%,充分說明了算法在目標具有多時間窗口下的有效性。

表7 目標點有多時間窗口情況下的任務規劃結果(部分)Table 7 Task planning results with multiple time windows for point targets (part)

圖8 目標點有多時間窗口時RITC-AGA得到的觀測軌跡Fig.8 Observation trajectory obtained by RITC-AGA when the point targets have multiple time windows

為衡量在不同問題規模下的算法性能,同樣設計了與4.1節中4類問題規模一致的測試場景,并將仿真時長均設定為1天,其他參數保持不變。由于SGA和HACO不具備在目標有多時間窗口下的優化能力,因此只進行RITC-AGA與HQGA的對比實驗,最后得到的實驗結果見表8。

由表8可知,任務規模相同時,RITC-AGA在指標函數值和任務完成率上均好于HQGA,與在單時間窗口下的仿真結果一致。雖然HQGA具備對目標觀測狀態和觀測時刻兩個變量的求解能力,但由于其采用混雜編碼方式,將兩決策變量進行獨立編碼,獨立迭代優化,并未考慮兩變量之間的相互依存和耦合性,因此在迭代結果的最優性上略差于RITC-AGA。以上對比實驗結果進一步說明了本文設計的基于遺傳算法的求解算法在長規劃周期,多時間窗口下的有效性。

表8 多時間窗口場景下兩算法優化結果對比Table 8 Comparison of optimization results of the two algorithms under multiple time windows scenarios

5 結論

本文針對敏捷成像衛星對多點目標連續觀測的任務規劃問題,將觀測收益和姿態能耗兩個指標作為優化指標,將目標點觀測狀態和成像時刻作為決策變量。將衛星在目標姿態機動的能量最優問題看作一個最優控制問題,并基于線性化的姿態動力學模型完成能量最優求解和姿態機動約束檢查。設計了基于相對成像時刻編碼的自適應遺傳算法完成規劃問題的求解,基于該編碼方式可同時完成對觀測序列和成像時刻兩個決策變量的求解優化,且適用于長時間,多時間窗口的規劃問題。最后分別在單一時間窗口和多時間窗口下的不同規模的仿真對比實驗驗證了算法的優越性和有效性。