王孟陽, 張棟*, 唐碩, 許斌, 趙軍民
(1.西北工業大學 航天學院, 陜西 西安 710072; 2.陜西省空天飛行器設計重點實驗室, 陜西 西安 710072;3.西北工業大學 自動化學院, 陜西 西安 710072; 4.西安現代控制技術研究所, 陜西 西安 710018)
隨著武器裝備技術的發展以及作戰樣式的改變,作戰逐漸向著網絡化、智能化、集群化的方向發展,基于分布式自組網通信架構的無人機(UAV)集群作戰技術是目前國內外學界研究熱點[1-2]。UAV集群整合了無人技術優勢和群體自組織特性,在原有基礎上通過能力互補和協同行動實現無人作戰分布式自主協同,具有自組織性、群體穩定性、高彈性和高效能等優勢[3-4]。由于戰場環境動態變化、作戰需求多樣、作戰任務復雜、集群飛行器異構、網絡通信不穩定等因素,使得集群作戰任務規劃面臨著巨大的挑戰,因此,有必要研究更高效的集群協同方法,以最大限度地提高集群作戰效能。
任務規劃是UAV集群作戰的關鍵技術,其研究重點是UAV集群、目標群和任務群之間的優化配置,實現集群任務分解、任務分配及航跡設計,是對集群有限資源的合理配置、分析和利用,進而實現多機高效協同地執行任務[5]。通常將任務規劃建模看作是一種組合優化問題,在特定的場景要求下對問題進行適當簡化建立多約束模型,而后采用多組合優化問題模型進行求解,包括多旅行商問題模型[6]、車輛路由問題模型[7]、混合整數線性規劃模型[8]、網絡流優化模型[9]等。在任務規劃求解方面,近年來諸如粒子群算法[10]、差分進化算法[11]、狼群算法[12]、遺傳算法[13-14]、蟻群算法[15]和螢火蟲算法[16]等啟發算法因其簡單有效的優勢受到學者們的廣泛青睞。其中蟻群算法自提出以來就被應用于各類復雜組合優化問題求解中,通過對自然界中真實蟻群覓食機制的模擬,建立人工蟻群,將問題解空間搜索中的啟發信息表達到蟻群的信息素釋放、揮發機制中,在搜索過程中引入正反饋機制,提高了算法的魯棒性、靈活性和收斂速度[17]。
分布式架構下集群依靠通信網絡實現態勢一致性,是任務規劃的重要基礎。針對任務規劃過程中集群通信約束及通信故障等問題[18],文獻[19]首次將多智能體系統中的聯盟概念引入到多UAV系統中,建立了組建最優聯盟的數學模型,并采用粒子群算法進行求解,但是該方法需要預先知道任務環境的全部信息,算法存在實時性較低的問題;文獻[20]提出了一種未知環境下的異構多UAV協同搜索打擊中的聯盟組建方法,但沒有考慮到通信距離、通信時延等約束對任務聯盟的影響;文獻[21]研究了任務執行過程通信拓撲變化時,以距離為原則進行聯盟劃分的集群編隊控制方法,但考慮的任務效能指標過少,不能最大化發揮集群優勢;文獻[22]提出了一種改進的合同網協議的目標分配方案解決UAV集群攻擊任務的復雜性而導致分配不均勻的問題;文獻[23]基于合同網算法構建多項式時間聯盟構建方法,進行任務分配滿足UAV聯盟最快到達目標;文獻[24]提出了一種異構多UAV協同任務聯盟組建方法,用于解決存在通信距離、時間延遲等約束條件下的局部任務分配問題,但在任務聯盟組建過程中僅考慮任務資源沒有以航跡效能作為UAV的投標信息,因此獲得的任務效能與真實環境下的任務效能存在較大偏差。
由于戰場環境的復雜多變,基于任務信息已知、環境變化可預測、UAV集群和目標匹配關系固定的離線任務規劃已不能適應作戰要求。面對復雜多變、動態不確定的作戰場景,UAV集群需要在滿足任務約束、執行能力約束、通信距離受限、實時網絡通信結構不定、通信時延等多約束條件下實時調整任務序列和飛行航跡。
為解決以上問題,本文針對異構UAV集群執行偵察-打擊-評估一體任務,提出一種基于動態聯盟組建策略的集群在線任務規劃方法??紤]UAV集群執行任務的能力約束、載荷約束、目標約束、任務約束、執行約束等多約束條件,構建了UAV集群的任務規劃數學模型。針對復雜動態作戰場景,考慮到網絡拓撲結構、通信距離和通信延遲,設計了一種UAV集群動態聯盟組建策略。任務聯盟組建過程中針對任務序列與集群航跡的耦合問題,提出了能夠最大化效能的任務規劃求解算法。
以UAV集群執行偵察-打擊-評估一體任務為場景進行描述,具體描述為:場景區域內存在多架異構UAV,UAV可攜帶偵察、打擊和評估任務載荷。初始狀態下集群僅僅通過己方雷達得知敵方目標的大致位置信息,因此集群需要對區域內的目標進行協同偵察定位獲得精確的目標信息,觸發集群對目標打擊和評估任務。在此過程中會涉及到新的威脅、新的目標或者是新的任務出現,如圖1所示。當出現動態威脅時,要實現出現即避開的任務要求;當出現動態目標時,要實現出現即偵察、偵察即打擊、打擊即評估的任務要求,因此,UAV集群執行任務過程中必須具有空間協同,時間協同和任務協同特性。

圖1 UAV集群協同動態任務示意圖
UAV為了實現上述動態過程,當攜帶探測設備的UAV發現新目標時,考慮到單架UAV不能滿足對目標的任務資源約束,需要確定對該目標的最合理的UAV任務執行序列,使得任務效能最大化又能保持集群的穩定性和連通性,將該UAV序列稱為任務聯盟。由該UAV作為長機并向其通信范圍內的UAV進行通信,通過招標、投標過程組建動態任務聯盟,協調其余UAV進行協同任務規劃,包括協同動態任務分配和動態航跡規劃,為滿足任務執行效能的最大化,聯盟內UAV要求按照一定的時間間隔和進入角約束執行打擊和評估任務。UAV集群在動態戰場環境內不斷發現新目標并觸發集群對目標的動態任務,直至完成對區域內所有目標的偵察、打擊和評估。
集群任務執行過程中需要滿足UAV單體飛行性能、目標狀態,戰場威脅、通信狀態、戰場環境、任務協同以及空間、時間約束等動態約束,因此戰場環境的復雜性與動態性使得追求作戰任務指標的全局最優通常是不現實的。當要求集群對動態戰場環境做出敏捷性響應時,需要在任務指標的最優性和實時性之間找到一個平衡點,戰場態勢的變化要求UAV實時調整其任務計劃,具備動態反饋機制和規劃能力。針對該動態過程,本文的研究重點是建立動態任務規劃多約束模型,結合協同任務執行過程中的特點,給出通信約束下的集群動態察打評一體任務的任務分配和航跡規劃的耦合求解方法。
根據上述的場景問題描述,建立UAV集群任務規劃數學模型,其模型描述為如下五元組:
{E,U,T,M,C}
(1)
式中:E為戰場環境;U為UAV集合,U={Ui|i=1,2,…,nU},nU為UAV數量;T為目標集合,T={Tj|j=1,2,…,nT},nT為目標數量;M為待執行任務集合,M={Mk|k=1,2,…,nM},nM為任務總數;C為UAV執行任務的多約束集合。下面分別對各元素進行建模。
2.1.1 UAV能力模型
UAV安裝有自動駕駛儀,為簡化任務規劃過程,假設UAV集群在執行任務過程中保持勻速定高飛行,集群規劃路徑可以通過高度分層實現相互避碰,集群航跡規劃考慮二維平面內的航跡規劃,UAV運動的數學模型為
(2)
式中:(x,y)為UAV位置;v為UAV速度;φ為UAV飛行航向角,φ∈(-π rad,π rad];Wφ為自動駕駛儀增益;φc為UAV控制指令。
UAV執行任務需滿足燃油約束,任務規劃過程中燃油約束等效為UAV最大飛行航程,表示為
Li≤Li,max
(3)
式中:Li為UAVUi飛行航程;Li,max為Ui最大飛行航程。
2.1.2 UAV載荷模型
UAV單體攜帶的載荷資源有限,UAVUi攜帶的載荷表示為一個三維向量:
(4)

2.1.3 目標模型
為了保證對目標的準確位置定位、打擊及毀傷評估,目標Tj所需的任務載荷資源需求向量表示為
(5)

考慮到目標的資源需求,執行目標Tj對應任務的UAV聯盟Uallocation所需要的總資源表示為
(6)
在任務規劃過程中,效能評價指標采用任務聯盟內UAV集合規劃完成的任務價值、完成任務的總路徑長度及任務時間協同差值三類指標進行衡量。當準確定位出目標Tj時,針對Tj的待執行任務集合Mj組建任務聯盟Uallocation,Mj與Tj所需的任務載荷資源Rj對應,表示為
(7)
式中:nm為目標Tj當前待執行的任務數目,nm=ns+ne;Rj,k為目標Tj執行的第k個任務所需資源,包括打擊和評估資源;fj,k為完成Rj,k對應的預期獎勵價值[24],可表示為
fj,k=Fj,k×e-βj×tj,k
(8)

(9)
在約束條件下的UAV集群任務規劃的優化評價指標之一就是使得J1(Tj)最大化,即集群覆蓋任務獎勵最大化。
設Li為Uallocation內Ui執行完成所有任務的預估航程值,在實際應用和仿真計算指標中,通常將航程效能指標表示為剩余航程最大化,則集群的飛行航程效能指標J2(Tj)計算如下:
(10)
任務規劃目標是使得集群協同到達時間差最小化,為了滿足任務時間協同約束tj,集群協同效能指標J3(Tj)計算如下:
(11)
式中:tk,p為任務規劃過程中Uk預估完成時間。任務聯盟組建的目標是在滿足UAV動態聯盟和各類約束條件下使得效能指標最大化,對目標Tj問題效能函數J(Tj)為
J(Tj)=ω1J1(Tj)+ω2J2(Tj)-ω3J3(Tj)
(12)
式中:ω1、ω2和ω3分別為3項任務指標的權重系數,通過調整權重系數可以獲得不同的任務執行效果。
對于UAV集群協同執行察打評一體動態任務,建立多約束模型。
2.3.1 戰場威脅模型
將戰場環境中存在的威脅模型建立為空間中的圓柱體模型,僅考慮二維平面上的避障問題,因此將威脅表示為
PT=[xT,yT,rT]
(13)
式中:(xT,yT)是威脅平面的圓心;rT是威脅半徑。規劃過程中飛行航路必須在指定的飛行空間內,不能進入威脅空間。
2.3.2 任務時序約束
如果不同的任務Mj和Mk之間存在絕對的先后順序,則稱任務存在時序約束,任務時序為一種偏序關系[25]。如果Mk必須在Mj之前執行,則稱Mk為Mj的前序任務,Mj為Mk的后繼任務,具體表達為
(14)
式中:enforce[{},]表示絕對時序關系。
2.3.3 任務協同約束
任務執行過程中,針對目標Tj的任務集合Rj需要UAV聯盟Uallocation協同完成,用qj∈{0,1}表示Rj的執行變量。當Uallocation被分配執行完成任務集合Rj時,qj=1,否則qj=0。
2.3.4 生成航跡約束
將UAV的航跡約束分為以下3個層面:幾何層面、任務層面和環境層面[26]。
如圖2所示為3架UAV對環境內兩個目標執行偵察、打擊和評估任務。對T1依次由U1執行偵察任務{R},U2和U3執行雙重打擊任務{S},U3執行打擊任務過程中,避開環境中存在的威脅;對目標T2,依次執行打擊任務{S}和評估任務{E}。根據圖2的幾何表示,幾何層面的航跡約束條件清晰可見。設ki(t)為Ui在t時刻的軌跡曲率,ki(t)應滿足:

圖2 航跡約束的幾何表示
ki(t)≤1/rmin
(15)
式中:rmin為Ui的最小轉彎半徑。

(16)


(17)
式中:(xi(t),yi(t))為Ui在t時刻位置;(xj,T,yj,T)為威脅j圓心坐標;rj,T為威脅j圓半徑。
綜上,將異構UAV集群對新目標組建聯盟的任務規劃問題建模為多約束優化問題,其效能函數為式(12),約束條件為式(3)~式(6)和式(14)~式(17)。
由上述問題描述和建模可知,當集群定位出目標時,觸發對目標的任務規劃,由于UAV一直處于機動狀態,通信范圍有限,集群內通信網絡存在拓撲結構實時變化的情況。基于場景模型及約束,設計一種基于動態聯盟組建策略的任務規劃方法,首先根據網絡拓撲結構提出動態聯盟組建方法,然后針對新目標的局部任務規劃采用耦合Dubins航跡的分工機制蟻群算法進行任務規劃求解。該方法能夠有效求解動態網絡拓撲結構、UAV模型、目標模型、多約束模型、通信范圍和通信時延約束下的任務規劃問題。
UAV集群自組網采用UAV間雙向通信的方式,既能支持信息的傳輸與共享,又能使成員得知其在任務中所處的地位[27]。矩陣A=[aij]∈n×n表示UAV之間的通信關系,aij表示Ui和Uj之間是否進行通信,aij=1表示通信連接,aij=0則通信斷開,aij=aji,信息可以在UAV之間雙向傳遞。本文采用的自組網通信對應的結點拓撲關系是時變的,如圖3所示。

圖3 網絡通信拓撲
當集群內某架攜帶偵察載荷的UAV發現目標時,觸發針對此目標的動態任務規劃。實際任務過程中UAV一直處于飛行狀態,考慮到UAV的通信距離rn和通信時延約束Δtd,信息交流只能發生在通信相互連通的UAV之間。對于任意一架Ui,能與其通信連接的其他UAV稱為Ui的鄰域UAV,表示為Ls(Ui),圖4為集群通信結構示意圖。

圖4 UAV集群的通信示意圖
在圖4中共有7架UAV,綠色區域表示U1的通信范圍,虛線表示UAV之間的網絡連接,U1的鄰域UAV為Ls(U1)={U2,U4,U5,U7},U1發現目標T并將其信息發送至Ls(U1)內UAV,由于通信時延的作用,U1及其鄰域之間的通信均經過Δtd后才能相互傳達。
Dubins曲線能夠將兩個曲率有限的點按照一定方向連接起來。由于Dubins曲線長度容易計算,因此本文使用Dubins曲線來生成飛行路徑。
通常有6種Dubins曲線:兩條內切曲線、兩條外切曲線和兩條外切圓。設曲線起點位置和終點位置分別為Ps(xs,ys)和Pf(xf,yf),起點和終端速度分別為vs和vf,航向角分別為φs和φf,起始和終端圓半徑分別為rs和rf,Dubins曲線的解的構造過程可用向量Ls和Lf表示為
Ls(xs,ys,φs,rs)→Lf(xf,yf,φf,rf)
(18)
如果曲線路徑上沒有威脅,使用簡單的Dubins曲線平滑地連接起始點和終端點。當檢測到威脅時,且覆蓋UAV原有飛行路徑,則重新規劃以避開威脅。路徑的重規劃可看作在原有起始點和終端點中間選擇一個安全點P1(x1,y1)或P2(x2,y2),如圖5所示,虛線γ為原始路徑,以曲線長度最短為原則選擇兩個安全點中離原始路徑較近的點P1作為中點,根據中點速度方向與安全圓相切確定中點航向角φ1,安全圓D半徑為rD=κrT,其中rT為威脅半徑,κ為安全系數,κ>1。由此將路徑重新規劃問題看作是Dubins曲線的二段解。第1段是Ls(xs,ys,φs,rs)→L1(x1,y1,φ1,rD),第2段是L1(x1,y1,φ1,rD)→Lf(xf,yf,φf,rf),得到實線γ1是基于Dubins曲線生成的避開環境中威脅的飛行路徑。

圖5 威脅規避路徑示意圖
為實現多機終端時間一致的協同航跡規劃,文獻[28]基于Dubins曲線航跡提出一種空間協同約束下的多機打擊快速航跡規劃方法,通過對曲線半徑參數的優化實現多機航跡同步,以某一UAV參考航跡為基準,對其余UAV的Dubins曲線半徑進行求解,得到滿足終端時間一致性要求的多機航跡。本文采用文獻[28]提出的方法實現多機協同航跡計算。
考慮到UAV的探測距離和通信時延等約束,根據目標狀態及任務要求,機間相對距離和通信半徑的相對關系,UAV攜帶資源載荷的差異,將動態任務聯盟的組建分為4個步驟:招標發布、投標申請、聯盟組建和航跡規劃及執行,對應的狀態轉移規則和通信交流規則如圖6所示。

圖6 狀態及通信轉移規則
招標發布階段,由發現目標的UAV作為聯盟長機向其通信范圍內的UAV發布招標信息;投標申請階段,具有穩定通信和資源能力的UAV向長機發送投標信息;在聯盟組建階段,長機根據收到的投標信息進行任務分配確定聯盟成員,并發送授權結果;航跡規劃及執行階段,聯盟成員根據需求約束進行航跡重規劃執行任務。
3.3.1 招標發布
每架UAV狀態均為飛行狀態,當Ui發現新目標Ts時,Ui完成對目標的準確定位及評估,若Ts不需要執行協同任務,則由Ui對其執行任務;若對Ts需要執行多機協同任務,則Ui自動成為聯盟長機,進入聯盟組建招標發布狀態,向其鄰域內的UAV發布招標信息。聯盟長機發送的招標信息用向量Pi表示:
(19)

為保證招標信息的一致性,招標過程中存在一種情況:同一通信局域網內的不同UAV同時發現多個目標,此時通信網絡內存在多個招標信息。為避免系統沖突和資源浪費,需要對同一通信局域網內的招標信息達成一致,即若Ui發布招標信息的同時接收到來自Uk的招標信息,此刻Ui比較Pi和Pk中任務獎勵信息大小:若Pk中獎勵信息大于Pi,則Ui對Pk進行任務投標并將招標信息Pi儲存待任務執行完畢后再行招標;反之繼續執行對Pi的聯盟組建過程,從而實現集群內信息一致性。
3.3.2 投標申請
UAV之間存在通信范圍rn、通信時延Δtd、聯盟組建計算時間tTA,因此聯盟組建不是瞬時完成的。在此階段集群處于持續飛行狀態,在聯盟組建的過程中集群通信拓撲動態變化,可能會導致部分UAV超出距離無法接收到長機信息的情況。根據招標發布-投標申請-聯盟組建過程中的3次信息交流,計算聯盟組建過程耗時最大值δmax為
δmax=3·Δtd+tTA+δt
(20)

(21)

(22)

(23)
為避免通信資源浪費,Uj在一次投標過程中不再參與另一局域網內UAV的招標過程,直至其自身聯盟組建失敗或任務執行完成。
3.3.3 聯盟組建
聯盟長機收到所有潛在聯盟成員的聯盟投標信息后,綜合所有成員的投標信息組建聯盟,若投標信息滿足任務Ms執行約束,則聯盟組建成功,否則聯盟組建失敗,長機重新進行聯盟組建招標提議。以最優化執行任務為前提,長機在滿足聯盟成員數目的約束下,采用分工機制蟻群算法從聯盟潛在成員集合Upotential中選擇任務預估完成時間較少的UAV組成任務聯盟Uallocation:
(24)
如果聯盟組建成功長機也作為聯盟成員進行任務分配,將任務分配結果Dj作為聯盟結果反饋給聯盟成員Uj。聯盟結果信息包括聯盟成員編號NU,每個聯盟成員執行任務的角度α及預估任務執行時間λj,作為航跡生成的約束進入航跡規劃狀態。聯盟組建結果Dj表示為
Dj={NU,Ts,Mj,s,aj,λj}
(25)
式中:Mj,s為Uj對目標Ts的任務信息;αj為Uj的分配任務執行角度。
3.3.4 航跡規劃及執行
聯盟內的每個成員需要根據自身當前狀態、聯盟組建結果信息Dj、預估任務執行時間λj和目標任務信息Mj,s和αj重新規劃自身航跡執行任務,以此達到集群協同涌現效果。航跡規劃完成后,進入對目標Ts的協同任務執行狀態。當任務執行完成后,相應地減少自身的任務資源,重新進入飛行狀態等待新的任務聯盟組建并執行分配任務。

(26)

(27)


(28)

(29)
(30)
(31)

(32)
式中:ρ∈[0,1)為信息素揮發系數,包括局部信息素揮發系數ρlocal和全局信息素揮發系數ρglobal。
任務聯盟組建完成后,根據式(7)~式(12)計算當前代任務執行效能J,并與全局任務最優執行效能Jbest進行比較,若優于全局最優任務執行效能,則更新聯盟成員全局最優執行計劃Mbest和執行效能Jbest。
基于動態聯盟的異構UAV集群在線任務規劃的算法偽代碼見算法1,具體描述如下:
1)任務聯盟招標-投標。UAV發現目標成為長機,向其鄰域內的其余UAV發布任務招標信息,進行“招標-投標”任務聯盟組建過程(算法1的4~6行);
2)任務分配。初始化蟻群算法并建立人工螞蟻簇(算法1的7~10行),對人工螞蟻簇內的螞蟻分別進行任務分配計算,其中螞蟻任務轉移路徑長度按照Dubins航跡進行約束規劃(算法1的14行)。比較每代任務執行效能J與全局任務最優效能Jbest(算法1的20~24行),迭代結束得到任務最優執行序列和集群航跡。
3)任務聯盟組建及飛行航跡規劃。輸出任務規劃最優方案并由長機釋放任務聯盟組建結果信息(算法1的28~29行),聯盟成員根據任務聯盟組建及任務分配結果進行航跡規劃(算法1的 30行)。
4)集群任務執行。聯盟成員按照最優航跡飛行執行任務,任務執行結束等待下一次任務聯盟組建(算法1的31~32行)。
算法1UAV集群U的在線任務規劃算法

2: Output: 最優任務方案Mbest和任務航跡
3: Begin
4: UAV發現目標并成為長機
5: UAV長機根據式(19)發布招標信息
6: 長機通信范圍內的其余UAV根據式(22)進行任務投標
7: 任務聯盟組建過程
8:c←0
10: 平均分配給每架UAV由m只螞蟻組成的人工螞蟻簇
11: whilec 12: 執行分工機制蟻群算法計算 14: 對各投標UAV進行按式(18)進行Dubins路徑規劃 15: 根據式(26)~式(31)計算AC狀態轉移 16: End 17: AC局部信息素更新 18: AC根據式(32)全局信息素更新 19: AC根據式(7)~式(12)計算評價指標 ←J 20: ifJ>Jbestdo 21:Jbest=J 22:Mbest=M 23: End 24: 迭代更新 25: 每個UAV分配新一代人工螞蟻簇 26:c←c+1 27: End 28: 輸出最佳解決方案Mbest 29: 集群長機根據式(25)發布任務分配結果 30: 聯盟內UAV根據任務協同指標進行Dubins航跡規劃 31: UAV集群協同飛行 32: UAV集群任務結束后等待組建形成新的任務聯盟 33: End 為驗證基于動態聯盟的集群在線任務規劃方法,分別對UAV集群執行察打評一體任務的動態任務規劃和通信約束下的算法性能進行仿真分析。以典型的察打評一體化的任務場景為例來仿真UAV集群動態聯盟組建任務規劃全過程,通過Monte Carlo仿真分析不同聯盟組建算法性能并進行對比,通過Monte Carlo仿真分析不同通信延遲和通信裕度時間對集群任務執行效能的影響,通過虛實結合半實物仿真對本文提出的方法有效性進行驗證。 為了便于仿真效果展示,UAV集群包括32架UAV,分別由11架攜帶察打評一體載荷的UAV、11架攜帶打擊載荷的UAV和10架攜帶偵察評估載荷的UAV構成。任務區域內存在3個目標,待執行察打評一體任務,環境中存在若干威脅。初始時刻UAV集群隨機分布在任務環境中,UAV的位置、最大航程、載荷資源和任務能力如表1所示,UAV初始航向角不同,打擊載荷資源末端打擊距離均為200 m,任務能力表示UAV是否攜帶偵察R、打擊S和評估載荷E。目標初始參數如表 2所示。數據鏈通信參數為:機間通信距離為1 500 m,機間通信延遲為Δtd=0.2 s,聯盟組建計算時間為tTA=0.5 s,通信耗時裕值δt=0.3 s。 表1 初始時刻各UAV的信息 表2 初始時刻各目標的信息 圖7 U1招標狀態 鄰域UAV判斷在聯盟組建過程中能否一直處于U1的通信范圍內,得到聯盟潛在成員Upotential={U3,U4,U5,U6,U7,U8,U9,U11,U13,U14,U16,U17,U19,U20,U22,U24,U27,U30,U31}。聯盟潛在成員向長機進行任務投標,長機評估任務資源和任務效能,構建任務聯盟Uallocation={U1,U5,U6,U7,U8,U9,U11,U16,U17,U20}執行對目標T3的打擊和評估任務,考慮到爆炸煙霧等對評估任務效能的影響,評估任務須在打擊完成10 s后開始執行,且評估任務執行時間為20 s。聯盟內UAV的任務航跡如圖8(a)所示,聯盟內UAV與目標之間距離如圖8(b)所示。從圖中可以看出,其中〈U1,U6,U7,U8,U9,U16,U17,U20〉被分配在不同終端打擊角度的約束下同時打擊目標T1,預計打擊時刻為101.44 s。UAV〈U5,U11〉在時間約束條件下于111.44 s執行對目標T1打擊效果的評估,持續時間為20 s,圖8(b)中空五星為對T1的打擊時刻。 圖8 t=43.92 s時UAV聯盟針對目標T1的任務規劃結果 U27于t=54.23 s完成對目標T3的30 s持續偵察定位,確定目標T3需要4架攜帶打擊載荷的UAV分別從60°方向等時間間隔打擊,時間差為5 s,需要3架UAV評估。U27的潛在任務聯盟成員為Upotential={U2,U3,U10,U13,U18,U19,U21,U22,U23,U26,U29,U30,U31},U27偵察航跡及其招標狀態如圖9(a)所示,綠色范圍表示U27的通信鄰域。 圖9 t=54.23 s時UAV聯盟針對目標T3的任務規劃結果 構建任務聯盟Uallocation={U10,U13,U18,U19,U21,U22,U23,U26,U27,U29}執行對目標T3的打擊和評估任務,此時環境中出現多個動態威脅,聯盟執行任務過程中需對所有的動態威脅和靜態威脅進行規避,任務聯盟的任務航跡、聯盟UAV成員與目標之間距離分別如圖9(a)和圖9(b)所示,虛線威脅表示動態威脅。任務聯盟中6架攜帶打擊載荷的UAV〈U10,U13,U18,U19,U21,U22〉均從60°方向序貫依次打擊目標,滿足打擊目標的5 s時間間隔,打擊時刻分別為〈111.2 s,121.2 s,131.2 s,126.2 s,116.2 s,136.2 s〉。考慮到爆炸煙霧等的影響,評估任務時間約束為打擊任務結束10 s后開始執行,〈U23,U26,U29〉從3個方向開始評估任務,持續時間均為20 s,從圖9(b)可以看出,〈U23,U26,U29〉在滿足時間約束的條件下于166.25 s完成對目標T2的評估任務。UAV聯盟皆在滿足其最大飛行航程的約束下完成對目標T3的察-打-評一體任務。 t=104.17 s時,此時潛在任務聯盟成員為Upotential={U3,U5,U20,U31}無法滿足目標T2的任務需求,無法構建任務聯盟,此時由U32對目標T2進行持續封控監測并發布招標命令,等待任務聯盟組建。t=142.28 s時,U32的潛在聯盟成員為Upotential={U1,U2,U3,U4,U5,U6,U7,U9,U10,U12,U13,U14,U15,U16,U17,U20,U24,U27,U28,U30,U31},U32偵察航跡及其招標狀態如圖10(a)所示,組成任務聯盟Uallocation={U1,U2,U3,U4,U7,U10,U12,U14,U15,U16,U24,U28,U32}執行對目標T2的打擊和評估任務,由〈U2,U7,U10,U14,U15,U16〉執行打擊任務,〈U1,U3,U4,U12,U24,U28〉執行評估任務,評估時長為15 s,聯盟航跡及成員目標之間的距離分別如圖10(b)和圖10(c)所示。從圖10中結果可知,聯盟中的UAV能夠在滿足任務約束條件下到達目標,且為其規劃的路徑滿足曲率連續和范圍約束。 圖10 t=142.28 s時UAV聯盟針對目標T2的任務規劃結果 由于引入通信距離約束和招標-投標任務聯盟組建過程,相對于領域內所有UAV參與規劃,任務規劃過程的計算量得到一定程度的減少。針對3個目標的任務聯盟規劃的仿真耗時分別為0.45 s、0.4 s和0.72 s。圖11顯示了UAV群的任務順序,每架UAV的飛行時間分為聯盟等待時間、必要飛行時間和任務執行時間,根據任務類型,任務執行時間可分為偵察任務、打擊任務和評估任務執行時間。 圖11 UAV集群任務序列 聯盟組建過程中的關鍵步驟為長機對投標信息選擇執行任務的聯盟成員的過程,基于本文的任務場景設計及分布式框架,仿真對比本文聯盟組建方法與不考慮通信約束和聯盟構建的集群全局優化方法、任務多項式時間聯盟[23]構建方法性能。 仿真條件采用4.1節中設定的目標參數及UAV通信約束參數,每個目標需要不同次數的打擊任務和評估任務,設置多組Monte Carlo仿真實驗對比當UAV數量分別為24、32、40、48、56情況下的集群任務規劃性能,初始時刻UAV散布在任務區域內,在未發現目標時執行偵察任務,使用不同聯盟算法的任務分配效能和任務執行平均時間如圖12所示。 圖12 UAV數目變化時聯盟組建算法性能對比 圖12(a)為UAV數目變化時系統效能對比,圖12(b)為聯盟執行任務平均耗時對比,可以看出本文方法系統效能明顯優于多項式時間聯盟構建方法,但任務完成時間略長,這是由于多項式時間聯盟構建方法在構建任務聯盟時,以任務完成耗時最短為唯一指標。因此隨著UAV數目增加,多項式時間聯盟構建方法系統效能有下降趨勢,這是由于多項式聯盟組建方法隨著UAV數目增加,鄰域內UAV數目增加,但該方法不考慮的集群任務的協同效能,導致聯盟代價增大,效能降低。同時由于全局優化方法在任務規劃過程中不考慮集群通信結構約束,問題轉換為當前場景下全部可用UAV節點的任務優化配置,仿真結果顯示系統效能相對于本文方法任務完成時間減少,任務效能提升,但是此類情況下的任務規劃不符合應用過程中的實際在線狀態條件,且隨著優化節點數據的增多,算法優化計算量增大,計算時間增長,因此全局優化方法不適合于動態場景下的在線任務規劃方法,適合于全場景態勢信息明確,全鏈路連通,對目標任務類型及約束想定,任務規劃時間裕度大的任務預規劃情況。綜合比較可得,本文方法在動態任務規劃過程中損失較少任務完成時間的前提下可獲得較優的系統效能。 UAV集群執行任務過程中,任務效能還受集群內機間通信約束的影響,本節通過設置不同的通信距離Rmax和通信延遲裕度δt,考慮到隨著通信距離的增加,機間通信時延Δtd增大,導致聯盟潛在成員投標預估位置和預計任務完成時間ETA不同。采用本文任務規劃方法考慮UAV在不同通信距離Rmax和通信延遲裕度δt時間約束下對集群任務效能的影響。 采用4.1節中仿真的仿真初始參數,UAV、目標以及環境的初始參數保持一致。分別設置UAV的通信距離rn分別為1 000 m、1 500 m、2 000 m、2 500 m 狀態,對應的通信時延Δtd分別為0.2 s、2.0 s和3.5 s和5.5 s,聯盟組建計算時間tTA為 0.5 s,通信延遲裕度δt分別為0.3 s、1.0 s和3.0 s。對聯盟組建過程分析,并采用Monte Carlo仿真實驗方法對比當UAV通信距離變化對動態聯盟任務規劃的效能影響,在相同參數配置下,進行50次仿真時延并對結果取平均值。集群的任務平均效能值隨UAV的通信距離和通信延遲的影響如圖13所示。 圖13 通信約束對任務效能方法的影響 從圖13中可以看出,當UAV的通信時延固定時,隨著機間通信距離的增加,UAV集群執行任務效能持續增大,這是因為隨著通信距離的增大,任務聯盟的潛在聯盟成員增加,聯盟長機會獲得更多的任務投標信息,在此基礎上篩選得出集群最優任務執行序列和任務航跡,這表明更容易獲得效能更優的任務聯盟。然而隨著通信半徑的增加,當通信距離為2 500 m時,任務聯盟總效能降低,這是因為隨著通信距離的增大,通信延遲相應增加,聯盟穩定的潛在成員數目減少,因此任務協同完成時間增加,協同性能降低,系統總效能降低。從圖13中的結果同樣表明隨著機間通信距離的增大,即使通信延遲增加,也能保證任務聯盟的組建和任務的執行。 為了進一步對本文方法進行驗證,在仿真實驗的基礎上,進一步開展了相關的半實物仿真調試。由于飛控硬件數量的限制,采用虛實結合的方法,包括5套半實物仿真子系統和27套虛擬仿真子系統,各系統之間采用自組網數據鏈路實現聯盟組建過程中的數據通信,通信鏈范圍為1 500 m。半實物仿真實驗布置如圖14所示。 圖14 虛實結合半實物仿真實驗布置 32架機集群虛實結合半實物仿真流程如下: 1) 確定半實物UAV集群飛行原點經緯坐標為(105.044 327°,31.522 062°),將UAV集群航跡點結果從相對坐標系下進行坐標轉換為經緯度坐標。 2) 32架機從初始位置出發,按照固定方向飛行,集群飛行軌跡按照6自由度模型模擬,當集群內有UAV發現目標時,通過自組網數據鏈與其鄰域內的其與UAV進行聯盟組建規劃任務。 3) 聯盟組建成功后,聯盟內UAV上集群規劃器進行動態航跡規劃并裝訂,由機載飛控端機按照動態航跡飛行。 4) 將UAV飛行過程中的遙測信息(飛行信息、姿態信息)通過通信數據鏈路返回至動態推演視景仿真系統進行顯示,虛實結合半實物仿真系統示意如圖15所示。 圖15 集群虛實結合半實物仿真系統示意圖 采用4.1節仿真參數,半實物仿真UAV飛行速度為50 m/s和60 m/s,對4.1節仿真結果進行半實物仿真驗證,為清晰展示驗證效果,將4.1節仿真中圍繞U1、U27和U32的3個聯盟組建過程的集群飛行效果在動態推演視景仿真系統中的二維驗證分別如圖16(a)、圖16(b)和圖16(c)所示。 圖16 半實物仿真飛行效果二維展示 從半實物仿真試驗結果可以看出,本文所提出的聯盟組建算法滿足UAV集群飛行過程中動態任務需求,并生成引導UAV到任務終點位置的期望航線。UAV在跟蹤動態航線執行多種任務過程中,能滿足任務時空約束,在期望的時刻以期望的角度完成任務,充分說明了所提出算法的有效性。 本文提出了一種基于動態聯盟策略的UAV集群在線任務規劃方法,針對動態任務規劃過程中的環境、通信拓撲和任務不確定等問題,建立了集群任務規劃數學模型,設計了一種動態聯盟組建策略,提出了耦合Dubins航跡規劃的多子群蟻群任務規劃方法,解決了多約束不確定場景下的UAV集群在線任務規劃問題,并通過虛實結合的半實物仿真系統進行了驗證。得出以下主要結論: 1)以UAV集群執行察打評一體的典型任務場景為例,仿真驗證表明本文方法可以解決多不約束不確定場景的在線任務規劃問題。對比分析得出本文方法優于多項式時間聯盟構建方法的系統效能,稍差于全局優化方法,但全局優化方法不適合于動態場景下的在線任務規劃問題。綜合可得動態任務規劃過程中本文方法可在損失較少任務完成時間的前提下可獲得較優的系統效能。 2)通過仿真分析了在考慮通信距離和通信時間延遲約束的集群任務規劃的效能,結果表明通過增大UAV的通信距離和減少通信時延,能夠一定程度上增加系統任務效能。 3)通過虛實結合的半實物集群仿真驗證了本文提出方法對UAV集群半實物模型具備良好的適應能力,對于后續研究工作進一步對于走向工程化應用具有一定指導意義。4 仿真與分析
4.1 UAV集群察-打-評任務典型場景仿真









4.2 典型任務聯盟方法仿真對比

4.3 通信約束下的場景仿真

4.4 虛實結合的集群半實物仿真



5 結論