林 云, 粘松雷
(海軍航空工程學院指揮系,山東煙臺264001)
編隊協同任務分配問題是航空兵協同作戰的重要研究內容之一,其目的是在滿足各項技戰術指標的前提下,將不同位置、價值和威脅程度的目標合理地分配給不同的任務兵力,并對兵力進行編組和設計粗略航跡,使得編隊的整體作戰效益最大,代價最小。協同任務分配是一個約束多而復雜的優化問題,其解空間隨武器和任務總數的增加而呈指數級增加,使其成為一個多參數、多約束的網絡協議問題。合同網算法采用基于投標、競標等市場機制,協調多架航空兵的任務,具有通信量少、魯棒性(robustness)好等優點。其他相關文獻中的分配算法模型或同時,或部分存在以下問題,如:①缺乏考慮任務優先權的影響;②難以有效處理隨機出現的新任務;③局限單機分配單任務問題等。
針對編隊協同任務分配特點,綜合考慮以上存在的部分問題,論文中采用基于合同網協議(Contract Net Protocol)的任務分配算法,提出了編隊協同任務分配算法,考慮了任務優先權的影響,實例證明能夠解決預先任務分配和任務執行過程中隨機出現的新任務的實時分配問題。
以1架擔任指揮的飛機與多架擔任突擊任務的飛機編隊協同任務分配為背景進行研究。在復雜電磁環境下,由航空兵指揮中心或指揮機通過聯合戰術分發系統實現對編隊的指揮控制,由指揮中心完成編隊戰術決策和任務控制,由突擊兵力完成對海攻擊任務,能夠充分實現編隊之間的信息共享、可用資源的統一調度和作戰任務的綜合管理。圖1為航空兵對海作戰典型戰場態勢想定。

圖1 航空兵對海作戰典型戰場態勢想定
按照編隊系統組成和分工,將編隊中各組成實體分別視為兩類agent:管理agent和突擊agent。

圖2 編隊實體示意圖
編隊協同任務系統中,管理agent具有完全的智能性和自治性,是完全自治agent(autonomous agent),而突擊agent由于受指揮機指揮控制,具有部分自治性,是半自治agent(semi-autonomous agent),整個編隊構成多智能體系統(Multi-agent System,MAS),通過各agent之間的交互和協同實現整個系統的任務,實際上是一個有限中央控制下的分布式系統。如果是多編隊協同作戰,則通過各編隊指揮控制飛機之間的交互實現各編隊之間的協同,如圖3所示。
合同網是Smith于1980年在研究分布式問題求解過程中提出來的,是分布式控制中常用的協商策略。合同網模型中的節點可以分為:①管理者:任務的擁有者,負責任務的分配和管理;②投標者:有能力完成任務的節點,就所分配的任務參與競標;③中標者:最后競標的成功者,負責完成任務。

圖3 編隊MAS協同任務分配體系結構
合同網的基本思想是將任務的分配通過節點之間的招投標過程實現,將協商引入到管理者和投標者的雙向選擇過程中。當管理者有任務需要其他結點幫助解決時,它就向其他結點廣播有關該任務信息,即發出任務通告(招標),接到招標的結點則檢查自己對解決該問題的相關能力,然后發出自己的投標值并使自己成為投標者,最后由管理者評估這些投標值并選出最合適的中標者授予任務。在招投標過程中,利用通信機制對每個任務的分配進行協商,避免資源、知識等的沖突,即節點之間通過招標—投標—中標這一市場投標機制進行任務分配,使系統以較低的代價、較高的質量完成分布式任務[1-5],如圖4所示。

圖4 基于合同網協議的任務協商分配過程
設有1架指揮飛機與N架殲擊機(V1,V2,…,VN)組成協同對海攻擊編隊,共有M個目標{T1,T2,…,TM}需要分配。
則有目標分配矩陣XN×M為

其中:i=1,2,…,N;j=1,2,…,M。
目標分配矩陣XN×M的構造需要使編隊整體作戰效能最大,即目標分配收益最大化,代價最小化。以下也將從收益和代價這兩方面構造任務分配總體目標函數。
目標分配收益函數

式中:πj為目標Tj被摧毀的概率函數;Pj為目標攻擊優先權值,Pij為Vi攻擊Tj的效率,在此可理解為Vi能夠摧毀Tj的概率。

在式(2)中,將任務攻擊優先權納入目標分配收益函數中,用以表明相關聯任務的緊迫程度。優先級的評估方法主要有兩種:①自主建立任務的優先級,指由單一的作戰平臺根據戰場態勢信息確定任務的優先級;②協調建立任務的優先級,指兩個或兩個以上的作戰平臺之間的協同作戰考慮,統一排列任務[7-8]。
本文中由指揮飛機統一確定任務優先權,綜合進行目標態勢評估及發布指揮控制飛機的指令,確定目標優先級Pj。首先根據任務緊迫程度的大小關系確定任務的優先序Q,優先序排第一的任務,權值設為1,而優先序為第 k的任務,權值為 1/k,k=1,2,…,M。任務j的優先權值Pj與任務優先序qj的關系為

目標分配代價函數:

式中:i為損耗概率函數;vi為Vi的價值,與其戰斗力、機載設備裝置相關。

式中:Li(Tj)為Vi攻擊Tj的損耗函數;Li(Tj)=f(,為V到目標T的路徑長度代價;為Viji到目標Tj的平均路徑威脅代價;rij為Vi攻擊Tj的風險,可理解為Vi攻擊目標Tj過程中被擊毀的概率。f的形式依照具體算法確定。
E(X)= α·B(X)+β·C(X) (7)
其中,α、β為權重系數。可將式(7)簡化為

則最優分配方案對應的分配矩陣最優解為

在任務分配的過程中,可以為單架殲擊機分配多個目標,也可以將單個目標分配給多架殲擊機,實施協同突擊。但為了實現總體效能最大,各殲擊機的任務量應有所均衡。主要從以下兩式加以約束

式中:Nmax表示完成單一任務的殲擊機最大數量;Mmax表示分配給單架殲擊機的最大任務量。

式中,δ、ε分別為限制閾值。
預先任務分配一般是編隊在作戰任務確定之后,根據所有獲取到的情報信息,考慮各種約束條件,對作戰任務進行分配,并將規劃任務信息裝訂到各參戰殲擊機上。此時,針對初始目標集{T1,T2,…,TM},根據單架殲擊機最大任務量Mmax的限制,構造所有可能的目標攻擊方案,然后各殲擊機分別計算各目標攻擊方案的收益、代價,求得效能最大的方案,按照“貪婪”法則,將此方案作為自己的投標方案。投標時,由指揮飛機隨機生成各殲擊機的投標順序,按照順序各殲擊機先后出示自己的“最優方案”。待一輪投標結束后,指揮飛機根據各殲擊機所出示的方案,構造目標分配XN×M矩陣,根據總體任務分配效能函數,得到此輪投標的效能值。如果時間允許,可進行多輪投標,從中得到相對最優任務分配方案。
(1)成立對應的施工環境衛生管理機構,在工程施工過程中嚴格遵守國家和地方政府下發的有關環境保護的法律、法規和規章,加強對施工燃油、工程材料、設備、廢水、生產生活垃圾、棄渣的控制和治理,遵守有防火及廢棄物處理的規章制度,做好交通環境疏導,充分滿足便民要求,認真接受城市交通管理,隨時接受相關單位的監督檢查。
設由初始目標集構造的目標攻擊方案As={Tj1,Tj2,…,Tjmax}(As為有序集,表示殲擊機按照順序執行任務)。則有
(1)Vi選擇目標攻擊方案As的收益

(2)Vi選擇目標攻擊方案As的代價

其中 ηi∈[0,1],表示 Vi選擇目標攻擊方案 As的損耗;Thri(As)為Vi選擇方案As的威脅代價;Leni(As)為Vi選擇方案As的路徑代價。
(3)Vi為目標攻擊方案As的選擇函數

式中,ξ和ω分別為權重系數。則Vi選擇函數最大分配方案為 A(i)=E-1i[max(Ei)];投標過程中,Vi將此方案作為最終選擇方案進行投標。
編隊在動態作戰環境下執行作戰任務的過程中,會出現許多預先規劃時無法預料的突發任務,為保證任務完成,需要根據對戰場態勢的實時評估,通過實時控制對作戰任務進行調整。如果編隊內探測到新的目標,或者由于某架殲擊機被擊毀,其剩余作戰任務無法按照原計劃完成,因此需要對新出現的任務進行分配。首先由指揮飛機對新目標進行優先級排序得到新目標序列{T1,T2,…,TX},然后按照優先級由高到低的順序就新目標進行競標,設當前競標任務為Tk,則殲擊機Vi執行任務Tk的效能函數,

其中,Bi(Tk)、Ci(Tk)分別為Vi執行任務Tk的收益和代價,殲擊機Vi以執行任務Tk的效能Eik為投標值參與投標,待所有可參與任務的殲擊機均投標完成后,指揮飛機從中選擇效能值最高的殲擊機作為中標者負責執行此任務。這種競標方式具有較小的通訊量和計算量,可以解決在時間緊迫的動態戰場環境中的任務分配[9-15]。
(1)紅方兵力部署在兩個機場A1,A2,兩種類型的飛機P1,P2。如圖5所示。
(2)藍方目標為驅護艦艇編隊。
(3)實施對這三艘艦艇的打擊任務{T1,T2,T3},T1為對目標毀傷效果O1為重創,T2為對目標毀傷效果O2為重創,T3為對目標毀傷效果O3為擊沉。

圖5 初始戰場態勢示意圖
依據CNP進行預先任務分配,在時間允許的條件下進行了多次競標,仿真結果如圖6所示。
可見,隨著競標次數的增多,整體效能不斷增加,

圖6 分配方案整體效能變化曲線
經過競標后,整體效能接近定值。經過預先任務分配后得到的分配結果,如圖7所示。

圖7 預先協同任務分配
如果在任務執行過程中出現新任務要求,可經過實時任務分配算法進行新一輪競標,在激烈的戰場環境中得到了較優解,實現了對態勢變化的快速反應,如圖8所示。

圖8 動態任務分配
協同任務分配是編隊作戰指揮決策的關鍵技術之一,論文針對相關文獻中任務分配方法中存在的問題,基于MAS理論和合同網協議,建立了編隊系統結構和任務分配模型,將任務優先權引入任務分配模型中,建立了預先任務分配和作戰過程中實時任務分配模型,可以實現單架殲擊機執行多個任務和多架殲擊機協同執行同一任務分配模式,最后對模型進行了仿真驗證,結果證明了該方法在編隊協同任務分配過程中的有效性。
[1] David C H.Germinating a new SEAD:The implications of executing the SEAD mission[D].Alabama:School of Advanced Airpower Studies Air University,2001.
[2] Wellman M,Wurman P.Market-aware agents for a multi-agent world[J].Robotics and Autonomous Systems,1998,24(3):115-125.
[3] Schumacher C,Chandler P R,Rasmussen S J.Task allocation for wide area search munitions via network flow optimization[C]∥AIAA Guidance,Navigation,and Control Conference and Exhibit.Montreal:AIAA Press,2001:1-8.
[4] Chandler P R,Pachter M.Hierarchical control for autonomous teams[C]∥ AIAA Guidance,Navigation,and Control Conference and Exhibit.Montreal:AIAA Press,2001:632-642.
[5] Smith R G.The contract net protocol:high level communication and control in distributed problem solver[J].IEEE Trans.on Computers,1980,29(12):1104-1113.
[6] 王向東,魏 蓉,王文杰.基于擴展合同網的多Agent協作研究[J].微電子學與計算機,2008,25(4):108-111.
[7] 郭銳鋒,于 東,劉明烈,等.基于合同網的任務分配方法的研究[J].小型微型計算機系統,1999,20(10):740-743.
[8] 寇英信,王 琳,周中良.多目標攻擊條件下的作戰任務分配模型研究[J].系統仿真學報,2008,20(16):4408-4411.
[9] 席裕庚.預測控制[M].北京:國防工業出版社1993.1-10.
[10] 王杏林,曹曉東.概念建模[M].北京:國防工業出版社,2007:1-24.
[11] 趙 宇.編隊對海戰斗協同評審專家系統研究[D].廣州:海軍兵種指揮學院,2006.
[12] 冷 鋒,鄒振寧,伍 波.反輻射導彈作戰效能分析[J].戰術導彈技術.2005,21(6):5-7.
[13] 彭征明,李云芝,羅小明.反輻射導彈毀傷能力評估研究[J].裝備指揮技術學院學報.2005,16(3):15-18.
[14] 羅 宇,黃風雷,劉 彥.反輻射導彈對某型雷達目標毀傷能力的評估[J].彈箭與制導學報.2005,25(1):139-141.
[15] 孫治國.艦載反艦導彈變加速機動作戰效能分析[D].西安:西北工業大學,2007.