張傳昊,李豪杰,于 航,陳志鵬
(1.南京理工大學中法工程師學院,江蘇 南京 210094;2.南京理工大學機械工程學院,江蘇 南京 210094)
網絡化彈藥是無人機與彈藥相結合的產物,巡飛彈便是網絡化彈藥的典型代表[1]。隨著武器裝備的無人化、智能化發展,通過集群彈藥進行分布式探測、協同決策、協同打擊成為了一種新的作戰模式。在我方未提前獲得戰場目標具體打擊信息情況下,巡飛彈在其巡飛階段可以對目標類型、位置等信息進行實時獲取,當發現戰場存在多種目標時,需要哪些節點彈藥對哪個目標進行打擊的問題可通過多節點間控制系統決策來解決,若隨機選擇某一打擊目標則無法發揮集群彈藥協同作戰的優勢。通過多系統間的信息交互做出合理高效的打擊與安全控制決策,不僅可以保證彈群對各目標打擊的合理選擇以及各目標任務的合理分配,而且可以控制巡飛彈巡飛狀態與待發狀態之間的安全轉換。
目前,不論是封控子彈藥還是巡飛彈藥大都選擇分布式網絡拓撲結構進行自組網,而合同網算法是分布式任務分配算法中較為常用的一種,其各角色分布式通信和信息處理的方式讓其具備很強的拓展性和魯棒性。國內外學者基于無人機的作戰方式對合同網算法的改進展開了大量研究[2-4]。文獻[5]通過引入并發機制解決了對無人機實時任務分配問題。文獻[6]通過引入歷史任務效能及無人機自身任務負載優化無人機投標策略,降低了系統通信量。文獻[7]通過任務負載率指標與令牌環網相結合解決了招標者及任務分配不合理的問題。
目前對基于巡飛彈作戰的任務分配問題研究較少。巡飛彈的消耗性決定了其至多執行一次打擊任務,無法通過任務負載率的大小評判各節點是否需要對自身擁有的任務進行招標或者是否具備更好的打擊條件來執行其他任務,進而導致無法確定招標節點以及具備最優打擊條件的投標節點。此外,多個任務并行分配的方式會使得巡飛彈群無法找到執行各目標打擊任務的最優解。
為了適應巡飛彈的集群作戰模式,開展巡飛彈藥任務分配策略研究,本文結合威脅評估方法,引入對目標的打擊效益及降標分配方式,在盡量減少各控制系統間信息交互次數的情況下,實現巡飛彈群對不同威脅度目標的最優打擊節點的選拔,進而對巡飛彈藥各節點進行安全狀態控制。
合同網算法[8]由Davis和Smith于20世紀80年代提出,模擬了人類在商業活動中“招標-競標-中標-簽約”機制,通過多個具備通信和信息處理能力個體之間的協商,追求全體最優解來解決分布式任務分配的算法。
經典合同網任務分配流程如圖1所示。

圖1 經典合同網的分配流程Fig.1 The distribution process of the classic contract net
經典合同網算法可用來實現對目標攻擊時的決策,通過信息交互與處理,進行任務分配,控制彈藥由巡飛轉換為待發狀態以及對目標的打擊。但對于巡飛彈藥協同作戰的模式,還存在以下不足之處:
1) 多種目標同時存在時無法確定任務分配先后順序。巡飛彈藥在協同探測的過程中,會遇到多目標同時出現,不同節點探測到的多個目標信息會通過信息交聯共享到其他節點,如何選擇多個目標中的一個作為本次任務分配是待解決的問題。
2) 所有彈藥節點都參與通信,通信量大,影響攻擊決策的實時性和可靠性。由于沒有對比標準對自我打擊目標效益進行評估,導致各節點彈藥都認為具備對各目標的打擊能力。對于一定數量的巡飛彈藥來說,多對一的通信方式加大了彈藥節點間的通信負擔,易出現信道堵塞、信息丟失等,影響多彈控制系統間信息傳輸的可靠性。
3) 無法實現多彈同步打擊的飽和攻擊。巡飛彈藥協同打擊要求對單個目標選拔出多個較優打擊彈藥,實現對重點目標的飽和打擊。
針對巡飛彈藥進行任務分配的需求,以提高決策效率、減少通信數據量為目標,在任務分配過程有以下規定:
1) 戰場僅有單目標存在時,無需進行威脅評估。多目標時按照各目標威脅度確定目標分配次序。威脅度大的目標優先進行分配,由探測到該目標的節點彈藥擔任招標者。
2) 根據各彈特征,引入打擊效益及其各項指標作為決策參考依據。各目標的探測節點共享目標信息時要附帶自身對該目標打擊效益Es及各指標值作為標準。
Eij>Es時,認為節點i相比于探測節點對目標j有更優的打擊位置及成功率。
Eij 3)多彈選拔,降標分配。打擊效益高于標準效益的節點進行投標,選擇打擊效益值最大的前N個彈藥作為中標者。i 算法總流程為: 1) 初始化目標類型、位置,各節點的各指標信息。 2) 目標信息及打擊效益共享。 3) 僅存在單目標,即目標數量Nm=1時,進行步驟4);多目標存在時,即Nm>1時,各節點各自進行兩次威脅評估確定最終的各目標威脅度排序。 4)Eij>Es的節點參與投標。 5) 若i 6)N個節點收到任務后從巡飛狀態到待發狀態準備對目標進行打擊。 7) 更新未選中節點位置與速度方向,返回步驟4),未被選中各節點保持巡飛狀態,進行下一目標的自我評估和多彈選拔。 圖2為巡飛彈任務分配流程圖。 圖2 巡飛彈任務分配流程圖Fig.2 Flow chart of task assignment of cruising munition 假設在戰場中存在n個目標,且n>1,我方有m枚巡飛彈藥在巡飛狀態,通過威脅評估、各節點打擊效益以及對目標的總體打擊效益模型來確定m枚彈藥對不同n個目標的最優分配結果。 2.2.1多目標威脅評估模型 為了在多種目標存在的情況下確定巡飛彈群打擊任務分配順序,通過層次分析法與熵值法以及TOPSIS排序法分別針對己方彈群與我方陣地來確定各目標的威脅度大小,最后經過線性相加降序排列后進而確定任務分配的順序。 本文選取目標類型、搜索能力、機動能力、打擊能力、相對位置關系5項指標作為目標威脅度評判屬性。采用層次分析法與熵值法分別確定各目標威脅屬性的權重大小。對于層次分析法,需要對目標威脅屬性層各屬性重要程度進行對比確定目標屬性矩陣,通常用模糊評價語言的方式對其進行定性處理,利用G.A.Miller指標標度法將目標靜態威脅指標劃分為9級[9],分別為極大、很大、大、稍大、中等、稍小、小、很小、極小。本文用0~10之間的數值對各級模糊評價進行映射,如表1所示。 表1 模糊評價語言等級及其數值映射Tab.1 Fuzzy evaluation language level and its numerical mapping 再通過目標屬性對比矩陣得到其最大特征值對應的特征向量,歸一化后通過一致性檢驗得到主觀評價的目標各屬性威脅權重值φ。 通過模糊評價法及其數值映射確定各目標分別對各屬性的威脅度,構建目標威脅度矩陣Xij(i=1,2,…,n;j=1,2,3,4,5)。利用熵值法得到各屬性的權重。將層次分析法與熵值法得到的權重分別按式(1)進行線性相加得到組合權重作為各個屬性的最終權重。其中既包含了人為主觀意愿,也考慮了客觀事實。 ω=aφ+bΩ, (1) 式(1)中,a+b=1。 最后采用TOPSIS法求得各目標的相對貼近度,此貼近度即為各目標相對威脅度大小。由于建立威脅度矩陣的對象不同,可以得到兩組各目標威脅評估結果,通過線性相加決定最終的威脅評估結果C。 C=αC1+βC2, (2) 式(2)中,α+β=1。 最終將威脅評估結果C降序排列就是巡飛彈群所需要的任務分配次序D。 2.2.2各節點打擊效益模型 為了各節點自我評估量化以及標準指標的確定。引入打擊效益Eij,打擊效益反映出各節點執行對目標打擊任務的綜合效益,計算公式如下: Eij=Rij-(Hij+Zij+Sij), (3) 式(3)中,Eij為打擊效益,Rij為節點i對目標j的打擊收益,Hij為節點i打擊目標j的航程代價,Zij為節點i打擊目標j的轉向代價,Sij為節點i打擊目標j的損失代價。 設巡飛彈藥i被選拔執行對某目標j的打擊任務,巡飛彈藥彈目交會過程中穩定跟蹤目標且成功起爆概率為Bi,巡飛彈藥輸出毀傷元成功毀傷目標的概率為Fi,打擊收益則可以表示為 Rij=Bi·Fi。 (4) 打擊目標與巡飛彈間的相對位置因素也決定了各彈對目標的打擊代價。巡飛彈任務分配過程中為了減少各節點的通信壓力,默認各節點無法獲得巡飛彈群中所有彈藥與目標間距離的最大值信息。為了方便各項指標的共同計算,以招標節點到目標的距離為標準,對巡飛彈藥在打擊過程中的航程代價標準化處理進行計算,可以表示為 (5) 式(5)中,Dij為各節點與目標的距離,Dtj為探測節點到目標的距離,探測節點自我評估時默認該值為0。可以看出,當節點距目標距離越小,其航程代價越小,進而對打擊效益的增益越大。 轉向代價為節點彈藥當前速度方向與節點與目標連線的夾角。與航程代價相同,以招標節點的角度值為標準,為方便各項共同計算以及各節點對比,轉向代價通過標準化可以表示為 (6) 式(6)中,θij為節點i當前速度方向與節點i與目標j連線的夾角,θtj為探測節點t探測到目標j時速度方向與其和目標j連線的夾角。探測節點自我評估默認該值為0。與航程代價同理,節點打擊目標的轉向角度越小,其角度代價越小,對打擊效益的增益越大。 損失代價可以表示為 Sij=1-(1-Oi)·(1-Ji), (7) 式(7)中,Oi為巡飛彈藥被摧毀的概率,Ji為巡飛彈藥由于打擊過程中脫網或者由于解保環境信號閾值、時序異常引信已進入絕火狀態而無法起爆的概率。 2.2.3對各目標總打擊效益模型 為了代表對多目標的分配結果,設目標分配矩陣為Pij,可以表示為 (8) 式(8)中,i=1,2…,m;j=1,2…,n。 為了找到巡飛彈群對各目標打擊總體打擊效益的最大值,可以表示為 (9) 設定巡飛彈在任務分配過程中位置坐標為 {(x,y)|x={x1,…,xm},y={y1,…,ym}},且每個目標都需要N枚彈藥進行打擊。對于巡飛彈藥進行各目標任務分配,有以下約束: (10) C(Dj)>C(Dj+1),?j=1,2,…,n, (11) (12) (13) 式(10)代表巡飛彈藥進行任務分配時的動態過程,要求各節點的指標參數在隨時變化,各節點對各目標進行自我評估時的位置、速度方向不同。式(11)要求各目標的打擊任務順序由各目標的威脅度來決定,先執行的任務其對應目標威脅度越高。式(12)要求各目標都必須由N枚彈藥進行打擊。式(13)代表巡飛彈的消耗性,要求每個節點彈藥最多只能對一個目標進行打擊。 2.2.4毀傷評估 為了確保對各目標的完全毀傷,毀傷評估可以作為是否需要巡飛彈對某目標再次打擊的有力判據。巡飛彈群可以通過層次分析法與模糊綜合評價法相結合,準確評估打擊后的毀傷效果,有助于彈群的自主決策,實現對目標的精確打擊與完全毀傷。 為了驗證本文針對巡飛彈協同作戰設計的任務分配的可行性,進行仿真驗證。 假設某戰場有5類目標,分別為防空導彈車、火箭炮、單兵、坦克、步戰車,其位置坐標分別為(800,720),(900,660),(760,755),(1 040,660),(720,760)。設定同構巡飛彈數量為20枚,其巡飛位置的橫縱坐標均在0~100范圍內,各節點的速度方向與節點和目標連線夾角在0~90°范圍內隨機設置。 各節點首先對這5類目標進行兩次威脅評估,本文將目標類型、搜索能力、機動能力、打擊能力、相對位置關系5種目標屬性的重要程度確定為{8,6,5,7,6},根據層次分析法得到前文5種屬性的相對權重值分別為{0.250 0,0.187 5,0.156 2,0.218 7,0.187 5}。表2為針對我方彈群與陣地的各目標威脅度。 構建目標威脅度矩陣,通過熵值法求得矩陣{0.182 7,0.110 5,0.100 7,0.556 5,0.049 7}, {0.252 3,0.102 7,0.139 1,0.437 3,0.068 6},與層次分析法求得的權重線性相加得到最終結果為{0.216 3,0.149 0,0.128 5,0.387 6,0.118 6},{0.251 2,0.145 1,0.147 7,0.328 0,0.128 1}。 最后對TOPSIS法得到的兩個目標威脅度排序進行線性相加確定最終的目標威脅評估結果為{0.670 2,0.561 2,0.339 0,0.440 5,0.382 5},各威脅度從大到小依次為防空導彈、火箭炮、坦克、步戰車、單兵。 表2 針對巡飛彈群的各目標威脅度Tab.2 Threats to each target of the cruising munition group 表3 針對己方陣地的各目標威脅度Tab.3 The threat level of each target against one’s own position 算法仿真過程如圖5所示。 圖5 針對威脅度不同的各目標打擊彈組選拔過程Fig.5 The selection process of each target strike group with different threats 圖5(a)為初始化時彈群與目標的位置,圖5(b)首先針對威脅度最高的目標1即防空導彈進行打擊彈組選拔,選拔出3枚巡飛彈藥進行打擊,圖5(c)、(d)、(e)、(f)分別對彈群位置及角度等各項指標進行更新,根據威脅度排序依次對火箭炮、坦克、步戰車、單兵完成多彈選拔。 根據仿真過程中各節點對自身打擊效益的計算,5次任務分配選拔出的打擊節點序號及各節點參數如表4所示。 表4 各目標對應的打擊彈組序號及其投標時位置、角度Tab.4 The serial number of each target corresponding to the munition group and its position and angle when bidding 可以看出各節點按照目標威脅排序,依次進行任務分配,選拔出的3個節點具有較優的打擊位置以及較小的轉向角度。圖6為每次任務所有節點打擊效益排序,可以看出,被選拔出打擊5個目標的各彈組均具有對該目標的最高打擊綜合效益,驗證了巡飛彈對威脅度不同的目標任務分配算法的可行性。 圖6 任務分配過程中各節點打擊效益排序Fig.6 Ranking of each node’s impact on the benefits in the process of task allocation 圖7為本文算法與經典合同網算法對比,對10個威脅度不同的目標進行任務分配,不考慮經典合同網算法無法按照目標威脅程度進行任務分配,默認經典合同網與改進合同網同時對相同目標進行任務分配。通過對比可以發現,由于經典合同網算法沒有確定選拔的打擊效益標準,所有節點均認為可以對該目標進行打擊,而本文算法通過利用打擊效益標準的引入大大減少了每次目標分配的投標節點數量,對每個目標的投標彈數平均減少了79%,有效地排除了打擊效益較低的節點。 圖7 經典合同網與改進合同網各任務投標彈數對比Fig.7 Comparison of the number of bids for each task of the classic contract network and the improved contract network 圖8為本文改進算法與經典合同網算法的投標總次數對比圖,仿真次數設為30,每次仿真對10個威脅度目標進行任務分配。可以看出,在每次完成所有目標分配的各節點投標總次數都遠遠低于經典合同網中的投標次數,平均減少了47.89%,大大減小了控制系統間的通信壓力,保證各節點信息傳輸的可靠性,提高了對多目標任務分配的效率,達到了預期的效果。 圖8 經典合同網與改進合同網總投標次數對比Fig.8 Comparison of the total number of bids between the classic contract network and the improved contract network 通過改進合同網算法來適應巡飛彈多彈協同打擊目標的模式,由目標威脅等級的高低決定打擊各目標任務分配優先級,引入標準打擊效益與節點自我判斷來排除部分效益低的節點,仿真驗證了本文設計的巡飛彈任務分配算法的可行性,發現每完成10個目標的任務分配所需要的信息傳遞總次數平均減少了47.89%,不僅明顯減輕了巡飛彈群網絡系統的通信負擔,且能選拔出打擊效益較高的多個節點執行目標打擊任務,提高了巡飛彈藥的綜合打擊效益。
2.2 巡飛彈任務分配模型

3 仿真驗證
3.1 任務分配過程仿真





3.2 與經典合同網算法對比


4 結論