史紅權,隆雨佟,曾 黎
(1.大連艦艇學院作戰軟件與仿真研究所 大連 116018;2.電子科技大學計算機科學與工程學院 成都 611731)
面向多目標的編隊級防空火力資源優化分配屬于一種武器目標分配(weapon target assignment,WTA)問題,隨著同時面對的敵方目標規模和己方火力資源規模的擴大,火力資源到目標的分配難度呈指數型增加,成為研究的熱點問題。
現有方法主要存在優化分配問題建模方法和模型求解方法兩方面的不足。在建模方法方面,文獻[1]采用毀傷概率作為衡量模型效果的唯一標準,在資源充足的情況下會造成資源浪費,難以應對多輪次攔截任務。文獻[2]將毀傷概率與目標威脅度的乘積作為最終打擊效益,沒有考慮資源消耗情況。文獻[3-4]分別提出了綜合火力優化分配模型和最小火力浪費分配模型,二者都考慮了如何使得參與攔截的武器平臺數量最小,并沒有考慮各平臺中武器資源數量總消耗最小。文獻[5]將完成攔截任務的效能和代價之差作為整體效能,沒有體現毀傷概率與消耗的主次關系。在實際作戰中,需要有效攔截來襲目標,應使得毀傷概率達到一定閾值之后再考慮武器資源消耗這一次要優化目標。綜上,在建模方面,現有模型在防空資源調度決策中并不能很好地平衡攔截效率與資源成本之間的關系。
在模型求解方法方面,常用的智能算法有遺傳算法(genetic algorithm,GA)[6]、和聲搜索(harmony search,HS)算 法[7]、粒子群算法[8](particle swarm optimization,PSO)等。其中,遺傳算法和粒子群算法應用得比較廣泛。例如,文獻[9]使用改進的遺傳算法求解聯合防空目標分配問題,通過使用改進的遺傳算法自適應提高尋優能力以及收斂速度。文獻[10]提出了一種改進鯰魚效應的云自適應粒子群算法,但由于增加了計算的復雜度反而大幅增加了計算時間。兩者在處理大規模數據時仍易出現早熟收斂現象。求解防空火力分配問題時盡可能消耗更少的武器資源,并在可行域中定位最優解集中的局部空間,以快速求解。考慮上述原因,遺傳算法和粒子群算法均不能很好地求解防空火力分配問題。和聲搜索算法由于實現簡單、速度較快的特性使其成為求解WTA 問題的一種新選擇。目前和聲搜索算法已有許多改進方法,常見的有改進的和聲搜索算法(the improved harmony search algorithm,IHS)[11],自適應全局最優和聲搜索算法(the selfadaptive global best harmony search algorithm,SGHS)[12],全局最優和聲搜索算法(global best harmony search algorithm,GHS)[13],但這些算法仍有其局限性。對此,本文提出了一種改進全局最優和聲搜索算法(improved global best harmony search algorithm,IGHS),借鑒IHS 的思路在GHS 中引入自適應參數,在搜索初期加強全局搜索能力,在搜索后期加強局部搜索能力。
由此,本文提出了一種新的編隊級防空火力資源優化分配模型,在約束中加入各火力單元的成本并將成本消耗作為模型的次重要優化目標,并利用改進全局最優和聲搜索算法求解問題模型,經過實驗對比,驗證了本文方法的有效性。
本文提出的編隊級防空火力資源優化分配模型總體方案如圖1 所示。該方案中,本文假設編隊所有艦艇編隊的防空火力單元統一存放在一個作戰資源池中,指揮艦可以隨意分配調度這些資源。在此基礎之上,通過對問題進行形式化描述,并建立編隊級防空火力資源優化分配模型。在實際作戰過程中,輸入多個來襲目標態勢信息,并結合資源池信息,利用求解方法,快速求解編隊級防空火力資源優化分配模型,得到編隊級火力資源優化分配方案,實現對多來襲目標的有效攔截。

圖1 總體方案
在問題形式化定義和資源優化分配模型建模方面,本文考慮了火力單元的類型、消耗成本、來襲目標的類型與數量,以及不同類型的火力單元對不同類型來襲目標的單發毀傷概率,通過增加基于實際情況的約束,如火力資源庫存、毀傷概率公式,使本模型更加貼近現實,解決了最終的毀傷概率與火力資源成本消耗的平衡問題。在模型求解方面,本文利用改進全局最優和聲搜索算法能快速并準確地找到近似全局最優解。
資源池狀態包括單枚毀傷概率矩陣、火力單元成本以及火力資源庫存表。假設場景中共有m種火力單元,r種來襲目標,同時待攔截目標的有l個。由于彈藥不同帶來的火力與射程的差異,且來襲目標也有速度與火力的差異,因此每種火力單元對應不同的攔截目標都有獨立的基本毀傷概率,現假定實際作戰時我軍對己方火力單元與來襲目標的特性已有充分了解,因此事先有一張單枚火力單元毀傷概率矩陣Q=(qij)m?r,表示i類火力單元對j類來襲目標的毀傷概率。

其次,由于每種類型的火力單元造價不同,裝填時間與發射時間亦有差別,所以不同種類的火力單元所消耗的成本也不同。但具體的量化函數不是本文的重點,因此本文預定義了各類火力單元的成本,以體現各類火力單元的差異。火力單元的成本如表1 所示。

表1 火力單元成本表
資源池中火力單元的儲備情況也是戰前必須清楚的武器資源狀態,因此定義一張火力資源庫存表如表2 所示。

表2 火力資源庫存表
考慮到場景中共有l個待攔截的目標,因此本模型的火力分配方案為一個矩陣A∈Cm?l,其中元素ai j表示第i種火力單元參與攔截第j個目標的數量,該矩陣的各行之和即為各種火力單元的消耗數量。而在眾多參與攔截某一特定目標的火力單元中,只需要有一枚命中即代表攔截成功,即攔截成功的對立事件為所有參與攔截的火力單元全部攔截失敗。而所有參與攔截的火力單元全部攔截失敗即代表每一種火力單元都攔截失敗,也表示所有參與該次攔截的同種單元全部失敗。所以對來襲目標j的毀傷概率P j為:

式中,pij表示第i種火力單元對第j個來襲目標的毀傷概率。
為使總體收益最大化,還應該定義一個概率閾值,當一組解下的所有目標的平均毀傷概率高于該閾值時,便將此組解納入候選解集,最終的最優解將從候選解集中消耗成本最少的解中選出。概率閾值在實際應用場景中可以人工設定。
該模型考慮多目標來襲時對每個目標分配多個火力單元進行攔截,同時假定所有平臺的資源都集中在一個資源池里面,即選擇資源時可以不考慮所在平臺。攔截軌道如圖2 所示。

圖2 編隊級防空火力資源優化分配模型攔截軌道
如1.1 節所述,定義參數如下:
di為i類火力單元的火力資源庫存,ci為i類火力單元的單位成本,ai j為分配i類火力單元攔截第j個目標的數量,qi j為無其他因素影響下i類單枚火力單元對j類目標的基本毀傷概率。
則本文模型的數學表達式為:

式中,上標k表示第k組解。主要目標為求解所有攔截目標的最大平均毀傷概率,次要目標為最小的成本消耗。約束1 表示每次分配火力時數量都不得超過剩余庫存量;約束2 表示i類火力單元總消耗不得超過自身的總庫存量;約束3 表示每個攔截目標至少有一個火力單元參與攔截;約束4 及約束5 的定義見1.1 節;約束6 表示一組解下所有攔截目標的平均毀傷概率超過概率閾值時則不再關注毀傷概率,轉而關注其成本消耗,以此達成總體收益最高。
在編隊級防空火力資源優化分配模型的基礎上,為快速在巨大的可行域中搜索出全局最優解,本節提出了基于改進全局最優和聲搜索算法的防空火力資源優化分配模型的求解方法。求解過程中,把一組解A=(aij)m?l看作是一組樂器組合,組合中的單個元素 aij看作各樂器吹奏的音符,多種樂器組合組成一個和聲記憶庫,定義價值函數f(A(k))類比音樂效果。求解計算流程如圖3 所示。

圖3 基于改進全局最優和聲搜索算法的防空火力資源優化分配求解流程
具體過程描述如下:
1)初始化基本參數
根據1.2 節的模型,目標函數f(X(k))可定義為:

Pthr=0.95;σ>0。體現了毀傷概率與成本消耗的主次關系。
定義和聲記憶庫大小HM_size、和聲記憶率(harmony memory considering rate,HMCR)及音調調節率(pitch adjusting rate,PAR)上下限的大小。HM_size 決定和聲記憶庫中保留的組合數量一般取值[3,10];HMCR 決定新解從和聲記憶庫或全體可行域產生,一般取值為[0.7,0.95];PAR 決定新解的分量是否從當前最優解中選取,PAR 越高,算法的全局搜索能力越強;反之,算法的局部搜索能力越強,下限一般為0.1,上限一般為0.5。
2)初始化和聲記憶庫
在滿足火力資源庫存的約束下隨機產生10 組初始解放入和聲記憶庫HM 中,并根據價值函數降序排序:

式中,A(j)為第j個解向量;為第j個解向量的第i個分量;f(A(j))為第j個解向量的價值函數;且f(A(1))>f(A(2))>···>f(A(L))。
3)生成新解
首先生成兩個0~1 的隨機數rand1、rand2,并計算PAR,公式如下:

式中,PAR_max 和PAR_min 為PAR 的上下限;n為當前迭代輪次;N為總迭代輪次。PAR 隨著迭代次數自適應調整,做到搜索初期放大全局搜索能力,搜索后期放大局部搜索能力。

4)更新記憶庫
計算新解的價值函數f(A(new))并將其加入到記憶庫中重新降序排序,取新序列中的前10 個組合形成新的記憶庫。
執行上述步驟,重復步驟3)和步驟4),直到達到最大迭代次數或滿足預先設定的停止準則就結束循環,輸出當前和聲記憶庫中最優的解向量作為火力分配方案。
本文實驗使用了遺傳算法、改進鯰魚效應——云自適應粒子群算法、和聲搜索算法、改進和聲搜索算法、自適應全局最優和聲搜索算法、局最優和聲搜索算法以及改進全局最優和聲搜索算法等7 種不同的算法進行對比。同時根據數據規模不同設置兩個對照組,分別對比以上7 種方法在處理不同規模數據上的表現。
本文實驗的運行環境:CPU 為AMD Ryzen7 4800H with Radeon Graphics2.90GHz;內存為16GB;操作系統為Windows1064 位;編程語言為Python3.7,IDE 為PyCharm2020.2.1(Professional Edition)。
基于HS 的求解方法中,HM_size=3,HMCR=0.95,PAR=0.1,FW=1。基于GHS 的方法參數與HS 一致。基于IHS 的求解方法中,PAR 的取值范圍為[0.1,0.5],FW 的取值范圍為[0.5,1.5]。基于SGHS 的求解方法中,HMCR 服從期望為前百次均值,標準差為0.01 的正態分布,PAR 服從期望為前百次均值,標準差為0.05 的正態分布。基于IGHS的求解方法中,PAR 的取值范圍為[0.1,0.5]。基于GA 的求解方法中,種群大小取20,突變概率取0.01,適應度函數為HS 中的目標函數(11)。基于CE-CAPSO 的求解方法中,慣性權重的取值范圍為[0.4,0.9],學習因子取1。所有方法的初始解在可行范圍內隨機生成,迭代次數均為500 次。
2.2.1 簡單數據規模下的結果
該組實驗假定資源池中有3 種類型的火力單元,同時攔截目標也為3 種類型,每種類型來襲數量為一個,一共3 個,其基本毀傷概率矩陣Q為:

各類型火力單元庫存均為10 枚,單枚成本消耗矩陣C為:

單次實驗的概率?消耗迭代圖如圖4 所示,黑色實線代表概率閾值,取值為0.95。
重復進行100 次實驗,所有方法的平均結果如表3 所示。
在該組實驗中,由于火力單元類型為3 種,來襲目標有3 個,因此單個解的規模為3×3=9 維。此情況下7 種方法均能一定程度上給出各自的最優解。首先觀察圖4a,發現所有折線的走向均是由高到底,這是由于來襲目標數量只有3 個,而各類火力單元庫存各有10 枚,此時資源充足,而所有算法的初始解均是在滿足約束條件的情況下隨機生成,因此大概率會消耗掉大量彈藥,即初始的平均毀傷概率很高。但由于超過了概率閾值,所以所有方法均在后續的迭代中不斷降低彈藥的消耗,后續的走向就會降低,但仍然會出現上升的情況,這是因為此時的優化目標已從毀傷概率轉到成本消耗上,如果搜索方法發現了一種解能降低成本消耗,而此時該解的毀傷概率卻比先前的解高,如此便會出現毀傷概率折線上升的情況,最終會收斂于概率閾值的上方。
再觀察圖4b,在毀傷概率超過概率閾值的情況下,成本消耗才是衡量搜索方法性能的標準。首先觀察基于改進GE-GAPSO 的方法,該方法更新頻率最低,且最終結果最差,顯然陷入了局部最優,同時在表3 中也可以看出該方法的成本消耗最高,而且耗時也僅優于GA,大幅慢于5 種和聲搜索算法。在其余6 種方法中,成本消耗差別不大,但GA 的方法耗時最長,5 種和聲搜索算法在簡單數據規模的情況下性能差距不大。

表3 簡單數據規模下的實驗結果

圖4 簡單數據規模下的概率?消耗迭代圖
2.2.2 復雜數據規模下的結果
該組實驗假定資源池中有5 種類型的火力單元,同時攔截目標為3 種類型,第一種類型來襲數量為3 個,第二種類型來襲數量為兩個,第三種類型來襲數量為兩個,一共7 個,其基本毀傷概率矩陣Q為:

各類型火力單元庫存均為30 枚,單枚成本消耗矩陣C為:

單次實驗的概率?消耗迭代圖如圖5 所示,黑色實線代表概率閾值,取值為0.95。
重復進行100 次實驗,所有方法的平均結果如表4 所示。
在該組實驗中,由于火力單元類型增加至5種,來襲目標增加至7 個,因此單個解的規模為5×7=35 維。此情況下7 種方法性能的差距已經有所體現。首先觀察圖5a,由于此時解空間增大,隨機生成初始解的毀傷概率可能會低于概率閾值,所以初始毀傷概高于概率閾值的折線總體走勢,仍然朝概率閾值逼近,而初始毀傷概率低于概率閾值的折線先上漲到超過概率閾值,再朝著概率閾值逼近,最終收斂于概率閾值上方,符合模型的期望。但可以看到此時基于GA 的方法和基于CECAPSO 的方法已經失效,因為數據復雜度的上升會進一步放大全局搜索能力不足的缺陷,使得算法失去了跳出當前搜索區域的能力,而且算法速度上的差異也被進一步擴大。
再觀察圖5b,此時5 種和聲算法仍然具備搜索能力,但性能上也有差異。圖中5 種方法的折線不斷在下降,收斂速度方面,本文方法與基于GHS 的方法收斂速度明顯快于其他方法,基于HS 的方法與基于SGHS 的方法居中,基于IHS 的收斂速度最慢。搜索結果方面,本文方法收斂點最低,其次為基于GHS 的方法,另外3 種方法收斂點則大幅高于前兩者。所以,本文選擇的基于IGHS 的方法不僅能最早進入收斂狀態,且最后的結果在所有方法中也是最優,足以體現其尋優能力與效率。在表4 中也可以清楚地觀察到HS、IHS、SGHS,GHS 以及IGHS 平均成本消耗的優劣。

表4 火力資源庫存充足情況下的實驗結果
綜上,本文提出的IGHS 能在短時間內計算出更好的答案,且在復雜數據規模下的性能最優,所以本文使用該算法作為求解編隊級防空火力資源優化分配模型的方法。
相比于傳統的基于毀傷期望的防空作戰資源分配策略模型,本文綜合了毀傷概率與作戰資源消耗提出了一種編隊級防空火力資源優化分配模型,在GHS 的基礎上引入自適應參數提出了IGHS 并用其求解,使得對來襲目標的平均毀傷概率盡可能增大,在滿足所給出的概率閾值后,再降低作戰資源消耗,達到作戰目標預期并實現總體收益最大化。經過仿真實驗并與GA、CE-CAPSO、HS、IHS、SGHS 及GHS 進行了對比,驗證了本文提出的模型與本文算法的正確性和有效性,能夠在較短的時間內得到平均毀傷概率更大且武器資源消耗更小的解,滿足本文模型的要求。
后續可從算法和模型兩方面改進。針對算法而言,相比于其他算法,IGHS 有其優勢也有其局限性,后續的改進方向可以通過改進新解生成的規則增加算法的穩定性和收斂速度,也可與其他智能算法相結合,充分利用多種算法的長處以更好地尋求問題的解。針對模型而言,后續可以考慮平臺間的決策,著重探究平臺間的協同問題,以更好利用和平衡各平臺的作戰資源,形成一個較為穩定的能夠兼顧各平臺作戰資源的巨大資源池。