王爾申,郭 靖,宏 晨,肖明明,劉 暢,曲萍萍
(1.沈陽航空航天大學(xué)電子信息工程學(xué)院,沈陽 110136;2.沈陽航空航天大學(xué)遼寧通用航空研究院,沈陽 110136;3.北京聯(lián)合大學(xué)多智能體系統(tǒng)研究中心,北京 100101;4.北京聯(lián)合大學(xué)北京市信息服務(wù)工程重點(diǎn)實(shí)驗(yàn)室,北京100101;5.北京聯(lián)合大學(xué)機(jī)器人學(xué)院,北京 100101;6.北京聯(lián)合大學(xué)智慧城市學(xué)院,北京 100101)
近年來,智能集群技術(shù)已成為無人機(jī)(Unmanned aerial vehicle,UAV)技術(shù)的發(fā)展熱點(diǎn),直接催生了一種新的無人機(jī)作戰(zhàn)模式——無人機(jī)集群作戰(zhàn)[1]。集群作戰(zhàn)的理論基礎(chǔ)是群體智能。就像飛機(jī)的靈感來自于飛鳥,雷達(dá)的靈感產(chǎn)生自蝙蝠,集群技術(shù)的靈感來源于蜂群,蟻群,狼群等群居自然生物。集群內(nèi)部分工明確,每個(gè)個(gè)體遵循簡單的行為和規(guī)則,不需要核心個(gè)體的統(tǒng)一調(diào)度,便能自發(fā)地形成一個(gè)有機(jī)整體,實(shí)現(xiàn)復(fù)雜而強(qiáng)大的系統(tǒng)功能[2]。無人機(jī)集群對抗中,每個(gè)作戰(zhàn)個(gè)體可以根據(jù)作戰(zhàn)場景中雙方的態(tài)勢不斷學(xué)習(xí),并自動調(diào)整自身的行為以應(yīng)對各種復(fù)雜戰(zhàn)場態(tài)勢[3]。
無人機(jī)集群對抗模型的研究發(fā)展主要有空空對抗和空地對抗2個(gè)方面。在空空對抗方面,Zohdi等引入短程與長程作用力,提出基于“點(diǎn)-質(zhì)量群”的機(jī)械力學(xué)模型模擬蜂群行為,建立一種離散multi-agent模型去模擬無人機(jī)集群對抗博弈行為[4-6];陳燦等根據(jù)多智能體強(qiáng)化學(xué)習(xí)(Multi agent reinforcement learning,MARL)的集中式訓(xùn)練分布式執(zhí)行(Centralized training with decentralized execution,CTDE)范式,在Actor-Critic框架下建立無人機(jī)集群對抗博弈模型[7];羅德林等引入多Agent系統(tǒng)、態(tài)勢評估和空戰(zhàn)對抗等理念,為每個(gè)無人機(jī)建立獨(dú)立的Agent,設(shè)計(jì)相應(yīng)的決策方法,以此建立無人機(jī)集群對抗模型[8];軒書哲等針對大規(guī)模無人集群攻防對抗問題,使用強(qiáng)化學(xué)習(xí)將問題建模為基于馬爾科夫決策過程(Markov decision process,MDP)的多智能體近端策略優(yōu)化(Multi-agent proximal policy optimization,M-PPO)無人機(jī)集群對抗模型[9];符小衛(wèi)等針對多無人機(jī)協(xié)同對抗博弈問題,通過強(qiáng)化學(xué)習(xí)和無人機(jī)動力學(xué)模型建立了無人機(jī)協(xié)同對抗追逃博弈模型[10];章豪等通過無人機(jī)運(yùn)動學(xué)模型以及協(xié)同約束,建立了無人機(jī)集群協(xié)同規(guī)避的博弈模型[11];Liu等在二維視角下通過質(zhì)點(diǎn)運(yùn)動模型,建立分布式無人機(jī)協(xié)同編隊(duì)博弈策略模型[12];Xing等針對無人機(jī)協(xié)同對抗任務(wù)搜索,建立分布式柵格化無人機(jī)集群運(yùn)動模型,提出基于人工勢場-蟻群的路徑規(guī)劃決策優(yōu)化算法[13];Jia等針對異構(gòu)無人機(jī)集群協(xié)同對抗路徑規(guī)劃問題,提出擴(kuò)展多智能體的分布式任務(wù)的基于共識捆綁算法(Consensus based bundle algorithm,CBBA)[14];王爾申等針對無人機(jī)集群協(xié)同對抗問題,根據(jù)復(fù)雜網(wǎng)絡(luò)理論,構(gòu)建無人集群協(xié)同對抗網(wǎng)絡(luò),基于邊攻擊成本分析協(xié)同網(wǎng)絡(luò)級聯(lián)效應(yīng)及魯棒性[15-17]。
在空地對抗方面,Cruz等將集群空地對抗行為看作是高度復(fù)雜的非線性動態(tài)系統(tǒng),把動態(tài)博弈過程分為多級決策,建立非線性動力學(xué)模型[18-19];趙玉亮等針無人機(jī)空地對抗的不確定性和復(fù)雜性,考慮多因素提出了一種多目標(biāo)雙矩陣博弈模型[20];魯鴻軒等針無人機(jī)空地自主對抗問題,分析對抗行為,提出一種三支理論的無人機(jī)空地對抗模型[21];薄寧等針對有/無人機(jī)協(xié)同空地對抗博弈問題,將博弈對抗建模為MDP模型并通過求解MDP模型得到對抗策略[22]。
現(xiàn)有的群體動態(tài)博弈模型的收益參數(shù)多是在初始狀態(tài)下設(shè)定的,動態(tài)博弈過程中不再變化,使得目標(biāo)收益函數(shù)不能實(shí)時(shí)反映戰(zhàn)場態(tài)勢的動態(tài)變化,導(dǎo)致博弈決策滯后于戰(zhàn)場態(tài)勢的變化[18-19]。本文針對戰(zhàn)場態(tài)勢實(shí)時(shí)變化導(dǎo)致目標(biāo)收益函數(shù)動態(tài)變化的問題,以無人機(jī)集群與地面防空陣地為博弈雙方,應(yīng)用非合作博弈理論,使用空間狀態(tài)矩陣表征戰(zhàn)場態(tài)勢,給出基于戰(zhàn)場態(tài)勢的自適應(yīng)權(quán)重表達(dá)式,建立了無人機(jī)集群空地對抗博弈模型。仿真驗(yàn)證了基于自適應(yīng)權(quán)重的博弈模型的合理有效性。本文主要貢獻(xiàn)是在于提出的自適應(yīng)收益權(quán)重因子以及命中因子衰減,目的是為了提高無人機(jī)集群對抗模型的適應(yīng)性。
設(shè)定作戰(zhàn)雙方為紅方(Red)和藍(lán)方(Blue),紅方為防守方,藍(lán)方為進(jìn)攻方。藍(lán)方是由無人戰(zhàn)斗機(jī)UCAV(Unmanned combat air vehicle),偵察無人機(jī)RUAV(Reconnaissance UAV)組成的無人機(jī)集群。紅方由電子雷達(dá)陣地(Electronic radar fronts,ERF)和地面防空導(dǎo)彈陣地(Ground air defense fronts,GADF)組成。
設(shè)紅藍(lán)雙方的作戰(zhàn)單位分別有NRER、NRAD、NBC、NBR,其中RER表示紅方的電子雷達(dá),RAD表示紅方的防空導(dǎo)彈,BC表示藍(lán)方的戰(zhàn)斗無人機(jī)集群,BR表示藍(lán)方的偵察無人機(jī)集群。用k=0、1、…、K表示離散的對抗時(shí)間步,k=0表示初始狀態(tài),K為對抗的最大時(shí)間步。對抗時(shí)間步k的間隔設(shè)定為1s,即對抗在第0s初始化,第1s開始,第Ks結(jié)束。不妨將博弈的參與者統(tǒng)一定義為X={RER,RAD,BC,BR}(i=1,2,…,NX),Xi表示參與者X的第i類作戰(zhàn)單位。
1.1.1 基礎(chǔ)狀態(tài)矩陣
根據(jù)空地對抗場景,給出作戰(zhàn)單位的基礎(chǔ)狀態(tài)矩陣
式中:(k)=[(k)(k)(k)]為k時(shí)刻Xi三維坐標(biāo),(k)為Xi的數(shù)量,(k)為Xi的武器載荷量,(k)表示Xi的基礎(chǔ)狀態(tài)矩陣。
1.1.2 作戰(zhàn)參數(shù)矩陣
根據(jù)無人機(jī)、雷達(dá)以及地空導(dǎo)彈等作戰(zhàn)單位的攻擊特性,建立參數(shù)矩陣

式中:為Xi的作戰(zhàn)半徑,為Xi的飛行高度,(k)為Xi的飛行速度,(k)為Xi的最大火力,表示Xi的參數(shù)矩陣。
1.1.3 決策參數(shù)矩陣
把雙方的位移,火力以及目標(biāo)選擇設(shè)為對抗行為控制因素,表示博弈決策信息


式中θ為投影在XOY面上無人機(jī)的目標(biāo)偏角。通過雙方位置得到θ從而求得坐標(biāo)增量。
得到基于空間狀態(tài)的Xi戰(zhàn)場態(tài)勢矩陣MX i(k)

式中:TX i(k)為4維向量,ZX i(k)和UX i(k)為5維向量,MX i(k)為14維向量。
因此,整體戰(zhàn)場態(tài)勢矩陣可表示為

式中

式中:MBlue(k)為無人機(jī)群狀態(tài)矩陣,MRed(k)為地面部隊(duì)狀態(tài)矩陣,M為NRed+NBlue維矩陣。
復(fù)雜而多變的無人機(jī)集群對抗環(huán)境具有狀態(tài)不確定性,為了簡化對抗過程而提出如下約束。
1.2.1 攻擊約束


式 中:Δsx、Δsy、Δsz分 別 為x、y、z軸 的 距 離 分 量;ΔxyzXY為計(jì)算XY之間的歐氏距離。紅藍(lán)雙方的有效射程限定了火力輸出(k),在k時(shí)刻 敵 方Y(jié)進(jìn)入我方X有效射程RX內(nèi),我方才可攻擊。
1.2.2 武器載荷約束
下一時(shí)間步的火力輸出不能超過當(dāng)前時(shí)間步的載荷儲備

式中CX(k+1)為k+1時(shí)刻X的最大火力值。
1.3.1 位移更新
位置坐標(biāo)的狀態(tài)轉(zhuǎn)移方程為

式中ΨX i(k)、ζX i(k)分別為Xi的坐標(biāo)向量和坐標(biāo)增量向量。
1.3.2 數(shù)量更新

(1)判決函數(shù)

上面兩函數(shù)實(shí)現(xiàn)了描述的二值化,從而可以利用0~1分布作為目標(biāo)及距離的判定函數(shù)。

Q(k)是Xi投入的單位數(shù)量防御因子去抵消Yj投入的單位數(shù)量攻擊因子,即滿足Xi單位數(shù)量防御因子等于Yj單位數(shù)量攻擊因子。討論兩種特殊情況:
(3)損耗因子A(k)

式中:K(k)為命中因子,Yj表示攻擊Xi時(shí),Xi被命中的概率。
在對抗過程中,紅方的RER第1類作戰(zhàn)單位(簡寫RER1)擁有電子偵察能力,RER2具有電子干擾能力。電子干擾能夠擾亂無人機(jī)的導(dǎo)航信息和通信鏈路,導(dǎo)致無法正常工作,從而降低甚至喪失作戰(zhàn)能力,是反制無人機(jī)的重要方式[23],可以對藍(lán)方無人機(jī)集群造成嚴(yán)重影響。RER2使得無人機(jī)集群的攻擊,飛行以及通信等能力受到制約,將影響集中體現(xiàn)在命中因子中,本文提出了如下命中因子衰減方式。

1.3.3 載荷更新

博弈對抗的目的是給予雙方一定量的初始對抗資源的前提下:(1)盡可能保留己方在博弈結(jié)束時(shí)的作戰(zhàn)資源;(2)最大化減少敵方在博弈結(jié)束時(shí)的作戰(zhàn)資源。雙方的收益(支付)函數(shù)表示如下
式 中:αi、βi(i=1,2,3,4)都 是 靜 態(tài) 權(quán) 重;JB(k)和JR(k)分別為藍(lán)方和紅方在k時(shí)刻的目標(biāo)收益函數(shù);(k)為歸一化的Xi作戰(zhàn)單位數(shù)量變化量。其中,(0)是Xi作戰(zhàn)單位數(shù)量的初始值

考慮無人機(jī)集群的復(fù)雜對抗環(huán)境,針對收益函數(shù),靜態(tài)權(quán)重的收益函數(shù)不能有效的反映當(dāng)前對抗局勢[8-9]。對抗博弈的收益簡單認(rèn)定為作戰(zhàn)單位數(shù)量的線性表征會使得誤差增大,還應(yīng)考慮作戰(zhàn)單位的武器載荷量,作戰(zhàn)單位的作戰(zhàn)狀態(tài)等對局勢有影響的因素,復(fù)雜的戰(zhàn)場環(huán)境應(yīng)使得對抗博弈的收益考慮多方面因素的組合。
作戰(zhàn)單位數(shù)量是反映收益函數(shù)的關(guān)鍵因素,而其權(quán)重表征了在對抗中作戰(zhàn)單位數(shù)量變化的重要程度。作戰(zhàn)單位數(shù)量變化的重要程度與火力值(k),命中因子K(k)和武器載荷量WiX(k)等作戰(zhàn)指標(biāo)有關(guān)。
2.1.1 火力值權(quán)重分量

式中:ηc1為火力值權(quán)重分量,Xi的σiX經(jīng)驗(yàn)取值區(qū)間為[0,1.8]。
2.1.2 武器載荷權(quán)重分量
根據(jù)式(8),武器載荷量WiX(k)限制了下一時(shí)間步的攻擊閾值CiX(k+1)。作戰(zhàn)單位的武器載荷量代表了該作戰(zhàn)單位在戰(zhàn)場局勢的潛在威脅程度,結(jié)合數(shù)量變化量能更合理表征潛在威脅程度。引入均衡冪因子,調(diào)節(jié)作戰(zhàn)單位的潛在威脅程度表征重要程度的比例關(guān)系


式中WiX(0)為Xi武器載荷量的初始值。
2.1.3 命中因子權(quán)重分量
根據(jù)式(14),命中因子是單調(diào)減函數(shù),命中因子越小則對戰(zhàn)場態(tài)勢的影響越小,使得k時(shí)刻Xi的重要程度減小,引入命中因子均衡因子,調(diào)節(jié)命中因子對權(quán)重的影響


式中K(0)為Xi命中因子的初始值。
綜上所述,針對不同作戰(zhàn)單位,根據(jù)戰(zhàn)場態(tài)勢,綜合k時(shí)刻的決策信息,提出一種用來動態(tài)計(jì)算目標(biāo)收益函數(shù)的自適應(yīng)權(quán)重,自適應(yīng)權(quán)重表達(dá)式如下

紅藍(lán)雙方權(quán)重更新式如下

加入自適應(yīng)權(quán)重的博弈雙方目標(biāo)收益函數(shù)如下


無人機(jī)集群空地對抗是一種非合作博弈,為求解納什均衡,根據(jù)極小極大值方法,表征出雙方一般和博弈目標(biāo)收益和

其目的是最大化己方的收益,同時(shí)減小敵方的收益。


式中:(ΠB,ΠR)分別表示雙方所有可選的策略空間,(πB,πR)為雙方的策略空間中的任一策略。
其中(ΠB,ΠR)策略空間中包括了雙方狀態(tài)下對應(yīng)所執(zhí)行的多維動作,有位移增量、火力值、目標(biāo)選擇以及電子干擾的4維動作。
空地對抗博弈算法具體流程如下所示。
輸入:初始化作戰(zhàn)雙方位置,速度等狀態(tài)數(shù)據(jù)輸出:J是目標(biāo)收益
初始化:仿真次數(shù)E=7200,對抗回合數(shù)K=25,X=[blue,red],N=[Nblue,Nred],=[ZiX(k),TiX(k)],=[UiX(k)](i=1,2,…,N),動作探索參數(shù)ε=0.5

設(shè)定對抗活動處于恒定高度的三維空間內(nèi),高度可以通過參數(shù)設(shè)置,即(k)=HiX。對抗示意圖如圖1所示,藍(lán)方處于左下角,紅方處于右上角,為了顯示清晰,作戰(zhàn)單位在示意圖中適當(dāng)偏移。

圖1 紅藍(lán)雙方對抗初始示意圖Fig.1 Initial picture of the red-blue confrontation
模型的初始化參數(shù)如表1~4所示,其中表1參考了實(shí)際戰(zhàn)爭的作戰(zhàn)參數(shù),描述了作戰(zhàn)單位的初始狀態(tài),表2~4參考了文獻(xiàn)[17-18]的設(shè)定,其中表2是自適應(yīng)權(quán)重的初始值;表3是作戰(zhàn)單位的命中因子的初始值;基于攻擊目標(biāo)選擇策略的不確定性,設(shè)定雙方的選擇目標(biāo)概率如表4所示。其中,RER2=0表示紅方不對藍(lán)方施加電子干擾,RER2=1表示紅方對藍(lán)方施加電子干擾。例如:0.6 (0.8 )表示不加干擾的選擇概率為0.6 ,施加干擾時(shí)選擇概率為0.8 。

表1 作戰(zhàn)單位基礎(chǔ)數(shù)據(jù)Table1 Basic data of combat units

表2 收益函數(shù)的初始權(quán)重Table2 Initial weight of reward function

表3 作戰(zhàn)單位的命中概率Table3 Hit rate of combat units

表4 作戰(zhàn)單位的選擇目標(biāo)概率Table4 Rate of target selection for combat units
自適應(yīng)權(quán)重的各因子在近似最佳值左右各取一個(gè)對稱的合理范圍進(jìn)行試驗(yàn),如表5、6所示,括號外為有電子干擾(Electromagnetic interference,EI)的值,括號里為無電子干擾(Non-EI,NEI)的值。如 在表5中BC1的為0.5 ~1.5 (0.4 ~1.6 )。表示在EI情況下取值范圍為0.5 ~1.5 ,NEI情況下取值范圍為0.4 ~1.6 。

表5 藍(lán)方α權(quán)重的均衡因子Table5 Balance factor of blue α weight

表6 紅方β權(quán)重的均衡因子Table6 Balance factor of red β weight
在求解納什均衡時(shí),采用蒙特卡洛方式進(jìn)行7200次仿真,對每一步的收益函數(shù)取期望-JβR、-JαB作為納什均衡的近似解,數(shù)據(jù)經(jīng)均值化處理,誤差棒為標(biāo)準(zhǔn)差,實(shí)驗(yàn)結(jié)果如下。
4.2.1 目標(biāo)收益
如圖2所示,藍(lán)色矩形表示藍(lán)方無人機(jī)集群,紅色圓表示紅方地面部隊(duì),黑色三角表示雙方的收益和,實(shí)心表示有EI,空心表示NEI。縱坐標(biāo)為目標(biāo)收益J,橫坐標(biāo)為對抗時(shí)間步k,施加電子干擾EI的對抗區(qū)間為[7,15]。

圖2 靜態(tài)權(quán)重和自適應(yīng)權(quán)重的目標(biāo)收益Fig.2 Target reward of static weights and adaptive weights
圖2(a)表示在NEI情況下,紅方的目標(biāo)收益NEI-JR減小,藍(lán)方的目標(biāo)收益NEI-JB增大,藍(lán)方在對抗中更占優(yōu)勢;在EI情況下,紅方的目標(biāo)收益EI-JR增大,藍(lán)方的目標(biāo)收益EI-JB減小,紅方在對抗中更占優(yōu)勢。收益和EI+與NEI+均減小。圖2(b)表示在NEI情況下,NEI-JR減小,NEI-JB增大。藍(lán)方在對抗中更占優(yōu)勢;在EI情況下,EI-JR增大,EI-JB減小,紅方在對抗中更占優(yōu)勢。而收益和EI+增大NEI+減小。圖2(b)子圖中,收益和NEI+持續(xù)減小,表明藍(lán)方持續(xù)占優(yōu)勢,收益和EI+先減小后增大,表明藍(lán)方在初期占優(yōu)勢,中后期紅方更占優(yōu)勢。
無人機(jī)集群對抗過程是一種高度復(fù)雜的非線性動態(tài)過程。對比EI和NEI條件下的目標(biāo)收益函數(shù),發(fā)現(xiàn)靜態(tài)權(quán)重的目標(biāo)收益隨著對抗演化,呈現(xiàn)了單調(diào)下降趨勢;而根據(jù)圖2(b)子圖更易看出自適應(yīng)權(quán)重的目標(biāo)收益隨著對抗演化,呈現(xiàn)非單調(diào)性。說明靜態(tài)權(quán)重的目標(biāo)收益曲線對復(fù)雜對抗過程的適應(yīng)性不足,自適應(yīng)權(quán)重的目標(biāo)收益曲線可以更加合理地表征對抗過程,使得改進(jìn)的目標(biāo)收益函數(shù)具有一定的動態(tài)適應(yīng)性。
4.2.2 對抗過程
由圖3可知藍(lán)方BR1、BR2與紅方RER1均未有損失。在NEI情況下,BC1、BC2、RER2的數(shù)量下降趨勢較小,RAD1、RAD2的數(shù)量下降趨勢較大;在EI情況下,BC1、BC2、RER2的數(shù) 量下降趨勢較大,RAD1、RAD2的數(shù)量下降趨勢較小。表明施加電子干擾可以擊毀更多的BC1和BC2,同時(shí)減少RAD1和RAD2的損失。

圖3 作戰(zhàn)單位數(shù)量Fig.3 Number of combat units
4.2.3 對抗結(jié)果
對抗雙方的作戰(zhàn)單位數(shù)量直方圖如圖4(a)所示,NEI是未施加電子干擾的剩余數(shù)量,EI是施加電子干擾的剩余數(shù)量。雙方獲勝的條件是可攻擊單位總數(shù)量的損失超過80%。圖4(a)中,在NEI情況下,藍(lán)方BC1+BC2的損失未超過80%,紅方RAD1+RAD2的損失超過80%,因此在NEI情況下,藍(lán)方較易獲勝;而在EI情況下,藍(lán)方BC1+BC2的損失超過80%,而紅方RAD1+RAD2的損失未超過80%,因此在EI情況下,紅方較易獲勝。

圖4 作戰(zhàn)單位剩余數(shù)量及獲勝率直方圖Fig.4 Surviving number of combat units and histogram of win rate
將對抗結(jié)果分為3種情況:平局,紅方勝和藍(lán)方勝。如圖4(b)所示,在NEI情況下,藍(lán)方獲勝的比率為94.61 %,紅方獲勝的比率為2.78 %,平局的比率為2.61 %;在EI情況下,紅方獲勝的比率為100%,藍(lán)方獲勝和平局的比率均為0%。
4.2.4 自適應(yīng)權(quán)重差
自適應(yīng)權(quán)重差值等于EI時(shí)的權(quán)重值減去NEI時(shí)的權(quán)重值。如圖5所示,藍(lán)色a表示藍(lán)方無人機(jī)集群的權(quán)重差值(簡稱為a差值),紅色b表示紅方地面部隊(duì)的權(quán)重差值(簡稱為b差值)。由 圖5可知,BR1、BR2、RER1的 權(quán)重沒有變化,表明在對抗過程中其收益權(quán)重是相互獨(dú)立的。BC1、BC2的a差值曲線遞減,說明藍(lán)方認(rèn)為EI使 得BC1、BC2的 作 戰(zhàn) 能 力 削 弱;b差 值 曲 線也遞減,說明紅方認(rèn)為EI使得BC1、BC2的威脅程度降低。

圖5 自適應(yīng)權(quán)重差值曲線Fig.5 Curves of adaptive weight difference
RER2的a差值曲線遞增,說明藍(lán)方認(rèn)為EI使得RER2的威脅程度增加;b差值曲線也遞增,說明紅方認(rèn)為EI使RER2的作戰(zhàn)能力增強(qiáng)。RAD1的a差值曲線非線性遞增,說明藍(lán)方認(rèn)為EI使得RAD1的威脅程度非線性增加;b差值曲線非單調(diào)增加,k∈[1,9]時(shí)紅方認(rèn)為EI使得RAD1的 作戰(zhàn)能力增強(qiáng),k∈[10,16]因受損較大使得增強(qiáng)后的作戰(zhàn)能力有所削弱。RAD2的a差值曲線非單調(diào)增加,k∈[1,14]時(shí)藍(lán)方認(rèn)為EI使得RAD2的威脅程度增加,k∈[15,16]因受損較大使得增加的威脅程度有所降低;b差值曲線非單調(diào)增加,k∈[1,14]時(shí) 紅 方 認(rèn) 為EI使 得RAD2的作戰(zhàn)能力增強(qiáng),k∈[15,16]因受損較大使得增強(qiáng)后的作戰(zhàn)能力有所削弱。
針對無人機(jī)集群對抗博弈時(shí)目標(biāo)收益函數(shù)的動態(tài)變化問題,本文以無人機(jī)集群空地對抗為作戰(zhàn)場景,分析動態(tài)變化的戰(zhàn)場態(tài)勢,提出一種基于戰(zhàn)場態(tài)勢的收益權(quán)重自適應(yīng)計(jì)算方法,改進(jìn)動態(tài)博弈的目標(biāo)收益函數(shù),主要結(jié)論:(1)非線性動態(tài)系統(tǒng)與博弈論相結(jié)合,建立無人機(jī)集群空地對抗博弈模型,提出非完全信息下目標(biāo)選擇概率的生成方法,得出的動態(tài)命中因子能適應(yīng)不同打擊策略下的對抗行為;(2)空地對抗仿真實(shí)驗(yàn)表明,提出的自適應(yīng)收益權(quán)重能夠表征對抗策略差異下的不同收益,通過權(quán)重差曲線可以表征自適應(yīng)權(quán)重對不同策略的靈敏程度。與靜態(tài)權(quán)重模型相比,自適應(yīng)權(quán)重模型的目標(biāo)收益刻畫態(tài)勢的準(zhǔn)確性更高。