趙祿達(dá),王 斌,2,侯 嵬
(1.國(guó)防科技大學(xué)電子對(duì)抗學(xué)院,安徽 合肥 230037;2. 國(guó)防科技大學(xué)第三學(xué)科交叉中心,安徽 合肥 230037)
現(xiàn)代戰(zhàn)爭(zhēng)中,電子戰(zhàn)的作戰(zhàn)雙方總是處于對(duì)抗博弈的天平兩端——電子進(jìn)攻方的作戰(zhàn)目標(biāo)是干擾壓制敵方所有電子目標(biāo),癱瘓敵方作戰(zhàn)能力;電子防御方則需要綜合運(yùn)用抗干擾、反偵察、抗截獲等多種手段和措施,對(duì)抗進(jìn)攻方的干擾進(jìn)攻[1]。從目前電子戰(zhàn)與人工智能結(jié)合形成的認(rèn)知電子戰(zhàn)[2]來看,雖然電子干擾措施采取的是自適應(yīng)策略,人工操作和干預(yù)較少,但是干擾決策的本質(zhì)仍然是攻防雙方的干擾-抗干擾策略博弈。所以,研究不同干擾樣式下的電子戰(zhàn)博弈策略就顯得尤為重要了。
電子戰(zhàn)中的干擾樣式的決策分析始終是研究的熱點(diǎn)。現(xiàn)階段的靜態(tài)干擾樣式?jīng)Q策模型多是在沒有電子進(jìn)攻的靜態(tài)條件下,以裝備固有參數(shù)為主要參考的性能或能力評(píng)估模型,且考慮作戰(zhàn)實(shí)際過程中的環(huán)境、人為因素較少。文獻(xiàn)[3]提出了一種電子戰(zhàn)干擾戰(zhàn)術(shù)、技術(shù)措施相結(jié)合的博弈論決策框架,為后續(xù)研究做出了很好的鋪墊。文獻(xiàn)[4]在博弈論決策框架內(nèi)將決策準(zhǔn)則由最大最小值定理進(jìn)行合理拓展,進(jìn)一步提高了決策效率。文獻(xiàn)[5]中引入博弈論對(duì)雷達(dá)的干擾效果進(jìn)行了評(píng)估,雖然只是簡(jiǎn)單考慮了靜態(tài)博弈的納什均衡解,但展示出了將博弈論用于研究對(duì)抗效能的優(yōu)勢(shì)。近年來不少學(xué)者將人工智能運(yùn)用到電子戰(zhàn)決策中來,文獻(xiàn)[6]總結(jié)了目前人工智能在電子戰(zhàn)干擾決策方面的進(jìn)展,提出了一種智能化干擾決策架構(gòu)。文獻(xiàn)[7—8]根據(jù)強(qiáng)化學(xué)習(xí)的框架,提出了電子干擾決策的自適應(yīng)決策方法。
可以看出,目前的電子戰(zhàn)干擾決策問題取得了較好的進(jìn)展,但也存在以下幾點(diǎn)問題:一是對(duì)雷達(dá)干擾樣式選擇的博弈和決策問題研究較多,對(duì)通信干擾樣式的博弈和決策問題研究較少;二是在確定效用評(píng)價(jià)指標(biāo)時(shí),基本上均以誤碼率作為最終指標(biāo)進(jìn)行討論,沒有綜合考慮通信電子戰(zhàn)的系統(tǒng)因素、作戰(zhàn)行動(dòng)因素和指揮員主觀因素等;三是在研究干擾決策的博弈過程時(shí),以靜態(tài)博弈為主,動(dòng)態(tài)博弈的研究較少。本文針對(duì)以上問題,提出了通信電子戰(zhàn)干擾樣式選擇的博弈決策模型,通過作戰(zhàn)雙方不完全信息的動(dòng)態(tài)博弈解決了通信電子戰(zhàn)行動(dòng)決策中的干擾樣式選擇問題。
通信電子戰(zhàn)干擾樣式選擇的博弈模型由多指標(biāo)評(píng)價(jià)模型和干擾樣式動(dòng)態(tài)博弈模型組成,如圖1所示。首先在評(píng)價(jià)過程中,將不同性質(zhì)的數(shù)據(jù)按照不同的數(shù)據(jù)預(yù)處理方法進(jìn)行數(shù)據(jù)處理,基于改進(jìn)AHP-熵權(quán)法對(duì)通信電子戰(zhàn)作戰(zhàn)效果指標(biāo)權(quán)重進(jìn)行確定;然后對(duì)不同性質(zhì)的指標(biāo)數(shù)據(jù)使用不同的聚合方法進(jìn)行指標(biāo)融合,從而得到系統(tǒng)評(píng)價(jià)指標(biāo);隨后將系統(tǒng)的效用評(píng)價(jià)函數(shù)帶入干擾樣式博弈模型中,進(jìn)行動(dòng)態(tài)博弈分析;最后得到通信電子戰(zhàn)系統(tǒng)干擾樣式?jīng)Q策。

圖1 通信電子戰(zhàn)干擾樣式選擇的博弈模型示意圖Fig.1 A illustration ofgame model for interference pattern selection of communication EW
如果綜合考慮影響通信電子戰(zhàn)最終決策的所有因素,就需要使用多屬性決策評(píng)價(jià)方法來確定最終的效用評(píng)價(jià)函數(shù),目前解決此類問題的方法有許多種,如灰關(guān)聯(lián)評(píng)估法[9]、模糊綜合評(píng)估法[10]和I2TOPSIS評(píng)估法[11]等。以上方法在評(píng)價(jià)過程中很少同時(shí)考慮攻防雙方對(duì)抗博弈,對(duì)作戰(zhàn)整體情況把握不足,且在指標(biāo)處理時(shí)以線性處理的方法居多,對(duì)非線性指標(biāo)的處理討論較少。本文針對(duì)以上評(píng)價(jià)方法的不足,提出通信電子戰(zhàn)系統(tǒng)作戰(zhàn)效果多指標(biāo)評(píng)價(jià)模型。
2.1.1干擾樣式效用評(píng)價(jià)指標(biāo)體系
指標(biāo)體系結(jié)構(gòu)如圖2所示。指標(biāo)體系主要由系統(tǒng)因素、行動(dòng)因素和主觀因素三部分構(gòu)成,在末端狀態(tài)層共有11個(gè)指標(biāo)。其中,X11與X12兩個(gè)指標(biāo)屬于定量指標(biāo),其余指標(biāo)屬于定性評(píng)價(jià)型指標(biāo)。定性指標(biāo)采取評(píng)語化打分法結(jié)合先驗(yàn)知識(shí)進(jìn)行求解,下面將定量指標(biāo)求解方法進(jìn)行說明。
本文設(shè)定我方使用的通信電子戰(zhàn)干擾信號(hào)樣式有3種,分別為寬帶噪聲干擾(broad band noise, BBN)、部分頻帶噪聲干擾(partial band noise, PBN)和單音干擾(single toner, ST);敵方使用的通信抗干擾樣式有2種,分別為:直接序列擴(kuò)頻通信(direct sequence spread spectrum, DSSS)和跳頻擴(kuò)頻通信(frequency hopping spread spectrum, FHSS)。在我方3種干擾樣式和敵方2種抗干擾樣式的相互作用下的誤碼率求解方法可參見文獻(xiàn)[12—13]。信號(hào)編碼復(fù)雜度指干擾信號(hào)編碼量與敵方通信網(wǎng)絡(luò)信道規(guī)模的關(guān)系,一般在行動(dòng)前進(jìn)行確定,復(fù)雜度不宜過大或過小,由于這一指標(biāo)在實(shí)際作戰(zhàn)行動(dòng)過程中變化不大,本文直接根據(jù)實(shí)例數(shù)據(jù)給出。

圖2 干擾樣式效用評(píng)價(jià)指標(biāo)體系Fig.2 Interference pattern utility evaluation index system
在指標(biāo)評(píng)價(jià)過程中給每個(gè)指標(biāo)的重要性賦予一定的權(quán)重值,最后對(duì)不同性質(zhì)的各個(gè)指標(biāo)進(jìn)行加權(quán)求和就可以得到最終的通信電子戰(zhàn)系統(tǒng)效能評(píng)價(jià)指標(biāo)。
2.1.2評(píng)價(jià)指標(biāo)預(yù)處理方法
其次,對(duì)狀態(tài)層的末端指標(biāo)進(jìn)行數(shù)據(jù)預(yù)處理。設(shè)指標(biāo)歸一化評(píng)語集為{c1,c2,…,cN},其中c1為歸一化評(píng)價(jià)指標(biāo)的最差值,cN為歸一化評(píng)價(jià)指標(biāo)的最優(yōu)值。
在圖2建立的指標(biāo)體系中,由于誤碼率取值一般采用分貝值表示,所以指標(biāo)X11采用對(duì)數(shù)型指標(biāo)歸一化方法進(jìn)行數(shù)據(jù)預(yù)處理。那么,第i個(gè)對(duì)數(shù)型評(píng)價(jià)指標(biāo)歸一化公式為:
(1)
式(1)中,imax、imin為第i個(gè)指標(biāo)的最大最小值。
而通信編碼的復(fù)雜度會(huì)隨著編碼數(shù)量的增加呈指數(shù)性增長(zhǎng),故指標(biāo)X12采用指數(shù)型指標(biāo)歸一化方法進(jìn)行數(shù)據(jù)預(yù)處理。那么,第i個(gè)指數(shù)型評(píng)價(jià)指標(biāo)歸一化公式為:
(2)
式(2)中,α、β為歸一化參數(shù),一般取值為2或3。
對(duì)于定性指標(biāo)的評(píng)分描述,本文采用以下方式。
對(duì)第i個(gè)定性評(píng)價(jià)指標(biāo)的評(píng)語描述為:
G(i)={(ci,χi),i=1,2,…,n}
(3)
式(3)中,χi為第i個(gè)指標(biāo)隸屬于第n個(gè)等級(jí)評(píng)語的可信度概率。則第i個(gè)定性評(píng)價(jià)指標(biāo)的歸一化評(píng)語描述為:
(4)

2.1.3使用改進(jìn)AHP-熵權(quán)法確定指標(biāo)權(quán)重
本文使用的改進(jìn)AHP-熵權(quán)法確定指標(biāo)權(quán)重包括三個(gè)部分,分別為使用改進(jìn)的AHP法確定指標(biāo)權(quán)重、使用熵權(quán)法確定指標(biāo)權(quán)重和使用最小二乘法對(duì)確定好的兩種權(quán)重值進(jìn)行組合優(yōu)化,算法框架如圖3所示。

圖3 干擾樣式效用評(píng)價(jià)指標(biāo)權(quán)重計(jì)算框架Fig.3 Calculation framework of index weight of interference utility assessment
下面對(duì)指標(biāo)權(quán)重的求解方法分別進(jìn)行說明。使用改進(jìn)的AHP法確定指標(biāo)權(quán)重的步驟如下:
1)根據(jù)圖2構(gòu)建的指標(biāo)體系結(jié)構(gòu)確定指標(biāo)層次和每個(gè)層次的指標(biāo)比較序號(hào)。
2)構(gòu)建指標(biāo)層與狀態(tài)層的判斷矩陣B1、B2,計(jì)算方法為:
B=(bij)n×n=bik/bkj
(5)
式(5)中,bij指的是標(biāo)度i指標(biāo)相對(duì)于j指標(biāo)的重要性,計(jì)算方法為:
(6)

3)單層次排序并進(jìn)行一致性檢驗(yàn)。假設(shè)評(píng)價(jià)指標(biāo)體系有k層,一致性指標(biāo)CRk=CIk/RI。其中,RI為隨機(jī)一致性比率,求解方式可參考文獻(xiàn)[9]。CIk=(λmax-n)/n-1,λmax為矩陣最大特征值,若CRk<0.1,滿足本層次的一致性要求,繼續(xù)執(zhí)行;若CRk≥0.1,則轉(zhuǎn)到2)。
4)層次總排序并進(jìn)行一致性檢驗(yàn)。與3)類似,將CR=∑kCI/RI,若CR≥0.1,則轉(zhuǎn)到1)修改層次結(jié)構(gòu)模型和判斷矩陣,若CR<0.1,滿足總層次的一致性要求,輸出最終層次排序uj,即為:
(7)

使用熵權(quán)法確定指標(biāo)權(quán)重的步驟如下:
1)假設(shè)有n個(gè)評(píng)價(jià)目標(biāo),m個(gè)評(píng)價(jià)指標(biāo),將每個(gè)評(píng)價(jià)目標(biāo)的評(píng)價(jià)指標(biāo)數(shù)據(jù)放在一個(gè)矩陣中構(gòu)成矩陣X,表示為:
(8)
2)確定每個(gè)指標(biāo)的熵值。定義第j個(gè)評(píng)價(jià)指標(biāo)的熵值為:
(9)

3)確定每個(gè)指標(biāo)的權(quán)重。第j個(gè)指標(biāo)的權(quán)重計(jì)算公式為:
(10)
使用最小二乘法對(duì)確定好的兩種權(quán)重值進(jìn)行組合優(yōu)化的方法如下:
對(duì)于使用改進(jìn)的AHP法和熵權(quán)法確定的兩種指標(biāo)權(quán)重理應(yīng)相差越小越好,建立式(11)所示的組合權(quán)重的優(yōu)化模型:
(11)
通過拉格朗日乘數(shù)法解得以上模型的解為:
(12)

2.1.4指標(biāo)聚合方法[14]
對(duì)于圖2所示指標(biāo)體系內(nèi)的X13、X23、X24這3個(gè)指標(biāo),當(dāng)其變化時(shí)通信電子戰(zhàn)作戰(zhàn)效果會(huì)隨之產(chǎn)生非線性變化,而其余指標(biāo)值在變化時(shí)上級(jí)指標(biāo)基本呈線性變化。所以,在指標(biāo)融合時(shí),對(duì)于前一種指標(biāo)類型采用加權(quán)平均算子(ordered weighted averaging,OWA) 進(jìn)行融合,后一種指標(biāo)類型采用加權(quán)幾何平均算子(weighted geometric mean,WGM)進(jìn)行融合,聚合方法分別為:
(13)

(14)
在以往的相關(guān)研究中,大部分的電子戰(zhàn)系統(tǒng)的干擾決策是基于干擾反饋得出的[14],并且假設(shè)干擾方采取的是比較固定的干擾方式,對(duì)電子目標(biāo)的干擾順序也是預(yù)先設(shè)定好的。主動(dòng)的干擾樣式的選擇主要根據(jù)干擾行動(dòng)前的預(yù)案實(shí)施,被動(dòng)干擾樣式的選擇則是多通過以往的經(jīng)驗(yàn)綜合判斷得出。此方式得出的電子戰(zhàn)干擾決策主觀性過強(qiáng),隨機(jī)性較大。現(xiàn)代智能化戰(zhàn)爭(zhēng)中,電子戰(zhàn)的雙方博弈行為已經(jīng)不再僅僅是簡(jiǎn)單的利益沖突競(jìng)爭(zhēng)關(guān)系,而是一種動(dòng)態(tài)變化的環(huán)境和策略相結(jié)合的對(duì)抗過程。我方通信電子戰(zhàn)系統(tǒng)對(duì)敵方通信網(wǎng)絡(luò)實(shí)時(shí)偵察,敵方通信網(wǎng)絡(luò)的目標(biāo)信息在我方實(shí)時(shí)掌握的情況下,我方指揮員可進(jìn)行戰(zhàn)術(shù)判斷并采取及時(shí)的干擾措施,而敵方在通信網(wǎng)絡(luò)受到干擾后對(duì)我方使用的是何種干擾方式是未知的,加之雙方的對(duì)抗行動(dòng)也存在先后,那么,敵我雙方的對(duì)抗行動(dòng)可以視為一種不完全信息的動(dòng)態(tài)博弈,攻防雙方會(huì)根據(jù)最大化自身利益的原則來選擇應(yīng)對(duì)策略[15]。
本文建立的通信電子戰(zhàn)系統(tǒng)干擾樣式博弈模型的框架如圖4所示。

圖4 通信電子戰(zhàn)系統(tǒng)干擾樣式博弈模型求解框架圖Fig.4 Frame diagram of game model of jamming pattern in communication EW system
下面對(duì)模型求解步驟進(jìn)行說明。
1) 確定博弈雙方的效用函數(shù)和策略集。基于通信電子戰(zhàn)效能影響因素結(jié)構(gòu),結(jié)合每個(gè)指標(biāo)性質(zhì),構(gòu)建出通信電子戰(zhàn)系統(tǒng)效用值:
(15)
式(15)中,Ω={1,2,5,8,10,11}。以A表示通信方(敵),J表示干擾方(我),設(shè)敵方有p種通信抗干擾策略,我方有q種電子干擾策略,敵我雙方的通信策略集為SA={A1,A2,…,Ap},SJ={J1,J2,…,Jq}。
2) 選定盈利函數(shù)時(shí),由于雙方的零和對(duì)抗性,可以將同一函數(shù)作為雙方的效用函數(shù),唯一的區(qū)別是一方追求的是效用函數(shù)的最大化,而另一方追求的是效用函數(shù)的最小化,其博弈論表達(dá)式如下:
G={SA,SJ,UA,UJ}
(16)
式(16)中,UJ=-UA=U(SA,SJ)。
3) 在m×n種策略的對(duì)抗條件下,對(duì)得到的盈利矩陣使用最小最大優(yōu)化方法[16],在干擾效果最好的情況中選擇最差的情況。在敵我雙方提前未知雙方策略的情況下,敵方盈利滿足:
(17)
我方盈利函數(shù)滿足:
(18)
下面考慮解盈利矩陣的兩種情況:
①若VAi=VJj,對(duì)抗雙方博弈平衡,得到納什均衡解,此時(shí)Ai*,Jj*為對(duì)抗雙方的博弈純策略。
②若VAi≠VJj,對(duì)抗雙方無法取得博弈平衡點(diǎn),雙方會(huì)以概率遍歷所有策略,此時(shí)得到的穩(wěn)定均衡解為對(duì)抗雙方的混合策略的納什均衡解。

(19)
同樣的,根據(jù)先最小后最大原理,當(dāng)且僅當(dāng)敵我雙方的盈利與損失相等時(shí),可得出混合策略下的納什均衡解(X*,Y*),即
(20)

本文仿真背景具體設(shè)置如下:假設(shè)某次電子戰(zhàn)戰(zhàn)術(shù)行動(dòng)中,我方通信電子戰(zhàn)系統(tǒng)對(duì)敵實(shí)施一次戰(zhàn)術(shù)進(jìn)攻,導(dǎo)致敵通信網(wǎng)絡(luò)受到了干擾壓制。敵方通信系統(tǒng)的信號(hào)調(diào)制方式為BPSK(二進(jìn)制相移鍵控),我方通信電子戰(zhàn)系統(tǒng)對(duì)通信網(wǎng)絡(luò)實(shí)施干擾壓制。下文中設(shè)定3個(gè)模擬場(chǎng)景,場(chǎng)景中的通信系統(tǒng)指標(biāo)仿真數(shù)據(jù)使用文獻(xiàn)[17]中的實(shí)際數(shù)據(jù)均值代替,不同場(chǎng)景的指標(biāo)仿真數(shù)據(jù),如表1所示。

表1 3個(gè)不同場(chǎng)景下評(píng)價(jià)指標(biāo)
我方行動(dòng)集為SJ={J1,J2,J3},敵方行動(dòng)集為SA={A1,A2},策略集為{(J1,J1), (J1,J2), (J1,J3), (J2,J1), (J2,J2), (J2,J3), (J3,J1), (J3,J2), (J3,J3)},敵方策略集為{(A1,A1), (A1,A2), (A2,A1), (A2,A2)}。模型的評(píng)語集為{Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ},對(duì)評(píng)語集相應(yīng)評(píng)估范圍進(jìn)行拓展,得到{[0,0.01), [0.01,0.25), [0.25,0.5), [0.5,0.75), [0.75,1]}。
結(jié)合仿真背景使用本文建立模型進(jìn)行算例仿真和結(jié)果驗(yàn)證,步驟如下:
1) 模型數(shù)據(jù)初始化。根據(jù)3.1節(jié)中3個(gè)場(chǎng)景的數(shù)據(jù)結(jié)合表1求解得出不同情況下的誤碼率。雙方的效用值符號(hào)設(shè)置如表2所示。

表2 對(duì)抗雙方效用值矩陣
2) 將仿真背景數(shù)據(jù)中的指標(biāo)X11數(shù)據(jù)進(jìn)行計(jì)算求解,得出3個(gè)場(chǎng)景的結(jié)果為:
根據(jù)干擾樣式效用評(píng)價(jià)指標(biāo)體系,對(duì)3個(gè)場(chǎng)景的數(shù)據(jù)指標(biāo)進(jìn)行計(jì)算融合,將處理后的3個(gè)場(chǎng)景數(shù)據(jù)帶入評(píng)估模型中,即可得到每個(gè)場(chǎng)景總體評(píng)價(jià)效用值。在求解效用值時(shí)分別使用改進(jìn)AHP-熵權(quán)法、改進(jìn)的AHP法和熵權(quán)法將求得權(quán)重直接帶入式(13)—式(15)求解得出的效用值與實(shí)際效用值進(jìn)行比較,在3個(gè)場(chǎng)景中得到的結(jié)果如圖5—圖7所示。

圖5 場(chǎng)景1中使用3種權(quán)重確定方法得出的效用值與實(shí)際效用值Fig.5 The utility value and the actual utility value obtained from scheme 1 using the 3 weight determination methods

圖6 場(chǎng)景2中使用3種權(quán)重確定方法得出的效用值與實(shí)際效用值Fig.6 The utility value and the actual utility value obtained from scheme 2 using the 3 weight determination methods

圖7 場(chǎng)景3中使用3種權(quán)重確定方法得出的效用值與實(shí)際效用值Fig.7 The utility value and the actual utility value obtained from scheme 3 using the 3 weight determination methods
對(duì)以上3個(gè)場(chǎng)景使用3種不同方法求解得出的效用值與實(shí)際效用值的絕對(duì)誤差進(jìn)行比較,結(jié)果如圖8所示。

圖8 3個(gè)場(chǎng)景中3種不同方法得出的效用值與實(shí)際效用值之間的絕對(duì)誤差Fig.8 Effective value of different strategies under fuzzy comprehensive evaluation
可以看出,使用改進(jìn)AHP-熵權(quán)法求得指標(biāo)權(quán)重進(jìn)而求解的效用值與實(shí)際效用值之間的絕對(duì)誤差要小于改進(jìn)AHP法和熵權(quán)法,具有較好的穩(wěn)定性。
3) 求雙方盈利函數(shù)值(U(i,j))2×3。根據(jù)式(1)—式(3)中的求解方法結(jié)合式(15)的指標(biāo)融合方法,結(jié)合步驟2)中求解得出的評(píng)價(jià)指標(biāo)權(quán)重,即可求得3種場(chǎng)景下的敵我雙方對(duì)抗博弈效用值矩陣,結(jié)果如表3所示。
4) 對(duì)抗決策求解。以場(chǎng)景1為例,通過場(chǎng)景的具體參數(shù)和敵我雙方對(duì)抗態(tài)勢(shì),得出通信電子戰(zhàn)干擾樣式對(duì)抗博弈拓?fù)鋱D關(guān)系如圖9所示。

表3 對(duì)抗雙方效用值矩陣

圖9 博弈模型仿真拓?fù)鋱DFig.9 Model simulation topology
具體博弈求解流程如下:
①我方電子戰(zhàn)指揮員首先根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)情報(bào)和預(yù)先方案選定通信電子戰(zhàn)系統(tǒng)內(nèi)的3個(gè)類型的干擾樣式的1種,敵方只能根據(jù)經(jīng)驗(yàn)判斷和先驗(yàn)知識(shí)采取防御措施。
②我方在選定了干擾樣式的類型tk(k=1,2,3)后,對(duì)敵方實(shí)施通信干擾,對(duì)應(yīng)的干擾方式表示為Jj(j=1,2,3)。
③敵方在發(fā)現(xiàn)通信網(wǎng)絡(luò)受到干擾后,即可大致判定出我方干擾方式Jj,依據(jù)貝葉斯法則修正對(duì)我方干擾站類型的概率估計(jì),有p=p(tk|Jj),接著比較自己采取抗干擾行動(dòng)A1、A2時(shí)的期望效用值:
(21)
確定效用值最大的行動(dòng)A*(Jj)。當(dāng)我方策略為(J2,J2)時(shí),則我方的后驗(yàn)概率P{t1|J2}=P{t2|J2}=0.5,敵方觀察后,采取A1時(shí)得出的期望效用值為P{t1|J2}×u(t1,J2,A1)+P{t2|J2}×u(t2,J2,A1)=0.5×(-3.2×10-2-7.5×10-4)=-0.016 4,使用A2時(shí)得出的效用值為P{t1|J2}×u(t1,J2,A2)+P{t2|J2}×u(t2,J2,A2)=0.5×(-1.0×10-1-1.9×10-2)=-0.006,顯然此時(shí)應(yīng)選用A2策略,對(duì)我方來說,效用值為U*=(u(t1,J2,A2),u(t2,J2,A2))=(0.01,0.019)。作為對(duì)比,求解另兩組混合策略(J1,J1),(J3,J3),得到敵方策略應(yīng)為(A2,A2)。
④根據(jù)效益最大化原則,由下式
u(tk,Jj,A*(Jj))(k,j=1,2,3)
(22)
比較即可得出對(duì)我方最有利的干擾方式J*(tk)。將數(shù)據(jù)帶入式(14)中得:
(23)
式(23)中,q1、q2含義解釋見表4中備注的相關(guān)說明。計(jì)算得到的完美貝葉斯納什均衡解為[((J2,J2),(A2,A2)),p=0.5,q1∈[0,1],q2≥0.513]即表示我方通信電子戰(zhàn)指揮員選擇類型1和類型2的干擾站后均會(huì)選擇PBN作為干擾策略,敵方在觀察我方干擾信號(hào)后做出貝葉斯判斷,在我方前后兩次干擾后選擇FHSS抗干擾手段。
同理可得另外2個(gè)場(chǎng)景的博弈結(jié)果,經(jīng)仿真計(jì)算,3個(gè)場(chǎng)景的完美貝葉斯納什均衡解如表4所示。

表4 3個(gè)場(chǎng)景的完美貝葉斯納什均衡解
表4中,P{t1|J2}=p,P{t2|J2}=1-p,P{t1|J1}=q1,P{t2|J1}=1-q1,P{t1|J3}=q2,P{t2|J3}=1-q2。
如本文引言中所述,目前在通信電子戰(zhàn)系統(tǒng)的作戰(zhàn)效果的評(píng)價(jià)研究中,大多數(shù)學(xué)者將誤碼率直接作為整個(gè)系統(tǒng)的效用函數(shù)[18],但在實(shí)際作戰(zhàn)中,戰(zhàn)場(chǎng)環(huán)境的變化、指揮員策略的使用以及通信干擾信號(hào)樣式的動(dòng)態(tài)變化等因素,都會(huì)對(duì)結(jié)果產(chǎn)生影響。以本文仿真條件為背景,考慮3個(gè)場(chǎng)景不同對(duì)抗策略下的通信系統(tǒng)誤碼率隨干信比變化的動(dòng)態(tài)過程,仿真結(jié)果如圖10所示。

圖10 3個(gè)場(chǎng)景下不同對(duì)抗策略下的通信系統(tǒng)誤碼率隨著干信比變化的動(dòng)態(tài)過程Fig.10 The system SER varies with the J/S under different strategies of 3 scenes
可以看出,當(dāng)敵方使用抗干擾通信手段為DSSS時(shí),三個(gè)場(chǎng)景中的誤碼率隨干信比的變化趨勢(shì)基本一致,在我方使用BBN、PBN、ST三種通信干擾方式時(shí)曲線相互位置基本保持不變,且當(dāng)敵我雙方使用DSSS-ST對(duì)抗手段時(shí)誤碼率達(dá)到最高且相對(duì)穩(wěn)定。這與表4中求解的完美貝葉斯納什均衡解[((J3,J1),(A1,A2)),p=0,q1=1,q2=1]保持一致。但是,場(chǎng)景1中當(dāng)敵方使用抗干擾通信樣式為FHSS,我方使用BBN、PBN、ST三種不同的通信干擾方式時(shí),誤碼率曲線并不一直處于相同大小關(guān)系的狀態(tài),在圖10(d)中的Q1、Q2點(diǎn)左側(cè),使用FHSS-PBN對(duì)抗方式時(shí)的作戰(zhàn)效果要始終優(yōu)于使用FHSS-BBN對(duì)抗方式,而在Q1、Q2點(diǎn)右側(cè),雙方使用FHSS-PBN對(duì)抗方式時(shí)的作戰(zhàn)效果要始終劣于雙方使用FHSS-BBN對(duì)抗方式。此時(shí)就需要電子戰(zhàn)指揮員結(jié)合實(shí)際情況實(shí)施強(qiáng)力的戰(zhàn)場(chǎng)干預(yù),使博弈中的效用值函數(shù)始終處于利于我方的均衡狀態(tài)。這也證明了僅僅使用誤碼率當(dāng)做通信系統(tǒng)或通信電子戰(zhàn)系統(tǒng)的效用值函數(shù)是不妥的,應(yīng)采用本文建立的博弈模型進(jìn)行預(yù)測(cè)求解。
本文提出了通信電子戰(zhàn)干擾樣式選擇的博弈決策模型。該模型在充分考慮實(shí)際作戰(zhàn)中通信電子戰(zhàn)的作戰(zhàn)雙方所面臨實(shí)際情景的基礎(chǔ)上,建立了綜合考慮通信電子戰(zhàn)系統(tǒng)因素、作戰(zhàn)行動(dòng)因素和指揮員主觀因素的通信干擾樣式?jīng)Q策評(píng)價(jià)指標(biāo)體系,通過作戰(zhàn)雙方的不完全信息的動(dòng)態(tài)博弈解決了通信電子戰(zhàn)行動(dòng)決策中的干擾樣式選擇問題。仿真實(shí)驗(yàn)結(jié)果表明,本文建立模型的效用函數(shù)比僅使用誤碼率作為效用函數(shù)更加符合實(shí)際要求,可以在對(duì)方?jīng)Q策信息未知的情況下對(duì)整個(gè)對(duì)抗過程進(jìn)行預(yù)判分析,選擇對(duì)自身效用最大的決策,對(duì)決策者的策略選擇具有指導(dǎo)性價(jià)值。