王明陽(yáng) 劉旭旭 李裕霖 李溯琪* 王佰錄
①(西南電子技術(shù)研究所 成都 610036)
②(重慶大學(xué)微電子與通信工程學(xué)院 重慶 400044)
在諸多的軍事和民用領(lǐng)域都存在對(duì)手目標(biāo)蓄意入侵我方重要區(qū)域從事惡意傷害活動(dòng)的場(chǎng)景。典型例子包括計(jì)算機(jī)網(wǎng)絡(luò)黑客入侵[1]、銀行系統(tǒng)遭到惡意攻擊以及軍事戰(zhàn)場(chǎng)敵我對(duì)抗[2]等。針對(duì)此類(lèi)場(chǎng)景,依據(jù)場(chǎng)景中部署的傳感器采集測(cè)量數(shù)據(jù),評(píng)估和預(yù)測(cè)對(duì)手目標(biāo)的一系列行動(dòng)對(duì)我方資產(chǎn)造成的潛在傷害和損失[3,4]具有重要意義,評(píng)估資產(chǎn)的預(yù)期損傷,可有效地輔助我方下一步行動(dòng)規(guī)劃,提升重要資產(chǎn)和要害部位的生存率[5,6]。針對(duì)傷害或影響評(píng)估問(wèn)題,國(guó)內(nèi)外學(xué)者已開(kāi)展相關(guān)研究,在不同場(chǎng)景下構(gòu)建了多個(gè)期望傷害模型,白俄羅斯Tuzlukov[7]提出了風(fēng)險(xiǎn)轉(zhuǎn)移模型,新西蘭Bolderheij等人[8]提出運(yùn)營(yíng)風(fēng)險(xiǎn)模型,以及瑞典Johansson[9]則提出生存價(jià)值模型。然而,一方面,這些模型主要是離線(xiàn)評(píng)估的方法,難以實(shí)現(xiàn)對(duì)手目標(biāo)動(dòng)態(tài)變化過(guò)程中期望傷害的動(dòng)態(tài)評(píng)估和預(yù)測(cè),因此不適用于瞬息萬(wàn)變的博弈對(duì)抗場(chǎng)景。另外,還有一些學(xué)者,在軍事戰(zhàn)場(chǎng)場(chǎng)景下,針對(duì)優(yōu)化我方資源配置問(wèn)題,研究了武器庫(kù)與攻擊目標(biāo)的最優(yōu)匹配方法[9]。
近年來(lái),英國(guó)利物浦大學(xué)Narykov等人[10]提出了對(duì)手風(fēng)險(xiǎn)(Adversarial Risk,AR)的概念,其定義是一組從事惡意傷害活動(dòng)的對(duì)手目標(biāo)對(duì)我方重要資產(chǎn)造成的期望傷害。相對(duì)于常見(jiàn)的傷害模型[8,11,12],Narykov提出的對(duì)手風(fēng)險(xiǎn)模型更加完備,主要考慮了殺傷力無(wú)限和殺傷力有限兩種情形。實(shí)際中,入侵的對(duì)手目標(biāo)可造成的傷害具有不確定性。這種不確定性的一方面來(lái)源于成功打擊與否的隨機(jī)性,相應(yīng)的打擊概率受到目標(biāo)與資產(chǎn)的幾何位置關(guān)系、目標(biāo)自身的殺傷范圍、殺傷力等因素影響。另一方面,入侵的對(duì)手目標(biāo)從遠(yuǎn)方來(lái)襲的過(guò)程中,目標(biāo)數(shù)量、運(yùn)動(dòng)狀態(tài)(位置、速度、加速度等)時(shí)變未知[13],也是導(dǎo)致潛在傷害具有不確定性的重要原因。然而,對(duì)手風(fēng)險(xiǎn)模型僅建模了給定運(yùn)動(dòng)狀態(tài)的多目標(biāo)對(duì)于某高價(jià)值資產(chǎn)造成的期望傷害。因此,要實(shí)現(xiàn)目標(biāo)動(dòng)態(tài)變化過(guò)程中潛在傷害的在線(xiàn)評(píng)估,一種可行的方法是借助多目標(biāo)跟蹤器,先對(duì)多目標(biāo)狀態(tài)后驗(yàn)分布進(jìn)行實(shí)時(shí)估計(jì)。
隨機(jī)集統(tǒng)計(jì)理論(Finite Set Statistics,FISST)[14]的研究始于1994年。與傳統(tǒng)向量統(tǒng)計(jì)理論不同,隨機(jī)集理論將量測(cè)強(qiáng)不確定性和目標(biāo)維度未知時(shí)變特性建模在點(diǎn)過(guò)程理論框架下,為多目標(biāo)跟蹤問(wèn)題提供了統(tǒng)一最優(yōu)貝葉斯濾波框架。隨機(jī)集形式的多目標(biāo)后驗(yàn)分布可同時(shí)描述目標(biāo)數(shù)量、各目標(biāo)狀態(tài)的隨機(jī)性以及目標(biāo)間的統(tǒng)計(jì)相關(guān)性,特別適合于評(píng)估統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)。借助隨機(jī)集多目標(biāo)跟蹤器,迭代地計(jì)算每個(gè)時(shí)刻的多目標(biāo)后驗(yàn)分布,進(jìn)一步結(jié)合對(duì)手風(fēng)險(xiǎn)模型,即可對(duì)統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)進(jìn)行在線(xiàn)評(píng)估。針對(duì)任意隨機(jī)集分布,文獻(xiàn)[10]推導(dǎo)了對(duì)手風(fēng)險(xiǎn)的最優(yōu)均方誤差估計(jì)(及其方差)的表達(dá)式,但是涉及關(guān)于點(diǎn)過(guò)程強(qiáng)度函數(shù)和二階統(tǒng)計(jì)矩的積分,無(wú)法直接實(shí)現(xiàn)。因此,結(jié)合Poisson點(diǎn)過(guò)程,文獻(xiàn)[10]進(jìn)一步給出了對(duì)手風(fēng)險(xiǎn)的最優(yōu)均方誤差估計(jì)(及其方差)的計(jì)算公式,并基于概率假設(shè)密度 (Probability Hypotheses Density,PHD) 跟蹤器實(shí)現(xiàn)了對(duì)手風(fēng)險(xiǎn)的在線(xiàn)評(píng)估。
現(xiàn)有基于隨機(jī)集理論的多目標(biāo)跟蹤算法主要分為兩類(lèi),一類(lèi)是非標(biāo)簽隨機(jī)集跟蹤器,包括伯努利(Bernoulli)跟蹤器[15]、PHD[16]/基數(shù)均衡化概率假設(shè)密度(Cardinality Balanced Probability Hypotheses Density,CPHD)跟蹤器[17]、多伯努利(Multi-Bernoulli,MB)跟蹤器[18,19]等;另一類(lèi)是標(biāo)簽隨機(jī)集跟蹤器,如廣義標(biāo)簽多伯努利(Generalized Labeled Multi-Bernoulli,GLMB)跟蹤器[20-22],標(biāo)簽多伯努利(LMB) 跟蹤器[23-30]等。與PHD濾波器相比,LMB跟蹤器的優(yōu)勢(shì)體現(xiàn)在兩個(gè)方面:(1)LMB跟蹤器具備區(qū)別目標(biāo)身份和建立目標(biāo)航跡能力;(2)LMB跟蹤器跟蹤性能逼近最優(yōu)貝葉斯跟蹤器的閉合解GLMB跟蹤器,尤其在低檢測(cè)概率和高雜波率場(chǎng)景下,性能遠(yuǎn)優(yōu)于PHD濾波器。
因此,本文在隨機(jī)集理論框架下基于LMB跟蹤器研究對(duì)手風(fēng)險(xiǎn)在線(xiàn)評(píng)估問(wèn)題,主要貢獻(xiàn)如下:
(1) 基于對(duì)手風(fēng)險(xiǎn)加性模型和乘性模型,分別推導(dǎo)了LMB分布的統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)最小均方誤差估計(jì)表達(dá)式。結(jié)合LMB跟蹤器,提出了一種基于LMB跟蹤器的統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)在線(xiàn)評(píng)估方法。
(2) 對(duì)手風(fēng)險(xiǎn)最小均方誤差估計(jì)涉及非線(xiàn)性函數(shù)的積分,因此沒(méi)有閉合解。針對(duì)該問(wèn)題,本文結(jié)合混合高斯近似和重要性抽樣近似方法,提出一種對(duì)手風(fēng)險(xiǎn)最小均方誤差估計(jì)的數(shù)值計(jì)算方法。
最后,模擬一組對(duì)手目標(biāo)惡意入侵重要區(qū)域的場(chǎng)景,基于場(chǎng)景中監(jiān)視雷達(dá)數(shù)據(jù),驗(yàn)證了提出的對(duì)手風(fēng)險(xiǎn)評(píng)估方法的性能優(yōu)勢(shì)。
對(duì)手風(fēng)險(xiǎn)[10,12]是指一組從事惡意傷害活動(dòng)的對(duì)手目標(biāo)對(duì)我方重要資產(chǎn)造成的期望傷害。對(duì)手風(fēng)險(xiǎn)大小可以由目標(biāo)打擊概率和目標(biāo)殺傷力共同描述。以軍事敵我對(duì)抗為例,目標(biāo)的殺傷力一般指入侵的對(duì)手目標(biāo)對(duì)于我方武器裝備平臺(tái)、重要港口城市、油田等重要資產(chǎn)的破壞程度。目標(biāo)打擊概率一般指對(duì)手目標(biāo)成功打擊我方重要資產(chǎn)的概率。
2.1節(jié)與2.2節(jié)根據(jù)對(duì)手目標(biāo)殺傷力差異,建模了多目標(biāo)對(duì)手風(fēng)險(xiǎn)加性模型、乘性模型;2.3節(jié)基于對(duì)手目標(biāo)打擊能力和打擊意圖,從兩個(gè)維度精細(xì)化建立目標(biāo)打擊概率模型。
假設(shè)場(chǎng)景中存在n ∈N 個(gè)對(duì)手目標(biāo),其動(dòng)力學(xué)狀態(tài)由序列x1:n ∈Xn表示。依據(jù)對(duì)手目標(biāo)對(duì)于資產(chǎn)的殺傷力強(qiáng)弱,可將多目標(biāo)打擊資產(chǎn)的方式劃分成兩類(lèi):(1)傷害疊加型;(2)一發(fā)擊穿型。相應(yīng)地,本節(jié)構(gòu)建了兩種類(lèi)型的多目標(biāo)對(duì)手風(fēng)險(xiǎn)模型。
假設(shè)一組對(duì)手目標(biāo)x1:n對(duì)我方資產(chǎn)A進(jìn)行打擊,其中,資產(chǎn)A的價(jià)值總值記為VA,目標(biāo)xi對(duì)我方資產(chǎn)A的傷害值為dA(xi),i=1,2,...,n。若多對(duì)手目標(biāo)x1:n對(duì)資產(chǎn)A造成的傷害即目標(biāo)殺傷力較弱,不足以直接消滅我方資產(chǎn),那么多個(gè)對(duì)手目標(biāo)對(duì)資產(chǎn)造成的傷害可呈現(xiàn)疊加的形式,即資產(chǎn)受到總期望傷害為多目標(biāo)期望傷害之和:
式(1)被稱(chēng)為加性對(duì)手風(fēng)險(xiǎn)模型[31-33],用符號(hào)來(lái)表示,簡(jiǎn)稱(chēng)模型。
與2.1節(jié)類(lèi)似,假設(shè)一組對(duì)手目標(biāo)x1:n對(duì)我方資產(chǎn)進(jìn)行打擊,其中,目標(biāo)i對(duì)我方資產(chǎn)A的傷害值為dA(xi),i=1,2,...,n。若目標(biāo)xi對(duì)資產(chǎn)A造成傷害為?dA(xi)≥VA,?i=1,2,...,n即目標(biāo)打擊傷害能力較強(qiáng),可以理解為對(duì)手目標(biāo)能夠一發(fā)擊穿我方目標(biāo),則多目標(biāo)中任意目標(biāo)擊中資產(chǎn)均可視為成功打擊。相應(yīng)地,多目標(biāo)成功打擊資產(chǎn)的概率可表示為[34]
因此,資產(chǎn)受到的總期望傷害可由式(3)計(jì)算:
觀察式(1)和式(3),無(wú)論是加性模型還是乘性模型,成功打擊概率τA(xi)都是對(duì)手風(fēng)險(xiǎn)的核心參數(shù)。本文主要考慮對(duì)手目標(biāo)的典型特征包括打擊能力和打擊意圖[35,36],其中將打擊能力建模為對(duì)手目標(biāo)與我方資產(chǎn)的距離函數(shù),而打擊意圖則與對(duì)手目標(biāo)的打擊角度具有強(qiáng)相關(guān)性。具體而言,建立打擊概率的模型如下:
其中,cA(x):X→[0,1]表征對(duì)手目標(biāo)打擊能力,主要由入侵的對(duì)手目標(biāo)與資產(chǎn)的幾何位置關(guān)系決定,因此構(gòu)建如下模型[37-39]:
其中,br表示對(duì)手目標(biāo)潛在打擊范圍,r(x,xA):X×X→R+表示對(duì)手目標(biāo)位置x與資產(chǎn)A位置xA之間的距離;iA:X→[0,1]表征目標(biāo)的打擊意圖,主要由目標(biāo)的速度方向決定,因此構(gòu)建如下模型[40]:
其中,θ:X×X→[0,π]表示目標(biāo)的打擊角度,即目標(biāo)速度方向和目標(biāo)與資產(chǎn)連線(xiàn)的夾角,如圖1所示,bθ為角度靈敏度參數(shù)。此外,建模目標(biāo)打擊概率還可考慮目標(biāo)的速度、高度等更多維度信息[41,42]。

圖1 對(duì)手目標(biāo)打擊我方資產(chǎn)場(chǎng)景示意圖Fig.1 A schematic diagram of the scenario where the opponent’s targets attack own assets
基于LMB (Labeled Multi-Bernoulli)跟蹤器的對(duì)手風(fēng)險(xiǎn)動(dòng)態(tài)評(píng)估是根據(jù)場(chǎng)景中多個(gè)對(duì)手目標(biāo)的實(shí)時(shí)觀測(cè)數(shù)據(jù),借助LMB跟蹤器,序貫地對(duì)場(chǎng)景中任意位置(尤其是重要資產(chǎn)位置)的對(duì)手風(fēng)險(xiǎn)進(jìn)行在線(xiàn)評(píng)估。
3.1 節(jié)構(gòu)建了隨機(jī)點(diǎn)過(guò)程下的統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)模型,并基于最小均方誤差原則在線(xiàn)評(píng)估對(duì)手風(fēng)險(xiǎn);3.2節(jié)基于多目標(biāo)對(duì)手風(fēng)險(xiǎn)模型,依據(jù)隨機(jī)有限集(Random Finite Set,RFS) 多目標(biāo)后驗(yàn)分布特征,推導(dǎo)對(duì)手風(fēng)險(xiǎn)分布最小均方誤差估計(jì)的表達(dá)式,并提出基于重要性抽樣的數(shù)值計(jì)算方法。
在實(shí)際場(chǎng)景中,對(duì)手目標(biāo)狀態(tài)動(dòng)態(tài)變化,且目標(biāo)個(gè)數(shù)時(shí)變未知,因此多入侵目標(biāo)的對(duì)手風(fēng)險(xiǎn)存在強(qiáng)不確定性,難以直接計(jì)算?;谟邢藜y(tǒng)計(jì)理論,可把數(shù)量和動(dòng)力學(xué)狀態(tài)未知時(shí)變的多目標(biāo)建模為RFS(或隨機(jī)點(diǎn)過(guò)程)的形式,同時(shí)為多目標(biāo)跟蹤問(wèn)題提供了統(tǒng)一最優(yōu)貝葉斯濾波框架。本節(jié)通過(guò)RFS建模多對(duì)手目標(biāo)狀態(tài),構(gòu)建基于RFS的統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)模型,然后在最小均方誤差準(zhǔn)則下計(jì)算對(duì)手風(fēng)險(xiǎn)的最優(yōu)估計(jì)。
首先,構(gòu)造隨機(jī)點(diǎn)過(guò)程Φ的統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)如下:
其中,°表示函數(shù)合成運(yùn)算算子,X={x1,x2,...,xn}表示多目標(biāo)狀態(tài)集合,n表示目標(biāo)個(gè)數(shù)(隨機(jī)變量)。
從數(shù)學(xué)上講,統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)RΦ(X)∈R 是隨機(jī)點(diǎn)過(guò)程Φ的隨機(jī)變量函數(shù)。若Φ的概率分布已知,則可利用概率論數(shù)學(xué)工具,分析RΦ(X)的統(tǒng)計(jì)特性。具體而言,RΦ(X)的一階統(tǒng)計(jì)矩可表示為
其中,vΦ(x) 表示隨機(jī)過(guò)程Φ的強(qiáng)度函數(shù)[14]。
其中,GΦ[·] 表示隨機(jī)過(guò)程Φ的概率生成泛函(Probability-Generating Functionals,p.g.fl.s)[14]。
在LMB跟蹤器框架下,每時(shí)刻多目標(biāo)后驗(yàn)分布是LMB分布的形式。結(jié)合加性模型和乘性模型,本節(jié)在式(9)和式(10)的基礎(chǔ)上進(jìn)一步推導(dǎo)LMB分布下對(duì)手風(fēng)險(xiǎn)最小均方誤差估計(jì)的表達(dá)式。
3.2.1 加性模型
其中
將式(13)代入式(9)得
利用式(12),LMB分布的對(duì)手風(fēng)險(xiǎn)最小均方誤差估計(jì)可進(jìn)一步化簡(jiǎn)為式(11),定理得證。
3.2.2 乘性模型
定理2:給定k時(shí)刻LMB后驗(yàn)分布π(·|Z)=其中r(?)和p(?)(·|Z)由式(A-11)和式(A-12)給出?;趯?duì)手風(fēng)險(xiǎn)模型(式(3)),k時(shí)刻對(duì)手風(fēng)險(xiǎn)最小均方誤差估計(jì)為
定理2證明:根據(jù)文獻(xiàn)[10],對(duì)手風(fēng)險(xiǎn)模型下,對(duì)于隨機(jī)過(guò)程Φ,其對(duì)應(yīng)的對(duì)手風(fēng)險(xiǎn)最小均方誤差可表示為
由文獻(xiàn)[14]可知,k時(shí)刻LMB后驗(yàn)分布的p.g.fl.s.可表示為
將式(17)代入式(16),可得
進(jìn)一步地,將LMB跟蹤器后驗(yàn)參數(shù)r(?)和p(?)(x)的表達(dá)式(式(A-11)、式(A-12))代入式(18),式(15)得證。
3.2.3 對(duì)手風(fēng)險(xiǎn)估計(jì)的數(shù)值計(jì)算方法
混合高斯近似方法是LMB濾波器最常見(jiàn)的實(shí)現(xiàn)方式[23]。本節(jié)基于混合高斯實(shí)現(xiàn),進(jìn)一步研究了對(duì)手風(fēng)險(xiǎn)估計(jì)的數(shù)值計(jì)算方法。假設(shè)LMB后驗(yàn)分布中參數(shù)p(θ)(·)是混合高斯的形式,即
(1) 加性模型
回顧2.3節(jié)中打擊概率模型τA(x)(如式(4)所示),顯然cA(x)和iA(x)均為非線(xiàn)性函數(shù),因此泛函F(θ)[dAτA]無(wú)解析解。為此,本文提出一種基于重要性抽樣的數(shù)值計(jì)算方法。具體計(jì)算方法如下:
對(duì)于任意高斯分量j=1,2,...,J,進(jìn)行NP的抽樣,即
利用所獲得的NP個(gè)樣本近似計(jì)算F(θ)[dAτA],可得
最后,將式(22)代入式(11)可得
(2) 乘性模型
然后將式(25)代入式(15),可得
圖2給出了基于LMB跟蹤器的對(duì)手風(fēng)險(xiǎn)評(píng)估算法的整體流程。如圖2所示,提出的算法主要包含LMB跟蹤器模塊和對(duì)手風(fēng)險(xiǎn)評(píng)估模塊,其中LMB跟蹤器模塊主要包含航跡預(yù)測(cè)和航跡更新;對(duì)手風(fēng)險(xiǎn)評(píng)估模塊主要包含打擊概率計(jì)算和對(duì)手風(fēng)險(xiǎn)的最小均方誤差估計(jì)。

圖2 對(duì)手風(fēng)險(xiǎn)評(píng)估算法整體流程圖Fig.2 Overall flow chart of adversarial risk assessment algorithm
與基于PHD跟蹤器的對(duì)手風(fēng)險(xiǎn)評(píng)估算法[10]相比,尤其在強(qiáng)雜波探測(cè)環(huán)境/低檢測(cè)概率等復(fù)雜場(chǎng)景下,基于LMB跟蹤器的對(duì)手風(fēng)險(xiǎn)評(píng)估結(jié)果更加準(zhǔn)確且魯棒性更強(qiáng)。
本節(jié)模擬敵方目標(biāo)突防攻擊我方雷達(dá)陣地的場(chǎng)景,設(shè)計(jì)仿真實(shí)驗(yàn),對(duì)基于LMB跟蹤器的對(duì)手風(fēng)險(xiǎn)(AR)評(píng)估算法(簡(jiǎn)稱(chēng)LMB-AR算法)進(jìn)行性能評(píng)估。算法性能評(píng)估以基于PHD跟蹤器的對(duì)手風(fēng)險(xiǎn)評(píng)估算法(簡(jiǎn)稱(chēng)PHD-AR算法)作為性能標(biāo)桿。
考慮低空監(jiān)視雷達(dá)工作場(chǎng)景,觀測(cè)總時(shí)間360 s。雷達(dá)坐標(biāo)監(jiān)視區(qū)域范圍[-35,35]×[0,100]×[0,7]km,數(shù)據(jù)周期T=1 s。場(chǎng)景包含5個(gè)運(yùn)動(dòng)目標(biāo),運(yùn)動(dòng)軌跡如圖3所示,各目標(biāo)參數(shù)由表1給出。

表1 不同目標(biāo)的出生時(shí)刻和死亡時(shí)刻Tab.1 The birth and death moments of different targets

圖3 雷達(dá)監(jiān)視場(chǎng)景-3D視圖多目標(biāo)真實(shí)運(yùn)動(dòng)軌跡Fig.3 Radar surveillance scene-3D view multi-target real movement trajectory
資產(chǎn)位置設(shè)置如下:資產(chǎn)S1位置(x1,y1,z1)=(-28050,0,0)m,資產(chǎn)S2位置(x2,y2,z2)=(9500,5500,45)m,資產(chǎn)S3位置 (x3,y3,z3)=(23900,3000,35)m。目標(biāo)傷害值假設(shè)恒定,即dA=100,潛在打擊范圍br=15000 m,角度靈敏參數(shù)bθ=50°。
單目標(biāo)狀態(tài)轉(zhuǎn)移模型假設(shè)為線(xiàn)性高斯模型,
其中,轉(zhuǎn)移矩陣F和過(guò)程噪聲強(qiáng)度協(xié)方差矩陣Q分別為
其中,
0n和 0m×n分別表示n×n維度和m×n維度的零矩陣;σν=5 m/s2表示過(guò)程噪聲標(biāo)準(zhǔn)差。
考慮雷達(dá)量測(cè)zk=[r φ φ]T,其中r,φ,φ分別表示目標(biāo)位置的徑向距離、方位角、俯仰角,則單目標(biāo)似然函數(shù)為非線(xiàn)性高斯模型:
其中,量測(cè)函數(shù)H(·)和量測(cè)噪聲協(xié)方差矩陣R分別為
這里σr=30 m,σφ=0.5°,σφ=0.5°分別表示斜距、方位角和俯仰角的標(biāo)準(zhǔn)差;arctan(·)表示反正切函數(shù)。目標(biāo)繼續(xù)生存概率PS=0.98,每個(gè)目標(biāo)的檢測(cè)概率為PD,雜波分布是參數(shù)為λc的泊松過(guò)程。
PHD和LMB濾波器均采用混合高斯(GM)實(shí)現(xiàn)方法。各算法GM實(shí)現(xiàn)的參數(shù)選擇如下:伯努利分量的截?cái)嚅T(mén)限為γt=10-4;GM實(shí)現(xiàn)的高斯分量截?cái)嚅T(mén)限與合并門(mén)限分別為γp=10-5和γm=4;高斯分量的最大個(gè)數(shù)限制為Nmax=10。對(duì)手風(fēng)險(xiǎn)評(píng)估的數(shù)值近似方法中,粒子數(shù)NP取10。
采用RMSE進(jìn)行對(duì)手風(fēng)險(xiǎn)估計(jì)誤差評(píng)估,所有統(tǒng)計(jì)性能結(jié)果均是100次蒙特卡羅(Monte Carlo,MC)實(shí)驗(yàn)的平均結(jié)果。真實(shí)對(duì)手風(fēng)險(xiǎn)計(jì)算方法為:將真實(shí)目標(biāo)狀態(tài)分別代入式(1)和式(3)得到真實(shí)的對(duì)手風(fēng)險(xiǎn)R,利用評(píng)估算法計(jì)算第n次實(shí)驗(yàn)的對(duì)手風(fēng)險(xiǎn)估計(jì)值則對(duì)手風(fēng)險(xiǎn)的RMSE計(jì)算如下
其中,N表示總實(shí)驗(yàn)次數(shù)。

圖4 雜波率 λc=25,檢測(cè)概率 PD=0.8下,資產(chǎn)1的PHD-AR算法和LMB-AR算法的對(duì)手風(fēng)險(xiǎn)估計(jì)值隨時(shí)間變化的曲線(xiàn)Fig.4 Curves of the counterparty risk estimates of asset 1’s PHD-AR algorithm and LMB-AR algorithm changing over time under the clutter rate λc=25 and detection probabilityPD=0.8

圖5 LMB-AR算法的全場(chǎng)景對(duì)手風(fēng)險(xiǎn)估計(jì)熱力圖Fig.5 Heat map of full-scenario opponent risk estimation of LMB-AR algorithm
圖4(a),圖4(b)表明,加性模型下目標(biāo)對(duì)手風(fēng)險(xiǎn)呈疊加型,乘性模型下目標(biāo)的對(duì)手風(fēng)險(xiǎn)峰值與資產(chǎn)的價(jià)值相當(dāng),驗(yàn)證了算法的有效性。且與PHD-AR評(píng)估算法相比,本文所提出的LMB-AR評(píng)估算法,更加接近真實(shí)的對(duì)手風(fēng)險(xiǎn)評(píng)估結(jié)果。PHD-AR評(píng)估算法結(jié)果與真實(shí)結(jié)果的偏差隨時(shí)間推移而增大。開(kāi)始階段,目標(biāo)距離資產(chǎn)較遠(yuǎn),對(duì)手風(fēng)險(xiǎn)小,差異不明顯。目標(biāo)靠近時(shí),對(duì)資產(chǎn)威脅增大,對(duì)手風(fēng)險(xiǎn)增加,差異變得顯著。而文本所提出的LMB-AR評(píng)估算法并未出現(xiàn)上述情況,在對(duì)手風(fēng)險(xiǎn)較大階段,LMBAR評(píng)估算法仍能得到較好的評(píng)估結(jié)果。此外,從圖4(a),圖4(b)中可以看出,在某些時(shí)刻,PHDAR算法輸出的對(duì)手風(fēng)險(xiǎn)評(píng)估結(jié)果急劇下降,評(píng)估結(jié)果出現(xiàn)跳變,該結(jié)果是由PHD跟蹤器漏跟造成的。另一方面,LMB-AR評(píng)估算法輸出結(jié)果在整個(gè)時(shí)間段內(nèi)連續(xù)穩(wěn)定且緊跟真實(shí)的對(duì)手風(fēng)險(xiǎn)評(píng)估結(jié)果。
圖5(a),圖5(b)表明LMB-AR算法在實(shí)時(shí)估計(jì)全場(chǎng)景的對(duì)手風(fēng)險(xiǎn)時(shí)同樣有效,可以實(shí)時(shí)反映戰(zhàn)場(chǎng)態(tài)勢(shì),具有重要意義。
實(shí)驗(yàn)1:相同雜波率,不同檢測(cè)概率下算法性能比對(duì)。

表2 雜波率 λc=25,不同檢測(cè)概率下,加性模型PHD-AR算法和LMB-AR算法資產(chǎn)1對(duì)手風(fēng)險(xiǎn)估值的平均RMSE比較Tab.2 Comparison of average RMSE of asset 1 counterparty risk valuation of additive model PHD-AR algorithm and LMBAR algorithm under fixed clutter rate λc=25 and different detection probabilities

表3 雜波率 λc=25,不同檢測(cè)概率下,乘性模型PHD-AR算法和LMB-AR算法資產(chǎn)1對(duì)手風(fēng)險(xiǎn)估值的平均RMSE比較Tab.3 Comparison of average RMSE of asset 1 counterparty risk valuation of multiplicative model PHD-AR algorithm and LMB-AR algorithm under fixed clutter rate λc=25 and different detection probabilities

圖6 固定雜波率 λc=25,不同檢測(cè)概率下,資產(chǎn)1的PHD-AR和LMB-AR的對(duì)手風(fēng)險(xiǎn)估計(jì)RMSE隨時(shí)間變化的曲線(xiàn)Fig.6 Curve of counterparty risk estimate RMSE of asset 1’s PHD-AR and LMB-AR changing over time under fixed clutter rate λc=25 and different detection probabilities
實(shí)驗(yàn)2:相同檢測(cè)概率,不同雜波率下算法性能比對(duì)。

表4 檢測(cè)概率 PD=0.90,不同雜波率下,加性模型PHD-AR算法和LMB-AR算法資產(chǎn)1對(duì)手風(fēng)險(xiǎn)估值的平均RMSE比較Tab.4 Comparison of average RMSE of asset 1 counterparty risk valuation of additive model PHD-AR algorithm and LMB-AR algorithm under detection probabilityPD=0.90 and different clutter rates

表5 檢測(cè)概率 PD=0.90,不同雜波率下,乘性模型PHD-AR算法和LMB-AR算法資產(chǎn)1對(duì)手風(fēng)險(xiǎn)估值的平均RMSE比較Tab.5 Comparison of average RMSE of asset 1 counterparty risk valuation of multiplicative model PHD-AR algorithm and LMB-AR algorithm under detection probability PD=0.90 and different clutter rates

圖7 檢測(cè)概率 PD=0.90,不同雜波率下,資產(chǎn)1的PHD-AR和LMB-AR的對(duì)手風(fēng)險(xiǎn)估計(jì)RMSE隨時(shí)間變化的曲線(xiàn)Fig.7 Curve of the counterparty risk estimate RMSE of asset 1’s PHD-AR and LMB-AR changing over time under detection probability PD=0.90 and different clutter rates
結(jié)果分析:LMB-AR算法相較于PHD-AR算法無(wú)論是單次實(shí)驗(yàn)結(jié)果或是平均RMSE結(jié)果均有較大的性能提升。該得益主要源于兩個(gè)方面:
(1) LMB分布的自由度更高,統(tǒng)計(jì)風(fēng)險(xiǎn)模型更準(zhǔn)確。PHD-AR算法中,多目標(biāo)狀態(tài)的統(tǒng)計(jì)特性是由Poisson過(guò)程描述的,假設(shè)目標(biāo)數(shù)目服從Poisson分布且多目標(biāo)獨(dú)立同分布,假設(shè)較局限。而LMB-AR算法中,多目標(biāo)狀態(tài)后驗(yàn)服從LMB分布,目標(biāo)數(shù)量分布的自由度更高,且放松了多目標(biāo)獨(dú)立分布的假設(shè)。
(2) LMB濾波器性能更優(yōu)。相比于PHD濾波器,多目標(biāo)狀態(tài)估計(jì)更加準(zhǔn)確,因此相應(yīng)地,統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)作為多目標(biāo)狀態(tài)的隨機(jī)變量函數(shù),其統(tǒng)計(jì)矩(最小均方誤差估計(jì))更加準(zhǔn)確。
在諸多軍事和民用領(lǐng)域都涉及對(duì)手目標(biāo)試圖入侵我方重要區(qū)域從事惡意傷害活動(dòng)的場(chǎng)景,而評(píng)估入侵目標(biāo)對(duì)我方重要資產(chǎn)的期望傷害具有重要的實(shí)際意義。本文在隨機(jī)集理論框架下基于標(biāo)簽多伯努利(LMB)跟蹤器研究對(duì)手風(fēng)險(xiǎn)在線(xiàn)評(píng)估方法。首先,在LMB跟蹤器的框架下,基于加性傷害模型和乘性傷害模型,分別推導(dǎo)了統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)最小均方誤差(Minimum Mean Squared Error,MMSE)估計(jì)的表達(dá)式。其次,針對(duì)所涉及的非線(xiàn)性函數(shù)積分問(wèn)題,結(jié)合混合高斯近似和抽樣近似方法,提出統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)最小均方誤差估計(jì)的數(shù)值計(jì)算方法;最后,將統(tǒng)計(jì)對(duì)手風(fēng)險(xiǎn)評(píng)估方法與LMB跟蹤器的迭代過(guò)程有機(jī)結(jié)合,可實(shí)現(xiàn)入侵多目標(biāo)對(duì)我方重要資產(chǎn)期望損失的動(dòng)態(tài)在線(xiàn)評(píng)估。模擬多個(gè)具有殺傷能力的目標(biāo)攻擊雷達(dá)陣地的場(chǎng)景,利用雷達(dá)獲取的實(shí)時(shí)點(diǎn)跡量測(cè)數(shù)據(jù),驗(yàn)證了提出算法的有效性和性能優(yōu)勢(shì)。
附錄 LMB跟蹤器
LMB跟蹤器是一種具有較高跟蹤質(zhì)量的隨機(jī)集跟蹤器,其跟蹤性能逼近最優(yōu)貝葉斯跟蹤器的閉合解GLMB跟蹤器,尤其在低檢測(cè)概率和高雜波率場(chǎng)景下,性能遠(yuǎn)優(yōu)于PHD跟蹤器等其他隨機(jī)集濾波器。
(1) 標(biāo)簽隨機(jī)集和LMB分布
令 X 和 L分別表示目標(biāo)狀態(tài)空間和(離散)標(biāo)簽空間。X表示定義在增廣空間 X×L上的隨機(jī)有限集。令L:X×L→L 表示投影L((x,?))=?,則L(X)={L(x),x ∈X}表示多目標(biāo)狀態(tài)X的標(biāo)簽集合。若X與其標(biāo)簽集合L(X) 具有相同的基數(shù),即|L(X)|=|X|,則稱(chēng)X為標(biāo)簽隨機(jī)集。約束條件|L(X)|=|X|保證了標(biāo)簽隨機(jī)集中各目標(biāo)身份的唯一性。
LMB隨機(jī)集是一種典型的標(biāo)簽隨機(jī)集,服從如下分布:
其中,
Δ(X)?δ|X|(|L(X)|)表示互異標(biāo)簽指示器;為多目標(biāo)指數(shù)符號(hào);r(?)表示目標(biāo)?的存在概率;p(·,?) 表示目標(biāo)?存在條件下的概率密度;1Y(X)為指示函數(shù),其定義如下:
則LMB分布可由LMB參數(shù)集合完全表征。
(2) LMB跟蹤器迭代遞歸方程
LMB跟蹤器在性能上逼近最優(yōu)貝葉斯跟蹤器的閉合解GLMB跟蹤器,同時(shí)在計(jì)算復(fù)雜度上遠(yuǎn)小于GLMB跟蹤器。LMB跟蹤器中,假設(shè)多目標(biāo)后驗(yàn)密度服從LMB分布,通過(guò)貝葉斯預(yù)測(cè)和貝葉斯更新兩個(gè)步驟,對(duì)每個(gè)時(shí)刻多目標(biāo)后驗(yàn)分布進(jìn)行迭代計(jì)算。LMB跟蹤器的迭代遞歸方程具體描述如下:
(a) 預(yù)測(cè)方程:假定k-1時(shí)刻多目標(biāo)后驗(yàn)密度為L(zhǎng)MB分布,其參數(shù)集為π=k時(shí)刻新生目標(biāo)同樣服從LMB分布,其參數(shù)集為則k時(shí)刻多目標(biāo)預(yù)測(cè)概率密度函數(shù)為
其中
這里L(fēng)+L∪B;pS(·,?)表 示k時(shí)刻目標(biāo)?的存活概率;f(x|·,?)表示目標(biāo)?的狀態(tài)轉(zhuǎn)移函數(shù)。
(b) 更新方程:假定k時(shí)刻多目標(biāo)預(yù)測(cè)密度函數(shù)為式(A-5)所示的LMB分布,傳感器接收到量測(cè)集合Z,則多目標(biāo)后驗(yàn)密度可近似為一階矩匹配的LMB分布,其參數(shù)化表征為? ∈L+},其中
其中,pD(x,?) 表示目標(biāo)?的檢測(cè)概率;定義θ:L →{0:|Z|}{0,1,...,|Z|}為目標(biāo)航跡-量測(cè)的關(guān)聯(lián)映射;ΘI+表示標(biāo)簽集合I+與量測(cè)Z的關(guān)聯(lián)映射空間,包含所有關(guān)聯(lián)假設(shè)θ。
利益沖突所有作者均聲明不存在利益沖突
Conflict of InterestsThe authors declare that there is no conflict of interests