周國祥 許錦洲 韋曉萍
(1.海軍蚌埠士官學(xué)校 蚌埠 233012)(2.海軍指揮學(xué)院浦口分院 南京 211800)
隨著傳感器和軍事信息系統(tǒng)的發(fā)展應(yīng)用,海戰(zhàn)場各作戰(zhàn)平臺的探測距離遠、機動能力強、火力范圍廣,使得戰(zhàn)場態(tài)勢變化更加快速復(fù)雜,且敵我雙方交戰(zhàn)過程中普遍采用了偽裝、隱蔽和欺騙(CC&D)等戰(zhàn)術(shù),如何及時、準(zhǔn)確、迅速地反映戰(zhàn)場態(tài)勢的變化,增強對戰(zhàn)場態(tài)勢的感知,逐步識別敵方意圖和作戰(zhàn)計劃,并作出正確的態(tài)勢估計[1],將成為作戰(zhàn)雙方爭奪戰(zhàn)場信息優(yōu)勢的焦點[2]。
態(tài)勢估計是信息融合功能模型[3~6]的二級處理過程,它接收一級融合結(jié)果,并從中抽取對當(dāng)前態(tài)勢盡可能準(zhǔn)確、完備的戰(zhàn)場情報信息,為各級指揮員作戰(zhàn)決策提供輔助支持。態(tài)勢估計是在決策級上進行的一種推理行為[7],由于傳感器性能以及敵方干擾、欺騙等行為,使得態(tài)勢估計過程需要處理的信息具有高度不確定性。同時,由于作戰(zhàn)的復(fù)雜性,使得用于推理的軍事知識存在著不確定性。因此,態(tài)勢估計系統(tǒng)必須能夠處理不確定性信息,進行有效推理[8]。
用于態(tài)勢評估的主要方法有模板匹配[9]、規(guī)劃識別[10]、貝葉斯網(wǎng)絡(luò)[11~12]以及專家系統(tǒng)[13]等,這些方法運用于戰(zhàn)場態(tài)勢評估問題各有其優(yōu)缺點。DS證據(jù)理論是一種有效的不確定性推理方法,比傳統(tǒng)概率論能更好地把握問題的未知性和不確定性[14]。該理論提供了證據(jù)的合成方法,能融合多個證據(jù)源提供的證據(jù),因此成功應(yīng)用于信息融合領(lǐng)域。針對文獻[7~8]中存在的基本概率賦值函數(shù)由領(lǐng)域?qū)<医o出,結(jié)果容易受專家主觀因素影響的問題,本文提出一種基于神經(jīng)網(wǎng)絡(luò)和DS證據(jù)理論相結(jié)合的態(tài)勢估計方法,使用神經(jīng)網(wǎng)絡(luò)中應(yīng)用最為廣泛的BP網(wǎng)絡(luò)來求解基本概率賦值函數(shù),再使用DS證據(jù)理論進行態(tài)勢估計。結(jié)果表明,該方法可有效克服專家主觀因素的影響,為海戰(zhàn)場戰(zhàn)術(shù)態(tài)勢估計提供新的途徑。
BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),其主要特點是信號前向傳播,誤差反向傳播。該網(wǎng)絡(luò)是一個典型的多層網(wǎng)絡(luò),由輸入層、一個或多個隱含層、輸出層組成,各層之間采用全互連方式,同層單元之間不存在連接。可以利用訓(xùn)練樣本的學(xué)習(xí)建立起記憶,將未知模式判為最接近的記憶。且經(jīng)過神經(jīng)網(wǎng)絡(luò)處理的數(shù)據(jù),可近似認(rèn)為數(shù)據(jù)間是相互獨立的,能較好滿足DS證據(jù)理論對證據(jù)獨立性的要求。
BP算法的基本思想[15]是,學(xué)習(xí)過程由信號的正向傳播與誤差的反向傳播組成。正向傳播時,輸入樣本從輸入層傳入,經(jīng)各隱層逐層處理之后,傳向輸出層。若輸出層的實際輸出與期望輸出(導(dǎo)師信號)不符,則轉(zhuǎn)入誤差的反向傳播。誤差反傳是將輸出誤差以某種形式通過隱層向輸入層逐層反傳,并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元權(quán)值的依據(jù)。這種信號正向傳播與誤差反向傳播的各層權(quán)值調(diào)整過程是周而復(fù)始地進行的。權(quán)值不斷調(diào)整的過程,也就是網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過程,此過程一直進行到網(wǎng)絡(luò)輸出的誤差減少到可接受的程度,或進行到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止。
BP算法的步驟[15]如圖1所示。

圖1 標(biāo)準(zhǔn)BP算法流程
針對標(biāo)準(zhǔn)BP算法存在易陷入局部極小、學(xué)習(xí)效率低、收斂速度慢、隱節(jié)點選取缺乏指導(dǎo)等缺陷,目前已提出不少有效的改進算法,較常用的有增加動量項、自適應(yīng)調(diào)節(jié)學(xué)習(xí)率、引入陡度因子等方法。本文采用增加動量項和自適應(yīng)調(diào)節(jié)學(xué)習(xí)率相結(jié)合的BP改進算法。
1)增加動量項
若用W 代表某層權(quán)矩陣,X代表某層輸入向量,則含動量項的權(quán)值調(diào)整向量表達式為

可見,增加動量項即從前一次權(quán)值調(diào)整量中取出一部分疊加到本次權(quán)值調(diào)整量中,α稱為動量系數(shù),一般α∈(0,1)。動量項反映了以前積累的調(diào)整經(jīng)驗,對于t時刻的調(diào)整起阻尼作用。
2)自適應(yīng)調(diào)節(jié)學(xué)習(xí)率
設(shè)一初始學(xué)習(xí)率,若經(jīng)過一批次權(quán)值調(diào)整后使總誤差E總增加,則本次調(diào)整無效,且有

若經(jīng)過一批次權(quán)值調(diào)整后使總誤差E總減少,則本次調(diào)整有效,且有

1)DS證據(jù)理論
在命題A的一個辨識框架Θ中,有冪集2Θ上的基本概率賦值函數(shù)m:2Θ→ [0,1],且滿足:

式(4)中,m(A)稱為辨識框架上的基本概率賦值函數(shù),它表示證據(jù)支持命題A發(fā)生的程度。其信任函數(shù)bel(A)和似然函數(shù)pl(A)分別如下式(5)~(6)所示:

信任函數(shù)bel(A)表示證據(jù)完全支持命題A的程度,似然函數(shù)pl(A)表示證據(jù)不反對(不懷疑)命題A的程度,區(qū)間 [bel(A),pl(A)]構(gòu)成證據(jù)的不確定空間,表示命題的不確定程度。
設(shè)m1,m2,…,mn是同一辨識框架Θ上n個不同證據(jù)的基本可信度分配,由Dempster公式進行合成,合成后的mass函數(shù)m:2Θ→ [0,1]如下:

式中,m1(Ai1),m2(Ai2),…,mn(Ain)為焦元。k為證據(jù)之間的沖突概率,反映了證據(jù)之間沖突的程度;歸一化因子(1-k)-1的作用就是避免在合成時將非0的概率賦給空集Φ。
2)BP網(wǎng)絡(luò)與DS理論的融合方法
本文所采用的BP網(wǎng)絡(luò)與DS理論的融合模型如圖2所示。在傳感器探測和0級處理、1級處理的基礎(chǔ)上,將各時刻傳感器所探測目標(biāo)的狀態(tài)估計、特征信息、航跡信息、屬性估計、事件(輻射源事件、機動事件)等信息提取出來,進行模糊化處理后利用BP神經(jīng)網(wǎng)絡(luò)進行敵目標(biāo)意圖分類識別,將神經(jīng)網(wǎng)絡(luò)的輸出作為DS證據(jù)理論推理所需的基本概率賦值,采用DS證據(jù)理論來完成決策級融合,實現(xiàn)對海戰(zhàn)場戰(zhàn)術(shù)態(tài)勢的評估。該模型將BP網(wǎng)絡(luò)自主學(xué)習(xí)、聯(lián)想記憶、容錯能力與DS證據(jù)理論的不確定推理能力結(jié)合起來,能較好地解決DS理論中基本概率賦值難以獲取的問題。
3)融合判決準(zhǔn)則
本文采用如下基于規(guī)則的判決準(zhǔn)則:

圖2 BP網(wǎng)絡(luò)與DS理論的融合模型
(1)判定的目標(biāo)作戰(zhàn)意圖應(yīng)具有最大的基本概率分配函數(shù)值;
(2)判定的目標(biāo)作戰(zhàn)意圖與其它作戰(zhàn)意圖的基本概率分配函數(shù)值之差要大于某個閾值;
(3)表示未知的m(Θ)必須小于某一門限;
(4)判定目標(biāo)作戰(zhàn)意圖的基本概率函數(shù)值要大于不確定基本概率函數(shù)值m(Θ)。
由于各種傳感器得到的速度、目標(biāo)方位、發(fā)現(xiàn)距離等數(shù)據(jù)均為實數(shù),為減少識別空間,便于神經(jīng)網(wǎng)絡(luò)的分類判決,需要對各屬性進行模糊化,本文采用文獻[16]的方法進行模糊化處理。
模糊化后各識別屬性如下:
1)目標(biāo)類型:分為 (C1,C2,C3)三種類型。其中,C1為巡洋艦等大型艦艇;C2為巡邏艇、快艇等;C3為驅(qū)護艦。
2)運動速度:分為快、較快、較慢、慢,分別表示為(V1,V2,V3,V4)。
3)目標(biāo)方位:將識別參考點設(shè)為中心,以正北、正東為正方向的四個象限,分別表示為 (B1,B2,B3,B4)。
4)發(fā)現(xiàn)距離:分為遠、較遠、較近、近四個類別,表示為(D1,D2,D3,D4)。
5)目標(biāo)火力范圍:分為遠、較遠、較近、近四個類別,表示為 (F1,F(xiàn)2,F(xiàn)3,F(xiàn)4)。
6)航跡類型:分為直航、以直航為主、以機動為主、機動四種,表示為 (T1,T2,T3,T4)。
7)警戒雷達是否開機:R1為開機,R2為未開機。
8)導(dǎo)攻雷達是否開機:R1為開機,R2為未開機。
對海戰(zhàn)場戰(zhàn)術(shù)態(tài)勢的類別分為進攻、防御、相持、逃跑四種,表示為 (A1,A2,A3,A4)。
根據(jù)以往數(shù)據(jù)資料積累可得到一些敵目標(biāo)屬性及其意圖信息,首先對屬性信息進行預(yù)處理,建立起B(yǎng)P網(wǎng)絡(luò)的訓(xùn)練樣本集,如表1所示。

表1 屬性模糊化后BP網(wǎng)絡(luò)學(xué)習(xí)樣本

續(xù)表1
選取上述訓(xùn)練樣本集對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,這里采用3層BP神經(jīng)網(wǎng)絡(luò),訓(xùn)練算法采用增加動量項和自適應(yīng)調(diào)節(jié)學(xué)習(xí)率的改進BP算法,訓(xùn)練誤差設(shè)為0.01,經(jīng)反復(fù)訓(xùn)練確定網(wǎng)絡(luò)結(jié)構(gòu)為8-11-4,BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差下降曲線如圖3所示。

圖3 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差下降曲線
設(shè)我水面艦艇執(zhí)行警戒任務(wù)時發(fā)現(xiàn)有敵艦艇接近,敵艦意圖有進攻 (A1)、防御 (A2)、相持 (A3)、逃避 (A4)四種,則得到辨識框架Θ= (A1,A2,A3,A4)。在E1~E3時刻,分別將所探測目標(biāo)的狀態(tài)估計、特征信息、航跡信息、屬性估計、輻射源事件等信息模糊化后輸入已訓(xùn)練好的神經(jīng)網(wǎng)絡(luò),得各時刻基本概率賦值函數(shù)m1、m2、m3。經(jīng)過D-S證據(jù)理論方法進行信息融合后,結(jié)果如表2所示:

表2 證據(jù)空間的時空域融合
由表2可知,隨著時刻E3傳感器檢測到證據(jù)m3,使得A1的可信度達到0.4594,且不確定的可信度降為0.0240,若設(shè)定閾值ε1=0.40,閾值ε2=0.25,顯然有m(A1)=max{m(Ai)}>ε1,(i=1,2,3,4),且 m(A1)-max{m(Ai)}>ε2,(i=2,3,4),根據(jù)判決準(zhǔn)則可判定敵艦艇處于態(tài)勢A1,即目標(biāo)可能發(fā)動進攻,這與實際情況是相符的。
本文分析了海戰(zhàn)場態(tài)勢估計的特點,提出BP網(wǎng)絡(luò)與DS證據(jù)理論相結(jié)合的方法,克服了DS證據(jù)理論中基本概率賦值難以獲取的問題。將傳感器0級、1級處理結(jié)果進行預(yù)處理后,輸入BP網(wǎng)絡(luò)進行目標(biāo)意圖的分類識別,將神經(jīng)網(wǎng)絡(luò)的輸出作為證據(jù),采用DS證據(jù)理論完成各時刻證據(jù)空間的時空域融合,仿真試驗結(jié)果表明,該方法能有效克服專家主觀因素的影響,可有效應(yīng)用于海戰(zhàn)場中艦艇編隊?wèi)?zhàn)術(shù)態(tài)勢估計。
[1]韓崇昭,朱洪艷,段戰(zhàn)勝.多源信息融合[M].北京:清華大學(xué)出版社,2006:475476.
[2]趙宗貴,李君靈,王珂.戰(zhàn)場態(tài)勢估計概念、結(jié)構(gòu)與效能[J].中國電子科學(xué)研究院學(xué)報,2010,5(3):226230.
[3]沃茲,李納斯.多傳感數(shù)據(jù)融合[M].馬薩諸塞州波士頓出版社,1990.
[4]霍爾,李納斯.多傳感器數(shù)據(jù)融合概述[J].IEEE論文集,1997,85(1).
[5]霍爾,李納斯.多傳感器數(shù)據(jù)融合手冊[M].紐約:CRC出版社,2001.
[6]斯坦伯格,波曼,懷特.回顧JDL數(shù)據(jù)融合模型[J].第三屆NATO/IRIS會議論文集,1998.
[7]徐曉輝,劉作良.基于DS證據(jù)理論的態(tài)勢評估方法[J].電光與控制,2005,12(5):3637,65.
[8]賈則,宋敬利,金輝,等.DS證據(jù)理論在戰(zhàn)術(shù)態(tài)勢估計技術(shù)中的應(yīng)用[J].計算機測量控制,2009,17(8):15711573.
[9]李曼,馮新喜,張薇.基于模板的態(tài)勢估計推理模型與算法[J].火力與指揮控制,2010,35(6):6466.
[10]谷文祥,李麗,李丹丹.規(guī)劃識別的研究及其應(yīng)用[J].智能系統(tǒng)學(xué)報,2007,2(1):911.
[11]杜菲菲,馮新喜.用于態(tài)勢評估的貝葉斯網(wǎng)絡(luò)研究綜述[J].電光與控制,2010,17(9):4247.
[12]孫兆林.基于貝葉斯網(wǎng)絡(luò)的態(tài)勢估計方法研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2005,10:710.
[13]Ruoff等.C3I態(tài)勢估計專家系統(tǒng):模型、方法與工具[M].指揮與控制科學(xué).AFCEA出版社,1998.
[14]韓峰,楊萬海,袁曉光.一種有效處理沖突證據(jù)的組合方法[J].電光與控制,2010,17(4):58,13.
[15]韓力群.人工神經(jīng)網(wǎng)絡(luò)理論、設(shè)計及應(yīng)用[M].第二版.北京:化學(xué)工業(yè)出版社,2007,7:4752.
[16]楊金寶,吳曉平.D-S證據(jù)理論在電路故障診斷中的應(yīng)用研究[J].計算機與數(shù)字工程,2012,40(12).
[17]牛曉博,趙虎,陳新來.基于信息熵和概率神經(jīng)網(wǎng)絡(luò)的海戰(zhàn)場目標(biāo)識別[J].電光與控制,2010,17(4):8485.