韓玉龍 林 云 陳 榕 孫守福 高 武
(海軍航空工程學院 煙臺 264001)
?
基于離散DBN的多UAV協同對海突擊目標優先等級評估*
韓玉龍 林 云 陳 榕 孫守福 高 武
(海軍航空工程學院 煙臺 264001)
針對UAV編隊在遂行對海突擊作戰任務時面臨的目標選擇難題,從目標體系的角度出發,圍繞目標價值性、目標威脅性和攻擊可行性三個方面構建了基于離散DBN的目標優先等級評估模型的網絡結構。設計了一個對海突擊作戰想定,利用Netica軟件對模型進行了仿真,完成了對海上目標的優先等級排序。通過仿真算例驗證了模型的有效性,仿真結果可以為UAV部隊對海突擊訓練和作戰提供參考。
無人機; 動態貝葉斯網絡; 對海突擊; 目標優先級; 評估
Class Number TP391
海上作戰環境日益復雜,多UAV編隊遂行對海突擊作戰任務需要應對的目標種類和數量都越來越多,受UAV數量限制,不可能對敵方所有目標進行攻擊。如何確定目標的優先等級,形成突擊目標清單,成為對海突擊作戰任務規劃的重要任務。
多UAV協同對海突擊目標優先等級評估是指根據編隊指揮所的作戰企圖和戰場態勢、我方所掌握的目標信息資料、UAV及其武器系統的性能,對敵海上目標進行全面分析、對比,從中選取最應該和最適合打擊的目標并進行排序,即從整個敵海上目標體系中確定最需要并且最適合UAV打擊對象的一種決策活動[1~2]。
很多隨機現象,例如戰場環境的變換、語音的產生以及連續變化的視覺圖像等,都涉及一些隨時間變化的隨機變量。而標準的貝葉斯網絡僅能對靜態系統進行建模。為對此類動態過程進行表達和推理,引入了動態貝葉斯網絡(Dynamic Bayesian Networks,DBN)的概念[3~4]。
DBN是以概率網絡為基礎,將靜態貝葉斯網絡結構與時間信息相結合,形成具有處理時序數據能力的隨機模型,即DBN是一組隨時間擴展的貝葉斯網絡模型。2002年美國伯克利大學的Murphy在其博士論文”Dynamic Bayesian networks:Representation,inference and learning”中給出了離散DBN的完整定義以及相關的理論框架,目前,該論文也已經成為DBN在實際應用中的理論框架。
離散DBN中每段時間間隔下的貝葉斯網絡稱為時間片。其中,每個時間片可包含多個時刻,也可為一個時刻,相鄰時間片的間隔由實際任務情況決定。要使用貝葉斯網絡來表述這一隨時間擴展的過程,需得到隨機變量X[1],X[2],…,X[n]的概率分布,但這樣一個分布是十分復雜的[5]。因此,為了能夠對復雜系統進行研究并建立相應的模型,需要做一些假設和簡化條件處理。假設條件如下:
1) 動態概率過程具備馬爾科夫性,滿足P(X[t+1]|X[1],X[2],…,X[t])=P(X[t+1]|X[t]),即未來時刻的概率與過去時刻無關,只與當前時刻有關;
2) 每個時間片內網絡結構平穩一致;
3) 相鄰時間的條件概率過程平穩,也就是說P(X[t+1]|X[t])與時間t無關,能夠方便地得到不同時間的轉移概率。
在上述假設條件下,DBN由以下兩部分組成:
1) 先驗網絡B1,是一個定義在初始狀態X[1]上的聯合概率分布。
2) 轉移網絡B→,是一個定義在變量X[t]與X[t+1]上的轉移概率P(X[t+1]|X[t])(對所有t都成立)[5~6]。
(B1,B→)組成的DBN是對應于變量X[1],X[2],…,X[∞]上的半無限網絡結構。在實際計算中,只考察一個有限的時間段1,2,…,T,并將離散DBN展開到X[1],X[2],…,X[T]上的一個網絡結構。在時刻1,X[1]的父結點是那些在先驗網絡B1中的結點,在時刻t+1,X[t+1]的父結點是那些在時刻t和時刻t+1中的都相關的在B→中的結點。

(1)
同樣可以計算出DBN中任一結點的聯合概率分布律為
(2)
離散靜態貝葉斯網絡可以根據多個時刻的觀測值來對系統的狀態進行定性推理,能夠將各個時刻的觀測值相互補充和修正,來處理觀測值的不確定性,進而增強推理結果的準確性。
首先,貝葉斯網絡以及DBN推理的依據是貝葉斯公式:
(3)
一個具有n個隱藏結點、m個觀測結點的靜態BN,根據BN的條件獨立特性,得到其推理公式:
p(x1,x2,…,xn|y1,y2,…,ym)=
(i=1,2,…,n;j=1,2,…,m)
(4)
xi表示觀測變量Xi的一個取值狀態,而yj表示觀測變量Yj的取值。pa(Yj)表示yj的雙親結點集合。在式(4)中,分母求和符號∑下x1,x2,…,xn表示隱藏變量的一種組合狀態。分母的是對觀測變量組合狀態以及隱藏變量組合狀態的聯合分布求和,實際是計算確定的觀測變量組合狀態的分布。
上述靜態貝葉斯網絡隨時間發展就得到T個時間片的DBN,由于觀測值只有一種組合狀態,因此在此觀測值下隱藏變量的分布為
p(x11,x12,…,x1n,…,xT1,xT2,…,xTn|y11,y12,…,y1m,…,yT1,yT2,…,yTm)
(5)
式中:i=1,2,…,T,j=1,2,…,m,k=1,2,…,n。xij表示Xij的一個取值狀態。第一個下標表示第i時間片,第二個下標表示該時間片內的第j個隱藏結點。yij表示觀測變量Yij的取值。pa(Yij)表示Yij的雙親結點集合。分母求和符號∑下x11…x21…xT1…xTn為隱藏變量的一種組合狀態。這是一切離散DBN推理算法的本質[8]。
貝葉斯網絡的網絡結構式表示條件獨立性信息的一種自然方式,網絡中的每個結點都表示特定域中的一個變量,結點間的連接(有向弧)表示相互間因果關系,體現了領域知識性方面的特征。建立目標優先等級評估的離散DBN模型需要首先確定其網絡結構,據此,本文從目標價值性、目標威脅性和攻擊可行性三個方面建立網絡結構[3]。
4.1 目標價值分析模型
對于多UAV編隊來說,目標價值體現在固有價值(Int)和體系價值(Sys)兩個方面。其中,目標的固有價值,又可以從經濟價值(Eco)、政治價值(Pol)和心理價值(Psy)三個方面進行刻畫。而目標的體系價值,需要充分考慮目標在整個目標體系中的地位和作用,可分為關鍵結點(Key),重要結點(Imp)以及普通結點(Gen)。通過上述分析,建立基于離散DBN的目標價值分析模型。
目標價值分析模型中,各結點變量的狀態集合可表示為:目標價值(Val)={高(H),中(M),低(L)};目標經濟價值(Eco)={高(H),中(M),低(L)},目標的政治價值(Pol)={高(H),中(M),低(L)},目標心理價值(Psy)={高(H),中(M),低(L)};目標的體系價值(Sys)={關鍵結點(key),重要結點(Imp),普通結點(Gen)}。

圖1 目標價值分析模型
4.2 目標威脅性分析模型
在海戰場,目標的威脅可以從三個方面體現。 1) 目標速度。不同的目標通常具有不同的作戰速度,即使同一海上目標,速度不同,威脅度也不同。一般來講,在一定的海域內,目標的速度越快,對我威脅越大。 2) 目標航向。由目標航向可大致判斷敵海上目標之意圖:若駛向我方編隊,則進攻意圖明顯,若敵駛離我方編隊,則逃跑意圖明顯。 3) 目標距離。通常情況下認為,目標距我越近威脅越大。
該模型中各結點變量的狀態集為:目標威脅(Thr)={高(H),中(M),低(L)};目標速度(Rate)={高(H),中(M),低(L)};目標航向(Cou)={駛向(Tow),并行(Par),駛離(Lea)};目標距離(Dis)={遠(Far),中(M),近(Clo)}。

圖2 目標威脅性分析模型
4.3 目標打擊可行性模型
UAV是對選擇目標進行突擊的執行者,因此,UAV的作戰能力是對海突擊目標選擇的落腳點,所以要充分考慮我UAV對目標進行打擊的可行性。
目標打擊可行性可以從目標易損性、機動性和反擊能力三個方面來描述。目標易損性是指目標在敵對環境殺傷下喪失全部或部分作戰功能的可行性。目標易損性又分為戰術易損性和結構易損性。戰術易損性是指目標被對方紅外、雷達或其他探測器探測到的可能性。結構易損性是指目標在被探測到的條件下,受彈藥的毀傷作用時被擊毀的可能性。從分析可以看出,目標易損性表示了發現目標和對目標實施毀傷難易程度。目標的機動性越強,穩定跟蹤目標并且達成射擊條件的難度越大;目標的反擊能力反映了其在遭受攻擊時對對方進行防御和反擊的強度。目標的機動性和反擊能力越強,對其實施毀傷的難度越大,打擊的效費比越低,目標打擊的可行性越低。
因此,從目標易損性(Vul)、目標機動性(Man)和目標反擊能力(Con)三點出發建立目標打擊可行性模型。

圖3 目標打擊可行性分析模型
定義模型中結點變量的狀態集為:目標攻擊可行性(Fea)={高(H),中(M),低(L)};目標易損性(Vul)={高(H),中(M),低(L)};目標機動性(Man)={高(H),中(M),低(L)};目標反擊能力(Con)={高(H),中(M),低(L)}。
4.4 目標打擊選擇模型
在建立價值分析模型、目標威脅分析和目標打擊可行性分析模型的基礎上,依據各網絡結點的因果影響關系,最終構建出目標打擊選擇模型。其中,根結點目標選擇優先等級(Pri)={高(H),中(M),低(L)}。

圖4 基于DBN的目標選擇網絡結構模型
建立了基于DBN的目標選擇模型以后,需要構造條件概率表。條件概率表的建立要綜合多方面的海戰場信息,同時還要考慮軍事專家的建議,也可以對經驗數據進行統計學習來獲得。
對于沒有父結點的結點,需要對其賦予一個初始狀態的概率。如果一個結點中的變量賦值相同,則表明對于這個結點沒有得到任何可供參考的信息。父結點的多少直接影響著條件概率表的復雜度,為了降低其復雜度,可通過減少父結點的數量或增加中間結點來減少一個變量的父結點的數量。對于復雜的網絡構造,通常采用增加中間結點的辦法降低條件概率表獲取的復雜度[9]。
對于圖4建立的離散DBN目標優先等級評估模型,給出以下條件概率表,表1~表5,以及狀態轉移概率表6。

表1 條件概率表(一)

表2 條件概率表(二)

表3 條件概率表(三)

表4 條件概率表(四)

表5 條件概率表(五)

表6 狀態轉移概率表
假設某編隊在海上巡邏發現八個海上目標,擬派出UAV執行對海突擊任務。經過先期偵察探測,得到如下海戰場態勢:敵可能出現方位為150°,同時識別分析出目標為1艘驅逐艦,2艘護衛艦,1艘兩棲登陸艦,2艘導彈艇,2艘補給船[10],對其分別編號如表9所示。
通過對當前海戰場態勢信息和歷史案例庫的定性匹配推理,初步確定了主要作戰區域和初步目標清單。編隊指揮員對實時得到的目標信息進行分析,采用基于離散DBN的目標選擇優先等級評估模型對目標進行選擇,制定最終的目標清單。
Netica是加拿大Norsys軟件公司開發的一款BN工具平臺,是目前應用比成熟的分析軟件,在醫療、故障診斷等民用領域有著廣泛的應用,在軍事上也逐漸得到了應用。為驗證模型的可行性和有效性,采用Netica進行仿真驗證。
首先構建網絡結構。如圖5所示,在0時刻,由于模型還未進行時間擴展,沒有得到關于目標的任何信息,為保證其后的評估不帶有任何傾向性,默認所有結點的狀態概率均勻分布。

圖5 0時刻目標1優先等級評估模型(未進行時間擴展)
通過偵察兵力的實時偵察,表9給出了目標1三個時刻的影響因子值。

表7 目標1三個時刻的影響因子值(一)

表8 目標1三個時刻的影響因子值(二)
將目標1的相關參數輸入模型中,得到的推理結果如圖3~圖7所示。

圖6 1時刻目標1優先等級評估模型

圖7 2時刻目標1優先等級評估模型
將實驗參數代入到建立的動態貝葉斯態勢評估模型中進行仿真,仿真結果如圖5~圖8所示可以得目標1的優先級為高的概率分別為33.3%,49.8%,64.9%,83.8%,可以認為目標1打擊的優先級非常高。以此類推,計算出所有目標的優先級排序結果如表所示。指揮員可參考表進行最終的目標選擇。相較于專家打分法、排隊遴選法、淘汰法、綜合計算法、模糊綜合評價以及模擬法等,基于DBN的目標選擇方法,在整個目標選擇過程中,下一時刻的推理結果不僅取決于該時刻的實時數據,而且與前一時刻的結果相關,計算結果實時性更強,可靠性更高,而且便于編程實現。

圖8 3時刻目標1優先等級評估模型

目標名稱目標編號優先級為高的概率優先級排序驅逐艦183.8%2護衛艦1281.5%4護衛艦2382.4%3登陸艦465.8%8導彈艇1585.7%1導彈艇2673.3%7補給船1780.4%5補給船2878.7%6
針對多UAV協同對海突擊目標優先等級評估問題,從目標體系的角度出發,從目標價值性、目標威脅性和目標打擊可行性三個方面重點分析了影響多UAV協同對海突擊目標優先等級評估的主要因素,在此基礎上建立了離散DBN。利用Netica軟件根據作戰想定對所建立的模型進行了仿真驗證。仿真結果表明,利用基于離散DBN的多UAV協同對海突擊目標優先等級評估模型可以有效地對目標進行選擇和排序,且具有良好的優化效果和實效性,滿足一般戰場的實時性需求。
在真實的戰場環境下,對海突擊目標優先等級評估的影響因素非常多,要更加準確的實現目標選擇還需在模型構建和參數學習方面進一步研究。
[1] 賀小亮,畢義明.基于貝葉斯網絡的目標選擇方案設計[J].現代防御技術.2014,42(3):6-11.
[2] 李馮敬,姚佩陽,田曉飛,王欣.動態貝葉斯網絡在通信對抗目標選擇中的應用[J].電光與控制,2012,19(8):63-69.
[3] WANG Zhaowen, YANG Xiaokang, YI Xu. Time varying dynamic Bayesian network for nonstationary events modeling and online inference[J]. IEEE Transactions on Singnal Processing,2011,59(4):1553-1566.
[4] 李京,劉衛東,楊根源.基于貝葉斯分類器的目標價值等級分析[J].現代防御技術,2012,40(5):46-49.
[5] 任佳,高曉光.貝葉斯網絡參數學習及對無人機的決策支持[M].北京:國防工業出版社,2012:25-27.
[6] Kevin Patrick Murphy. Dynamic Bayesian networks: representation, inference and learning[D]. Berkeley: The University the university of California,2002.
[7] 李博宇.早期胃癌生物標記物識別及調控網絡預測[D].成都:電子科技大學,2014.43-47.
[8] 史建國,高曉光,李相民.基于離散模糊動態貝葉斯網絡的空戰態勢評估及仿真[J].系統仿真學報.2006,18(5):1093-1096.
[9] 肖兵,沈薇薇,金宏斌.基于動態貝葉斯網絡的威脅估計研究[J].自動化與信息工程.2010,31(4):4-7.
[10] 隋振庚,李天偉,竺燕根,等.模糊多屬性決策在艦艇打擊海上目標的應用[J].艦船電子工程,2006,26(6):49-51.
Target Priority Evaluation about Multi-UAV Coordinated Air-to-Sea Attacking Based on Discrete DBN
HAN Yulong LIN Yun CHEN Rong SUN Shoufu GAO Wu
(Naval Aeronautical and Astronautical University, Yantai 264001)
To solve the target selecting problem of multi-Uninhabited Aerial Vehicle coordinated air-to-sea attacking, from the perspective of target system, a target priority evaluation model based on discrete Dynamic Bayesian networks was proposed from target value, target threat and target attacked feasibility. This model was simulated with Netica, which successfully accomplished the target priority evaluation. The simulation result proved the validity of the model, which can provide proposal for UAV troops.
UAV, DBN, air-to-sea attack, target priority, evaluation
2015年4月5日,
2015年5月29日
軍事學博士研究生基金項目:艦載無人機突擊島礁作戰任務規劃研究(編號:2014JY473)資助。
韓玉龍,男,博士研究生,研究方向:海軍武器裝備攻防體系對抗和信息化。林云,男,博士,講師,研究方向:海軍兵種戰術。陳榕,男,博士,講師,研究方向:海軍兵種戰術。孫守福,男,博士研究生,講師,研究方向:海軍兵種戰術。高武,男,碩士研究生,研究方向:海軍兵種戰術。
TP391
10.3969/j.issn.1672-9730.2015.10.006