雷 濤,楊亞寧,唐佳璐,楊 玲,茍先太
(1.中國電子科技集團公司 第二十九研究所,成都 614000;2.西南交通大學 電氣工程學院,成都 611756)
兩軍對壘的過程中,想要把握戰場主動權就必須得掌握敵方的行為意圖,而隨著信息技術的不斷發展與完善,戰場上的信息也變得繁雜起來,信息技術成為決勝戰場的主導因素之一[1],而面臨這些越來越多的復雜的戰場信息,如果還是像以往作戰,單純的依靠指戰員的經驗和臨時的判斷的話,將會嚴重影響我方的戰斗響應時間,導致貽誤戰機,嚴重的甚至會輸掉整場戰爭[2-3]。因此,我們迫切需要研究一種基于深度學習的對于場景行為識別的方法。本系統是通過捕捉敵方雷達的基礎電磁信息和外部特征信息[4-5],獲取敵方雷達的行為意圖從而判斷出敵軍的意圖行為。
對于作戰目標的意圖識別問題,國外的研究要早于國內,對于信息融合的一些研究,國內直到20世紀80年代才相繼展開[6]。而目前的對于作戰目標的意圖識別的傳統方法,已經出現了的有深度信念網絡、專家系統、貝葉斯網絡、模板匹配等[2]。
模板匹配法是一種最基礎的模式識別的方法,這種方法基本上是一種統計識別方法。文獻[6-7]引入模板匹配方法,對海戰場的作戰目標進行了意圖識別,并且提高了模型的容錯能力和辨識能力。但是由于模板匹配自身的局限性,其識別效果受到先驗模型的覆蓋面、模板的普適性的約束,因此具有極大的不確定性。
專家系統是人工智能領域中的最重要的的一個應用領域,被用來對人工難以解決的復雜問題進行知識推導和表示。文獻[8-9]引入專家系統,通過置信規則庫來對群體目標進行了威脅評估,從而提高了識別的計算效率和精度。但是由于專家系統只是單純的依靠機械式的推理計算,而缺乏知識的共享性和重用性,并不能滿足現在戰場上的復雜性和多變性。
貝葉斯網絡是一種圖形化網絡,通常是基于概率推理的。貝葉斯網絡一般用于解決不確定的或者是數據缺失條件下的問題,而對于一些結果發生的可能性該方法還可以給予量化分析。文獻[10-11]引入貝葉斯網絡,定義了空域作戰目標的事件分類,并對后續事件進行了學習更新。但是貝葉斯網絡非常依賴于經驗知識,很難發現和處理抗性欺騙信息[12-13]。
深度信念網絡(DBN)的構成是多層受限玻爾茲曼機(RBM)的堆疊[14-15],是由Hinton等人[14]在2006年提出的一個概念生成模型。在深度信念網絡中,這些網絡被限制為一個可視層和一個隱層,層間存在連接,但層內的單元間不存在連接。深度信念網絡是模式識別領域新興的概率生成模型[15],可以用來進行深層次的學習和對數據進行深度的挖掘[16-17]。深度信念網絡現在主要用于語音[18-19]、情感[20-21]、文本[22-23]和圖像[24-25]的分類和識別。但由于這項技術發展時間不長,相比其他方法,這項技術的識別準確率較低,學習過程較為緩慢。
本文概述了基于神經網絡與知識圖譜的場景識別方法的研究現狀,通過了聚類算法、LSTM模型、知識圖譜分析以及Web仿真技術的運用,用信息融合方法對得到的原始戰場信息進行知識的挖掘,從而得到戰場態勢信息,分析識別出戰場場景。再配合three.js動畫庫將實時場景進行仿真模擬,實現基本三維場景創建,提高開發效率,降低開發成本[3]。
本文基于神經網絡與知識圖譜的場景識別方法解決了傳統識別方法中存在的識別準確率低、需要訓練的數據量大、識別緩慢的的問題,能夠更加快速準確,而且需要的數據更少,耗費的資源更少的實現高準確率的識別。通過此種方法可以更好地擬悉敵方作戰意圖、提高我國電子對抗作戰實力、營造更安全的國家周邊環境。
為了更好地模擬雷達行為的仿真,我們建立了一個場景劇本,通過創建這個場景并實現仿真,通過對仿真數據進行仿真并對數據進行綜合處理。
圖1是整個仿真流程中所仿真的所有雷達行為,是仿真了從探測敵方雷達開始進行搜索活動到失去目標然后再進行小范圍的精確搜索活動直到找到目標并確認目標,然后進行制導活動的完整流程。

圖1 多雷達行為構成的防空反導場景
在實戰過程中通過己方的雷達、聲納、紅外傳感器等獲取到的敵方雷達數據,如位置坐標、移動速度、平均功率、峰值功率等參數。本文則對獲取到的敵方雷達活動進行仿真構建。本文的仿真系統處理到的雷達數據包括了雷達的坐標位置、速度信息、平均功率等,如表1所示。

表1 雷達相關數據參數
對于雷達的行為信息的判別,如處于搜索還是跟蹤狀態,我們本文采用的是通過對于雷達幅度的大小變化來推斷出雷達此時的行為特征的,而主要步驟是通過從己方的雷達、聲納、紅外傳感器等獲取到敵方輻射源脈沖序列,然后對這個脈沖序列的峰值、谷值等參數進行提取,將這些信息綜合分析后即可得出相關的行為識別結果,步驟如圖2所示。

圖2 對雷達的行為識別示意圖
依據雷達峰值與谷值識別行為狀態的具體流程如下所示:
1)首先對雷達的幅度直方圖進行計算,在直方圖中依次添加脈沖的幅度,將其橫軸設置為幅度值,縱軸設置為脈沖的個數,采用統計學中的“百分位數”方法進行幅度峰值(Amax)與谷值(Amin)提取,通過Matlab進行仿真模擬圖形,如圖3所示。

圖3 搜索和跟蹤目標的幅度直方圖
峰值變化量:dAmax=dAmax(t)-dAmax(t-1)
谷值變化量:dAmin=dAmin(t)-dAmin(t-1)
隨后統計固定時間段內的峰值變化量與谷值變化量:若峰值變化量絕對值>ΔA或者谷值變化量絕對值>ΔA,那么則判斷為搜索狀態;如果峰值變化量絕對值<ΔA且者谷值變化量絕對值<ΔA,則判定為跟蹤狀態。
在雷達對抗領域采用人工智能技術作為新興技術,將長短時記憶循環神經網絡或知識圖譜應用于雷達場景識別技術,無疑能夠牢牢抓住電磁作戰領域的主動權,拉開與對手的技術差距。而對敵場景識別包括了:從敵信息源獲取的信息進行相關的特征提取,再通過識別推理,即可推理識別得到場景,場景識別的一般過程如圖4所示,下面將介紹本文中采用到的知識圖譜方法。

圖4 場景識別的一般過程
知識圖譜的構建是為了描述場景中與目標相關的各種實體與概念之間的關系。知識圖譜是一種基于圖的數據結構,由節點和邊組成,如圖5所示。知識圖譜最常用的語義關系為“實體-關系-實體”與“實體-屬性-屬性值”。通俗地講,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關系網絡,它提供了從“關系”的角度去分析問題的能力。

圖5 知識圖譜結構圖
依據雷達信號特征、雷達事件及時空信息與雷達場景之間的因果關系構建知識圖譜根據專家在大量雷達場景數據中提取到的知識生成三元組,如在場景可能為防空反導場景識別(A)、場景B、場景C的前提下,根據雷達時空信息,可以推斷出場景可能為防空反導場景識別(A)、場景C對應三元組為{(1,1,1), 航線在特定區域外行駛方向由我方至敵方,(1,0,1)},進而挖掘雷達的特征信號、事件信息、時空信息與場景識別之間存在的關聯,完成知識提取,如圖6所示。

圖6 知識提取
三元組G=(E,R,S)建立起兩個節點之間的聯系,無數個三元組建立起概念層之間的聯系。概念層建立在數據層之上,是知識圖譜的核心,豐富實體之間、邊之間的關系和屬性值。以場景識別過程建立知識庫,按照識別規則出現的先后順序,在初始數據至最終識別結果之間,必然存在實體和邊之間的上下層關系及同層關系,同一層實體之間label相同,為一種概念,上下層兩個實體之間由關系連接,建立起概念之間的上下位關系。結合實體和邊之間關系及其內屬性等語義描述,即可建立起包含概念層和數據層的結構化的可邏輯推理的知識庫,實現雷達場景識別過程信息的存儲。如圖7所示。

圖7 結合語義建立知識圖譜
將處理雷達數據進行整合后,并將數據傳入Web端就行仿真,再通過聚類算法和LSTM綜合處理得到場景識別的仿真結果。
長短時神經網絡(LSTM,long short-term memory)是一種時間循環神經網絡,它的誕生最開始是用于解決RNN循環神經網絡中存在的長期依賴問題。LSTM的優點是在較長的序列中,它的計算處理能力要強于普通的循環神經網絡,另外LSTM也能同時解決掉普通的循環神經網絡中存在的梯度的爆炸和梯度的消失問題。而LSTM的主要組成是由3個門結構構成,分別是遺忘門、輸入門、輸出門,具體組成如圖8所示。

圖8 LSTM神經網絡結構圖
本系統用到LSTM的流程如下:


ft=σ(wf·[ht-1,xt]+bf)
(1)
it=σ(wi·[ht-1,xt]+bi)
(2)
(3)
(4)
ot=σ(wo[ht-1,xt]+bo)
(5)
ht=ot·tanh(ct)
(6)
通過LSTM對雷達的數據的訓練與分析,最后得出部分行為識別結果如圖9所示。

圖9 部分數據的 A 雷達行為模式占比時序分布圖
由圖9可以看出A 雷達跟蹤在占比和雷達工作脈寬在攻擊、偵查和防御3個意圖的特征據中都出現了重合部分,并且圖中3種特征數據之間混疊嚴重,但是其中A 雷達的搜索模式占比中攻擊意圖和偵查意圖的特征數據重復部分較大,防御意圖與其他兩種意圖之間的重復程度較小,可以分析得出在這段時序內的雷達意圖。
系統通過了聚類算法、LSTM模型、知識圖譜分析對上傳的數據進行了分析和處理,在Matlab中計算出識別結果,然后通過服務器傳到Web客戶端,Web客戶端three.js動畫庫將實時場景進行仿真模擬,其架構如圖10所示。

圖10 仿真系統框架設計
系統通過使用Three.js中內置的對象對仿真場景進行初始化仿真,仿真的流程如下:首先在場景中創建一個盒子模型,之后的所有仿真皆在此盒模型中進行,隨后再對背景元素進行構建,如相機、渲染器的創建等,由此創造出一個最基礎的仿真場景;然后再到場景中添加仿真的環境元素,如海洋、天空、日光等,添加完畢后再用這些環境元素的紋理對盒子模型的內部進行紋理映射,至此,整個場景的環境效果即可呈現;再創建完場景和背景元素后就可以往盒子模型中加入仿真模型了,如雷達、預警機、驅逐艦等。本仿真系統的數據支持是進行了LSTM運算的Matlab算法端,通過這些數據,系統不斷加載渲染出模型以及通過內置動畫展現出模型的空間信息。本系統中采用的是這6步:1)創建三維場景;2)設置攝像機;3)設置光源;4)設置渲染;5)加載 OBJ 文件;6)模型的平移、旋轉、縮放等。
三維模型的加載流程如圖11所示。

圖11 三維模型加載流程
雷達在搜索、小搜、跟蹤等行為轉變過程中,其相對于偵察設備的功率會發生變化。同時雷達的位置坐標、移動速度、頻段、峰值數量、脈寬也會發生變化,因此測量觀測雷達的各項參數變化特征,可快速確定威脅目標當前的行為方式、意圖從而推導識別出現在的場景。記錄的部分數據如表2所示。

表2 雷達部分數據截取表
在對9 000組樣本進行了訓練與測試之后,得出了網絡模型LSTM和知識圖譜方法的識別準確率,如表3所示,在選取的部分實驗中可得出LSTM的識別準確率大致在82.3%左右,而知識圖譜的識別準確率在86.1%左右,經過

表3 雷達部分數據截取表
實驗驗證識別準確率達到了實戰的要求,相比較這知識圖譜與LSTM,知識圖譜的識別準確率要更高一些,但并不意味著知識圖譜要更有優勢,因為相對于知識圖譜來說,LSTM作為單向通道時的準確率是可以通過拓展雙向通道提升準確率的,即為雙向LSTM(Bi-LSTM)。
針對判斷實戰環境中進行場景識別過程時受到的硬件設備和環境的限制。通過了聚類算法、LSTM模型、知識圖譜分析以及Web仿真技術的運用,用信息融合方法對得到的原始戰場信息進行知識的挖掘,從而得到戰場態勢信息,分析識別出戰場場景。系統運行流暢,仿真效果良好,可視化程度高,兩種方法的識別準確率都達到了80%以上,經過測試達到了實驗要求,可以對數據進行快速仿真,對場景進行快速識別,對于三維場景在瀏覽器端的模擬實現和對海上模擬電子對抗具有一定的實際實用價值,但系統也還存在一些問題:
1)由于所研究問題的特殊性,無論是真實戰場的敵軍航艦外部信息、戰場雷達信號還是敵軍戰術意圖數據集合,都是無法獲取與準確仿真的,因此在仿真數據以及選取特征數據都需要進一步的考證和實踐。
2)現代軍事發展日新月異,雷達型號更新換代較快,系統選取根據目前雷達型號得出的相關結論并不具有一定的時效性,因此需要在構建模型的進行算法計算的時候要充分考慮到雷達數據的更新換代。