方 旖, 畢大平, 潘繼飛,2, 陳秋菊,2
(1.國防科技大學電子對抗學院,合肥,230037; 2.國防科技大學電子對抗信息處理實驗室,合肥,230037)
大數據分析技術與人工智能技術的發展為雷達對抗帶來了革命性影響。相控陣、軟件化等技術的應用大大提升了多功能雷達系統(Multi-Function Radar, MFR)的智能化程度。MFR必須具備及時準確地感知與辨識雷達狀態動態變化的能力,才能引導對抗裝備敏捷地決策出最優的對抗策略,進而實施認知對抗。面對波束、體制與信號形式均能自適應捷變的多功能雷達目標輻射源的情況,傳統的“精度”驅動的對抗偵察手段顯然難以適應。行為識別需要獲取足夠多、足夠全面的數據樣本,構造可用于深度學習的數據集,并且基于“數據”驅動的智能分析辨識手段,才能使其性能遠高于傳統方法。
在雷達行為辨識問題的研究中,Visnevski等人首先引入句法模式識別理論,分析多功能雷達工作模式的活動規律[1]。在此基礎上,引入多功能雷達各狀態的概率分布[2],在雷達字提取中出現插入、缺失及替換情況下,完成對雷達工作模式的識別。將多層次模型同時應用到脈沖組數據和行為模式上[3-4],可以描述脈沖參數與行為模式的各個層次之間的聯系。但是各層次建模過程中的門限值難以設定,容易受到噪聲干擾。傳統的識別方法通常利用構建相干處理周期(CPI)矩陣,并將矩陣與先前搭建的雷達數據庫進行關聯[5]。此方法原理簡單,但受設定的門限值影響較大,只能劃分參數特征區別明顯的脈沖序列,并且需要在已知上一級行為狀態的情況下,才能完整進行識別分析。引入生物信息學“多序列比對(MSA)”方法,是將跟蹤行為序列插入到搜索行為序列中,把形成的新序列定義為雷達的行為序列,并從中重建搜索序列,完成對搜索行為的規律探索[6]。該方法能夠很好地適應多功能雷達信號波束捷變的特點,但多功能雷達的行為類型多、變化快,此方法不易推廣到其他行為任務,有一定局限性。文獻[7]研究了未知雷達狀態識別方法,利用機器學習理論相關算法,分別提出了基于有監督分類與基于無監督聚類的2種識別算法。無監督聚類算法主要包括K-均值聚類、C-均值聚類等,主要利用樣本之間的相似性和映射關系分析出樣本參數和行為模式之間的邏輯關系,并進行分類。有監督分類主要包括樸素貝葉斯算法、支持向量機、神經網絡等。其中,神經網絡的應用[8-9]能夠針對靜態與動態2種行為模態信息,挖掘行為識別的多模態特征,具有重要意義[10-12]。
近年來,深度學習算法在圖像識別、語音識別等領域發展迅速[13-15],解決了對語音語調的識別、語音情感的分析、人體行為體態分析預測以及醫療圖像分析等多個研究方向的問題。同樣的,在雷達對抗領域也有大量專家學者利用深度學習的方法對雷達目標、雷達圖像等方面展開研究,并取得了一定成果[16-18]。神經網絡的泛化能力(Generalization)是指神經網絡在學習完成以后神經網絡對測試樣本或工作樣本做出正確反應的能力。一個神經網絡的泛化能力影響了網絡對訓練集之外的數據的識別能力,以及構造的神經網絡的推廣應用能力。為提高神經網絡的泛化能力,本文對樣本的初始權值、數據集處理構造和網絡結構設計進行研究改進,優化神經網絡。
本文重點構造面向多功能雷達行為識別的數據集,同時根據多功能雷達信號脈沖的特點,設計一種優化后的BP神經網絡,作為合適的雷達行為辨識網絡模型。①以某型機載火控雷達作為研究對象,將雷達信號脈沖數據轉化為知識信息,并對其進行變化點檢測、原始數據處理、數據集優化等;②在此基礎上,設計完成了基于BP神經網絡與其他雷達行為辨識算法的仿真實驗對比。算法流程見圖1。

圖1 算法流程
圍繞多功能雷達的認知對抗需求,建立如圖2所示的多功能雷達行為辨識模型,主要由雷達行為模式分析建模、構建數據集、采用深度學習等技術手段完成雷達行為特征辨識等組成。
隨著人工智能的快速發展,其與雷達對抗領域結合成為了當前的研究熱點。隨著在新體制多功能雷達的逐步應用,雷達行為越發復雜多變,人工已難以依據雷達信號參數即時判斷當前狀態,無法做出相適應的干擾。從電子對抗的角度考慮,在通常情況下,只能獲得雷達的信號波形和經過偵察處理后輸出的傳統波形特征參數。而在真實的對抗中,由于偵察方難以提前建立敵方雷達信息相應的雷達知識庫,只能通過對波形的分析,提取能夠表現雷達行為特征的參數,識別當前雷達行為。因此,利用雷達信號特征提取、序列分割等手段,把行為信息構建為結構化的數據非常重要。

圖2 數據驅動的多功能雷達行為辨識模型
初始數據經過處理轉化為雷達行為數據集,可以很好地解決多功能雷達信號直接計算量過大、數據冗余等問題。本文通過學習知識圖譜的構建方法,利用現有的雷達知識庫設計垂直數據庫的模型,并通過樣本數據提取實體、屬性和關系,分析整合后的結果與模型相結合構造多功能雷達行為數據。
經過初步提取后的雷達行為數據集中的信息復雜,可能存在來源不同、質量參差不齊等問題,所以需要對所有數據進行篩選、整合、加工、推理等工作,將數據結合方法,建立可匹配人的思想的數據庫。
2.1.1 脈沖分割
當多功能雷達行為較為復雜時,可以將其分割為基礎行為,如搜索、跟蹤等。基礎行為的分析可以簡化輸入樣本,減少訓練時間,增強神經網絡的泛化能力。本文引入多功能雷達行為變化點檢測算法[19-21],對雷達脈沖序列進行功能性切割。定義雷達行為的變化點:計算所得的條件概率在變化點檢測算法中發生很大變化的點。設定一個固定窗口長度的滑動窗口,沿著所有接收到的脈沖序列時間順序滑動,對每一個窗口內的數據進行概率計算,當前后2個概率值相差超過閾值時,判斷出現變化點。變化點前后2個事件有可能為同一行為狀態,也可能是不同行為狀態,在每一事件結束,都進行狀態更新,并判斷是否為同一行為。
圖3為變化點檢測流程圖。

圖3 變化點檢測流程
定義從當前時間點回溯到最近變化點之間的脈沖描述字數據稱為1個行程,用r表示。假設檢測到的最近變化點已經過去了t個單位時間,則與最近數據相關聯的有t個不同長度的行程,那么在接收到最新數據之后再進行變化點檢測,可以考慮2種可能性:新的序列是當前行程的一部分,因此當前行程的長度加1;或者是變化點發生,當前行程結束,新的序列是新行程的一部分。設rt表示最近行程的長度,則在給定前面t個事件下rt的概率為:
P(e1:t+1|e1:t)=
(1)
假設給定了相應的脈沖描述字時間序列,則根據貝葉斯準則,在t事件之后rt的概率分布為:
(2)
P(rt&e1:t)=
(3)
式中:P(rt&e1:t) 為轉移概率;P(et|rt-1&e1:t-1) 為最近序列屬于某一行程的概率。
假設在計算當前概率時,上一個序列的概率已知,則需要計算風險函數H來判斷行為是否發生變化:
(4)
2.1.2 數據整合與加工
由于分割得到的脈沖序列相互之間可能存在不等長的情況,則需要對數據進行補齊。補齊的方式主要有以下幾種:
1)特殊值法:把所有空缺的位置看作是特殊的屬性值處理,通常選擇“0”進行補充,此方法工作量小,但極易造成數據偏差過大,影響識別結果。
2)平均值法:當空缺位置上的數據是數值屬性時,取組內相同類型參數的所有數值的平均值進行補充;當空缺位置上的數據的是非數值屬性時,則利用統計學中的眾數原理,選擇同類型參數出現次數最多的進行補充。
3)人工填寫法:根據已有的樣本數據和多功能雷達的先驗知識,人為補充最可靠的數據。此方法補充的數據偏差最小,但若空缺過多則會造成工作量較大的問題。
本文選擇平均值法對數據進行補齊,最終得到完整的、已分割完成的多功能雷達脈沖序列組。基本步驟見圖4。

圖4 數據補齊流程
本文基于某型機載火控雷達的設計原則,根據雷達脈沖序列及其變化規律分析其與雷達行為的邏輯關系,并根據此邏輯關系推理其他常見行為狀態和工作模式。該方法建立在用于描述的高端特征向量與行為子集中每個行為均有映射關系的基礎上,其中高端特征向量包括頻率變化規律特征、波形變化規律特征、波束行為特征、重頻變化規律特征等。
綜合上述所有工作,完成對多功能雷達行為數據集的構建,并不斷更新雷達行為及其對應的脈沖序列信息,慢慢形成能夠包含大部分雷達行為狀態的、可適用于各種環境變化的數據庫。完備的多功能雷達行為數據庫可以使訓練后的網絡應用于多種情況下的行為分析中,并且可以不斷補充歸納豐富網絡的識別能力,增強神經網絡的泛化能力。
BP神經網絡算法是一種按照誤差反向傳播算法訓練的多層感知器網絡,又稱為誤差方向傳播算法,是監督式學習算法的一種。通常,BP神經網絡包括輸入層、輸出層和隱藏層。
搭建本文適用的BP神經網絡需要從數據準備、網絡結構設計、網絡模型訓練3個方面逐步進行。數據準備在多功能雷達行為數據集構建階段完成。
對網絡進行初始化設計,即需要確定網絡層數、選擇合適的訓練方法、權值的初始化等。本文設計的網絡結構模型如下:

2)傳遞函數的選擇。一般來說,如果隱藏層和輸出層同時選擇sigmoid 函數,則輸出值會被限制在0或-1之間。因此,選擇tan-sigmoid函數作為隱藏層的傳遞函數,線性傳遞函數purelin作為輸出層的傳遞函數。這樣可以在整個網絡的輸出選擇任意值,tan-sigmoid函數的輸入也能選擇任意值,且誤差比log-sigmoid小。迭代次數最多不超過5 000,最小全局誤差為10-6,學習率設置為0.01。訓練神經網絡的每一次迭代都經過反向傳播進行梯度下降,若學習率太高,那系統可能難以收斂,難以對準目標;若學習率太低,則容易陷入局部最優。
3)訓練方法的選擇。選擇訓練函數為tranlm,速度較快,并采用均方誤差(MSE)進行評估網絡。

1)訓練樣本數據包含的行為信息有近距離搜索、遠距離搜索、搜索加跟蹤、跟蹤不同目標。通過變化點檢測,把序列分割成代表不同工作狀態的序列組。選取300組進行檢測,用概率表示,結果見圖5。

圖5 變化點檢測結果
由圖5可知,基于貝葉斯準則和固定窗口滑動的變化點檢測方法能夠以較高的性能完成脈沖序列的變化點估計,雖仍然存在虛警的情況,但不影響主要變化點的判斷。結合脈寬和波束方位2個參數的變化點檢測,可以判斷出有疑問的變化點,挑選出判斷準確的變化點,從而對脈沖序列進行分析和任務型分組,為進行下一步的工作提供有力支持。
2)選取頻率、脈寬、脈幅、波束方位、重復周期和帶寬6類參數對分割后的多功能雷達脈沖序列進行整理,將完整的序列集合輸入BP神經網絡進行訓練。BP神經網絡迭代設置5 000次,完成網絡訓練后,為檢驗識別網絡的可靠性,輸入驗證數據集進行檢驗,同樣包含4種工作狀態分別為:近距離搜索、遠距離搜索、跟蹤目標1和跟蹤目標2。如圖6所示,分別是驗證數據集的類型、識別結果和真實結果的對比、識別各組數據的誤差和識別正確率。




圖6 神經網絡驗證結果
從圖6可知,面向多功能雷達行為識別的網絡模型的總識別率可以達到89%,其中近距離搜索的識別正確率最高,這與其在訓練樣本數據中工作狀態時間長有一定關系。
3)對比以CPI特征為主的脈沖劃分的傳統識別方法,基本流程見圖7。

圖7 CPI脈沖劃分法
對比文獻[5~6]中的雷達行為識別方法,僅針對脈幅變化進行分析計算。文獻[5]通過對幅度波形提取峰谷值比、幅度直方圖、平均能量3個參數來區別搜索與跟蹤。文獻[6]采用循環二分法進行分析。首先確定一個門限值,通過門限值找出整段序列中與其他差異性最大的一段并計算最大似然比統計量。判斷得到2點(或1點)變化點后,對分出的3個(或2個)段繼續進行分析,不斷循環處理,直到再無變化點被檢測出來。2種方法均可以對多功能雷達行為進行識別,但是,在實際復雜信號環境下,當脈沖密度很高時,脈沖相互疊加會造成幅度測量的不準確;其次,對于非相控陣體制的雷達來說,工作模式的切換往往還與脈寬、脈沖重復周期等參數的變化相關,而不僅反映在幅度變化上,僅采用幅度一種參數進行分割,可利用的信息量少,在多工作模式下容易造成漏警,判決不夠準確。而本文使用的算法能夠較穩定地識別出多種雷達行為狀態,并能形成可以實時優化的數據集,不斷進行補充、訓練與識別雷達行為。
現有多功能雷達的設計準則已經多樣化,不再一成不變,當使用CPI脈沖劃分的方法按照經驗設定16個或32個脈沖序列為一組時,已經產生了一定的誤差。而本文使用的變化點檢測算法不需要任何先驗知識,并且在脈沖數量較小的情況下,分析結果也能實現較高的準確率。
再者,利用CPI脈沖劃分后的序列不能直接對應于某一基礎行為,此時對應的多功能雷達行為還是復雜多樣的,而經過變化點檢測算法后得到的脈沖對應的多功能雷達行為已經是某一種單一工作模式了。例如文中指出的某一機載火控雷達中的遠距離搜索、近距離搜索、搜索加跟蹤、邊搜索邊跟蹤行為已經被分割為遠距離搜索、近距離搜索和跟蹤3種工作模式。此結果更利于網絡訓練和后期識別的需要,減少工作量,提升識別效果。
相比較而言可以看出本文所用方法的訓練結果較穩定,訓練過程中多次迭代可以減弱一定噪聲變量的影響,減小誤差,提高識別率,且識別率較為穩定。
目前,雷達正向多功能智能化方向發展,本文提出的行為數據集構建與行為辨識方法就是對多功能雷達行為智能識別方向的一種探索,主要的研究貢獻有:
1)建立了多功能雷達行為模型,引入變化點檢測算法,對多行為的脈沖序列進行分割。為減小冗余,對原始脈沖序列進行篩選、補齊,提高了初始數據的應用效果,能夠適應于神經網絡算法設計,為后續工作奠定了基礎。
2)設計完成了基于BP神經網絡算法的多功能雷達行為辨識實驗,發現在有充足訓練樣本的情況下,本文所用算法具有較強的優勢,且可以識別出脈沖序列區別較小的幾種雷達行為。
本文僅圍繞某型機載火控雷達的4種工作狀態進行了數據集譜構建與行為辨識算法的建模與仿真實驗,還有更多更為復雜的雷達行為需要進一步研究;在復雜的戰場環境下,如何克服數據殘缺、噪聲干擾等困難,建立完善可靠的雷達數據庫和雷達知識庫,以及如何識別新型未知雷達的行為,均是下一階段研究的方向。