徐 晶 張譯方 邱光輝 張生杰 徐才進
(西南電子設備研究所 成都 610036)
雷達輻射源識別是電子偵察的重要環節,在信號分選基礎上,對偵收的雷達參數進行分析,完成對雷達型號甚至個體的準確判識,為作戰籌劃、戰術決策等提供重要的情報支撐[1]。
近年來,隨著雷達技術體制不斷升級更新,現代作戰空間呈現電磁信號數量繁多、密級重疊、動態交疊、樣式變化快的特點。大數據人工智能技術的發展,為雷達輻射源識別帶來了新的思路:基于大量偵收數據,通過機器學習訓練方法,自動完成對雷達特征的提取及識別空間的構建,以此解決對新體制、多功能雷達的準確判識。常見的智能化雷達輻射源識別有基于機器學習的識別方法[1]及基于神經網絡的識別方法[3-4]。另一方面,受實戰環境、戰術使用及技術條件的限制,雷達輻射源識別所面臨的信號是一種“小樣本空間”[5],對應的數據存在完備性不足、連續性差、類別不均衡的缺點,基于數據驅動的人工智能識別方法存在對訓練數據過擬合、泛化能力差、魯棒性不足的問題,造成人工智能技術無法良好適應于電子戰系統和裝備的應用。
為解決上述問題,本文提出針對偵察低截獲雷達的型號識別技術,具體地,提出基于K-means和組合采樣的樣本擴展技術,實現對小樣本類別數據的擴展,達到不同類別數據的樣本均衡,以此解決基于機器學習的雷達型號識別技術對大樣本數據過擬合的問題,提高模型的泛化能力,提升對偵察低截獲雷達的型號識別準確度。
本文提出一種針對低偵察目標的雷達型號識別技術框架,如圖1所示。在已有智能處理識別基礎上,增加基于K-means和組合采樣的樣本均衡技術:首先,運用K-means算法對各型號樣本進行聚小類處理;進一步,對于樣本數量少的小類,運用SMOTE方法進行樣本擴充,對于樣本數量過多的小類,運用隨機采樣方法進行樣本抽樣。以此形成數量充足、分布均衡的樣本數據,達到對機器學習算法的充分訓練,形成泛化能力更強、適應性更廣的智能識別模型,解決運用人工智能方法對偵察低截獲雷達型號識別率低的問題,提升電子戰系統或裝備對威脅電子目標的識別效果。

圖1 針對偵察低截獲雷達的型號識別框架
受限于戰場環境和偵收條件,所收集的雷達型號樣本數據往往存在類別不均衡的現象。因此,雷達型號識別問題屬于不平衡分類問題,導致運用基于機器學習方法的識別結果向樣本數量多的類別傾斜,而忽略樣本少的類別,造成整體分類效果不理想。
針對上述問題,提出一種基于K-means和組合采樣的樣本均衡方法,用以對雷達型號樣本庫進行均衡處理,以此降低由于樣本不均衡造成識別準確度低的問題,以二分類為例,所提出的技術識別流程如圖2所示。

圖2 基于組合樣本采樣的識別流程圖
SMOTE是一種被廣泛應用于不平衡分類問題的數據預處理方法[6]。SMOTE基本思想是在每個少數類樣本和K個類內近鄰樣本之間線性插值,隨機地生成一個新樣本。因為合成的樣本是兩個樣本間的隨機值,所以能有效增加少數類樣本多樣性,解決了由隨機過采樣導致的過擬合問題。SMOTE原理如圖3所示。

圖3 SMOTE算法說明圖
SMOTE算法運用K-NN算法計算近鄰,K-NN分類算法是數據挖掘領域一種非常成熟而典型的分類方法,具有思路簡單、易于實現的優點,同時往往具有較高的分類準確率。算法基本思路是給定含有類別標簽的標記樣本集,對于無標簽的待測樣本,計算其與所有已標記樣本集中所有樣本的距離,選擇聚類最近的K個樣本作為近鄰,然后根據這K個近鄰樣本的類別標簽,采用少數服從多數的原則對待測樣本進行類別標注。
SMOTE的基本步驟為:
首先,利用K-NN算法,在類內尋找少數類樣本Xi的K個近鄰樣本,作為合成新樣本的根樣本,樣本間的相似性度量用歐氏距離來表示為
(1)
然后,從K個根樣本中隨機選擇一個作為合成樣本的輔助樣本,重復n次,在Xi和每個輔助樣本Xij之間進行線性插值,最終得到n個新合成樣本。線性插值可表示為
Xnew=Xi+(Xi-Xij)·γ
(2)
其中,Xi是原有樣本;Xij是近鄰樣本,j=1,2,…,K;γ是[0,1]之間的隨機數;Xnew是新合成的樣本。
新體制、多功能雷達呈現模式多樣、頻率捷變快、參數變化多的特點。同一雷達型號的樣本數據呈現離散程度高,分布不平衡的特點。如機載相控陣雷達,大部分時間工作于搜索或跟蹤模式,造成我方偵收、處理形成的參數大多為上述兩種模式的樣本,而缺少LPI、頻率分集等特殊運用模式的樣本。造成同一雷達型號的樣本數據呈現出類內不均衡的特點。
如果直接運用SMOTE方法對上述類內不均衡的樣本進行采樣,所形成的樣本數據分布無法擬合真實的樣本分布情況,難以全面刻畫雷達型號的樣本特征,造成對LPI等特殊模式下雷達的識別準確度低。直接運用SMOTE擴增造成識別錯誤的示意如圖4所示。

圖4 類內不均衡導致識別錯誤示意
針對上述問題,本文提出結合K-means和SMOTE的樣本均衡方法。運用K-means方法對不同類別的雷達型號進行類內的聚類,形成類內的小類劃分;進一步,運用SMOTE和隨機采樣方法對所有小類進行均衡處理,以此形成類內、類間分布均衡的樣本數據集。
K-means聚類是一種無監督學習方法,可用于分析數據的分布特性[7]?;静襟E如下:
1)選取K個初始聚類中心;
2)分別計算每個樣本點到K個簇心的距離(一般為歐氏距離),找到離該點最近的簇心,將其劃分到對應的簇;
3)所有樣本點被劃分到K個簇后,重新計算各簇中心(平均距離中心);
4)反復迭代步驟2)和3),直到達到終止條件。
為獲取同一類別內樣本的分布信息,利用K-means對每類樣本進行聚類,使特征參數接近的樣本歸為統一小類。每種型號的樣本可被劃分為多個小類。
對于樣本數量少的小類,運用SMOTE方法進行插值擴增。對于樣本數量冗余的小類,運用隨機不放回抽取的方法,對樣本進行抽樣精簡。以此,形成小類間樣本數據相當的均衡樣本集。對小類進行處理的過程如圖5所示。

圖5 樣本均衡過程示意
本節運用仿真形成的7型雷達型號數據驗證所提出方法的有效性。利用識別率RC評估分類效果(NC為識別正確的樣本個數,NA為待識別樣本總數)
(3)
本文分別運用原始樣本和均衡后樣本對卷積神經網絡模型進行訓練,并對比分析上述兩種情況的識別準確度。
本文采用的卷積神經網絡由三個卷積計算層(卷積層+池化層)和一個全連接層組成。網絡結構示意如圖6所示。

圖6 本文采用的卷積神經網絡示意
圖7、圖8分別為A、D兩種型號均衡前后的樣本分布圖。由圖可以看出,對于每一種型號,采用本文提出的樣本擴展方法,能在不改變原有樣本總體分布的基礎上,對各參數范圍內的樣本進行合理擴充,既能讓每個新增樣本與原有樣本保持相似,也能夠對樣本比例進行一定調整,使得各小類的樣本數目更加均衡,從而確保模型具有良好的訓練效果。

圖7 型號A原始樣本與均衡后樣本分布圖

圖8 型號D原始樣本與均衡后樣本分布圖
表1為均衡前后各型號樣本數量的對比情況,從表1中可看出,運用所提出方法進行樣本均衡后,各型號的樣本數量能夠達到相同的數量級。

表1 各型號樣本數量
為進一步說明組合樣本均衡方法對識別性能提升的有效性,表2給出了樣本均衡前后,卷積神經網絡對不同型號的識別準確度。

表2 不同型號的識別結果
由表2可知,低偵察型號A、B、F、G的識別準確率均得到顯著提高。圖9詳細給出了均衡前樣本和均衡后樣本訓練生成模型對型號A的識別結果對比圖(其中0為正確識別、1為錯誤識別)。可得出,所提出方法能夠有效提高對低偵察型號的識別準確度。

圖9 型號A識別結果圖
對于樣本數據充足的型號C、D、E,識別準確度仍能保持在98%以上,表明對于樣本充足型號,所提出方法能夠保持原有的高識別準確度。
以上實驗結果表明,本文提出的組合均衡方法能夠有效解決樣本數據不平衡的問題,改善機器學習算法對大樣本過擬合情況,使得訓練生成的識別模型能夠同時適用于大樣本和小樣本場景,具備更強的泛化能力,整體提升機器學習算法對雷達型號的識別準確度。
本文研究并設計了一種基于K-means和組合采樣的樣本均衡方法:針對新體制雷達參數分布廣的特點,首先提出運用K-means算法對各型號雷達樣本進行聚類處理,將特征相似的樣本劃分為同一小類;進一步,提出了基于組合采樣的樣本均衡策略,對樣本量較少的低偵察型號采用SMOTE擴充,對樣本量充足的型號采用均勻抽樣去冗余,以實現各型號樣本數量的平衡。仿真結果表明,本文方法能有效增強智能識別模型的可靠性和泛化能力,明顯提升了偵察低截獲雷達的型號識別準確率,同時也能保持樣本充足型號的高識別準確度,具有較高的工程應用價值。