孫晶明, 虞盛康, 孫 俊
(1. 南京電子技術研究所, 江蘇 南京 210039; 2. 中國電子科技集團公司智能感知技術重點實驗室, 江蘇 南京 210039)
雷達自動目標識別(radar automatic target recognition,RATR)是雷達研究與應用的一個重要領域。高分辨距離像(high resolution range profile,HRRP)是實現實時目標識別的重要雷達特征,提供了用寬帶雷達信號獲取目標回波的距離維信息,反映了豐富的目標結構特征,如目標尺寸、散射點分布等,且易于獲取和處理,因此成為國內外備受關注的研究熱點。然而,使用HRRP進行目標識別仍然存在很多難點問題,其中姿態敏感性是影響HRRP-RATR性能的主要因素。
當高分辨雷達發射帶寬足夠大的信號時,目標回波在距離維上擴展至多個單元。采用散射點模型簡化表示雷達目標,則HRRP中的尖峰是各距離單元內所有散射點的矢量合成,若散射點沒有發生越距離單元變動,則各尖峰的相對位置關系不變;而散射點的后向散射性質隨目標相對于雷達姿態角的改變而改變,因此尖峰幅度是隨姿態快變的。這兩個原因造成了HRRP的姿態敏感性,進而導致HRRP-RATR的關鍵步驟特征提取的性能很難得到保證。
針對HRRP識別的姿態敏感性問題,研究者們提出了三大類解決方法。第一類方法是提取姿態不敏感特征。這類方法是依據特定的準則函數提取目標的區分性特征。常用的有核主分量分析法等,能夠降低數據維度,但所提特征的信息損失較大,識別性能受限。第二類方法是分角域處理。文獻[12]從如何分角域的角度,研究了統計建模自適應分角域的方法,將姿態角連續分布的HRRP樣本按不同角域切分為若干段分別處理,以緩解HRRP的姿態敏感性。文獻[13]從如何有效地提取出可代表各角域樣本中心的模板的角度,研究了HRRP平均模板或統計特征模板的生成方法,在一定程度上可提升目標識別性能。第三類方法是設計性能優良的分類器。文獻[15]采用多個分類器融合,得到最終的識別結果,具有較強的魯棒性。但這類方法設計難度較大,且并沒有解決姿態敏感性問題。除了算法方面的研究,還有文獻從理論上分析了姿態敏感性問題。文獻[17]通過分析表明,閃爍現象導致HRRP波形發生劇變,使得各角域內的HRRP相似度下降,對傳統分角域處理的識別方法的性能產生嚴重影響。
鑒于傳統方法不能很好地解決HRRP的姿態敏感性問題,當前在圖像識別領域大獲成功的深度學習技術開始被廣泛應用于HRRP-RATR任務中,特別是卷積神經網絡(convolutional neural network,CNN)。深度網絡模型區別于傳統淺層機器學習模型的地方在于其深度網絡結構、大規模的網絡模型參數和訓練模型所需的大數據條件。深度CNN的卷積層的作用類似于特征提取器,可以學習從低層到高層的豐富的內在結構特征。圖像識別領域的大量成功案例顯示出CNN在特征提取和表示學習中的強大能力。
本文借鑒CNN在圖像識別中的應用,建立了適用于HRRP-RATR基于CNN的識別框架。在將深度網絡模型應用于HRRP-RATR時,通過預處理或網絡設計方式降低了幅度敏感性、平移敏感性、姿態敏感性。并針對實際應用時的數據錄取需求,進行了詳細的姿態角性能測試實驗和結果分析。實驗結果表明,CNN方法具有一定的抗姿態敏感性特性,可降低實際數據錄取工作對樣本姿態角覆蓋的要求。
CNN將多個卷積層進行堆疊,不僅具有傳統神經網絡的優勢,如良好的錯誤容忍度、自適應性、自學習能力,而且具有自動特征提取的能力和權重共享的特性。
本文利用原始HRRP的幅度信息作為預處理的輸入。如無特別說明,后文中的HRRP均指原始HRRP的幅度信息的簡稱。
針對HRRP的平移敏感性問題,人為生成訓練數據的平移讓CNN“看見”這種類型的變化。給定一個HRRP∈,生成的HRRP可寫為

(1)
式中:是循環平移量,可正可負,意味著左循環平移或右循環平移;且′與有相同的尺寸。為了保證目標信號不越界,可以設定平移窗范圍,這里選擇[-200,200]個距離單元。值得一提的是,這種解決平移敏感性問題的方式同時也起到了數據增廣的效果,增大了訓練樣本量。
針對HRRP的幅度敏感性問題,將每個HRRP按極差變換方式進行歸一化處理:

(2)
因為CNN擅長處理圖像,灰度圖像的動態范圍在[0,255]內,所以為了獲得用于HRRP-RATR的CNN的最優性能,需要將所有HRRP的動態范圍統一到[0,255]內。
針對HRRP的姿態敏感性問題,構造一個用于HRRP-RATR的內嵌了目標姿態角處理的網絡,可提取不敏感于目標姿態的特征。
根據前面對預處理的描述可知,相比于傳統預處理方法,本文采用的預處理技術更簡單易用,但預處理對保證CNN的性能至關重要。
本文提出的CNN結構如圖1所示。

圖1 提出的CNN結構Fig.1 The proposed CNN structure
CNN包含10個卷積層,每層都后接一個非線性激活層,以及4個最大池化層,2個1 024單元的全連接層,1個全連接的softmax輸出層。輸入是預處理后的HRRP,且每個HRRP的維度是1×1 024。輸出是目標類型的近似后驗概率分布,其顯著特點是采用不同于一般圖像識別的一維卷積核。
實際上,實驗中已經嘗試過將HRRP整形為4×256和32×32兩種格式作為CNN的輸入,但識別性能較差,主要原因可能是這樣強行改變樣本維度會破壞HRRP的內在結構特性。因此,在接下來的實驗中,都采用1×1 024形式的HRRP作為CNN的輸入。
實驗數據采用某波段雷達錄取的6種飛機目標P1~P6的寬帶數據。目標姿態角范圍為0°~180°,信噪比分布范圍為10~50 dB。為了避免引入類間不平衡問題,將整個姿態角范圍以2°為間隔劃分為90個角域,每個角域隨機抽取200個HRRP樣本。這樣,數據集總共有108 000個樣本。
數據的預處理操作如第1.1節所述。主要訓練參數如下:
(1) 迭代次數:200 000;
(2) 批處理大小:256;
(3) 初始學習率:0.01;
(4) 優化器:SGD;
(5) 正則化方式:L2。
實驗運行環境為Caffe,GPU(GTX 1080),CPU(E5-2620 V4)。
當訓練集樣本的姿態角缺失時,導致訓練過擬合,嚴重影響網絡的泛化性。實驗目的是探究訓練集樣本姿態角覆蓋與識別性能的關系,以指導實際應用中的數據錄取工作。
2.2.1 散度角測試
將所有數據以10°為步長,每10°、20°、30°、40°、50°、60°只取2°數據訓練,剩余數據測試,共分為6組。但這樣劃分數據集會造成第2~6組的測試集樣本量明顯多于第1組(實際上,第2~6組的測試集都包含第1組),為了方便進行各組實驗結果的對比分析,需統一測試集樣本量標準,因此6組實驗中都以第1組的測試集作為標準測試集。具體數據量設置如表1所示。

表1 實驗數據設置
由于姿態角測試不可避免地與樣本量因素耦合在一起,因此需結合全姿態角的樣本量性能曲線進行分析,得到平均識別率曲線隨訓練集樣本量的變化趨勢如圖2所示。平均識別率計算公式為

(3)
式中:表示第類正確識別的測試集樣本量;表示第類總的測試集樣本量;表示目標類型數。

圖2 識別性能與訓練集樣本量的變化關系Fig.2 Relationship between recognition performance and sample size of training set
通過對比可以看出,在保持訓練集樣本量相同的前提下,隨著訓練集樣本姿態角間隔逐漸增大,缺姿態條件下的CNN性能相比于全姿態條件下的CNN性能惡化越來越嚴重。當訓練集樣本量為10 800且訓練集樣本姿態角間隔為20°時,CNN平均識別率達到80%;當訓練集樣本量為6 000且訓練集樣本姿態角間隔為40°時,CNN平均識別率達到72%。
為了進一步分析散度角情況下各目標姿態角域的識別性能,按姿態角域統計平均識別率的分布情況,如圖3所示。可以看出,當訓練集樣本姿態角間隔為40°時,迎頭方向仍能保持較好的識別性能,尾后次之,側向較差。

圖3 訓練集樣本姿態角間隔為40°時的識別性能統計Fig.3 Recognition performance statistics of training set samples with 40° pose angle interval
采用t分布隨機鄰域嵌入(t-distributed stochastic neighbor embedding, t-SNE)方法將CNN提取的識別特征投影到二維平面上的分布,如圖4所示。通過對比可以看出,隨著訓練集樣本姿態角間隔變大,不同類型目標之間的分類界限逐漸模糊,識別性能逐漸下降。

圖4 特征二維投影分布對比Fig.4 Comparison of two dimensional projection distribution of features
2.2.2 跨角域測試
將所有數據按20°一個角域進行劃分,只取0°~20°或80°~100°或160°~180°數據訓練,剩余數據分角域測試,共分為3組。具體數據量設置如表2所示。

表2 實驗數據設置
為了分析跨角域情況下各姿態角域的識別性能,按姿態角域統計平均識別率的分布情況,如圖5所示。

圖5 只取特定角域數據訓練時的識別性能統計Fig.5 Statistics of recognition performance when training with only specific angle domain data
通過對比可以看出,測試集樣本中與訓練集樣本姿態角鄰近的角域識別性能優于遠離的角域識別性能。考慮到實際存在姿態角估計誤差,因此當前采用的CNN模型不具備跨角域識別的能力。
2.2.3 姿態角標簽測試
將所有數據按30°一個角域進行劃分,但不是用機型作為標簽,而是用姿態角域作為標簽,分為6類。按9∶1比例均勻分成訓練集和測試集,即訓練集樣本量為97 200,測試集樣本量為10 800。
用姿態角域作為標簽的識別混淆矩陣如圖6所示,平均識別率為80%。從識別混淆矩陣上看,迎頭和尾后方向的鄰近角域的相關性較強,識別混淆性較大;而側向的鄰近角域的相關性較弱,識別混淆性較小。這也間接說明,在實測數據錄取時,可以適當放寬迎頭和尾后方向的訓練集樣本姿態角間隔(樣本相關性強),而對于側向仍需要較密集地錄取數據(樣本相關性弱)。

圖6 用姿態角域作為標簽的識別混淆矩陣Fig.6 Recognition confusion matrix using pose angle domain as label
采用t-SNE方法將CNN提取的識別特征投影到二維平面上的分布如圖7所示。可以看出,各姿態角域的點集呈現較明顯的簇分布,鄰近角域的點集交疊區域較大,這也印證了識別混淆矩陣的結果。

圖7 特征二維投影分布Fig.7 Two dimensional projection distribution of features
根據實驗結果,形成如下基本結論。
(1) 對于信噪比大于10 dB的寬帶HRRP數據,在不考慮拒判的前提下,當訓練集樣本姿態角間隔為20°且訓練集樣本量在10 000以上時,可滿足6類飛機的識別率大于80%的要求。
(2) 考慮對飛機目標姿態角估計誤差約為10°,在訓練集樣本姿態角間隔30°以內,通過增大訓練集樣本量,可以提升識別性能。
(3) 當訓練集樣本姿態角間隔為40°時,迎頭方向仍能保持較好的識別性能,尾后次之,側向較差。
(4) 在實測數據錄取工作中,當全姿態數據的錄取條件不具備時,可以適當放寬迎頭和尾后方向的訓練集樣本姿態角間隔的限制到30°,而對于側向仍需要較密集地錄取數據(10°以內),并在可錄取的姿態角域內盡可能地增大訓練集樣本量到10 000以上。
本文提出了一種新穎的基于CNN的HRRP-RATR方法,并針對實際應用時的數據錄取需求,在實測HRRP數據上進行了詳細的姿態角性能測試實驗和結果分析。實驗結果表明,精巧設計的CNN方法具有一定的抗姿態敏感性特性,可降低實際數據錄取工作對樣本姿態角覆蓋的要求。并通過分析獲得了4條具有實用價值的結論,可為工程化應用提供指導。