劉丹陽, 吳 堃, 朱永鋒, 張永杰, 周劍雄
(1. 國防科技大學電子科學學院, 湖南 長沙 410073; 2. 北京遙感設備研究所, 北京 100854)
雷達自動目標識別技術在民用和軍事領域有著廣泛的應用。高分辨距離像(high resolution range profile, HRRP)是目標強散射中心在雷達視線上的投影,反映了目標物理結構的特征[1-2]。高分辨率雷達可以降低地雜波的平均功率,識別復雜環境中的地面目標,因此常用HRRP對地面目標進行分類識別[3-4]。針對HRRP識別的研究主要包括數據預處理、基于HRRP的特征提取、特征選擇和分類器設計[5-6]?;贖RRP的特性,通常采用神經網絡作為分類器來識別雷達目標[7]。
雷達目標識別中,如何提取目標的特征并對特征進行選擇是關鍵。文獻[8]提出了一種基于匹配度的距離像識別方法,直接使用HRRP作為特征向量進行識別,這種方法沒有幅度敏感性。但由于HRRP數據維度較高且具有平移敏感性和姿態敏感性,需要對HRRP進行特征提取再進行目標識別,達到降低維數、提高特征穩健性的目的。文獻[9-10]使用參數化特征提取方法,提出基于簡單散射中心模型的Relax算法,具有低維數和高精度性能。由于地面目標的復雜性,對HRRP提取單個特征往往不能達到較好的識別效果,因此可采用特征提取方法提取多個特征作為特征集合進行綜合識別。
對特征提取得到的特征集合還可以進行進一步特征優選,通過特征選擇方法從原始特征集合中選擇出評估最佳的特征子集,即選出與分類相關的特征,去除無關和冗余的特征,達到降低特征維數、避免維數災難[11]的目的,防止出現隨著特征維數增加識別性能不升反減的現象。在特征選擇后,分類器對目標的識別效果不會減弱,算法的泛化能力也有所提升。特征選擇方法根據是否依賴于后續的分類識別算法可分為過濾式和封裝式兩種[12-14]。對HRRP 特征選擇通常使用Fisher 準則函數來評價特征性能的質量,從而得到最優特征子集[15]。基于Fisher 準則系數的特征選擇方法僅適用于對單個特征進行可分性測度評價,不適用于對特征集合進行特征選擇。
Kullback-Leibler(KL)散度,又被稱為相對熵,是基于概率分布的可分性測度,代表了區分兩類目標的總的平均信息[16]。本文提出一種基于KL散度的特征選擇方法,利用地面目標HRRP仿真數據和實測數據分別進行識別實驗,實驗結果證明所提出的特征選擇方法在基本保持或提升特征集的識別性能的前提下,能保持甚至提升識別的穩健性,具有較好的應用價值。
距離像識別主要包括預處理、特征提取和分類器分類3個部分。在特征選擇之前,要進行預處理和特征提取。
在特征提取之前,需要對HRRP進行預處理,主要包括幅度歸一化和噪聲抑制處理。
1.1.1 幅度歸一化
為降低HRRP幅度敏感性,需要對輸入原始HRRP的幅度歸一化處理:
(1)
prof2(n)=prof1(n)/Ep
(2)
式中:prof1(n)(n=0,1,…,N-1)為原始輸入HRRP;Ep為輸入HRRP的最大值;prof2(n)為幅度歸一化后的HRRP。
本文采用的信噪比(signal to noise ratio, SNR)是最嚴格的峰值SNR,定義單幅距離像的峰值SNRS為
(3)
式中:σ2為prof1(n)的噪聲平均功率。
1.1.2 噪聲抑制處理
對歸一化后的HRRP進行噪聲抑制處理:
prof(n)=prof2(n)·sgn(prof2(n)-An)
(4)
(5)
式中:An為抑制噪聲門限;x為抑制噪聲門限系數;prof(n)(n=0,1,…,N-1)為抑制噪聲后的幅度距離像。
一維距離像的特征反映了目標的物理結構特性??梢詮念A處理得到的幅度距離像上提取目標長度、強散射中心數目等特征形成特征矢量。
記T為距離像上超過門限的峰值的位置集合:
T={n/prof(n)>An,prof(n)>prof(n+1),
prof(n)>prof(n-1)},
n=1,2,…,N-2
(6)
距離像的重心被定義為
(7)
式中:nc(1≤nc≤N)根據四舍五入準則取整數。
直接從一維距離像prof(n)中提取如下距離像特征:
P1=length(T)
(8)
(9)
P3=T(tend)-T(1)+1
(10)
(11)
(12)
(13)
(14)
(15)
(16)
(17)
(18)
(19)
式中:T(t)(t=1,2,…,tend)為距離像上超過門限的峰值位置集合;tcent為T的中心點,由對tcent/2取整得到;P1為強散射中心數目;P2為峰值距離單元數目;P3為距離像的主體長度;P4為距離像偏度;P5為距離像方差;P6為差分距離像能量;P7為距離像的熵;P8為距離像二階矩;P9為距離像三階矩;P10為距離像均值;P11與距離像強散射中心個數有關;P12為距離像關于強散射中心的偏度。
針對P7,當ni符合prof(ni)=0時,令prof(ni)=An。
上述P1~P3、P11是基于提取強散射中心的特征,P4~P6、P10、P12反映距離像的幅度特性,P7為距離像的熵,P8~P9分別為二階矩、三階矩,P4、P11、P12反映距離像的空間分布對稱性程度。
到此為止,成功提取了距離像的特征矢量P,為P1~P12的合集。
以上就是對HRRP進行預處理和特征提取的算法流程。
在實際應用中,HRRP樣本集合中的距離像的SNR、俯仰角和帶寬3個參數不唯一且有可能浮動較大。為在盡可能多的情況下達到較好的識別效果,期望得到一組特征集合,對距離像樣本提取該特征集合, 可以適應3個參數變量的改變。


圖1 距離像特征選擇算法流程圖Fig.1 Flow chent of HRRP feature selection algorithm
在不同參數下優選得到的特征子集不同??紤]的參數變量包括HRRP樣本的SNR、俯仰角和帶寬等,需要通過特征選擇準則函數,使得到的特征子集對參數變量具有較好的泛化能力和識別能力。
散度代表了區分兩類目標的總的平均信息。采用基于散度的準則函數對特征提取后的特征向量進行特征選擇,從原始特征集合中選擇出評估標準最佳的、具有泛化能力的特征子集。
本文僅討論3類目標特征選擇。分別對3類目標的HRRP樣本提取特征向量P中的特征Pk(k=1,2,…,12),得到特征值分布的概率密度函數f(Pk|w)(w=1,2,3);對于特征值Pk,定義wi類對wj類的散度為Jij[17],計算方式如下:
Jij=
(20)
式中:f(Pk|wi)和f(Pk|wj)分別為wi,wj類的概率密度函數;wi、wj∈{1,2,3}且wi≠wj。
同一特征值對應的散度具有對稱性,即
Jij=Jji
(21)
因此,要分析3類目標差異性,只需分析J12、J13和J23即可。定義單個特征的散度J為J12、J13和J23的均值:
J=(J12+J13+J23)/3
(22)
特征對3類目標的平均分類能力越強,散度J越大。
本文中采用的 KL 散度,可以理解為可分性的一個測度,究其實質,是不同目標類型之間的類間距和類內距的一種描述。從式(22)可以看出,本文采用的特征選擇算法僅針對了3類目標的類間差異性,對于單個目標的類內一致性,沒有給出討論,后續會補充相關實驗分析。
有了散度這一基本判據,需要采用準則函數對原始特征集合進行特征選擇。本文基于散度J,從給出的12個特征值Pk中優選6個較好的特征作為最優特征子集。
首先,分別針對單個變量進行特征選擇。以SNR作為變量為例,假定HRRP樣本的SNR范圍為20~30 dB,間隔1 dB,SNR種類數SNUM=11。通過在SNUM種SNR下、12個特征值下的散度,計算出特征值Pk在SNUM種SNR下的散度均值:
(23)


綜合3個變量,提出總準則函數F:
F(k)=
(24)

因為散度越大,綜合分類識別能力越強,所以F(k)(k=1,2,…,12)值越大,特征值Pk對3類變量的綜合泛化能力和識別能力越好。對準則函數值F進行降序排序,選取前6個準則函數值F(k)對應的特征Pk作為優化的特征子集。
實際應用中,對距離像數據集,當算法中涉及相關參數變化時,對不同參數下的距離像樣本計算散度值,并應用準則函數計算每個特征的散度均值,即可得到選擇后的特征集合。

HRRP識別包括3個步驟:預處理、特征提取和分類器分類。
識別分為訓練和測試兩個階段。首先是訓練階段,在對訓練數據進行預處理和特征提取后將特征向量導入分類器,訓練得到分類器結構及分類器參數;然后,是測試階段,對測試數據進行預處理和特征提取后,將特征向量和網絡參數導入分類器,得到測試數據識別結果。HRRP識別算法流程圖如圖2所示。

圖2 距離像識別算法流程圖Fig.2 Flowchart of HRRP recognition algorithm
圖2中,prof1(n)和prof(n)分別為原始輸入HRRP和預處理后的HRRP。此處應特別注意,特征提取后的特征向量在特征選擇前指提取全部的特征向量P,在特征選擇后指提取特征子集PJ。
因為提出的特征集合維度低且實時性好,所以識別實驗采用3層簡單神經網絡作為識別分類器。分類器輸入為樣本距離像對應的特征向量P,對輸出結果進行處理,可得到樣本的識別結果。本節實驗可以證實,使用該分類器對地面目標進行識別可以達到良好的識別效果。
將測試數據的平均識別率看作識別結果的重要指標。定義平均識別率Pa為
(25)
式中:mw為測試數據中目標w被正確識別的個數;M表示3類目標樣本總數。
穩健性特征選擇方法是指在算法中涉及相關參數變化時,特征選擇得到的特征子集能夠穩定保持較高的平均識別率。本文提供了一種可以根據距離像數據進行特征選擇的算法,對本文識別實驗而言,選用的特征子集與距離像數據有關。
本節首先采用仿真數據進行實驗,綜合HRRP SNR、俯仰角和帶寬3個參數變量,應用基于散度的準則函數進行特征選擇,得到優選的特征子集,將特征子集帶入分類器,分析特征子集對3個參數變量的泛化能力和識別性能。然后采用實測數據,進行特征選擇方法在實際應用中的識別性能驗證。
仿真實驗采用的數據由圖形電磁計算軟件GRECO計算得到。仿真數據參數如表1所示。仿真數據是目標在給定的俯仰角和方位角下,信號的頻域數據。對所有姿態下的數據進行頻率維傅里葉變換,就可以得到目標在給定姿態角下的一維距離像。

表1 仿真數據參數
在仿真實驗中,選取了3類車輛作為待識別的目標,分別是目標1、目標2和目標3。對3臺目標車輛各隨機選取一幅HRRP圖,如圖3所示。
在仿真實驗中,需要對原始距離像數據添加高斯白噪聲,SNR采用式(3)中的峰值SNR。
對加噪聲后的一維距離像進行數據預處理和特征提取,生成特征向量P,再對P進行特征選擇,即可得到特征子集。進行特征選擇首先要確定使用的HRRP數據。

圖3 待識別目標車輛HRRPFig.3 HRRP of target vehicle to be recognized
為選擇出對HRRP樣本的3個變量都具有穩健識別能力的特征子集,需要綜合針對HRRP樣本的3個變量進行特征選擇。表2列出3組可用于特征選擇的HRRP數據,每組數據只改變一個變量,固定另外兩個變量,例如數據1只改變HRRP的SNR,固定俯仰角和帶寬。數據2和數據3分別以HRRP的俯仰角和帶寬作為變量。

表2 用于特征選擇的HRRP數據
對數據1樣本集分別提取3類目標的特征向量P,得到P中的特征Pk,k=1,2,…,12分布的概率密度函數f(Pk|wi)(wi=1,2,3)。以特征3為例,圖4為3類目標分別關于P3的概率密度函數曲線。
從圖4可以看出,3個目標關于P3的概率密度分布不同,目標2和目標3的概率密度函數曲線重疊程度最小,可區分度最大;目標1和目標3的概率密度函數曲線重疊程度最大,可區分度最小。根據概率密度函數可以求出散度J12=8.95;J13=3.70;J23=10.39。其中,J23最大,J13最小,與分布曲線符合。可見利用目標間特征值的散度來評價目標可分性具有可行性。

仿真實驗中,集合PJ中的特征排列順序按照F值降序排列,即按照特征值對3類目標的綜合分類能力降序排列,選出特征子集PJ={P3,P8,P9,P2,P11,P1}。得到的特征子集PJ可作為優化的特征選擇方法應用到HRRP識別中。
不同的訓練數據生成不同的分類器網絡參數,影響目標的平均識別率。仿真實驗在HRRP數據的SNR、俯仰角和帶寬3個變量分別變化時,將特征選擇前的特征向量P和特征選擇后的特征子集PJ訓練生成的分類器參數進行對比,對比二者參數對測試數據的泛化能力和識別性能,探究特征選擇方法的可行性。
3.1.1 SNR分析
固定訓練數據和測試數據的俯仰角為30°~40°、帶寬為1 GHz。對于SNR為23 dB的訓練數據,分別基于全部特征P和特征子集PJ進行特征提取并訓練得到分類器參數;測試數據SNR分別取20~35 dB,間隔1 dB,通過載入不同的分類器參數得到3類目標在特征選擇前后不同SNR下的平均識別率,如圖5所示。圖5中,兩條曲線代表在不同特征集合導入分類器訓練后得到的參數下,測試數據SNR與目標平均識別率的關系曲線。

圖5 特征選擇前后測試數據SNR與平均識別率的關系Fig.5 Relationship between the SNR of the test data and the average recognition rate before and after feature selection
由圖5可以看出:
(1) 隨著測試數據SNR的增大,特征選擇前后的特征集合的識別能力都在提高,特征集合大部分情況下的識別能力略高于特征子集,差距一般不超過1%,但特征子集的識別能力變化更為平穩;
(2) 在中高SNR(22~35 dB)測試數據下,特征子集與全部特征識別性能相近,目標Pa均大于87%;
(3) 在低SNR(20~21 dB)測試數據下,特征子集識別性能略優于全部特征。
因此,相比特征選擇前,特征選擇后的特征子集在犧牲極小的識別性能的前提下,對不同SNR的測試數據具有更好的泛化能力。
3.1.2 俯仰角分析
固定訓練數據和測試數據的SNR為23 dB,帶寬為1 GHz。對于俯仰角為30°~40°的訓練數據,分別基于全部特征P和特征子集PJ進行特征提取,并訓練得到分類器參數;測試數據俯仰角分別取30°~40°,間隔1°,通過載入不同參數的分類器得到3類目標在特征選擇前后不同俯仰角下的平均識別率,如圖6所示。

圖6 特征選擇前后測試數據俯仰角與平均識別率的關系Fig.6 Relationship between the elevation angle of the test data and the average recognition rate before and after feature selection
圖6中,兩條曲線代表在不同特征集合導入分類器訓練后得到的參數下,測試數據俯仰角與目標平均識別率的關系曲線??梢钥闯?
(1) 測試數據在低俯仰角(30°~37°)下,Pa略高于在高俯仰角(38°~40°)下的Pa,但Pa均達到82%以上,識別性能良好;
(2) 在高俯仰角(38°~40°)測試數據下,特征子集的識別率略高于全部特征,不超過2%;在低俯仰角(30°~37°)測試數據下,特征子集的識別率略低于全部特征,不超過1.5%。綜合看來,相比特征選擇前,特征子集對所討論的不同俯仰角測試數據具有更好的穩健識別能力。
綜上所述,相比特征選擇前,特征選擇后的特征子集對所討論俯仰角測試數據的識別能力得到基本保持并在測試數據低俯仰角范圍略有提高,具有更好的穩健識別能力。
3.1.3 距離分辨力分析
固定訓練數據和測試數據的SNR為23 dB,俯仰角為30°~40°。對于帶寬為600 MHz的訓練數據,分別通過特征提取得到全部特征P和特征子集PJ,分別訓練得到二者的分類器參數;測試數據顆粒度保持一致,帶寬分別取200 MHz~1 GHz,間隔100 MHz,距離分辨力逐漸上升。通過載入不同參數的分類器得到3類目標在特征選擇前后不同帶寬下的平均識別率,如圖7所示。

圖7 特征選擇前后測試數據帶寬與平均識別率關系Fig.7 Relationship between the bandwidth of the test data and the average recognition rate before and after feature selection
圖7中,兩條曲線代表在不同特征集合導入分類器訓練后得到的參數下,測試數據帶寬與目標平均識別率的關系曲線??梢钥闯?
(1) 數據帶寬不低于400 MHz時,隨著測試數據帶寬的增大,距離分辨力提高,特征選擇前后的特征集合的目標Pa都在提高,但特征子集的識別能力略低于全部特征,不超過1%,即相比特征選擇前,特征選擇后的特征子集在犧牲極小的識別性能的前提下,降低了特征維度;
(2) 在帶寬600 MHz~1 GHz測試數據下,特征選擇前后的特征集合識別性能均較好,目標Pa均在80%以上;
(3) 在低帶寬(200~500 MHz)測試數據下,由于分辨力過低,特征選擇前后的特征集合識別性能均較差。
因此,相比特征選擇前,特征選擇后的特征子集PJ在犧牲極小的識別性能的前提下,對帶寬在600 MHz~1 GHz的測試數據實現了低特征維數的良好識別。
綜合3個仿真實驗結果,得出如下結論。相對于P,PJ訓練生成的分類器參數:
(1) 在犧牲極小的識別性能的前提下,對不同SNR的測試數據具有更好的泛化能力;
(2) 對所討論俯仰角測試數據的識別能力得到基本保持并在低俯仰角范圍略有提高,具有更好的穩健識別能力;
(3) 在犧牲極小的識別性能的前提下,對帶寬在600 MHz~1 GHz的測試數據實現了低特征維數下的良好識別。
本小節實驗針對3個變量,分別進行穩健性分析,證明特征選擇方法在犧牲極小的識別性能的前提下保持甚至提升了識別的穩健性,驗證了所提方法的可用性。
實測數據實驗使用了車輛和角反射器一共3類地面目標的實測HRRP數據。實測數據波段為X波段,距離分辨力為0.3 m。3類地面目標分別為目標A、目標B和目標C,目標實物圖如圖8所示。

圖8 待識別目標Fig.8 Target to be recognized
對實測數據HRRP分別采用全部特征P和特征子集PJ作為特征提取集合進行目標識別。在進行訓練和測試后,得出特征選擇前后的識別混淆矩陣(見表3和表4)。
表3為特征選擇前的識別混淆矩陣?;煜仃嚧砟繕薃、B和C分別被識別為目標A、B和C的概率,例如,0.71代表目標B被識別為目標A的概率為0.71%,主對角線數值分別代表3類目標的正確識別率。采用全部特征P進行分類識別的3類目標Pa為93.62%。

表3 特征選擇前的識別混淆矩陣
表4為特征選擇后的識別混淆矩陣。采用特征子集PJ進行分類識別的3類目標Pa為91.37%。

表4 特征選擇的后識別混淆矩陣
對比表3和表4可以發現,相比全部特征P,采用特征子集PJ進行分類識別可以保證目標平均識別率基本不變,證明了基于散度的特征提取方法在降低了特征維度的前提下可以保持識別性能基本不變,依然能對地面目標的實測HRRP數據進行較好的分類識別,具有應用性與普適性。
本文提出了一種基于散度的特征選擇方法,對提出的可適用于HRRP地面目標識別的特征集合進行特征選擇,得到優選后的特征子集后再進入分類器識別。
本文采用地面目標仿真數據和實測數據進行了神經網絡分類器識別實驗。仿真數據識別實驗針對HRRP數據的SNR、俯仰角和帶寬3種變量,證明特征選擇方法在基本不降低特征的識別性能的前提下能夠保持甚至提升識別的穩健性,證明了所提方法的可用性。
實測數據識別實驗采用3類地面目標實測HRRP數據,實驗發現,采用特征提取前后特征集進行目標識別,得到的識別性能基本相同,證明了基于散度的特征提取方法在降低了特征維度的前提下可以保持特征集識別性能基本不變,依然能對地面目標進行較好的分類識別,該方法具有實際價值。