張紅莉,李月琴,韓 磊,齊英杰,張 維
(1.北京聯合大學智慧城市學院,北京 100101;2.北京理工大學機電學院,北京 100081)
高分辨距離像(high resolution range profile, HRRP)是雷達各距離單元目標散射回波的矢量和,反映了目標散射點沿雷達徑向距離方向上的分布情況,包含豐富的目標結構、尺寸和形狀信息[1]。相對于SAR/ISAR圖像,HRRP具有易于獲取和計算簡單等優勢[2],因此,基于HRRP的目標識別成為雷達自動目標識別領域的研究熱點。目前基于HRRP的識別主要有:字典學習[3]、模板匹配、統計識別、K近鄰法、支持向量機(SVM)[4]、決策樹等方法[5],但由于這些方法主要是基于雷達數據的淺層特征進行識別,難免會造成有效信息的損失,從而使得目標泛化能力低,識別準確率有待進一步提升[6]。而與傳統識別方法相比,深度神經網絡模型能自主學習更高層次的結構信息[7-8],完成不同目標的分類與識別,獲得比傳統識別方法更好的識別性能,在各個領域得到了廣泛應用。
本文針對傳統的HRRP目標識別方法識別率低、模型泛化能力不足等問題,提出基于LGBM和深度神經網絡的HRRP目標識別方法。該方法使用LGBM特征選擇算法對提取的HRRP特征進行二次選擇,減少樣本維度以提升速度;利用基于Dropout約束的深度神經網絡對選擇的最優目標特征進行分類。
基于HRRP的數據特點,搭建了適用于HRRP目標識別的LGBM及深度神經網絡算法模型,如圖1所示。LGBM是一種改進的梯度提升樹(GBDT)算法,其主要思想是利用決策樹迭代訓練以提升學習器性能,支持高效的并行訓練,具有準確率高、內存消耗低、訓練速度快等優點。本文利用LGBM進行二次特征選擇,將獲得的HRRP目標最優特征樣本數據送入深度神經網絡模型進行訓練學習,達到優化分類器識別效果的目的。

圖1 基于LGBM及深度神經網絡的HRRP目標識別基本框架圖Fig.1 Basic frame diagram of HRRP target recognition based on LGBM and deep neural network
目標識別過程分為訓練階段和識別階段。在訓練階段,通過雷達對目標的探測,得到不同目標的雷達HRRP原始信號;經預處理降低HRRP信號的幅度敏感性后,再基于HRRP的物理和統計等特性提取可以反映目標本質的諸多特征;然后采用LGBM對提取的特征進行選擇,計算每個特征的重要程度并篩選出有利于分類的最優特征,生成目標模板庫;最后將最優特征樣本數據送入Dropout約束的深度神經網絡進行訓練。在識別階段,對待識別的HRRP信號進行同樣的預處理、特征提取操作后,通過LGBM進行特征選擇得到待識別模板,送入訓練好的網絡模型,實現對未知目標的自動識別。
作為一種高分辨率雷達信號,HRRP信號的維數通常在數百維以上,如果直接使用目標原始HRRP信號進行識別,不僅會消耗大量的計算機內存資源,而且會因為使用了大量的冗余信息而降低雷達目標識別的速度[9]。因此,如何從HRRP中提取出能夠反映目標本質特性的特征,對雷達HRRP目標識別效果有著決定性的影響,是模型成敗的關鍵[10]。
由于不同的特征側重表達距離像不同維度的統計特性,多個特征之間互有補充,因此相較于利用單一特征識別目標,提取多個特征能更有效地提高目標的識別精度。HRRP信號中包含了豐富的目標幾何結構、峰值數量、組成材料等信息,因此,雷達HRRP目標識別技術中最經典的特征提取方法是直接從原始HRRP信號中提取出具有明確物理意義的可以反映目標幾何結構等信息的特征,如目標的長度、目標強散射點的數目、強散射點之間的距離、HRRP徑向能量[11]、散射中心分布熵等;一維距離像的平均值、均方差、對稱性與分散性程度等其他特征,可以從數學分析的角度反映出目標的統計特性;為了有效對抗一維距離像的平移敏感性,可以提取頻譜及功率譜等平移不變特征。
經過上述分析,本文從HRRP信號中提取了13個具有代表性,能較好反映目標本質特性的特征,分別是功率譜特征、目標徑向長度、強散射中心數目[12]、二階中心矩、三階中心矩、散射中心分布熵、平均值與方差[13]、目標平均起伏特性、對稱性與分散性、去尺度結構特征以及目標徑向能量。
由于各特征之間并非是完全不相關的,而且不同特征對目標分類的貢獻度也有優劣之分,所以隨著提取特征的數目增加,重復的冗余量會增大,噪聲和誤差也隨之增大,不但導致算法的計算量增大,也會降低目標的識別率,因此,需要選出有利于目標分類的特征。這里使用LGBM算法對特征進行選擇,將訓練樣本放入LGBM中進行訓練,計算每個特征的重要程度,根據特征重要性篩選關鍵特征來減少分類所需的特征數量,從而達到保證分類性能的同時降低識別時間。
LGBM根據特征在所有決策樹中被分割后所帶來的總信息增益來度量特征屬性的重要性,數值越高代表該特征對模型的重要性越大,更有利于模型的分類識別。按重要性對特征元素進行降序排列,依次刪除重要性最低的特征,根據測試集在新特征子集下的準確率判斷是否剔除當前重要性程度最低的特征,如此循環,從而實現特征選擇。具體流程如下:
輸入數據集D,特征集F={Tj|j=1,2,…,d},假設訓練集I含有n個樣本{X1,X2,…,Xn},每個樣本含有d維特征,即Xi=[T1,T2,…,Td,]。
輸出最優特征子集Fbest
1) 對包含所有特征的訓練集進行LGBM建模,分別計算樣本特征元素Tj的重要性程度Vj。假設訓練集I每次迭代損失函數的負梯度為{g,g2,…,gn},將樣本按梯度的絕對值降序排序;取前a×100%個樣本,構成大梯度樣本子集A;從剩余樣本集合隨機選取b×100%個樣本,構成小梯度樣本子集B;在樣本子集(A∪B)學習一棵新的決策樹,并引入常量系數,抵消采樣對數據分布的影響,則分裂特征j的分割點k的增益表示為:
(1)
式(1)中,

2) 根據第一步得到的Vj對特征元素Tj進行降序排列。
3) 使用LGBM算法進行評估,根據混淆矩陣計算測試集在全部特征下的準確率aj=t/n,其中t是所有被正確分類的樣本數量,n是樣本總數。
4) 對于步驟2)中排序后的特征全集進行搜索,每次在特征集合F中刪除具有最小重要度的特征元素Tj,并使用LGBM計算測試集在新特征子集下的準確率abest。
5) 根據準確率判斷是否刪除當前重要性最低的特征:如果aj 6) 如此循環計算,當所有特征元素Tj被遍歷完,最終得到一個分類準確率較高且特征數目較少的最優特征子集Fbest。 可見,LGBM算法根據特征的重要度進行特征選擇,而且對模型的結果進行了初步評估,大大降低了特征的波動性;同時由于重要性比較小的特征被刪除,使得特征的冗余量下降。因此,不但降低了目標識別的時間,而且有利于后期目標分類精度的提高。 在提取目標HRRP特征之后,目標識別的效果主要取決于分類器的性能。針對HRRP數據特點,在復雜情況下如果使用傳統的目標識別方法會導致識別精度低、模型泛化能力不足等問題。而深度神經網絡模型能自主學習更高層次的結構信息,完成不同目標的分類與識別,獲得比傳統識別方法更好的識別性能,且在各個領域得到了廣泛應用。基于以上考慮,本文設計并應用含有多個隱含層的多層感知器——深度神經網絡(DNN)作為HRRP目標識別的分類器。考慮在不影響分類性能的前提下,算法運算量應盡可能小[14],因此設計了包含三個隱含層的DNN模型,為提升識別率和訓練速度,采用ReLU函數進行非線性變換和Adam算法進行參數優化;為了增強模型泛化能力,在DNN的訓練過程引入Dropout方法,防止過擬合。通過利用LGBM特征選擇算法獲得的最優特征樣本數據訓練DNN,得到網絡的連接權值,建立HRRP目標識別的網絡模型;對待識別目標進行同樣的特征提取、LGBM特征選擇后,輸入訓練好的DNN,最終輸出預測結果,實現對目標的分類。 2.3.1深度神經網絡模型的基本結構 根據HRRP特征數據大小和目標識別要求,本文采用的深度神經網絡模型由一個5層的全連接神經網絡構成,包含一個輸入層、三個隱藏層和一個輸出層,如圖2所示。圖中W1∈Rn1×n0,W2∈Rn2×n1,W3∈Rn3×n2和W4∈Rn4×n3為權重矩陣;b1,b2,b3和b4代表偏置向量;其中n0為輸入層維數,n1,n2,n3分別對應三個隱藏層神經元個數,輸出層結點數為4。 圖2 基于HRRP目標識別的深度神經網絡結構示意圖Fig.2 Deep neural network structure diagram based on HRRP target recognition 同層的神經元是相互獨立的,而相鄰層的神經元之間相互連接。輸入層的數據是經過LGBM選擇出來的最優特征子集。神經網絡輸出結果經Softmax函數處理轉變為概率分布,根據最大概率準則輸出最終的識別結果。另外,由于在訓練樣本較少的情況下DNN容易發生過擬合問題,為此將Dropout方法引入網絡模型,在訓練網絡時以一定概率隨機丟棄部分神經元,以提升模型的泛化能力。 2.3.2分類器實現的關鍵技術 利用該深度神經網絡模型進行HRRP目標識別時,由于在訓練過程中,數據是前向傳播的,誤差是反向傳播的,需要依次調節各隱藏層和輸出層的權重參數和偏置向量。因此,在具體的實現過程中需要應用以下關鍵技術。 1) 前向傳播中數據的非線性變換 模型的輸入數據從輸入層開始,經過網絡參數和激活函數的作用,逐層計算并順序向后傳播。整個模型中,前一層網絡的輸出作為下一層網絡的輸入,直到模型的輸出層。在HRRP目標識別中,由于樣本數據不全是線性可分的,在傳播過程中會出現數據發散和網絡梯度消失等問題,因此在雙方的具體實現過程中需要在隱含層引入激活函數對數據進行非線性變換。這里應用修正線性單元(rectified linear unit, ReLU)函數來完成數據的非線性變換。 如圖2所示,模型中輸入層數據X=[x1,x2,…,xM]T為經過LGBM特征選擇后的HRRP目標特征數據,其數據維數為M;將三個隱藏層的激活函數選擇為ReLU,記為f(x)=max(0,x),三個隱藏層的輸出矢量分別記為H1,H2和H3,數據維度分別為n1,n2,n3,則 (2) 由于ReLU函數求導簡單,在非負區間的一階導數恒為1,可以使網絡梯度保持在一個穩定的狀態,能夠避免梯度消失問題,加快收斂速度,從而更好地訓練網絡參數;而且相比其他的激活函數,ReLU函數計算高效,因此在HRRP目標識別中具有更好的表現。 2) 反向傳播損失函數的優化 將前向傳播計算得到的模型輸出預測值與目標真實類別進行比較,即可得到模型的輸出誤差。在訓練模型時,我們采用交叉熵(cross entropy loss)作為損失函數,用于描述模型預測值與已知真實值之間的這種誤差,記為: (3) 式(3)中,N為訓練樣本數;C為類別個數;yi=[yi1,yi2,yi3,yi4]T代表第i個樣本的期望輸出矢量,即樣本的真實標簽。 在進行HRRP目標識別時,通過不斷減小損失函數而使得訓練時達到更高的識別率。但是利用傳統隨機梯度下降法(stochastic gradient decent, SGD)進行損失函數的減小,使得優化后的DNN收斂速度慢,容易陷入局部最優解。為此采用自適應時刻估計方法(adaptive moment estimation, Adam)算法替代傳統SGD方法來更新模型參數。將所得到的模型訓練誤差,利用反向傳播算法計算權重和偏置向量的更新值,根據所得結果重新調整網絡模型的權重參數和偏置向量。假設第t輪訓練中,參數θ的小批量隨機梯度為gt,mt是梯度的一階矩估計,υt是梯度的二階矩估計,β1,β2對應mt,υt的指數衰減率,則 mt=β1mt-1+(1-β1)gt, (4) (5) 然后對mt,υt作偏差校正,記為: (6) (7) Adam算法能基于HRRP訓練樣本數據迭代更新神經網絡權重,學習效果更為有效,且在訓練過程中可以糾正學習率消失、損失函數波動較大等問題[15]。從而實現了在最大程度地最小化損失函數的同時,加速收斂并正確學習,達到了更高的識別率。 3) 利用Dropout防止過擬合 對于深度神經網絡模型而言,隨著網絡深度的增加,網絡的訓練難度也逐漸增加,且在HRRP目標特征訓練樣本較少的情況下,容易發生過擬合問題[16]。因此,本文在所提出的基于HRRP目標識別的深度神經網絡訓練過程中引入了Dropout方法,在緩解模型過擬合問題的同時提高了模型的泛化能力。 圖3所示分別為含有兩個隱含層的標準神經網絡和應用Dropout產生的神經網絡。可見引入Dropout方法后,在神經網絡訓練過程中,通過設置不同的舍棄概率,部分神經元將以一定的概率被丟棄,如圖3(b)所示。通過這一操作,使得神經網絡經過足夠多次的迭代之后,模型的泛化性能得到了有效的提升,而且有效減少了模型在訓練過程中陷入過擬合的狀態的風險[17]。在測試階段,Dropout恢復所有神經元之間的連接,保證模型測試時獲得最好的識別性能。 圖3 Dropout約束的神經網絡Fig.3 Dropout constrained neural networks 4) 網絡節點數設置 如何確定隱含層神經元數目是網絡模型設計中的重要環節。如果隱含層神經元數目過少,則網絡的學習能力較弱,無法實現較高的識別率;而神經元個數過多,網絡的學習能力變慢,且在反向傳播時容易陷入局部極小值,還可能出現過擬合問題[18]。 隱含層個數及其對應神經元個數沒有一定的選取準則,一般先設計一個隱含層,增加節點數進行測試,當增加節點數無法提升網絡識別性能時再考慮增加隱含層。然而太多的隱含層會使得網絡難以有效訓練,并帶來更多的參數需要學習。根據HRRP數據大小和識別任務要求,采用滿足識別需求的三個隱含層網絡。通過實驗分別對各個隱含層在節點數取不同值時的識別率進行測試,選擇識別率最好時對應的節點數作為該隱含層的節點數,從而確定各隱含層節點數,使得整個神經網絡模型所對應的識別率最高。 為了驗證本文所提算法的有效性,基于目標散射中心模型對HRRP數據進行了仿真,用于仿真的目標有4種,分別是立方體、長方體、四棱錐和六棱柱。選用調頻連續波雷達作為探測器,其仿真參數的設置如表1所示。 表1 探測器的基本參數Tab.1 Basic parameters of the detector 利用調頻連續波探測器對目標進行探測,將發射信號與回波信號進行混頻得到差拍信號,差拍信號包含目標距離、目標形狀等豐富的信息,然后將差拍信號進行FFT處理就得到了目標的HRRP信號,它是目標散射點的子回波在探測距離方向上的矢量和。為了減小姿態敏感的影響,探測角度0°~360°被平均分為72個角域,角域大小為5°,依次采集每個角域內四類目標的10個雷達HRRP信號,并對每一個HRRP依次提取其13個特征分量,該13個數字特征作為訓練數據集的一個樣本,故訓練樣本個數為72×10×4,數據維度為13。同樣的方法,再對每類目標另取72×100個識別樣本,用于檢驗目標識別效果。 根據2.2節的算法流程,使用LGBM算法計算各特征對模型的重要程度,并進行降序排列,其計算結果如圖4所示,圖中橫坐標數值越高代表該特征對模型的重要性越大,更有利于模型的分類識別。因此,根據特征重要度,得到冗余少且不損失分類精度的包含6個特征值的最優特征子集Fbest:目標徑向長度、目標強散射中心數目、三階中心矩、散射中心分布熵、目標平均起伏特性和目標徑向能量。 為了驗證LGBM二次特征選擇算法所選特征值的代表性,本文分別基于傳統的識別方法(SVM、GBDT、KNN和貝葉斯),對利用LGBM二次特征選擇前和選擇后的數據進行了目標識別測試,識別結果如圖5所示。由圖可見,在應用LGBM特征選擇后,SVM、GBDT、KNN和樸素貝葉斯算法的目標識別率都有提升,說明LGBM特征選擇算法能選出最利于目標識別的特征值。 圖4 各個特征對模型的重要程度Fig.4 Importance of each feature to the model 圖5 LGBM特征選擇前后各算法識別效果Fig.5 Recognition effects of different algorithms before and after LGBM feature selection 表2是經LGBM二次特征選擇前后不同識別方法的測試時間對比結果,與特征選擇前相比,應用LGBM特征選擇算法后,SVM和KNN的測試時間分別縮短了約0.14 s和0.18 s,GBDT和樸素貝葉斯的識別速度也有明顯提升。綜上,運用LGBM算法進行二次特征選擇在提高識別率的同時,也有效提升了識別速度。 表2 LGBM特征選擇前后各算法測試時間Tab.2 Testing time of different algorithms before and after LGBM feature selection 為了驗證所提出的基于LGBM和深度神經網絡的HRRP目標識別的性能優勢,使用HRRP數據進行了兩個對比實驗:一是在相同訓練樣本量的條件下,對比不同識別方法的識別準確率和時間;二是對比不同識別方法隨著訓練樣本量變化的識別率。 1) 相同訓練樣本量下各識別方法對比結果 為了證明所提出的HRRP目標識別算法的優越性,使用經過LGBM二次選擇后的HRRP目標特征數據進行目標識別實驗,由圖4可知,傳統模式識別方法SVM、GBDT具有較好的分類性能和識別速度,因此分別采用SVM、GBDT與不同結構網絡模型進行比較實驗。根據前面所提的網絡節點數設置原則,利用實驗數據對不同網絡隱含層的最佳網絡節點數進行了計算和選擇,其中Dropout參數設置為0.25,單隱層網絡隱含層節點數設置為48,深度神經網絡模型三個隱含層節點數分別設置為48、24和36。在每角域提取10個訓練樣本的條件下,各方法的識別結果如表3所示。 表3 各方法識別效果對比Tab.3 Comparison of recognition effect of each method 從表3可見,提出的深度神經網絡分類識別率明顯高于單隱層神經網絡和傳統識別方法SVM、GBDT。深度神經網絡雖然訓練耗時長,但在實際使用時是利用訓練好的模型進行目標識別時,所用時間大大縮減。因為深度神經網絡模型能學習更高層次的結構信息,另外將Dropout引入網絡模型的訓練過程,也有效增強了模型的泛化能力。 2) 不同訓練樣本量下各識別方法對比結果 為了進一步說明所提HRRP目標識別算法的穩定性,在相同的條件下,對于每類目標,每隔5°劃分為一個角域,每個角域用于訓練的樣本數目從1~10逐漸遞增,對所有識別樣本進行深度神經網絡、單隱層網絡、SVM和GBDT目標識別,并統計其識別精度,結果如圖6所示。可以看出,無論樣本量多少,深度神經網絡型的識別性能始終優于其他方法,且在訓練數據集較少的情況下也能保持相當穩定的識別性能。說明本文所提的HRRP目標識別算法,在處理目標分類問題時具備高精度識別的能力。 圖6 不同訓練樣本量下各識別方法的識別效果Fig.6 Identification effect of each recognition method under different training samples 本文提出基于LGBM和深度神經網絡的HRRP目標識別方法。該方法采用LGBM特征選擇算法對提取的HRRP的具有明確物理意義、統計特性和平移不變性的特征分量進行二次特征選擇,得到最優特征子集,以減少特征冗余和樣本維度;搭建深度神經網絡時,為了有效解決過擬合問題,引入了Dropout約束,把獲得的HRRP目標最優特征樣本數據送入深度神經網絡分類器進行訓練學習和測試,有效提高了模型的泛化能力。仿真實驗驗證結果表明,在4類雷達目標的分類實驗中,所提出的基于LGBM和深度神經網絡的HRRP雷達目標識別方法在降低訓練時間的同時有效提高了識別精度,為雷達目標識別方法提供了新的思路,具有一定的應用前景和具有較好的應用價值。2.3 深度神經網絡分類器的設計


3 實驗驗證與分析
3.1 實驗數據

3.2 二次特征選擇結果對比實驗



3.3 所提算法目標識別效果對比結果


4 結論