趙飛翔,杜 軍,劉 恒,馬子龍
(中國華陰兵器試驗中心,陜西 華陰 714200)
雷達目標識別在國防和經濟建設中發揮著重要作用[1]。常用的識別方法可分為以下兩種類型:一種是基于合成孔徑雷達(Synthetic Aperture Radar,SAR)圖像和逆合成孔徑雷達(Inverse Synthetic Aperture Radar,ISAR)圖像的目標分類識別;另一種是基于高分辨一維距離像(High-resolution Range Profile,HRRP)的目標分類識別。比起SAR/ISAR圖像,HRRP因其獲取和處理相對容易,在雷達目標識別中得到了廣泛關注[2]。
HRRP[3]可以看作是利用寬帶雷達信號獲得的目標散射點子回波沿雷達視線方向上投影的矢量和,它包含有目標的重要信息,例如目標的大小、散射中心的分布等。當使用HRRP進行目標識別時,傳統方法僅使用其幅度信息,而丟失其相位信息[4],這樣勢必造成目標信息不完備,使得算法識別效果受限。為解決此問題,文獻[5]提出一種基于主成分分析(Principal Component Analysis,PCA)的投影重構的分類方法,能有效克服初相敏感性的問題;文獻[6]利用復值獨立分量分析方法提取復HRRP特征,然后結合隱馬爾科夫模型(Hidden Markov Model,HMM)方法進行識別;文獻[7]為充分利用相位信息,提出一種多任務復數因子分析的算法,能較好地處理小樣本條件下的識別問題。這些方法雖然都能較好地處理復數HRRP,但其淺層結構很難挖掘目標深層結構信息,且算法依賴于研究者的經驗和專業知識,如果沒有相關領域的充足先驗知識,所提取的特征往往是不完備的。因此,自動提取目標深層特征顯得尤為重要。
深度學習[8-9]算法通過構建一個包含多個隱藏層的神經網絡,映射輸入數據到各個隱藏層,從而獲得輸入數據的各層特征表示。因為其強大的特征表示能力,深度學習近幾年在機器學習、模式識別等領域得到了廣泛關注和成功應用[10]。深度學習模型的訓練過程包括無監督的預訓練和監督的微調,其中預訓練過程采用的是逐層貪婪訓練算法,微調階段采用的是梯度優化方法。目前得到廣泛應用的深度學習模型主要有棧式自動編碼器(Stacked Autoencoder,SAE)、卷積神經網絡(Convolutional Neural Networks,CNN)和深度信念網絡(Deep Belief Network,DBN)。這些模型雖然在目標跟蹤[11]、流量預測[12]和字符識別[13]中有好的效果,但模型的微調過程需耗費大量時間,降低了網絡的訓練速度。
為解決此問題,Huang等人[14-15]提出了極限學習機(Extreme Learning Machine,ELM)算法。文獻[14]證明了ELM輸入層連接權值和隱藏層的偏置可隨機賦值,只需通過計算輸出層權值的最小二乘范數解即可完成網絡的訓練。雖然隱藏層參數不需要調整,但ELM依舊保持了良好的通用逼近能力,并且和基于梯度的方法相比,ELM具有學習速率快、泛化能力強的優點,但網絡的淺層結構制約了其提取數據深層信息的能力。文獻[16-18]提出了深度極限學習機的算法模型,但這些模型只應用在實數域。
為充分利用HRRP的相位信息,本文將深度極限學習機從實數域擴展到復數域,提出一種深度復極限學習機(Deep Complex Extreme Learning Machine,DCELM)。同時,為了在模型訓練過程中有效保持數據間的鄰域信息,將流形正則化(Manifold Regularization,MR)框架應用到DCELM的監督和無監督訓練過程中,提出一種基于流形正則深度復極限學習機(MR-DCELM)的雷達HRRP目標識別算法。
復極限學習機可以對復數輸入數據進行處理,其網絡結構如圖1所示。它包括輸入層、隱藏層和輸出層,其中輸入層連接權值和隱藏層的偏置可隨機賦值,只需通過計算輸出層權值的最小二乘范數解即可完成網絡的訓練。

圖1 復極限學習機網絡結構
給定一個復數訓練樣本(xi,ti),i=1,2,…,N,其中xi∈Cn,ti∈Cm,若模型隱層節點數為L,復激活函數為gc(x),則網絡的輸出可表示為
(1)
式中:wk∈Cn為輸入層的節點與第k個隱藏層的節點連接的復數權值向量,βk=[βk1,βk2,…,βkm]T∈Cm為第k個隱藏層的節點與輸出節點連接的復數輸出權值向量,bk∈C為第k個隱藏層節點的復數偏置。
式(1)可簡化為
Hβ=O。
(2)
如果具有L個隱藏層節點的復極限學習機能夠無限逼近給定的N個訓練樣本,式(2)可轉化為
Hβ=T,
(3)
(4)
(5)
因此,通過計算式(3)的最小二乘范數解,可完成CELM的訓練:
(6)
式中:H+為H的Moore-Penrose廣義逆。
式(6)可化為
(7)
式中:I為單位陣,C為嶺參數。
復極限學習機-自動編碼器(Complex Extreme Learning Machine-Autoencoder,CELM-AE)借鑒自動編碼器(Autoencoder,AE)的思想[10],通過對輸入編碼再解碼,從而重構輸入數據。對于有N個樣本的數據集xi(i=1,2,…,N),xi∈C,CELM-AE的隱藏層輸出和網絡輸出可分別用公式(8)和公式(9)表示為
h=gc(wx+b),wTw=I,bTb=I;
(8)
(9)
則根據1.1節介紹可通過下式計算模型的輸出權重:
(10)
流形正則化是一種通過構建無向加權圖和拉普拉斯算子的學習方法。該方法是建立在如下假設之上:如果點x1和x2在相同的局部鄰域內,也即它們相距很近,則它們的條件概率P(y|x1)和P(y|x2)也應該很相近。流形正則化可通過最小化下式代價函數進行表達;
(11)
式中:wij表示樣本xi和xj的相似性,可通過下式求解:
(12)
式中:KNN(xj)表示樣本點xj的最近鄰點集。
由于條件概率不容易求得,式(11)可化為
(13)

根據圖譜理論,式(13)可用下式表達:
(14)
式中:tr(·)為矩陣的跡;L為圖拉普拉斯矩陣,且L=D-W,D是對角陣,其元素為Dii=∑jwij。


圖2 DCELM訓練過程
本小節將提出流形正則深度復極限學習機算法(MR-DCELM),并給出其主要的學習步驟。MR-DCELM能夠捕獲數據的深層潛在信息,該模型是一個堆疊的多層神經網絡,其基本學習單元為MCELM-AE。在執行分類任務時,其訓練過程也分為兩個階段:無監督特征學習和有監督目標分類。
(1)無監督學習階段
給定一個復數訓練樣本(xi,ti),i=1,2,…,N,MCELM-AE的目標函數為
(15)
式中:k為隱層數,βτ為第τ個MCELM-AE模型的輸出權重,Lτ為在第τ個MCELM-AE模型特征空間上的圖拉普拉斯,λ為正則化參數。將約束條件代入目標函數中,式(15)可寫為
(16)
式中:Hτ為第τ個MCELM-AE模型的隱層輸出。
然后將目標函數對β求導可得

(17)
令?=0,可以得到式(15)的解為

(18)
式中:ILτ為維數是Lτ的單位陣,Lτ是第τ個MCELM-AE模型隱藏層的節點個數。
(2)監督學習階段
MCELM的目標函數為
(19)
式中:βk+1為第k個隱藏層和模型輸出層的連接權值;Hk為第k個隱藏層的輸出,Hk=gc((βk)THk-1);η為正則化參數。
類比無監督學習過程求取權值的方法,模型輸出權值可表示為
(20)
本節使用暗室測量的5類飛機目標數據驗證所提方法的可行性。其中目標采用的是縮比模型,雷達工作頻段為34.7~35.7 GHz,信號形式為階梯變頻,頻率間隔2 MHz;雷達方位角范圍為0°~30°,步長1°。則每個目標的樣本個數為31,維數為500。每個飛機目標的HRRP序列在圖3中給出。將每個目標樣本集中奇數位樣本抽出作為訓練樣本,將樣本集中其他樣本作為實驗樣本。考慮到隱藏層節點個數、嶺參數設置和流形正則化參數決定著模型的識別性能,將對這些參數進行研究。實驗運行軟件環境為Matlab R2013a,硬件環境為Intel(R) Pentium(R)、3.30 GHz CPU、4 GB內存的PC機。

圖3 每一個飛機目標HRRP序列
已知HRRP樣本為500維,因此實驗中將模型輸入層的節點個數設為500。雖然增加網絡隱層數可以獲得目標更深層次的抽象信息,但層數越多,網絡訓練難度越大,需要訓練的參數也越多。因此,不能一味地增加模型的深度,應依據實驗任務及樣本數據量確定合理的隱層數。通過分析,將模型隱層數量設置為2即可滿足任務需求。圖4顯示了第一及第二隱層不同的節點個數對識別效果的影響,由圖可知,當網絡第一個隱層節點個數為300,網絡第二個隱層節點個數為1 150時,模型取得最優的識別效果。

圖4 模型不同隱藏層節點個數對識別效果的影響
在3.1節中確定了網絡隱層數和隱層節點數,接下來需要分析嶺參數C=[C1,C2,C3]對網絡性能的影響。在{10-8,10-7,…,107,108}范圍內進行網格搜索,并遵循以下規則:先保持C2和C3不變,從{10-8,108}范圍內選取能夠獲得最優識別效果的C1的值,然后以此方法確定C2和C3的取值。C=[C1,C2,C3]對識別效果的影響在圖5中給出。由圖可知,最優的C=[C1,C2,C3]取值為C1=10-3,C2=104,C3=107。

圖5 嶺參數C=[C1,C2,C3]對模型識別效果的影響
本節討論流行正則化參數λ和η對所提算法識別效果的影響。由圖6可知,參數λ和η對算法模型影響較大。如果λ和η的值太大,將使得模型中其他的參數值變得很小,從而會造成模型欠擬合;如果λ和η的值太小,則流形正則化對網絡訓練的影響很小,不能很好地保持樣本間的鄰域信息。因此,設置合適的參數值顯得尤為重要。通過分析圖6可知,當λ=10-3、η=10-1時,所提方法可取得最好的識別效果。

圖6 流形正則參數λ和η對模型識別效果的影響
為驗證所提算法模型的可行性,將所提算法模型的識別效果和常用的深度學習模型棧式自動編碼器(SAE)、深度信念網絡(DBN)以及深度極限學習機(DELM)的識別效果相比較。已知HRRP樣本為500維,因此實驗中,將四種模型可見層的節點個數設為500,隱藏層的數量為2,隱藏層節點個數分別為300和1 150,訓練的迭代次數取30。四種算法模型均運行10次,其識別結果的平均值在表1中給出。

表1 所提算法和其他算法識別準確率比較
由表1可知,所提算法模型的識別效果相比DELM高出5.46%,相比SAE高出2.55%,相比DBN高出3.48%,表明所提算法利用復HRRP進行識別時,利用了目標更全面的數據信息,獲得了更完備的特征表達,從而使得識別效果更好。同時也注意到,所提算法模型的訓練速度是SAE訓練速度的7倍,是DBN訓練速度的8倍,表明所提算法相比常用深度學習模型具有更快的訓練速度。
本文將深度極限學習機從實數域擴展到復數域,提出深度復極限學習機,并將其應用于雷達目標識別中,用以解決傳統識別方法在利用HRRP時只利用其幅度信息而丟失相位信息,使得目標信息不完備,制約其識別效果的問題。同時將流形正則化引入到模型中,使其在訓練過程中有效保持數據間的鄰域信息。在暗室測量數據上的實驗結果驗證了所提算法模型的可行性。但需要說明的是,該實驗過程中并未考慮噪聲的影響,算法模型對噪聲的魯棒性將是下一步算法改進完善的重點。