蓋晴晴 韓玉兵 南華 白振東 盛衛星
(1. 南京理工大學,南京 210094; 2. 北京航天長征飛行器研究所,北京 100076)
雷達高分辨一維距離像(high resolution range profile,HRRP)是用寬帶雷達信號獲取的目標各個散射點子回波在雷達視線方向上投影的向量和幅度波形[1],包含了目標的重要特征結構信息,而且具有易獲取實時性強等特點,是雷達目標識別的重要特征. 但HRRP具有方位敏感性,即目標的姿態角發生微小的變化時,目標散射中心的分布就可能發生較大的變化,從而導致距離像形狀發生很大變化[2]. 所以本文將極化信息和高分辨一維距像相融合,組合成極化距離矩陣,對雷達目標進行全方位的特征提取與建模.該方法可以有助于減少HRRP的方位敏感性帶來的影響,且因極化信息的加入,使得我們可以獲得更加豐富的雷達目標信息[3]. 實際上多極化的HRRP被運用在多篇研究HRRP的論文中. 文獻[4-5]提出了距離極化多維匹配識別算法,該算法將4組不同極化下的HRRP以某種規則進行融合擴展,最后利用相關匹配或者模糊匹配的方式進行目標識別. 文獻[6]是提取了目標特征尺寸、散射中心分布熵和強散射中心維數3種目標特征,然后根據這3種特征的分類信息進行了融合識別. 文獻[7]將4組不同極化下的HRRP分別進行目標的分類與識別,最終的結果是根據多數投票準則進行決定. 文獻[8]利用D-S證據理論將極化信息和距離信息有效結合起來. 以上方法均有一個問題,即僅對極化距離矩陣進行了某一方面的研究. 針對極化雷達數據,本文在文獻[4]的基礎上,利用Pauli分解理論[9]和Freeman分解理論[10]對極化距離矩陣進行目標特征的提取,以獲得更多有效的雷達目標特征.
目前,深度學習已經成為了互聯網大數據和人工智能的一個熱潮. 其通過建立類似于人腦的分層模型結構,對輸入數據不斷地進行無監督的學習與訓練,提取更高維數的特征,在語音[11]、圖像[12]、自然語言[13]、在線廣告等領域取得了顯著的成效. 當然,近年來,深度學習被廣泛應用在目標識別領域. 谷歌的虛擬人腦[14]、ImageNet數據庫[15]、圖像的同時分類和標注[16-17]、視頻中的動作行為識別[18-19]在深度學習的模型上均取得了較好的效果. 本文將深度學習運用到雷達目標識別領域[20],將提取得到的雷達目標特征向量以張量形式的數據結構送入卷積神經網絡進行更加深一步的特征提取和目標識別. 該方法不僅充分地利用了極化信息,還能通過深度神經網絡不斷的自我學習與監督進一步提高雷達目標的識別效率.
在寬帶多極化雷達體制下,對目標進行一維距離成像,可以獲得4 種極化組態(如HH、HV、VH、VV)下的HRRP. H、V分別表示水平極化、垂直極化,PQ(P、Q=H或V)表示P極化發射,Q極化接收的組合狀態. 設目標4 種不同極化組態的HRRP為
{XPQ(k)|k=0,1,…,N-1;P=H,V;
Q=H,V}.
(1)
式中:k為距離單元;N為徑向距離長度.
定義極化距離矩陣為
(2)
對于極化距離矩陣X,將XHH和XVV稱為同極化項,而XHV和XVH稱為極化交叉項.在滿足互易條件時,即XHV=XVH,此時極化距離散射矩陣X可以表示為

(3)
Ω是復散射矩陣.定義其協方差矩陣C為
(4)
式中:L表示目標視角數;〈·〉表示在多視角空間的平均處理;*表示共軛操作;H表示共軛轉置. 可以看出協方差矩陣C是Hermitain矩陣,只包含6個獨立的元素:3個表示能量的實數對角線元素,3個獨立的復數元素. 所有的極化距離信息都包含在C這6個元素中. 對多視角空間內數據的平均處理有助于減少HRRP方位敏感帶來的影響[21].
本文對極化距離矩陣進行目標特征提取的過程主要包括兩個方面: 一方面是對極化距離矩陣X直接作處理,包括直接基于極化距離矩陣X的目標特征提取和基于Pauli分解理論的特征提取兩種方法;另一方面是基于協方差矩陣C的目標特征的提取,本文所用方法為Freeman分解.
目標的4種不同極化組態下的距離像為式(1). 為消除幅度增益變化的影響,對距離像進行功率歸一化,得到

(5)
考慮同一目標在不同極化組態中HRRP的相關性,將HRRP信息和極化信息有機地結合起來,這里參考文獻[4]的做法,將歸一化后的HRRP進行如下處理:
X1(k)=YHH(k),
(6)

(7)
X3(k)=YVV(k),
(8)

(9)

(10)

(11)
經由上述處理,得到6個雷達目標特征向量.
Pauli是極化雷達目標極化分解的一種以相干理論為基礎,算法復雜度較低的算法,其原理是將目標的極化矩陣分解為4個Pauli線性基的相加. 本文將該分解理論運用到雷達目標的極化距離矩陣X上,對X的分解如下:
(12)
在滿足互易定理(即XHV=XVH)的情況下,此時Pauli基縮減到Xa,Xb,Xc這三項,即Pauli分解如下:

(13)
由典型目標散射矩陣可知[7],式(13)中:Xa代表平面目標;Xb代表0°定向角的二面角;Xc代表45°的定向角的二面角.
結合式(12)和式(13)可以得到:

(14)

(15)

(16)
式中:α,β,γ分別代表目標中平面分量,二面角分量和45°的二面角分量.
由此我們又獲得了3個雷達目標特征向量.
Freeman分解是一種基于三元散射模型的目標分解,其將協方差矩陣C表示為表面散射、二次散射和體散射3種散射機理的加權和,表達式為[8]
C=fsCs+fdCd+fvCv

(17)
式中:Cs,Cd和Cv分別為表面散射、二次散射和體散射機理的協方差矩陣;fs、fd和fv分別為相應的加權系數;a和b分別為二次散射和表面散射的參數.
由文獻[8]可知三個加權系數對應的功率Ps,Pd,Pv:
Ps=fs(1+|b2|),
(18)
Pd=fd(1+|a2|),
(19)
Pv=8fv/3.
(20)
由此我們獲得了另外3個目標特征向量.
本文對雷達目標進行以上3種特征方式的提取,最終每個雷達目標可以獲得12個目標特征向量,如表1所示. 為了不破壞目標特征空間結構上的信息和盡量使每個特征提取方法都發揮很好的作用,我們吸取了QI等人在文獻[22]中的做法,將這12個雷達目標特征向量結合起來,組成張量的形式. 把利用Pauli分解理論和Freeman分解理論得到的雷達目標特征向量看作是直接基于極化距離矩陣特征提取到的目標向量的補充. 對每個雷達目標來說,最終可以獲得一個三維張量F∈RI1×I2×I3的數據,其中I1是目標的角度數,I2是目標的特征向量數,I3是每個特征向量對應的特征維數.

表1 雷達目標特征向量集合Tab.1 Radar target feature vector set
深度學習最早興起于圖像識別,但是在短短幾年時間內,深度學習推廣到了機器學習的各個領域,在圖像識別、語音識別、音頻處理、機器人、化學和金融等各個領域均有應用. 本文擬基于TensorFlow平臺將其運用在雷達目標識別方面.
由于卷積神經網絡(convolution neural networks,CNN)在圖像分類數據集上有非常突出的表現,本文目標特征向量組合靈感來源于全極化合成孔徑雷達(synthetic aperture radar, SAR)圖像分類[23],對于每個目標最終獲得的三維張量形式的數據,我們可以類似地把其數據結構看成圖像數據信息的結構,所以擬采用卷積神經網絡對由第1節獲得的數據集F進行特征提取和目標識別.
本文所使用的原始數據是利用Feko軟件仿真計算得到的目標的雷達散射截面積(radar cross section,RCS). 用于仿真的目標有3種,分別是圓錐、柱錐和球錐,如圖1所示. 目標的長度分別為0.63 m、1 m和2.2 m. 取俯仰角從0°到180°,角增量為0.1°,因此每個目標有1 800個姿態. 測量頻率波段為0.2~0.83 GHz,增量為0.01 GHz,共64個頻率點,即每個姿態下采64個頻點. 在獲得目標的4組極化組態下的RCS數據以后,經過逆傅里葉變換獲得4種極化組態下的一維距離像(HRRP).4組極化組態分別為水平發射-水平接收(HH),水平發射-垂直接收(HV),垂直發射-水平接收(VH),垂直發射-垂直接收(VV). 所以每類目標有4組極化 組態下的HRRP,每組極化組態下都有1800個姿態,每個姿態有64個采樣頻點,這4組極化組態下的HRRP就組成了我們之前所述的極化距離矩陣X.

圖1 3種目標模型(圓錐、柱錐、球錐)Fig.1 3 target models (cone, cylinder-cone, sphero-cone)
利用第1節所述的3種雷達目標特征提取方法,對雷達目標的極化距離矩陣X進行特征提取,最終可以獲得一個三維的張量F∈RI1×I2×I3數據.由于每個單極化距離像的矩陣大小為1800×64,最終每個雷達目標可以獲得的數據集為F∈R1800×12×64F∈R1800×12×64,其中1 800表示目標的姿態數,12表示經過3種特征提取方法得到的目標特征向量數,64表示每個姿態下有64個采樣頻點.
這里我們提出的深度CNN如圖2所示,總共包含2個卷積層,2個池化層,2個全連接層. 每個卷積層后面接有一個池化層,采用max pooling形式,下采樣窗口的大小(pooling size)取2×2,滑動步長(stride)取2. ReLU非線性激活函數作用于2個卷積層,Softmax非線性函數作用于第2個全連接層的輸出節點. 卷積層中卷積核的滑動步長全部取值為2.

圖2 基于雷達目標特征向量的CNN架構圖Fig.2 CNN structure diagram based on radar target feature vectors
我們將訓練數據集分批次輸入該CNN中,對CNN的參數進行訓練. 輸入的雷達目標特征向量的大小為12×64,第一個卷積層選取了深度為32,大小為5×5的卷積核,輸出為32×12×64的特征矩陣,經過第1個池化層后雷達目標特征向量的大小變為6×32. 將第一個池化層的輸出送入第2個卷積層,其深度為64,卷積核的大小為5×5,所以輸出特征向量的大小為64×6×32,經過第2個池化層后雷達目標特征向量的大小變為3×16. 最終雷達目標特征向量經過卷積層和池化層的特征處理大小由12×64變成了64×3×16. 第2個池化層經過扁平(flatten)處理以后送入有512個節點的第一個全連接層,其輸出再送入Softmax層,得到3個大小為1×1的輸出節點,每個節點的輸出值對應于每一類別的概率. 為解決訓練樣本數據少而產生的過擬合的問題,在模型訓練階段將Dropout[24]用于第一個全連接層,L2正則化方法[25]運用于第一個全連接層和第二個全連接層.
為了綜合梯度下降算法和隨機梯度下降算法的優缺點,本文采用了這兩個算法的折中——每次計算一小部分的訓練數據的損失函數,這一小部分數據被稱為一個batch,這里batch值設置為45. 采用指數衰減學習率法,初始學習率為0.01,衰減系數為0.99. 為了防止因訓練數據過少而產生的過擬合問題,采用L2正則化和Dropout兩種方法,Dropout值為0.5,通過反向傳播算法微調整個網絡的參數. 為了使訓練出的網絡模型在測試數據上更加健壯,在測試階段采用了滑動平均模型[25],模型平均衰減率為0.99.
綜上所述,本文的算法流程框圖如3所示.

圖3 算法流程框圖Fig.3 Flowchat of the algorithm
在進行計算機仿真前,必須先把數據集分為訓練集和測試集. 我們有3種目標,每一種目標的數據含有4組極化組態,1 800個俯仰采樣點. 因此在每一種極化組態下,我們總共有3(目標種類數)×1 800(姿態數)=5 400個數據,按照它們的姿態分為訓練集和測試集. 假定訓練集的數據來源于角增量為0.4°的均勻角度采樣數據,相當于每個目標取出其四分之一的俯仰角數據,即有1800/4=450個姿態. 訓練數據與測試數據數量之比是1/3,即針對整個雷達目標數據集,選擇25%的樣本作為網絡的訓練集,余下75%的樣本作為測試集,即訓練集總共有1 350個數據,測試集總共有4 050個數據. 本文實驗數據的信噪比均為0 dB.
為了說明將極化信息與HRRP相結合的有效性,在Matlab平臺上進行了基于極化距離矩陣的仿真,并且與只有一種極化組態下的一維距離像進行識別的結果進行了比較. 將極化距離矩陣通過直接基于極化距離矩陣進行特征提取,然后將提取到的目標特征送入支持向量機(support vector machine, SVM)分類器進行分類,結果如表2所示. 這里分類算法采用SVM算法.

表2 基于不同特征的目標平均識別率Tab.2 Target average recognition rate based on different characteristics
為了與以上結果做對比,本文又做了以下4個實驗:基于極化距離矩陣的深度卷積雷達目標識別;基于極化距離矩陣和Pauli分解理論的深度卷積雷達目標識別;基于極化距離矩陣和Freeman分解理論的深度卷積雷達目標識別;基于極化距離矩陣、Pauli分解理論和Freeman分解理論的深度卷積雷達目標識別. 為了書寫方便,這四個實驗名稱分別用X、XP、XF和XPF表示.
為了解決基于X、XP(XF)和XPF實驗數據維數不同這個問題,本文采用補0的方法,對基于X、XP、XF方法的數據進行補0,以使它們的數據維數和XPF相同. 實驗結果如表4~7所示. Step表示訓練網絡模型所執行的步數,本文每隔100步保存一次網絡模型,并用該網絡模型對測試數據進行了識別.Loss表示在該步數下總訓練樣本在該網絡下預測值與真實值的差異程度,該值越小說明預測值與真實值越接近, 即在該步數下網絡的性能越好.

表3 基于不同特征提取方式下不同步數時的Loss結果Tab.3 Loss results based on different steps under different feature extraction methods

表4 基于X網絡不同步數下目標識別率Tab.4 The target recognition rate under different steps based on the X network

表5 基于XP網絡不同步數下目標識別率Tab.5 The target recognition rate under different steps based on the XP network

續表5

表6 基于XF網絡不同步數下目標識別率Tab.6 The target recognition rate under different steps based on the XF network

表7 基于XPF網絡不同步數下目標識別率Tab.7 The target recognition rate under different steps based on the XPF network
分析以上實驗結果,可得如下結論:
1) 由表2可以看出多極化信息下一維距離像的目標平均識別率要比單一極化下一維距離像的識別效果好.
2) 把Pauli分解理論和Freeman分解理論運用到協方差矩陣C上可以使我們獲得更多的雷達目標的本質特征,對雷達目標識別率的提高有很大作用. 由表3可以看出在相同的訓練步數Step下,采用不同的特征提取方式,Loss值不同,而且采用XP、XF、XPF的Loss值相對于僅采用X的值要小,采用XPF的Loss值相對于采用XP、XF的值也較小,說明了XPF的網絡輸出值與真實值更加接近;對比表4、表5、表6、表7,在訓練步數較小的情況下,XPF的結果均比在XF、XP、X條件下的雷達目標識別率高,而且目標的平均識別率達到100%所用訓練步數從小到大依次為XPF、XF、XP和X,這說明了Pauli分解理論和Freeman分解理論的運用使我們得到了更多有效、更加全面的雷達目標信息.
3) 由表3可以看出,對于每種雷達特征提取方法來說,Loss值的總體趨勢是隨著訓練步數的增加而減少的,由表4、表5、表6、表7可以看出,雷達目標的平均識別率也隨著步數的增加而增加直到達到100%,這說明了該深度CNN訓練的有效性.
4) 深度CNN在雷達目標識別方面效果顯著. 對比表2和4可以發現,均是利用極化距離矩陣對雷達目標進行特征提取,但在訓練步數為200時深度CNN的雷達目標識別率比SVM算法的識別率高10.69%,在訓練步數達到1 100以及以上的時候神經網絡的雷達目標識別率達到了100%. 這是由于相對于傳統的機器學習算法,深度CNN能夠自動地將簡單的特征組合成更加復雜的特征,并使用這些組合特征解決問題,屬于深層學習. 而傳統的機器學習算法僅使用某種規則對目標進行特征提取然后進行識別,不會對這些特征進行再次的組合,屬于淺層學習[24]. 而且,觀察表4、表5、表6、表7可以發現,訓練步數越大的模型測試數據集的識別率就越高,這得益于深度CNN具有反向傳播的特征,訓練步數越大網絡模型的預測值越接近真實值,而且當訓練步數達到1 100時不同特征提取下的雷達目標識別率均達到了100%.
本文利用極化信息與高分辨一維距離像相結合的方式以獲得目標的極化距離像數據,然后提出了對其進行直接基于極化距離矩陣、基于Pauli分解理論和基于Freeman分解理論的目標特征提取. 并且將深度卷積神經網絡運用到雷達目標識別領域,把獲得的雷達目標特征向量結合起來送入深度卷積神經網絡進行學習訓練. 經過實驗與分析,得到如下結論:
1) 極化信息的加入使我們對雷達目標進行了全方位的特征提取與建模,獲取了更多的目標信息,大大地提高了雷達目標識別率.
2) Pauli分解理論和Freeman分解理論使我們挖掘了更多包含在極化距離矩陣中的目標信息,這兩種方法可以看作是直接基于極化距離矩陣目標特征提取方法的補充.
3) 深度卷積神經網絡的運用,以其深層學習的特點使雷達目標識別率得到了質的提高.