徐 彬 陳 渤 劉宏偉 金 林
?
基于注意循環神經網絡模型的雷達高分辨率距離像目標識別
徐 彬①②陳 渤*①②劉宏偉①②金 林②
①(西安電子科技大學雷達信號處理國家重點實驗室 西安 710071)②(西安電子科技大學信息感知技術協同創新中心 西安 710071)
針對雷達高分辨率距離像(HRRP)數據的識別問題,該文利用HRRP生成的時序特性,提出一種基于循環神經網絡的注意模型。該模型利用具有記憶功能的循環神經網絡對時域數據進行編碼,并根據HRRP中不同距離單元所映射的隱層對目標識別的重要性,自適應地賦予隱層不同的權值系數,并根據隱層特征編碼特征進行HRRP目標識別。該模型利用了隱藏在HRRP數據內部的目標結構信息,提高了特征的區分度。實測數據的實驗結果表明,該方法可以有效地進行識別,在樣本存在一定余度數據和樣本偏移的情況下,都能準確地找出目標支撐區域。
雷達目標識別;高分辨距離像;循環神經網絡;注意模型
雷達高分辨率距離像(HRRP)是用寬帶雷達信號獲取的目標散射點子回波在雷達視線方向投影的矢量和,它包含了目標尺寸和散射點分布等重要結構信息,并且易于獲取、存儲和處理,如今已成為了雷達自動目標識別(RATR)領域的一個重要的研究方向。針對雷達目標識別這一問題,大量學者進行了廣泛的研究。文獻[1]針對基于HRRP的一階統計特性的模板匹配分類器(MCC-TMM)和融合一階和二階統計特性的自適應高斯分類器(AGC)兩種不同方法的特性,提取對應的統計特征來進行目標識別。文獻[2]對HRRP在一定方位角內進行均值平滑,然后通過支持向量機(SVM)來進行雷達目標識別。文獻[3]在主成分分析(PCA)子空間投影特征基礎上,構建最小重構誤差準則實現HRRP目標識別。文獻[4]利用冗余字典學習HRRP的稀疏表示特征,獲得了較好的泛化能力。這些基于模型的特征都具有明確的物理含義,比較利于推廣。但它們都是將HRRP樣本作為一個整體來考慮,而沒有考慮樣本內部的相關性。鑒于這一特性,文獻[5-7]提出了基于時序特性的隱馬爾科夫模型。該方法先將HRRP作為一個序列特征來處理,然后將訓練數據通過不同的方位角進行分幀建模,在測試階段利用最大后驗概率判斷類別。這種方法考慮了目標內部的結構信息,并且通過分幀的方式解決了方位敏感性的問題。但是作為生成模型,需要先對模型分幀并對每一個分幀構建一個概率模型,每一個測試樣本均要求解在所有模型下的后驗概率,具有較高的計算量。
近年來,循環神經網絡模型(RNN)在識別領域取得了不錯的成果。該模型不僅能夠通過編碼的方式對數據提取特征,而且在隱層引入相關矩陣來考慮數據內部的相關性。除此之外,模型的非線性映射以及較大的狀態空間使得模型的數據表達能力比較強。HRRP時域數據反映的是目標上的散射點沿雷達視線的分布情況,數據內部具有一定的相關性,因此本文將循環神經網絡應用到HRRP目標識別中。基于循環神經網絡的HRRP目標識別,每一個時刻都會輸出一個類別,但是單個HRRP序列僅需要輸出一個類別。基于原始循環神經網絡的HRRP目標識別是通過投票的方式將HRRP類別歸為所有時刻類別個數最多的那一類。對于不同類目標,HRRP中的支撐區域是不同的,即便是同一類目標在不同的姿態角下支撐區域也不相同。通常情況下,HRRP中還包含噪聲區域。這種方法在投票過程中,不加區分地對不同距離單元的回波進行簡單的投票加權,忽略了各部分對識別的差異,因而并不合理。
為了解決前面提出的問題,本文提出了一種基于循環神經網絡的注意模型。該模型通過循環神經網絡對序列數據進行編碼,然后對數據每一個區域求解權值系數,使得HRRP樣本不同區域在識別中起不同的作用。相比于前面的方法,該模型存在以下幾個優點:首先,是一種端到端的判別模型,對于測試數據直接輸出類別,不需要通過投票的方式來判斷。其次,考慮到了樣本內部的相關性,通過一種反饋的神經網絡對樣本進行編碼使得提取的特征不僅僅包含當前的信息,也考慮了樣本的結構信息。最后,考慮了樣本不同的區域在識別中所起的作用是不相同的,通過對不同區域的隱層進行加權求和得到最終的隱層來進行識別,更符合HRRP目標識別的實際情況。通過實測數據驗證了該模型的有效性,并且在測試樣本存在一定偏移的情況下,也依然能夠找出有效的識別區域。
文章結構安排如下,第2節具體描述循環神經網絡與注意模型的結構;第3節說明將模型應用到HRRP上的具體步驟;第4節為實驗部分,通過在實測數據上的實驗來說明模型的有效性;最后為總結部分。
2.1 循環神經網絡
循環神經網絡最早是由文獻[13]提出,專門用來解決序列數據問題。在處理過程中,循環神經網絡在每一個時刻都會接收當前時刻的輸入和前一時刻的隱層,并且輸出類別或者預測的結果。

圖1 展開的循環神經網絡結構圖

(2)

(4)

2.2 注意模型結構
本文提出了一種適用于高分辨距離像數據的注意模型,如圖2所示。這種新的模型在原來循環神經網絡的基礎上,增加了權值系數這一項來衡量每一個數據段在進行識別中所起的作用,從而使得網絡可以自適應地尋找存在可分性的區域。

圖2 注意模型
在這個新的模型中,我們定義輸出概率為

(7)

(9)


3.1 時域特征提取
圖3是HRRP生成的示意圖,它反映了在一定雷達視角時,目標上散射體(如機頭、機翼、機尾等)的雷達散射截面積(RCS)沿雷達視線(RLOS)的分布情況,體現了散射點的相對幾何關系[15]。在對HRRP數據進行識別時,首先要對HRRP提取時域特征,將時域特征序列化之后,利用循環神經網絡進行處理。高分辨率距離像數據的波長遠小于一般雷達目標的尺寸,時域回波包含了目標尺寸、散射點分布等許多重要的結構信息,可以通過散射中心模型進行描述。在距離像中的每一個距離單元都等于該距離單元內的所有的散射點目標回波疊加,而HRRP也就對應于一個復向量,表示第個距離單元的子回波,表示HRRP中距離單元個數。對當前的HRRP時域回波取幅值,即。

圖3 HRRP生成示意圖
3.2 HRRP預處理
由文獻[2]可知,雷達目標的原始HRRP數據存在強度、平移敏感性等問題,這些敏感性對于雷達目標識別性能影響很大。本文對HRRP進行了2范數歸一化來消除強度敏感性。HRRP的平移敏感性則是由于目標運動導致HRRP在距離門內發生平移,在本文中采用的是質心對齊方法,即求取HRRP的質心位置,并將質心位置平移至HRRP中心位置[4]。其中質心為

將預處理完之后的HRRP數據轉化為序列數據,設經過預處理之后的1維距離像數據為

(14)
3.3 基于注意模型的雷達目標識別
HRRP樣本包含目標重要的結構特征,體現了散射點的相對幾何關系,對目標識別和分類很有價值。在當前時刻的維數據對應于目標的部分區域的散射點回波,而下一個時刻的維數據則對應于目標鄰近部分區域的散射點回波。在同一個目標的情況下,我們認為相鄰時刻的數據之間存在一定的相關性[5]。因此,將注意模型應用于預處理后的數據。
將注意模型應用于時域特征的HRRP主要包括訓練階段和測試階段。訓練階段主要是利用雷達目標HRRP的時域特征來建立模型,通過目標函數對模型中的參數進行調節,從而使得當前的模型可以更好地表達訓練數據。測試數據的主要任務則是在已經訓練好的網絡結構的基礎上,輸出測試數據屬于每一類目標的概率,將測試目標歸為最大概率類別。訓練階段和測試階段的具體步驟如下所示:
(1)訓練階段:
(2)測試階段:
步驟1 對于給定的測試樣本進行同訓練樣本相同的預處理方式,即能量歸一化,絕對對齊處理以及滑窗處理得到測試數據時域特征。
4.1 實驗數據介紹及實驗設置
本文的識別實驗使用的是國內某所的逆合成孔徑雷達(ISAR)的飛機飛行數據,其中雷達和飛機的參數如表1所示,3類飛機的航跡在地面上的投影如圖4所示。實驗的飛機有3種,其中“安-26”為中小型螺旋槳飛機,“獎狀”為小型噴氣飛機,“雅克-42”為中型噴氣飛機。從飛行的航跡可以看出,“獎狀”和“安-26”飛機的HRRP數據均給分成了7段,“雅克-42”飛機的HRRP數據給分成了5段。為了更全面地考慮方位角信息,本文采用“雅克-42”的第2, 5 段,“獎狀”的第6, 7 段,“安-26”的第5, 6段數據作為訓練樣本,用來訓練模型;其他的數據段作為測試樣本來驗證算法的性能。訓練和測試數據均為間隔20采樣,訓練樣本個數為7375,測試數據的樣本個數為16655。圖5給出了3類目標的距離像的時域特征,它反映了3類飛機的物理結構特征。

圖4 雅克-42,獎狀和安-26飛機的航跡圖

表1 ISAR實驗雷達和飛機參數
4.2 模型性能比較
本實驗將基于循環神經網絡的注意模型同兩種降維提取特征的方法進行了比較,除此之外,還同原始神經網絡模型以及同樣處理序列數據的HMM模型進行了比較。其中PCA降維至同隱層維度相同的50維,LDA降維之后采用線性支撐向量機(LSVM)來進行識別。原始循環神經網絡是經過模型的編碼之后對于每一個時刻的隱層進行識別,然后將識別結果通過投票的方式得到最終識別結果。HMM在HRRP中的應用采用文獻[7]中的方法,將原始HRRP滑窗序列化,然后分幀建立模型。
表2中,PCA為降維的方法,在將樣本降低至同樣維度的情況下,ARNN的識別結果比該方法要高大約5個百分點。對于LSVM,當前的網絡模型主要存在兩個優點:(1)由于LSVM采用二次規劃來求解支撐向量,而求解二次規劃涉及階矩陣求解問題(為樣本個數),沒有辦法處理大量訓練樣本。而ARNN采用批量學習的方法,每次參數更新時可以通過目標函數對部分訓練樣本求偏導來進行更新,可以處理大量的訓練數據。(2)原始LSVM更適合做二分類問題,而對于多分類則需要進行改進。ARNN模型輸出的是樣本屬于每一類的概率,因此,更適合于多類別問題。

圖5 時域特征
表2 不同方法的識別結果

方法LDAPCAHMMLSVMRNNARNN 識別結果0.7300.8300.8700.8800.8500.883
另外兩種降維提取特征的方法相比于基于循環神經網絡編碼方法進行的特征提取得到的目標識別效果要低。除此之外,原始循環神經網絡的識別結果相比于注意模型的結果也要低大約3個百分點,主要是有兩個方面的原因。第一,注意模型可以尋找有效的區域進行識別,而不是將全部的數據(包括噪聲)來識別;第二,注意模型是一個端到端的模型,模型更利用訓練。同樣是對數據序列化來進行處理,HMM是對數據每一幀建立一個模型,同時設置模型的狀態。相對而言,循環神經網絡隱層的非線性映射和更大的狀態空間使得模型的表達能力更強,這也可能是當前模型的結果優于HMM的原因。
4.3 注意模型同原始循環神經網絡對比
由于3類飛機的長度不同,在不同姿態角下的徑向長度也不同,因此在接收的回波數據中噪聲部分和目標部分所占的距離單元也不同。原始循環神經網絡對于每一個時刻的隱層進行識別,然后每一個時刻的識別結果通過投票的方式得到最終的識別結果。噪聲部分區域是不具備識別能力的,按照投票的方式進行識別,目標區域同噪聲區域在識別中所起的作用是相同。
為了驗證注意模型在HRRP上的有效性,本實驗將注意模型同原始循環神經網絡進行了對比。
原始數據經過處理之后變為長度為15的序列,圖6(a)顯示了測試數據不同時刻隱層特征的識別結果,其中前面的0~4個時刻以及11~14時刻對應的為噪聲區域,中間部分對應的為目標區域。由于前面的噪聲區域并不具備識別能力,因此識別結果比較差。從上面的識別結果看出,可識別區域集中在目標部分。而由于原始神經網絡的記憶功能,使得11~14區域的隱層也包含了一定的識別能力。在這種情況下,注意模型可以自動地尋找可識別的區域,從而賦予目標區域較大的權值,而對于噪聲區域賦予較小的權值。圖6(b)對應的是測試樣本不同時刻的權值系數,其中橫坐標為不同的測試樣本,縱坐標為樣本在不同時刻所對應的系數。從圖6(b)可以看出權值系數主要集中在6~10區域,即目標區域。我們取出其中一個測試樣本,然后用虛線在原始HRRP中畫出較大權值系數對應的距離單元,即圖6(c)。從圖中可以看出,在識別中真正在起作用的是HRRP的目標區域,當前的注意模型可以自動地找出可識別區域。
4.4 可視化分析
圖7給出了經過RNN編碼之后的隱層和原始HRRP的2維PCA可視化投影,可以比較直觀地看出,本文所提方法獲得的特征,不同類樣本間的重疊區域較小,可分性更好。相比于原始的HRRP的2維PCA投影,注意模型經過循環神經網絡編碼和隱層加權求和之后得到的特征具有更好的可分性。
4.5 樣本平移對權值系數的影響
通常情況下,距離像數據的平移敏感性會對模型造成一定的影響。在前面的預處理中,滑窗的長度取32,滑動距離為16。因此,本實驗測試樣本在平移16個距離單元和32個距離單元情況下的權值系數。在模型已經訓練好的前提下,對測試樣本分別平移16個距離單元和32個距離單元,求出當前情況下的權值系數。當前的權值系數與未平移的測試樣本的權值系數的相關系數,其中,為原始系數的第個距離,為平移之后的權值系數。圖8(a)為平移16個距離單元的相關系數,從圖中可以看出在橫軸為14的時候取得最大值,意味著在樣本平移一個時刻的情況下,權值系數也隨之平移了一個時刻。圖8(b)為平移32個距離單元的情況下權值系數也隨之平移了兩個時刻。說明在樣本存在平移時,模型也依然能夠找到支撐區域來進行目標識別。

圖6 實驗結果

圖7 2維PCA投影

圖8 權值系數平移之后的相關系數
本文提出了一種針對HRRP目標識別問題的注意循環神經網絡模型。該模型考慮了目標時序數據內部之間的相關性,先利用循環神經網絡對時域回波進行編碼,然后對不同的距離單元賦予不同的權值系數來決定其在目標識別中所起的作用。在實測數據上的實驗結果表明該模型不僅能夠提取出有效的特征來進行識別,在目標存在一定偏移和余度數據時也能夠尋找出有效的可識別區域。
[1] 張英軍, 白向輝. 雷達自動目標識別中的HRRP特征提取研究[J]. 系統工程與電子技術, 2007, 29(12): 2047-2053. doi: 10.3321/j.issn:1001-506x.2007.12.012. ZHANG Junying and BAI Xianghui. Study of the HRRP feature extraction in radar automatic target recognition[J]., 2007, 29(12): 2047- 2053. doi: 10.3321/j.issn:1001-506x.2007.12.012.
[2] 梁海濤, 張學禮, 童創明, 等. 基于小波分解與方位角平均HRRP的SVM目標識別方法[J]. 數據采集與處理, 2010, 25(1): 29-35. doi:10.3969/j.issn.1004-9037.2010.01.006. LIANG Haitao, ZHANG Xueli, TONG Chuangming,. SVM target identification method based on wavelet decomposition and azimuth average HRRP[J].&, 2010, 25(1): 29-35. doi: 10.3969/j.issn.1004-9037.2010.01.006.
[3] DU Lan, LIU Hongwei, BAO Zheng,. Radar automatic target recognition using complex high-resolution range profiles[J].,&, 2007, 1(1): 18-26. doi: 10.1049/iet-rsn:20050119.
[4] FENG B, DU L, LIU H W,. Radar HRRP target recognition based on K-SVD algorithm[C]. IEEE CIE International Conference on Radar, Chengdu, 2011: 642-645.
[5] 潘勉, 王鵬輝, 杜蘭, 等. 基于TSB-HMM模型的雷達高分辨距離像目標識別方法[J]. 電子與信息學報, 2013, 35(7): 1547-1556. doi: 10.3724/SP.J.1146.2012.01190. PAN Mian, WANG Penghui, DU Lan,. Radar HRRP target recognition based on truncated stick-breaking hidden Markov model[J].&, 2013, 35(7): 1547-1556. doi: 10.3724/SP.J.1146. 2012.01190.
[6] PAN Mian, DU Lan, WANG Penghui,. Multi-task hidden Markov modeling of spectrogram feature from radar high-resolution range profiles[J]., 2012, 2012(1): 1-17. doi: 10.1109/CIE-Radar.2011.6159624.
[7] JI S H, LIAO X J, and CARIN L. Adaptive multi-aspect target classification and detection with hidden Markov models[C]. International Conference on Acoustics, Speech and Signal Processing, Montreal, 2004: 125-129.
[8] GREGOR K, DANIHELKA I, GRAVES A,. DRAW: A recurrent neural network for image generation[C]. Proceedings of the 32nd International Conference on Machine Learning, Lille, 2015: 1-8.
[9] ZAREMBA W and SUTSKEVER I. Recurrent neural network regularization[C]. International Conference on Learning Representations, San Diego, 2015: 1-8.
[10] SRIVASTAVE N, MANSIMOV E, and SALAKHUTDINOV R. Unsupervised learning of video representations using LSTMs[C]. Proceedings of the 32nd International Conference on Machine Learning, Lille, 2015: 1-9.
[11] LI J W, LUONG M T, and JURAFSKY D. A hierarchical neural autoencoder for paragraphs and documents[C]. Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing, Beijing, 2015: 1106-1115.
[12] CHEN J X, YANG L, ZHANG Y Z,. Combining fully convolutional and recurrent neural networks for 3D biomedical image segmentation[C]. 29th Conference on Neural Information Processing Systems, Barcelona, 2016: 1-9.
[13] ELMAN J L. Finding structure in time[J]., 1990, 14(2): 179-211.
[14] CHOROWSKI J, BAHDANAU D, SERDYUK D,. Attention-based models for speech recognition[C]. 27th Conference on Natural Language Processing Systems, Montreal, 2015: 1-19.
[15] SU B and LU S J. Accurate scene text recognition based on recurrent neural network[C]. 12th Asian Conference on Computer Vision, Singapore, 2015: 35-48.
徐 彬: 男,1988年生,博士生,研究方向為雷達目標識別.
陳 渤: 男,1979年生,教授,研究方向為統計機器學習、雷達目標識別、統計深度網絡等.
劉宏偉: 男,1971年生,教授,長江學者,研究方向為雷達信號處理、雷達自動目標識別、認知雷達、協同探測等.
Attention-based Recurrent Neural Network Model for Radar High-resolution Range Profile Target Recognition
XU Bin①②CHEN Bo①②LIU Hongwei①②JIN Lin②
①(,,’710071,)②(,,’710071,)
To improve the performance of radar High-Resolution Range Profile (HRRP) target recognition, a new attention-based model is proposed based on time domain feature. This architecture encodes the time domain feature which can reveal the correlation inside the target with Recurrent Neural Network (RNN). Then, this model gives a weight to each part and sums the hidden feature with each weight for the final recognition. Experiments based on measured data show that the attention-based model is effective for radar HRRP recognition. Furthermore, the proposed method can still find the support areas even with the removed test data.
Radar Automatic Target Recognition (RATR);High-Resolution Range Profile (HRRP); Recurrent Neural Network (RNN); Attention-based model
TN957.51
A
1009-5896(2016)12-2988-08
10.11999/JEIT161034
2016-10-08;改回日期:2016-11-25;
2016-12-14
陳渤bchen@mail.xidian.edu.cn
國家杰出青年科學基金(61525105),國家自然科學基金(61201292, 61322103, 61372132),全國優秀博士學位論文作者專項資金(FANEDD-201156)
The National Science Fund for Distinguished Young Scholars (61525105), The National Natural Science Foundation of China (61201292, 61322103, 61372132), The Program for New Century Excellent Talents in University (FANEDD-201156)