郭 帥 陳 婷 王鵬輝 丁 軍 嚴俊坤 王英華 劉宏偉
(西安電子科技大學雷達信號處理全國重點實驗室 西安 710071)
雷達高分辨距離像(High-Resolution Range Profile,HRRP)是基于寬帶雷達信號獲取的目標散射點子回波在雷達射線方向上投影的向量和,包含了大量與目標尺寸、目標物理結構、散射點分布相關的信息。其中,HRRP的起伏反映了目標散射結構沿雷達視線方向的分布情況,HRRP的峰值反映了散射結構的強弱。此外,相較于二維的合成孔徑雷達圖像,一維HRRP數據具有獲取容易、需要的存儲資源少等特點。這使得HRRP在雷達自動目標識別(Radar Automatic Target Recognition,RATR)領域有著廣泛的應用。
現階段,基于HRRP的雷達目標識別技術主要以單雷達獲取的回波作為主要數據來源,以深度網絡等方法作為主要特征提取模塊,配合分類器實現對未知目標的類別判斷[1–3]。但是,隨著應用場景不斷趨于復雜,基于單雷達的HRRP目標識別系統逐漸無法滿足復雜場景的性能需求,識別準確性和可靠性難以保證。針對這一問題,多站協同目標識別技術提供一種解決思路。其通過多部雷達在相同時刻對同一目標從不同距離、不同視角進行觀測,利用多站數據之間的信息互補特性,能夠實現更加準確、穩健的目標識別[4–7]。
多站協同目標識別主要涉及雷達信息融合處理技術,根據融合模塊在信息流中所處的位置,可進一步劃分為數據融合、特征融合、決策融合。如圖1所示,上述3種融合方式分別通過輸入數據維度拼接、中間隱層特征拼接、輸出識別概率加權的方式實現了多站雷達協同識別。

圖1 融合網絡結構示意圖Fig.1 Schematic of different fusion network structures
近些年,復雜場景下的多站協同目標識別方法逐漸成為RATR領域的研究重點[8–12]。文獻[13]提出了一種基于特征拼接的雙雷達微動特征融合識別方法,該方法將兩個不同角度的雷達傳感器獲得的雷達數據分別進行特征提取,將提取到的雙雷達微動特征進行融合,最后利用支持向量機進行分類。文獻[14]提出了一種基于多雷達傳感器融合行人識別方法,該方法首先對多雷達接收到的回波進行時空對齊和數據關聯,實現對行人和騎行者進行自動檢測、跟蹤和分類。文獻[15]研究了多雷達傳感器網絡中目標決策融合問題,該研究將決策融合問題建模為一個多輸入多輸出(Multi-Input Multi-Output,MIMO)系統,提出了MIMO融合規則。上述研究結果表明:利用多角度或者多站點的雷達觀測的回波信號協同識別,有助于提高目標識別的準確性與穩健性。然而,現階段的多站協同目標識別方法缺乏對站間數據關聯性和差異性的建模,在站間數據差異大時,往往難以取得較好的識別性能。此外,現有方法的融合策略較為簡單,多采用數據拼接、特征拼接、加權決策等方法,難以實現多站信息的充分利用,一定程度上限制了現有多站協同目標識別方法的性能提升。
針對上述問題,本文提出了一種基于角度引導Transformer融合網絡的多站HRRP協同識別方法。首先,該方法采用Transformer結構作為特征提取器,利用其突出的長距離依賴關系提取能力,提取HRRP數據自身的時序特性和空間結構相關性,獲得表征目標結構特性的回波特征。其次,針對多站數據差異大的問題,本文設計了角度引導模塊。該模塊以目標方位角度作為輔助信息,對多站數據差異進行建模,一方面強化了所提特征與目標方位的關系,提升了模型抵抗擾動的能力,使得提取到的特征更加穩?。涣硪环矫妫梅轿唤嵌仍诙嗾倦[層特征間構建非線性映射,使經角度引導模塊修正后的各站特征在隱空間內具有較好的一致性,緩解了由多站數據差異性大引起的融合識別性能不足的問題。然后,針對現有方法融合策略簡單、難以實現多站信息充分利用的問題,本文從多階段特征融合的角度,設計了前級特征交互模塊和深層注意力特征融合模塊,實現了對各站特征在特征提取各個階段的層次化融合。最后,基于實測數據設計了多站仿真實驗,實驗結果表明:本文方法可以有效實現多站HRRP特征融合,獲得優于單站以及常規融合方法的識別性能。
本文提出了一種基于角度引導Transformer融合網絡的多站HRRP協同識別方法,整體結構如圖2所示。模型可分為單支路特征提取部分與多支路特征融合部分。在單支路特征提取部分,首先對每一部雷達獲取的HRRP進行數據預處理,將輸入HRRP進行模2范數歸一、對齊消除幅度敏感性和平移敏感性。其次,將預處理后的單個HRRP樣本進行子序列劃分、映射并添加位置編碼。然后,利用級聯的兩個Transformer層提取HRRP特征。最后,使用角度引導模塊對各支路中與目標方位相對應的特征進行增強。在多支路特征融合部分,首先使用前級特征交互模塊對各站HRRP特征進行特征學習階段的融合。這種早期融合策略使每一支路提早獲得其余支路的信息,降低后續融合任務的難度。然后,利用深層注意力特征融合模塊的自注意力機制對多站特征進行交互,獲取各站特征間的相互依賴關系,然后根據依賴關系的強弱進行自適應的多站特征融合。最后,使用分類層對融合特征進行分類,獲得預測的目標類別。

圖2 角度引導Transformer融合網絡結構Fig.2 Angle guided Transformer fusion network framework
由于HRRP的方位敏感性、幅度敏感性和平移敏感性會對模型提取穩健的目標特征產生一定影響[16],因此,需對HRRP進行歸一和對齊預處理,減弱HRRP敏感性造成的影響。以單支路為例,復HRRP數據用r=[r1,r2,...,rL]T表示,其中ri表示第i個距離單元的子回波,L表示距離單元總數。對復HRRP 數據取幅值,得到實HRRP 數據x=|r|=[x1,x2,...,xL]T。針對幅度敏感性,本文采取模2范數歸一對實HRRP數據x進行處理,得到幅度歸一化后的HRRP樣本xnorm∈R1×L,即
本文使用重心對齊方法克服平移敏感性。對xnorm進行循環移位操作,使其重心位于距離窗的中心位置,得到重心對齊后的HRRP樣本xalign∈R1×L。xnorm的重心G可通過式(2)進行計算:
為了使用Transformer模塊捕獲目標局部子結構的特征,還需要對xalign進行切分映射并添加位置編碼,如圖3所示。xalign的劃分方式需要綜合考慮雷達距離分辨率、目標子結構描述粒度以及模型計算復雜度的影響。設P為每個HRRP子序列的長度,N=L/P為劃分的HRRP子序列個數,將xalign劃分為多個子序列后可表示為:

圖3 切分映射及位置編碼Fig.3 Patch embedding and positional embedding
其中,E∈RP×D表示輸入編碼器,表示子序列編碼,xemb∈RN×D表示編碼后的HRRP。本文用一個線性全連接層實現輸入編碼器,且所有子序列共享一個輸入編碼器。
同時,為了無偏向性地對HRRP的每個子序列上的信息進行聚合,在HRRP子序列前添加一個聚合向量xcls∈R1×D,用于在深層注意力特征融合模塊中聚合各站HRRP的特征。其次,為了充分利用HRRP子序列的空間位置關系,本文為聚合向量和xemb中每一個HRRP子序列添加可學習的時序位置編碼,即
其中,Epos∈R(N+1)×D表示位置編碼矩陣,xin∈R(N+1)×D表示預處理模塊的輸出,同時也作為第1個Transformer層的輸入。
HRRP子序列是對目標局部子結構的描述,本文使用Transformer提取目標局部子結構內部以及子結構之間的特征。Transformer是一種具有注意力機制的模型,近年來已經在多個領域展現出了卓越的性能,并在序列建模問題中逐漸取代了現有的CNN,RNN等模型[17,18]。相比之下,CNN結構難以在淺層堆疊時獲取全局相關性,RNN結構難以建模長序列的遠距離依賴關系。而Transformer結構具有較優的長程依賴關系表征能力,可以利用自注意機制捕捉各個HRRP子序列的局部相關性和全局相關性。Transformer模塊由層歸一化、多頭自注意力層以及前饋層構成,如圖4所示。下面詳細介紹每一層的功能與作用。

圖4 Transformer模塊Fig.4 The Transformer module
Transformer模塊中層歸一化的位置會影響訓練時的穩定性,pre-norm[19]將層歸一化操作放在殘差連接操作之前進行,能在網絡層數較深時更好地防止模型的梯度爆炸或者梯度消失。因此,在這里采用pre-norm對輸入序列xin進行層歸一化,即
Transformer模塊中多頭自注意力層用于對各輸入序列局部與全局關系的捕捉,提取長距離依賴特征,增強了模型捕獲HRRP回波的復雜起伏變化、HRRP子序列間結構相關性的能力。多頭注意力層的具體實現如下:首先將分別進行3次線性映射,得到dq維的查詢矩陣Q,dk維的鍵矩陣K和dv維的值矩陣V,通過計算查詢矩陣Q和鍵矩陣K的乘積,并除以縮放因子,然后應用softmax函數獲得注意力權重,依注意力權重對值矩陣V進行加權即可得到自注意力輸出,如式(7):
Transformer模塊中前饋層包含一個多層感知器,能夠將輸入映射到一個高維隱空間,再從高維隱空間映射回原空間,對輸入在隱空間進行了特征提取及篩選。前饋層的輸出表示如式(9):
其中,Transformer(·)表示一個Transformer層。
多站融合是為了充分利用多站在不同視角對目標進行觀測的信息多樣性,從而提升識別性能。然而,不同的觀測視角使得多站接收的數據間差異通常較大,直接融合往往難以取得較好的效果。目標方位角度為目標運動方向與雷達視線的夾角,各站的觀測視角對應不同的目標方位角度,故可以使用目標方位角度描述多站數據的差異。因此,本文針對各站數據差異較大這一問題,設計了角度引導模塊。一方面,通過對每個雷達站的HRRP特征提取過程引入與之對應的目標方位角度,能強化所提特征與目標方位角度的對應關系,提升了模型抵抗擾動的能力,有利于提取相對穩健的目標特征。另一方面,根據之前的研究[20,21],不同視角下的目標回波之間存在映射關系,利用方位角度編碼在多站隱層特征構建非線性映射,提升了各站特征在隱空間的一致性,能夠緩解數據差異性引起的融合困難的問題。
角度引導模塊的輸入由多層Transformer模塊的輸出特征f和目標HRRP對應的方位角度a兩部分構成,其結構如圖5所示。首先,通過角度編碼模塊對a進行線性編碼,編碼模塊由兩個全連接層構成,輸出γ(a)表示為

圖5 角度引導模塊Fig.5 The angle guided module
其中,W1,W2,b1和b2分別表示兩次線性變換的權重和偏置。然后,基于卷積模塊的映射函數?將Transformer層輸出特征進行特征映射。映射函數?包括兩個卷積層,一個批歸一化層,一個GELU激活層。第1個卷積層將輸入特征f的特征通道數增大到原先的兩倍,第2個卷積層的輸出通道數與輸入特征f保持一致。特征映射過程表示為
其中,BN 表示批歸一化,1 D-Conv(·)表示一維卷積操作,非線性激活 GELU 的表達式為GELU(x)=x·Φ(x),其中Φ(x)為高斯分布的累積概率分布。最后,將經過映射的特征與角度編碼相乘并使用殘差連接將其與輸入特征f求和。角度引導層輸出特征fout可表示為
傳統特征融合方法是將單站HRRP特征提取模塊輸出的特征進行融合,這種融合方法僅對深層特征進行了融合,未考慮各輸入淺層特征之間的關系。如果在特征提取的較早階段加入特征交互,則能提前對目標進行多方面描述,降低后續特征融合任務的難度。因此,本文方法從模型多階段特征融合的角度,設計了前級特征交互模塊和深層注意力特征融合模塊,實現了對多站特征在特征提取過程中多階段層次化的融合。前級特征交互模塊如圖6所示,通過將特征融合的時機前移,使得模型在淺層特征提取時就可以與來自其他雷達的淺層特征進行關聯學習。

圖6 前級特征交互模塊Fig.6 The pre-feature interaction module
此處以三站交互為例,介紹前級特征交互模塊的具體流程。前級特征交互模塊的輸入特征為各站角度引導層的輸出,其中,上標代表站序號。前級特征交互模塊的輸出可表示為
在多站協同目標場景下,多站特征融合是實現穩健、準確識別的關鍵。本文設計的多階段特征融合除了對多站特征進行加權的前級特征交互外,還設計了深層注意力特征融合模塊,模塊具體結構如圖7所示。該模塊主要利用站間多視角特征的互補性,通過自注意力機制對站間特征的相關性建模,根據獲取的站間特征的相互依賴關系強弱,實現模型深層階段的自適應特征融合,獲得更加準確的識別結果。
深層注意力特征融合模塊的輸入為第2個前級特征交互模塊輸出的交互特征,。首先,經特征提取獲得的多站特征處于各自的特征空間,在注意力特征融合前需要將各站特征經過一個共享的深層映射層映射到同一高維特征空間,即
然后,利用Transformer層的自注意力機制對多站特征fin1∈R1×B,fin2∈R1×B,fin3∈R1×B間的相關性進行建模,B為深層映射后高維特征空間的維度。由于多站特征融合的輸出應與輸入次序無關,所以此處沒有對多站特征添加位置編碼,使得特征融合所用的Transformer具有置換不變性。接著利用平均池化對交互后的特征進行處理,獲得最終的融合特征。深層注意力特征融合層的輸出out可表示為
其中,[fin1,fin2,fin3]∈R3×B表示將多站拼接后作為輸入,Transformernp(·)表示置換不變Transformer層,Avgpooling(·)表示平均池化操作。最后,使用分類頭對融合特征out進行目標類別的預測,得到識別結果。
考慮到多站協同場景下的融合識別,提出模型應具備對站間輸入順序變化不敏感的特性,即模型應需要具備置換不變性。傳統的序列神經網絡,如RNN對輸入序列的順序比較敏感,難以實現輸入數據無序性的相關性建模。然而,本文所用的置換不變Transformer則可以很好地符合這一特性。置換不變Transformer與用于特征提取的Transformer層的對比如圖8所示。特征提取階段利用Transformer進行HRRP特征提取時,對HRRP子序列引入了額外的位置編碼,這些位置編碼記錄了HRRP子序列間的相互位置關系,使得Transformer能夠建模這種時序相關性,實現局部與全局的特征提取,如圖8(a)所示。然而,置換不變Transformer通過舍棄位置編碼操作,實現無序數據間的相關性建模,使得多站融合輸出結果與輸入的各站HRRP特征順序無關,如圖8(b)所示。

圖8 置換不變Transformer與Transformer特征提取層對比圖Fig.8 Comparison of permutation invariant Transformer in feature fusion and Transformer in feature extraction
實驗中所用實測數據來自單部雷達采集的某一航線的5型目標回波,雷達參數如表1所示。數據采集過程中,目標的徑向距離變化范圍為40~100 km,方位角變化范圍為2°~50°。然后,將測量到的數據依目標距離、方位角的變化劃分為3段,分別用每段數據作為各雷達站的觀測數據。其中,各站觀測數據中目標的距離變化范圍約為20 km,方位角變化范圍約為16°。本文通過以上方式模擬三站場景進行協同識別實驗。

表1 雷達參數Tab.1 Parameters of radar
實驗中所觀測的目標共包含5型民航客機,各類目標的物理參數如表2所示。圖9展示了模擬三站場景對應的HRRP,圖中每一行分別代表不同型號的飛機,每一列分別代表不同的雷達站點??梢钥闯鐾荒繕嗽诓煌暯窍掠^測到的HRRP之間存在明顯差異,因此在多站協同條件下可以獲得更多與目標相關的信息。

表2 目標物理參數Tab.2 Parameters of targets

圖9 模擬多站場景的目標HRRPFig.9 Target HRRP examples for simulating multistation scenarios
實驗中,對每類目標分別采集不同架次的多批次數據,并按采集批次劃分訓練集和測試集。每個站點的訓練集包含13349個樣本,測試集包含12314個樣本,每個HRRP樣本維度為256維,各型目標的訓練與測試樣本數如表3所示。

表3 數據集樣本分布Tab.3 Dataset samples distribution
實驗中的所有方法均在單張RTX 3090顯卡上使用Pytorch實現,訓練損失函數采用交叉熵損失,優化器采用AdamW[22],初始學習率設置為1E–3,訓練輪次設置為200,訓練批量大小設置為64,子序列長度P為32,輸入編碼維度D設置為128,前級特征交互模塊中主支路權重w11,w22,w33均設置為0.6,其余支路權重設置為0.2,實驗中的相關參數配置如表4所示。

表4 實驗參數配置Tab.4 Experimental parameters configuration
為了評估所提方法在多站協同識別場景下的有效性,本文選取了多種方法進行了識別性能對比。對比方法包括基于卷積神經網絡(Convolutional Neural Networks,CNN)模型的單站識別方法、基于CNN的數據融合方法[23]、基于CNN的特征融合方法[24]、基于CNN的決策融合方法[25]、基于Transformer的單站識別方法、基于Transformer的特征融合方法。其中,CNN單站識別方法由3層卷積層和兩層全連接層構成,3層卷積層的通道數分別為8,16,32,卷積核大小均為1×5,步長為1,全連接層神經元數目分別是512和5?;贑NN模型的多站協同識別方法在單站CNN模型的基礎上分別構建以數據拼接為輸入的數據融合識別方法、以特征拼接的特征融合識別方法和以單站預測概率加權的決策融合識別方法?;赥ransformer模型的單站識別方法使用3層Transformer層提取特征,兩層全連接層用于最終識別?;赥ransformer模型的特征融合方法將每個站的第3層Transformer層的輸出特征進行拼接,作為本文基線方法。所有方法均在同一設備、相同超參數設置下完成。表5為所提方法與其他方法的識別結果對比。

表5 實驗結果Tab.5 Experimental results
從表5可以看出,本文方法能夠提取高質量的表征目標特性的特征,并通過前級特征交互和深層注意力特征融合模塊有效利用各站觀測數據的互補性,從而在所有方法中獲得了最優的識別性能,識別率達到96.90%。在單站識別方法中,基于CNN模型的單站識別方法的最優識別率為90.71%,基于Transformer的單站識別方法的最優識別率為93.21%。本文方法相較二者分別提升了6.19%和3.69%。對比各單站識別方法,由于Transformer模型能夠在關注HRRP局部結構信息的同時關注HRRP的全局結構信息,具有優于CNN模型的特征表達能力,所以基于Transformer的單站方法的識別率全面優于對應的基于CNN的單站方法的識別率。在多站協同識別方法中,基于CNN模型的多站協同識別方法在使用決策融合時取得最優90.96%的識別率,基于Transformer模型的特征融合方法的識別率為93.60%,本文方法相較二者分別提升了5.94%和3.30%。通過對比多站協同識別結果和單站識別結果,可以看出多站協同識別方法可以從額外的數據中獲得更多的關于目標的信息,有效提升識別性能。本文方法進一步通過使用多階段融合策略改善了傳統融合方法融合能力不足的問題,獲得了顯著的識別性能提升。
表5還給出了各方法的參數量及計算量的對比。本文方法的參數量低于基于CNN模型的多站融合方法,計算量與其相當,而識別性能卻有著明顯提升,進一步表明了本文方法的優越性。
圖10為本文方法對應的測試混淆矩陣??梢钥闯觯疚姆椒▽320,A321的識別性能最好,識別率分別為99.77%和99.79%。對于A350,識別率為97.96%。對于A330-2,識別率為95.68%。A330-3的識別性能最差,識別率為91.64%。進一步觀察類間誤判情況,A330-2,A330-3和A350之間存在部分誤判,從表2可以看出:這3類目標的各項物理參數均比較接近。因此,這部分誤判主要是由目標的物理特性相近造成的。

圖10 測試集識別率混淆矩陣(%)Fig.10 Confusion matrix of the recognition accuracy in test set (%)
為進一步分析本文方法所提特征的可分性,使用t-SNE對歸一對齊后的測試集HRRP數據和經本文方法處理所提取得到的特征進行二維可視化[26,27],如圖11所示。圖中不同顏色、不同符號分別代表不同類型的目標??梢钥闯?,本文方法所提取到的隱層特征在二維可視化圖中呈現出類內分布緊致,類間邊界清晰的特點,各類可分性較模型處理前有著明顯提升。

圖11 測試集數據與本文方法所提特征的二維t-SNE可視化Fig.11 Visualization of test data and feature via two-dimensional t-SNE
在基于角度引導Transformer融合網絡預處理過程中,需要確定劃分的HRRP子序列的個數N。N越大,劃分的HRRP子序列越多,對目標局部結構的關注粒度更精細,但輸入序列數增多同時增加了模型學習的難度和計算量。相反,N越小,劃分的HRRP子序列越少,模型計算時所需的計算量也較少,但對目標HRRP局部結構的關注粒度更粗,影響模型的表征能力。在實際應用中可根據實驗數據選擇合適的N。為分析模型對N的依賴程度,設計從2到128不等的HRRP子序列個數作為輸入,測試其對識別率和計算量的影響。圖12給出了識別率以及計算量隨著N變化的曲線圖。當N過大或過小時,都會引起識別性能的顯著下降。當N=8時,模型取得最優的識別性能,并具有相對較小的計算量。

圖12 識別率和計算量隨著HRRP子序列個數變化的曲線圖Fig.12 Accuracy and calculation amount changing with the number of HRRP subsequences
為了評估所提方法中各個模塊對識別性能的貢獻,本文將上述Transformer特征融合方法作為基線方法,通過對基線方法中逐步添加各個模塊進行消融實驗。消融實驗結果如表6所示?;€方法的識別率為93.60%。當在基線方法中添加角度引導模塊時,識別性能提升0.90%,表明所提出的角度引導模塊能有效地將目標的角度先驗融入到特征提取過程中,引導模型提取與目標方位角匹配的特征。當只添加前級特征交互模塊時,識別性能下降0.40%,這是因為僅進行前級特征交互而未進行深層特征融合時,模型較難學習到多輸入之間的互補信息。當只添加深層注意力特征融合模塊時,識別性能提升0.10%,說明注意力機制能改善特征融合的性能。當同時添加角度引導和前級特征交互模塊時,識別性能提升0.17%,由于缺乏深度特征融合,識別性能提升有限。當同時添加前級特征交互和深層注意力特征融合模塊時,識別性能提升0.87%,表明通過前級特征交互提前將其他雷達回波的信息與自身回波的信息進行關聯學習對協同識別有益。當同時添加角度引導和深層注意力特征融合模塊時,識別性能提升2.08%,表明角度引導與深層注意力特征融合組合效果較好。最后,完整的基于角度引導Transformer融合網絡的平均識別率為96.90%,識別性能較基線提升3.30%,說明所提出的3個模塊之間可以有效協作,獲得最大的識別性能提升。

表6 消融實驗結果Tab.6 Results of ablation experiment
針對多站HRRP協同目標識別問題,本文提出了一種基于角度引導Transformer融合網絡的多站HRRP協同識別方法。首先,各站的HRRP回波經預處理消除幅度敏感性和平移敏感性。然后,使用Transformer模塊提取單站回波特征,并利用角度引導模塊對單站特征進行增強。接著,通過前級特征交互模塊和深層注意力特征融合模塊對多站特征進行多階段層次化融合。最后經分類頭輸出多站協同目標識別結果。在實測數據上的仿真實驗結果表明,本文方法可以有效地對多站HRRP回波特征進行融合,通過角度引導模塊、前級特征交互模塊和深層注意力特征融合模塊的有機結合,可以獲得優于單雷達以及常規融合方法的識別性能。最后需要說明的是,本文僅在雷達信號融合處理層面對多站協同目標識別進行了簡要分析,在實際應用中,多站協同目標識別系統還面臨多雷達布站設置、參數配置、回波配準等問題。此外,當部分回波因干擾等出現缺損時,如何進行雷達信號融合處理也是未來需要關注的問題。