張旭威,徐鵬濤,管振輝
(中國船舶集團有限公司第七二三研究所,江蘇 揚州 225101)
雷達信號分選作為雷達偵察系統的關鍵技術之一,其目的是從接收到的隨機混疊脈沖流中分離出每一部雷達所產生的脈沖列[1]。分選結果的正確與否直接影響后續的信號處理工作,繼而影響戰場態勢感知能力、情報獲取能力和決策判斷力。
信號分選的典型方法是將脈沖描述字(PDW)通過預分選稀釋脈沖流,然后再對脈沖重復間隔(PRI)進行處理以完成主分選。
由于現代戰場環境中雷達輻射源數量的激增、雷達信號調制的復雜多變等因素影響,戰場電磁環境較之以往更加復雜,這給信號分選的實時性和準確性都帶來了極大的挑戰。傳統的基于脈沖重復間隔(PRI)這一單參數進行分選的算法,如積累差直方圖(CDIF)[2]、時序差直方圖(SDIF)[3]、PRI變換法[4]等對固定、參差和正常抖動范圍的低電磁環境復雜度下的雷達信號有較好的分選效果,然而分選過程需要人為設置多個參數以滿足分選需要,靈活性差,越來越難以適應現代戰場的需要。
機器學習[5]有著從樣本數據中獲取規律并利用此規律對未知數據進行預測的特點,而雷達信號分選從本質上來看,也是從一堆雜亂的樣本信號數據中找出信號的規律并進行后續處理的過程。因此,將機器學習算法應用于雷達信號分選也是一種新的發展趨勢。
本文提出一種基于Transformer[6]的雷達信號分選方法,該方法較傳統雷達信號分選技術而言更為靈活,且對復雜調制雷達信號適應性較好。實驗證明該方法對復雜電磁環境下的雷達信號仍然能夠進行有效分選,且分選準確率較高。
從脈沖序列的到達時間(TOA)角度來看,PDW數據就是一連串的序列型數據,信號分選就是對這個序列中的數據進行分類。單一地對每個輸入數據進行處理,而不考慮序列中數據之間的關系是不能很好地對數據特征進行學習的。循環神經網絡(RNN)[7]和長短期記憶網絡(LSTM)[8]是處理序列問題的2個經典模型,但是又各有缺點(RNN存在長期依賴所導致的梯度消失問題,LSTM存在并行處理較弱的問題)。
注意力機制(Attention)[9]的發展有效避免了上述2種經典模型的缺點,已成為神經網絡領域的一個重要概念。注意力機制選擇性地關注部分區域的特征,從而提高觀察精細度。
自注意力(Self-Attention)機制是注意力機制的改進,其通過將序列中數據間的所有成對交互關系進行建模,從而捕獲數據內部特征的相關性,減少對外部信息的依賴。這種機制適用于挖掘雷達脈沖序列中PDW數據之間特征的相關性從而進行信號分選的問題。Self-Attention的結構圖如圖1所示,通過3個可學習權重的矩陣{WQ,WK,WV},將輸入序列X做線性變換得到Q=XWQ,K=XWK,V=XWV。自注意力機制的計算公式如下:

圖1 Self-Attention(自注意力)結構圖
(1)
式中:dk為矩陣K的向量維度。
多頭注意力(Multi-Head Attention)機制通過增加Self-Attention的數量來避免單個Self-Attention對序列數據學習能力不足的問題。Multi-Head Attention結構圖如圖2所示。從圖中可以看到Multi-Head Attention包含多個Self-Attention層。

圖2 多頭注意力結構圖
由于Transformer的Attention模塊無法捕獲輸入序列數據的順序,因此將位置編碼添加到模型中以獲得序列中數據的位置信息。位置編碼公式如下:
Ep(pos,2i)=sin(pos/10 0002i/d)
(2)
Ep(pos,2i+1)=cos(pos/10 0002i/d)
(3)
式中:pos表示序列中數據的位置;d表示向量編碼的維度;2i表示偶數維度;2i+1表示奇數維度。
將計算出的Ep與源數據向量相加就得到了含有位置信息的輸入向量。
Transformer模型主要由編碼器(Encoder)和解碼器(Decoder)2個部分組成,而Encoder和Decoder又由若干個模塊組成,模塊中的典型多頭注意力結構如上所述,Transformer的整體結構如圖3所示。

圖3 Transformer整體結構
Decoder模塊中的Masked Multi-Head Attention是在Multi-Head Attention的基礎上多了一步遮擋操作,目的是為了防止數據向量依賴于當前時刻之后的信息。
本文實驗數據為模擬器生成的雷達信號,其中包含一些高重頻、大抖動、同方位的復雜調制信號。為了便于網絡模型訓練、驗證和測試,對接收到的信號進行標注處理。
本文所使用的網絡結構保留了原始Transformer模型的編碼器部分,編碼器模塊的數量為4,在編碼器后接一個全連接的線性層,由于使用的Pytorch中的交叉熵損失函數帶有歸一化指數函數(Softmax),故最后無需再進行Softmax操作。由于數據集中的輻射源數量為40余種,為了讓模型注重于數據特征的學習,將網絡的輸出種類設置為50。具體的網絡模型如圖4所示。

圖4 本文雷達信號分選的整體網絡結構
本文實驗所采用的深度網絡框架工具為Pytorch,運算平臺為CUDA11.4,python版本為3.8。硬件環境:CPU為Intel Core i7-8700,內存容量為64 GB,顯卡型號為NVIDIA GTX1080Ti,顯存容量為11 GB。將采集到的PDW數據經過處理標注后作為訓練集送入到網絡模型中進行訓練,剩下的作為驗證集和測試集。其中總的數據量大小為580 MB,訓練集、驗證集、測試集的劃分比例為6∶2∶2。訓練數據集反復迭代遍歷30次,小批量尺寸設為16,采用Adam優化器,學習率設為0.000 1,損失函數為交叉熵,模型的評價準則為:
(4)
式中:npp表示預測和標簽都是類別p的數量;tp表示類別p的真實數量。
實驗結果如圖5、圖6所示。

圖5 模型在訓練集和驗證集上的損失曲線

圖6 模型在測試集上的準確度曲線

圖9 基于擴展目標布點的目標成像結果
對實驗結果進行分析可知,隨著迭代次數的增加,訓練集和驗證集上的損失值不斷降低,表明模型在不斷學習數據的特征。將30輪次訓練的模型參數保存后在測試集上對模型進行驗證,可以看出模型在迭代輪次下標為28時對測試數據的表現最好,分選準確率達到93%以上。
本文提出了一種基于Transformer的雷達信號分選方法,該方法將完整的Transformer網絡結構進行了適應性的修改以滿足雷達信號分選的需要,利用模型中的位置編碼和多頭注意力機制加強對PDW的數據特征進行訓練學習,從而達到雷達信號分選的目的。實驗證明,本文提出的方法可以對復雜電磁環境下的信號進行有效分選,對于復雜調制的雷達信號仍然具有適應性,在整個測試集上的分選正確率達到93%以上。