金 濤, 王曉峰, 田潤瀾, 張歆東,*
(1. 吉林大學電子科學與工程學院, 吉林 長春 130012; 2. 空軍航空大學航空作戰勤務學院, 吉林 長春 130022)
雷達輻射源識別[1]是電子戰的一個重要組成部分和關鍵步驟,在完成信號截獲和脈沖參數分析后,需要對信號進行進一步分析,以得到輻射源型號甚至是個體信息。傳統的雷達輻射源識別方法需要手動提取并選取特征,比如文獻[2]提出了基于多尺度信息熵的雷達輻射源識別方法;文獻[3]提出基于脈沖角度特征的雷達輻射源識別方法來進一步提升識別準確率。這些方法過于依賴情報人員經驗[4],并且在低信噪比時表現不足;另一方面,雷達技術的不斷進步使得當前電子對抗偵察所要面對的電磁環境[5]日益復雜,時域、頻域和空域交迭情況錯綜復雜,所以迫切需要探究適用于雷達輻射源識別的新方法。
為了探究替代傳統雷達輻射源識別的方法,眾多學者將機器學習引入雷達輻射源識別,如文獻[6]提出基于時頻圖像紋理特征的雷達輻射源識別方式;文獻[7]提出基于小波不變矩來進行輻射源識別,且都取得了不錯的成果。但是機器學習存在模型普適性較差、難以識別有交迭的不完整數據、訓練模型需要運用大量樣本等問題。隨著這些年深度學習在圖像、語音識別[8-9]、自然語言識別領域的不斷突破,如何將深度學習[10-15]運用到輻射源識別領域,從而有效提升識別效率和精度成為當前重點關注的問題。以往文獻中,往往先將輻射源幅度序列轉換為時頻圖像進行識別,如文獻[16]將提取的時頻圖像放入埃爾曼網絡中進行識別;文獻[17]用棧式稀疏自編碼器來提取特征并識別信號;文獻[18]使用卷積神經網絡進行雷達信號波形識別。將幅度序列轉換為時頻圖像需要耗費大量的工作量,時頻圖像在低信噪比時識別效果也較差,因此無法應用于實際戰場。
在此背景下,本文提出了一種基于改進一維卷積神經網絡[19-20](one-dimensional convolutional neural network, 1DCNN)與時間卷積網絡(temporal convolutional network, TCN)[21]的新型分類方法。相較于需要輸入時頻圖像的方法,本文模型能夠直接輸入輻射源幅度序列。序列數據相較于時頻圖像,所需內存更小,因此不僅能夠節省大量轉換時間,而且能夠同時處理更多數據。另外,本文模型還能夠自主學習和提取特征,相較于人工提取特征的方法能夠更加準確快速地提取信息,從而有效提升識別準確率和識別精度。
TCN是在傳統卷積神經網絡基礎上進行改進和優化而得到的一種新型網絡結構,主要是由卷積神經網絡和殘差[22-23]結構連接構成,同時引入因果卷積和空洞卷積[24]。因果卷積能夠實現序列建模,空洞卷積能夠在不增加池化層的前提下擴大感受野,并學習長序列數據。TCN的網絡結構如圖1 所示。TCN結構具有以下特點:
(1) 并行性:由于卷積神經網絡每一層使用相同的卷積核,因此一個長序列輸入可以用TCN并行處理;
(2) 靈活的感受視野:引入空洞卷積能夠在不增加池化的同時擴大感受野,所以TCN網絡擁有靈活的感受野;
(3) 可變的輸入長度:TCN中加入了0-padding使網絡能夠輸入不同長度的數據;
(4) 梯度較為穩定:不會因為不同時間段共享參數而導致梯度爆炸或者消失;
(5) 更小的內存訓練:TCN里同一層卷積核共享,所以能夠占用更少內存。
對于雷達輻射源識別來說,如何迅速準確地識別出信號是要解決的首要問題。相較于常見的神經網絡模型,TCN能夠做到保證準確率的同時更加迅速地識別輻射源信號,主要原因有以下3點:① TCN能夠并行處理雷達輻射源信號,相較于常見串行處理數據的循環神經(recurrent neural network, RNN)、長短時記憶網絡(long short time memory, LSTM)網絡等,其速度更快。② 通常來說,網絡層數越多,訓練越復雜,識別雷達輻射源信號所耗費的時間越長。TCN采取空洞卷積,能夠識別長輻射源幅度序列的同時減少層數的數量,進而縮短訓練時間。③ 常用于雷達輻射源識別的RNN和LSTM等網絡,采用逐層傳遞信息的方式,TCN采用殘差連接,能夠跨層傳遞信息,所以訓練速度更快。
TCN一般采用ReLU激活函數[25],該激活函數確實能在一定程度上加快模型的收斂,但是ReLU激活函數在訓練過程中是很脆弱的,很容易就會導致神經元壞死等問題。
為了解決這個問題,需要尋找一個代替ReLU的激活函數,常見的選擇方向有指數修正單元ELUs或者參數化線性修正單元如Leaky ReLU[26]等。ReLU是將所有的負軸上的值都設為零,如圖2(a)所示;ELUs在負軸上采用較小的指數函數代替ReLU負軸上的零值,使得負軸上的值能得以保留一部分,如圖2(b)所示;Leaky ReLU是給負軸的值賦予一個非零斜率,如圖2(c)所示,合理地選取斜率值不僅能在一定程度上增加模型在零點附近的擬合能力,還會降低模型過擬合的風險。
當向模型中輸入輻射源幅度序列時,隨著幅度序列的不斷增長,會出現信息過載問題,為了解決這個問題,引入注意力機制[27]。注意力機制能夠計算當前輸入序列和輸出的匹配程度,匹配度越高,網絡也就越重視輸入序列里面包含的信息。Attention計算得到的匹配度權重,只限于當前序列對,并不是整體權重,因此能夠根據輸入序列和輸出的不同來變換權重。對于雷達輻射源識別來說,注意力機制能幫助深度學習模型將已經輸出的輻射源信號類型與輸入的輻射源幅度序列相匹配,并計算出相應的匹配度權重來幫助網絡進一步提升整體識別準確率。對于易于漏選、錯報的弱小信號,注意力機制也能夠通過計算輸入的弱小信號與輸出的匹配程度,并計算匹配度權重來提升識別準確率。注意力機制的具體實現流程如圖3所示。
一系列的<“鍵”,“值”>數據對構成“源頭”中的數據,首先選定一個“詢問”,通過計算“詢問”和各個“鍵”的相似性或者相關性,并通過相似性的不同得到每個“鍵”對應“值”的權重系數,然后使用softmax將這些權重系數歸一化處理,最后將“值”和權重系數進行加權求和,即得到了最終的注意力數值。
對于注意力機制而言,“詢問”表示輻射源信號,源頭中的“鍵”和“值”含義相同,就是輸入的輻射源信號中每個信號所對應的權值。通過對輻射源信號進行加權求和,得到最后的注意力輻射源信號,從而使模型關注更重要的輻射源信息來更加快速準確地完成對輻射源信號的識別。注意力機制在輻射源幅度序列識別中采用自動加權方式,可以通過加權的方式將源模塊ms和目標模塊mt相聯系。目前常用的計算方式為
(1)
(2)
式中:Wa、Ua、Va表示權值矩陣;mt和ms在輻射源識別中表示“輻射源信號”和“每個信號對應的權值”;dot表示點乘;general加入了參數Wa表示更通用的點乘;Concat表示拼接;perceptron表示感知機。
本文在原有TCN的基礎上進行改進,同時引入1DCNN和注意力機制,模型結構如圖4所示。本文的結構主要由一維卷積層、TCN層、Attention層3部分組成。
第一部分是改進的1DCNN,相較于常見的卷積神經網絡,本文首先在第一層卷積層前加入批歸一化層[28]來加快模型擬合速度,然后將ReLU激活函數替換為Leaky ReLU激活函數,最后在全連接層中加入權值初始化來加速訓練過程。第二部分是TCN層,本文采用了兩層TCN,并將其中的ReLU激活函數替換為Leaky ReLU激活函數來增加模型零值附近擬合能力。第三部分是Attention層,該層位于全連接層前,能夠幫助模型提取關鍵特征輸入到全連接層中,提高分類準確率。
卷積層1的卷積核數量為32,卷積核的時域窗長度為5,最大池化層的窗口大小為2;卷積層2的卷積核數量為16,卷積核的時域窗長度為5。時間卷積網絡1的第一個卷積層的卷積核時域窗長度為5,卷積核數量為32,第二個卷積層的卷積核時域窗長度為5,卷積核數量為16;時間卷積網絡2采用與時間卷積網絡1相同的參數,這4個卷積層分別由兩個殘差網絡連接;全連接層的參數設置為8,用來分類8種輻射源信號。為了防止過擬合,在網絡中加入Dropout,大小設置為0.2。
步驟 1將數據輸入到本文的網絡之中。
步驟 2將讀取的數據預處理后以14∶7∶9的比例分為訓練集、測試集、驗證集,并將其隨機打散。
步驟 3將要分類數據的標簽變成獨熱碼的形式。
步驟 4設置datetime用來獲取模型訓練時間。
步驟 5本文采用Adam優化算法來快速得到最優解,避免模型達到局部最優解。初始學習率設置為0.001,最大訓練輪數設置為50。
步驟 6在訓練過程中驗證集損失可能會先減后增,這是過擬合的一種表現。為了避免過擬合對實驗結果產生影響,本文引入了早停機制,當驗證集誤差不再減小,且再經過3輪的訓練仍不再減小的情況下提前終止訓練,否則模型會完成50輪訓練后再終止。
本文所要分類識別的雷達輻射源信號有8種,分別為調頻連續波(frequency modulated continous wave, FMCW)、多相碼(Frank,P1,P2,P3,P4)、二進制相移鍵控(binary phase shift keying, BPSK)和Costas。載頻取值范圍均為1~1.2 kHz,除Costas之外,其余7種信號采樣頻率為7 kHz。每個信號的參數如表1所示。

表1 信號的主要參數
根據實際信號特征,采用 Matlab 仿真生成實驗數據,信噪比范圍為-20~10 dB,間隔2 dB;各個信噪比下每類信號均產生2 000個樣本,樣本長度固定為1 024。實驗采用的實驗測試平臺為Intel(R)Core(TM)i7-10750H,NVIDIA GeForce RTX 2070 super。本文的神經網絡模型是在TensorFlow平臺上所搭建的,學習框架采用Keras2.3.0,平臺為PyCharm 2018.3.6 x64,編譯器為Python 3.6。
實驗 1本文所采用的網絡是在TCN的基礎之上進行改進,并引入改進的1DCNN和注意力機制得到的。首先分析引入注意力機制后對改進TCN識別輻射源信號的影響。本文的注意力結構放在時間卷積網絡結構之后,加上Attention的結構圖如圖5所示。
這時網絡結構變成N對N,因為要將多個特征輸入到注意力層。本文所采用的是注意權值不共享的注意力層,從數據集中選取1 024個序列數據,將注意力層給這1 024個幅度序列數據分配的權重系數可視化如圖6所示。從圖中可以看出,當數據流入注意力層之后,注意力機制會計算已經輸出的輻射源信號類型與輸入的輻射源幅度序列的匹配程度,并根據匹配程度分配不同權重系數,在選取的1 024個序列數據中有3個數據與輸出匹配程度較高,因此相應的權重系數較高。
TCN+注意力與TCN的準確率、損失和訓練時間對比如表2所示。從表2中可以看出,加入注意力機制之后,TCN對于雷達輻射源的識別能力有較為明顯的提升,但是模型訓練所用時間大幅增長,這不符合雷達輻射源快速識別的要求。為了解決這個問題,在TCN+注意力網絡之前加入改進的1DCNN幫助時間卷積網絡提取特征來加速訓練。下面分析加入改進1DCNN前后的影響。

表2 TCN加入注意力前后對比
TCN+注意力網絡加入改進的1DCNN前后的準確率、損失、訓練時間如表3所示,并在表3中對加入時間卷積網絡的準確率、損失、訓練時間進行對比。從表中可以看出相較于TCN+注意力網絡,加入1DCNN之后,在準確率和損失基本保持不變的情況下,訓練時間能夠較為明顯的縮短。對比CNN+TCN+注意力(CTA)網絡與TCN,可以發現在訓練時間基本一致的同時,CTA網絡的準確率和損失明顯優于TCN。

表3 加入改進1DCNN前后對比
為了對比不同激活函數對本文深度學習模型的影響,將激活函數ReLU、Leaky ReLU、ELUs分別替換到本文所用的深度模型中,其他參數保持不變,得到的結果如表4所示。從表4中可以看出,Leaky ReLU在準確率和損失方面對比其他兩種激活函數有較為明顯的優勢,所以選擇Leaky ReLU作為本文神經網絡激活函數。

表4 使用不同激活函數的準確率和損失對比
實驗 2為了進一步探究本文所采用的網絡(簡稱為CTA)與本文網絡中所用的TCN的優勢,選取了采用相同參數的時間卷積網絡與本文網絡進行對比;同時,為了進一步探究本文所采用的深度學習模型對比常見深度學習模型的優勢,選擇經典的深度學習模型AlexNet[29]、VGG19[30]、ResNet18[31]進行對比。5種模型采用相同的數據集,得到5種模型在不同信噪比條件下識別準確率如圖7所示,5種模型訓練所用的時間、訓練輪數、準確率和損失如表5 所示。
首先對比采用相同參數的時間卷積網絡與本文所采用網絡,可以看出,雖然TCN網絡訓練速度稍快,但是,本文所采用的網絡模型相較TCN網絡在準確率上有較為明顯的提升。尤其是當信噪比處于-20~-10 dB的時候,本文所采用的神經網絡模型明顯優于TCN網絡,這說明在低信噪比情況下,本文所采用的神經網絡模型,能夠更加準確地識別出雷達輻射源信號。

表5 5種模型訓練情況
從圖7中和表5中可以看出,相較于其他3種經典模型,本文所采用的神經網絡模型,無論訓練時間還是準確率方面都具有明顯優勢,這說明本文所采用的神經網絡模型訓練難度對比其他3種經典網絡模型較低,更適合應用于雷達輻射源識別;AlexNet對比其他幾種模型網絡精度最低,雖然單輪所花費的時間較短,但是所需要的輪數較多,因此不適合用于雷達輻射源識別;ResNet18和VGG19對于雷達輻射源識別的準確度基本相似,但VGG19所用時間明顯低于ResNet18;綜合比較時間卷積網絡和常用的經典網絡模型,本文所采用的網絡模型能夠較好地均衡分類精度和時間,能夠更加準確快速地識別雷達輻射源信號。
實驗 3為了探究本文所采用的模型對不同雷達輻射源信號識別的能力。將本文訓練得到的網絡模型在不同信噪比下對8種輻射源信號進行識別。可以得到模型對8種信號在不同信噪比的識別情況如下圖8所示。
從圖8中可以看出,當信噪比高于-10 dB的時候,本文所采用的模型對于8種信號的識別基本可以達到100%,即使信噪比處于-16 dB時,模型對于8種信號的識別精度依舊能達到90%,能夠基本滿足模型低信噪比下對于信號識別精度的要求;當信噪比的值繼續下降時,模型對于8種雷達信號的識別精度也會隨之繼續降低,當信噪比處于-20 dB時,可以看出Costas信號受到信噪比的影響最大,精度會降低到55%左右;P3碼受到的影響最小,精度依舊會保持在77%以上;對于BPSK和Frank信號來說,當信噪比處于-20 dB時,識別準確率會降低到63%左右;對于其他4種信號識別結果將為均衡,都保持在72%以上。當信號的信噪比較低時,傳入模型中的信息會包含大量噪聲和干擾,這些噪聲和干擾會被模型當作信號特征導入模型,所以當信噪比較低時識別精度會顯著下降。
8種信號的整體混淆矩陣如圖9所示。從圖9中可以看出,絕大部分信號能夠被準確的分類,能夠明顯看出一條清晰的對角線。對于這8種信號,在-20~10 dB信噪比下,平均準確率均能達到94.7%以上,能夠做到較為準確的識別。從圖9中也可以看出,P3和Frank信號受噪聲影響相對較小,BPSK和Costas更容易受到噪聲影響。
本文在TCN的基礎之上,引入改進后的1DCNN和注意力機制,并且通過改進激活函數等方式進一步優化神經網絡模型性能。引入注意力機制,將輻射源信號依照權重系數進行篩選,使網絡更加集中于重要信息,能夠有效提高模型對于輻射源信號識別準確率;加入一維卷積神經網絡能較明顯加快網絡訓練速度。通過仿真實驗對比表明,對于8種輻射源信號,本文提出的網絡結構能夠做到快速準確的識別,有效地平衡了識別速度和識別精度。