殷雪鳳,武 斌
(西安電子科技大學電子工程學院,陜西西安 710126)
雷達輻射源識別(REI/RER)技術是電子戰中至關重要的一部分,是電子支援措施(ESM)的核心和雷達對抗系統中的關鍵技術[1]。輻射源識別技術通過從偵察信號中獲取目標輻射源的體制、用途、型號等信息,為下一步態勢估計、威脅估計和決策調整提供依據。
在輻射源識別研究的早期,信號穩定、調制簡單,傳統的雷達輻射源識別方法主要是基于脈沖描述字(PDW)的特征提取方法[2]。但隨著雷達技術的發展,特別是新體制、新用途雷達的使用,調制形式變得復雜,調制參數轉換越來越快捷,時空領域范圍內的雷達信號交錯,密度增大,傳統雷達輻射源識別方法不能有效對輻射源進行識別[3]。因此,最新的電子戰系統還對雷達信號的脈內特征進行分析,不少研究人員在這方面做了大量工作。時頻特征、小波包特征、分數階傅里葉變換域特征和小波脊頻特征等參數在輻射源識別領域中都取得了不錯的效果[4]。但這些方法都需要人工提取特征,費時費力,而且人為提取的特征在輻射源識別系統中的有效性和普適性還有待深入研究,因此,整個系統對人為因素的依賴太強。
隨著人工智能的發展,特別是近幾年深度學習的崛起,不少專家學者將深度學習模型應用于雷達輻射源識別中,并取得了一定的成果。文獻[5]提出了一種基于深度置信網絡的識別算法,將信號的時頻圖輸入訓練好的深度置信網絡,識別不同調制信號。文獻[6]對輻射源信號進行幅-相二維圖像表征,利用卷積神經網絡對二維圖像進行特征提取和分類,實現了對不同調制信號的分類識別。文獻[4]將輻射源的二維時頻圖用隨機投影和主成分分析方法進行降維,再利用層級編碼器(SAE)模型挖掘時頻圖像的深度聯合特征,實現對輻射源信號的識別。然而,這些深度學習識別算法,需要對信號進行處理,變換到時頻域或其他維度,增大了信號處理的復雜性。
針對以上問題,本文提出一種基于一維卷積神經網絡(CNN)和長短期記憶網絡(LSTM)的深度學習雷達輻射源識別模型,首先通過一維CNN的局部特征學習能力自動提取雷達信號的局部特征,然后通過LSTM學習雷達輻射源信號序列在整個時間維度上的信息,最后通過全連接層得到樣本數據屬于各個輻射源的概率完成分類,實現對原始輻射源時域信號端到端的識別。仿真實驗證明了該方法的有效性。
卷積神經網絡(CNN)常用于計算機視覺領域,它通過直接與圖像像素進行卷積來提取圖像特征[7]。CNN相鄰層的節點不采用全連接的方式,一般由卷積層和池化層交替級聯。
卷積層的目的主要是提取輸入的特征值點,通過設置一個卷積核,然后以一定的步長滑動卷積核,基于卷積核與輸入的卷積,由此得到對應的局部特征矩陣。通過采用不同的卷積核與原始輸入進行卷積運算,即可從不同角度提取輸入的特征。這樣的方式保留了原有輸入特征的順序關系,同時卷積運算特征提取的方式實現了權值共享,減少了參數數量。池化層使用一個過濾器以一定步長對矩陣進行掃描,獲取視野域的最大值或平均值,其作用是對卷積層的輸入結果進行采樣,進一步壓縮特征圖,實現特征降維,防止過擬合。
長短期記憶網絡(LSTM)是一種特殊的循環神經網絡,由Hochreiter等人提出[8],它可以根據當前以及過去較遠時間的輸入,完成輸出預測的任務。
LSTM由遞歸連接的LSTM單元組成,每個LSTM單元結構如圖1所示,分別由遺忘門、輸入門、輸出門組成。首先通過遺忘門σf根據輸入xt和上一LSTM單元的輸出ht-1對上一時刻的輸入狀態Ct-1進行控制,丟失不重要的信息;然后輸入門的控制信息σj來決定添加有用的信息,得到當前狀態Ct;最后通過遺忘門和輸入門影響輸出門,得到最終輸出ht。其中,tanh為激活函數對狀態量和輸入量進行縮放。這種結構使網絡能夠選擇性地記住對輸出重要的信息,遺忘不重要的輸入[9]。

圖1 LSTM單元結構圖
在本文提出的輻射源識別算法中,采集得到的不同調制方式的帶標簽的基帶雷達輻射源信號,在經過z-score標準化預處理之后,直接輸入搭建好的CNNSLTM深度學習模型中,模型通過反向傳播算法調節網絡參數,使網絡收斂,最終能夠實現對不同調制方式的時域信號進行識別。
本文采用的預處理方式為z-score標準化方法,這是一種在深度學習中常用的數據處理方法,經過處理的數據均值為0,標準差為1,保證不同維度的數據具有相同的分布規模,更有利于網絡優化,能有效縮短訓練時間。
設原始輻射源采樣序列為x=[x1,x2,x3…xN],其中N為采樣點數。以第i個采樣點為例,標準化之后的采樣值為:


通過以上的標準化處理,使得輸入數據分布在較為合理的范圍以內,有利于減小樣本數據間量綱的差異對預測結果的影響。
由于雷達輻射源信號是典型的時間序列數據,因此本文選用擅長處理時間序列的一維CNN網絡和LSTM網絡解決雷達輻射源識別問題。CNN擅長局部特征的提取,而LSTM則擅長捕獲數據時序性,適合處理時間序列。為了更好地提取雷達輻射源信號的特征,本文將二者結合,用CNN提取雷達信號的局部特征,用LSTM挖掘信號整體的關聯,提取全局特征,網絡結構如圖2所示。用3個卷積單元提取輸入信號的局部特征,即短時間內各個采樣點之間的關系;1個LSTM層用于提取較長時間采樣點之間的相關關系;最后通過2個全連接層,實現對于不同調制信號的識別[10]。

圖2 CNN-LSTM網絡結構示意圖
此處的3個卷積單元的結構相同,都由卷積層、批量歸一化層(BN)、激活層、池化層構成,如圖3所示。卷積層計算信號與不同卷積核的卷積,激活層將卷積得到的特征進行非線性激活。為了更有利于提取信號的局部特征,每個卷積單元的卷積核大小分別為:4×1、3×1、3×1,較小的卷積核具有更小范圍的感受野,更有利于關注局部的特征。為了加快網絡的訓練和收斂速度,降低梯度爆炸和梯度消失的情況發生,防止網絡過擬合,在對卷積結果進行激活之前,加入了BN層[11]。最后將激活層的輸出輸入池化層進行下采樣,對特征進行降維,此處池化層采用的池化方式為最大池化,另外,在池化層中為了進一步提高模型的泛化能力,還進行了Dropout操作。卷積單元這樣的設置,即保證輸入信號的特征能被有效提取,BN層和池化層的加入也能防止網絡過擬合,同時提高訓練速度。

圖3 卷積單元結構示意圖
LSTM層將卷積單元得到的特征圖進行計算,得到特征之間的全局關系,使得網絡對于整個采樣時間內的采樣值有更加全面的認識。通過CNN之后的網絡輸出不僅數據規模減小,而且時間維度的局部特征更為明顯,這幫助提高了LSTM的訓練速度。而LSTM層可以很好地完成時間上的特征提取,更好地發現時間片間的聯系,得到更有利于雷達輻射源識別的特征。最后,網絡末尾的2個全連接層對LSTM的輸出進行處理,實現不同調制信號的分類識別。整個網絡部分參數如表1所示;LSTM輸出節點數為64;FC1輸出節點數為64,激活函數為ReLU,Dropout為0.5;FC2輸出節點數為6,激活函數為Softmax。
本文采用的損失函數為交叉熵函數,這是由于本文研究的雷達輻射源識別問題屬于機器學習中的多分類問題,采用該函數更利于網絡訓練。優化算法為隨機梯度下降算法,學習率設置為0.001。訓練時批處理的大小為256,每次迭代結束后檢查驗證集損失值,當其連續多次不再發生變化,則表明模型參數訓練充分,停止訓練,得到訓練好的雷達輻射源識別網絡模型。

表1 CNN?LSTM網絡參數
本文的仿真實驗是在谷歌的Google Colaboratory在線平臺上進行的,平臺GPU的型號為Tesla T4,內存為12.78 GB,硬盤為40 GB。系統版本為Ubuntu 18.04.3,軟件上用python 3語言在以TensorFlow為后端運行的Keras上實現。
實驗中的雷達輻射源數據均是通過Matlab仿真得到,主要包含6類不同的調制信號,分別為:常規脈沖信號(CP)、線性調頻信號(LFM)、非線性余弦調頻信號(NCFM)、二相編碼壓縮信號(BPSK)、二頻率編碼信號(BFSK)和四頻率編碼信號(QFSK)。為使仿真信號更接近原始雷達輻射源信號,信號調制參數不取固定參數,而是在設置的參數值的一定范圍內波動,如常規脈沖信號的載波頻率為200 MHz,實際仿真載波頻率值在(190 MHz,210 MHz)區間內均勻分布,具體參數如表2所示。統一取采樣頻率fs=4 GHz,仿真時長T=1.024 μs,脈寬為τ=1 μs,采樣點數為4 097個點。其中,BPSK和BFSK采用的編碼方式為11位巴克碼,碼元寬度為0.09 μs;QFSK采用的編碼方式為16位Frank碼,碼元寬度為0.062 5 μs。
為驗證模型的抗噪聲性能,仿真生成了-12~14 dB、步長為2 dB的樣本數據。在模型訓練階段,每類調制信號在一種信噪比條件下仿真了500個樣本數據,設置6種調制類型、14個不同的信噪比,共42 000個數據作為訓練集。在訓練時隨機選用37 800個樣本訓練,4 200個樣本用于驗證。另外,生成了每種調制信號單一信噪比下100個樣本、共8 400個樣本的數據集作為測試集,用于測試訓練得到的網絡性能。

表2 不同調制信號的參數設置
本文提出的基于CNN-LSTM深度神經網絡的雷達輻射源識別模型,在訓練集上得到充分訓練后,最終在測試集上的平均識別準確率達到了91.13%。為了進一步探究CNN-LSTM網絡對不同調制信號的識別情況,本文分別統計了每種調制信號在不同信噪比下,樣本的識別正確率,如圖4所示。由圖4可知,在信噪比大于-4 dB時,網絡對于6種調制信號的識別正確率都達到了90%以上;當信噪比在4 dB以上時,對于所有調制信號的識別正確率都達到了100%,可見,CNN-LSTM網絡對于不同的調制信號都有較好的識別效果,具有較好的抗噪聲性能。

圖4 不同信噪比下6種調制信號識別結果圖
另外,為了說明LSTM層對于網絡的影響,在實驗中,設置了對照實驗,訓練了另一個CNN網絡,該網絡結構將CNN-LSTM網絡中的LSTM層改成了Flatten層,直接把多維輸入一維化,其他結構和參數與CNN-LSTM完全相同,以同樣的方式對該網絡進行訓練,并在相同的測試集上測試網絡,將其識別結果與CNN-LSTM網絡識別結果進行對比。圖5為CNN-LSTM網絡以及CNN網絡在不同信噪比下的識別結果。從圖5中可以看出,在信噪比高于-6 dB的情況下,CNN-LSTM網絡的識別結果的正確率都在90%以上;在信噪比高于2 dB之后,該模型的準確率達到了100%。相比之下,CNN模型在低信噪比的情況下識別結果遠不如CNN-LSTM模型,在信噪比為-8 dB時,識別準確率就已降到了70%以下。由此可見,CNN-LSTM模型能更有效識別不同調制信號,具有更好的抗噪聲性能。

圖5 CNN-LSTM與CNN網絡識別結果比較
為了進一步分析模型識別的準確性,對識別結果進行了抗混淆性能分析。表3為測試集識別結果的混淆矩陣,由表3可知,模型對于所有調制類型的信號識別正確率都能達到80% 以上。模型對于LFM和QFSK的識別效果最好,識別的正確率達到了94%以上;不論何種信噪比條件下,模型對于NCFM、BFSK的識別效果也比較好,識別準確率都達到了90%以上;但對于BPSK信號的識別效果不佳,僅為81.57%,模型易把BPSK信號錯誤識別成CP信號,而對于CP信號,被錯分成BPSK信號的概率也是最高的。可見,不論對于何種信號,模型的整體識別能力都是不錯的,都達到了80%以上,但對于CP和BPSK信號的識別能力還有待加強。

表3 CNN?LSTM網絡輻射源識別混淆矩陣 %
為了研究批處理大小對單個測試信號處理時間的影響,實驗選取設置不同取值的批量,在不同批處理大小下統計處理單個信號的時間,其中批處理的取值為[2,4,8,…,4 096,8 192]。實驗結果如圖6所示。由圖6可知,批量大小對單個樣本的測試時間有較大的影響,當批處理大小為2時,單個樣本的測試時間約為200 ms,當批量大小大于1 024后,單個樣本的測試時間基本穩定在3 ms左右。因此,每次將多個測試樣本輸入網絡能有效降低單個測試信號的處理時間,提高網絡工作效率。

圖6 不同批處理大小與單個樣本測試時間關系圖
本文提出了一種基于一維CNN和LSTM的深度學習輻射源識別模型,對輻射源時域信號進行自動特征提取,實現了對6種不同調制信號的識別,避免了人工提取特征的困難;另外,本文用LSTM網絡提取輻射源信號的全局關系,提高了網絡的抗噪聲性能。仿真結果表明,相比于單一CNN網絡,加入LSTM層的網絡的抗噪聲性能更好,在-6 dB的信噪比條件下,識別的準確率能達到90%。CNN-LSTM網絡從整體來看具有很好的識別效果,但是對于某些特定調制信號的識別正確率偏低,如常規脈沖信號。未來的工作將進一步改進網絡,提高網絡對于CP信號的識別率。另外,本文發掘出的LSTM網絡結構良好的抗噪聲和全局學習性能,可以考慮將其應用到輻射源識別的其他方面,如雷達指紋識別等。