段可欣,閆文君,劉 凱,王藝卉,3,李春雷
(1.海軍航空大學,山東 煙臺 264001;2.91422部隊,山東 萊陽 265200;3.31401部隊,山東 煙臺 264001;4.92038部隊,山東 青島 266109)
隨著現代軍事裝備技術的發展,大量新體制輻射源的出現使戰場電磁環境變得日益復雜。新型技術體制的雷達不斷裝備戰場,電子對抗環境日趨復雜與密集。信號參數不斷變化對雷達輻射源信號分選識別提出了更高的要求。輻射源個體識別(Specific Emitter Identification,SEI)對于雷達對抗信息處理和雷達對抗偵察系統都具有重要意義,其不僅能使雷達對抗、偵察、干擾等效能得到充分發揮,更重要的是,它還能由輻射源的性能、工作狀態等輻射源個體信息,分析得到關于輻射源載體的屬性、工作狀態和威脅等級等初始判斷信息。
在雷達輻射源識別領域,基于傳統特征的個體識別方法對于目前復雜的電磁環境適用性較差,尤其當待識別信號數量少、提取累積特征困難時,識別能力有限。因此,不斷有專家學者提出新的特征提取方法。高階譜分析在分析信號特征時具有獨特的優勢,與時間無關的特殊性使高階譜分析能夠提取信號的非高斯性特征和非線性特征。除此之外,還具有相位保持性和尺度不變性等優良特性。信號雙譜分析[1-2]作為高階譜應用中最廣泛的1 種方法,在信號處理中備受關注。
孟祥豪等提出用雙譜的對角線積分作為特征,對復合調制LPI 雷達信號進行識別的方法,降低了計算量,但對信噪比有一定要求[3];張彥龍等融合了雙譜理論、奇異值分解和信息熵理論對不同調制類型的雷達輻射源信號用模糊C均值算法進行聚類分析,但為降低計算量,僅對第一象限區域進行取樣分析,整體特征獲取不夠全面[4];王世強等提出利用Bhattacharyya距離結合SVM對信號雙譜進行分析處理的分類識別辦法,對雙譜特征加以優化,算法結果較穩定,但是該方法提取輻射源個體信息不夠充足[5];曹儒等先向量化信號雙譜的幅度,再利用層次極限學習機以圖像處理的辦法學習4 類有意調制類型的特征,進而達到識別目的[6];為降低雙譜計算量,陳培博等提出取第一象限的雙譜幅度特征和相位特征,再使用對抗網絡對所提取的特征進行識別[7-8];丁力達等采用卷積神經網絡對二維壓縮后的雙譜特征進行學習,但圖像特征維數過高,聚集性不夠強[9]。綜上所述,在輻射源個體識別中,對所提取的雙譜特征挖掘不夠全面充分,導致輻射源識別效果受限。
本文通過對輻射源信號的雙譜進行分析,根據香農信息熵的概念定義雙譜奇異值全局熵和雙譜對角線的幅度分散熵。首先,將雙譜矩陣進行奇異值分解,依據奇異值的分布規律提取雙譜的奇異值全局熵;然后,以雙譜對角線的幅值分散程度定義幅值分散熵;最后,聯合雙譜對角線及對角積分一起組成特征向量。該方法的特色之處在于在信號分析中融入了熵理論,它可以充分挖掘接收到的輻射源信號雙譜特征在分布上的特征,豐富了輻射源識別指紋特征,提高識別率。
雙譜分析可對信號幅度和相位的保持性顯現出信號的非線性特性。雙譜的概念如下所述[10]。
假定高階累積量ckx(τ1,τ2,…,τk-1)是絕對可和的,即:
則k 階譜定義為k 階累積量的k-1 階散Fourier變換,即:
那么,雙譜即三階譜可定義為:
可以求出接收機接收到的離散含相噪信號為:
式(4)中:w( n )是高斯噪聲信號;s( n )是發射機輸出的含有非高斯噪聲的信號,且w( n )和s( n )相互獨立。對x( n )求三階累積量,則有:
式(5)中,E()· 表示求期望。將式(5)展開,然后合并得到:
所以,只要信號和噪聲的均值為0,就有:
若w(n)是高斯有色噪聲,則c3ω(τ1,τ2)可以忽略不計。可見信號的雙譜可以消除高斯有色噪聲對信號的影響,其雙譜由c3s(τ1,τ2)確定,即:
由上述分析可知,雙譜分析可濾除高斯噪聲的影響,從而最大化保留輻射源信號個體特征。本文仿真了來自3幅射源信號的雙譜,如圖1所示。

圖1 不同輻射源雙譜圖Fig.1 Bispectrum of different radiation sources
由圖1 可以看出,不同輻射源信號雙譜的幅值和分布存在不同。
輻射源個體識別的實時性對輻射源個體特征計算量有一定的要求。如果將信號的雙譜全部納入個體識別中,計算量較大。因此,引入降維的方法,通過對雙譜進行積分,可以將二維雙譜轉變成一維特征函數,但積分雙譜仍有以下缺點:
1)積分雙譜是沿雙譜某一路徑上的積分,但雙譜具有對稱性,存在一些點位上的信息重復和冗余,這些雙譜點對于提取雷達輻射源個體特征的貢獻不大;
2)由于所接收的原始雷達輻射源信號中有可能存在交叉項,經過高階譜多次相關函數計算和雙譜積分后,交叉項將更加嚴重。
為了克服上述缺點,考慮雙譜具有對稱性和周期性的特點,選擇合適的積分路徑既能最大化保留雙譜特征,也能有效避免交叉項惡化。在比較現有積分雙譜特征的基礎上,本文使用對角積分雙譜[11]。選用雙譜次對角線,避免插值的同時,包含了豐富的雷達輻射源信號幅度和相位信息,雙譜對角線積分表達式如下:
對3 個輻射源雙譜分別取對角切片,如圖2 所示。可以看出,不同輻射源的雙譜對角線在幅值和分布規律上有明顯不同。


圖2 不同輻射源雙譜對角線切片Fig.2 Diagonal slices of bispectrum from different radiation sources
熵最初提出是為了表示熱力學中熱狀態的不平衡程度。香農為描述信息量的大小,提出“信息熵”的概念。熵的值對照信息系統的有序程度:值越大,信息系統的信息量越小,信息系統越無序;反之,值越小,系統內信息量越大,信息系統越有序。信息熵定義為[12]:設Pi表示集合中事件i()i=1,2,…,n 出現的概率,則各事件概率矢量的集合為P=(P1,P2,…,Pn),且滿足0 ≤Pi≤1 和=1 。 由此,信息熵H(P1,P2,…,Pn)的值為:
由于雷達信號是有用信號疊加了隨機噪聲,不同的雷達攜帶了一定程度的指紋特征,信號雙譜的能量集中情況和分布復雜程度也因各信號時頻分布存在不同而不同[13]。因此,為刻畫雷達輻射源信號的雙譜能量在全局的分布情況,引入雙譜奇異值全局熵的概念,對雙譜運用奇異值分解[14],提取雙譜矩陣的全局主要信息得到奇異值向量()σ1,σ2,…,σk。奇異值可以理解為“主特征值”,且有從大到小的排列順序。奇異值包含了矩陣的重要特征信息,且奇異值的大小還代表了該奇異值對原始矩陣的重要程度,有權重的含義在里面。1個矩陣可以表示成k 個秩為1,值為奇異值的小矩陣的“和”。k 的值決定了保留奇異值向量的個數,既能保留大部分特征,又能減少計算量。由此引入奇異值的全局熵[15]概念;每個奇異值在整個奇異值向量中占的比重為Qi=,則奇異值的全局熵Eσ為:
雙譜奇異值全局熵包含被分析信號雙譜矩陣的代數特性和分布特征。
由圖2 可看出,雙譜對角線具有非常標準的對稱性,但每個輻射源雙譜對角線上的峰值和谷值的位置、大小各不相同。就本文而言,由于實驗中使用的是同廠家、同型號的發射機,采用的是相同的調制方式,同一臺接收機,在同樣的實驗條件下采集的數據,在對收集的數據進行雙譜分析取得的對角線特征中的不同,就是要提取的輻射源指紋特征。
根據對角線幅值分布情況,先對整條對角線均分成n 段,對每段取幅值均值ai,雙譜對角線可用1個幅值向量()a1,a2,…,an來表示,各幅值均值占幅值積分的比例記為Ai=,則雙譜對角線的幅度分散熵為:
卷積神經網絡(Convolutional Neural Network,CNN)是深度學習[17-18]中1 個非常重要的神經網絡結構[15],多用于圖像,音、視頻等信息的處理。由于具有強大的前向反饋功能,CNN能夠自動學習并提取數據中的特征,進而利用所獲取的特征信息進行識別。CNN 主要包括卷積層、池化層、全連接層。卷積層目的是提取輸入數據的特征,并在迭代過程中提取越來越復雜的特征;池化層是對卷積層提取到的特征進行亞采樣處理,以減少網絡中參數個數,避免過擬合,提高神經網絡識別的魯棒性;全連接層是把CNN學到的特征映射到樣本空間,完成最終的識別任務。
CNN利用卷積核作為“特征過濾器”,使用不同的卷積核以提取不同的特征。卷積層數和卷積核的個數決定提取特征的數量和復雜度,這也正是網絡設計需要平衡的網絡結構的寬度和深度。更進一步,在同一個CNN結構中,迭代次數和訓練的批樣本數量都會影響神經網絡的識別率。這些參數都需要不斷調整尋優實驗獲取,以期用最少的計算量得到最佳結果。本文中,設計的CNN模型使用2層網絡層用于一維特征向量的數據分析,CNN模型如圖3所示。

圖3 CNN網絡結構圖Fig.3 Network structure diagram of CNN
卷積核大小設為3×1。卷積層1(Conv1)由32個長度為3 的一維卷積核構成,卷積運算后做最大池化;卷積層2(Conv2)由64 個長度為3 的一維卷積核作卷積運算,并做最大池化。全連接1(Dense1)有1 024 個結點,全連接2(Dense2,softmax 輸出)有3 個結點,輸出的3個節點代表3個不同的輻射源。
本文實驗平臺為Windows 10,雙譜算法平臺為MATLAB R2018b。深度學習模型架構為Tensor-Flow,其中環境為Python3.7。本文采用基于GNU Radio 和USRP 的SDR 平臺模擬輻射源,用ADS-B 數據流盤軟件和USRP的組合模擬信號收集器。實驗過程中,搭建由裝有GNU Radio 軟件的計算機和3 臺USRP-B210組成的SDR平臺作為信號發射裝置,由裝有ADS-B 數據流盤軟件的計算機和1 臺USRP-B210 作為信號接收裝置,信號采集過程如圖4所示。

圖4 輻射源信號采集系統實物圖Fig.4 Physical diagram of radiation source signal acquisition system
在GNU Radio的GUI界面中,將發射信號的參數設置如下:信號的調制方式為16QAM,載波頻率為1.09 GHz,帶寬為2 MHz,發射增益為50,USRP 采樣率為2 MHz,通道選擇TX/RX 2 ∶0。在ADS-B數據流盤軟件操作界面配置B210 設備信息,工作頻率設為20 MHz,采樣頻率2 MHz,通道選擇RX 2 ∶0,接收增益為60。在發射機流圖與接收機裝置均連接好之后,進行真實環境下的數據收集,實驗場景如圖4所示。
運行GNU Radio 的GRC 流圖,ADS-B 數據流盤軟件的DATA文件開始存儲接收到的.usrp文件,即原始數據集。相同環境下,用同一接收機接收一段噪聲信號,計算這段信號幅度的平均值M 和標準差S。由于這段信號僅包含噪聲信號,令平均值M 作為噪聲強度,即信號強度。假設信號和噪聲的功率比為K ,方差為標準差的平方,即M=,根據信噪比定義可知,SNR=20 lg 10()2,計算得出該環境下信噪比估計值為22.87 dB(取到小數點后2位)。接下來的實驗均在此信噪比條件下進行。
用同一套接收裝置分別接收發射端使用3臺不同USRP-B210發射的信號,保證3臺USRP-B210設備調成一樣的參數,接收來自3 臺不同發射機的.usrp 數據。將收集到的.usrp數據先轉換成.mat數據,然后對.mat 數據進行雙譜分析,得到3 個輻射源的雙譜對角線如圖5所示。
有效運用“四種形態”。緊扣“六大紀律”等規定,堅持正確執紀導向,把握運用好“四種形態”。計提醒談話56人,黨紀輕處分3人,力求挺紀于前、防早防小、治病救人。

圖5 不同輻射源的雙譜對角線統計圖Fig.5 Bispectral diagonal statistics of different radiation sources
在雙譜分析的基礎上,求信號雙譜奇異值全局熵,對角線積分和對角線幅度分散熵。雙譜對角線取值個數設為300,由此得到長度為303 的特征向量,3個輻射源分別收集2 235、1 291、2 212條樣本,共得到5 738條長度為303的數據組成的數據集,訓練集和測試集的劃分比為3 ∶1,將它們送入神經網絡進行訓練和測試。
為降低網絡結構的復雜度,提高模型的泛化能力,本文使用由2個卷積層構成的CNN。采用3×1 的卷積核對輻射源信號進行特征采集,2 個卷積層中卷積核的數目依次為32、64。為保留信號有效特征,池化層采用3×1 的池化核。最后,使用全連接層進行特征組合及特征分類。為了避免模型產生過擬合,本文在CNN 的全連接層后加入dropout 正則項,在訓練過程中隨機使一些神經元失活,進而濾除部分噪聲點。
由于不同參數對網絡性能影響較大,本文在對網絡進行訓練時,采取可變參數策略對網絡性能進行優化。所選取的參數主要有迭代次數(epoch),批樣本數量(batchsize),衡量網絡性能的指標選取為識別率和訓練時的損失函數。
對于神經網絡而言,在模型訓練的過程中,1次訓練所選取的樣本數稱為批樣本數量,它的大小影響模型的優化程度和速度,適當批樣本數量使得梯度下降方向更加準確。運行模型對全部數據完成1次前向傳播和反向傳播的完整過程叫做1 個單次迭代訓練,合適的迭代次數能保證在不會過擬合的條件下得到比較優秀的訓練效果。
圖6、7分別為不同的迭代次數與批樣本數量對網絡性能影響的對比情況。從圖6 可以看出,神經網絡迭代后期,損失函數變化很小。


圖6 不同迭代次數的識別率和損失函數Fig.6 Recognization accuracy and loss function of different iterations
為防止過擬合,在接下來的實驗中,迭代次數設置為1 個較大的數字100,同時使用回調函數callback中的EarlyStopping。在訓練過程中,每訓練一段時間,觀察一下模型在數據上的表現,并在數據表現沒有明顯提升時自動終止迭代,輸出準確率和損失函數的值,如圖7所示。

圖7 不同批樣本數量的識別率和損失值Fig.7 Recognization accuracy and loss values of different batch sample sizes
由圖7 a)可以看出,隨著批樣本數量從32增加到64時,識別率隨迭代次數增大而升高。當迭代次數大于25時,識別率達到了95%以上。但當批樣本數量增加到128 和256 時,準確率逐漸下降。這是因為過大的批樣本數量會使模型梯度下降加快,過早進入收斂狀態,訓練完數據集所需的次數減少,使訓練時間增加,參數修正較慢,導致準確率下降。同時,由圖7 b)可以看出,批樣本數量為64 時,損失值也是最低。因此,對本文的模型來說,最佳的批樣本數量應選64。
為客觀比較本文算法的性能,選用單獨使用雙譜對角線作為識別特征和使用SVM作為分類器進行識別和對比。得到如圖8所示混淆矩陣。圖8 a)表示使用本文方法測試的結果;圖8 b)表示單獨使用雙譜對角線作為特征測試的結果;圖8 c)表示使用SVM測試的結果。


圖8 本文方法與其他識別方法的對比結果Fig.8 Comparison results of this method with other recognition methods
由圖8 可知,本文方法比單獨使用雙譜對角線所提取的特征信息有一定增強,神經網絡的特征提取能力也優于SVM,準確率更高。
對3 種方案的算法復雜度進行比較,將空間復雜度和時間復雜度作為算法復雜度的衡量指標。空間復雜度指網絡中卷積核的系數,時間復雜度從迭代耗時和平均識別時間方面進行考慮。3類模型使用樣本數量均為5 738,訓練測試比為3 ∶1。
SVM方法的識別率相比另外2種方法較低,且算法原理中不涉及算法復雜度中包括的2種時間統計內容。表1給出了本文方法與雙譜對角線法的算法復雜度比較。其中,M 為判別網絡的卷積核系數,迭代時間為模型訓練迭代30次的時間,平均識別時間為模型在測試集上的預測時間。由表1 可知,本文方法和雙譜對角線法在空間復雜度相同的條件下,迭代耗時相差不大但平均識別時間要短19%,說明使用本文方法提取的特征對于神經網絡的訓練更有效,對測試集的識別效果也更好。

表1 算法復雜度分析Tab.1 Algorithm complexity analysis
對訓練集和驗證集在網絡中的識別率分析,得到結果如圖9所示。Train1、Validation1分別表示本文方法的訓練集和驗證集;Train2、Validation2 分別表示雙譜對角線方法的訓練集和驗證集。由圖9 可知,本文方法相比雙譜對角線方法識別率更高,且隨著迭代次數增多,本文方法條件下訓練集和驗證集的正確率數值差距也逐漸減小,相比雙譜對角線方法識別效果也更穩定。

圖9 不同訓練集和驗證集的識別率對比Fig.9 Comparison of recognition accuracy between different training sets and validation sets
綜上所述,利用信號的雙譜及其在雙譜基礎上提取的二次特征組成的特征組合,在神經網絡的加成下對同類型雷達輻射源的識別有較高的準確率且實時性較好。
本文在信號雙譜分析的基礎上取對角線作為識別特征,并通過對角線上的雙譜信息求雙譜對角線幅度分散熵和對雙譜矩陣取奇異值全局熵,進一步擴充了輻射源個體的識別特征。這樣既減少了計算量,又通過二次特征進一步豐富了雙譜特征信息量,提高了輻射源個體識別率。因此,利用雙譜包含的豐富輻射源個體特征信息配合熵理論對于不確定度的刻畫、對于輻射源個體的識別都有一定的工程意義。