劉 傲,周 正
(海軍航空大學,山東 煙臺 264001)
雷達輻射源識別是通過對信號的檢測、特征提取以及分析,確定雷達輻射源體制、類型、調制方式等信息的過程,該過程是情報偵察和戰場態勢感知的必要環節,也是威脅等級評估的關鍵依據[1]。
基于TOA(到達時間)、DOA(到達角)、CF(載頻)、PRF(脈沖重復周期)和PW(脈沖寬度)等特征參數的傳統方法,難以滿足信號處理中保留有用信息及在低信噪比下雷達輻射源識別準確率的要求。因此,研究人員探索了很多新的識別方法,例如混合調制、脈內調制雷達信號識別[2-3],GM-PHD 濾波器分類方法[4],基于FCBF[5]、模糊函數[6]、非線性復雜度[7]的雷達信號識別,以及通過機器學習、卷積神經網絡等[8-13],對輻射源信號進行分類的人工智能方法。
近年來,提取新的雷達脈沖識別參數成為雷達輻射源識別的突破點,傳統的實數序列處理方法已經無法滿足實際需要[14]。因此,眾多研究人員選擇了另一種處理方式——實數序列符號化。把實數序列符號化,就是對原始數據進行粗粒化處理,可以去除數據中的非本質特征,得到數據中關鍵的特征信息,在計算速度上具有很大的優勢[15-16]。文獻[17]提出了一種基于時間序列符號表示的貝葉斯規則和概率鏈規則的模型,首先將時間序列轉換為符號,然后用概率方法將符號序列分類;文獻[18]將觀測到的實值數據序列進行Hilbert 變換,得到相應的復值解析信號,進而將時間序列進行符號化表示。雖然在過去幾十年中引入了許多實數序列的符號表示,但這些方法或多或少都存在一定的局限性。例如,距離測度可以用符號方法來定義,但這些距離測度與原始序列上定義的距離測度幾乎沒有相關性;降維后的序列對原始信號的有用信息保留不完整[19];并且實際應用中,要處理的實數序列紛繁復雜,所以選取一種合適的實數序列符號化方法至關重要。
在實數序列符號化的方法中,既能降維又能降噪的符號化聚合近似(Symbolic Aggregate approXimation,SAX)方法被認為是一種簡單有效的實數序列符號化的方法[20]。為獲得更好的識別效果,本文在SAX 的基礎上融入奇異譜分析(Singular Spectrum Analysis,SSA)方法。奇異譜方法(SSA)是一種從時間序列的動力重構出發,并與經驗正交函數相聯系的一種統計技術,是經驗正交函數(EOF,Empirical Orthogonal Function)分解的一種特殊應用[21-22]。分解的空間結構與時間尺度密切相關,可以較好地從含噪聲的有限尺度時間序列中提取信息,目前已被應用于多種時間序列的分析中[23]。
本文首先將不同調制方式的雷達信號用符號化聚合近似方法進行符號化處理,再用奇異譜分析方法進一步提高信號處理的效果,在此基礎上,提出了一種基于奇異譜修正香農熵(Singular Spectrum Modified Shannon Entropy,SSSE) 的雷達信號特征量,通過BP 神經網絡對不同信號進行分類,能在低信噪比條件下較好地識別出多種調制信號。
SAX 允許將任意長度的時間序列縮減為任意長度的字符串,有效降低實數序列維度,在保留原始數據信息的基礎上,具有一定的降噪性,SAX 方法已在許多實數序列分析和時間序列分析上得到廣泛應用。
SAX 方法分為3 步:1)先將時間序列進行標準化處理;2)將標準化后時間序列運用分段聚集近似(Piecewise Aggregate Approximation,PAA)算法,將序列降維表示,通過設置參數w,表示分段后維數大小;3)設置劃分后符號集的數目a,通過查詢斷點查找表(表1 是a 取值為3~10 的斷點取值),確定相關斷點,將降維后的序列進行劃分,完成時間序列的符號化。確定斷點集合的方法有等區間法和等概率法,為了更好地保留數據的有效信息,一般采取等概率法[20]。

然而,現實中待處理的序列很難滿足數據可分的情況,因此,當n/w 不是整數時可進行如下操作:
當1




為在相應參數α 下的斷點集合。斷點取值如表1 所示[20]。

表1 a 取值為從3~10 的等概率斷點查找表
圖1 給出了字長為256 的隨機游走序列經SAX 符號化示例,其中,字符集a 大小分別為6 和8,將劃分后的序列維數w 分別定為8 和16。通過查找斷點表1,將原始序列按要求進行劃分后,在不同標準化幅值下,各閾對應的符號不同,并且能保留較完整的信息,便完成了序列的SAX 符號化。

圖1 隨機游走序列的SAX 符號化
符號化后需要對序列進行相關分析,即分析每個字的頻度。目前常用的統計量是修正的香農熵[20],其定義為:

其中,pi是第i 個符號序列的概率,Nobs是數據中實際觀測到的可能序列的數目,修正香農熵的取值范圍是[0,1]。在純隨機時間序列和等概率分區情況下,Hs=1;對于確定的時間序列,Hs∈[0,1),Hs越小,表示數據結構的確定性越強。


對式(6)奇異值分解得:

其中,U 和V 均為正交陣,∑為矩陣X 的奇異值構成的對角陣:

其中,σk為奇異值,對角線上的非零值構成重構相空間矩陣X 的奇異譜集合:

對角陣∑中的非零元素σi與所有元素和的比值為重構概率Pi:將

式(10)帶入式(5),并將所得公式定義為奇異譜修正香農熵(Singular Spectrum Shannon Entropy,SSSE):

奇異譜修正香農熵Hssa的計算流程如圖2 所示。

圖2 奇異譜修正香農熵的求解流程
為驗證奇異譜修正香農熵的抗噪性,模擬文獻[24]中的仿真信號

圖3 為仿真信號在SNR 為-10 dB~40 dB 內奇異譜修正香農熵的曲線圖。由圖可見,隨著SNR 的升高,Hssa的值遞增,參數a 取值為3 時,在SNR>5 dB后,Hssa趨于穩定,雖然有較小波動,但在所有的取值中穩定性最好;參數a 取值為4、5 和6 時,在SNR>10 dB 后,Hssa趨于穩定,波動較小。總體趨于穩定,說明所定義的SSSE 具有較好抗噪性。由圖可知,a=3 時的Hssa相對較小,波動性更小,且僅在SNR>5 dB 時便趨于穩定,說明此時SSSE 抗噪性最佳。

圖3 奇異譜修正香農熵與SNR 的關系
求得奇異譜修正香農熵后,采用基于BP 算法的二層神經網絡分類器,其只包含一個隱藏層和一個輸出層,參數如下[25]:

二層神經網絡前向傳播過程如下,從第1 個節點開始計算,直到計算到最后一層:

其損失函數為:

后向傳播過程如下,由最后一個節點開始計算偏導數,直到計算到第1 個節點:

本文提出的基于奇異譜修正香農熵的雷達輻射源信號識別流程圖如圖4 所示。

圖4 基于奇異譜修正香農熵的雷達輻射源信號識別流程圖
步驟1 雷達調制信號時頻化處理:處理雷達信號時,先將信號從時域變換到頻域,噪聲會均勻分布于整個頻帶中,接收到的信號能量大多分布于有效帶寬內,其中有用信號比重很大,而噪聲占比較小。將時域轉換為頻域,提高SNR;
步驟2 將信號能量和帶寬歸一化處理:能量歸一化可以減小信號源距離的影響;帶寬歸一化可以減少特征提取時的計算量、消除帶外噪聲及掃頻寬度的影響;


步驟4 根據圖2 求得預處理后信號的奇異譜修正香農熵,通過BP 神經網絡完成信號分類。
仿真NLFM、BPSK、BFSK、BASK、4FSK 和QPSK等6 種雷達信號。信號載頻為3 kHz,脈寬為10 μs,采樣頻率為30 kHz,基帶信號為隨機序列,碼元速率為1 250 b/s,采用高斯白噪聲。
實驗1 奇異譜修正香農熵的分離特性
對上述6 種信號在-10 dB~20 dB 的信噪比內每隔1 dB 產生50 個樣本,并對樣本提取奇異譜修正香農熵,進行50 次蒙特卡洛實驗,加入信號的噪聲為高斯白噪聲,實驗平臺為MATLAB R2014a,得到特征曲線如圖5 所示。在-10 dB~-5 dB 范圍內,雖然各信號熵值相近,但總體仍有較好的區分度,并且比較穩定,可以用來區分不同調制信號。實驗2 通過BP 神經網絡對信號分類

圖5 各類信號奇異譜修正香農熵與SNR 關系圖

圖6 預測信號類別與實際信號類別的混淆矩陣
在第2 節中,通過對奇異譜修正香農熵與信噪比進行仿真,得出在參數a 取值為3 時,SSSE 抗噪性最佳,因此,取a 為3。根據參考文獻[20]中經過多次試驗得出維數w 可取140。對上述每種信號在-4 dB~20 dB 的SNR 內每隔4 dB 取240 個樣本,任取其中80 個作為模型的訓練集,其余160 個作為測試集,進行100 次仿真實驗。加入信號的噪聲為高斯白噪聲,實驗平臺為MATLAB R2014a,經仿真得到混淆矩陣如圖6 所示。可以看出,BPSK 和QPSK、BFSK 和4FSK 之間有個別混淆,這是因為雙方幅度譜存在一定相似度,但總體識別率較好,達到有效區分的效果。任取其中160 個測試集樣本,可得預測信號類別與實際信號類別的契合表示如圖7 所示,各類信號的識別率如表2 所示。圖7 中縱軸數字1~6 分別代表NLFM、BPSK、BFSK、BASK、4FSK 和QPSK 等6 種雷達信號,預測類別與實際類別重合,說明預測正確,反之預測錯誤,由之可以看出各識別信號的預測情況。從表2 中可以看出,在SNR 大于0 dB 時,各信號的識別率在90%以上,在SNR 大于4 dB 時,5 種信號的識別率在95 %以上,在SNR 大于8 dB 時,各信號的識別率在95%以上,說明在低信噪比下分類效果較好。這是因為仿真信號的幅度譜存在差異,使用SSSE 可以在時間序列降維和降噪后,較好地從其中提取信息突出這一差異,使得信號區分度更好,通過仿真,也說明在低信噪比下使用SSSE 的分類效果較好。

表2 6 類雷達調制信號分選正確率
實驗3 不同方法對比

圖8 用SAX 算法所得特征曲線圖

圖9 用SSA 算法所得特征曲線圖
對上述6 種信號在-10 dB~20 dB 的信噪比內每隔1 dB 產生50 個樣本,并對樣本分別用SAX 和SSA 算法進行仿真,進行50 次蒙特卡洛實驗,加入信號的噪聲為高斯白噪聲,實驗平臺為MATLAB R2014a。得到特征曲線如圖8 和圖9 所示,采用BP神經網絡分類器得到不同參數下的信號總體識別率如下頁圖10 和表3 所示。從圖8 和圖9 中可以看出,不同信號在一定信噪比范圍內均有交疊,其中用SAX 方法在-10 dB~-3 dB 內5 種信號交疊較嚴重,用SSA 方法在3 dB~10 dB 內4 種信號交疊較嚴重,不易區分。從圖10 和表3 中可以看出,SSSE 的總體識別率比SAX 與SSA 均要好。這是因為SAX 算法基于PAA 等長劃分時間序列,且各個分段用其均值表示,弱化了時間序列中極值等信息,若各段內部差異大,但均值相等,則無法區分時間序列的差異;用SSA 算法處理時間序列,若時間序列被噪聲嚴重干擾,便會失去其效果。本文所用方法彌補了這些缺陷,使得處理后的時間序列分類更加準確。

圖10 SSSE、SAX、SSA 不同信噪比下總體識別率

表3 SSSE、SAX、SSA 總體識別率
本文通過對接收到的雷達信號進行符號化和奇異譜分析處理,提取奇異譜修正香農熵這一特征,較好地完成了降噪,保留了信號的主要特征,進而通過分類器進行分類。通過仿真,證明該參數在低信噪比下對于不同調制方式雷達信號的識別率較好,具有一定的參考價值。