任 進,姬麗彬,黨 柳
(北方工業大學 信息學院,北京 100144)
信號的調制識別是指已知信號所在的調制集合,正確識別目標信號的調制類型,是通信偵察以及軟件無線電領域的一個重要研究課題[1-3]。調制識別作為非合作通信中的一種關鍵技術,能夠對未知信號的調制方式進行自動判決識別,進而實現對信號的正確解調獲取信息[4]。在信號檢測與解調的過程中,調制識別這一技術不容忽視,其在軍用和民用領域都扮演著不可或缺的角色。在民用通信領域,調制識別技術對頻譜監督管理中信號的身份驗證和干擾識別至關重要。在軍事通信領域,出于一種占據戰略主動權的戰術手段和戰略目的,調制識別技術通常被用于探測敵方信號調制類型,從而進行針對性的偵查與反干擾。
在諸多文獻中,識別方法大致可以被劃分為2種:基于決策論[5]的最大似然假設檢驗方法和基于特征提取的統計模式識別方法[6]。基于決策論的最大似然假設檢驗方法根據接收信號的似然函數,對似然比與閾值做出比較,進而完成決策,其中決策是使用貝葉斯假設的框架做出。以未知量選擇模型的分類法為依據,能夠將基于最大似然檢驗的自動調制分類大致劃分成3種:平均似然比檢驗[7-8]、廣義似然比檢驗[9]和混合似然比檢驗[10]。但是,它存在計算復雜度高和適用范圍窄等缺點[11]。基于特征提取的統計模式識別方法首先采用可以表征不同調制樣式的信號分類特征,以觀察不同通信信號的特征參數差異來進行分類標準的選取,最后對信號的調制方式做出判決。它的缺點是需要人工提取,較為繁瑣。總之,上述方法的分類性能和計算復雜度有待進一步提高。
近年來,通信研究者已經開始結合通信系統或者通信信號的本質進行深度學習的研究,如利用卷積神經網絡擬合傳統通信流程中的匹配濾波器功能,進行調制識別和接收檢測[12]。
本文創新性地提出了基于循環神經網絡(Recurrent Neural Network,RNN)的衛星調制信號識別算法,在低信噪比(SNR)情況下,識別率高、抗噪性能較強。相比于高階累積量法下的操作復雜性,神經網絡方法的識別性能更為優越。
任意調制方式的接收信號的模型為:
ω(t),
(1)
式中,A為接收信號的幅度;f0為發射機和接收機之間的頻偏;θ0為相偏;φ(t)為相位抖動;x(τ)為有用信號;g(t)為成型濾波器的脈沖函數;h(t)為信道的響應函數;ε為傳輸系統的時間同步的誤差;ω(t)為加性高斯噪聲[13]。
無線信號在經過衰落信道后的模型為:
y(n)=Aej(2πf0n+θ0)x(n)+ω(n),
(2)
式中,n取正整數。
在調制識別領域,大多采用布拉德利大學O’Shea生成并公開的調制數據集RML2016.10a。這一數據集共包括220 000個調制信號,包含11種調制方式,并且每種調制方式都產生了20 000個調制信號。由于本文主要面向衛星調制信號,且數據集中不包括APSK這一重要的衛星調制信號,所以本文將依照RML2016.10a的格式由GNU Radio生成新的包含6種調制信號的數據集。為了更好地模擬地面發射機與衛星之間的無線通信信道的真實環境,對信道進行仿真,選用GNU Radio中的Dynamic Channel模型分層模塊,這一模塊包括4個部分,如圖1所示。同時,還采用GNU Radio Dynamic Channel模型,將真實信號通過不明的信道仿真模型后,再使用切片和矩形滑窗處理512/1 024/2 048個采樣,對仿真產生的數據隨機挑選時間段完成采樣,之后將結果輸出存儲到輸出向量中,整個操作過程如圖2所示。

圖1 動態信道模型結構

圖2 數據集生成流程
通常,高斯噪聲加擾后的調制信號的復數表達可以記為:
(3)
式中,L=0,1,…,N,N為發送端碼元的序列長度;aL為碼元序列;Ts為碼元周期;A為信號能量;RNs(·)為基帶碼元的矩形波形;fc為載波頻率;θc為相位抖動;n(t)為零均值的復高斯白噪聲,與發送信號x(t)的關系為相互獨立。
K階矩計算公式可以表示為:
Mk(τ1,τ2,…,τK-1)=E{x(t)x(t+τ1)…x(t+τK-1)},
(4)
式中,τ1,τ2,…,τK-1是延遲時間。
K階累積量可以表示為:
CK(τ1,τ2,…,τK-1)=cum{x(t),x(t+τ1),…,x(t+τK-1)}。
(5)
由以上推導,可得到:
C20(x(t))=M20=E[x(t)x(t)],
(6)
C21(x(t))=M21=E[x(t)x*(t)],
(7)
(8)
C41(x(t))=M41-3M20M21,
(9)
(10)
(11)
(12)
(13)
式中,x*(t)為x(t)的共軛取值。根據現代信號處理理論可知,零均值高斯白噪聲的高階累積量[14](大于二階)為零,由以上推導公式能夠分別計算取得它們的各階累積量值如表1所示。為了有效識別這6種信號,本文構造高階累積量特征參數[15]F={C21,C40,C42,C63,C80}。

表1 不同調制信號的高階累積量
在確定了本文所需的高階累積量特征參數后,還需要分類器依據選取的特征參數對信號分類。KNN[16]是一種經典的統計模式識別算法,它的設計思想是對于那些需要分類的樣本,首先通過公式計算待分類的樣本與已知類別的訓練樣本之間的距離或相似度,找到距離或相似度與待分類樣本數據最近的K個鄰居;之后,通過這些鄰居類別的范疇來分析判定待分類樣本的類別。它在訓練大型數據方面具有有效性,并且對嘈雜數據具有魯棒性。因此,選取KNN作為分類器,實現對信號的分類。其調制識別流程如下:
① 輸入6種調制信號數據集;
② 選取的5種特征構成特征集;
③ 分割數據集為訓練集和測試集;
④ 計算輸入樣本和訓練樣本之間的距離;
⑤ 找到訓練數據的K近鄰;
⑥ 將K的最大標簽類設置為訓練數據;
⑦ 如果信號未分類,則對輸入信號進行分類訓練;如果信號被分類,應用KNN分類器;
⑧ 預測信號調制方式,計算并輸出識別準確率。
RNN[17]被廣泛用于從時間序列數據中學習持久特征。RNN與一個隱藏層的單元連接到下一隱藏層的全連接神經網絡不同,RNN中一個隱藏層的單元與自身循環連接,如圖3所示,其中W,U,V分別表示輸入到記憶、記憶到記憶、記憶到輸出的權重矩陣。

圖3 RNN的一般結構

但是,傳統的RNN在梯度下降更新過程中存在梯度消失問題。因此,RNN不適合學習長期依賴關系。為了克服這種局限性,引入了LSTM模型。LSTM神經網絡[18]是一種以長短期記憶網絡為單元的有門限的RNN,其結構如圖4所示。

圖4 一個LSTM單元的結構
LSTM單元背后的核心思想是除了外部循環單元,還有內部循環的LSTM細胞(自我循環)。每個細胞都有與傳統RNN相同的輸入和輸出,但引入了更多的參數和一個由幾個門組成的系統來控制信息流。LSTM單元中的3個門定義為:
it=σ(Wiht-1+Uixt+bi),
(14)
ft=σ(Wfht-1+Ufxt+bf),
(15)
ot=σ(Woht-1+Uoxt+bo),
(16)
式中,σ(·)為Sigmoid激活函數,取值為0~1;it,ft,ot分別為輸入門限層、忘記門限層、輸出門限層;Wi,Ui,Wf,Uf,Wo,Uo和bi,bf,bo分別為對應的權重矩陣和偏差。上述門限層允許LSTM單元學習在長距離單元上存儲和訪問信息,從而避免了梯度消失問題。在自我循環中,將細胞記憶ct置于具有自我循環權值ft的下一個單元中,以決定向下一個細胞記憶中刪除或添加信息:
ct=ft·ct-1+it·tanh(Wcht-1+Ucxt+bc)。
(17)
當前時間步長ht的輸出由當前細胞記憶ct和輸出門限層ot決定:
ht=ot·tanh(ct)。
(18)
通過對以上2種深度學習模型的分析,本文提出了基于RNN的衛星調制信號識別算法。在整個模型中,RNN-LSTM采用信號的IQ數據作為模型的輸入,表2給出了該模型的參數設置。其中,網絡包括一層LSTM層和一層全連接層,LSTM出于分時特征提取的目的,而全連接層則是為了分類而存在。模型的輸入為512×2,LSTM胞元的數目為40,全連接層胞元的數目為32,最后輸出長度為6的one-hot矢量,代表6種調制方式。
LSTM層的激活函數為ReLu,輸出層的激活函數為Softmax,由于最后輸出為6類不同的調制方式,所以采用Categorical-crossentropy這一多分類的交叉熵損失函數。除此之外,本模型還采用了Adam優化器,在訓練的過程中使學習率隨著訓練過程自動修改,以便加快訓練,提高模型性能。
基于上述設計,本文所采用LSTM模型的結構如圖5所示。

圖5 單層LSTM網絡的結構
為了驗證算法的有效性,本節將對基于高階累積量和RNN的衛星信號識別性能分別進行仿真。
針對高階累積量識別算法,設置對應的待識別調制集為Ω={QPSK,8PSK,64QAM,256QAM,16APSK,32APSK}。其中,仿真信號SNR取值范圍-4~16 dB。SNR每次變化間隔為2 dB,接收信號采樣長度依次設定為128,512,1 024點。而對于每個SNR和樣本數,都產生了1 000個實現,輸入到構造好的KNN分類器中對信號的調制方式進行識別,仿真結果如圖6、表3、圖7和圖8所示。可以看出,方案能夠有效地識別這6個調制樣式。當SNR>0 dB時,不同采樣長度信號的平均識別率都達到了50%以上;當SNR>10 dB時,信號的平均識別率達到了90%以上。從表3可以看出,隨著采樣長度的增加,信號的識別率顯著增加,當SNR>12 dB時,信號的調制方式可以高效地被識別出來,識別率逼近100%。從圖7和圖8可以看出,低SNR情況下,與其他2種調制相比,64QAM和256QAM信號的識別率最高,抗噪性能較強。通常,MQAM的高階調制識別問題是調制識別領域會遇到的經典問題,而本文所用方法能夠在低SNR情況下對該類信號完成較好的識別。混淆矩陣右側的數字代表預測標簽的概率,顏色越深代表預測越準確。

圖6 不同采樣長度下信號正確識別概率

表3 不同采樣長度和SNR下信號正確識別概率

圖7 SNR=-4 dB時6種信號混淆矩陣

圖8 SNR=4 dB時6種信號混淆矩陣
針對基于RNN的衛星信號識別算法,將第一節生成的數據集導入,按照表2設置的參數完成仿真,仿真結果如圖9~13所示。由圖9可以看出,當Epoch增加時,網絡在訓練集的準確率逐步上升后趨于穩定,之后處于較高的水平,這意味著對模型的訓練十分有效且沒有出現過擬合現象。由圖10可以看出,當Epoch增加時,模型的損失函數逐漸下降,與準確率恰好相反,這是符合正常規律的。

圖9 LSTM網絡準確率曲線

圖10 LSTM網絡損失函數變化曲線
由圖11可以看出,隨著采樣率的增加,相同SNR下本算法的識別率有著較為明顯的增長。在采樣長度等于512,SNR>4 dB時,識別率趨近100%,可以準確識別出6種調制信號。由圖12和圖13可以看出,低SNR情況下,與其他2種調制相比,在RNN算法下,仍是MQAM信號的識別率最高,抗噪性能較強,SNR>0 dB時,所有信號已經基本可以被識別;SNR>4 dB時,信號的識別率接近100%。

圖11 RNN下不同采樣率的識別率對比

圖12 SNR=-4 dB時6種信號混淆矩陣

圖13 SNR=4 dB時6種信號混淆矩陣
在無線電監測以及頻譜管理領域,通信信號調制樣式的準確識別地位顯著,出于在復雜電磁環境和惡劣衛星通信環境下提高信號識別性能的目的,本文提出了一種基于高階累積量的調制識別算法,該算法利用高階累積量具有良好的抗噪性能的特性,提取二階、四階、六階及八階高階累積量作為信號識別的特征,并通過KNN算法實現了調制方式的良好分類,這種分類方案在存在載波頻偏的情況下是魯棒的。同時,面對KNN算法低SNR下識別率較低的情況,本文將RNN和LSTM網絡用于調制識別算法,實現了低SNR下的高效識別,同時這一深度學習算法無需人工提取特征,可以快速適應未知信號。調制信號識別可以依據信號自身的瞬時幅度和相位等特征達到目的。得益于強大的神經網絡優勢,將信號自身特性與神經網絡聯系起來進行調制信號識別也將是不錯的方法。