鄒海英
(四川大學電子信息學院,成都610065)
調制識別技術在頻譜感知、電子對抗和防御等領域具有十分廣泛的應用,因此一直是無線通信領域研究的熱點問題。早期的調制識別方法主要是基于統計模式的識別方法[1-2],其特征主要靠人工提取。人工提取特征的方式,依賴人的經驗,魯棒性差,時間復雜度高,同時存在識別率偏低等問題。
近年來,隨著深度學習的快速發展,無線通信研究者開始把深度學習用于信號調制識別。Adzhemov S S[3]提出使用神經網絡對無線電數字信號進行調制識別的方法,該方法使用多層感知器作為分類識別器,可以使決策規則的形成過程自動化。但多層感知器在低信噪比下分類效果差,識別率低。Hui Wang[4]提出使用主成分分析對提取的循環譜特征做降維處理,再利用ANN分類器對數字調制信號進行分類識別,但該方法需要手工提取特征,時間復雜度較高。ZHIYU QU[5]提出使用時頻分析,圖像處理和卷積神經網絡技術實現雷達信號脈內調制識別的方法,但該方法識別的調制類型偏少。Wu S 等人[6]提出一種基于深度學習網絡的遠距離通信信號特征的識別算法,但該算法的時間復雜度較高。Ahmed.K.Ali 等提出利用高階頻譜特征和基于神經網絡屬性的分類算法,但該方法是在AWGN 信道環境下進行的,不適用其他復雜的信道環境[7]。
針對上述調制識別算法存在的問題,結合LSTM在處理時序問題上面的優勢,提出一種基于Deep-LSTM 的調制識別算法。該算法通過減少人工預處理和特征提取步驟,直接將輸入信號通過Deep-LSTM 網絡學習特征之后,后接Softmax 判決輸出。
在簡單多徑信道環境下,信號傳輸模型可以表示為:

式中x(t)代表未知的調制信號,m(t)代表均值為0,方差為σ2的高斯白噪聲序列,r(t)為接收到的調制信號序列,h(n)表示多徑信道,n取值為0,1,2,3,…,K-1,h(n)的模型表達式為:

式中h0表示多徑主徑幅度增益,μ0表示主徑相移。ht、θt、μt分別表示第t個多徑幅度增益、多徑延遲、相移因子。
深度學習方法不需要對數據進行預處理和特征提取步驟,直接把數據送入網絡輸入層,中間經過網絡挖掘數據特征信息,最后由網絡輸出層輸出結果。因此使用深度學習方法對信號進行調制識別,可以有效地降低時間復雜度,提高信號調制識別準確率。基于深度學習的調制識別基本流程框架如圖1 所示。

圖1 基于深度學習的調制識別基本流程框架
長短期記憶網絡(LSTM)是RNN 的一種變體網絡,主要由遺忘門、輸入門、輸出門和細胞狀態4 個部分組成,其內部結構圖如圖2 所示。

圖2 LSTM內部結構圖
遺忘門的作用是決定LSTM cell 第一步應該扔掉什么信息,其計算公式為:

其中σ(?)表示sigmod 激活函數,wf表示遺忘門權重矩陣,bf表示遺忘門偏置向量,a(t-1)代表t-1 時刻LSTM cell 的輸出,x(t)表示t時刻LSTM cell 的輸入。
輸入門的作用是決定在t時刻要新添加哪些信息到LSTM cell 中,其計算公式為:

其中wu表示輸入權重矩陣,bu表示輸入門偏置向量。
在LSTM cell 中第三層tanh 層的作用是生成一個向量,以用來得到要新添加的信息,其計算公式為:

其中wc表示細胞狀態權重矩陣,bc表示細胞狀態偏置向量。
最終LSTM cell 將更新的細胞狀態信息保存下來,其計算公式為:

輸出門的作用得到LSTM cell 中的a(t),也即t時刻LSTM cell 的輸出,再用a(t)通過Softmax 分類器得到最終的輸出y(t)。a(t)的計算公式為:

式(7)中wo表示輸出門權重矩陣,bo表示輸出門偏置向量。
LSTM 網絡提取信號的調制特征是通過學習信號的調制信息,發現每條輸入信號中每個樣本點的時序關系,并將這些樣本點的時序關系進行特征表達。當LSTM 網絡的層數達到一定深度時,可以更有效地挖掘到信號的深層次特征,所以算法通過改進LSTM 網絡設計了一個Deep-LSTM(Deep Long Short-Term Memory)神經網絡用于對通信信號進行調制識別,其網絡結構如圖3 所示。Deep-LSTM 網絡一共包含8 層,前4層由LSTM 單元組成,后3 層由全連接層組成,最后通過一個Softmax 層判決輸出。網絡中的激活函數為selu 函數,dropout 值為0.5。

圖3 Deep-LSTM網絡結構
Deep-LSTM 算法流程如圖4 所示。首先對數據進行預處理;然后構建Deep-LSTM 網絡,將網絡初始化;接著輸入訓練數據對網絡進行訓練;再使用BP 算法對網絡權值進行微調得到預測模型;最后把測試數據送入Deep-LSTM 預測模型中,使用Softmax 進行分類檢測,輸出識別準確率。

圖4 Deep-LSTM算法流程圖
算法使用的實驗數據為GNU Radio 信道模型生成的RML2016.10b 數據集[8]。該數據集包含10 種信號類型和20 種信噪比。10 種信號類型分別是8PSK,BPSK, CPFSK, GFSK, PAM4, QAM16, QAM64, QPSK,AM-DSB 和WBFM,20 種信噪比為-20dB 到18dB,步長為2dB。10 種信號均勻分布,總樣本大小為1200000。使用python 中的numpy 程序庫將數據集存儲格式轉換為Nexamples×Dimen1×Dimen2,其中Nexamples=1200000,Dimen1=2 表示每個樣本包含I/Q 兩路數據,Dimen2=128 表示每個樣本包含128 個采樣點數據,即RML2016.10b 數據集的存儲維度為(1200000,2,128)。
采用損失函數:交叉熵(Categorical Cross Entropy)和識別準確率(Accuracy)作為評價Deep-LSTM 算法分類識別性能的指標。

Categorical Cross Entropy 的計算公式為:式中n表示樣本數目,m表示待分類數,x?im表示期望輸出,xim表示實際輸出。
Accuracy 為識別準確率指標,其計算公式為:

式(10)中M為樣本總數,G(?)表示網絡模型預測函數,xi和yi表示第i個樣本數據和對應的真實標簽值。信號調制類型與對應的真實標簽值如表1 所示。

表1 信號調制類型與對應的真實label 標簽值
Deep-LSTM 算法使用RML2016.10b 數據集進行了實驗仿真,得到信號集的平均識別準確率,如圖5所示。

圖5 信號集的平均識別準確率
由圖5 可得隨著信噪比從-20dB 到18dB 不斷增加,識別率不斷提高。當SNR≥5dB 時,平均識別率達到95%,說明算法的調制識別性能優越。
圖6 為10 種調制信號在各信噪比下的識別準確率。由圖可知,除了16QAM 和WBFM 信號,Deep-LSTM 算法對大部分信號都能很好地識別出來。

圖6 各調制信號在各信噪比下的識別準確率
為了進一步驗證Deep-LSTM 算法識別性能的優越性,進行了以下對比實驗。
實驗一:Deep-LSTM 算法與參考文獻算法[9]對比

表2 Deep-LSTM 算法與參考文獻算法識別性能表
表2 為專家系統算法(基于集成循環矩的調制識別方法,分類器分別采用DNN、DTree、KNN、SVM、NaiveBayes)和Deep-LSTM 算法的調制識別性能表。由表可知Deep-LSTM 算法在各信噪比下的識別率均高于專家系統算法,特別是在低信噪比下算法的識別性能優勢更明顯。
實驗二:LSTM 網絡層數對識別性能的影響

表3 LSTM 網絡層數對識別性能的影響
表3 為不同的LSTM 網絡層數對算法識別性能影響的實驗結果。LSTM 的網絡層數直接影響Deep-LSTM 網絡學習信號調制特征的能力;當LSTM 層數太少時,網絡無法有效地學習和提取到信號的調制特征信息,導致算法識別性能低下;當LSTM 層數過多時,網絡訓練參數過多,訓練的時間復雜度較高,也會影響算法的識別性能。由表可知Deep-LSTM 算法網絡中LSTM 網絡層數選取4 層時算法識別性能明顯優于LSTM 網絡層數為1,2,3,5 和6 時,故更加充分地說明Deep-LSTM 算法的可行性和有效性。
實驗三:dropout 值對識別性能的影響

表4 dropout 對識別性能的影響

表4 為dropout 值對識別性能影響的實驗結果。dropout 是為了防止模型過擬合的一個參數。由表可知,當dropout 值從0.2 增加到0.5 時,算法識別性能明顯提高;當dropout 值大于0.5 時,算法識別性能明顯降低了,這是因為dropout 值太大導致模型對樣本數據的擬合能力下降了。實驗四:batch_size 對識別性能的影響
表5 為batch_size 對識別性能影響的實驗結果。batch_size 為批處理樣本數量,其值的大小會影響網絡模型的訓練速度和優化程度,故選擇合適的batch_size值才能使網絡模型同時在時間和精度上達到最優。由表可知Deep-LSTM 算法設置batch_size=1024 時的識別性能明顯比batch_size=512 和2048 更好。
針對傳統的基于統計模式的調制識別算法存在識別準確率低,特征提取困難、魯棒性和泛化能力偏差等問題,提出了基于Deep-LSTM 的常規通信信號調制識別方法。仿真實驗結果表明,在SNR≥5dB 時,可以達到95%的平均識別準確率,在識別性能、魯棒性和泛化能力等方面都優于傳統的特征提取算法。但算法目前還有以下需要完善的地方:①算法在SNR≤0dB 時,識別效果不佳,未來可以考慮在深度學習網絡輸入端先對信號進行降噪處理。②算法對16QAM 和WBFM 信號識別效果不佳,需要尋找新的算法來提高16QAM 和WBFM 信號的識別率。