孫姝君,彭盛亮,姚育東,楊喜
(1. 華僑大學信息科學與工程學院,福建 廈門 361021;2. 史蒂文斯理工學院電子與計算機工程系,美國 新澤西州 霍博肯 07030;3. 吉首大學信息科學與工程學院,湖南 吉首 416000)
調制識別是要識別出信號采用的調制方案,有著廣泛的應用。在認知無線電中,調制識別有助于次級用戶了解主用戶信號的細節信息,是無線環境全面感知的重要組成部分;在智能通信中,調制識別能夠減少調制信息的傳輸開銷,實現信號的盲解調;在無線電監管中,調制識別有利于更精準地判斷信號是否滿足無線電管理規定;在電子對抗中,識別敵方信號的調制方案是有效實施無線電干擾和欺騙的前提[1]。
近年來,隨著深度學習(deep learning, DL)的蓬勃發展,基于DL的調制識別技術越來越受到人們的關注。與傳統調制識別方法不同,基于DL的方法采用深度神經網絡(deep neural network,DNN)作為分類器,具有3方面的優勢:第一,能夠充分利用通信系統中存在的海量數據,有效改善調制識別精度;第二,能夠實現自動提取特征,克服手動提取特征過程依賴專業背景和人工經驗的難題;第三,能夠持續受益于深度學習工具的快速迭代和演進,具備在復雜場景下解決復雜調制識別問題的潛能[2]。
傳統的調制識別算法可分為兩大類,即基于似然(likelihood based,LB)的算法和基于特征(feature based,FB)的算法[1]。LB算法將調制識別問題視為一個多元假設檢驗問題,它可以得到最優解,但其計算復雜度相對較高。參考文獻[3]研究了平均似然比和廣義似然比在調制識別中的應用。參考文獻[4]設計了兩種分別基于Gauss-Legendre和Gauss-Hermite求積規則的LB算法,用于識別線性調制。FB算法從信號中提取特征用以區別不同的調制方案,如果特征和分類器選擇恰當,該算法可以在保證較低復雜度的同時獲得近似最優的性能,因而逐漸占據了主導地位[5]。參考文獻[6]提出了一種以高階累積量(high-order cumulant,HOC)為特征的FB算法,在多徑衰落條件下具有較好的魯棒性。參考文獻[7]以近似熵為特征,實現了連續相位調制的識別。在參考文獻[8]中,四階譜特征和壓縮感知被用來區分星座圖類似的調制信號。此外,在分類器方面,參考文獻[9]的研究表明,決策樹比人工神經網絡更適用于多輸入多輸出系統。參考文獻[10-12]中也提出了基于其他分類器的FB算法,如支持向量機和K最近鄰等。
DL是當前人工智能浪潮中強有力的工具之一,其本質是一種基于多層神經網絡、以海量數據為輸入、自動組合低層特征形成高層特征的規則學習方法。最基本的神經網絡包括3部分,分別為輸入層、隱藏層和輸出層[13]。其中,輸入層的神經元用于接收輸入數據,并將數據傳輸到隱藏層的各神經元;隱藏層中的神經元利用激活函數處理數據,并將處理后的數據傳到輸出層;最后由輸出層的神經元輸出結果。在DNN中,隱藏層的層數越多,結構越復雜。此時,整個網絡的參數也變得更多,每一層相對上一層的抽象表示也更加深入,因而DNN相較于基本的神經網絡具有更強大的性能。
近年來,隨著DL的蓬勃發展,DNN也被引入通信領域,用于解決調制識別等傳統通信問題?;贒L的調制識別技術,能夠充分發揮DNN的性能優勢,彌補原有LB和FB算法的不足。
在通信系統中,接收信號通??杀硎緸槿缦滦问剑?/p>

其中,n(k)代表加性高斯白噪聲(additive white Gaussian noise,AWGN),x(l)代表符號序列,A代表幅度因子,f0代表載波頻率偏移,kθ代表相位抖動,T代表符號間隔,h(·)代表殘留信道影響,T∈為定時誤差。
考慮由N個接收信號采樣點組成的接收向量和M種調制方案組成的候選集合,調制識別的任務是根據接收向量確定調制方案Si。

基于DL的調制識別的系統結構如圖1所示。接收到的調制信號首先經過數據預處理,轉換為適當的信號表征;信號表征再送入DNN中處理,并完成調制方案的識別。在實際應用中,根據調制候選集和無線環境的不同,有必要采用適當的數據預處理方法,設計合理的DNN結構,以滿足不同的應用需求。

圖1 基于DL的調制識別系統結構
數據預處理作為基于DL的調制識別中的關鍵步驟,目的在于對原始數據進行變換,將其表征成恰當的形式,使之能夠適于DNN處理。如果數據預處理方式得當,DNN就能夠更好地從數據中提取典型特征,達到更佳的識別性能。根據預處理后數據表征形式的不同,數據預處理方式可以分為三大類:特征表征、序列表征和圖像表征。
特征表征是將接收信號預處理成一個或者多個特征值,例如HOC特征、高階矩特征、頻譜特征及其他統計特征等[1]。參考文獻[6]將接收信號轉換成HOC特征,以對抗多徑衰落的影響;參考文獻[10]使用四階譜特征表征接收信號,實現了4種調相信號的識別;參考文獻[14]研究了多達28種特征表征,并討論了不同特征值組合對調制識別性能的影響。
序列表征是將接收信號預處理成一個一維向量,例如正交同相(in-phase and quadrature,IQ)序列[15-17]、幅度相位(amplitude and phase,AP)序列[18-19]、快速傅里葉變換(fast Fourier transform,FFT)序列[20]和幅值直方圖序列[21]等。參考文獻[22]最早將IQ表征用于調制識別,性能較傳統方法具有較大優勢;參考文獻[16]利用IQ序列表征信號,討論了不確定噪聲條件下的調制識別問題;參考文獻[18]分析了IQ、AP和FFT 3種序列表征,同時指出在不同的信噪比(signal-to-noise ratio,SNR)條件下,不同的表征形式具有不同的調制識別精度。
圖像表征是將接收信號預處理成一個二維矩陣,例如星座圖[2,5,23]、眼圖[24]、特征點圖[25]以及經各種變換后產生的譜圖[26-28]等。參考文獻[2]利用接收信號的星座圖表征,將調制識別問題轉換成圖像識別問題,并利用DNN解決;參考文獻[27]和參考文獻[28]分別將接收信號轉換成雙譜圖和循環熵譜圖,也取得了較高的識別精度;參考文獻文獻[29]采用等勢星座圖替代原始的星座圖,進一步提升了調制識別的性能。
DNN是基于DL的調制識別的核心部分,它負責處理信號表征結果,并完成調制方案的推斷和輸出。DNN一般分為三大類,即深度前饋網絡、卷積神經網絡(convolutional neural network,CNN)和循環神經網絡(recurrent neural network,RNN)[13]。
3.3.1 深度前饋網絡
深度前饋網絡,也叫前饋神經網絡或多層感知機。深度前饋網絡的特點是整個網絡中無反饋,信號從輸入層到輸出層單向傳播。其每層神經元與下一層神經元之間完全互連,各神經元之間不存在同層連接和跨層連接。深度置信網絡(deep belief network,DBN)是深度前饋網絡的典型代表之一,由多層受限玻爾茲曼機(restricted Boltzmann machine,RBM)組成[30]。其中每個RBM有兩層,即上層隱藏層和下層可見層。
最近幾年,國內外的研究者已經提出了不少基于DBN的調制識別算法。參考文獻[31]設計了一種包括3個常規RBM和1個高斯-伯努利RBM的DBN,用于處理接收信號的譜圖表征,在SNR大于或等于2 dB時,對5種調制方案的識別精度達到了90%以上。參考文獻[32]提出了一種基于DBN和星座圖投影的調制識別算法,利用DBN學習星座圖投影的潛在特征,其識別精度接近LB算法,但復雜度更低。
3.3.2 卷積神經網絡
CNN通常指包含卷積運算的神經網絡。在CNN中,相鄰層局部連通,多層之間利用空間局部相關性實現權重共享,因此同一個參數可以被不同的神經元多次使用。此外,隱藏層內的卷積核使得CNN的輸入層與輸出層之間具有稀疏連通性,從而大大提高了計算效率,降低了網絡存儲需求[33]。代表性的CNN結構有AlexNet、VGG-Net、GoogLeNet、ResNet等。
AlexNet包含5個卷積層和3個全連接層,其中卷積層之后還連接了最大池化層,一共有6 000萬個參數和65萬個神經元。參考文獻[2]提出了一種基于AlexNet和星座圖表征的調制識別算法,利用AlexNet學習星座圖的特征,完成了8種調制方案的識別。參考文獻[28]提出了一種基于AlexNet和譜圖的調制識別算法,將譜圖送入AlexNet進行訓練,并用訓練好的AlexNet模型推斷接收信號的調制方案。為了解決數據不足導致的調制識別性能惡化的問題,參考文獻[34]在AlexNet的基礎上,引入生成對抗網絡對訓練數據進行擴充,使得整體識別精度提高了0.1%~6%。為了便于在邊緣設備和實時場景中部署基于DL的調制識別技術,參考文獻[29]提出采用網絡剪枝技術對AlexNet進行裁剪。與原始的AlexNet相比,剪枝后網絡僅使用了1.5%~5%的參數,僅耗費了33%~35%的識別時間。
VGG-Net由牛津大學計算機視覺組和Google DeepMind公司聯合提出,通過反復堆疊大小為3×3的小型卷積核和2×2的最大池化層,構筑了一種16~19層深的CNN結構,具有更強的泛化能力和較少的迭代次數。參考文獻[15]提出使用VGG-Net對接收信號的IQ序列進行學習和識別,在AWGN信道下24種調制方案的平均識別精度約為33.5%,其中11種調制方案的平均識別精度約為54%。
自2012年AlexNet取得歷史性突破直到GoogLeNet橫空出世以前,主流的CNN結構都是朝著更深、更寬的方向發展,但增大網絡也會使得網絡計算復雜度急劇增加。GoogLeNet由若干Inception模塊堆疊而成,采用全局平均池化層代替了最后的全連接層。這種結構在增加CNN的深度和寬度的同時,保證了網絡計算量基本恒定。參考文獻[2]研究了基于GoogLeNet的調制識別,對8種調制方案的平均識別精度約為89%。
傳統的CNN在信息傳遞時或多或少地存在信息丟失和損耗的問題,同時還可能存在梯度消失或梯度爆炸的風險,導致網絡無法訓練。ResNet在一定程度上解決了這個問題。它通過在網絡中增加直連通道,將輸入信息同時繞道傳送給輸出,既保護了信息的完整性,又降低了網絡訓練的難度,使得構建超深層網絡成為現實。參考文獻[27]就提出了一種基于ResNet和譜圖的調制識別算法,用于應對非高斯噪聲影響。該算法在不同脈沖噪聲條件下均能保持較好的識別性能。參考文獻[17]在ResNet的基礎上,引入了3種融合方法用于解決實際接收信號長度不固定的問題。
3.3.3 循環神經網絡
RNN是一種擅于處理序列數據的神經網絡。在RNN中,網絡會存儲之前的信息并用于計算當前的輸出,即隱藏層的輸入不僅包括上一層的輸出,還包括上一時刻自身的輸出。當RNN的相關輸入與期望輸出在時間軸上間隔很長時,網絡訓練容易產生梯度消失或者梯度爆炸,使得RNN的長時記憶失效。為了解決這個問題,長短期記憶(long short-term memory,LSTM)網絡應運而生。LSTM網絡將數據維護在獨特的cell結構中,通過輸入門、遺忘門和輸出門這3個門結構實現信息的添加和刪除,以克服傳統RNN存在的長期依賴問題[35]。
參考文獻[16]設計了一種由3個LSTM層堆疊的RNN,用于對抗調制識別中的瑞利衰落和不確定噪聲影響,并增強頻率偏移場景下的魯棒性。參考文獻[36]提出了一種基于LSTM網絡的調制識別算法,用來學習接收信號的IQ序列和HOC表征,相較于CNN,它具有更好的識別性能。參考文獻[18]利用LSTM網絡處理接收信號的AP序列和FFT序列表征,在衰落信道下11種調制方案的平均識別精度接近90%。
為便于評估和對比不同調制識別算法的性能,研究者們創建了一些公開數據集,其中最為流行的是RadioML數據集[15,37],包含RadioML2016.04c、RadioML2016.10a、RadioML 2016.10b和RadioML2018.01a等多個版本。
RadioML2016.04c是一個利用GNU Radio生成的數據集,共涉及11種常用信號調制方案,包含8種數字調制和3種模擬調制,分別是二進制相移鍵控(binary phase shift keying,BPSK)、正交相移鍵控(quadrature phase shift keying,QPSK)、8PSK、十六進制正交幅度調制(16quadrature amplitude modulation,16QAM)、64QAM、二進制頻移鍵控(binary frequency shift keying,BFSK)、連續相位頻移鍵控(continuous phase frequency shift keying , CPFSK)、四進制脈沖幅度調制(pulse amplitude modulation 4,PAM4)、寬帶頻率調制(wide band frequency modulation,WBFM)、單邊帶調幅(single-sideband amplitude modulation,AM-SSB)、雙邊帶調幅(double-sideband amplitude modulation,AM-DSB)。其采樣速率為每符號8個采樣點,包括220 000個調制信號樣本,信道類型為多徑衰落信道。此外,它還是一個具有中等時鐘漂移、輕度衰落的可變SNR數據集,可用于不同信號和噪聲場景下的調制識別性能測試。
RadioML2016.10a是RadioML2016.04c的一個更干凈規范的版本,同樣包含了上述11種調制方案,信噪比變化范圍為-20~18 dB。該數據集考慮了AWGN和多徑衰落影響,并引入了采樣率偏移和中心頻率偏移等惡劣條件,以與實際無線通信環境更為相似。
RadioML2016.10b是RadioML2016.10a的擴展版本,一共包含1 200 000個信號樣本,但只涉及10種調制方案,分別為BPSK、QPSK、8PSK、16QAM、64QAM、BFSK、CPFSK、PAM4、WB-FM和 AM-DSB。
RadioML2018.01a對RadioML2016.10a中的調制類型進行了增廣,共涉及24種調制方案,包括通斷鍵控(on-off keying,OOK)、四進制幅移鍵控(4 amplitude shift keying,4ASK)、8ASK、BPSK、QPSK、偏移QPSK 、8PSK、16PSK、32PSK、十六進制幅度相移鍵控(16 amplitude and phase shift keying,16APSK)、32APSK、64APSK、128APSK、16QAM、32QAM、64QAM、128QAM、256QAM、單邊帶載波調幅(single-sideband amplitude modulation with carrier,AM-SSB-WC)、單邊帶抑制載波調幅(single-sideband amplitude modulation with suppressed-carrier,AM-SSB-SC)、AM-DSB-WC、AM-DSB-SC、調頻(frequency modulation,FM)、高斯最小頻移鍵控(Gaussian filtered minimum shift keying,GMSK)。數據以浮點復數的形式存儲,有200萬個信號樣本,每個樣本的長度為1 024個采樣值。
基于DL的調制識別性能主要從識別精度和模型復雜度兩個方面評價。
3.5.1 識別精度
識別精度的第一個衡量指標為混淆矩陣(confusion matrix)。混淆矩陣也稱誤差矩陣,能夠直觀反映識別結果的分布狀況,通常為M×M的方陣,其第p行、第q列的值M(p,q)表示有M(p,q)個調制方案為Sp的信號樣本被識別為調制方案Sp。假設候選集中有2種調制方案,即M=2,那么,其混淆矩陣如圖1所示。

圖1 混淆矩陣
其中,TP(truepositive,TP)和TN(true negative,TN)表示預測結果正確,FP(false positive,FP)和FN(false negative,FN)表示預測結果錯誤。
識別精度的另一個衡量指標為識別準確率(accuracy,Acc),表示識別正確的信號樣本數量在所有信號樣本中所占的百分比。以M=2為例,Acc可具體計算如下:

3.5.2 模型復雜度
DNN的模型復雜度主要包括時間復雜度和空間復雜度。時間復雜度可以通過訓練時間或識別時間衡量;空間復雜度取決于模型的參數數量和模型所需的存儲空間大小。

表1 基于DL的調制識別算法對比
為了進一步展示基于DL的調制識別算法的性能,表1列舉了本文所提及的部分算法識別精度和模型復雜度,并給出了它們的數據預處理方式和DNN類型。從表1可以看出,大部分算法均具有較好的識別性能。其中,候選調制方案越簡單,SNR越高,識別性能越好。
雖然基于DL的調制識別研究已經取得了一系列的成果,但仍有進一步研究的空間。
首先,從數據預處理的角度看,在同一種信號表征形式下,如果候選調制方案不同,或者無線環境不同,算法的識別精度會有明顯差異,因此有必要研究信號表征與調制方案及信道條件之間的關聯性,以便根據實際場景選擇恰當的數據預處理方式。同時,綜合利用信號的特征表征、序列表征和圖像表征,已被證實有利于提高調制識別精度,但如何融合這些表征形式還沒有得到深入的研究。
其次,從DNN的角度看,不同的DNN結構擅長處理不同形式的數據,因此未來需要進一步根據數據預處理結果,設計匹配的網絡結構,以充分學習信號的典型特征,實現高精度的調制識別。
最后,從模型復雜度的角度看,基于DL的調制識別的精度雖然在不斷提升,但其模型復雜度也在不斷增加,導致其難以部署到資源有限的移動平臺和邊緣節點上。因此,如何在保證識別精度不明顯下降的同時減少網絡參數、改善模型效率,值得未來繼續研究。
本文首先回顧了傳統的調制識別方法及DL的相關基礎;然后重點討論了基于DL的調制識別技術,給出了系統架構,闡述了特征表征、序列表征和圖像表征3種數據預處理方式,著重分析了3種常用的DNN,包括深度前饋網絡、CNN和RNN,介紹了RadioML數據集,列舉了識別精度和模型復雜度兩方面的性能指標,并對部分算法進行了總結;接著從數據預處理、DNN和模型復雜度3個角度展望了下一步的研究工作。未來隨著DL的不斷演進,基于DL的調制識別技術也將不斷完善,取得更大的發展。