王 鵬,張君毅,趙國慶
(1.中國電子科技集團公司第五十四研究所,河北 石家莊 050081;2.西安電子科技大學 電子工程學院,陜西 西安 710071)
通信信號調制識別的主要任務是通過對截獲到的通信信號樣本進行信號分析和判別進而確定通信信號調制方式、調制采用的參數以及其他所需的信號參數,為進一步的通信信號處理分析提供依據,在頻譜監測管理、通信偵察、電子對抗和無線電監測等領域具有廣泛的應用。其中,調制方式作為區別不同體制通信信號的一個重要特征,對其進行識別是通信信號調制識別的一項基本任務,具有重要的研究意義。
針對通信信號調制方式識別的問題,國內外學者提出了大量的方法,實現了通信信號調制方式識別由早期的人工方式到基于機器學習的自動化識別的跨越式發展[1-7]。在實際實踐中,現有基于機器學習的通信信號調制方式識別主要由數據預處理、特征提取、特征選擇、分類器設計、模型訓練和模型應用等步驟組成。然而,特征提取與選擇需要非常強的專業知識背景和極高的技巧,并且需要根據訓練結果進行多次調整,亟需更具普適性的替代方法[8-9]。針對這一問題,本文利用深度學習中的卷積神經網絡實現特征的自動抽取和表達,并基于自學習的特征設計了分類器,實現了通信信號調制方式的識別,最后進行了仿真實驗,仿真結果表明了該方法的有效性。
卷積神經網絡(Convolutional Neural Networks,CNN)的研究經歷了理論提出階段、模型實現階段以及廣泛應用階段[10-11],在圖像分類[12]、語音識別[13-14]和文本處理[15-18]等領域取得了較好的應用效果,是當前學術界的關注焦點之一。經典的CNN結構如圖1所示,包含了卷積層、池化層、全連接層和輸出層等。其中,卷積層是利用卷積核提取特征,得到特征圖;而池化層則是對特征圖按照特定方式進行降采樣處理,減小規模的同時保留有用信息,使得CNN具備抗畸變能力,提高網絡的魯棒性;全連接層一般位于網絡尾端,對前面逐層變換和映射得到的特征進行回歸分類等處理,實現輸出。

圖1 CNN結構
為實現通信信號調制方式的識別,本文建立了如圖2所示的CNN網絡。可以發現,本文所建網絡模型由1層輸入層、2層卷積層、2層池化層、1層全連層和1層輸出層組成。
本文所提模型的輸入為IQ兩路原始采樣數據,卷積層對IQ兩路數據進行卷積實現調制樣式分類特征的自學習,池化層對自學習特征進行降采樣提高分類特征的魯棒性,最后將自學習的分類特征輸入設計的分類器,輸出當前特征對應調制樣式的概率,最終實現調制樣式的識別。可見,上述模型以原始采樣數據為輸入,避免了傳統識別算法中特征的提取、選擇與組合過程。
第1層卷積層的卷積核大小為1×5 ,特征圖層數為64,激勵函數為如式(1)所示的ReLu函數;第1層池化層的核大小為2×2,采用最大池化法;第2層卷積層的卷積核大小為1×5,特征圖層數為32;第2層池化層的核大小為1×2,采用最大池化法;全連層的神經元個數為128,激勵函數為如式(2)所示的Sigmoid函數;輸出層采用Softmax回歸多分類,代價函數采用交叉熵函數,如式(3)、式(5)所示。
ReLu函數:
f(x)=max(0,x)。
(1)
Sigmoid函數:
(2)
對于給定的訓練集{(x1,y1),(x2,y2),...,(xm,ym)},yi∈{1,2,...,k},k表示分類的類別。對于給定測試輸入數據xi,利用假設函數來對每一個類別估算出概率值p(yi=j|xi) ,得到如下輸出向量:
(3)
式中,w表示模型的參數。為了更加清晰地述代價函數,首先定義一個示性函數,其取值規則如下:

(4)
則代價函數可以表示為:
(5)

圖2 用于調制方式識別的CNN網絡結構
調制后信號s(t)的復包絡可以統一表示為:
s(t)=A(t)exp(jφ(t)),
(6)
式中,A(t)為信號的幅度;φ(t)為信號的相位,其具體方式由調制方式決定。式(6)給出了信號的解析形式,稱其實部為同相分量,虛部為正交分量,如式(10)、式(11)所示:
sI(t)=Re{s(t)}=A(t)cos(φ(t)),
(7)
sQ(t)=Im{s(t)}=A(t)sin(φ(t))。
(8)
為了更好地描述真實世界中各種因素對信號的影響,本文采用如下所示的信號模型:

(9)
式中,n0(t)為由頻率振蕩器特性不一致而引起的載波變化;n1(t)為由時鐘振蕩器特性不一致而引起采樣變化;h(t)表示時變的信道沖激響應;n(t)表示噪聲。具體的信號產生方法詳見文獻[19],根據該方法產生的公開數據集詳見www.deepsig.io/datasets。
為實現算法性能的驗證,本文采用文獻[16]中所公開的數據集[13]作為樣本數據。數據樣本集包含3種模擬調制(WB-FM,AM-SSB,AM-DSB)和8種數字調制(BPSK,QPSK,8PSK,16QAM,64QAM,GFSK,CPFSK,PAM4)共11種調制方式的信號樣本數據。其中,每種調制方式數據的信噪比范圍均為-20~18 dB,信噪比步進為2 dB。在不同的信噪比條件下,每種調試方式的信號樣本均由IQ兩路組成,每路數據的采樣點數為128,包含8~16個數字碼元,每個碼元的過采樣率為8。在樣本數據集中,所有調制方式信號的數據共162 060組;此外,樣本數據集綜合考慮了式(9)所示的多徑衰落以及頻率選擇性衰落所引起的接收信號在幅度、頻率、相位及時間延遲方面的影響,與真實環境中各類因素對通信信號傳輸的影響十分貼近。
為驗證本文所提算法的有效性,利用3.2中所述的通信信號公開數據集對本文所提算法和文獻[16]中的算法進行了仿真,并從計算復雜度和識別性能兩方面進行了對比。其中,為提高算法的魯棒性和計算效率,在本文所提算法及文獻[16]算法的訓練過程中均采用Mini-Batch方法,Batch的大小為1 024,即將所有的訓練數據集以1 024個數據樣本為單位進行隨機組合,對一組數據進行訓練后對模型參數進行更新,當整個數據集訓練完成后稱為1次訓練。本文所提算法與文獻[16]算法的訓練次數都設定為100次。本文采用隨機梯度法對所提算法中代價函數進行優化,并分析討論了不同學習步長對算法性能的影響。為實現算法的性能驗證,隨機抽取數據集中70%的樣本作為訓練樣本,并隨機選擇訓練樣本中的10%作為驗證樣本,剩余的30%作為測試樣本。
為體現本文所提算法在計算復雜度方面的優越性,本文首先從模型網絡結構復雜度方面進行了理論分析。為實現調制樣式的識別,文獻[16]所提算法需完成2 830 427個模型參數的訓練,而本文所提算法僅需完成143 275個模型參數的訓練,模型參數訓練量僅為前者的5.06%左右,極大地降低了網絡結構的復雜度,可有效提高識別算法的計算效率。為進一步驗證本文所提算法在計算復雜度方面的優越性,在配置為8G內存、i7處理器的計算機上對文獻[16]算法和本文所提算法進行了仿真。仿真結果表明,文獻[16]所提算法完成一次訓練所需時間為410 s左右,而本文所提算法完成一次訓練所需時間僅為30 s左右,是前者的7.31%,與前述理論分析結果基本一致。這就說明,相比文獻[16]所提算法,本文算法可大幅提高調制樣式的識別效率。
圖3給出了不同算法在不同信噪比條件下對不同調制方式的識別結果。其中,CNN1表示本文所提模型中隨機梯度學習算法的學習步長為0.1,CNN2表示本文所提模型中隨機梯度學習算法的學習步長為0.01。
從圖3中結果可以看出,不同的學習步長對本文所提算法的識別效果具有一定的影響。總體來說,CNN2的調制識別效果比CNN1的調制識別效果略有提高(見圖3(a)),在BPSK的識別上體現的尤為明顯。
同時,從圖3中可以看出,本文所提算法對不同調制方式的識別結果存在著較大的差異。具體來說,對11種調制方式中的AM-SSB、BPSK、GFSK、PAM4、16QAM、64QAM識別效果較好,在0 dB左右即可達到90%甚至接近100%的正確識別率;而對AM-DSB、8PSK、WBFM等調試方式的識別效果較差,在高信噪比條件下也只有70%左右的正確識別率,且算法性能不穩定。
此外,從圖3中還可以看出,與文獻[16]所提算法識別性能相比,本文算法除在8PSK、BPSK、CPFSK等調制方式的識別正確率上存在明顯差異且互有高低外,在其它調制方式識別上基本相當,對11種調制方式的平均正確識別率也基本相當。
因此,結合4.1節中算法計算復雜度的分析,本文所提算法在與文獻[16]所提算法在保持識別性能相當的同時,大幅降低了算法的計算復雜度與運行時間,更加有利于基于深度學習的調制方式識別算法的工程化。

(a) 8PSK

(b) AM-DSB

(c) AM-SSB

(d) BPSK

(e) CPFSK

(f) GFSK

(g) PAM4

(h) 16QAM

(i) 64QAM

(j) QPSK

(k) WBFM

(l) 平均正確率
調制方式作為區別不同體制通信信號的一個重要特征,是通信信號調制識別的一項基本任務,具有重要的研究意義。為了避免傳統算法中對特征的提取與選擇問題,本文構建了一種基于卷積神經網絡的調制方式模型,實現了分類特征的自學習與調制樣式的識別。仿真結果表明了本文所提算法的有效性和可行性,同時也表明本文算法在性能穩定性、不同調制方式識別能力差異等方面尚存在一定的問題,這也是下一步工作的研究重點。