安澤亮,張天騏,馬寶澤,鄧盼,徐雨晴
(1.重慶郵電大學通信與信息工程學院,重慶 400065;2.重慶郵電大學計算機科學與技術學院,重慶 400065)
正交空時分組碼(OSTBC,orthogonal spacetime block code)[1-2]因分集增益高和接收端解碼簡便,在多入多出(MIMO,multiple-input multipleoutput)系統中得到廣泛應用,能顯著提升通信傳輸的可靠性。近年來,非合作通信場景下OSTBC信號盲處理研究受到廣泛關注,但只有正確識別調制樣式,才能準確解碼得到傳輸信息,所以調制識別研究是OSTBC 信號盲處理中的一個重要研究方向。但現有調制識別研究主要針對單入單出系統,而對MIMO 系統調制識別的研究較少,且受空時編碼和MIMO 信道影響,OSTBC 信號的調制識別變得更加棘手[3-7],因此,非合作通信場景下OSTBC信號的調制識別具有重要的研究價值。
當前,針對OSTBC 信號調制識別算法主要分為2 類:基于似然函數和基于特征工程。其中,基于似然函數的算法[3-4]具有較優的識別精度,但其過高的計算復雜度和過多的先驗信息需求,使其不適用于非協作MIMO-OSTBC 系統。基于特征工程的算法包含特征提取和分類判決2 個環節。1) 特征提取是指從截獲的OSTBC 信號中提取深層特征,如高階累積量[5-6]、高階矩[5]和瞬時統計特征[6-7],這些特征具有較好的調制特征表達能力,但都是基于人工專家經驗設計的,特征選取的理論指導不足且缺乏通用性,在多類別OSTBC 信號識別中存在特征冗余和判決閾值設定困難的問題。2) 分類判決是指設計有效的分類器來完成OSTBC 信號識別任務。現有分類器大多基于機器學習算法,如K 最近鄰(KNN,k-nearest neighbor)[5]、支持向量機(SVM,support vector machine)[5]以及決策樹[6]。然而,特征工程方法的非線性擬合能力有限,識別精度存在提升的空間,且特征提取步驟煩瑣,不利于實際工程應用。針對上述問題,應用驅動人工智能蓬勃發展的深度學習技術,能自動提取信號特征,簡化任務復雜度,且其非線性擬合能力更強,可進一步逼近識別精度上限。例如,基于堆疊自編碼器的深層神經網絡(SAE-DNN,stacked auto encoder-deep neural network)[7],學習信號高階累積量和瞬時特征,相比機器學習算法有一定性能提升,但特征轉換中存在信息損失,識別精度有待提升,且該算法假設信道狀態信息已知,不適用于非合作通信場景。
受上述研究啟發,本文提出一種基于一維卷積神經網絡(1D-CNN,one-dimensional convolutional neural network)的多天線協作OSTBC 信號調制識別算法。首先,通過迫零(ZF,zero-forcing)盲均衡來減少信道衰落的影響,恢復源信號的特征表達能力,并通過最小化基于峭度的損失函數來盲估計信道矩陣,解決非合作通信場景下信道狀態信息未知的問題;其次,充分利用深度學習在模式識別領域的前沿技術,并構建1D-CNN 來匹配一維輸入信號特性,直接從天然無損同相正交(I/Q,in-phase/quadrature)信號中提取高維特征,避免復雜的特征轉換;最后,為彌補單天線判決的不足,采用投票和置信度決策2 種融合策略,實現接收端多天線協作調制識別二進制相移鍵控(BPSK,binary phase shift keying)、4 相移鍵控(4PSK,4 phase shift keying)、8 相移鍵控(8PSK,8 phase shift keying)、16 正交振幅調制(16QAM,16 quadrature amplitude modulation)、4 脈沖振幅調制(4PAM,4 pulse amplitude modulation)5 種調制信號。仿真實驗表明,所提算法能實現比現有算法更高的識別精度和更低的測試計算時間,擁有較高的工程應用前景。同時,所提算法能自動提取信號波形的高維特征,避免了煩瑣的人工特征提取,提升了OSTBC 信號調制識別的智能化層級。
本文考慮一個MIMO-OSTBC 系統,收發端天線配置為M×N,系統模型和數據集構造流程如圖1所示。首先,發送端通過符號調制器將二進制比特數據映射為K個符號流s=[s1,s2,…,sK]T,且s中各調制符號是獨立同分布的;然后,通過空時編碼器輸出一個M×L的空時編碼符號復矩陣X=C(s)=[x1,x2,…,xM],其中L為發送時隙長度;進一步地,對X進行功率歸一化,確保每根天線發射信號具有相同的單位功率;最后,功率歸一化后的經過衰落信道后,接收端N根天線接收信號矩陣Y(s) ∈CN×L為

圖1 系統模型和數據集構造流程

其中,W∈CN×L是N×L的加性白高斯噪聲矩陣,與發送信號不相關;H∈CN×M是N×L的準靜態平坦衰落信道矩陣,設定H為滿秩矩陣(N>M);空時編碼矩陣是對s的線性編碼,即在時隙長度L內通過M根天線發送K個符號。

具體地,本文采用3/4 編碼速率的OSTBC(3,3,4)編碼方式,即符號流s在4 個時隙之中,通過3 根天線進行信號傳輸,對應的編碼傳輸矩陣為

由于受MIMO-OSTBC 系統和信道衰落影響,單個接收天線接收來自多個發送天線的混合信號,導致接收信號存在模糊性,因此,需采用ZF均衡來消除模糊性。現有MIMO-OSTBC 調制識別研究中[5,7],通常預先用ZF 技術來預處理接收信號,提升后續信號的表征能力和調制識別準確率,但都假設接收端已知完美信道狀態信息H,直接用ZF 技術來消除混合信道干擾,但在非合作通信場景下,接收端預先無法獲得完美H,因此,需采用盲信道估計來獲得信道估計值,本文通過最小化基于峭度的損失函數[8]來獲得H? 。首先,切分信號的實部和虛部,矢量化后的接收信號矩陣Y(s)為y。


本節介紹數據集的構造流程。如圖1 所示,當發射信號通過衰落信道后,接收機端通過ZF 盲均衡來恢復發射源信號,并對進行I/Q 分解來構造本文數據庫。本文OSTBC 下的調制信號數據集Ω包含 5 種通信調制信號{BPSK,4PSK,8PSK,16QAM,4PAM}。為充分利用數據集的全面性,這里采用多種信噪比(SNR,signal-noise-ratio)樣式,SNR 在[ ?20 dB,18 dB]以2 dB 為間隔,共計20 種。仿真采用平坦瑞利衰落信道并設定其參數均值μ=0和方差σ2=1,ZF 盲均衡先采用最小化基于峭度的損失函數的方法獲取衰落信道估計值,結合空時編碼信息從衰落信號中恢復原始發送信號,并存儲全部接收天線信號作為數據集,每根天線單次收集的信號作為一個有效樣本。由于CNN 僅能處理實數數據,不能處理復數數據,因此需I/Q 分解一維復數數據(1×L)為二維數據(2×L),如式(14)所示。

其中,I表示信號的實部,Q表示信號的虛部。本文的數據集尺寸為[T×2×L],其中,數據集Ω的總樣本數T=k m×ksnr×ks,km是信號種類數,ksnr是信噪比種類數,ks是每類樣本每種信噪比包含的樣本數。設km=5,ksnr=20,ks= 2 000。
為更好地理解源信號的恢復效果,通過星座圖方式來可視化時序信號特點。在SNR=10dB下,MIMO-OSTBC 收發端天線配置為3×5,數據集可視化結果如圖2 所示。在圖2 中,發射源信號s通過空時編碼、信道衰落和噪聲影響后,接收信號星座點產生了偏移,具有一定的幅相誤差,使星座圖出現混淆模糊,從而降低了不同調制方式間的特征區分度,進而限制后續分類器性能。相比之下,ZF 盲均衡恢復的源信號的星座點模糊程度較小且聚類更明顯,能有效緩解信道和OSTBC 編碼影響,5 種調制方式間的區分度更大,較強的表征能力提升了調制識別的性能上限,而分類器只能無限逼近這一上限,因此,通過ZF 盲均衡提升信號表征能力是至關重要的。

圖2 數據集可視化(SNR=10dB,MIMO-OSTBC 收發端天線配置為3×5)
本文所設計的MIMO-OSTBC 系統調制識別原理如圖3 所示。對于接收機,通過下變頻、ZF 盲均衡、數據標準化以及I/Q 分解等一系列預處理以后,本文將2×N的數據樣本輸入識別網絡,進一步完成特征提取和調制決策分類。

圖3 MIMO-OSTBC 系統調制識別原理
考慮到發射信號經過衰落信道后,不同接收信號功率受影響程度不同,為統一各數據樣本的數量級和增加可比性,并加快網絡收斂速度和防止梯度爆炸,本文采用Z-score 標準歸一化,基于輸入樣本的均值μ和標準差σ對進行標準化,即

圖4 給出了本文所設計的一維卷積神經網絡架構。為保證輸入數據的信息無損和避免復雜的統計特征轉換,本文模型輸入采用最原始的I/Q 數據,其包含天然無損的特征信息,且數據預處理簡易,這和文獻[10-11]的研究思路相同。

圖4 一維卷積神經網絡架構
3.2.1 特征提取模塊
對于特征提取模塊,由5 個一維卷積層(Conv 1D)和4 個平均池化層級聯構成。Fil 為濾波器個數,濾波器可視為特征檢測器,每個濾波器會從數據學習特征,采用金字塔形式來設計模型每層濾波器個數;Ker 為卷積核大小,借鑒主流的InceptionNet 和GoogleNet 中采用的3×3 小卷積核,本文選擇Ker=3。
首先,為更好地適應時序數據的矢量特性和加快卷積運算,本文采用1D 卷積而不是2D 卷積,Conv 1D[12]的輸入和輸出數據是二維的,而Conv 2D[13]則對應三維輸入輸出,更適用于圖像數據。Conv 1D 主要通過輸入數據與卷積核的卷積運算來提取數據高維特征,且卷積核移動方向是單維的,Conv 1D 層輸出為


圖5 一維卷積和平均池化原理
3.2.2 分類器模塊
從特征提取模塊到分類器模塊,需要采用Flatten 層將二維輸出特征圖展平壓縮成一維特征矢量。分類器模塊包含2 個全連接層、Dropout 層和一個輸出層,其中輸出層采用Softmax 激活函數,Dropout 層能降低模型過擬合風險,提升模型穩健性,這里選擇置零比例rate=0.2,即20%神經元將會被賦值零權重。2 個全連接層中都采用ReLU 激活函數,神經元節點數分別為128 和64,當給定全連接層FC-1 的輸出特征矢量,全連接層FC-2的輸出特征矢量為


因此,在輸出概率矢量p基礎上,最后的調制識別問題就轉變為基于最大后驗準則的閉集分類問題,對于樣本輸入數據,判別輸出結果ξ為

為減小訓練復雜度,本文對所有天線接收信號集中訓練,僅訓練一個1D-CNN,而不是訓練M個網絡。在測試中,所有天線采用同一個網絡測試。本文采用隨機梯度下降策略來更新網絡權重矩陣W和偏置b,一個訓練batch 對應的損失函數為

其中,Kb是一個batch 包含的樣本數,log(?)是對數函數,和yj分別是真實標簽和預測標簽。
本節主要介紹2 種決策融合策略。針對OSTBC(3,3,4)系統,在任一SNR 下,N路接收信號y受到的信道和瞬時噪聲影響程度不同,在通過ZF 盲均衡恢復后的源信號有M條支路,各支路信號的盲均衡恢復效果有所差別,所蘊含的特征表達能力也不同,因此1D-CNN 分類器基于每一支路的信號所獲得調制識別精度存在差別,且傳統方法沒有協作利用各支路的決策信息,識別精度上還存在提升的空間。為了提升最終的調制識別精度,本文采用決策融合策略來匯總各支路的判決信息,有助于降低系統誤判的概率,具體如圖3 所示。
3.3.1投票決策融合
投票決策融合是在M條支路的最終判決信息(Argmax 層輸出的ξ)基礎上,使用“少數服從”多數的評判方法給出了最終的決策結果V(x),即

3.3.2 投票決策融合
不同于投票決策融合,置信度決策融合主要原理是利用M條支路的置信度信息,即Softmax 激活層輸出的p,其中包含了每種調制類別的預測概率矢量,通過累加平均所有支路的置信度信息作為最終的判決依據,選擇最大概率p對應的調制方式作為系統最終的預測類別P(x),數學上可表示為

本文所提出的MIMO-OSTBC 系統調制識別算法流程如算法1 所示。
算法1MIMO-OSTBC 系統調制識別算法
輸入
1) 預處理的訓練集Ψ1和未處理的測試信號y。
2) 隨機初始化的1D-CNN 模型。
網絡訓練
1) 隨機打亂訓練樣本Ψ1,按每128 個樣本對應一個batch,將整個數據集分為m個batch。
2) 將m個batch 的訓練數據和樣本輸入初始化的1D-CNN。
3) 采用SGD 方法來更新網絡權重W和偏置b,當網絡收斂時,保存訓練好的模型參數。
測試信號ZF 盲均衡
1) 對信號進行下變頻、載頻估計等預處理。
2) 按照第2 節的ZF 盲均衡策略,將N根天線的接收信號y恢復為M路估計的源信號。
歸一化預處理
決策融合輸出
1) 投票決策融合。根據式(20)和式(23)計算M路信號類型出現個數,用式(22)匯總M路判決結果,投票選擇出現最多的類型V(x)。
2) 置信度決策融合。通過式(19)和式(25)計算并統計M路信號上各類型出現置信度,用式(24)匯總M路置信度結果,選擇最大概率對應的調制類型P(x)。
本節對所提算法識別精度進行仿真驗證,采用的空時編碼類型為OSTBC(3,3,4)。本文MIMOOSTBC 系統搭建和數據集生成在MATLAB 2019a仿真平臺上完成,在TensorFlow2.0 環境下完成模型的搭建、訓練和測試,所用GPU 型號為NVIDIA GeForce GTX 1660 Ti。按照6:2:2 的比例,整個數據集被切分為訓練集、驗證集和測試集,且每種調制類型有相同大小的樣本子集,并使用Adam 優化器進行梯度更新,batch 批大小、輪次epoch 上限和初始學習率lr 分別設定為128、50 和0.001,對應損失函數為交叉熵損失函數。針對過擬合問題,這里采用早停策略,當驗證損失在5 個epoch 內不再下降時停止模型訓練。為評價所提識別算法性能,采用調制識別精度Pcc作為評價指標。

其中,Ncorrect表示測試集樣本總數,Ntotal表示測試集中正確分類的樣本個數。
本節從3 個方面測試模型整體識別精度,包括ZF 盲均衡效果、不同OSTBC 碼率以及不同調制類型。ZF 盲均衡預處理和不同OSTBC 碼率對識別精度的影響如圖6 所示,不管是OSTBC(3,3,4)還是OSTBC(3,4,8),在整個SNR 范圍內采用ZF 盲均衡的識別精度明顯高于無均衡的情況,從圖2 數據集可視化中也能看出,ZF 盲均衡能有效補償信道衰落影響,恢復信號的星座點更集中且特征區分度更明顯。在圖6 中,不同碼率的OSTBC 對識別精度影響較小,當SNR≥?4 dB時,采用ZF 盲均衡的OSTBC(3,3,4)和OSTBC(3,4,8)的識別精度都大于95% 。其中,OSTBC(3,3,4) 碼率為3/4,而OSTBC(3,4,8)碼率為1/2,對應空時編碼矩陣為

圖6 ZF 盲均衡預處理和不同OSTBC 碼率對識別精度的影響

為對比不同盲均衡方法的預處理效果,表1從先驗信息需求和平均識別精度兩方面進行了驗證。其中,ML(maximum likelihood)盲均衡表示最大似然盲均衡方法[2],MUK(multiuser kurtosis maximization)盲均衡表示基于多用戶峰態最大化的盲均衡方法[14]。首先,對于先驗信息需求,MUK方法僅要求發射天線數,ZF 方法需要考慮空時碼類型和盲信道估計值,ML 方法在ZF 方法基礎上還要求已知調制類型,這與本文調制識別任務相矛盾,因此不能將ML 方法應用于本文中。其次,對于平均識別精度,相比ZF 方法和ML 方法,雖然MUK 方法的先驗需求最低,但MUK 方法在整個SNR 范圍內平均識別精度最低。綜合考慮上述內容,本文選擇ZF 方法來補償信道和空時編碼對調制信號的影響。

表1 不同盲均衡預處理方法的性能對比
不同SNR 下不同調制類型的識別度對比如圖7所示。當SNR ≥ 0時,所有調制類型的識別精度都能達到100%,而SNR< 0時,調制識別精度有所下降。對于Mod-PSK 類間信號,隨著調制階數Mod的不斷增加,識別精度不斷下降,這是因為BPSK、QPSK 和8PSK 同屬于圓形Mod-PSK 類調制,存在較多重疊區域。相比低階BPSK、QPSK,高階8PSK由于重疊度大,其特征更為模糊,這在圖2 具象化的星座圖上也可看出。此外,在低SNR 下,4PAM和16QAM 的識別精度要高于Mod-PSK 類信號。

圖7 不同調制類型的識別精度
本節從識別精度和算法復雜度2 個角度對比了本文算法和現有算法[5,7]。不同算法的識別精度對比如圖8 所示。不同于基于特征工程的機器學習算法,所提1D-CNN 算法利用信號包含的天然無損的特征信息,并借助卷積神經網絡強大的特征自動提取能力,因此所提算法識別精度優于現有算法,當SNR=?4dB時,所提算法能達到99.5%的識別精度,而SAE-DNN 算法[7]、SVM 算法[5]和KNN 算法[5]分別達到 95%、88%和 88%的識別精度。且在SNR ≥2dB時,1D-CNN 算法識別精度比SAE-DNN算法提高了10%,而比SVM 算法和KNN 算法提高了20%。

圖8 不同算法識別精度對比
不同算法復雜度對比如表2 所示,主要包括2 個指標:內存消耗和測試時間。從測試時間來看,所提1D-CNN 算法和SAE-DNN 算法比KNN 算法和SVM 算法低了一個量級,處于亞毫秒級,且1D-CNN 具有最低的測試時間。由表2 還能看出,所提算法比KNN 算法和SVM 算法更小,占用更少的內存,有利于實際移動端的部署,此外,根據圖8可知,雖然SAE-DNN 算法的模型內存消耗最小,但其識別精度低于1D-CNN 算法。因此,綜合來看,所提1D-CNN算法能滿足實時性要求且識別精度高于現有方法,在工業應用上擁有較高的發展前景。

表2 不同算法復雜度對比
不同決策融合策略下所提算法識別精度如圖9所示。從圖9 可以看出,不管是置信度決策融合還是投票決策融合,采用多路信號協作決策融合方法要比單一支路的決策識別方法性能更優,在識別精度為95%時,相比單一支路決策方法,置信度決策融合和投票決策融合方法分別存在1 dB 和2 dB 的性能增益。從圖9 還可以看出,基于置信度決策融合策略比基于投票決策融合策略的識別精度更高,在SNR=?8dB時,置信度決策識別精度比投票決策方法存在20%的性能提升,因此,在本文仿真中,所提算法均采用置信度決策融合策略進行調制識別。

圖9 不同決策融合策略下所提算法識別精度
不同接收天線數對模型識別精度的影響如圖10所示。對于OSTBC3 系統,發射端天線數Tx 設定為3。由圖10 可知,隨著接收端天線數Tr 的不斷增大,模型識別精度隨之上升,這是因為收發端天線數差值 Δ=Tr ? Tx 越大,系統分集增益越大,對應的系統SNR 增益越大,可有效降低高斯白噪聲的影響和不同調制信號間特征間的模糊度,從而提升系統識別效果。從圖10 可以看出,當SNR=?8dB時,從Tr=4到Tr=8,系統約有30%的識別精度提升。

圖10 不同接收天線下所提算法識別精度(Tx=3 )
為了衡量所提算法對信道估計誤差的穩健性,實驗測試了不同信道估計誤差對所提算法識別精度的影響,如圖11 所示。帶有估計誤差的信道矩陣為,其中,E是誤差矩陣,其服從均值為0、方差為的高斯分布;大小決定了估計誤差大小。相比無估計誤差,信號在有下識別精度有所下降,且隨著不斷增大,識別精度也隨之降低。對于SNR=0,當≤0.3和≤0.1時,識別精度分別能達到90%以上和100%。因此,所提算法借助1D-CNN 所具備的強有力的自學能力,能有效改善一定程度的信道估計誤差影響。

圖11 不同信道估計誤差 對所提算法識別精度的影響
本節驗證了網絡層數和卷積核大小對模型識別精度的影響。不同網絡層數對模型識別精度的影響如圖12 所示。圖12 中1D-CNN-A、1D-CNN-B和1D-CNN-C 分別表示刪除圖4 中網絡特征提取模塊的最后2 層、4 層和6 層,而1D-CNN-Entire 表示完整的模型。從圖12 可以看出,受限于淺層網絡的特征提取能力,模型識別精度會因網絡層數的遞減而下降,而多個卷積層和平均池化層的級聯,助推了信號高維特征的提取,可識別不同調制信號間的細微區別。

圖12 不同網絡層數下所提算法識別精度
不同卷積核尺寸Ker 對模型識別精度的影響如圖13 所示。從圖13 可以看出,對于完整的模型,Ker=2 到Ker=6 過程中,識別精度先增加后下降,且在Ker=3時識別精度達到最優。這是因為較小的卷積核對應感受野較小從而不能提取有效的特征;而較大的卷積核能獲得更大的感受野,但會提取過多無用的特征,且無法堆疊更多的網絡層,從而限制網絡的特征提取能力。因此,通過該實驗確定本文所用網絡的卷積核為Ker=3。

圖13 不同卷積核尺寸下所提算法識別精度
了不同樣本符號長度L下的調制識別精度如圖14所示。通過對原始數據進行稀疏化采樣,每隔k個時間點對進行采樣得到0 ≤i≤ [(n? 1)/k]。從圖14 可以看出,識別精度隨著L的增加總體呈增長趨勢,但當L從128 增加到256 時,兩者識別精度差異較小,且當SNR ≥?12 dB時,數據長度L=128能獲得最優識別精度。此外,L過大會增加網絡訓練和測試復雜度,因此,本文數據集和模型架構選擇L=128作為樣本構造參數和模型輸入尺寸。

圖14 不同符號長度下所提算法識別精度
本文基于ZF 盲均衡后的I/Q 數據形式,并結合前沿的深度神經網絡模型,較好地完成了非合作通信場景下的MIMO-OSTBC 信號識別任務。所提算法直接使用內在無損的I/Q 信號信息,避免了復雜的特征工程,并使用ZF 盲均衡來消除信道干擾,最后借助多天線決策融合策略來提升系統整體調制識別率。對比傳統算法,本文所提算法能獲得更高的識別精度,在SNR≥?6dB和SNR≥?2 dB下識別精度分別能達到95%和100%,這表明本文算法能在低SNR 下很好地工作。此外,本文針對一維時序OSTBC 信號形式,構造了1D-CNN 來進行調制識別的設計思路,這也有助于未來其他類型一維時序通信信號的智能化調制識別研究。