王安義,張衡
(西安科技大學 通信與信息工程學院,西安 710054)
隨著5G 研究與快速發展,多輸入多輸出(Multi-Input Multi-Output,MIMO)系統因其能有效提高系統性能和增大系統容量受到了廣泛關注[1]。且MIMO 是5G 中提高系統容量和頻譜利用率的關鍵技術。理論上,當小區基站天線數目趨于無窮大時,加性高斯白噪聲(Additive White Gaussian Noise,AWGN)和瑞利衰落等負面影響全都可以忽略不計,數據傳輸速率能得到極大提高[2]。但是在復雜的場景下,信號依然受到很多負面干擾,使得信號失真,因此使用深度學習去解決端到端的信號恢復,也成為一個新的研究方向。
近幾年人工智能技術已然成為當今社會最前沿的研究方向,其中深度學習受到了學術界和工業界的極大關注,并且在圖像識別、語音識別、自然語言處理等方面實現了實際應用[3-5]。在此背景下,近年來國內外研究學者開始就如何將人工智能技術引入到通信領域展開了初步的研究探索,在調試方式識別、信道編碼、通信信號分類等方面取得了一定的研究成果[6-9]。當前,現代無線通信系統朝著寬頻帶、大容量、遠距離、多用戶、高效率、高靈活性的智能化和綜合化方向發展。新技術問題的出現總是和人們對高性能通信系統的需求相伴隨。隨著通信場景多樣化,系統面臨著信道時變、鏈路非線性、計算處理資源受限等問題。在信道估計方面,文獻[10]中提出一種基于深度學習的時變瑞利衰落信道估計方法,通過將循環神經網絡(Recurrent Neural Network,RNN)結構與滑動窗口思想相結合,利用神經網絡建立、訓練和測試滑動雙向門控遞歸單元信道估計器,完成時變瑞利衰落信道的估計。在信道均衡方面,文獻[11]中考慮了利用深度學習實現信道均衡,提出了基于深度神經網絡(Deep Neural Network,DNN)和卷積神經網絡(Convolutional Neural Network,CNN)的均衡器,并與傳統的基于最小二乘法(Least Squares method,LS)和最小均方誤差(Minimum Mean Squared Error,MMSE)的均衡方法進行了比較,在正交頻分復用(Orthogonal Frequency-Division Multiplexing,OFDM)系統中,取得了比傳統均衡方法更好的誤碼率(Bit Error Ratio,BER)性能。在符號判決方面,文獻[12]中利用DNN 結構來替代OFDM 接收機中符號檢測模塊。未來通信場景運用的多樣化,使得信號恢復處理研究領域面臨新的問題。然而,機遇總是和挑戰相并存,在這樣的背景下,突破傳統方法的束縛,分析數據和知識的關聯性,研究復雜場景下信號恢復新方法,實現智能通信接收方法就更加值得去探索和研究。
深度學習中的多標簽分類算法常用于解決文本分類、圖像分類、生物信息分類等問題。與傳統分類不同的是,在多標簽分類問題中標簽數不確定,可以是單個標簽,可也是多個標簽,高達幾十甚至上百個。依據這一特性,本文將輸出的比特序列看作多個標簽,提出了基于多標簽分類的MIMO智能接收機。最后進行了仿真分析,驗證了其優越的性能。
本文主要工作如下:
1)提出MIMO 智能接收機模型,實現從接收到的IQ(I:in-phase 表示同相;Q:quadrature 表示正交,與I 相位差90°)信號波形中恢復出原始信息比特流的目的,替代傳統通信接收機中載波和符號同步、信道估計、均衡、解調、信道譯碼等整個信息恢復流程,盡可能減少無線信道衰落、噪聲、干擾等因素的影響。
2)提出一種基于CNN 分類的智能接收機實現方式。具體來說,本文設計了一種一維卷積(1D-Conv)-DenseNet 網絡結構,網絡中所有的卷積均為一維卷積,采用全局池化(Global pooling)得到相同維度的特征向量來提升網絡對不同輸入信號長度的適應性,在最后的分類層采用一個分類函數來代替M個二分類器來實現比特流恢復,解決信息比特數較多時采用單分類器出現的類別數目過多的問題,同時選擇Sigmoid 作為分類函數,省去對比特序列的熱編碼步驟。
在MIMO 發送信號端,將要發送的語音、文本或視頻等內容在經過處理轉換成信息比特流,然后對信息比特流進行信道編碼、調制和脈沖整形,最后經過空時編碼后由不同天線將產生的信號輻射到空中。接收機接收到信號后,采用解調、信道解碼等方法恢復信息碼流,然后對碼流進行解密、解碼,得到原始內容。傳統的通信接收算法主要針對特定的調制和編碼方式進行設計,對于發射端采用自適應編碼調制的通信系統,其接收端也往往需要知道當前信號采用的調制和編碼方式,才能選擇對應的接收算法進行信息恢復。本文以MIMO 無線通信系統為模型,其接收端的信號為:
其中:y為接收信息向量;H為瑞利衰落隨機信道矩陣;x=(x1,x2,…,xM)T為發送向量,n為高斯加性白噪聲。
研究表明,在發射機上獲得的增益通常很小,尤其是在高信噪比(Signal-to-Noise Ratio,SNR)時。然而,在多用戶情況下性能差距要大得多,并且隨著信噪比變大或發射天線數量增加,性能差距將增加而不是減小。這可能使得在發射機處獲得信道知識的潛在高成本更加合理[13]。而接收機是保證無線通信系統誤碼率性能的關鍵,其接收到的信號會受到很多不可控因素的干擾和影響,常見的因素有衰落、損耗等。由于接收機會接收到一些失真嚴重的信號,想要從這些失真嚴重的信號中恢復發送數據,MIMO 傳統方法是采取空分復用技術,它是在發射端發射相互獨立的信號[14],接收端采用干擾抑制的方法進行解碼的技術。
由于龐大的訓練數據,本文對文獻[15]中提出的智能接收機算法進行了改進(如圖1 所示),設計了小訓練樣本的多標簽分類MIMO 智能接收機模型,該模型使用深度神經網絡來代替傳統通信接收端的信息恢復過程。多標簽分類MIMO 智能接收機的輸入為接收到的無線IQ 信號,輸出為恢復后的信息比特流。這種智能接收機與傳統的通信發送端形成一種新的通信體系,其目的是在各種非理想條件下盡可能可靠地恢復信息,提高接收機對復雜場景的適應性。
設發送的信息比特流為s=(s1,s2,…,sM),其中M是比特流中的比特數,si(i=1,2,…,M)取二進制0 或1。信息比特流經過信道編碼、調制和脈沖成型。產生的信號通過MIMO方式發送,通過無線信道發送到接收端。常用方法是使用單一的多類別分類器來解決。比特流總共包含M比特,所有可能的類的數目為2M,因此可以使用具有2M類的分類器來解決這個問題。然而,隨著比特數量級增加,輸出類別的數目呈指數爆炸增長[15]。傳輸位數小時可以輕松實現,但是隨著5G 技術的高速發展,大比特流傳輸不可避免。當M很大時,需要的訓練樣本數量將遠遠大于2M。產生如此多的訓練樣本很困難,實測的數據也很難達到需求;同時訓練的計算復雜度會非常高,訓練網絡的時間將非常長且很難收斂。
本文將該問題看作是單輸入多輸出分類問題,將接收到的IQ 信號作為網絡的輸入,網絡主體采用DenseNet(Dense convolutional Network)一維卷積模型,對網絡最后將提取到的共享特征向量進行多標簽分類操作,而多標簽分類恰好是處理單輸入多輸出分類問題的一個方法。多標簽分類器模型的任務是從接收到的IQ 信號中恢復信息比特流,常規的思路是把輸出的比特序列當作是一個序列整體,而本文將輸出序列的每一個值都看作一個輸出。在多標簽分類神經網絡中,一些學習算法本身就支持多標簽分類。將神經網絡模型配置為支持多標簽分類,并且可以根據分類任務的具體情況很好地執行。只需指定問題中的目標標簽數作為輸出層中節點數,神經網絡就可以直接支持多標簽分類[16-18]。具有M個輸出標簽(類)的任務將需要一個神經網絡輸出層,該神經網絡在輸出層中具有M個節點。輸出必須使用Sigmoid 函數激活,這將預測每個標簽的概率,損失函數選擇用二進制交叉熵損失函數擬合。
因此,本文提出基于多標簽分類算法的模型,此模型采用DenseNet 深度神經網絡。在全連接層之后使用Sigmoid 分類函數輸出向量標簽,標簽向量里的每個值即對應為0 或1的概率,當概率大于0.5 時輸出標簽為1,小于0.5 時輸出標簽為0。
文獻[15]中提出共享網絡多二分類模型,如圖2 左邊所示,該模型對共享網絡提取到的特征向量進行多次二分類操作。該模型使用M個Softmax 函數并行對特征向量進行分類從而實現多二分類,恢復M位比特信號。如圖2 右邊中虛線框所示,在該模型基礎上,使用一個Sigmoid 函數來代替M個Softmax 函數,實現一次分類操作恢復比特信號。Sigmoid 和Softmax 都可以用作分類,兩者的核心區別在于函數輸出值的分布。Softmax 函數用于分類主要就是利用其在眾多輸出值的概率分布滿足輸出中只有一個值大于0.5,剩下的輸出值均小于0.5,且所有值的和為1 的概率分布。而Sigmoid 函數的不同之處在于,該函數的每一個輸出都是獨立的,每一個輸出值都服從大于0 且小于1 的概率分布。本文正是利用了這一概率分布特性,使用一個Sigmoid 函數來代替M個Softmax 函數。此做法優點如下:
1)替換后的網絡得到簡化,在參數減少的同時,訓練時間也得到了優化(文獻[15]中多二分類模型并行計算,本質上還是多個網絡,訓練時間長)。2)在數據做標簽時也省去了很多步驟,因為文獻[15]中使用M個Softmax 二分類函數,而該分類函數的輸出標簽是獨熱編碼,需要2 個位編碼。首先在對M位比特做標簽時需要將一個長度為M的序列拆分為M個單獨的比特,然后需要對這些獨立的比特進行熱編碼,因為是二分類,所以每個標簽為2位,最后還要將這些獨立打好標簽的編碼再組合。本文利用Sigmoid 激活函數輸出是一個一維長度為M的向量矩陣這一特點,正好與M位序列向量匹配,可以直接使用信號的M位比特序列作為網絡的輸出標簽,在通信系統里減少操作步驟,在實際應用中減少時延。
修改模型為M個輸出的多標簽分類器,由于恢復的比特自身數值[0,1]的屬性,則可以省去進行標簽處理的步驟,因此本文直接將輸出比特作為輸出標簽。設s=(s1,s2,…,sM),M表示標簽空間的標簽量,作為最后一層輸出。將二維的信號比特特征x輸入此多標簽分類器模型中學習,得到預測輸出y=predict(x),真實實例標簽為=sT,其中激活函數為Sigmoid 函數:
整個網絡訓練損失函數設計為二值交叉熵損失函數:
其中:yi為真實標簽;N為樣本個數=σ(xj-1),j為網絡層數,xn-1為最后一層激活函數的前一層輸入。
深度神經網絡訓練是基于訓練數據集優化網絡參數,在訓練集上取得良好的性能,同時盡量使其推廣到訓練集以外的其他數據。本文采用深度學習多標簽分類中最常用的優化方法,即自適應矩陣估計(Adaptive moment estimation,Adam)。損失函數是訓練的關鍵,對于多標簽分類問題,選擇二值交叉熵損失函數。
訓練集數據和測試集數據均用Matlab2020a 生成。訓練使用Tensorflow 在英偉達2080Ti GPU 上進行。網絡初始化時,所有參數均以高斯分布隨機初始化。訓練優化器采用Adam,訓練時,batch 大小為128,Epoch 次數為8,初始學習率為0.001。
實驗分為四個部分:
實驗一 驗證智能接收機端到端信息恢復能力,考慮兩種調制方式:二進制相移鍵控(Binary Phase Shift Keying,BPSK)調制和正交相移鍵控(Quadrature Phase Shift Keying,QPSK)調制,信道編碼采用(7,4)漢明碼,脈沖成型濾波器采用升余弦濾波器,滾降系數為0.5。對于BPSK 漢明碼方式,原始信息比特數為16,使用Matlab 隨機生成序列,經過編碼后為28 比特,分別使用BPSK 和QPSK 調制,再經正交空時分組編碼(Orthogonal Space-Time Block Coding,OSTBC)和升余弦濾波成型后發出,默認環境AWGN,本次實驗信道是服從瑞利分布的多徑衰落,設置最大多普勒頻移為1 Hz。每個訓練數據集信號Eb/N0(比特信噪比,單位dB)范圍0 dB~8 dB,步長1 dB。每個Eb/N0 的樣本數為10 萬條,共計90 萬條訓練數據。測試數據集信號Eb/N0 范圍0 dB~8 dB,每個Eb/N0的樣本數為10 萬條。
實驗二 驗證智能接收機模型對多種調制和編碼組合的信息恢復能力,考慮兩種調制方式:BPSK 調制和QPSK 調制,信道編碼采用(7,3)循環編碼和(15,5)循環編碼,由于2發射天線空時編碼偶數特性,原始信息(7,3)循環編碼比特數為24,(15,5)循環編碼比特數為20,每個訓練數據集,信號Eb/N0 范圍0 dB~8 dB,步長1 dB。每個Eb/N0 的樣本數為1 萬條,共計9 萬條訓練集。測試數據集中,信號Eb/N0 范圍0 dB~8 dB,每個Eb/N0 的樣本數為1 萬條。
實驗三 驗證MIMO 智能接收機在受到干擾信號情況下的性能。本實驗是以2×2MIMO 為基礎,考慮了兩種受干擾的情況:其一是單個發射天線上信號受到干擾信號的干擾;其二是兩個發射天線信號分別受到不同頻率的干擾信號,干擾信號的功率根據信干比(Signal-to-Interference power Ratio,SIR)在-10 dB~20 dB 確定。
信號Eb/N0 范圍仍然設置為0 dB~8 dB。干擾信號部分如圖3 所示,干擾信號的橫坐標表示為離散干擾信號的個數,與接收的IQ 信號相同。本文選擇了Eb/N0=8 dB,SIR 分別為-10 dB、15 dB 的兩張圖。從圖3 中可以看出,當SIR 很小時,干擾信號可以很明顯辨別。當SIR 很大時,干擾信號很小,難以辨別。
實驗四 為驗證其信息恢復位數的可擴展性,考慮信息恢復比特位數分別為32、64、128。均用BPSK 調制方式與瑞利信道。每個訓練數據集信號Eb/N0 范圍為0 dB~8 dB,步長1 dB。每個Eb/N0 的樣本數為1 萬條,共計9 萬條訓練集。因為恢復位數不同,做了兩次對比實驗,第一次控制測試數據集相同,每個Eb/N0 均為1 萬條數據,則總比特數依次為32 萬條、64 萬條、128 萬條;第二次測試每個Eb/N0 控制總比特數相同,則測試集數據依次為1 萬條、0.5 萬條、0.25 萬條。
實驗一比較理想信道和瑞利信道下智能接收機的性能。從圖4 可以看出,當信道中有衰落的影響時,傳統接收機的性能受到很大的影響,但對智能接收機影響并不顯著,且智能接收機的性能遠遠優于傳統接收機,這也驗證了多標簽智能接收機端到端強大的信息恢復能力。Eb/N0=7 dB時,傳統譯碼方法的誤碼率(BER)為1E-7,而本文設計的多標簽接收機在Eb/N0=6 dB時,BER 已經為0,性能更加優異。
對于實驗二,從圖5 可以看出,在采用多種調制方式和編碼方式的情況下,智能接收機仍然能夠以很高的準確率恢復原始信息,而且性能遠遠優于傳統方法,說明了多標簽智能接收機的優越性。
對于實驗三,從圖6 可以看出,相同SIR下,傳統譯碼,兩個發射數據都被干擾要比單個發射數據要嚴重。但對于智能接收機而言,性能得到極大的提升。在SIR=-5 dB,Alamouti 譯碼幾乎已經無法恢復信號,但是智能接收機依然在Eb/N0=8 dB時,BER 達到了1E-5。這也驗證了智能接收機端到端處理數據的強大能力,以及強抗干擾性能。
實驗四的結果如圖7 所示,當總比特數相同時,在實驗一和實驗二的基礎上擴展了信號恢復位數,在小比特數情況下,當Eb/N0=5 dB時,BER 已經為0,性能非常優秀,隨著信息比特位數增大,在同一個深度神經網絡下,準確率開始下降。這是由于共享網絡模型本身存在問題,共享網絡由于共享的是同一個特征向量,所以特征向量的復雜度決定了結果的準確度。文獻[15]中提出的共享網絡由于在最后一層卷積層的卷積核數量為150,這使得共享的特性輸出維度為(151,1),當151 維用于32 位和64 位輸出時,效果很好;但是隨著輸出數量越來越大,特征向量輸出的效果降低。這需要進一步對特征向量增加維度進行優化。
從表1 中可以發現,改進過的模型的訓練時間有所減少,參數量大幅下降,每個批次提升約4 min,在相同共享網絡的情況下,網絡參數減少了2 416 個。結合圖2 虛線框中的結構,文獻[15]模型的參數為151×2×16=4 832,多標簽151×16=2 416,相差值Δ=4 832-2 416=2 416,改進后的模型參數量比文獻[15]中少了151×M。

表1 不同模型的性能對比Tab.1 Performance comparison of different models
本文將多標簽分類思想應用于MIMO 接收機系統上,采用深度學習算法,解決了MIMO 整個接收端的信號恢復問題。智能接收機優化的是接收端信息恢復整體性能,能夠實現多種調制和編碼方式下的信息恢復。智能接收機只從數據中學習,不需要考慮外界干擾的影響。仿真結果表明,基于多標簽分類算法的BER 性能優于現有的研究方法,同時在模型的參數量與時間效率上均有很大的優勢。本文提出的基于多標簽分類的MIMO 智能接收機可以進一步提高接收機的性能,因此對于實際的通信系統具有實際應用價值,針對通信過程中的信號檢測、信號恢復、信號調制方式識別等通信問題提供了一種新的解決方法。下一步將在已有的智能接收機仿真研究中,研究其在真實的海洋復雜多變的惡劣環境中的應用。