程智超 趙 峰,2*
1(桂林電子科技大學信息與通信學院 廣西 桂林 541004) 2(玉林師范學院電子與通信工程學院 廣西 玉林 537000)
大規模多輸入多輸出(MIMO)和設備到設備(D2D)技術作為5G通信的關鍵技術[1-2],能滿足移動業務指數性增長。D2D技術使得兩個附近的設備能夠不經過基站而建立直接通信鏈路,這比傳統蜂窩通信更加有效[3]。另外,為了減輕大規模MIMO技術中導頻開銷,可以通過蜂窩系統用戶和D2D用戶復用導頻。但是,D2D用戶的加入會導致嚴重的導頻污染[4-5],因此設計合理的導頻復用方法是大規模MIMO系統中引入D2D技術需要解決的首要問題。
目前,已有很多學者對大規模MIMO系統中的D2D用戶的導頻分配進行了研究,并給出了相應的解決辦法。文獻[6]提出了基于圖著色的導頻復用方案,該方案基于蜂窩用戶和D2D用戶之間的干擾強度建立干擾圖,并基于圖著色進行順序的給D2D用戶分配導頻以減輕導頻污染,但其只考慮了一對D2D用戶和蜂窩用戶共享同一信道資源進行通信。文獻[7]提出了最小化信道估計均方誤差之和(MMSE CE-PAS),該方案減少了用戶的信道估計誤差,因此有效提升了信號干擾噪聲比(SINR),但并沒有充分考慮整體的系統容量。目前,深度學習技術已經成為解決具有大搜索空間的復雜問題有用工具。文獻[8-9]總結了深度學習在無線通信物理層應用中所面臨的機遇和挑戰,并且介紹了深度神經網絡和遞歸神經網絡在物理層的一些實際應用。在大規模MIMO系統中,文獻[10]運用深度學習方法對蜂窩用戶進行資源分配,顯著提升了系統性能,使得系統容量逼近理論上限。
受到上述文獻的啟發,本文將卷積神經網絡應于大規模MIMO-D2D異構網絡。通過卷積神經網絡導頻分配系統(CNN-PAS)對D2D用戶對進行導頻復用,其中輸入特征為基站所提供的用戶位置信息,輸出標簽為該用戶的導頻分配結果。首先通過窮舉搜索得到訓練數據集,再通過分析訓練數據集。所提出的CNN-PAS能從所產生的推斷函數中提供給定D2D用戶位置的最優導頻復用結果。通過仿真實驗評估了CNN-PAS的性能,結果表明CNN-PAS在0.92 ms的平均計算時間內以低復雜度實現了近98.78%的理論上限性能。
如圖1所示,考慮一個單小區場景下的同步大規模MIMO-D2D異構網絡系統的上行鏈路,該小區配備有一個M根天線的中心基站,服務于K個傳統單天線的蜂窩用戶與N對傳統單天線的D2D用戶(M>>K+N),它們分別使用集合C和集合D進行表示,即C={1,2,…,N}和D={1,2,…,N}。

圖1 在單小區場景中支持具有上行鏈路頻譜共享的大規模MIMO-D2D異構網絡系統
假設小區中有τ個正交的導頻(τ=K),則認為蜂窩用戶發送類似于傳統大規模MIMO系統的相互正交的導頻,τ個導頻由蜂窩用戶使用,若干D2D用戶在一個小區中復用其中一個蜂窩用戶的導頻。使用如下的導頻序列Sl=[Sl1,Sl2,…,Slτ]T表示一個用戶被分配的導頻l∈[1,K]。在訓練階段期間,基站端引入功率控制以針對蜂窩用戶和D2D發射端。基站側接收導頻信號可以表示為:
(1)


將上行鏈路建模為:

聆聽是欣賞音樂的最基本手段,學生通過對音樂作品細致聆聽,可以形成有效學習體驗。欣賞音樂時的聆聽,不是隨意的聽聽音樂,而是在教師指導下的音樂內質情感內涵的挖掘,進而幫助學生形成音樂欣賞能力。欣賞音樂的聆聽,需要學生能夠用心去聽,用心去感受,只有與音樂形成某種程度的共鳴,這樣的聆聽欣賞才會見到效果。聆聽是欣賞音樂的最基本手段,教師要對聆聽方式、聆聽感知作出對應設計,以提升學生欣賞音樂的有效性。
所有蜂窩用戶和D2D用戶發射端在發送導頻信號后,然后再發送數據信號,基站和D2D用戶接收端接收它們。為了改善信號SINR,將接收的數據信號在基站和D2D用戶接收端處分別使用最小均方誤差檢測和匹配濾波器檢測估計信道狀態。因此,蜂窩用戶和D2D用戶的SINR可以分別表示為:
(2)
(3)

由式(1)可以清楚地看出,D2D用戶復用蜂窩用戶的導頻從而產生導頻污染,導頻污染帶來的干擾不會隨著基站天線數的增加而減小。因此本文目標是降低導頻污染,最大化小區中所有用戶的總上行鏈路頻譜效率。基于此,在通道保持不變的相干間隔的長度Tc下,由式(2)-式(3)可以將目標函數表示為:
系統的具體細節如圖2所示。第一步是獲取用戶的位置信息數據,每個用戶的位置信息被發送到基站;第二步對數據進行處理,測量每個用戶在蜂窩網中的位置和信道質量;第三步是建立一個卷積神經網絡模型;第四步是對用戶進行分配導頻。

圖2 應用卷積神經網絡的處理步驟
訓練數據集操作分為三個步驟,即訓練集生成、關鍵性能指標設計和標記。首先,應該為訓練集生成訓練樣本,為了捕捉信道誤差導致的導頻干擾影響,采用基站提供的用戶位置信息作為訓練集,例如:對于單小區中,有5個蜂窩用戶和10個D2D用戶對,則向量中輸入大小為50×1。

(4)


(5)
最后,應該根據這個關鍵性能指標聲明相應的標簽,即D2D用戶的導頻復用結果,之后這些訓練集用于通過所提出的卷積神經網絡導頻復用模型。
建立的導頻分配系統模型如圖3所示,輸入處理后的數據對卷積神經網絡進行預訓練,一般的深度學習方法,如多層感知機或卷積神經網絡,輸出神經元的數量是獲得總結果組合的數量。因此對于K個蜂窩用戶和N對D2D用戶導頻分配的情況,將有(K+N)!種輸出情況,當用戶量增加時不適合部署。因為N對D2D用戶是對K個導頻進行復用,所以為每組D2D用戶對訓練一組權重,此時的輸出大小為K種。

圖3 基于卷積神經網絡的導頻復用模型
CNN-PAS卷積神經網絡結構如圖4所示,該模型的輸入是大小為n×50的向量,其中n表示小區中的所有用戶數,然后經過兩個卷積層和一個全連接層提取特征,最后為Softmax輸出層。

圖4 CNN-PAS卷積神經網
通過考慮輸出層的輸出來確定導頻復用結果,對于D2D用戶對i,輸出有K個選擇,由于Softmax層輸出最大的值即為與之復用的蜂窩用戶導頻。如圖3所示,例如,有5個蜂窩用戶和10個D2D用戶對,對于第一個D2D用戶對輸出為[0.8,0,0.1,0.05,0.05],那么表示第一個D2D用戶對與第一個蜂窩用戶復用一對導頻。
本節介紹有關算法的性能評估的詳細信息。將CNN-PAS與窮舉導頻分配(ES-PAS)、MMSE CE-PAS[7]和隨機導頻分配[12](R-PAS)進行比較。ES-PAS提供理論上限容量,但由于其較高的復雜性而在實時系統中并不實用。R-PAS盡管設計簡單,但效果并非十分理想,MMSE CE-PAS方案與隨機導頻分配相比能夠有更好的效果,因為在該導頻復用方案中,減少了用戶的信道估計誤差,從而提升了系統容量。
實驗的硬件環境為Intel Xeon E5-2675處理器、16 GB顯存和128 GB運行內存,軟件環境為Ubuntu 16.04 X64操作系統、CUDA9.0、TensorFlow 1.7和Python 3.6。
本文采用以TensorFlow作為后端的keras的機器學習工具包來實現CNN-PAS,其中用于最小化損失函數的AdamOptimizer優化器和防止過擬合的dropout深度學習技術,仿真的參數如表1所示。

表1 仿真參數

續表1
圖5為系統總的頻譜效率隨基站天線數的變化趨勢,隨著基站側天線數的增加,系統總的頻譜效率也隨之增加,且天線數較少時,增長的速率快,當隨著天線數的增加,系統總的頻譜效率趨于穩定,可知當基站天線數較大時,導頻污染成了影響系統性能的主要因素。同時還可以看出,與MMSE CE-PAS、R-PAS方案相比,所提出的CNN-PAS方案明顯改善了系統總的頻譜效率,逼近理論上限ES-PAS方案,隨機導頻分配R-PAS即便具有低復雜度且易于部署,但同樣也具有最差的性能。

圖5 系統總的頻譜效率對比圖
圖6給出了準確率和代價函數隨迭代次數的變化曲線。可以看出,在訓練集中,準確率和代價函數隨著迭代次數平穩的上升和收斂,在迭代初期,曲線急速變化,當迭代50輪左右,準確率和代價函數都趨于平穩狀態。在測試集中,準確率和代價函數隨著迭代次數的增加呈現上升和收斂趨勢,和訓練集中的趨勢基本一致,說明該模型學習到了樣本數據中的特征且具有較好的魯棒性。

圖6 準確率和代價函數曲線圖
圖7給出了CNN-PAS在不同樣本數量的準確性。可以看出,CNN-PAS方案的準確性隨著樣本大小的增加而增加,其中樣本數量為100 000時,準確率約為98.78%。樣本的數量直接影響最終的準確率。相反,MMSE CE-PAS、R-PAS方案與樣本數量大小沒有直接關系,因為這些方案并不采用學習機制,無法學習到樣本中的特征。

圖7 不同樣本數量的準確率曲線
圖8給出了使用Intel-Xeon E5-2675處理器、16 GB顯存和128 GB運行內存硬件環境下不同導頻分配方案的經過時間的性能。這里,R-PAS由于其低復雜度O(1),而具有最低的經過時間(0.21 ms)。所提出的CNN-PAS僅需要0.92 ms,復雜度為O(2×(K+N))。MMSE-CE PAS所需時間隨著迭代次數的增加而增加,MMSE-CE PAS的復雜度為O((K+N)log(K+N))。此外評估了ES-PAS所消耗的時間,即使它具有最佳的性能,在相同的情況下經過時間大約為8小時,其中復雜度為O((K+N)!),不能部署在實際系統中。因此圖8中沒有包含此評估。

圖8 不同模型所消耗的時間
本文將卷積神經網絡應用于大規模MIMO-D2D異構網絡中來解決導頻污染問題。將蜂窩用戶、D2D用戶的位置信息和導頻分配結果分別作為輸入和輸出,通過利用卷積神經網絡對大量樣本數據的學習能力,從最優的導頻分配中推斷出D2D用戶復用蜂窩用戶導頻的結果,使得D2D用戶的導頻分配結果近似最優,從而大大減輕了導頻污染的問題。所提出的CNN-PAS提供了98.78%的理論上限性能和較低復雜性。未來工作可以將概率貝葉斯多分類方法應用于我們的統計分類模型。