齊月月,孫 強,2,錢盼盼,居金娟,周 暉,徐 晨
(1.南通大學 信息科學技術學院,江蘇 南通 226019;2.南通先進通信技術研究院有限公司,江蘇 南通 226019;3.南通職業大學 電子信息工程系,江蘇 南通 226007)
隨著5G通信網絡商業化[1-2],大規模多輸入多輸出(Multiple-Input Multiple-Output,MIMO)和毫米波結合傳輸帶來了巨大的能源消耗和硬件復雜度[3]。在最近開始探索的下一代(6G)通信技術[4]中,大型智能表面(Large Intelligent Surface,LIS)以其低成本、低硬件復雜度,以及易改變無線傳播環境的特性而備受學術界和工業界的關注[5-7]。LIS是一種具有電磁特性的二維表面,由大量的超材料[8]制成的無源可重構反射單元組成。這些單元通過控制相位、幅度、頻率甚至極化與入射信號進行交互[9],以提高無線通信系統的覆蓋率和速率。現有研究多集中在相移的調節方面[10-11],LIS的每個反射單元都可以通過外部編程控制,在基站端進行實時調節相位。
LIS協助無線通信時,通過調控LIS反射波束改變傳輸環境。目前工作[12-14]假設LIS與用戶和基站之間完美的級聯信道狀態信息(Channel State Information,CSI)已知時,設計LIS反射波束。但是,獲得級聯信道狀態信息是LIS系統最嚴峻的挑戰之一。關于LIS系統的信道估計,文獻[15]將最小二乘法用于估計正交頻分復用(Orthogonal Frequency Division Multiplexing,OFDM)系統中直接鏈路和反射鏈路的聯合信道會產生大量導頻訓練開銷。文獻[16]利用MIMO信道的低秩特性,提出一種基于稀疏矩陣因式分解的級聯信道估計方法,可以降低導頻訓練開銷。然而,該方法采用LIS開關變換模式會增加硬件復雜度和功耗。文獻[17]提出一種基于多層感知器神經網絡(Multi-Layer Perceptron Network,MLP)的信道估計和反射波束設計聯合優化方案,該方案既降低了訓練開銷和硬件復雜度,又提高了能量效率。但是,MLP神經網絡的隱含層的層與層之間都是全連接的,即第i層的任意一個神經元與第i+1層的任意一個神經元相連接,當LIS部署天線規模增大,神經元和層數變多,隨之而來的是梯度消失、梯度爆炸以及更高的計算復雜度問題,進而導致LIS系統性能降低。
本文提出一種基于殘差神經網絡(Residual Neural Network,ResNet)的LIS協助毫米波系統的反射波束解決方案。首先,LIS框架采用大量無源和少量有源元件混合組成,其中有源元件連接基帶的RF鏈用來估計有源元件的信道。在此基礎上,將ResNet的殘差單元進行改進,重新設置殘差單元數量和殘差單元結構。然后,通過離線學習少量有源元件信道與反射波束之間的映射關系,預測出最佳反射波束去傳輸信號。仿真分析了數據集大小、LIS天線數量、有源元件個數、信道路徑數量對ResNet神經網絡的影響,結果表明,本文采用ResNet神經網絡能更加高效、快速、準確地找出最佳反射波束,逼近最高可實現速率。


圖1 混合LIS協助毫米波系統通信模型
本文考慮具有K個子載波OFDM系統,定義hB,k,hU,k∈N×1為第k個子載波上的從基站和用戶分別到LIS的上行鏈路信道向量。根據信道互易性,下行鏈路信道向量分別定義為和符號H表示共軛轉置。從基站到LIS上行鏈路信道向量hB,k有L條路徑,每條路徑l都會產生一條時延tl、一個復系數gl、還有到達的方位角θl∈[0,2π)和仰角φl∈[0,2π)。ρB表示基站和LIS之間的路徑損耗,D、d表示信道延遲,p(t)表示在t秒時評估T間隔信號的脈沖整形函數。第k個子載波的頻域信道向量hB,k可表示為[18]
(1)
式中:a(θl,φl)∈N×1表示到達LIS方位角θl和仰角φl的陣列響應向量,同理表示hU,k。考慮到萊斯塊衰落信道模型,所以假設hB,k和hU,k在信道相干時間上保持恒定,信道相干時間取決于用戶的移動性和無線環境的動態性。然后,定義和為在第k個子載波上的從基站和用戶到M個有源元件的信道向量,稱作上行采樣信道,由用戶和基站發送上行導頻信號就可以獲取。表示為
(2)


(hU,k⊙hB,k)Hφxk+nk。
(3)

本文通過LIS布設的有源元件獲取少量的CSI去設計最佳反射波束向量φ,使得用戶端的可實現速率最大。上述LIS系統和信道模型可實現速率表示為
(4)

(5)
(6)

本文提出基于ResNet網絡去設計LIS系統反射波束向量。首先,LIS采用級聯采樣信道向量和可實現速率向量構建的數據集預先對該網絡進行離線訓練;然后,將重新估計的級聯采樣信道輸入訓練好的網絡模型在線預測最佳反射波束向量及相應的最高可實現速率。基于ResNet神經網絡的LIS系統分為訓練階段和預測階段兩個階段。
2.1.1 訓練階段
(1)采樣信道估計

(2)波束訓練
在這一步,LIS使用預先定義的反射碼本C進行窮舉波束訓練,遍歷每個反射波束向量φn(n=1,2,…,|C|),并接收來自用戶端反饋的可實現速率Rn(s),定義
在每個相干塊s的可實現速率表示為
(3)數據集構建
(4)ResNet模型訓練

2.1.2 預測階段
LIS利用訓練好的ResNet神經網絡模型直接輸入采樣信道向量來預測最佳反射波束,該段對每個信道相干塊執行以下步驟:
(1)采樣信道估計。與訓練階段的第一步相同。
(3)數據傳輸。通過ResNet神經模型預測最佳反射波束向量,然后利用其相應預測的最高可實現速率去反射傳輸數據(信號)。
使用數據集D進行訓練和預測時,為了讓學習過程更加平穩和快速收斂,需要對原數據進行預處理操作。
(1)輸入數據
輸入的采樣信道進行歸一化處理,即所有樣本除以輸入樣本中的最大值,可以表示為
(7)
這種歸一化的方法可以保留采樣信道的編碼距離信息。由于深度學習主要使用實值進行計算,為了不丟失采樣信道中虛部的值,將輸入數據實部和虛部的值分開,然后將構建成一個M×K×2三維實值輸入矩陣。
(2)目標數據
ResNet模型采用監督學習方法進行訓練,輸入數據伴隨著其目標響應。其中,目標響應是實值速率向量R(s),為了和輸入數據保持同樣的訓練效率,每個向量R(s)使用最大速率值max[R(s)]n進行歸一化,以防止網絡模型對某些強響應產生偏差。
ResNet網絡由何凱明等[19]提出,在信道估計和信道反饋方面已得到廣泛的應用[20-21],通過忽略輸入和目標之間的共同信息,集中去學習從輸入到殘差(輸入與目標之間的差異)的映射,從而降低學習難度,提高學習效率。另外,增加全等映射層來解決隨著網絡深度增加而產生的梯度消失、網絡退化等問題。本文提出的ResNet網絡模型由2個殘差單元和2層全連接層組成,如圖2所示。

圖2 ResNet的神經網絡模型
ResNet網絡結構如下:
(1)輸入層
輸入層是整個神經網絡的信息接入口,本文中每一個輸入數據都是經過預處理的三維采樣信道矩陣。
(2)殘差單元
如圖2所示,每一個殘差單元包含三層卷積核為3×3、步長為1的卷積層(Convolutional Layer,Conv)。卷積層的的特征維度分別為64、32、2,最后一層的特征維度和輸入層相同,使用按0填充,將三個卷積層的輸出尺寸設置為與輸入采樣信道相同。卷積層之后都引入批量歸一化(Batch Normalization,BN)層和激活函數層,批量歸一化層通過減少內部協變量偏移,加快網絡的收斂速度。采用帶泄露修正線性單元激活函數(Leaky Rectified Linear Unit,LeakyReLU),其中參數α設置為0.01,LeakyReLU是ReLU激活函數的變體,解決ReLU激活函數進入負區間不學習的問題。
(3)全連接層和輸出層
兩層全連接層分別有|C|/2和|C|個神經元,每一個全連接層后都有概率為0.5的Dropout函數,最后輸出層是回歸層。
ResNet網絡改進的殘差單元有兩個優點:首先,大多數ResNet網絡都包含池化層,這是一種下采樣的形式,不同于傳統方式,本文的殘差單元輸出尺寸與采樣信道矩陣大小相同,目的是細化而不是降維;其次,殘差單元中的快捷連接(Shortcut Connections,ShortCut)直接將數據傳遞到后面的層,避免了多重非線性堆積引起的梯度消失問題。圖3對比了ResNet神經網絡在不同殘差單元下的性能,其中,LIS設置為64×64(N=4 096) 根天線的均勻平面陣,信道路徑數設置為1,有源元件數目設置為8。實驗結果表明,ResNet網絡設置2個殘差單元時具有良好的性能,進一步增加殘差單元并不能顯著提高學習效果,而且增加了計算的復雜度。

圖3 殘差單元對ResNet神經網絡的影響
由于預測的最佳反射波束向量φn*具有最高可實現速率Rn*,所以選擇回歸損失函數對模型進行訓練,損失函數f(θ)表示為

(8)

本文采用Matlab2018b在具有單個GPU和64位操作系統的環境中完成仿真。通過DeepMIMO數據集來生成基于室外光線跟蹤場景“O1”的信道[23],其中,在光線跟蹤場景中,基站和用戶使用全向或準全向天線,還有3號基站為LIS。表1總結了DeepMIMO數據集參數。產生的數據集有36 200個數據點,將數據集分成兩組,即訓練集和測試集,分別占85%和15%。為了評估解決方案在毫米波場景下的性能,設置載波頻率為28 GHz,表2為ResNet和MLP神經網絡參數對比。

表1 DeepMIMO 數據集

表2 ResNet和MLP神經網絡參數
圖4對比了ResNet和MLP神經網絡在LIS部署不同天線數時的性能,LIS采用均勻平面陣,分別設置為32×32(N=1 024)和64×64(N=4 096)根天線,其中有源元件設置為8個,信道路徑數為1。由圖4可得,ResNet網絡在數據集為10 000時,已經逼近于完美CSI下最高可實現速率,而MLP需要數據集為30 000時才能實現,ResNet和MLP相應的訓練時間和預測時間如表3所示,其中,ResNet的訓練時間和預測時間都低于MLP。隨著LIS天線數量的增大,MLP網絡的可實現速率收斂速度明顯降低,而ResNet網絡只需要獲取少量的數據集進行訓練就可以準確找出最佳反射波束,快速逼近其最高可實現速率,減少了訓練開銷,提高了訓練效率。

圖4 LIS的天線數量對ResNet和MLP神經網絡的影響

表3 ResNet和MLP訓練和預測時間對比
圖5給出了有源元件數量對ResNet神經網絡和MLP神經網絡的影響,其中,LIS設置為64×64(N=4 096) 根天線的均勻平面陣,信道路徑數設置為1,有源元件數目分別設置為2、4、8。由仿真曲線可知,LIS采用相同有源元件時,ResNet神經網絡可實現速率優于MLP神經網絡,采用不同有源元件時,ResNet神經網絡只需要4個有源元件已經可以逼近完美CSI下的最高可實現速率,而MLP神經網絡需要8個有源元件才能實現。對比MLP神經網絡,ResNet神經網絡只需要更少的有源元件便可以逼近最高可實現速率,大幅度提高了LIS系統的能量效率。

圖5 有源元件對ResNet和MLP神經網絡影響
圖6給出了信道路徑對ResNet神經網絡和MLP神經網絡的影響,LIS設置為64×64(N=4 096) 根天線的均勻平面陣,其中,有源元件設置為4個,信道路徑數分別設置為1、2、5。從圖中可以看出,隨著信道路徑增加,信道變得更加豐富,ResNet神經網絡的可實現速率并沒有下降,相比MLP神經網絡表現出更強的魯棒性,適用于不同徑數的信道模型。

圖6 信道路徑對ResNet和MLP神經網絡影響
本文研究了LIS協助毫米波系統中聯合信道估計和反射波束設計問題,通過混合LIS框架中少量的有源元件估計出采樣信道向量;然后,基于ResNet神經網絡模型去學習采樣信道向量和反射波束向量的映射關系,預測最佳反射波束及其相應的最高可實現速率;最后,采用最佳反射波束傳輸數據。實驗結果表明,本文提出的ResNet神經網絡對于信道路徑增加表現出更強的魯棒性,而且只需要少量的數據集和有源元件就能快速準確找出最佳反射波束向量,逼近完美CSI的最高可實現速率,進一步降低了LIS系統的訓練開銷。