喻赟 張靜



摘??要:?可重構智慧表面(RIS)輔助多天線毫米波無線通信系統的級聯信道有直傳和反射兩條鏈路,系統維數大且復雜,獲取信道狀態信息(CSI)困難. 針對RIS輔助下的大規模多輸入多輸出(MIMO)通信系統應用場景,提出了基于通道注意力機制的SE-ResNetV2網絡來獲取CSI,在殘差網絡(ResNet)中引入了通道注意力模塊,通過擠壓和激勵策略來提高噪聲特征的捕捉能力. 仿真結果表明,相比于最小二乘(LS)估計算法和常規的注意力機制深度ResNet,所提出的深度學習網絡具有更好的去噪效果和估計精度.
關鍵詞:?可重構智慧表面(RIS);?多輸入多輸出(MIMO);?信道估計;?深度殘差網絡(ResNet);?注意力機制
中圖分類號:?TN 929.5 ???文獻標志碼:?A ???文章編號:?1000-5137(2024)02-0228-08
Channel estimation for RIS assisted MIMO cascaded channels via attention mechanism
YU Yun,?ZHANG Jing*
(College of Information,?Mechanical and Electronic Engineering,?Shanghai Normal University,?Shanghai 201418,?China)
Abstract:?The cascaded channel of the reconfigurable intelligent surface (RIS)?assisted multi-antenna millimeter-wave communication system had two links,?the direct one and reflection one. The channel dimension was large and received noise feature was unpredictable which was a great challenge to obtain the channel state information (CSI)?for application scenarios for massive multiple input multiple output (MIMO)?communication system. An SE-ResNetV2 network based on channel attention mechanism was proposed to obtain CSI. SE-Net modules was introduced into the residual network (ResNet)?to capture noise features through squeezing and excitation strategies. The simulation results showed that,?the proposed deep learning network had better denoising effect and estimation accuracy compared to the least squares(LS)?estimation algorithm and the conventional attention-mechanism deep ResNet.
Key words:?reconfigurable intelligent surface (RIS);?multiple input multiple output (MIMO);?channel estimation;?deep residual network (ResNet);?attention mechanism
可重構智慧表面(RIS)是一種可調控入射波相移的超材料,由多個無源反射元件組成,在無線通信領域中,可被視為大規模多輸入多輸出(MIMO)的擴展,受到學術界和工業界的廣泛關注[1],在無人機通信[2]、提高能量效率[3]和重定向信號反射[4]等領域具有廣泛應用. 然而,由于RIS只能被動地反射信號,無信號處理能力,在接收端獲取級聯信道狀態信息(CSI)的復雜度通常很高,無法直接獲得從用戶設備(UE)到RIS以及從RIS到基站(BS)的CSI.
為了在有限的導頻開銷下有效地估計RIS輔助級聯信道,在直傳鏈路被遮擋,僅有輔助鏈路時,利用RIS的可變相移和三線性平行因子分解,可運用交替最小二乘(LS)估計或改進方法獲取CSI[5]. 為了提高獲取CSI的能力,KUNDU等[6]提出了近似線性最小均方誤差信道估計器,以增強通道估計(CE)性能,但并未降低復雜度和導頻開銷. 為了減少導頻開銷,YANG等[7]和YOU等[8]將相鄰單元格分組,每組使用相同的反射系數,但這會降低CE精度. 因此,需要將分組后的信道估計矩陣恢復為完整的信道矩陣,以提高通信性能.
深度學習憑借著計算機算力的進步,為通信領域的研究提供了新思路. SOLTANI[9]和ZHANG等[10]提出了基于深度學習的信道估計方法,通過學習信道中導頻和數據點的頻域相關性,還原CSI. LIAO等[11]在多輸入多輸出-正交頻分復用(MIMO-OFDM)信道估計中使用了深度學習網絡. WANG[12]等利用深度學習的自編碼網絡對CSI進行壓縮和發送,在接收端解壓和恢復. BAEK等[13]將深度學習用于解決信號檢測等問題. 利用卷積神經網絡(CNN)在圖像處理領域展現出的強大特征提取能力,將線性LS信道估計的結果比擬為含有噪聲的圖像,利用CNN網絡能夠較好地改善RIS輔助系統的信道估計結果.
本文作者針對RIS輔助大規模MIMO系統,提出了一種基于通道注意力機制的SE-ResNetV2網絡,用于進行信道估計. 由于該系統的信道估計需要大量的導頻開銷,所產生的數據特征也較為復雜. 基于通道注意力機制的SE-ResNetV2網絡能較好地捕捉噪聲特征,豐富了神經網絡對噪聲特征的關注度. ResNetV2作為經典的殘差網絡(ResNet)能夠解決梯度消失或梯度爆炸等問題. 將ResNetV2網絡模塊與SENet網絡模塊聯合運用后,可使得信道估計的精度更高.
1 ?傳輸模型
考慮一個RIS輔助的大規模毫米波MIMO傳輸系統的上行鏈路,如圖1所示,它由用戶-基站的直傳鏈路和用戶-反射面-基站的反射鏈路組成. 接收信號為兩條鏈路信號的疊加信號. 假設基站端配備了R根天線,用戶端配備了M根天線,RIS反射單元的個數為N,每個反射元件都具有互相獨立的反射系數
,其中,
和
分別是第
個反射元件的幅度衰減因子和可控相移,通常
為
的離散值.
再假設RIS 級聯信道為準靜態平坦衰落信道,系統采用時分雙工的通信模式. 基站到用戶的信道可以表示為:
, (1)
其中,
表示基站到用戶的直傳鏈路;
表示RIS到用戶的鏈路;
表示基站到RIS的鏈路;
表示RIS反射單元的反射系數矩陣.
基站接收到的信號為:
, (2)
其中,
表示用戶向基站發送的導頻向量;
是基站的接收信號;
是導頻符號的平均功率;
是在基站端的加性高斯白噪聲(AWGN)向量,
是基站的平均噪聲功率
維單位矩陣.
為了減小多天線之間的干擾和碼間干擾,把導頻時隙分成
組,
,相同的導頻向量在每個組持續時間為
個時隙,
,采用離散傅里葉變換(DFT)矩陣
作為導頻圖案,用戶的
根天線在
個時隙分別用
的前
列作為導頻,并且使不同組的導頻向量之間相互正交. 再設RIS反射單元的反射系數:
,那么針對第
個導頻向量,基站端在
個時隙的接收信號可以表示為:
(3)
其中,
, (4)
(5)
, (6)
, (7)
其中,
包括了用戶的
個天線與基站所形成的
個直傳鏈路和
個反射鏈路的信道復衰落;
包括了RIS反射單元的反射系數和用戶處發射的導頻的共同影響;符號
表示Kronecker積;IT表示
維單位矩陣積;
表示噪聲向量.
根據式(3)~(7),得出
的LS估計值
, (8)
其中,
,
,
. 從式(8)可以得出,LS估計得到的信道包括了噪聲數據.
2 ?采用通道注意力機制的深度殘差神經網絡
SE-ResNetV2網絡的具體模型如圖2所示,由卷積層和SE-ResNetV2模塊組成. 其中,SE-ResNetV2模塊由SE-Net模塊和ResNetV2組成,在每個殘差模塊后方連接了一個SE-Net模塊.
2.1 深度ResNet模型
隨著神經網絡層數的增加,常規卷積神經網絡會導致部分淺層特征信息丟失,引發梯度爆炸和消失等問題. 在實際應用中,深層模型在訓練和測試達到飽和狀態后,性能會下降明顯,產生模型退化問題. 深度殘差學習框架通過預先訓練淺層模型,并增加卷積層恒等映射,解決了深層模型的退化問題.
殘差單元的結構如圖3所示. 殘差
經過兩個網絡層的映射,得到殘差
. 在進入第二層激活函數單元之前,需要將殘差
與最初的殘差
相加,即:
. (9)
如果神經網絡包含
個殘差塊,且激活函數與跳躍連接均為直接映射,那么整個ResNet的輸出可表示為:
. (10)
通常使用梯度下降法更新網絡參數. 在鏈式法則的導數計算下,損失函數
對輸入數據的導數可以表示為:
(11)
在式(11)中,存在梯度為1的常數,可避免梯度消失問題,通過累加,緩解了梯度爆炸. 系數
用來傳遞深層梯度至淺層. 當網絡層數增加時會出現退化等問題,為此將ResNet的初始參數設置為
,這樣調整比設置
更加容易.
ResNet需要依據實際提取特征的復雜程度,改變自己的網絡層次和深度,能夠在參數較少的情況下,得到更好的訓練效果. 采用多個卷積層、批量歸一化(BN)層和ReLU激活函數構成網絡結構,BN層可以讓每層的輸入服從標準正態分布,能有效提升網絡的效率和準確率. 在增加網絡層數時,會不可避免地改變特征圖的屬性. 當使用大小為1×1、步長為2 的卷積核進行采樣時,能夠得到ResNetV1網絡,該網絡能保證相同的輸入和輸出維度. 在此基礎上,依靠大量算法試驗后,可得到ResNetV2神經網絡,如圖4所示.
2.2 通道注意力機制模塊
SE-Net模塊是通道注意力機制模塊,如圖5所示. 通過網絡結構對通道上的相互依賴關系進行建模,捕捉通道的空間相關性,以此計算出不同通道的重要性程度,提升模型對于通道之間的特征感知能力,只增加少量的計算,就可以從整體上提升模型的性能.
SE-Net模塊首先對卷積得到的特征進行擠壓操作,以此得到通道的全局特征;然后再對全局特征進行激勵操作,學習各個通道之間的相互關系,從而得到不同通道在特征提取上的權重分布;最后乘以原來的特征圖得到最終的特征. 從本質上來講,SE-Net模塊是在通道維度上做了注意力機制的操作,一方面可以讓模型更加關注信息量最大的特征通道,另一方面也抑制了某些不重要的通道特征. 在提升模型效率的同時,減少了模型的計算復雜度.
3 ?RIS輔助信道估計中的SE-ResNetV2網絡
3.1 數據預處理
由于神經網絡通常處理實值數據,而原始的復信道衰落數據是復數形式,需要將其拆分為實部和虛部,輸入神經網絡. 將式(3)改寫為:
, (12)
其中,···
和
分別表示實部和虛部. 再運用LS估計得到
的實部和虛部.
在離線訓練前,根據其輸入輸出確定數據集結構,并構建網絡架構的輸入輸出維數,分別準備數據集和網絡架構,以適應直傳鏈路和反射鏈路的需求. 在數據收集過程中,要確保所有RIS反射單元被激活,利用基站接收到的導頻信號作為輸入,同時將直傳鏈路和級聯鏈路的信道矩陣作為兩個獨立任務的標簽數據.
利用Matlab模擬生成大量的萊斯衰落隨機信道和隨機接收噪聲,通過LS估計獲得粗略的信道估計值,作為神經網絡的訓練樣本.
3.2 前向信息傳輸
輸入數據先通過3×3×64的卷積層,得到
尺寸的特征圖
. 隨后進入SE-ResNetV2模塊. 在該模塊中,先經Res-NetV2網絡傳輸,再通過SE-Net模塊. 在SE-Net模塊中,對
特征執行全局平均池化,產生
向量. 該向量再送入雙層全連接網絡.在每層中,分別經過含Cr神經元的隱層和ReLU激活層,其中,C是神經元的個數;r是一個可調參數,代表著可以設置的壓縮比例.然后經過Sigmoid函數激活層,形成
通道注意力圖. 此注意力圖乘以原特征圖,再賦予權重后,與原輸入噪聲作合并處理,最終用3×3×64卷積核輸出,以保持維度一致.
3.3 網絡運行方式
網絡運行分為離線訓練和在線訓練兩個階段,各自獨立進行,如圖6所示.
在離線訓練階段,用Matlab仿真得到足量的萊斯衰落信道參數、導頻符號以及接收信號,再采用LS估計算出含噪的信道模型參數,然后送入SE-ResNetv2中. 通過迭代優化損失函數來更新網絡參數,直至模型收斂,得到的神經網絡即為訓練成熟的模型,用于預測實驗. 在預測環節,向該模型輸入未曾出現的數據集,從而獲得所需的信道估計結果,完成整個信道估計過程的模擬和驗證.
在訓練中,優化器的選擇對模型的訓練速度至關重要. Adam自適應優化算法結構簡單,計算速度快,能在考慮梯度一階矩和二階矩估計的基礎上,自動調整更新步長,適用于大數據量的網絡. 此算法在更新收斂幅度時表現出色,能加快模型訓練速率. 因此,選擇Adam優化器進行研究.
3.4 優化損失函數
通常,在信道估計這樣的回歸擬合問題中,基于L2型和L1型范數的優化指標為比較常用的損失函數.在信道參數稀疏時可采用L1型優化指標,其梯度會在極值點發生躍變,不利于學習. L2型優化指標在信道參數非稀疏時,可放大差異并指導優化,且L2范數與歸一化均方誤差(NMSE)相關.由于時域的RIS信道模型通常為非稀疏模型,在網絡模型訓練時,采用了L2型損失函數
, (13)
其中,
表示模型估算的結果;
是真實信道模型;K是每次訓練模型所用的訓練樣本數量.
在測試階段,以NMSE評估信道估計的準確度:
. (14)
4 ?仿真和分析
討論天線數
=16的用戶,基站
為32,RIS反射元件
為128. 毫米波頻段為28 GHz和73 GHz. 路徑衰落模型包括
,
和
,其中
,為參考距離
1 m處的損耗. 路徑損耗指數設為
,
,
. 每用戶生成60 000組數據,隨機分成訓練集(70%)、測試集(15%)和驗證集(15%). 訓練集的信噪比(SNR)取值范圍為[-5,0,…,25]dB.采用Adam優化算法,批量處理大小為64,訓練周期為1 000.
采用LS算法、交替最小二乘(BALS)[5]法、注意力機制網絡(ADNet)[14]作為對比算法,論證實驗的可靠性. 仿真參數如表1所示.
圖7展示了
,
,
情況下,SE-ResNetV2算法與ADNet,LS,BALS算法在不同信噪比下NMSE性能的對比. 可以看出,SE-ResNetV2算法的性能在整個SNR范圍內明顯優于傳統算法.由此可見,隨著網絡深度增加,SE-ResNetV2網絡成功地解決了梯度消失、梯度爆炸和淺層信息丟失等問題,有效提升了估計效果.
圖8為
,
,SNR=20 dB情況下,各算法的均方誤差(MSE)隨天線個數
的變化曲線.可以看到,隨著
的擴大,系統噪聲同步上升,進而導致各算法的NMSE也呈比例增長. 盡管如此,SE-ResNetV2算法總體上仍舊勝過其他傳統算法,特別是在處理更深層網絡結構時,有效避免了梯度消失或爆炸的情況,展現出更卓越的性能.
圖9展示了在
,
以及SNR=20 dB條件下,算法性能隨著RIS反射元件數量
變化的NMSE曲線.可以觀察到,隨著RIS反射元件數量的增加,傳統算法的性能出現較大波動,這是因為增加RIS的數量會引入更多的系統噪聲和冗余信息,而傳統方法無法有效解決噪聲問題. 然而,采用深度學習方法的SE-ResNetV2算法展現出更好的性能及更平穩的表現,這表明深度學習方法對于噪聲的處理更徹底,能夠適應各種不同數量的RIS硬件系統,在實際應用中展現出更大的靈活性.
5 ?結語
針對RIS輔助通信系統的信道估計問題,為克服LS估計方法精度不足的局限,研究了基于通道注意力機制的SE-ResNet2信道估計方法,基于現有的注意力機制深度ResNet,引入通道注意力模塊,通過擠壓和激勵策略來增強噪聲特征的捕捉能力. 仿真結果表明,相比于傳統估計算法,所提出的深度學習網絡對信道估計的歸一化均方誤差性能改善明顯,性能也有較大改善.
參考文獻:
[1] JIAN M N,?ALEXANDROPOULOS G C,?BASAR E,?et al. Reconfigurable intelligent surfaces for wireless communications:?overview of hardware designs,?channel models,?and estimation techniques [J]. Intelligent and Converged Networks,?2022,3(1):1-32.
[2] FANG S,?CHEN G J,?LI Y H. Joint optimization for secure intelligent reflecting surface assisted UAV networks [J]. IEEE Wireless Communications Letters,?2021,10(2):276-280.
[3] CAO C J,?LIAN Z X,?WANG Y J,et al. A non-stationary geometry-based channel model for IRS-assisted UAV-MIMO channels [J]. IEEE Communications Letters,?2021,25(12):3760-3764.
[4] WU Q Q,?GUAN X R,?ZHANG R. Intelligent reflecting surface-aided wireless energy and information transmission:?an overview [J]. Proceeding of IEEE,?2022,110(1):50-170.
[5] WEI L,?HUANG C W,?ALEXANDROPOULOS G C,?et al. Channel estimation for RIS-empowered multi-user MISO wireless communications [J]. IEEE Transactions Communications,?2021,69(6):4144-4157.
[6] KUNDUN K,?MCKAYM R. Channel estimation for reconfigurable intelligent surface aided MISO communications:?from LMMSE to deep learning solutions[J]. IEEE Open Journal Communications Society,?2021,2:471-487.
[7] YANG F,?ZHENG BX,?ZHANG S W,et al. Intelligent reflecting surface meets OFDM:?protocol design and rate maximization [J]. IEEE Transaction Communication,?2020,68(7):4522-4535.
[8] YOU C S,?ZHENG B X,?ZHANG R.Wireless communication via double IRS:?channel estimation and passive beamforming designs [J]. IEEE Wireless Communications Letters,?2021,10(2):431-435.
[9] SOLTANI M,POURAHMADI V,?MIRZAEI A,?et al. Deep learning?based channel estimation [J]. IEEE Communications Letters,?2019,23(4):652-655.
[10] ZHANG Y H,?MU Y F,?LIU Y,?et al. Deep learning?basedbeamspace channel estimation in mmWave massive MIMO systems [J],?IEEE Wireless Communications Letters,?2020,9(12):2212-2215.
[11] LIAO Y,?HUA Y X,?CAI Y L. Deep learning based channel estimation algorithm for fast time?varying MIMO?OFDM systems [J],?IEEE Communications Letters,?2020,24(3):572-576.
[12] WANG T Q,?WEN C K,?JIN S,?et al. Deep learning?basedCSI feedback approach for time?varying massive MIMO channels [J].IEEE Wireless Communications Letters,?2019,8(2):416-419.
[13] BAEK M S,?KWAK S,?JUNG J Y,?et al. A supplementary explanation for experimental environment of “implementation methodologies of deep learning?based signal detection for conventional MIMO transmitters”?[J]. IEEE Transactions Broadcasting,?2021,67(1):356-357.
[14] TIAN CW,?XU Y F,?LI ZY,?et al. Attention-guided CNN for image denoising [J]. Neural Networks,?2020,124:117-129.
(責任編輯:包震宇,顧浩然)
DOI:?10.3969/J.ISSN.1000-5137.2024.02.013
收稿日期:?2023-12-10
作者簡介:?喻赟(2001—),?男,?碩士研究生,?主要從事RIS通信信號處理方面的研究. E-mail:?2603514476@qq.com
* 通信作者:?張靜(1971—),?女,?副教授,?主要從事通信信號處理方面的研究. E-mail:?jannety@shnu.edu.cn
引用格式:?喻赟,?張靜. 采用通道注意力機制的RIS輔助MIMO級聯信道估計?[J]. 上海師范大學學報?(自然科學版中英文),?2024,53(2):228?235.
Citation format:?YU Y,?ZHANG J. Channel estimation for RIS assisted MIMO cascaded channels via attention mechanism [J]. Journal of Shanghai Normal University (Natural Sciences),?2024,53(2):228?235.