王華華, 李延山, 張志豪, 梁家敏
(重慶郵電大學通信與信息工程學院, 重慶 400065)
大規模多輸入多輸出正交頻分復用(multiple input multiple output orthogonal frequency division multiplexing, MIMO-OFDM)技術憑借其高效的頻譜效率已經成為了第5代移動通信系統中的一項關鍵技術[1]。通過在發送端和接收端使用多個天線,MIMO-OFDM系統能夠充分地利用分集與多路復用的優勢,同時極大地提升抗頻率選擇性衰落的能力。而使用大天線陣列,又可以使毫米波系統實現高波束賦形增益及接收信噪比(signal to noise ratio, SNR)。然而,由于大量的射頻鏈路被使用在天線陣列中,因此也給系統帶來了硬件成本和功率消耗高的問題。為了降低毫米波MIMO-OFDM系統的硬件成本以及功耗問題,多種方法被提出,其中在接收端使用低分辨率模數轉換器(analog-to-digital converter, ADC)的方案最為普遍[2-4]。
低分辨率ADC的引入將標準線性模型擴展為廣義線性模型,而適用于廣義線性模型下的信號檢測算法研究具有重要的理論和實際意義。目前學術界的研究方向主要有兩類,文獻[5-6]中提出的廣義近似消息傳遞信號重構(generalized approximate message passing, GAMP)算法,該算法用于從非線性的觀測信號中重構發送信號;文獻[7]中提出的廣義期望一致(generalized expectation consistent signal recovery, GEC-SR)算法,該算法是一種基于貝葉斯最優檢測器的算法,能夠完美匹配MIMO-OFDM系統。上述算法均是基于傳統的集中式處理結構,具有較高的矩陣運算復雜度。另一類則是基于分布式處理結構的算法,文獻[8-10]中提出了分布式期望傳播(expectation propagation, EP)算法,但只考慮了在標準線性模型中的應用,并不能直接擴展到廣義線性模型。考慮到EP算法在標準線性模型中良好的檢測性能,本文嘗試將EP算法應用到分布式的廣義線性系統模型。
本文考慮了EP算法在帶有低分辨率ADC的寬帶系統中的應用問題,將接收端的天線均分為多個天線數量相等的子陣列,在每個子陣列中獨立、迭代地執行消息更新規則,再由一個集中處理模塊對所有子陣列的處理結果進行匯總計算,直至滿足預設的迭代結束條件。基于此,提出了一種基于分布式EP算法(decentralized EP algorithm, de-EPA)的信號檢測方案,與原始EP算法比較,分布式算法能夠有效地降低矩陣運算的復雜度并維持檢測性能。本文首先對分布式廣義線性系統模型進行了詳細的描述,并將系統模型與因子圖表示的方式聯系起來,然后對EP算法的理論與消息更新方式進行了概述,提出了適用于分布式廣義線性模型下的EP檢測方案,并對算法進行了推導,最終通過復雜度分析與仿真結果表明了所提算法在計算復雜度、誤比特率(bit error ratio, BER)性能方面良好的表現。
考慮一個上行量化MIMO-OFDM分布式系統,該系統由Nt個單天線用戶和Nr根接收天線組成,且每根接收天線均配備有一個低分辨率復值量化器。同時,假設OFDM系統具有Nc個正交子載波。為了降低數據處理的復雜度,在接收端將天線陣列分解為C個獨立的子陣列,每個子陣列表示為一個局部檢測模塊,各子陣列之間的檢測過程獨立進行,然后再由一個集中處理模塊對每個局部檢測模塊的處理結果進行融合處理,再反饋給每個局部模塊。模型圖如圖1所示,其中包含快速傅里葉逆變換(inverse fast Fourier transform, IFFT)和無線射頻(radio frequency, RF)。

圖1 上行量化MIMO-OFDM分布式系統模型Fig.1 Uplink quantized MIMO-OFDM decentralized system model
用xi=[xi,1,xi,2,…,xi,Nc]T∈XNc×1表示第i個單天線用戶待發送的頻域信號,X 表示采用不同調制方式時對應的星座符號點集。每個天線對之間存在帶有L個抽頭的延遲多徑信道,例如,在第nt∈{1,2,…,Nt}根發送天線與第nr∈{1,2,…,Nr}根接收天線之間,信道表示為hnrnt∈CL×1,通過循環卷積技術,天線對之間的等效信道卷積矩陣表示為Hnrnt∈CNc×Nc。經過逆傅里葉變換,頻域信號被轉換為時域信號,時域信號在添加循環前綴之后通過天線對之間的多徑信道傳輸到達接收端。
在接收端,每根接收天線上的未量化信號表示為
(1)

(2)
式中:Qc(·)表示對實部和虛部逐元素映射的復值量化器,量化的具體規則可見文獻[11]。利用傅里葉變換矩陣將信道卷積矩陣Hnrnt對角化,對角矩陣中的每個元素為信道的頻域沖擊響應,即Λnrnt=FHnrntFH。
基于上述關系式,式(2)可表示為
(3)
通過堆疊所有接收天線上的量化信號,可以得到:
q=Qc(Ax+n)
(4)
式(4)中整體的信道矩陣表示為
(5)
式(4)中發送信號和量化信號表示為
q=[q1,q2,…,qNr]T∈CNrNc×1
(6)
x=[x1,x2,…,xNt]T∈CNcNt×1
(7)
為了便于表述和計算,令M=NcNr和N=NcNt,因此q、x和A的維度又可以分別表示為M×1、N×1和M×N。在大規模MIMO系統中,例如M×N=4 000×1 000時,傳統的信號檢測方案往往涉及到復數矩陣求逆,導致計算量非常龐大。為了提高檢測算法的效率和性能,分布式的系統模型應運而生。
將基站端的接收端天線陣列劃分為天線數量相等的C個子陣列,每個子陣列包含Nr/C根接收天線,對于第c∈C={1,2,…,C}個子陣列,式(4)可被寫為
yc=Qc(Acx+nc)
(8)
定義中間變量zc=Acx和Mc=NrNc/C便于后續計算。
在式(8)中,Ac由A的Mc行組成,且:
(9)
從式(8)可以看出,如果有一種檢測算法能夠使得某個子陣列獨立于其他子陣列完成信號檢測,那么基于分布式系統的計算復雜度將大大減小,文獻[10]中的EP算法提供了一種可行的思路。
EP算法在因子圖[12]的基礎上,通過投影的方式將復雜分布p(x)(常常是待求解的)投影到某個指數分布集Φ上的簡單分布q(x),來計算復雜分布p(x)的近似后驗概率。由于高斯分布具有乘、除易于計算的特點,因此將復雜分布投影到高斯分布集上是EP的關鍵點,即q(x)服從高斯分布[13]。投影的具體方式下所示:

(10)
式中:KL(·)表示KL (kullback-leibler)散度。
基于貝葉斯推理的框架,首先利用觀測信號y、信道矩陣A和發送信號的先驗分布p(x)來計算后驗分布p(x|y),再將分布p(x|y)投影到高斯分布集上的簡單分布q(x),最后容易求得發送信號x的后驗期望值。
根據式(8)和文獻[14]中的廣義線性模型,得到發送信號x的后驗概率密度函數表示為
(11)
式中:p(x)表示信號的先驗分布;δ(·)表示一個線性模塊,p(yc|zc)表示似然函數,即:
(12)
引入中間變量zc和因子節點δ(zc-Acx),式(11)的矢量因子圖表示如圖2所示。

圖2 廣義線性模型的矢量因子圖Fig.2 Vector factor graph of generalized linear model
將圖2中第c個子陣列的矢量因子圖模型展開,得到第c個子陣列的標量因子圖模型如圖3所示。圖3中,箭頭所指表示消息在不同節點之間傳遞更新的方向。

圖3 第c個子陣列的標量因子圖Fig.3 Scalar factor graph of the cth subarray
以圖3為例,結合文獻[6],得到基于EP消息更新方式如下所示:
(13)
(14)
(15)
(16)
(17)



圖4 de-EPA算法框圖Fig.4 de-EPA algorithm block diagram
算法的詳細過程推導如下。
步驟 1初始化。將因子節點δc和p(yc|zc)的外部輸入初始化為復高斯分布,即:
(18)

期望對下式所表示的后驗分布取。
(19)
式(19)的逐分量表示方式可參見文獻[15]。模塊A的外部信息即是變量節點zc傳遞的消息。
接下來給出后續推導過程中使用到的矢量高斯相乘公式[6]:
CN(x;a,A)·CN(x;b,B)=CN(0;a-b,A+B)·CN(x;c,C)
(20)
式中:C=(A-1+B-1);c=C·(A-1a+B-1b)。式(20)表示兩個矢量高斯分布的乘積仍服從高斯分布。

(21)
步驟 3計算模塊B的后驗信息以及外部消息。模塊B表示的是一個線性空間,首先計算線性空間的逆向輸出,由式(14)和式(17),得到:
(22)

(23)
將式(23)代入到式(22)中,利用式(20),得到線性空間的后驗信息為
(24)
模塊B的外部信息即是因子節點的輸出,由式(18)和式(24),得到
(25)
利用式(20),得到:
(26)
步驟 4對x進行匯總。當觀測矢量經過模塊A和B之后,我們得到x[c]的先驗信息,在進入模塊C之前,添加限定條件x=x[1]=x[2]=…=x[C],用于構造新的復高斯分布[16],利用限定條件和x[c]的先驗信息,得到
CN(x;u1x,diag(v1x))∝
(27)
利用式(20),得到:
(28)
步驟 5計算模塊C的后驗信息和外部信息。模塊C的后驗信息即是因子節點p(x)的后驗均值估計,由式(15)有:
式中:
(29)
模塊C的外部信息即是變量節點x傳遞的消息量,由式(15)和式(29)得到:
(30)
利用式(20),有
(31)
步驟 6計算模塊B的后驗信息和外部信息。首先計算線性空間的正向輸出,由式(17)和式(31)得到
(32)
化簡方式同式(23),且
(33)
根據線性關系zc=Acx,有
(34)
模塊B的外部信息即是變量節點zc傳遞的消息,由式(16)、式(34)得到
(35)
利用式(20)得到:
(36)
根據上述詳細推導過程,de-EPA步驟如算法1所示。

算法 1 De-EPA輸入:p(x)、Ac、yc、p(yc|zc),c=1,2,…,C輸出:x^=u^1x步驟 1 初始化。因子節點δc和p(yc|zc)的外部輸入為u[c]2x、v[c]2x、u[c]1z和v[c]1z與初始迭代次數t=1。步驟 2 計算因子節點p(yc|zc)的后驗信息u^[c]1z、v^[c]1z。步驟 3 計算變量節點zc的外部消息u[c]2z、v[c]2z。步驟 4 計算線性模塊的后驗信息u^[c]2x、V^[c]2x。步驟 5 計算變量節點x[c]的外部消息u[c]1x、v[c]1x。步驟 6 融合匯總x[c],計算x的均值u1x與方差v1x。步驟 7 計算因子節點p(x)的后驗均值u^[c]1x與方差v^[c]1x。步驟 8 計算變量節點x[c]的外部消息u[c]2x與v[c]2x。步驟 9 計算線性模塊的后驗信息u^[c]2x、V^[c]2x。步驟 10 根據線性關系zc=Acx,計算變量節點zc的后驗信息u^[c]2z、V^[c]2z。步驟 11 計算變量節點zc外部消息u[c]1z、v[c]1z。步驟 12 循環步驟2~步驟11,直至t=Tmax,得到發送信號的估計值u^1x=u^[c]1x。
算法的整體復雜度主要由矩陣求逆和矩陣乘法的次數決定,本節分別用實數乘法的次數和矩陣求逆的復雜度來衡量算法整體的復雜度情況。
(A+UCV)-1=A-1-A-1U(C-1+VA-1U)-1VA-1
(37)
首先計算矩陣求逆的復雜度,根據式(37)所示的伍德伯里矩陣恒等式性質,式(24)可以被簡化為
(38)

接下來計算單次迭代過程中每個子模塊所需實數乘法的次數。算法1中,步驟2所需的實數乘法次數為16Mc;步驟3、步驟5、步驟8、步驟11為24Mc;步驟4為4(Mc+3NMc);步驟7為16M,步驟9、步驟10為4(Mc+3NMc+N)。de-EPA與傳統的集中式EP算法(EP algorithm, EPA)[17]的計算復雜度對比如表1所示。

表1 復雜度比較Table 1 Complexity comparison
從表1得知,分布式檢測方案可以極大地降低矩陣求逆的復雜度。對于多載波的大規模MIMO-OFDM系統,檢測算法整體性能往往取決于矩陣求逆運算的復雜度。

圖5是在Nr×Nt=32×4、SNR=0 dB和量化精度為3 bit的條件下,兩種分布式檢測方案(C=2、C=4)與集中式檢測方案(C=1)的均方誤差(mean square error, MSE)性能比較。仿真表明當算法收斂后,與集中式檢測方案相比,C=2時多損失約1.5 dB,而C=4時多損失約2 dB。仿真表明分布式方案能夠維持良好的檢測性能。

圖5 分布式與集中式檢測方案性能比較Fig.5 Performance comparison between decentralized and centralized detection schemes
圖6是在Nr×Nt=32×4、SNR=0 dB和C=2條件下,分布式檢測方案的MSE性能與迭代次數T的關系,量化精度分別為1 bit、2 bit和3 bit。從圖5和圖6的仿真結果來看,算法在迭代次數達到7次左右收斂。在收斂時,1 bit量化的MSE約為-14 dB,2 bit量化的MSE約為-18.3 dB,3 bit量化的MSE約為-21.8 dB。結果表明隨量化精度的提高,算法的檢測性能也顯著提升。

圖6 不同量化精度的MSE性能比較Fig.6 MSE performance comparison of different quantization accuracy
圖7是在Nr×Nt=64×8和T=10的條件下,分布式檢測方案(C=2、C=4)的BER性能與量化精度的關系。仿真表明,算法的檢測性能隨量化精度的提升而提升,且隨SNR的增加,3種量化方式之間的差距也在逐步增加。當BER=10-3時,3 bit量化與2 bit量化的SNR性能僅相差1.8 dB,而BER=10-5時,二者之間的差距擴大到4.2 dB。仿真表明,分布式算法的檢測性能在MIMO-OFDM系統中是可以接受的,同時也說明了在MIMO-OFDM系統中使用低分辨率ADC是合理且可行的。

圖7 不同量化精度和子陣列數量下的性能比較Fig.7 Performance comparison under different quantization accuracy and number of subarrays
本文研究了基于EP算法的分布式信號檢測方案。該方案在維持檢測性能的同時降低了算法復雜度,尤其是矩陣求逆運算的復雜度。當天線數量增加時,可以通過增加子陣列的數量來降低算法整體的復雜度,因此算法的適用場景可以不受天線數量的限制。同時,量化精度的增加也能夠改善算法的檢測性能,3 bit的量化精度可以滿足大多數場景的使用,為降低大規模天線陣列系統的硬件成本提供了可行性。未來的研究方向是將算法擴展到稀疏信號或稀疏信道矩陣的大規模系統。