張德民 孟莎莎 陳貝
(重慶郵電大學重慶市移動通信技術重點實驗室,重慶 400065)
LTE系統基于傳輸分集的信號檢測的DSP實現
張德民 孟莎莎 陳貝
(重慶郵電大學重慶市移動通信技術重點實驗室,重慶 400065)
信號檢測是長期演進(LTE)系統接收端的一項重要技術,對系統的性能有著較大的影響。在LTE系統中,接收端的天線同時接收來自發送端的多個天線端口的數據,因此接收端必須采用信號檢測算法還原發送端的數據。分析與研究了基于傳輸分集的信號檢測算法,并著重討論了空頻編碼法,提出了一種簡單的DSP實現方案。該方案已成功應用于TD-LTE TTCN擴展測試集儀表開發項目中。
LTE 預編碼 傳輸分集 信號檢測 DSP實現
長期演進(long term evolution,LTE)[1-3]是第三代合作伙伴計劃(the 3rd generation partnership project, 3GPP)近幾年來啟動的最大的科研項目,能夠提高頻譜利用率和數據傳輸速率的多輸入多輸出(multiple input multiple output,MIMO)[4]技術成為LTE技術的首選。LTE又稱為準4G技術,MIMO系統信號檢測算法的好壞對MIMO系統有著很大的影響,所以對MIMO系統信號檢測的研究顯得非常重要。MIMO系統接收端的信號檢測是研究TD-LTE系統終端的重點。
傳統的信號檢測算法有很多,大體上可以分為最優檢測算法、線性檢測算法、非線性檢測算法三類。
最優檢測算法是指最大似然(maximum likelihood, ML)[5]算法和最大后驗概率(maximum a posteriori, MAP)算法。其中,ML算法用于發送信號等概率的情況,而MAP算法用于發送信號非等概率的情況。
線性檢測算法包括迫零(zero forcing,ZF)算法和最小均方誤差(minimum mean square error,MMSE)算法。
非線性檢測算法主要指垂直貝爾實驗室分層空間-時間(vertical bell labs layered space time,V-BLAST)[6]算法、QR分解算法[7]、球形檢測(sphere detection,SD)算法和相關改進算法。
線性信號檢測算法忽略了信道對接收數據的干擾,將接收的數據視為一種線性合并,這樣強制進行信號檢測的后果是放大了噪聲。最優檢測算法有著最高的性能,但它也有很高的復雜度,很難在實際系統中進行應用。而傳輸分集技術可靠性相對較高,特別是采用空頻編碼(space frequency block code, SFBC)[8]時,兩路信號是相互正交的,信道的相關性弱,采用線性檢測算法足以實現信號還原。因此,本文主要對TD-LTE系統中基于傳輸分集的信號檢測算法進行了分析和研究,在保證性能的前提下極大地降低了算法的復雜度。
發射分集的主要原理是利用空間信道的弱相關性,結合時間/頻率上的選擇性,為信號的傳遞提供更多的副本,提高信號傳輸的可靠性,從而改善接收信號的信噪比。假設一個發送信號為x,沖激響應矩陣為H,同時認為接收端完全正確估計出信道沖激響應。信號x從發送端經過信道到達接收端。信號x在無線信道傳輸的過程中,由于受多徑衰落、頻率選擇性衰落、噪聲的影響,導致接收信號存在符號間干擾和載波間干擾等。為消除這些干擾、恢復出原始信號,可以在接收端進行信號檢測。傳輸分集的信號檢測有兩種情況,即兩天線口和四天線口。
1.1 兩天線端口的信號檢測
針對兩天線傳輸,采用類似Alamouti編碼方式,編碼矩陣如下:

它表示在天線0的子載波k上的傳輸符號為x1,子載波(k+1)上的傳輸符號為x2,在天線1的子載波k上的傳輸符號為,子載波(k+1)上的傳輸符號為這種編碼方式稱為空頻編碼(SFBC)。在LTE系統中,天線端口0的兩個復值符號是x(0)(i)、x(1)(i),天線端口1的復值符號是-x(1)*(i)和x(0)*(i),其實質是SFBC。因此,編碼矩陣調整為如下形式:

在傳輸分集條件下,兩天線的傳輸分集的預編碼實質是SFBC,所以接收端解預編碼的算法的原理就是解SFBC的原理。采用最大比合并方式進行信號檢測、解預編碼、解層映射。解SFBC的原理如下:SFBC假設兩個相鄰子載波k和(k+1)保持準靜態,分別采用第j根發送天線和第i根接收天線,在子載波k和(k+1)上的信道沖擊響應分別為Hij(k)、Hij(k+1),則有Hij(k)= Hij(k+1)。對于1根接收天線,在1個正交頻分復用(orthogonal frequency-division multiplexing,OFDM)符號周期內,在第k和第(k+1)個子載波上的接收信號可以寫為:


SFBC通過發送端構造的正交發射矩陣使得信道矩陣具有正交性。接收端已估計出信道沖激響應,于是利用信道矩陣的正交性,采用簡單的線性處理即最大比合并。將接收信號向量乘以HH,有HHY=HHHX+HHN,則可以得到:

如果是2根接收天線,其處理的過程與單天線是相同的。在1個OFDM周期內,2根接收天線在第k和第(k+1)子載波上接收到的信號可以寫成矩陣的形式:Y=HX+N。將其展開可以得到:

若令天線端口0在子載波k和(k+1)處發送的數據為x1(k)=x1,x1(k+1)=x2,則天線端口1在子載波k和(k+1)處發送的數據為可將上式進一步簡化為:

為了便于參數統一,將第二行和第四行取共軛可以得到:


因為相鄰子載波的沖激響應數值相等,因此式(9)可以進一步簡化為:

此時的沖激響應矩陣為正交矩陣。等式左右兩邊同時乘以HH,濾除掉噪聲后,可以得到x1、x2的估計值:

1.2 四天線端口的信號檢測
四天線發送的預編碼和兩天線的原理是一樣的。在某個時刻k和其下一個時刻(k+1),可以通過最大比合并,通過接收的兩根天線在k和(k+1)時刻的值,把發送天線端口1和天線端口3上的數據解出。同理在時刻(k+2)和時刻(k+3)的值,可以把發送天線端口2和4上的數據解出。發送天線端口1~4在時刻k~(k+4)的數據如式(13)所示。

可見對于兩根接收天線,其原理和前面介紹的兩發兩收是一樣的,所以其推理過程類似。這里不再贅述其計算過程,結果如下。


四發四收的處理情況和前面類似,利用四根接收天線在k和(k+1)時刻的值解出發送天線端口1和端口3上的值x1和x2,再利用四根接收天線在(k+2)和(k+3)時刻的值解出發送天線端口1和端口3上的值x3和x4。下面直接給出它們的計算公式。



2.1 DSP處理器
TMS320C6455[9-10]芯片屬于C64x系列,是C6000系列中性能最高的定點數字信號處理器。它主要具有如下的特點:靈活的存儲器配置;專用存取結構;高度并行CPU結構;片內集成多種外設;類似精簡指令集計算機(reduced instruction set computer,RISC)的指令集。
2.2 變量定義
TD-LTE系統下行最大支持20 MHz帶寬,大約有110個資源塊(resource block,RB)。小區ID在小區搜索時獲得,是已知參數。循環冗余前綴(cyclic prefix, CP)分為常規和擴展兩種類型,本文DSP實現基于常規CP、6個RB,且每個RB的子載波個數選取為12。
DSP實現的公共參數如表1所示。當前支持的發送端/接收端的天線數組合為1T1R、1T2R、2T1R及2T2R。

表1 輸入、輸出參數Tab.1 Input/output parameters
2.3 詳細設計流程
根據接收天線接收的數據,以及估計出的發送天線和接收天線之間的脈沖響應來檢測發送天線上的數據。首先判斷傳輸天線個數。如果是一根發送天線,再判斷接收天線個數,此時有1發1收(1T1R)和1發2收(1T2R)兩種處理方式。如果是兩根發送天線,再判斷接收天線個數,此時有2發1收(2T1R)和2發2收(2T2R)兩種情況,每種情況都分開進行處理。具體的實現流程如圖1所示。
圖1中,1、2表示發送或接收天線數目; Detecsignal11()、Detecsignal12()、Detecsignal21()、Detecsignal22()分別表示1T1R、1T2R、2T1R、2T2R的信號檢測實現函數。

圖1 信號檢測實現流程圖Fig.1 Implementation flowchart of signal detection
在DSP實現的過程中,實現的主要思想如圖2所示。

圖2 實現的主要思想Fig.2 Main ideal of the implementation
①求分子的實部和虛部、分母(沖激響應的模的平方),從分子的實部和虛部、分母中找出最大值,為后面進行歸一化做準備。
②根據最大值,對分子的實部和虛部、分母分別進行歸一化。
③調用除法,求沖激響應的模的倒數。
④分別將分子的實部和虛部與沖激響應的模的倒數相乘。
在實現過程中有以下幾點需要注意。
第一,由于對接收信號與信道沖激響應采用的量化方式不清楚,因此首先分別計算譯出接收天線1的數據和譯出接收天線2的數據以及信道沖激響應的模。然后進行歸一化,找出最大值,根據最大值確定量化方式。
在具體實現時,并沒有取其共軛,而是在進行具體操作時,按照復數的乘法的加減法進行變化。如A=a-bi,B=c+di,則有AB=(a-bi)(c+di)=ac+bd+ (ad-bc)i。
第二,每次處理是求出每根天線的兩個數據,然后把兩根天線的兩個數據進行最大比合并即解出兩個數據。在譯出每根天線的數據時需注意最后要除以各自到接收天線1/2信道沖激響應的模。在進行除法時,先求出信道沖激響應的模的倒數,然后將解出的每根天線的數據與其信道沖激響應的模的倒數相乘。在求其倒數時,如A/B,變為A(1/B)。
由于A和B采用相同的量化方式,因而分別對A和B做如下處理。A采用Q13量化,用1左移31位除以B,得到的結果采用Q18量化,用32位進行保存而不做任何處理,直接與A相乘即可。而A是用16位進行保存,兩者直接相乘的結果是48位,前16位是符號擴展位,保留低32位,然后將得到的結果取其高16位即可。
第三,每次譯出的每根天線的第二個數據是數據的共軛,最后要對其取反。
2.4 DSP實現的優化
DSP實現的語言可以是C語言,也可以是匯編語言。匯編語言的可讀性比較差,但執行效率較高。因此判斷接收天線和發送天線個數用C語言實現,而具體每種情況(1T1R,1T2R,2T1R,2T2R)采用匯編語言來實現。
編寫程序的性能除了對算法的優化和設計,還有對程序的優化。CCS3.3編譯器自帶優化等級,根據自己欲達到的優化條件,選擇合適的優化等級。-o3優化級經常被青睞,但是-o3優化級存在一個致命的缺點,即在程序編排流水不合理時,并不能很好地優化程序,甚至在組織流水時會出現錯誤。所以需要手動編排流水,手動優化程序。
在程序中,循環體可以減少大量的指令周期,因此,優化循環體時要注意以下幾點。
①在循環體中,重復計算且值相同的多項式或者因子,在循環體外計算。
②優化選擇分支,減少分支選擇跳轉費時。
③能用TI提供的內聯函數,盡量使用內聯函數,這樣可以避免壓棧出棧的時間。
④合理安排指令及所使用的功能單元,使一個指令周期內可以并行處理多條指令。
在DSP軟件實現中,通過指令并行,盡量優化程序循環體,存儲空間保存在.asm的文件中,包括變量名稱的定義與占用空間大小。所占存儲空間由程序存儲空間和數據存儲空間兩部分組成。
在開發過程中,DSP軟件實現模塊的程序占4.2 kB,變量所占的內存為1.2 kB,其和不超過6 kB,而TMS320C6455芯片具有2 MB存儲空間,完全能夠滿足信號檢測功能實現對空間的要求。各種情況執行的周期如表2所示。

表2 各種情況執行的周期Tab.2 The execution cycles of each condition
本文從理論分析出發,根據分時長期演進(TDLTE)系統特性,闡述了基于傳輸分集的信號檢測技術,分別簡述了兩天線端口和四天線端口的情況。詳細講述了兩天線端口的實現流程及其在DSP的實現方法,并在TMS320C64x芯片上加以實現。程序運行結果表明,本文提出的方案能夠滿足TD-LTE系統的需求,具有可行性和高效性等特點。
[1] 沈嘉,索士強,全海洋,等.3GPP長期演進(LTE)技術原理與系統設計[M].北京:人民郵電出版社.
[2] 3GPP TS 36.211 v9.0.0 Evolved universal terrestrial radio Access (E-UTRA)physical channels and modulation(Release 9)[S].2009-12.http://www.3gpp.org/ftp/specs/2009-09/Rel-8/36_series/.
[3] 3GPP TS 36.212 v9.0.0 Evolved universal terrestrial radio access(EUTRA)physical channels and modulation(Release 9)[S].2009-12. http://www.3gpp.org/ftp/specs/2009-09/Rel-8/36_series/.
[4] Jalden J,Ottersten B.The diversity order of the semidefinite relaxation detector[J].IEEE Transactions on Information Theory,2008,54(4): 1406-1422.
[5] Rajan G,Rajan B.Multigroup ML decodable collocated and distributed space-time block codes[J].IEEE Transactions on Information Theory, 2010,56(7):3221-3247.
[6] Ohno K,Itami M,Ikegami T.Improvement of coexisting signal detection for MB-OFDMsystem[C]//ICUWB,2012IEEEInternational Conference on,Japan:IEEE Conference Publications,2012:352-356.
[7] Chein-I C.Multiparameter receiver operating characteristic analysis for signal detection and classification[J].IEEE Journals&Magazines, 2010,10(3):423-442.
[8] Safatly L,Andrieux G,Diouris J.LTE multi-antenna techniques based on Alamouti SFBC with correlated channels[C]//SoftCOM. 2010 IEEE International Conference on,Split,Dubrovnik:IEEE Conference Publications,2010:214-218.
[9] 謝瑞雯,陳國興.TMS320C6455的硬件資源分析[J].通信技術, 2010,43(7):230-232.
[10] 田黎育,何佩琨.TMS320C6000系列DSP編程工具與指南[M].北京:清華大學出版社,2006:32-45.
DSP Implementation of Signal Detection Based on Transmit Diversity in LTE System
Signal detection is one of the significant technologies for receiving terminal in long term evolution(LTE)system,it highly influences the system performance.In LTE system,the receiving antennas at receiving end simultaneously receive the data coming from multiple transmitting antenna ports,so it is necessary to use signal detection algorithm at the receiving end to restore the data from transmitting end.The signal detection algorithm based on transmit diversity is analyzed and studied,and the space frequency block coding(SFBC)method is discussed emphatically,and the simple DSP implementing scheme is proposed.The scheme has been successfully applied in development of the TD-LTE TTCN extended test suite instrumentation.
Long term evolution(LTE) Pre-coding Transmit diversity Signal detection DSP realization
TN929+.5
A
國家科技重大專項基金資助項目(編號:2012ZX03001024);
重慶市科委重點實驗室專項經費。
修改稿收到日期:2014-01-06。
張德民(1955-),男,1988年畢業于北京郵電大學信號、電路與系統專業,獲碩士學位,教授;主要從事信號處理及在通信系統中的應用。