黃 菲,丁月友
(重慶郵電大學 移動通信重慶市重點實驗室,重慶 400065)
LTE-A中UE專用參考信號的解調算法與實現
黃 菲,丁月友
(重慶郵電大學 移動通信重慶市重點實驗室,重慶 400065)
針對LTE-A新增的UE專用參考信號與小區參考信號映射的時頻資源不同,導致傳統的解調算法在UE專用參考信號上無法適用的問題。充分研究了UE專用參考信號時頻資源映射的特點,即端口間采用了頻分復用和碼分復用技術區分,而小區參考信號只采用了頻分復用技術,結合此特點與傳統的解調算法原理,設計了2種利用專用導頻信息的解調算法,即LS-UE算法和LMMSE-UE算法。最后,通過在EPA無線信道環境下,對2種解調算法的性能仿真,權衡實現的復雜度,選擇一種更適合LTE-A系統的下行解調算法,即LS-UE算法,并對該算法的多核DSP實現,驗證了該算法的可行性與高效性。
LTE-A;UE專用參考信號;解調算法;多核DSP實現
LTE-A系統作為LTE系統的演進,發送端使用了更多的專用天線端口傳輸數據,以提高整個系統的吞吐量和傳輸效率,這必使得接收端的解調算法十分困難,為了降低解調算法的難度,同時提高性能,LTE-A系統標準設計了幾種不同類型的參考信號[1]去處理不同的情形。特別設計了一種UE專用參考信號去支持雙碼字傳輸的解調算法。由于UE專用參考信號的時頻資源與CRS(小區參考信號)不同,不同天線上UE專用參考信號所占時頻資源采用了FDM(頻分復用)和CDM(碼分復用)技術[2]區分,而CRS只采用了FDM技術進行區分,這會導致應用于CRS上傳統的解調算法無法直接在UE專用參考信號上適用,即LS算法、LMMSE算法(最小均方誤差算法)[3]。因此,需要設計一種基于UE專用參考信號的解調算法,從而無失真地還原出發送的數據。目前已有文獻研究了基于UE參考信號的解調算法,文獻[4]主要用SFBC(空頻碼塊)的算法推導出基于UE專用參考信號的解調算法,但是此算法的性能比較差;文獻[5]提出的解調算法性能比較理想,但其復雜度較高,不適合在多核DSP中實現。綜上所述,本文的主要工作是在充分研究傳統的解調算法和以上文獻的基礎上,綜合權衡性能與復雜度,選取一種更適合LTE-A系統的解調算法,并通過多核DSP(TMS320C6670)實現。
LTE-A中UE參考信號(UERS)又叫做解調參考信號(Demodulation Reference Signal,DM-RS),DM-RS與傳輸數據一樣,都要經過預編碼和無線信道,如圖1所示,這暗含著信道估計把預編碼與無線信道作為整體估計,而不像CRS分開對待,表明LTE-A系統在下行傳輸中采用了OFDMA(正交頻分復用)技術。

圖1 DM-RS的LTE-A系統的下行鏈路傳輸處理
LTE-A增加天線端口可以提高數據傳輸量,更好地滿足現代通信高速率的要求。DM-RS的用途仍然是對PDSCH解調,映射在資源粒子的位置有一些變化。圖2給出DM-RS在8天線端口普通幀下的映射位置。圖2時域上顯示了1個子幀(1 ms),包含2個時隙(0.5 ms),每一個時隙在正常CP情況下有7個OFDM符號;而頻域上有12個子載波,1個資源塊(RB)就由頻域上的12個子載波和時域上的1個時隙組成。其中“1”資源表示端口7、8、11、13參考信號的映射位置,“2”資源表示端口9、10、12、14的參考信號的位置。

圖2 DMRS在8個端口下的映射圖
DM-RS主要在天線端口7~14,主要用于對PDSCH數據的解調。端口7~14的解調參考信號設計分為2個集合,即{7,8,11,13}和{9,10,12,14},每個集合DM-RS的映射位置相同。為保證PDSCH順利解調,在一個集合內,采用CDM使參考信號保證正交,而集合間采用的是FDM。LTE-A規定8組正交序列,在映射參考信號時,用序列的值乘以對應位置的參考信號,保證信號的正交,如表1所示。

表1 端口7~14的正交序列
八天線下的系統模型為:
(1)

對于UERS而言,由圖2可知端口7、8、11、13與端口9、10、12、14的導頻點不一樣,所以對于端口7、8、11、13而言,即導頻點“1”,此時端口9、10、12、14的輸入為0,所以系統模型式(1)變為:
(2)
如圖2所示,對同一頻帶上4個符號5、6、12、13上才有導頻值,所以式(2)化為:
(3)
由于同一頻帶上,在LTE系統中一個子幀的持續時間很小,可以近似地認為同一天線端口同一頻帶的頻率響應是平坦的,所以可得:
(4)
又令:
(5)
yk,l=[yk,5yk,6yk,12yk,13]′。
(6)
所以式(3)可化為:
(7)
(8)
2.1 LS-UE算法
此算法在傳統的LS算法[8]基礎上,加上UE專用參考信號的映射特點而來,該算法與傳統的LS算法一樣也不考慮噪聲的影響,其實現的公式如下:
(9)
由于導頻序列值是相互正交的,如式(8)所示,所以式(9)的最優值為:
(10)
現已求出了導頻位置的值,又因同一天線端口的同一導頻的頻率響應是平坦的,如式(4)所示,所以現在只需要在頻域上做插值算法即可。由于為每個用戶分配的專用資源塊是離散的,且每個資源塊上的導頻點在同一符號上的頻域上只占3個子載波,考慮到實現的復雜度問題,此處選用簡單的線性插值算法。
2.2 LMMSE-UE算法
由于LS-UE算法沒考慮噪聲的影響,這導致其性能下降,所以本節在傳統的LMMSE算法基礎上結合LS-UE算法,得到一種新的解調算法,即LMMSE-UE算法,此算法是在MMSE-UE算法的基礎上得到。MMSE-UE是一種基于MMSE準則的信道估計算法,信道傳輸函數的估計值必須滿足如下條件:
(11)
代價函數為:
(12)
(13)
(14)
MMSE-UE信道估計算法利用了信道統計特性提高了估計的準確性,在統計意義上其具有最優的性能,但是估計時要對XXH求逆,具有較高的復雜度,影響其在實際系統中的應用。因此實際應用中往往采用其簡化的形式,即LMMSE-UE算法,其利用E[(XXH)-1]代替式(14)中的(XXH)}-1。由于
(15)

(16)
RHH=E{HHH}=[rm,n],
(17)
(18)
式中,m、n代表導頻子載波的位置,τrms為歸一化時延,L為最大多徑時延,N為導頻數目。由此可見,在慢變信道情況之下,LMMSE算法能夠實現很好的性能。
2.3 性能仿真
本節的主要工作是對第2節中所提解調算法的性能仿真,仿真鏈路如圖1所示,鏈路仿真的參數如表2所示。仿真的無線信道環境采用EPA(步行環境)、EVA(車輛環境)和ETU(城市環境),最終得到上述解調算法在此信環境的性能。

表2 仿真參數
由圖3可以得出,在SNR相同的條件下,ETU信道的BER最大,EVA信道的BER次之,而EPA信道的BER最小,這是因為ETU信道的多徑時延最大,EPA信道的多徑時延最小。多徑時延越大,信號的頻率選擇性越明顯,表現在頻域為接收端接收到信號的包絡起伏越厲害,時域表現為碼間干擾越嚴重,所以到最后接收端將不能對接收到的信號進行正確解碼,導致更高的誤碼率或者誤比特率。另外還可以得出在3種信道環境下,LMMSE-UE算法都比LS-UE算法的性能優,這是由于LMMSE-UE算法考慮了噪聲的影響,但其復雜度較高,不易實現。因此,LS-UE算法更適合,能夠保持良好的性能,實現的復雜度也適中,從而使整個系統性能最優。

圖3 各信道環境下2種下行解調算法的誤比特率仿真
TMS320C6670是德州儀器公司專門為高性能無線通信領域而設計的一款高性能四核DSP,該芯片采用全新的keystone結構以及C66x增強型內核體系,同時專門為無線通信設計了眾多協處理器模塊,比如快速傅里葉變換協處理器(FFTC)和用于LTE-A數據信道編解碼的協處理器(TCP3d),可以用于通信系統比特速率處理的協處理器(BCP),每個內核的運行頻率可達1.2GHz,支持每個核38.4GMACS的定點操作與19.2GFLOPS的浮點操作。
3.1 實現原理
根據第2節可知,基于UE專用參考信號的解調算法中LS-UE算法在能夠保持良好性能的前提下,實現復雜度適中,所以本節采用多核DSP對此算法進行實現分析,其實現流程如圖4所示。

圖4 實現流程圖
由于UE專用參考信號的映射與子幀號和特殊子幀的配置有關,所以在解參考信號的資源映射前要進行子幀號和特殊子幀配置的判斷。實現時,要注意以下幾點:實現時采用C語言編程方式,而C語言不支持復數運算,需要把復數的實部和虛部分開單獨處理,即:
(a+jb)(c-jd)=(ac+bd)+j(bc-ad)。
(19)
從式(19)可以看出,完成2個復數的乘法需要做4次實數乘法和2次實數加法,由于一個實數在內存中存儲方式為一個字且前16 bit存實部后16 bit存虛部,所以還要進行移位操作取出復數的實部和虛部,取一個復數complex的實部和虛部的代碼為:
Real_part = complex>>16;
Imag_part = (complex<<16)>>16。
為了防止溢出,首先將復數相乘所得結果的實部存入int型變量Real_part中,虛部存入int型變量Imag_part中;另外由于數據的輸入是由MATLAB中的數據而來,所以輸入的實部和虛部都需要采用Q15量化。
3.2 實現性能測試與分析
從算法實現的性能測試與分析2個方面對基于UE專用參考信號的解調算法的DSP實現方案進行分析。
3.2.1 性能測試
將matlab仿真鏈路中的解調算法模塊替換為DSP解調算法實現模塊,即將Matlab中解調算法函數的輸入做Q15量化轉化為DSP數據導入DSP實現代碼的輸入,將DSP代碼運行的輸出轉化為Matlab的浮點數據作為均衡算法的輸入,鏈路其他模塊采用Matlab浮點仿真,DSP實現與MATLAB仿真結果的誤比特率性能曲線如圖5所示。仿真結果具有近似的性能,但也存在損失,這是因為在TMS320C6670中實現模塊時,定點實現比較方便,所以在浮點數轉化為定點數時對數據截位引入了誤差,但該誤差在系統允許的范圍內,驗證了該模塊實現設計的正確性。
3.2.2 性能分析
DSP的硬件資源是十分寶貴的,在實際項目開發中為了充分利用DSP硬件資源,必須充分考慮DSP的存儲資源和代碼執行效率,代碼執行效率可以通過程序執行的Cycle數,即程序模塊執行的時間來衡量。由于多天線解調算法模塊需要處理大量的數據,為了提高代碼的執行效率,必須對代碼進行優化,優化原則如下:
① 盡量避免使用取模或除法運算,在代碼實現過程中除2或4都是通過右移來實現;
② 盡量避免在循環中調用函數,有些函數有很多子模塊,表面上看都可以寫成單獨的函數,但是這些模塊都在多次甚至多層循環中,為了減少函數調用的時間消耗,并沒有將每個模塊單獨寫成子函數;
③ 慎用嵌套。通過上述優化的處理,LS-UE算法中各模塊在DSP中的執行周期如表3所示。

表3 關鍵模塊的運行周期
此處的線性插值只有頻域的插值,因為在設計LS-UE算法時,由于同一頻帶上,在LTE系統中一個子幀的持續時間很小,可以近似地認為同一天線端口同一頻帶的頻率響應是平坦的。另外由于芯片的一個子幀在1 ms內可以完成1.2×106個cycle的運算,解調算法各個模塊總的運行周期為415 392個cycle,因此能夠很好地滿足實時系統的處理。
本文主要闡述了基于LTE-A系統下的UE參考信號的下行解調算法,這些解調算法與基于小區參考信號的解調算法是不同的,這是由于UE專用參考信號映射的時頻位置與CRS不同。本文在基于小區參考信號解調算法的基礎上,介紹2種基于LTE-A系統下的UE參考信號的下行解調算法,即LS-UE算法與LMMSE-UE算法。從性能仿真可以看出,解調算法的性能都比較好,能滿足以后的應用,其中LMMSE-UE算法比LS-UE的性能好,但其復雜度較高,不易實現,因此得出,LS-UE算法更適合LTE-A系統,此算法能夠保持良好的性能,實現的復雜度也適中,從而使整個系統能最優。最后一節是對LS-UE算法的實現,在集成化開發環境CCS5.5下編程實現,運行結果驗證了該算法的可行性和高效性。
[1]NamYH,AkimotoY.EvolutionofReferenceSignalsforLTE-AdvancedSystems[J].IEEECommun.Mag,2012,20(2):132-138.
[2]ChaimanL,TaesangY,ClerckxB,etal.RecentTrendofMultiuserMIMOinLTE-Advanced[J].IEEECommunicationsMagazine,2013,51(3):127-128.
[3]KhanMNI,AlamMJ.NoiseReductionAlgorithmforLSChannelEstimationinOFDMSystem[J].ComputerandInformationTechnology,2012(12):310-315.
[4]DanW,FangtaoL,HongweiZ.SimulationofLTE-ADownlinkChannelEstimationAlgorithm[J].InstrumentationandMeasurement,SensorNetworkandAutomation,2013(6):965-967.
[5]MeidlingerM,WangQ.PerformanceEvaluationofLTEAdvancedDownlinkChannelEatimators[C]∥19thInternationalConferenceonSystems,SignalsandImageProcessing(IWSSIP),2012: 252-255.
[6]HsiehCY,LinDW,ChingwoM.LMMSE-BasedChannelEstiamtionforLTE-AdvancedMIMODownlinkEmployingUE-SpecificReferenceSignal[C]∥VehicularTechnologyConference(VTCSping),2015IEEE81st,2015:1-5.
[7]LiuK,XingK.ResearchofMMSEandLSChannelEstimationinOFDMSystems[C]∥InformationScienceandEngineering(ICISE),2010: 2308-2311.
[8]KhanMNI,AlamMJ.NoiseReductionAlgorithmforLSChannelEstimationinOFDMSystem[C]∥ComputerandInformationTechnology,Chittagong:IEEEPress,2012:310-315.
[9]WuJian-ming.CSI-RSDesignforVirtualizedAntennawhenLTEandLTE-AefficientlyCoexisting[C]∥PersonalIndoorandMobileRadioCommunications.IEEEPress,2012: 2073-2078.
[10] 3GPPTS36.211v10.1.0,3rdGenerationPartnershipProject;TechnicalSpecificationGroupRadioAccessNetwork;EvolvedUniversalTerrestrialRadioAccess(E-UTRA);PhysicalChannelsandModulation(Release10) [S],2011.
Demodulation Algorithm and Implementation of UE-specific Reference Signals for LTE-A
HUANG Fei,DING Yue-you
(Chongqing Key Lab of Mobile Communications Protocol,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)
Considering the different time-frequency resources between UE-specific reference signals and CRS in LTE-A,the traditional demodulation algorithms cannot be applied to UE-specific reference signals.The feature of time-frequency resource mapping of UE-specific reference signals is that frequency division multiplexing and code division multiplexing are used in the ports,while the CRS only uses frequency division multiplexing.Combined with the traditional principle of demodulation algorithms,the paper provides the design of two demodulation algorithms,LS-UE and LMMSE-UE.Finally,considering the performance simulation under three wireless channel environments and the complexity of implementation,LS-UE is considered as more suitable for LTE-A system,and the multi-pore DSP implementation of LS-UE verifies the feasibility and effectiveness of the algorithm.
LTE-A;UE-specific reference signal;demodulation algorithm;multi-core DSP implementation
10.3969/j.issn.1003-3114.2017.01.23
黃 菲,丁月友.LTE-A中UE專用參考信號的解調算法與實現[J].無線電通信技術,2017,43(1):94-98.
2016-10-08
重慶市教委科學技術研究項目(KJ1500428)
黃 菲(1991—),男,碩士研究生,主要研究方向:TD-LTE-A物理層算法研究和DSP軟件開發。丁月友(1992—),男,碩士研究生,主要研究方向:TD-LTE-A物理層算法研究和DSP軟件開發。
TN929
A
1003-3114(2017)01-94-5