魯 豪
(重慶郵電大學 通信與信息工程學院,重慶 400065)
TMS320TCI6618中FFTC協處理器在LTE中的應用
魯 豪
(重慶郵電大學 通信與信息工程學院,重慶 400065)
采用DSP進行數字基帶處理的基站以及軟件無線電面臨著嚴峻的考驗,鑒于此,德州儀器公司(TI)推出了TMS320TCI6618 DSP,其中快速傅里葉變換協處理器(FFTC)將大幅度提升基帶處理的性能。FFTC是一個可編程的加速器,專門針對LTE系統中的FFT與IFFT變換,本文詳細介紹了其在LTE系統中的應用和DSP多核并行化處理,最后根據實測數據對FFTC協處理器的性能進行了評估。
TMS320TCI6618;FFTC;DSP;LET;并行化
隨著通信標準的不斷演進,LTE/LTE-A[1]標準已經成功商用,LTE/LTE-A通信系統在大幅度提升基帶傳輸速率的同時,也給底層硬件的處理性能帶來了挑戰,對于一些采用DSP進行基帶處理的軟基站、小型基站和軟件無線電[2],DSP的處理性能將成為制約系統的一個重要因素,鑒于此,著名的DSP制造廠商德州儀器公司(TI)推出了一款TMS320TCI6618多核DSP[3]。該DSP共有4個核心,支撐浮點和定點的運算,最高主頻為1.2 GHz。此外TI公司根據不同的通信系統設計了滿足各個通信設備需求的相關協處理器,如A bit rate coprocessor(BCP)、The Turbo-Decoder Coprocessor 3(TCP3d)、The Turbo-Encoder Coprocessor 3(TCP3e)、The fast Fourier transform coprocessor(FFTC)等。本文設計的就是FFTC在LTE系統中的應用。
快速傅里葉變換協處理器(FFTC)[4]用以輔助DSP完成LTE系統中OFDM與SC-FDMA符號的處理,從而提升了基帶處理數據的效率,減輕了DSP的負擔,支持任何系統的FFT與IFFT算法。本文主要研究FFTC在LTE上行發送端的SC-FDMA符號多核并行化處理[5]。由于DSP自身的實現原理,傳統上利用匯編或者C語言進行編程以實現物理層信道的處理將耗費大量的指令周期,隨著數據量的增加,處理的時延會隨之上升。特別是LTE物理層中FFT與IFFT變換復雜度很高,盡管對一些算法進行了優化,也很難通過軟件的方式達到LTE時延的要求。通過硬件處理的方式,FFTC很好地解決了性能方面的問題。FFTC處理器可以處理LTE系統中SC-FDMA符號和OFDM符號處理,其中包括去(添加)CP、頻偏、FFT和IFFT變換[6]。本文對上行和下行處理進行了闡述,介紹了FFTC處理器結構,詳細說明了FFTC在基站上行和下行中的物理層信道處理流程,分析了FFTC對基帶數據處理的性能提升。
1.1 FFTC處理器硬件架構
圖1顯示了FFTC的內部結構以及與外部的接口構成。FFTC處理器內部由各個功能模塊、FFTC數據交換機,以及與外部進行數據交換的Packet DMA模塊構成。

圖1 FFTC模塊結構圖
ConfigurationRegisters、FFT Engine、Packet DMA、FFTC Streaming Interface、FFTC Scheduler構成FFTC模塊。FFTC處理器通過FFTC Streaming Interface與Packet DMA相連,來傳輸數據到FFT Engine中進行FFT與IFFT變換,其中FFTC Engine配置包含了循環前綴的添加與去除、輸入輸出比例因子等寄存器。FFTC Engine通過頻分與混合基快速算法實現FFT與IFFT的快速變換。FFTC的配置在后面會作詳細介紹。FFTC可以與內核、AIF、多核導航相連,可以接收來自它們傳輸過來的數據包,根據解析出的描述符得到FFTC的數據。
1.2 FFTC 配置
FFTC的配置主要分為FFTC Register的配置和Packet DMA的TX與RX流的配置。其中FFTC Register的配置主要是對FFTC Engine的配置,Packet DMA的配置主要是對其中TX與RX隊列的配置,決定了數據在FFTC中的傳輸。FFTC的配置流程如圖2所示。

圖2 FFTC的配置流程
FFTC Engine的主要配置包括數據scaling寄存器的配置,比例因子可以采用兩種方式,一種是動態配置(1)和靜態配置(0),如果采用動態配置,FFTC加速器會自動在做FFT變換時檢測是否溢出,會每級右移防止數據溢出,最后需要手動調整輸出數據的比例因子來進行放大。靜態配置需要手動設計每級(總共7級,根據點數和級數的對照表來配置)比例因子來對數據進行放大和縮小,保證數據的可靠性和準確性。隊列循環前綴寄存器配置主要是循環前綴的添加與刪除。隊列控制寄存器主要包括用來進行數據補零后的FFT計算。LTE頻移寄存器用來針對頻域與時域將FFT的DC分量移到頻譜中心。在配置Packet DMA時,可以利用TI公司提供的一些API函數,對于TX隊列與RX隊列,需要根據FFTC寄存器的參數來配置。FFTC主要寄存器配置參數功能說明如表1所列。

表1 FFTC主要寄存器配置參數功能說明
FFTC可以處理LTE系統中基站的下行發送信道與上行接收信道,主要用來處理FFT與IFFT,下面以OFDM與SC-FDMA符號為例,來介紹FFTC在LTE基帶中的應用。

圖3 下行OFDM的處理流程
下行OFDM的處理流程如圖3所示,接收端的SC-FDMA處理流程如圖4所示。

圖5 OFDM主從核并行設計處理

圖4 接收端的SC-FDMA處理流程
FFTC在OFDM符號與SC-FDMA符號中的運用主要是FFT與IFFT變換的應用,下面以2 048點FFT與IFFT為例來講解FFTC在LTE系統基帶處理中的應用。OFDM與SC-FDMA符號中的CP的添加都可以在配置FFTC時進行處理,考慮到TMS320TCI6618有3個FFTC加速器,所以在DSP中能夠同時處理多核符號的FFT與IFFT,其中多核并行采用IPC消息隊列方案實現DSP內核間通信是基于內存共享的傳輸方式,每個DSP內核查詢自己的MessageQ,從而獲取通知消息達到多核并行,本工程案例均使用IPC進行多核并行。多核并行中采用主從核方式進行符號級并行計算,以14符號為例,其中核0為調度核,核1與核2為主要計算核,考慮到負載均衡和資源的分配,將14符號分為核0做4個符號計算,核1與核2每個核做5個符號計算。OFDM主從核并行設計處理如圖5所示。
為校驗FFTC的性能,本工程都是與傳統的C代碼和匯編代碼進行性能比對,對于數據的可靠性均采用MATLAB計算NMSE在-70 db以上。下面以2 048點FFT與1200點IDFT為例,對FFTC工程進行可靠性與運算速度的評估。2 048點FFT與MATLAB數據校驗圖如圖6所示,1200點IDFT與MATLAB數據校驗圖如圖7所示。

圖6 2048點FFT與MATLAB數據校驗圖

圖7 1200點IDFT與MATLAB數據校驗圖
本文對FFTC 128、256、512、1 024、2 048點FFT與1200、900點IDFT數據進行了MATLAB仿真結果分析,并將加速器的處理時間與TI提供的庫函數與手寫線性匯編(1200與900點IDFT)性能在CCS仿真平臺作對比,發現提高明顯,性能如表2所列。

表2 FFT與IFFT的現行匯編與FFTC性能對比表(效率:um)
由上表可知,當點數較小時,才有匯編的效率比FFTC加速器效率要高,當進行2 048大點數FFT與下行1200與900點IDFT時,FFTC加速器有明顯優勢,其性能明顯高于匯編代碼??紤]到DSP實現LTE基帶處理的性能要求,FFTC在沒有消耗CPU的情況下,明顯提高了FFT與IFFT效率(其中2 048點FFT主要是下行20M帶寬發送鏈路,1200點IDFT主要是上行20M帶寬接收鏈路)。

[1] 林輝,焦慧穎.LTE-Advanced關鍵技術詳解[M].北京:人民郵電出版社,2012.
[2] 賈欣,許希斌.軟件無線電原理與技術[M].北京:人民郵電出版社,2010.
[3] Texas Instruments.TMS320C6618 Multicore Fixed and Floating-Point System-on-Chip,2012.
[4] Texas Instruments.TMS320C6618 KeyStone Architecture Fast Fourier Transform Coprocessor (FFTC) User Guide,2012.
[5] 周佩.基于多核DSP并行調度機制的實現[D].北京:中國科學院光電技術研究所,2012.
[6] 王萌,習勇.基于多核DSP的寬帶OFDM波形的并行設計與實現[J].信息化研究,2015,41(3):32-34.
FFTC from TMS320TCI6618 Application on LTE
Lu Hao
(School of Information and Communication Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)
Base stations and SDR with DSP processing baseband data are facing serious challenges.Texas Instrument has then brought up a product TMS320TCI6618 DSP.The fast Fourier transform coprocessor (FFTC) in this DSP can enhance enormously the performance of base station in baseband data processing.FFTC is a programmable peripheral,which supports FDD/TDD-LTE.The architecture and configuration of FFTC are introduced,and further,the application of FFTC in LTE system is introduced also.At the end of this article,a performance analysis is provided according to the tested data real-timely.
TMS320TCI6618;FFTC;DSP;LTE;parallelization
TN914.3
A
?士然
2016-11-08)