徐海東 王 江 易輝躍①
①(上海無線通信研究中心 上海 201899)
②(中國科學院上海微系統與信息技術研究所 上海 200050)
傳統的無線接入網絡基于專用硬件進行構建,網絡硬件設備復雜,部署和維護困難,且不利于擴展。為了解決這個問題,基于軟件定義的各種接入網技術應運而生。比較著名的有中國移動提出的基于實時云型基礎設施的無線接入網(Cloud-Radio Access Network, C-RAN)[1],C-RAN的室內基帶處理單元(Building Base band Unite, BBU)基帶池處理完全基于軟件無線電實現[2]。根據基帶運行平臺的不同,可以將軟件定義接入網絡分為基于通用處理器平臺及基于DSP平臺兩類。IBM提出的無線網絡云[3]屬于前者,中國科學院計算技術研究所提出的超級基站[4]屬于后者。近年還涌現出了很多基于通用處理器的無線接入網絡開源軟件,以4G長期演進技術 (Long-term Evolution, LTE)為例,有法國EURCOM組織的露天接口 (Open Air Interface, OAI)[5]和愛爾蘭SRS公司(Software Radio Systems limited)的srsLTE[6,7]。上海無線通信研究中心也曾經在OAI開源軟件的基礎上進行過進一步完善,實現了能夠支持數十個商用終端接入,體積只有手掌大小的LTE全功能軟基站[8]。文獻[9]將軟件定義接入網絡應用到車聯網中。
軟件定義網絡的靈活性很強,可以滿足各種客戶化的編排要求。但是軟件定義的系統也可以非常復雜,不易開發與維護,這就背離了軟件定義網絡的初衷。于是虛擬化、切片化、組件化的概念應運而生,這其中,組件化是虛擬化和切片化的基礎,是軟件定義網絡發展的必然趨勢。進入5G時代,隨著通信速率進一步提高,物理層的處理壓力陡然加大,軟件定義網絡還面臨DSP或通用處理器的計算瓶頸,也迫切需要進行組件化改造,以利于采用分布計算技術或者硬件加速技術。另一方面,由于5G需要滿足增強型移動寬帶(enhanced Mobile BroadBand, eMBB)、海量機器類通信(massive Machine Type Communications, mMTC)、超可靠及低時延通信(ultra-Reliable and Low-Latency Communications, uRLLC)等不同場景的應用需求[10],也需要對接入網進一步分割,實現端到端的網絡切片,以達到網絡的靈活彈性。
本文首先分析了無線接入網絡架構的現狀,接著分析了無線接入網絡組件化面臨的問題,并提出了一種組件化架構的無線接入網絡,此架構由有源天線單元(Active Antenna Unit, AAU)、射頻單元(Radio Unit, RU)、分布單元(Distributed Unit,DU)、集中單元(Centralized Unit, CU)、集中控制單元(Centralized Control Unit, CCU)等5種基本通信單元組成,在此基礎上可以構建易部署、可切片的軟件定義無線接入網絡。本文還實現了基于該架構的試驗原型,試驗原型的測試結果表明,這種組件化方案在提供高度靈活性的同時,還能夠顯著提升軟件定義無線電接入網(Radio Access Network,RAN)的處理能力,有效降低通用公共無線接口(Common Public Radio Interface, CPRI)[11]流量。
從4G到5G,無線接入網的基站從eNodeB的BBU和遠端射頻單元(Remote Radio Unit,RRU)兩級架構演化為gNodeB的CU, DU, AAU 3級架構[12],網元變得更小、更多了,反映了無線接入網絡組件化的發展趨勢。然而,5G接入網架構存在以下問題,不利于采用軟件無線電方法實現:
(1) 集中式的CU存在時延問題。5G的uRLLC場景,需要在1 ms的極短時間內響應,而集中式的CU傳輸路徑長,時延難以達標。
(2) DU的計算量大,且難以分割,不利于引入分布式計算或FPGA硬件加速引擎等機制。DU橫跨物理層、MAC層以及RLC層等多個協議層次,功能結構復雜而龐大,處理時延要求高,分割難度大。
(3) CPRI接口流量巨大,對承載網是非常大的負擔。類似C-RAN的集中式架構都存在這個問題。特別是在5G eMBB場景下,隨著空口帶寬和天線數量的增加,CPRI接口流量比4G LTE成倍增加。按照5G標準,空口帶寬1 GHz,天線數256情況下,CPRI接口流量將達到12800 Gbps[12]。
從以上分析不難看出,物理層的分割是接入網組件化的重點和難點所在。3GPP各方經過長期的研究和討論,在TR38.801協議文檔列舉了物理層分割的Option7.1, Option7.2和Option7.3等多種選項[12]。愛立信、華為、諾基亞等設備廠商在CPRI接口的基礎上推出了eCPRI(evolved CPRI)接口規范[13],給出了ID, IID和IU等多種物理層切割選項,由各個廠商在實現eCPRI接口的時候選擇。然而,由于物理層的復雜性,無論是3GPP還是eCPRI規范都未能形成最終的標準,各個廠商的實現不盡一致。
同樣是從改造CPRI接口的缺點出發,中國移動提出了下一代前傳接口(Next Generation Forward Interface, NGFI)方案,其思路是將切分后的傳輸流量與小區公共流量和天線端口解耦[14,15],中國移動還將NGFI方案與C-RAN架構相結合,提出了基于CU-DU的C-RAN架構[16]。在這個方案中,運營商有兩種選擇,其一是把DU與RRU放在一起,其二是把DU與CU放在一起。其缺點是,要么消耗CPRI接口流量,要么降低集中式網絡的運營優勢,兩者不能兼得。這種情況在5G中尤為明顯,巨大的CPRI接口流量導致DU必須要與RRU部署在一起。而DU計算消耗要比CU高一個數量級,云資源池如果僅能集中CU的計算消耗,那么所占的比例是很小的,C-RAN的集中性優勢將被削弱,與集中性優勢相捆綁的能耗節省、運維成本降低等好處將大為減少。
文獻[17-19]提出了在C-RAN接入網中共享基站的分布式緩存降低傳輸流量的方法,可以在一定程度上緩減傳輸壓力。但是這類方法的效果取決于緩存的命中率,與實際網絡應用場景相關性較大。
與5G接入網組件化架構演進困難重重、裹足不前情況不同的是,5G對核心網進行了全面的重構,徹底改變了過去幾代核心網以點到點的信令控制為主、各種業務緊密耦合的設備形態,變成了一種全微服務架構的、完全組件化的系統[20,21],非常值得接入網借鑒。
為了更好地適應軟件定義接入網絡切片化、虛擬容器化的趨勢,合理的組件化架構應該滿足以下要求:(1)組件的粒度應該盡量小,符合微服務的特點,便于編排和調度。(2)組件間的消息流量應該盡可能得低,減少拆分引起的額外處理消耗。(3)組件的功能應該具有獨立性,與其他組件耦合性小,便于可編程FPGA實現硬件加速并替換,也便于使用分布式處理技術進行負荷分擔。
圖1是本文的組件化接入網絡架構。該架構由CCU, CU, RU, DU和AAU等5種組件組成,其中CCU和RU是新增的組件。CCU是集中控制單元,根據功能又可以細分為移動管理CCU、負載管理CCU、干擾協調CCU、切片管理CCU等。RU是射頻處理單元,負責物理層底層的處理。CU和DU依然保留,但是功能有一些調整。CU和DU還可以分裂為多個,以支持接入網切片。圖1中物理小區的CU和DU都分裂成了3個運行在不同計算節點上的功能組件,對應3個切片,可用于5G的3種應用場景。通過將計算消耗負荷分擔到多個計算節點,軟件定義基站的整體處理能力將大大提升,更容易滿足5G的速率要求。
組件化方案將為接入網的切片化提供更為有效的途徑。目前5G網絡切片主要是核心網切片[22],接入網切片不具備差異處理能力和完善的隔離機制[23,24],各個設備廠商一般通過給予不同業務的DRB不同調度優先級的方法來實現接入網切片功能,這是3G和4G早就有的業務QoS技術,與完全隔離、高度差異化的網絡切片還有差距。組件化的切片將提供更好的隔離性,并且更容易實現不同業務切片的差異性。
從3GPP發布的TR38.801文檔可以看到,3GPP提出了Option1到Option8共8種CU和DU拆分選項,最后選擇了Option2作為5G標準[12]。按照這個方案,CU與DU在PDCP層與RLC層之間進行分割。如圖2所示,CU包括RRC和PDCP的功能,DU包括RLC,MAC以及PHY的功能。
3GPP將RLC協議實體放在DU中主要考慮的是時延因素。因為在3GPP 5G的網絡架構中,CU是一個集中式節點,對上通過NG接口與核心網(NGC)相連接,對下控制和協調多個小區。如果將RLC放在CU,那么對于低時延業務,CU與DU之間的傳輸時間就會影響時延目標的達成。
然而,采用Option2選項之后,RLC協議實體劃入DU,使得DU的實現過于復雜。按照傳統的做法,物理層一般會采用FPGA進行加速處理,然而RLC協議的加入,極大地增加了工程實現難度。
如前文所述,在本文的方案中,負載管理、切換管理、干擾協調等控制和管理功能由專門的CCU組件負責,這樣,CU不再必須是集中節點,可以與單個DU共點部署,時延就不再是問題。因此,本文的方案將CU與DU的切分點從Option2下移到Option4,也就是說將RLC協議層從DU移到CU,這樣DU的實現更為簡潔,更容易用可編程FPGA器件實現并進行組件化替換。此外,RLC協議的AM和UM模式有很好的消息包順序保證機制,可以解決CU和DU之間數據包的亂序問題。從消息流量來說,選項Option4與Option2差別不大,僅增加了RLC協議幀頭的開銷。

圖1 組件化、可切片的分布式軟基站架構
DU與RU的切分在物理層中進行,是組件化的重點和難點所在。3GPP在TR38.801文檔中討論了物理層中間拆分的可選方案Option7。對于上行業務的物理層切分,3GPP在TR38.801文檔的Option7方案中給出了Option7.1和Option7.2兩個子選項。本文另外給出了Option7.1a和Option7.3選項,作為對比分析方案進行比選。對于下行流程的切分,Option7共給出了3個子選項:Option7.1,Option7.2和Option7.3。具體切分點的位置如圖3所示。
決定RU和DU拆分方案的重要因素是RU和DU之間的交互消息流量和時延。拆分點越低,流量越大,時延要求越高。表1為以單天線、正常循環前綴的LTE FDD為例所做的各拆分方案流量分析。
表1中,除了Option8選項為RU與RRU的邊界,不作考慮之外,其他都是RU和DU切分的可選方案。
(1) RU與DU下行切分選項Option7.1, Option7.2和Option7.3的比較。
Option7.1選項位于映射模塊與iFFT模塊之間,傳輸的是去除循環前綴的頻域數據。
Option7.2位于預編碼與層映射之間,對于下行來說傳輸的為各信道調制、預編碼之后的數據,應用層滿負荷情況下流量比Option7.1略小,主要是因為下行參考信號、下行同步信號、PCFICH、PHICH、PBCH等不包括Option7.2在內,這些是在信道映射階段產生的。Option7.2接口流量的計算如式(1)

其中,第1項為PDCCH信道的流量,第2項為PDSCH信道公共信息的流量,第3項為PDSCH信道用戶流量。其中, αpdcch, αpdsch_com和αpdsch_user,i分別為各項對應的調制系數; D Lpdcch, DLpdsch_com和D分別為各項對應的調制前流量。D為用戶的調制前流量,它和用戶應用層凈流量關系如式(2)

圖2 CU和DU拆分選項

圖3 DU和RU拆分選項

表1 拆分方案流量分析,以LTE單天線、正常循環前綴為例

其中, γencode_dl_user,i為用戶i的信道編碼碼率,在LTE中是指Turbo編碼的碼率,在5G中是指LDPC編碼的碼率; DLapp,i為用戶i 的應用層流量;Cupper,i為用戶上層協議的開銷。調制系數是指調制后與調制前的位寬比。
Option7.3位于下行編碼、擾碼與調制之間,相當于eCPRI規范的ID選項,其流量為編碼、擾碼模塊處理后的比特數據,其計算公式為

對比式(1)和式(3)可知,Option7.3接口的流量比Option7.2明顯下降,是較佳的切分方案。
對于多個DU按照載頻進行切分的多切片場景,Option7.3方案也是可行的。此時,RU同時接收多個DU切片的數據,將各切片的PDSCH信道數據調制、加擾后映射到PDSCH信道對應的載頻,將各切片的DCI數據調制并綜合后映射到PDCCH信道對應的載頻。
(2) RU與DU上行切分選項Option7.1a, Option7.2和Option7.3的比較。
Option7.1a選項位于解映射與信道估計之間,相當于eCPRI規范的IU選項,是解映射模塊處理完之后傳遞給信道估計模塊的流量。在滿負荷情況下,Option7.1a選項的流量與選項Option7.1相等。在沒有滿負荷情況下,計算流量的方法如式(4)

其中,第1項U Lprach為PRACH信道流量;第2項為PUCCH信道流量,Cpucch_rs為 參考信號開銷,ULpucch為加參考信號前的流量;最后一項為PUSCH信道流量,其中 Cpusch_rs為參考信號開銷,U Lpusch為加參考信號前的流量,該流量可根據用戶應用層的流量按式(5)計算

其中, ULapp,i為用戶i應用層上行消息的凈流量,αpusch_user,i為 用戶i信道調制的調制比,γencode_ul_user,i為用戶i上行信道編碼的碼率,Culsch,i為用戶i ULSCH傳輸信道的開銷,Cupper,i為i用戶上層協議的開銷。
Option7.2選項位于信道估計與均衡之間,是信道估計模塊處理完之后傳遞給信道均衡模塊的流量。信道估計會對PUSCH信道中參考信號進行估計,并根據插值算法為每一個載頻產生一個信道估計值,作為信道均衡模塊的輸入信息。此時需要將每一個載頻的信道估計值連同未作均衡的數據一起從RU發送到DU,流量需要增加近1倍,其流量計算公式為

Option7.3選項位于調制與譯碼之間,是調制模塊處理完之后傳遞給譯碼模塊的流量。LTE的Turbo譯碼一般采用最大后驗概率(MAximum Posteriori, MAP)算法[25],或對其簡化的Max-Log-Map算法,都是軟判決譯碼算法,對軟信息寬度有要求,軟信息寬度越大,譯碼效果越好。為此,需要將調制之后的信息完整地送入Turbo譯碼器,由此可知Option7.3選項上行流量的計算公式為

比較式(4)和式(7)可知,Option7.3選項的流量相當于Option7.1a的流量除去上行參考信號開銷,流量降低并不是很明顯。5G數據信道采用LDPC編碼,常用的譯碼算法是最小和算法[26],也是一種軟判決譯碼算法,面臨的問題與LTE是一樣的。
把RU-DU切分點放在Option7.1a的一個重要好處是RU在這個點可以很容易地實施切片數據分離,RU在信道解映射的同時順便把上行數據按載頻分配給各個切片對應的DU。另外,Option7.1a把處理開銷非常大的譯碼和均衡模塊從RU分解出去,對分布式軟基站整體處理速率的提升將較為有利。
綜上,本文選擇Option7.1a作為DU和RU上行的拆分方案,選用Option7.3作為下行的拆分方案。
為了驗證組件化的無線接入網絡的可行性,本文開發了組件化的原型系統,并重點對組件化之后CU, DU, RU等組件的處理開銷和組件間流量進行了測試。組件化的基站原型以LTE軟件定義基站為基礎,將其在功能上拆分為RU, DU和CU等3個組件進行實現。圖4為本文的原型基站模塊圖。
從圖4可見,RU負責物理層底層處理,上行包括時域到頻域的變換、解映射等功能模塊,下行包括下行信道調制、信道映射和OFDM時域信號生成等功能模塊。DU負責物理層高層和MAC層協議處理,上行包括信道估計、信道均衡、解調、解擾、譯碼和MAC上行處理等功能模塊,下行包括MAC調度、MAC下行處理、PDSCH信道編碼、DCI調度信息生成、PHICH信息生成等功能模塊。CU負責高層協議處理,包括RLC, PDCP和RRC等協議處理模塊。
本實驗所用的測試機器是Z230工作站,處理器為至強E3 1226v3型號的4核CPU,內存容量為32 GB。終端與核心網同樣采用軟件定義模塊進行模擬,操作系統是Ubuntu14.04.03 LTS版本,并加載low-latency 3.19低時延內核。本文的試驗原型使用的是LTE FDD模式,空口帶寬為5 MHz。軟基站上行支持16QAM,最大速率5 Mbps,下行支持64QAM,最大速率14 Mbps。
4.2.1 組件間流量測試
圖5是上、下行數傳時CU, DU, RU 3大組件間的數據流量變化情況。圖5(a)為上行數傳1 Mbps到5 Mbps時的組件間流量,圖5(b)為下行數傳從1 Mbps到14 Mbps時的組件間流量。
從圖5(a)可知,在上行數傳時,隨著上行速率從1 Mbps上升到5 Mbps, DU~CU的流量從1.2 Mbps上升到5.9 Mbps,這個數值相當于在應用層流量的基礎上增加約20%的各協議層開銷。隨著上行傳輸速率的加大,RU~DU的流量逐步增加,在上行速率為5 Mbps時,RU~DU的流量為114 Mbps。而傳統 CPRI接口下行流量是固定的,5 MHz空口帶寬情況下,不管有沒有上行業務,流量都是固定的245.76 Mbps。這表明,通過組件化方案可以動態地控制上行流量,在沒有上行業務或上行業務量較小時流量比較少。
從圖5(b)可見,在下行數傳時,CU~DU,DU~RU的流量與應用層的數傳流量大致相當,與前面理論計算相吻合。其中,CU~DU由于處在更高的協議層次,流量比DU~RU稍小。在下行14 Mbps時,DU~RU的流量只有20.1 Mbps,相對于傳統的CPRI接口流量245.76 Mbps,壓縮了10倍以上。
從圖5(a)和圖5(b)都可以看到,RU~DU的流量即使在上行數傳速率為0時,也保持在14.7 MB,這是PUCCH信道、PRACH信道產生的與上行速率大小無關的固定流量,可以由式(4)右側的前兩項確定。

圖4 組件化的原型基站模塊圖

圖5 CU, DU和RU組件間流量測試結果
4.2.2 組件化與非組件化對比測試
表2為組件化與非組件化兩種系統的對比測試數據。從測試結果可以看到,時延相關的指標兩種方案的差異不是很明顯,而內存與CPU開銷指標差異較大。組件化方案內存和CPU的開銷有一定程度上升,這是由于組件間消息收發的處理需要額外內存和CPU處理資源。

表2 組件化與非組件化對比測試結果
4.2.3 基于組件化的C-RAN架構與基于CU-DU的C-RAN架構的比較
接入網組件化之后,具有更為靈活多樣的組網實施方式,將其與C-RAN架構相結合便是可行的實施方案之一,這將為運營商提高更為豐富的組網選擇。表3是當下行速率為10 Mbps時組件化的C-RAN方案與傳統CU-DU架構的C-RAN方案的比較,相關數據基于前面測試數據推算而得。從表3可以看到,在非理想前傳條件時,采用DU部署在中心資源池的組件化方案相對于傳統CU-DU方案優勢明顯,此時站址傳輸流量僅是后者的1.35倍,而中心資源池的計算集中度卻是后者的35.60倍。這表明組件化方案在不顯著增加傳輸開銷的情況下依然能夠保持C-RAN架構的集中化優勢,這將為C-RAN架構在5G應用場景中繼續發揮運維簡化、能耗降低等優勢創造條件。

表3 組件化C-RAN方案與CU-DU C-RAN方案比較(以10 Mbps下行傳輸為例)
本文針對軟件定義方法實現5G接入網的問題,提出了一種新的組件化方案,該方案是一種由CCU, CU, DU, RU和AAU等組件構成的分布式軟基站架構。本文通過對各種物理層切分選項的組件間流量進行理論分析之后確定了切分方案,并按此方案實現了試驗原型。軟件定義無線接入網的組件化架構既有利于通過分布式計算技術或者硬件組件加速技術克服軟件定義接入網的計算能力瓶頸,又有利于降低CPRI接口流量,實現基于組件的RAN切片。從前面的比較也能看到,組件化方案與CRAN架構相結合還能充分發揮C-RAN架構集中度高的優勢,在集中度與傳輸開銷之間獲取平衡,降低接入網的運維成本和能耗。