◆馬 龍 張 錚
?
基于NFV的4G網絡可靠性研究
◆馬 龍 張 錚
(信息工程大學四院 河南 450001)
本文主要介紹了NFV技術在4G網絡中的應用以及4G虛擬化網絡的實現方式,揭示了NFV對4G通信業務流程造成的影響,介紹了一種vEPC的實現方案,該方案對三類4G通信流程關鍵事件進行邏輯分解,并將其組裝為一個Fat-proxy,使用Fat-proxy將關鍵事件的控制消息從核心網分離出來并形成實例,通過并行執行事件消息來加速整個事件的執行,從而提高基于NFV技術的4G網絡的可靠性。
4G;NFV;vEPC;虛擬化
隨著通信技術、計算機技術、網絡技術的發展,傳統意義上的4G網絡也逐漸開始從網絡虛擬化入手,通過網絡虛擬化提高網絡資源的配置效率。如AT&T、BT、德國電信、法國電信等主要電信運營商推動成立了ETSI NFV,其主要目在于推動網絡虛擬化技術的標準化,希望通過基于行業標準的x86服務器、存儲和交換設備,來取代傳統網絡中專用網元設備,用以構建靈活定義、隨需創建的開放網絡和生態系統。網絡功能虛擬化(NFV)以一種低成本的方式擴展了用戶服務,將傳統的集中4G核心架構轉換為分布式架構。這種分布式體系結構使多個4G網絡功能(NFs)實例化,并在商用數據中心網絡上虛擬化它們。本文以NFV技術為切入點,重點研究NFV在4G網絡的應用部署、產生的問題及解決方法。
SDN[1]和NFV[2]都是近些年為了滿足新的應用需求提出的新一代網絡技術。SDN的核心理念是將網絡功能和業務處理抽象化,并且通過外置控制器來控制這些抽象化的對象。SDN將網絡業務的控制和轉發進行分離,分為控制平面和轉發平面,路由協議交換、路由表生成等路由功能均在統一的控制面完成。SDN是基于OpenFlow[3]實現的,OpenFlow在網絡中實現了軟硬件的分離以及底層硬件的虛擬化,從而為網絡的發展提供了一個良好的發展平臺。
NFV的本質在于解決電信運營商多年來高昂的網絡成本和封閉的網絡功能,NFV的初衷是通過使用x86等通用性硬件以及虛擬化技術,來承載很多功能的軟件處理,最終用來取代私有專用的網元設備。NFV技術顛覆了傳統電信封閉專用平臺的思想,同時引入靈活的彈性資源管理理念,通過將網絡設備的硬件和軟件解耦,并把傳統網絡設備內的業務功能分解成一個個VNF(Virtualized Network Function),通過對VNF的統一編排和管理,根據應用需求進行定義不同的業務鏈,實現不同業務流經過不同VNF進行處理,在此基礎上可以完成4G核心網網元、IMS網元等的邏輯實現。
SDN跟NFV最明顯的區別是,SDN處理的是OSI模型中的2-3層,NFV處理的是4-7層。依賴于應用在大量數據中心內的現有技術,網絡功能虛擬化的目標可以基于非SDN的機制而實現。但是,如果可以逐漸接近SDN所提出的將控制平面和數據平面的思路,那么就能進一步使現有的部署性能增強且簡化互操作性。
4G網絡主要包括無線接入網、核心網以及與接入無關的IMS(IP Multimedia Subsystem)網絡。3GPP定義了可支持高速移動數據業務的無線接入網LTE與演進的分組域核心網EPC架構。LTE主要研究無線接入網的長期演進技術,SAE (System Architecture Evolution)則是研究核心網的長期演進,它定義了一個全IP的分組核心網EPC,該系統僅有分組域而無電路域、基于全IP結構、控制與承載分離,其中主要包含HSS、MME、SGW、PGW、PCRF以及eNodeB等網元。在EPC網絡中,只定義了分組域的網絡架構,語音、短信等傳統電路域業務將基于IMS網絡分組架構承載。IMS網絡使用SIP協議作為核心控制協議,提供與接入無關的IP多媒體業務控制能力,主要包括P-CSCF、I-CSCF、S-CSCF、AS等網元。無線接入網、EPC、IMS網絡結構及主要接口協議如圖1所示。

圖1 4G網絡結構及主要接口協議
NFV旨在通過研究發展標準IT虛擬化技術,使得許多網絡設備類型能夠融入到符合行業標準的大容量服務器、交換機和存儲設備中,目前全球越來越多的廠商、運營商、服務提供商均參與其中。Juniper、阿朗、思科等網絡設備廠商結合SDN發展趨勢,選擇云數據中心網絡為突破方向,向虛擬網絡服務提供商轉型;而華為、中興、阿朗、愛立信等將重點推出vIMS、vEPC等平臺并開展測試及商用,例如華為的FusionSphere、阿朗的Cloudbound、愛立信的ECEE、HP的OpenNFV計劃等;傳統的電信運營商例如AT&T、DOCOMO、Sprint、Vodafone、SK、Telefonica以及國內的運營商均已開展虛擬核心網vEPC、虛擬IMS網絡以及部分虛擬網元的技術測試和與現網的融合工作。
NFV基礎設施可由在云平臺上運行虛擬網絡功能(VNFs)的服務器組成。例如在進行4G網絡的虛擬化部署時,可以將openEPC[4]分解成若干NFs(MME、SGW、PGW、HSS和PCRF),然后將這些NFs部署在華為的FusionSphere平臺上,從而實現對4G核心網和IMS網絡的虛擬化。虛擬化的vEPC NFs和vIMS NFs可根據實際需求進行快速靈活部署并擴展,基于FusionSphere平臺的4G網絡虛擬化架構如圖2所示。

圖2 4G虛擬化架構
NFV通過軟硬件解耦、基礎設施共享的方式,將傳統網絡設備內的業務功能分解成一個個VNF,能否保證電信級的處理能力,是影響4G通信業務在NFV上部署的關鍵。
(1)NFV對4G網絡中各類網元在形態上由傳統的軟硬一體變為基于統一平臺的虛擬功能網元,但是在功能邏輯上幾乎沒有變化。
(2)NFV在用戶容量上可能低于傳統網元,但是可以快速擴容。
(3)NFV虛擬功能網元之間的容災也需要在業務層面考慮并實現。
NFV虛擬網元在組網方式上與傳統4G網元沒有太大區別,但是由于傳統網元是直接部署在獨立的軟硬件設備上,而NFV架構下的4G網絡是部署在虛擬化的云平臺上,所以新增了虛擬資源管理、虛擬數據管理、虛擬控制管理等以及虛擬機的網絡管理(如圖3)。

圖3 NFV-4G核心網架構
(1)傳統電信級設備可靠性
電信級設備的可靠性需要達到99.999%,在性能上需要重點保證端到端時延和QoS。在傳統的EPC中有較少的NF(MME、SGW、PGW、HSS、PCRF等網元),它們通過專用的光纖連接在一起,不同NF之間鏈路的RTT是穩定的,它決定了NF的可達性和數據包轉發次數。這些NFs交換大量的控制消息來執行特定的通信流程。例如,在設備開機附著(Attach Request)中,MME從HSS獲得設備安全密鑰,對設備進行身份驗證及鑒權,同時在SGW和PGW中創建設備會話信息。SGW和PGW建立了該設備與網絡的會話,并配置了特定的QoS配置文件,從而在網絡上注冊了該設備。一旦某個控制消息延遲或失敗將會導致完整的附著過程失敗,然后設備會進行重新附著,將影響通信的可靠性。
(2)vEPC可靠性
通常EPC核心網是在數據中心網絡上虛擬化的,其NFV基礎設施是由在云平臺上運行虛擬網絡功能(VNFs)的服務器組成,這些VNFs可能存在多跳鏈接,而不像傳統的NFs直接相連。一旦某跳出現擁塞,信令數據會在擁塞的IP鏈路上花費更長時間,從而觸發不必要的數據重傳。多跳鏈接和多路徑還增加了丟包的概率,一個響應包的丟失可能就會導致整個業務流程失敗。虛擬化網絡利用了數據中心網絡[5]的固有的多路徑特性,也有可能導致數據包的亂序發送。排隊延時、丟包、超時重傳和亂序轉發等問題會直接影響用戶的通信狀態(例如語音中斷、無服務、不能上網等)。
為了解決以上問題需要在特定的軟件和硬件上保證信令消息及數據傳輸的高可靠性和高可用性,提供數據包級別的保證(例如話音業務和數據業務的分別是100ms和300ms延遲[6])。
(3)vIMS可靠性
IMS的核心業務是VoLTE服務,IMS配合LTE和EPC網絡實現端到端的基于分組域的短信、語音、視頻通信業務。但是IMS協議和基于云平臺的上IMS的故障恢復機制相對較弱,導致基于云的IMS不能在錯誤的情況下提供會話級別的恢復能力,將導致會話業務中斷。為了解決這個問題,應當確保提供冗余來實時恢復故障。
在NFV的應用中,排隊延時、丟包、超時重傳和亂序轉發等問題會直接影響4G的通信業務流程及用戶的通信狀態。為了消除這些影響,需要對邏輯處理功能及網絡架構進行適當調整,從而滿足電信級的可靠性。下面將主要介紹NFV在EPC核心網中的實現方案。
為了解決上述問題,UCLA的研究團隊采用一種基于業務邏輯的虛擬化方法[7]。其主要原理是對于每一個關鍵的通信業務流程,以模塊的形式從每個NF中提取該業務流程的邏輯功能,然后將所有NFs中提取的基于業務流程的模塊組裝為一個代理Fat-proxy(或者Thick Client),如圖4所示。通過提取切換(Handover)、尋呼(Paging)、服務請求(Service Request)這三個關鍵事件的業務邏輯,為三個事件的業務邏輯創建Fat-proxy,利用Fat-proxy充當這些事件的NF,從而降低延時,提高處理效率。
使用Fat-proxy主要有三方面特點:首先Fat-proxy充當NF,并且只處理單一類型的事件,既減少了延遲,又避免了超時重傳;其次,這三個關鍵事件大量的消息流量(占總流量的50%)從vEPC中轉移到Fat-proxy,可以使vEPC及時處理其他的事件請求,同時確保Fat-proxy及時執行關鍵事件業務;最后, Fat-proxy可以在需求增加時輕松地進行擴展。
(1)邏輯功能分解
通過OpenEPC源碼來構造業務邏輯事件函數調用關系,提取函數調用信息和全局變量,在源碼的基礎上自動識別功能依賴關系,從而形成函數調用圖。調用圖記錄了調用關鍵事件和特定場景下的函數鏈,形成不同事件的功能依賴關系,然后對不同的調用關系進行分解。在調用過程中,由于相同的函數可以根據所執行的事件的場景被鏈接到不同的位置,所以要對此類調用關系進行細致劃分。例如用戶在沒有X2切換接口情況下,在兩個eNodeB之間進行切換(Handover)時,用戶的下行數據是通過EPC進行轉發。首先PGW將數據轉發給源SGW,SGW將其轉發給源eNodeB,由于eNodeB之間沒有X2接口,因此無法向目的eNodeB轉發數據。隨后,源eNodeB將這些數據投遞至源SGW,源SWG將這些數據轉發給目的SGW,最終通過目的eNodeB轉發給用戶。整個業務流程從Forward Relocation Request請求開始調用,然后MME在目的SGW上調用創建會話請求(Create Session Request)來創建一個會話,用于轉發下行數據包。第二種情況是用戶在有X2接口的eNodeB之間進行切換,在這種情況下,下行數據包不需要通過EPC通道進行轉發。目的eNodeB發送路徑切換請求消息(PathswitchRequest)到MME,告知用戶已從源eNodeB遷移,MME調用修改承載請求(ModifyBearerRequest),并更新下行通道標識符,控制SGW將要將數據包轉發到目的eNodeB。
通過梳理各類業務邏輯事件函數調用關系,記錄調用關鍵事件和特定場景下的函數鏈,最終將通信業務事件的邏輯功能進行分解。
(2)通信業務事件邏輯的提取
邏輯提取主要是從各自的vEPC NFs提取關鍵事件執行邏輯,并將它們組合為該事件的代理。首先識別關鍵事件所依賴的函數執行關系,通過函數分解過程(步驟1),提取執行過程中存在邏輯依賴關系和數據依賴關系。邏輯依賴發生在兩個事件之間,當兩個事件執行時存在邏輯聯系時,如果沒有正確識別和處理,將會影響整個事件的功能。數據依賴發生在事件執行期間,它需要與外部實體交換用戶數據。一旦擁有了所有事件的執行邏輯流程,就會將關鍵事件的執行與所有其他事件進行比較,然后在關鍵事件和其他事件之間找到公共的要素,從而提取事件的執行邏輯。

圖4 切換事件的并行化執行
(3)優化Fat-proxy
關鍵事件執行的延遲會導致整個通信業務的中斷。因此,需要通過并行執行一些消息來加速事件的執行。可通過劃分不同協議的互斥邏輯,利用網絡協議的基于邏輯的分區來實現這一目標。例如,圖4顯示了在切換事件期間,EPC NFs之間交換消息的流程。S-MME從eNodeB接收到消息,并觸發轉發Allocation消息到T-MME。接收到消息后,T-MME將創建會話請求(Creation Session Req)發送給T-SGW,隨后T-MME將T-SGW的響應消息成功會話發送給eNodeB。創建會話請求和跨區遷移請求消息的方向是相反的(兩個消息都是同時發送的),前者是GTP協議的一部分,后者是S1AP協議的一部分,這些消息的并行傳輸是可能的。通過識別NF中的協議級別模塊化,并將消息執行并行化,可加速跨區遷移的效率。在大多數業務流程事件中,有40%-60%的消息可以并發執行,以顯著提高網絡性能。
隨著NFV技術在4G網絡中的應用發展,越來越多的4G網絡將會進行虛擬化部署,其中最關鍵的是解決NFV對4G通信業務流程造成的影響,使其能夠提供電信級的服務保證。本文介紹的vEPC的實現方案,通過增加Fat-proxy來提高基于NFV技術的4G網絡的可靠性,對研究NFV的實際應用具有一定的技術意義。
[1]ONF.Software Defined Networking(SDN) Definition[EB/OL].https://www.opennetworking.org/sdn-definition/.
[2]ETSI.Network Functions Virtualisation[EB/OL]. http://www.etsi.org/technologies-clusters/technologies/nfv.
[3]Mckeown N,Anderson T,Balakrishnan H,et al. Op-enFlow:enabling innovation in campus networks[J].Acm Sigcomm Computer Communication Review, 2008.
[4]OpenEPC-Open source LTE implementation[EB/OL].http://www.openepc.net/.
[5]Mittal R,Lam V T,Dukkipati N,et al.TIMELY: RTT-based Congestion Control for the Datacenter[C].ACM C-onference on Special Interest Group on Data Communication. ACM, 2015.
[6]3GPP.TS 23.203:Policy and Charging Control Architecture[S], 2013.
[7]Raza M T,Kim D,Kim K H,et al.Rethinking LTE network functions virtualization[C].IEEE,International Con-ference on Network Protocols.IEEE Computer Society,2017.