劉 作,陳 楊,黎 聰
(中國(guó)—東盟信息港股份有限公司,廣西 南寧 530200)
隨著向4G、5G核心網(wǎng)的演進(jìn),核心網(wǎng)網(wǎng)元功能在分組交換領(lǐng)域深度迭代。在模擬通信時(shí)代,信令與媒體不可分割。隨著對(duì)信令輕量化的需求,控制與承載分離成為2G、3G時(shí)代核心網(wǎng)架構(gòu)的標(biāo)志。但是,隨著網(wǎng)絡(luò)能力的提升和分組交換技術(shù)的深度發(fā)展,在當(dāng)下的4G、5G時(shí)代,隨路信令再次回歸核心網(wǎng)架構(gòu)。隨著控制與承載分分合合幾十年,如今的輕量化部署與靈活應(yīng)用,對(duì)核心網(wǎng)功能網(wǎng)元的NFV化產(chǎn)生了硬性需求。
網(wǎng)關(guān)即完成兩個(gè)異構(gòu)網(wǎng)絡(luò)之間信息(包括媒體信息和用于控制的信令信息)相互轉(zhuǎn)換的設(shè)備。國(guó)際互聯(lián)網(wǎng)工程任務(wù)組(The Internet Engineering Task Force,簡(jiǎn)稱(chēng)IETF)在RFC2719提出了網(wǎng)關(guān)的總體模型,將網(wǎng)關(guān)的特征分為3個(gè)功能實(shí)體——媒體網(wǎng)關(guān)(MG)功能、媒體網(wǎng)關(guān)控制(MGC)功能和信令網(wǎng)關(guān)(SG)功能。
5G網(wǎng)絡(luò)切片基于NFV和SDN技術(shù),為了打破傳統(tǒng)核心網(wǎng)運(yùn)行模式單一的狀況,采用各種運(yùn)行業(yè)務(wù)綜合發(fā)展的模式,根據(jù)不同業(yè)務(wù)的優(yōu)先等級(jí),能夠?qū)崿F(xiàn)端到端的業(yè)務(wù)編排;基于NFV化的媒體網(wǎng)關(guān),可以實(shí)現(xiàn)對(duì)用戶(hù)業(yè)務(wù)進(jìn)行切片定制化,針對(duì)不同業(yè)務(wù)實(shí)現(xiàn)端到端業(yè)務(wù)編排能力,符合5G核心網(wǎng)的發(fā)展方向。
ETSI網(wǎng)絡(luò)功能虛擬化行業(yè)規(guī)范工作組(NFV ISG)在GS NFV 002(Architectural Framework)中定義NFV基礎(chǔ)體系架構(gòu)[1],整體架構(gòu)由3部分組成。
網(wǎng)絡(luò)功能虛擬化設(shè)施(NFV Infrastructure,NFVI)基于傳統(tǒng)硬件的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)3大硬件模塊,將其組成節(jié)點(diǎn)和網(wǎng)絡(luò)鏈路通過(guò)hypervisor管理程序,將物理資源能力抽象為VNF應(yīng)用調(diào)用,提供應(yīng)用部署支撐環(huán)境。
虛擬網(wǎng)絡(luò)功能(Virtualized Network Functions,VNFs)是已定義好外部接口和功能行為的功能模塊。一個(gè)VNF就是某網(wǎng)絡(luò)功能部署在虛擬資源如VM中的一個(gè)實(shí)例。實(shí)際上,單個(gè)VNF可以劃分多個(gè)內(nèi)部元件,部署在多個(gè)虛擬機(jī)中。每個(gè)虛擬機(jī)承載VNF的一個(gè)元件,打包作為方案向外提供定制化服務(wù)。
網(wǎng)絡(luò)功能虛擬化的管理與編排(NFV Management and Orchestration,NFV MANO),主要用于編排管理VNF組件、配置及基礎(chǔ)設(shè)施,并管理VNF的生命周期,主要聚焦于NFV架構(gòu)中所需的所有虛擬化相關(guān)的管理任務(wù)[2]。
媒體網(wǎng)關(guān)VNF應(yīng)用基于為用戶(hù)提供定制化切片服務(wù),將媒體網(wǎng)關(guān)整體功能進(jìn)行劃分,由多個(gè)子VNF共同構(gòu)成基于VNF的微服務(wù)集群。
(1)MG_Core:輸出媒體轉(zhuǎn)碼、放音及錄音合成等核心媒體操控功能。
(2)Signaling Control:提供信令支撐功能,包括信令轉(zhuǎn)換、sdp媒體協(xié)商以及到核心網(wǎng)元偶聯(lián)的建立與維護(hù)。
(3)SCP(Service Control Point):核心業(yè)務(wù)邏輯控制與編排單元,基于面向服務(wù)架構(gòu)設(shè)計(jì),對(duì)其他子VNF網(wǎng)元提供業(yè)務(wù)邏輯控制,以及根據(jù)不同客戶(hù)需求提供定制化業(yè)務(wù)邏輯編排。
(4)DBS:提供數(shù)據(jù)庫(kù)和存儲(chǔ)支撐。
(5)ACP(Access Control Point):對(duì)接用戶(hù),為用戶(hù)提供的切片入口用于滿(mǎn)足定制化需求請(qǐng)求及響應(yīng)。
本文的分析流程劃分為3個(gè)部分:NFV平臺(tái)搭建與核心網(wǎng)對(duì)接、VNF應(yīng)用部署、問(wèn)題分析與改進(jìn)總結(jié)。

媒體網(wǎng)關(guān)VNF應(yīng)用指標(biāo),包括媒體協(xié)商轉(zhuǎn)碼,計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)硬件指標(biāo),流媒體錄音生成,業(yè)務(wù)服務(wù)連續(xù)性;(2)核心網(wǎng)對(duì)接指標(biāo)參數(shù),包括M3UA偶聯(lián)、CIC使用率和流媒體帶寬占用率。
NFV環(huán)境搭建整體架構(gòu)劃分。本文所述應(yīng)用場(chǎng)景是一種基于語(yǔ)音通話(huà)的電信增值業(yè)務(wù)平臺(tái),提供語(yǔ)音通話(huà)接續(xù)、錄音、彩鈴等定制化功能。為形成對(duì)比及方便測(cè)試,整體劃分為超融合NFV集群和基于物理機(jī)的VMWare資源池。參考論文《基于NFV的媒體網(wǎng)關(guān)軟化技術(shù)應(yīng)用測(cè)試研究》的測(cè)試結(jié)論,軟化媒體網(wǎng)關(guān)組件CPU線(xiàn)程個(gè)數(shù)與響應(yīng)網(wǎng)卡IRQ的線(xiàn)程個(gè)數(shù)最佳配置比為1:8的情況下,分配2個(gè)線(xiàn)程用于響應(yīng)網(wǎng)卡中斷,使網(wǎng)卡SI%穩(wěn)定在25%以下[3]。此外,與核心網(wǎng)T局、H/L局通過(guò)sigtran協(xié)議互配OPC、DPC、GT碼,互聯(lián)互通。
基于VNF應(yīng)用能力輸出的靈活性和定制化需求,單粒度應(yīng)用部署采取兩種應(yīng)用標(biāo)準(zhǔn)。單粒度MG_Core支撐500媒體話(huà)路并發(fā)能力,各VNF應(yīng)用均按錄音轉(zhuǎn)碼要求配置。
本文旨在研究基于NFV部署的VNF應(yīng)用,在承載電信級(jí)核心網(wǎng)媒體業(yè)務(wù)時(shí)的系統(tǒng)穩(wěn)定性,包括從Hypervisor抽象底層設(shè)施的能力輸出效果、底層變更對(duì)應(yīng)用的影響以及VNF應(yīng)用性能指標(biāo)。
3.3.1 錄音合成延遲問(wèn)題
基于系統(tǒng)周期性抽檢錄音合成監(jiān)控機(jī)制,發(fā)現(xiàn)系統(tǒng)在業(yè)務(wù)高峰期存在錄音合成延遲問(wèn)題。抽檢規(guī)模為500個(gè)隨機(jī)樣本,以失敗案例為分子進(jìn)行統(tǒng)計(jì),嚴(yán)重時(shí)刻能達(dá)到60%的延遲,通過(guò)對(duì)物理層資源的觀(guān)測(cè)顯示,部署MG_Core的子VNF應(yīng)用會(huì)存在個(gè)別線(xiàn)程CPUIdle跳0,而集中在CPUWait等待資源釋放,持續(xù)時(shí)間0~9 s,此時(shí)CPU利用率超過(guò)60%。基于錄音合成優(yōu)先級(jí)低于媒體轉(zhuǎn)碼、接續(xù)等優(yōu)先級(jí)。此外,由于Hypervisor抽象物理資源所消耗的計(jì)算資源占比大概為30%,在系統(tǒng)媒體話(huà)路并發(fā)增高時(shí),會(huì)出現(xiàn)底層計(jì)算資源搶占問(wèn)題。
3.3.2 業(yè)務(wù)偶發(fā)閃斷問(wèn)題
在系統(tǒng)上線(xiàn)使用過(guò)程中,觀(guān)測(cè)業(yè)務(wù)穩(wěn)定性發(fā)現(xiàn)存在偶發(fā)閃斷現(xiàn)象。閃斷發(fā)生時(shí)表現(xiàn)為系統(tǒng)呼叫量從2 400媒體話(huà)路并發(fā)瞬間降至0,振鈴量由于存量呼叫的關(guān)系由2 300話(huà)路并發(fā)降至280,接通量由1 250降至150,部署的MG_Core的CPU空閑率從60%釋放至95%,網(wǎng)絡(luò)流入流量監(jiān)控顯示流入的流量從600 kb/s降至30 kb/s,網(wǎng)絡(luò)流出流量從12 Mb/s降至0。IOPS讀寫(xiě)由于媒體業(yè)務(wù)中斷原因?qū)懭胱兙彛瑥?00 r/s降至90 r/s,CIC使用率從1 200降至160。
通過(guò)排查發(fā)現(xiàn),最早時(shí)刻發(fā)生中斷告警的為到核心網(wǎng)H/L局的sigtran偶聯(lián)中斷,每次中斷時(shí)間0~5 min。由于偶聯(lián)是支撐信令交互的傳輸通道,在偶聯(lián)發(fā)生中斷后無(wú)法對(duì)話(huà)路進(jìn)行路由,導(dǎo)致發(fā)生業(yè)務(wù)中斷和底層物理資源的釋放。經(jīng)研究排查,在sigtran偶聯(lián)閃斷時(shí),Signaling Ctrl應(yīng)用模塊所在的物理機(jī)存在突發(fā)重啟導(dǎo)致的冷遷移,導(dǎo)致5 min內(nèi)的業(yè)務(wù)中斷。
3.4.1 錄音合成延遲問(wèn)題解決
經(jīng)3.3.2節(jié)對(duì)MG_Core子VNF應(yīng)用的分析,它的承載業(yè)務(wù)擴(kuò)容基線(xiàn)CPU利用率在60%。當(dāng)高于60%時(shí),系統(tǒng)會(huì)出現(xiàn)資源搶占問(wèn)題導(dǎo)致的錄音合成延遲。由于其他子VNF應(yīng)用模塊資源與MG_Core子VNF應(yīng)用存在資源利用差值,在其他模塊資源未飽和之前,可以動(dòng)態(tài)擴(kuò)容MG_Core子VNF應(yīng)用,降低整體資源利用率,解決資源搶占問(wèn)題。此外,由于錄音合成基于ffmpeg組件,為防止單個(gè)線(xiàn)程被強(qiáng)占導(dǎo)致錄音合成掛死現(xiàn)象,通過(guò)配置ffmpeg錄音合成采用多進(jìn)程綁定可避免該問(wèn)題的發(fā)生。綜上,在部署MG_Core子VNF應(yīng)用時(shí),可調(diào)整ffmpeg配置綁定多線(xiàn)程工作,同時(shí)對(duì)虛擬機(jī)資源進(jìn)行監(jiān)控基線(xiàn)添加,當(dāng)CPU利用率超過(guò)60%時(shí),即可考慮動(dòng)態(tài)擴(kuò)容子VNF應(yīng)用方案。
3.4.2 閃斷問(wèn)題解決
雖然閃斷是基于物理層故障暴露出來(lái)的問(wèn)題,但經(jīng)分析可以從VNF應(yīng)用部署角度盡力避免該問(wèn)題,即采用分布式部署與負(fù)載均衡策略,將VNF應(yīng)用部署在不同物理機(jī)上,采用偶數(shù)部署機(jī)制形成彼此互為熱備。當(dāng)某個(gè)底層物理資源宕機(jī)遷移期間,部署在其他底層物理機(jī)所制成的虛擬機(jī)上的VNF應(yīng)用即可起到熱備份作用。通過(guò)該解決方案策略部署VNF子應(yīng)用后,系統(tǒng)業(yè)務(wù)閃斷問(wèn)題修復(fù),經(jīng)數(shù)日觀(guān)測(cè)無(wú)閃斷發(fā)生。綜上,在部署VNF子應(yīng)用時(shí),將子應(yīng)用針對(duì)底層物理機(jī)資源采取分布式部署與負(fù)載均衡策略,可極大提高對(duì)底層物理資源障礙的容錯(cuò)性,提高業(yè)務(wù)系統(tǒng)穩(wěn)定性。
5G網(wǎng)絡(luò)是萬(wàn)物互聯(lián)的時(shí)代。NFV作為5G網(wǎng)絡(luò)切片的關(guān)鍵技術(shù),是電信核心網(wǎng)的發(fā)展趨勢(shì)。本文以NFV為基礎(chǔ)環(huán)境,對(duì)媒體網(wǎng)關(guān)進(jìn)行以VNF應(yīng)用部署為目的的功能分解與部署,制定了核心網(wǎng)電信業(yè)務(wù)承載穩(wěn)定性分析流程和技術(shù)指標(biāo),以系統(tǒng)承載業(yè)務(wù)所暴露出來(lái)的問(wèn)題為基礎(chǔ),分析得到了能夠提高系統(tǒng)穩(wěn)定性的VNF應(yīng)用部署方案和MG_Core擴(kuò)容基線(xiàn)數(shù)值,為基于VNF的媒體網(wǎng)關(guān)承載電信級(jí)業(yè)務(wù)應(yīng)用部署提供了參考。