王路+趙鵬+付喬


摘要:指出了網絡功能虛擬化(NFV)的5個關鍵技術:硬件及管理技術、虛擬層技術、管理編排技術、可靠性技術、加速技術,并介紹了NFV發展情況及當前存在的問題。認為NFV作為運營商網絡轉型的核心技術架構,是虛擬化和云計算等信息技術(IT)技術在電信領域的一次大規模應用。隨著技術的成熟,未來將很快看到NFV架構的電信網絡;以NFV為出發點,通信技術(CT)和IT將走向深度融合。
關鍵詞: NFV;管理和編排(MANO);Hypervisor
1 NFV架構和應用場景
1.1 NFV架構
網絡功能虛擬化(NFV)的基礎架構由歐洲電信標準化協會(ETSI) NFV行業規范組織(ISG)設計完成,NFV邏輯架構如圖1所示。
NFV邏輯架構主要分為4個部分:NFV的管理和編排(MANO)系統用于整體編排和控制管理;NFV基礎設施(NFVI)提供網元部署所依賴的基礎設施環境;虛擬網絡功能(VNF)這一層包括虛擬網元自身以及負責管理VNF的網元管理系統(EMS);運營支持系統/業務支持系統(OSS/BSS)是運營支撐系統。
1.2 NFV應用場景
NFV的應用范圍非常廣泛,從網絡邊緣到網絡核心,從固定網絡到移動網絡,所有網絡功能的實現都有可能重新設計或改造。以下介紹幾種NFV應用的典型場景[1]。
(1)固定接入網。
虛擬客戶終端設備(vCPE)和虛擬寬帶遠程接入服務器(vBRAS)是NFV部署的典型案例之一。vCPE將復雜的網絡功能及新增業務以虛擬化方式部署在網絡側而非用戶側,同時為運營商未來新增業務乃至第三方業務提供開放平臺。vCPE的部署使得傳統固定接入網絡變得更加靈活,用戶可以根據需求定制自己的網絡。從目前的產業發展現狀來看,固定接入網絡的NFV化已經成為業界的共識,但目前技術方案尚未完全成熟,各類VNF的功能仍有待完善。
(2)移動核心網。
核心網虛擬化一直是NFV應用的重點領域。目前,全球運營商在該領域概念驗證(POC)、試點乃至部署案例眾多,比如:日本DoCoMo公司嘗試自主集成構建物聯網解決訪問虛擬演進的數據核心網(vEPC)。同時,中國移動也以虛擬IP多媒體子系統(vIMS)和基于IMS的語音業務(VoLTE)為切入點,進行了深入的NFV試點。
(3)移動接入網。
移動接入網的分布式特征所帶來的高成本、高管理復雜度的挑戰使得NFV成為其未來發展的重要解決方案。新一代基站布建架構——云化無線接入網(C-RAN)就是一種典型應用場景。C-RAN通過將基帶處理器從站點移開,并置于核心更深處,可有效降低設備成本,改善協作,增加網絡容量。同時,在無線接入網絡方面,基于虛擬技術的無線控制器(AC)虛擬化和池化技術也逐漸引起廣泛關注。AC虛擬池的實現可以有效降低AC設備成本,增強設備的可靠性,提高AC設備利用率,簡化運營商運維管理AC設備的復雜度。
(4)數據中心應用。
虛擬防火墻(vFW)、虛擬負載均衡器(vLB)和虛擬安全套接層(vSSL)/Internet協議安全性(IPSEC)網關(GW)當前在數據中心也得到了大量應用。得益于NFV帶來的靈活性特點,上述虛擬化網元可以靈活擴容和縮容。其次,基于SDN的業務鏈功能,能夠實現非常靈活的增值業務編排,真正實現用戶按需定制。
2 NFV關鍵技術及其解決方案
2.1 硬件及硬件管理技術
2.1.1 硬件概述
硬件作為NFV最底層的基礎設施,涉及的硬件包括3類:計算類、存儲類和網絡類。
(1)計算。
計算類硬件采用商用通用服務器(COTS),目前業界主流的指令集為X86,服務器為雙中央處理器(CPU)的2路服務器。主流服務器形態包括5種:刀片式、機架式、多節點(也稱為高密度服務器)、整機柜、機柜級架構(RSA)。
·刀片式服務器是一種刀框集成多個卡式服務器單元(形態像刀片)的服務器,刀框內同時集成背板、交換背板、管理單板、電源和風扇等部件。其集成度較高,可以節省大量機柜空間。
·機架式服務器是一種集成CPU、內存、主板、網卡、硬盤、電源和風扇的服務器。一個機架式服務器為一個計算單元。
·多節點服務器是一種在特定空間的框內,集成電源、風扇和多個服務器單元的服務器,多個服務器單元共享電源和風扇。
·整機柜服務器是一種標準化的服務器,整機柜內集成電源模塊、風扇模塊、交換模塊、管理模塊、服務器模塊。
·RSA是Intel提出的一種未來服務器形態,是芯片資源池化,通過資源池虛擬出需要的服務器的技術。
(2)存儲。
當前NFV業界主流存儲技術采用IP存儲區域網絡(IP-SAN)和分布式存儲,相應的存儲介質為磁陣和存儲型服務器。
磁陣是一種可靠性達5個9、性能高的成熟存儲硬件。存儲型服務器是一種配置硬盤多,滿足大容量存儲需求的服務器。不同存儲介質需要結合相應的存儲技術,以發揮最大的技術優勢。
(3)網絡。
網絡類硬件主要采用交換機。為滿足站點組網的要求,實現設備間互通,采用接入交換機和核心交換機實現站點組網。接入交換機一般采用1U的盒式交換機,主要實現二層互通,核心交換機采用模塊交換機,主要實現三層互通。
2.1.2 硬件資源池共享
NFV業務種類繁多,主要集中在無線接入、固網接入、核心網和部分業務平臺等。硬件資源池的共享是實現資源共享的第一步,網元部署地理位置和業務特性,決定了硬件資源有無共享的必要,硬件配置則決定硬件資源池有無共享的可行性。因此,在相同地理位置,網元業務特性相同的網元,應保證其硬件配置的一致,同一個硬件資源池中應盡量減少硬件配置的種類。
2.1.3 硬件管理
硬件管理是NFV網絡部署、運營、保證業務質量必不可少的部分。然而當前硬件管理規范方面并不是十分標準。
服務器一般采用簡單網絡管理協議(SNMP)和智能平臺管理接口(IPMI)實現管理,不同廠商SNMP和IPMI存在差異。磁陣一般采用SNMP和存儲管理接口標準(SMI-S)實現管理,SNMP方面不同廠商存在較大差異,SMI-S為全球存儲網絡工業協會(SINA)組織主導的國際標準,是統一的標準;然而SMI-S,在故障告警方面沒有涉及。交換機可采用SNMP實現管理,不同廠商在實現方面存在較大差異。
目前臺式系統管理任務組(DMTF)正在制訂服務器、磁陣和交換機的相關技術標準,即Redfish和Swordfish。主流服務器、磁陣廠商均在推動該標準的成熟。Redfish和Swordfish均基于Restful 應用程序編程接口(API)實現,接口符合未來發展的趨勢。Redfish和Swordfish在故障管理方面暫未成熟,DMTF正在大力推動其完善
2.2 虛擬層技術
虛擬層是基礎架構層NFVI的重要組成部分,包含Hypervisor和虛擬化基礎設置管理(VIM)。虛擬層將物理計算、存儲、網絡資源通過虛擬化技術轉換為虛擬的計算、存儲、網絡資源池,提供給虛擬機使用,同時,提供虛擬資源的管理和運維[2]。
2.2.1 VIM
虛擬化基礎設施管理平臺,負責對虛擬化資源進行統一的管理、監測控制、優化,對虛擬機進行生命周期管理等。
目前,主流VIM平臺基于OpenStack社區進行開發,包括身份認證及授權、虛擬機鏡像管理、計算資源管理、存儲資源管理、網絡資源管理、虛擬機生命周期管理等能力。同時,VIM平臺整合了NFVI的運維和管理能力,包括虛擬化層的關鍵績效指標(KPI)監測控制,故障告警收集及上報等。
2.2.2 虛擬化軟件Hypervisor
Hypervisor將通用物理服務器與上層軟件應用分開,使得具有不同操作系統的多個虛擬機可以在同一個物理服務器上運行,最大化地利用硬件資源,即一個物理服務器的硬件資源可以被多個虛擬機共享。Hypervisor把硬件相關的CPU、內存、硬盤、網絡資源全面虛擬化,并提供給上層VNF使用,具備計算虛擬化、存儲虛擬化和網絡虛擬化能力。Hypervisor可以與VIM系統交互實現對虛擬機的創建、刪除等操作以及故障管理、性能管理等功能。
(1)計算虛擬化。
實現對服務器物理資源的抽象,將CPU、內存、輸入/輸出(I/O)等服務器物理資源轉化為一組可統一管理、調度和分配的邏輯資源,并基于這些邏輯資源在單個物理服務器上構建多個同時運行、相互隔離的虛擬機執行環境,實現更高的資源利用率,同時滿足應用更加靈活的資源動態分配需求。
為實現5個9的高可用性,NFV對計算虛擬化提出了新的技術要求,包括CPU核綁定、大頁內存、非均勻存儲器存取(NUMA)、親和性/反親和性部署等能力,同時需禁止CPU、內存的超分配。
(2)存儲虛擬化。
將存儲設備進行抽象,以邏輯資源的方式呈現,統一提供全面的存儲服務。可以在不同的存儲形態,設備類型之間提供統一的功能。
(3)網絡虛擬化。
在服務器的CPU中實現完整的虛擬交換的功能,虛擬機的虛擬網卡對應虛擬交換的一個虛擬端口,服務器的物理網卡作為虛擬交換的上行端口。
目前,業界主流的網絡虛擬化技術包括虛擬交換機及單根I/O設備虛擬化技術(SR-IOV)。虛擬交換機(OVS)是在開源的Apache2.0許可下的產品級質量的虛擬交換標準,通過虛擬化軟件提供的部署在主機上的虛擬交換功能,主機節點的物理接口及虛擬機的虛擬網卡(vNIC)分別與虛擬交換機連接,通過虛擬交換機實現與外部網絡的數據傳輸。SR-IOV基于虛擬功能的虛擬機直通,虛擬機直接使用物理網卡資源進行網絡通信,減少傳統的虛擬交換帶來的CPU消耗,提升性能,減少時延。
2.3 管理編排技術
2.3.1 管理編排
NFV MANO的架構由NFV編排器(NFVO)、VNF管理器(VNFM)、VIM組成,完成對于NFV系統內虛擬資源、虛擬網元和網絡服務的管理。MANO系統架構圖2所示。
NFVO實現網絡服務和網元管理及處理,提供網絡服務生命周期的管理。VNFM實現虛擬化網元VNF的生命周期管理,包括VNF實例的初始化、VNF的擴容/縮容、VNF實例的終止。VIM是虛擬化基礎設施管理系統,主要負責虛擬基礎設施的管理,監測控制和故障上報,面向上層VNFM和NFVO提供虛擬化資源池。VIM提供虛擬機鏡像管理功能。
2.3.2 管理編排產業發展
MANO由ETSI NFV ISG首先提出,并于2014年底發布MANO階段1規范,明確了MANO系統架構、功能實體、接口和參考流程,為業界NFV管理系統的設計提供了參考。
目前NFV MANO相關標準化工作尚未完成接口和模版的數據模型定義,尚無法指導各廠家設備基于統一格式開發并實現互通;與此同時,很多開源社區提供了開源版本的MANO或MANO部分組件,形成了對標準的重要補充。
在NFVO層面,目前最重要的開源組織是剛剛宣布成立的開放網絡自動化平臺(ONAP)組織,ONAP由中國移動主導的OPEN-O和AT&T主導的ECOMP合并成立。在VIM層面, OpenStack已經成為VIM的事實標準,多數廠家VIM基于OpenStack實現,并支持OpenStack API,供VNFM和NFVO調用。
2.3.3 NFV后的網絡管理
MANO的引入,實現了網絡的靈活管理和動態調整,同時也為運營商運維帶來了全新的挑戰。
首先,MANO引入了NFVO、VNFM、VIM等一系列新的管理實體,將原有煙囪式的一體化運維分拆成了資源和應用兩個層面,對現有OSS網管管理架構和流程均造成較大影響,需著重考慮MANO與OSS的協作關系。
其次,NFV引入了NFVI、VNF、網絡服務(NS)等一系列新的管理對象,對現有OSS管理的資源管理模型、配置模型、性能模型、故障模型和多層故障關聯等均造成較大改變。
再次,NFV MANO向運營商提供了更為智能化的網絡管理手段,有望使網絡運維由傳統的故障驅動型運維轉向依靠預定義的策略和模版,依靠大數據和機器學習,實現網絡的自動調整和治愈。這對未來網管及網絡運維人員的技能均提出了極大的挑戰。
基于以上挑戰,未來網管的一種形態將發生大的變化,在管理模式上分為設計態和運行態。設計態采用形式化語言提供系統運行的策略和編排的模版,供機器執行,實現網絡的自動調整和治愈;運行態監測控制資源和應用,對其進行實時的調度和治愈。
2.4 可靠性技術
引入虛擬化技術后,如何保證虛擬網元依然能夠表現出與傳統物理設備相當的可靠性成為人們關心的主要問題。虛擬軟件和云管理技術可靠性要求較低。如何基于相對不可靠的虛擬化和云技術提供高可靠的電信業務呢?
NFV的可靠性可以自底向上,分別從硬件、虛擬云平臺、虛擬網元3個層次實現。
(1)硬件可靠性。
硬件層面的可靠性即包括NFV所在的硬件節點的可靠性,也包括物理網絡、存儲的可靠性。通過多年信息技術(IT)和通信技術(CT)的積累,這些設備的可靠性已經有了較為完備的部署方案,基本可以滿足NFV的需求。
(2)虛擬云平臺可靠性。
虛擬云平臺的可靠性包括云管理平臺的可靠性和虛擬管理平臺(Hypervisor)的可靠性。目前OpenStack已被普遍認可作為云管理平臺。在IT和CT關于OpenStack可靠性的需求中,流傳著一個“牲口還是寵物”的玩笑。IT領域認為虛擬資源就是“牲口”,需要成群的管理,卻不需要對每一個都格外關注,當某一個虛擬資源出現故障后,我們只需要為用戶重新啟動一個虛擬資源補充這個空白即可。然而,在CT領域,由于其虛擬資源上運行的是電信網元,每一個故障都可能導致電信業務的錯誤乃至癱瘓,因此CT運營商必須把這些虛擬資源看成是“寵物”,即對每一個虛擬資源都要格外關注,一旦出現故障,就要及時發現并恢復,以保障其上業務的正常運行。
Hypervisor的可靠性問題目前業界未能達成一致意見。雖然存在一些私有的Hypervisor的可靠性解決方案,然而廣泛采用的開源的Hypervisor并沒有可靠性保障,而主要是依靠云管理節點發現故障并進行修復。這就導致Hypervisor的可靠性機制完全依賴于云管理平臺及其二者之間網絡的可靠性。同時,云管理節點目前發現故障及修復的接口尚未完善,因此在Hypervisor發現故障和修復方面存在較大問題。
(3)虛擬網元可靠性。
傳統的電信網元軟件一般都有較為完善的可靠性機制。當引入虛擬化技術后,由于引入了虛擬層,電信網元軟件無法直接讀取到網元硬件的信息,而只能看到其依賴的虛擬層信息。因此,引入虛擬化后,電信網元的可靠性方案也要因此進行相應的修改和優化,以滿足電信網絡的快速故障發現和恢復要求。目前,大部分虛擬網元在交付同時都能提供可靠性方案。然而各種可靠性方案存在差別,且對硬件和云平臺的要求各異。
2.5 數據面加速技術
傳統的IT通用服務器采用的多核處理器的包處理性能無法滿足通信網絡數據面網元的高性能要求,因此出現了多種數據面加速技術。傳統支撐包處理的主流硬件平臺大致可分為3個方向:硬件加速器、網絡處理器、多核處理器。
2.5.1 硬件加速器
硬件加速器由于本身規模化的固化功能具有高性能、低成本的特點。專用集成電路(ASIC)和現場可編程門陣列(FPGA)是其中最廣為采用的器件。
ASIC是一種應特定用戶要求和特定電子系統的需要而設計、制造的集成電路。ASIC的優點是面向特定用戶的需求,在批量生產時與通用集成電路相比體積更小,功耗更低,可靠性提高,性能提高,保密性增強,成本降低等;但是ASIC的靈活性和擴展性不夠,開發費用高,開發周期長。
FPGA作為ASIC領域中的一種半定制電路而出現,與ASIC的區別是用戶不需要介入芯片的布局布線和工藝問題,而且可以隨時間改變其邏輯功能,使用靈活。FPGA以并行運算為主,其開發相對于傳統PC、單片機的開發有很大不同,以硬件描述語言來實現。相比于PC或單片機的順序操作有很大區別。
2.5.2 網絡處理器
網絡處理器(NPU)是專門為處理數據包而設計的可編程通用處理器,采用多內核并行處理結構,提供了包處理邏輯軟件可編程的能力,在獲得靈活性的同時兼顧了高性能的硬件包處理。其常被應用于通信領域的各種任務,比如包處理、協議分析、路由查找、聲音/數據的匯聚、防火墻、服務質量(QoS)等。其通用性表現在執行邏輯由運行時加載的軟件決定,用戶使用專用指令集即微碼進行開發。其硬件體系結構大多采用高速的接口技術和總線規范,具有較高的I/O能力,使得包處理能力得到很大提升。
NPU擁有高性能和高可編程性等諸多優點,但其成本和特定領域的特性限制了它的市場規模。
2.5.3 多核處理器
多核處理器在更為復雜的高層包處理上具有優勢,隨著包處理開源生態系統逐漸豐富,為軟件定義的包處理提供了快速迭代的平臺。現代CPU性能的擴展主要通過多核的方式進行演進。這樣利用通用處理器同樣可以在一定程度上并行地處理網絡負載。由于多核處理器在邏輯負載復雜的協議及應用層面上的處理優勢,以及越來越強勁的數據面的支持能力,它在多種業務領域得到廣泛的采用。再加上多年來圍繞CPU已經建立起的大量成熟軟件生態,多核處理器發展的活力和熱度也是其他形態很難比擬的。
當前的多核處理器也正在走向片上系統(SoC)化,針對網絡的SoC往往集成內存控制器、網絡控制器,甚至是一些硬件加速處理引擎。
多核處理器集成多個CPU核以及眾多加速單元和網絡接口,組成了一個SoC。在這些SoC上,對于可固化的處理交由加速單元完成,而對于靈活的業務邏輯則由眾多的通用處理器完成,這種方式有效地融合了軟硬件各自的優勢。
2.5.4 VNF加速
對于性能要求一般的控制面/數據面網元,可以直接部署在通用多核處理器服務器上執行。
對于性能要求嚴苛的數據面網元,可以考慮采用輔助硬件加速器的方式。取決于業務功能的定制化和靈活性考慮,綜合成本因素,選擇ASIC或者FPGA加速器。
3 結束語
NFV作為運營商網絡轉型的核心技術架構,是虛擬化和云計算等IT技術在電信領域的一次大規模應用。目前以ETSI NFV架構為技術架構,運營商和業界廠商大力推動NFV的分層解耦和資源池化,并且在固定接入網、移動接入網、移動核心網、數據中心等場景下開展試驗驗證和商用嘗試。
雖然ETSI在NFV架構上已經定型,但在具體模塊、接口、流程等實現上還不完善,目前業界的開源社區、標準組織和廠家乃至運營商都在積極推動相關技術的進步和成熟。文章中,我們詳細分析了采用NFV分層解耦后之后,需要關注的關鍵技術。首先需要通過虛擬化技術在硬件資源池之上形成虛擬資源池,并且考慮硬件共享和硬件管理、虛擬資源管理的問題,完成虛擬資源生命周期管理;其次,通過管理和編排系統對各類資源形成視圖,完成虛擬網元的生命周期管理和網絡服務的管理,并且解決各層故障上報和故障關聯的問題,同時還要處理好NFV管理編排和OSS的關系,形成新的網管體系。電信業務有著高可靠性和實時性等要求,因此僅僅實現NFV分層解耦無法滿足這類特殊要求。要實現電信業務的5個9可靠性要求,需要從下向上在每個層面都提供可靠性保障,并且各層面能夠進行聯動,提供系統級別的可靠性;要實現電信業務實時性的要求,數據面網元功能需從硬件實現到系統設計都進行針對性的加速。
以NFV為基礎的運營商網絡轉型大幕已經開啟,隨著技術的成熟,未來將很快看到NFV架構的電信網絡,以NFV為出發點CT和IT將走向深度融合。
參考文獻
[1] 李正茂. 通信4.0[M]. 北京,中信出版社, 2016
[2] Network Functions Virtualization (NFV); Management Orchestration: GS NFV-MAN 001 V0.6.2 (2014-07)[S]. ETSI, 2014