鄧靈莉,顧寧倫,袁向陽,余立,馮俊蘭, 鄧超,楊志強,張同須,吳榮宇,張新鵬
(1. 中國移動通信有限公司研究院,北京 100053; 2. 中國移動通信集團有限公司,北京 100032; 3. 中國移動通信集團河南有限公司,河南 鄭州 450008)
網絡智能化是AI技術與通信網絡的硬件、軟件、系統、流程等的深度融合,利用AI技術助力通信網絡流程智能化,降本、增效、提質,促進技術體系變革,使能業務敏捷創新。其需求動機主要來源于以下3個方面。
(1)管理優化需求:運營商現有生產網絡層級多、網元多、廠商多、版本多,而現有投訴處理、故障管理等運營運維流程依賴工單流轉與人工操作,效率有待提升、經驗難以固化和復制推廣。
(2)網絡演進需求:基礎設施虛擬化和網元軟件化在實現資源彈性和動態調度等新特性的同時,也給分層解耦的轉型網絡帶來了更多的管理層次和廠商組合,加之5G網絡的復雜配置和能效管理,進一步加劇了網絡管理的復雜度。
(3)業務拓展需求:隨著個人用戶市場的飽和,作為被寄予厚望的潛在增長點,新型智能服務和行業應用對網絡服務從時延到可靠性、帶寬及連通性等各方面均提出了更為嚴苛的個性化需求。
自動駕駛網絡[1]提出通過簡化網絡架構、封裝自治域和提供業務/網絡操作控制閉環,實現用戶體驗最優化、管理操作自動化和資源效率最大化,為網絡智能化明晰了目標架構和實現路徑。
自動駕駛網絡概念最早于2019年5月TM Forum舉辦的數字轉型峰會期間,由中國移動等公司主導發布的《自動駕駛網絡白皮書》[1]首次提出,旨在為未來網絡管理提供參考架構和管理框架。一方面為垂直行業的客戶定義全自動零等待、零接觸、零故障(Zero-X)的創新網絡和ICT服務;另一方面為服務運營商的規劃、服務/營銷、運營和管理,提供具備自我配置、自我修復、自我優化和自我演變(Self-X)能力的電信網絡基礎設施。
如圖1所示,自動駕駛網絡定義了三層四閉環的分層架構[1],一方面底層網絡資源被劃分成包含網絡設備及其管控系統的自治域,域內的網絡功能復雜性被封裝為一組網絡服務,同時域內網絡功能運維管理本身實現高度自動化;另一方面以自治域為基礎,形成分別對應資源操作、服務操作和業務操作的3個層次,層內提供自動閉環,層間通過意圖接口交互,使上層服務調用獨立于下層實現。

圖1 自動駕駛網絡/網絡智能化的分層架構
? 資源運營層:在每個自治域中,通過控制網絡資源操作交互的資源閉環實現網絡資源和能力調度自動化。
? 業務運營層:通過面向業務操作,并與網絡資源操作交互的業務閉環,實現跨自治域的網絡規劃、設計、開通、配置、保障和優化自動化。
? 商務運營層:通過實現業務域業務操作之間交互的商務閉環,為客戶和合作伙伴提供自動駕駛網絡服務的商務支持和運營自動化。
? 用戶閉環:通過與上述3層中其他3個閉環的交互實現用戶服務,是觸發對應商務/業務/資源閉環的主線程。
由于通信網絡管控、維護和運營的場景多樣性和業務豐富性,作為網絡智能化的終極目標,為實現自動駕駛網絡,涉及多層次、跨領域的復雜協作,難以一蹴而就,需要在具備行業共識的分級標準和評測體系指導下,分階段發展演進。
與之對應,根據自動駕駛網絡分級框架[1],網絡智能化能力逐步提高包含特定場景的功能要求以及覆蓋場景范圍兩個維度的要求,具體包括以下幾個級別。
? 級別0——手工運維:系統僅提供輔助監控功能,所有動態任務都必須手動執行。在此級別中,Zero-X不適用。
? 級別1——輔助運維:系統根據預先配置執行某個重復的子任務,以提高執行效率。在此級別中,Zero-X僅適用于個別情況。
? 級別2——部分自治/初級智能化:在某些外部環境下,系統基于人工智能模型為某些單元啟用閉環監控運維自動化(自動閉環)。在此級別中,Zero-X僅可用于單個自治域內場景,但不能適用于跨域網絡服務。
? 級別3——有條件自治/中級智能化:基于級別2的能力,系統可實時感知環境變化,并在特定網絡域中,自動實現自身優化調整以適應外部環境,從而實現基于意圖的閉環管理(認知閉環)。在此級別中,Zero-X可用于特定的跨域網絡服務和自治域內場景。
? 級別4——高度自治/高級智能化:基于級別3的能力,在更復雜的跨域環境中,系統支持基于服務和客戶體驗驅動的預測、分析和決策(主動閉環)。在此級別中,Zero-X可用于特定網絡服務的端到端全生命周期操作。
? 級別5——完全自治/完全智能化:系統擁有覆蓋全生命周期、跨域、跨服務的自動閉環能力。在此級別中,Zero-X可用于任何網絡服務的端到端全生命周期操作,這是電信網絡演進的目標。
如圖2所示,自動駕駛網絡對電信運營商的網絡管理體系提出了空間和時間兩個維度的需求。一方面,自動駕駛網絡的分層分域閉環自治架構和跨層業務驅動交互要求運營商網絡管理體系在空間維度實現功能增強(“加法”)和接口簡化(“減法”);另一方面,自動駕駛網絡對AI技術的引入和網絡管理本身復雜度,要求運營商網絡管理體系在時間維度實現持續迭代和逐步提升(“螺旋上升”)。

圖2 網絡智能化體系架構
從功能增強角度來看,首先,在網絡管理域、各專業網絡域和基礎設施域固化人工經驗形成靜態規則,引入自動閉環;其次,從用戶閉環驅動角度來看,擴展已有原始數據采集體系,實現覆蓋各專業網絡KPI感知、端到端業務感知和用戶體驗感知的網絡感知體系;最后,分別在各層次自動閉環的感知、分析和決策環節,系統性地引入大數據和AI技術,實現超越人工經驗的意圖驅動認知閉環。
從接口簡化角度來看,首先,使用規則簡化各層管理接口;其次,根據運營商策略統一治理網絡數據/知識的接入、匯聚、存儲和分發;最后,進一步通過意圖封裝管理接口,實現上層意圖到下層規則的自動轉換,并提供達成情況反饋。
從持續迭代角度來看,考慮到現代AI技術數據驅動的特性,結合自動駕駛網絡客戶/業務驅動的目標,嵌入在各個管理層次/自治域中的AI算法/知識/規則,需要持續監測、演進和迭代才能跟隨網絡/業務/用戶的動態發展保持“活力”,為此,網絡管理體系需要建設面向算法模型、微服務、網元/網管的DevOps機制,為各層認知閉環的持續迭代提供數據、訓練、封裝和發布服務。
建設網絡智能化能力、提升網絡自動駕駛水平,助力運營商實現數字化轉型,已成為全球業界共識。如圖3所示,標準組織、行業組織、開源組織紛紛布局、搶占先機,覆蓋了網絡智能化技術體系的各個領域。

圖3 網絡智能化產業組織工作布局
2.1.1 通信技術領域
TM Forum自2019年啟動自動駕駛網絡項目至今,已經發布2篇白皮書[1-2]和4項規范標準,定義了目標愿景和工作規劃[3](即將滾動更新)、商業需求[4]和技術架構[5]。
ETSIISG ZSM正在討論在其針對跨域端到端網絡運維管理層次的ZSM框架中如何引入閉環自動化,并針對數據驅動的機器學習和AI算法進行優化[6]。
自4G面世以來,3GPP已開始通過引入無線專業的自組織網絡(SON)控制閉環和路測最小化(MDT)數據采集增強機制,實現移動網絡的部分自動化。面向5G,除了在無線工作組RAN和網管工作組SA5繼續完善增強SON/MDT[7-9]之外,3GPP的核心網架構工作組SA2和網管工作組SA5還分別引入了針對核心自治域與服務運維層次的本地智能分析邏輯功能NWDA[10-12]和MDA[13],以及閉環SLS保證機制[14-16]和意圖驅動管理IDM接口[17-18]。
2017年,ITU-TSG13建立了包括 5G(FG-ML5G)在內的面向未來網絡的機器學習的焦點小組,并先后發布了面向未來網絡的機器學習[19]和數據處理框架推薦標準[20]。
2019年,O-RAN聯盟參照3GPP的5G RAN網絡架構發布了無線智能管控架構[21],以及在其中應用AI/ML技術的指南[22]。其中包含對應于服務運維域的非實時無線智能控制器non-RTRIC[23]和對應于無線自治域的近實時無線智能控制器near-RTRIC[24],以及對應于基礎設施域的虛擬化白盒網元管理系統[25-26]。目前,O-RAN聯盟正在制定和完善無線自治域北向意圖接口標準A1AP[27]和基礎設施域北向規則接口標準E2AP[28]。
IETF早在2014年便正式成立了自主網絡(autonomic network)工作組ANIMA,并于2015年發布了對應于傳輸自治域IP網絡的自主網絡概念定義[29]和需求分析[30]?;贗ETF開發的YANG數據建模語言[31]和網絡配置協議[32-33],網絡管理模型工作組NETMOD和網絡管理研究組NMRG正在分別進行自主網絡北向規則接口標準[34]和意圖接口管理需求[35]的研發工作。
負責OpenFlow系列協議標準制定的ONF,于2015年4月在控制器北向接口項目組成立意圖驅動網絡(IBN)研究課題,并于2016年10月發布基于其SDN功能架構[36]與北向接口實現IBN的參考指南[37]。
ETSI ISG NFV已將MANO自動化作為近期主要工作目標之一,為此開展了針對虛擬基礎設施層自動閉環的規則策略[38]和意圖框架[39],以及面向VNF持續迭代CI/CD測試標準[40-41]的研發工作。
2.1.2 通用智能領域
ETSI ISG ENI定義了網絡AI應用的類別[42],即將發布用于增強網絡智能的通用功能架構[43],及其與已有網絡管理體系的映射[44]。
2004年W3C發布由Web本體工作組(WebOnt)制定的Web本體語言推薦標準OWL[45],通過定義類以及類的屬性將領域知識形式化:形式化定義個體并說明它們之間的屬性;并在OWL允許的層次上,對類和個體進行推理。
2017年臉書、微軟等公司聯合推出開放的神經網絡交換ONNX標準[46],通過標準化神經網絡計算圖(模型文件)的表示格式,推動各類神經網絡開發框架的互通互用與優化共享。
2017年和2018年相繼成立的Linux網絡基金會和Linux人工智能與數據基金會,分別提供了開放網絡自動化平臺ONAP[47]、開源SDN控制器OpenDaylight[48]、網絡大數據與 AI工具集PNDA[49],以及模型集市Acumos[50]、邊端模型優化與推理框架Adlik[51]等一系列面向網絡智能化的通用自動化平臺與智能化工具。
2019年,微眾銀行發布聯邦學習開源框架FATE[52],作為聯邦學習全球首個工業級開源框架,FATE為實現機器學習、深度學習、遷移學習提供跨域聯邦學習方案與交互信息管理。2020年IEEE正式批準首個聯邦學習框架標準[53],為互不信任或因為監管要求需要隔離的不同管理層/自治域之間進行協作學習提供參考標準。
2.1.3 分級評測領域
2019年基于自動駕駛汽車分級框架和認知閉環(執行、感知、分析、決策、意圖體驗)的網絡智能化分級框架被TM Forum的《自動駕駛網絡白皮書》[1]采納發布后引起業界廣泛關注。
3GPP[54-55]、TM Forum[5]、ITU-T[56]隨后分別啟動了針對網元管控運維層次以及服務與運營層次的智能化分級研究課題、推薦標準與行業標準項目。
2020年,GTI的eMBB課題組[57]啟動網絡智能化專項并應用分級框架對網絡智能化應用進行初步評估。
由于網絡智能化的目標架構涉及網絡管理體系各領域的橫向拉通和各層次的縱向聯動,而相關領域各個標準組織規范研發和開源社區參考實現之間缺乏有效協同機制,為此多個行業組織正在積極布局爭奪網絡智能化的產業引導話語權。
2020年9月,TM Forum開始組織針對自動駕駛網絡的跨組織協作專題研討會議,計劃從推動基本概念、術語、框架(包括自動駕駛網絡的定義、閉環、分級、自治域、認知閉環等)的共識入手,加強專注于各網絡自治域內部的行業組織間的深入協作,共同開展關鍵技術、接口標準、示范應用以及測評規范的開發。
ITU-T負責下一代網絡標準的SG13研究組,繼2017年建立FG ML5G焦點小組并發布面向未來網絡的機器學習功能框架[19]、智能分級評估框架[56]和數據處理框架[20]之后,又于2020年11月建立FGAN自動駕駛網絡焦點組,計劃開展針對標準和開源的產業引導工作。
2020年12月,NGMN啟動網絡自動化與自治項目,計劃在網絡自動化平臺基礎上,進一步開展網絡智能化需求調研,并從運營商角度出發為促進相關標準與開源的開放產業合作提供建議。2021年1月,經董事會批準,NGMN正式成立針對軟件化網絡的端到端運營模式研究專項工作組,計劃就軟件化網絡的持續集成和持續迭代等運營管理轉型進行引導。
2020年9月至2021年1月期間,Linux網絡基金會組織了針對網絡智能化需求場景、研發策略與應用部署的公開調研[58],并在旗下測評認證委員會(CVC)討論,與TM Forum、O-RAN、3GPP和IETF等標準組織協作,規劃開展針對智能網絡服務和網絡AI算法的評測工具研發與實驗環境構建。
根據最新調研分析[58],如圖4所示,業界的網絡智能化轉型總體尚處于起步階段:一方面,從網絡自動駕駛級別角度觀察,大部分運營商在人工運維、輔助自動化、初級智能化、中級智能化、高級智能化與完全智能化6個級別中處于初級智能化級別;另一方面,從應用研發階段角度觀察,業界公司在尚未啟動、概念驗證、分散試點、規模商用與長遠計劃5個研發階段中大部分處于概念驗證和分散試點階段,尚未進入規模商用成熟期。

圖4 網絡智能化產業調研分析:總體進展
領先運營商和廠商普遍采用統一平臺進行網絡智能化應用的引入與協同。如圖5(a)所示,研發應用階段越高,選擇平臺策略的公司占比越高;進入規模商用階段后的所有公司均采用統一平臺。在平臺的功能規劃方面,AI算法是所有公司的首要需求,其次是提供數據接入能力與業務應用,最后是提供統一研發部署與受信任的AI能力。
與此同時,運營商普遍傾向自研。如圖5(b)和圖5(c)所示,超過一半的運營商自研網絡智能化平臺,超過三分之二的運營商自研網絡智能化應用。其中,直接服務于客戶和管理一線的運維、保障、優化等是業界普遍最為關心的應用類場景,而智能網元、能效管理、應用優化3類應用場景,由于受本身技術難度大、標準化程度低、不受掌控等客觀條件影響,排名普遍偏后。

圖5 網絡智能化產業調研分析:研發策略
如前文所述,網絡智能化已成為通信行業關注熱點:各標準組織和開源社區的已有工作布局覆蓋了網絡智能化技術體系的所有管理層次和各個專業領域,并開展了多樣的跨組織協作。與此同時,運營商生產環境下的相關實踐仍處于起步階段,并由于缺乏明確的產業引導而面臨諸多挑戰,這主要體現在統一行動路線、構建愿景共識和孵化產業生態3個方面。
現有分級框架雖從覆蓋場景角度提出了網絡自動化和智能化能力提升的分階段建設路徑,但未對網絡智能化實踐中如何避免各場景煙囪式開發、拉通現網各專業各廠商能力差異并提升和維持網絡智能化水平提供明確的可操作建議。
一方面,面向現網運營的高層(業務運營域與商務運營域)能力建設需要解除對底層(網絡自治域和基礎設施域)的能力依賴和實現綁定。為此,需要持續推動基礎網絡數據采集和管理控制的能力開放與接口標準化。
另一方面,面向網絡演進長期發展,考慮到網絡基礎設施的云化轉型,高層(業務運營域與商務運營域)的未來能力建設重點,將從關注網絡設備本身運行狀態或局部網絡KPI,擴展到面向業務的體驗感知能力與智能保障機制建設,需要著重加強推進網絡感知域體系建設。
此外,如何為網絡自動化智能化水平的快速提升與長期演進做好頂層設計,實現上述兩方面工作的統籌協調,一方面,確保短期攻關技術積累能最大程度地為長期能力建設與優化迭代所復用,另一方面,面向端到端業務目標形成覆蓋異構網絡基礎設施的敏捷開通、統一管理和運維保障體系。為此,需要著重推進與網絡基礎設施解耦可復用的通用智能域體系建設。
目前,針對網絡自治域與基礎設施域的自動閉環、本地AI及KPI感知功能增強如何與通用智能域AI平臺提供的數據、訓練、封裝和部署服務對接,缺乏明確的產業共識與可參照的標準規范;各領域的規則、意圖、知識和模型交互接口規范由各標準組織分頭制定缺乏協同,存在架構冗余與接口不一致的情況。
上述現象的根本原因在于傳統通信行業標準協作以網元和網絡為核心,以專業領域作為分工依據。各標準組織之間松散耦合的協作模式,難以為需要跨層跨域進行統一規劃建設的網絡感知域與通用智能域建立體系化規范。為此,需要引導產業各方建立面向全程全網自動化和智能化能力體系建設的跨組織協作平臺。
持續提升網絡智能化能力,涉及網絡運維責任逐漸從人轉移給軟件系統,系統決策依據從可解釋的經驗擴展到難以直觀理解的人工智能算法模型,并非單純技術實現問題。
AI核心本質上是一個數學和計算的問題,現有工作更多的是將其他領域AI技術直接應用在通信網絡問題上做一定嘗試,而對網絡所需的核心智能化能力的數學問題抽象不夠。同時由于缺乏反映通信網絡的公開數據集、實驗環境、知識庫等研發AI算法的基礎,因而缺少面向網絡智能化的核心算法和理論。
根據LFN的產業調研數據分析[58],實驗環境、數據集、人才儲備是當前業界主體初級智能化水平和未來持續提升長期面臨的共性挑戰;相對領先的運營商和數字服務提供商還普遍面臨網元標準化、數據標準化的挑戰,也需要提前規劃、做好儲備、優化應對。從廠商角度看,網元標準化與研發環境是當前面臨的共性挑戰,“不信任完全網絡智能化控制”是進行長期產品規劃時主要擔心的問題。
因此,更需要產業協力構建服務于網絡智能化技術大規模研發、測試、認證、迭代的準現網環境,為共性能力研發沉淀、算力部署驗證、數據原料加工提取提供有反饋的試驗平臺。
據Tractica/Ovum研究和預測,到2025年,全球電信業對AI的軟件、硬件和服務的投資將達到367億美元,網絡/IT運營監控和管理將成為電信業最大的AI應用,占據電信業AI支出的61%。
伴隨著中國社會與經濟的數字化轉型,中國運營商的網絡智能化實踐也在加速。中國移動成立九天特區并率先提出“2025年建設L4級別的自動駕駛網絡”的發展目標[59]、中國電信提出“云改數轉”的云網發展運營規劃[60]、中國聯通進行了圍繞AI賦能網絡的組織架構調整并發布自動駕駛白皮書[61]。
可以預見,中國作為全球網絡規模最大、客戶數量最多的地域之一,能充分展現網絡智能化降本、增效、提質的規模效應;具備全球最復雜的網絡架構、最豐富網絡服務運維場景,擁有多年積累的大量人工運維管理經驗,可檢驗和凸顯網絡智能化應用效果;在國家政策引導和相關企業的不懈努力下,積累了豐富的產、學、研聯合創新經驗,將成為帶動全球網絡智能化產業整體轉型的核心力量。
面向未來,我們期待以中國企業為代表的新型數字服務提供商等產業各方,繼續發揮其在國際標準、開源社區和產業協作中的影響力,結合自身網絡運營體系改革、運維自動化能力提升的應用需求,與內部人工智能平臺算法/能力/應用研發積累的經驗,為通信網絡運營商、網絡設備供應商、網管系統集成商、第三方科研機構和解決方案提供商的網絡智能化聯合創新和應用實踐,搭建產業協作的開放創新平臺。