師 嚴 胡雅坤 呂文琳 張 賀 陳 璇
1 中國聯通研究院 北京 100048
2 中國聯合網絡通信有限公司山東省分公司 濟南 250000
3 中國聯合網絡通信有限公司智網創新中心 北京 100044
基于大容量、高帶寬、長距離、低時延和確定性等特征優勢,光網絡是連接和承載移動通信網絡、數據通信網絡、衛星通信網絡、海洋信息網絡的基礎通信設施,以網絡底座支撐未來社會各行業的數字化轉型,實現萬物互聯。從全生命周期運營維護的現狀來看,光網絡以設備、系統為中心,對用戶體驗缺少感知;系統優化依賴被動響應,大量網絡的運維都是基于用戶投訴驅動;網絡運維日益復雜,以人為主的運維方式已無法適應業務的規模增長,封閉的網絡架構已難以有效支撐業務的靈活性;傳統的集中式管控,仍然依賴大量人工的運維模式,導致現有網絡無法及時響應、匹配客戶的商業意圖,物理網絡與商業意圖之間存在巨大的鴻溝,無法滿足當前業務需求[1]。
未來光網絡規模會越來越龐大,同時用戶對光網絡性能、可靠性的要求會更高,但傳統運維模式難以支持光網絡高效管理和控制,因此迫切需要基于智能化技術實現全生命周期“自規劃、自配置、自修復、自優化”的自智光網絡。將數字孿生技術引入光網絡中,利用大數據分析、光電數理模型和深度學習算法實現光網絡的動態建模和智能優化。光網絡數字孿生技術可以將物理空間中的光系統/網絡及設備的運行狀態置于數字空間中進行跟蹤、分析、預判、處理,對于網絡的規劃、分析、優化控制,都可以在數字孿生體中進行預演,同時,真實網絡的數據通過交互接口不斷傳入數字孿生體,對孿生體進行迭代更新,這樣從數字孿生體中便能夠可視化監測網絡的實時狀態,并且能夠便捷地查看網絡規劃和優化效果,從而將迭代過選取的最佳部署策略用于真實光網絡中。
本文針對新一代光網絡特點和光網絡智能運維需求,提出光網絡數字孿生體系架構,對光傳輸系統建立高保真、多維度、動態響應的映射模型并在控制系統中制定高效、精準、智能的優化策略,為光網絡數字化轉型和全光網絡的構建提供有益參考。
本文構建了光網絡數字孿生體系,自下而上分為光網絡層、光網絡數字孿生系統層、應用層,如圖1所示。其中,光網絡層是物理空間中需要進行數字孿生仿真建模的物理實體,包括光器件、光模塊、板卡、設備、系統及網絡等;光網絡數字孿生系統層是實現光網絡從器件、網絡和業務的多層次孿生建模的主體;應用層包含規劃、建設、維護、優化、運營等多方面的網絡創新技術及應用,經過意圖翻譯后,驅動孿生體管理模塊進行模型調用與編排。

圖1 光網絡數字孿生體系架構圖
光網絡數字孿生系統,是光網絡孿生體系架構的核心系統,包括數據層、孿生模型層和孿生體管理。
1)數據層:通過傳感采集、性能監測、信息上報等方式,從光網絡層或管控平臺采集不同類別的數據,并存儲于數據層。在數據層會對采集的不同類型的數據進行融合處理及深度挖掘,為孿生模型層提供準確完備的數據來源。
2)孿生模型層:通過不同模型實例之間組合,向應用層提供服務,從而最大化網絡業務的敏捷性和可編程性;同時,在孿生空間或實體網絡空間中,能夠對預測、調度、配置、優化等目標完成充分的仿真和驗證,從而保證策略下發到物理網絡時有效可靠。
3)孿生體管理:負責孿生系統的全生命周期記錄、可視化呈現和孿生層管理等,能夠對模型的準確度進行校驗,對模型進行持續修正和優化;負責數據和模型的認證、授權、保密、準確性和完整性等安全保證。孿生體管理包括模型管理、模型修正、模型編排和安全管理等功能。
光網絡是一個龐大復雜的系統,針對光網絡物理實體及運行機理構建數字孿生系統注定會面臨巨大挑戰,應對挑戰的關鍵是突破精準感知、仿真建模以及模型編排三類重點技術。上述三類技術的突破將會從不同維度為構建數字孿生系統奠定基礎。
光網絡精準感知的重點與難點在于光網絡數據的采集、融合與挖掘。光網絡數據既包括業務、配置、性能、告警等光網絡運行狀態數據,也包括功率譜、噪聲譜和增益譜等影響光網絡運行狀態的光學參數。光網絡數字孿生系統采用統一的數據采集系統/模塊,通過傳感器探測、光性能監測、接口交互協議等多種感知技術和采集上報機制,實現對光層多源數據的動態采集和高速傳輸,實現對光鏈路衰減、光信噪比、非線性損傷等多種性能指標的感知。
在光網絡數字孿生系統中,數據反映光網絡運行狀況,模型表征物理對象運行機理。在光網絡規建維優營全生命周期的管理和控制過程中,需要采集多類關鍵指標數據,如表1所示。

表1 面向數字孿生的光網絡關鍵指標
光網絡數字孿生系統對數據采集周期、精度及維度都提出了更高的要求,傳統單一的數據采集方法無法滿足光網絡數字孿生系統的需要。
在硬件設備上,針對光網絡的不同層次有相應的感知技術,例如,通過相干光模塊DSP芯片,可以計算色度色散、偏振模色散、偏振相關損耗與偏振態變化等較難獲取的光層損傷信息;基于φ-OTDR技術可實時探測光纖鏈路中的異常震動等動態變化事件,實現光纖物理環境的精準感知;利用光標簽調頂技術,通過在每個光放站解調光標簽信號,獲取每個OTS段的OSNR以及單波光功率,補充現網中光性能監測(Optical Performance Monitor,OPM)部署位置有限的問題。通過設備層面的感知技術,可以在物理空間獲取更豐富、更精細的光網絡信息,為光網絡數字孿生系統的構建提供了強有力的數據支撐。
在數據采集和上報方式上,傳統的光網絡數據采集技術是主動查詢的采集方式,如簡單網絡管理協議(Simple Network Management Protocol,SNMP)和網絡配置協議(Network Configuration Protocol,NETCONF),此種方式為管控系統常用采集模式,但采集效率相對較低,查詢精度最低為分鐘級別。因此,面對大規模、高性能的網絡監控需求,支持主動推送模式的網絡遙測(Telemetry)技術更能滿足光網絡數字孿生系統對實時、高速、精細的數據要求。
評價仿真建模技術的關鍵指標是誤差。光網絡孿生建模技術的關鍵,是能夠精準模擬物理實體的運行機制,并通過數字化形式映射到信息空間,能夠支持系統模擬仿真、性能實時評估與優化、告警與故障溯源等各類應用場景。光網絡孿生模型層包含基礎模型、傳輸模型和功能模型,如圖2所示。

圖2 光網絡孿生分層模型示意圖
1)基礎模型,是組成光傳輸系統的各種單元的虛擬實體。光網絡中器件多樣,結構和功能復雜,可分為器件模型和設備模型兩大類:器件模型,能夠構建光傳輸系統中所需各種器件的模型,包括光收發機、光放大器件、波長選擇開關(Wavelength Selective Switch,WSS)/陣列波導光柵(Arrayed Waveguide Grating,AWG)器件、光濾波器件、光纖等[2];設備模型,從光網絡設備及連接的角度,對端口、板卡、機框、機架、網元等以及之間的連接所構建的模型。
2)傳輸模型,是模擬光信號從發射端經過光纖傳輸和中繼放大后到達接收端的過程,包括偏振效應、光放大器自發輻射(Amplifier Spontaneous Emission,ASE)噪聲、收發機噪聲、非線性噪聲、濾波效應等各種噪聲及損傷的影響,最終能夠在時域和頻域對光信號傳輸過程進行精準的模擬,并與真實網絡動態響應[3-4]。
3)功能模型,基于數據層提供的鏈路、網元、網絡的數據信息進行模型調用和訓練,輸出結果為優化器件模型、網絡部署決策、配置仿真等提供輔助參考。功能模型可以包括以下五類:健康度評估模型,針對器件或鏈路層級的健康度情況進行分析,提前對亞健康狀態的物理器件或者鏈路進行預警;性能預測模型,構建時間序列預測模型或者回歸分析預測模型,對不同類型的傳輸性能進行預測,為決策、配置提供依據;傳輸優化模型,基于已有的基礎模型以及傳輸模型,針對已存在或預測性問題構建傳輸優化模型,給定優化方案,并能夠在孿生系統中進行仿真驗證;故障模擬模型,對物理拓撲、傳輸質量指標、業務信息、外部因素等改變進行仿真操作,模擬可能發生的故障,對結果進行分析并給出預防措施;動態配置模型,通過構建動態模型,利用孿生系統對器件配置、路由配置進行仿真,輔助運維管理決策。
光網絡物理實體與數理模型之間很難達到百分之百的仿真精確度。因此,對于數字孿生系統而言,需要通過各種仿真建模技術不斷完善孿生模型,確保模型誤差小于應用場景所承受的最小仿真誤差。從孿生模型構建方式可以分為物理驅動模型、數據驅動模型和物理—數據混合驅動模型。
1)物理驅動模型:利用物理理論,推導精準可解釋的理論模型,直接對請求做出相應響應,優勢是精準、可解釋性強且通用性好,因此也被稱為白盒模型。例如,針對光纖非線性計算的高斯噪聲(Gaussian Noise,GN)模型,針對光纖傳輸模型的分步傅里葉方法(Split-step Fourier Method,SSFM)。
2)數據驅動模型:對于一些建模過程較為復雜的模型,尤其是光纖傳輸過程中的偏振損傷和非線性效應等,可以直接將光通信模塊和系統當作黑盒,利用機器學習算法和數據驅動的思想,向輸入、輸出端口直接發送仿真服務指令,探索其輸入輸出之間的函數關系,模擬光通信模塊和系統真實的模型機理。例如,基于雙向長短期記憶算法實現光纖信道建模,利用神經網絡進行EDFA孿生建模。
3)物理—數據混合驅動模型:基于知識規則的模型,運行機理部分被感知。當子系統模塊部分已知,難以獲知全部的模塊運行原理時,在現有已知部分基礎上,根據歷史數據或者專家經驗與機器學習模型相結合,構建接近真實機理的灰盒模型,對實際系統鏈路中每個模塊進行數字化建模。
光網絡數字孿生模型層包括不同層次的數字模型,模型間同時存在復雜的依賴關系,因此如何對不同模型進行編排是數字孿生精準仿真的關鍵之一。數字孿生系統將模型仿真過程原子化,使每個原子模型都具備自動仿真的能力;再結合應用場景的需求,根據數據流向解析原子模型之間的關聯關系,完成各數字孿生體之間的數據傳遞;通過設置原子模型的在線仿真時序,將各類仿真任務序列化,實現對孿生模型的編排。孿生模型編排后的結果可通過文件保存,便于以后直接讀取。孿生體管理模塊會為編排后的孿生模型分配內存和計算資源,創建數字孿生模型實例。
圖3是傳輸質量評估模型的編排過程。孿生體管理模塊會首先對任務信息進行轉譯,確定功能模型。當功能模型接收到孿生體管理模塊請求后,定位最小顆粒器件模型,選定基礎模型和傳輸模型組合的模型簇。孿生體管理模塊會對模型簇進行組合編排,并根據拓撲信息中的連接關系設定數據流向,根據流向設置模型的在線仿真序列,構建當前任務流程以及計算任務,完成數字孿生模型實例的創建。

圖3 傳輸質量評估模型的編排示意圖
網絡規劃、建設部署、運營維護及網絡優化是運營商運營的四個生命周期階段,直接影響到資本性支出(Capital Expenditure,CAPEX)和運營支出(Operational Expenditure,OPEX)等相關成本。數字孿生光網絡通過網絡數字化、感知實時化、模擬在線化的共同創新底座,來支持全生命周期不同場景的智能化需求。
隨著光網絡業務量的增多,光網絡節點數量的快速增長,傳統OPM逐漸無法滿足應用需求。特別是在動態業務場景下,光性能監測時效性不足,將極大影響業務快速開通與恢復。
基于數字孿生的快速業務發放,通過實時精準感知能力,數據采集模塊同步光鏈路上各收發功率、光通道/線路誤碼率、光器件相關性能等實時參數,以及鏈路時延、拓撲資源、業務資源、帶寬資源等業務及資源信息,構建路由性能及時延地圖,如圖4所示。根據用戶意圖,結合資源利用率及均衡程度、性能及時延地圖等當前網絡狀態,通過設定相關的路由策略(如最小時延、最優性能路徑、最優SLA等),計算得到最優或次最優的路由方案。在數字孿生系統中仿真模擬最優或次最優的路由方案,基于實時網絡數據計算各監控點單波功率、OSNR等,評估當前通道質量、模擬調試預發放業務、評估預發放業務對在網業務的影響,并模擬調整線路,自動生成配置適配全網性能最優等。最后數字孿生系統將最優路由配置,通過智能管控系統進行端到端業務發放。業務下發后,該業務及承載業務的相關資源、鏈路也將通過實時精準感知以及性能評估進行實時監測。

圖4 快速業務發放示意圖
在現網中,由于性能損傷導致光層故障多且影響范圍大、故障處理周期長成本高、故障難以提前預測等問題。傳統運維手段只有當傳輸質量降低到引發故障時才被感知到,無法在故障發生之前提前識別網絡性能下降的風險;后續的故障處理需要人工參與,選擇優化方案也依靠人工經驗。
基于數字孿生的光網絡性能預測評估流程如圖5所示。通過在光網絡數字孿生系統中設置光網絡健康度任務,自動識別或人工指定需要監測性能指標,并將任務下發給指標預測模塊。指標預測模塊通過對基礎模型進行調用和編排,構建基于OSNR/BER的傳輸模型,結合歷史數據實現性能預測評估功能模型,對鏈路、系統、業務的性能趨勢變化進行分析。基于實時性能數據,通過性能預測評估模型綜合評估業務質量,并與預警閾值相比,反饋光網絡鏈路、業務健康度、資源利用率及風險等級等,預測潛在的性能劣化、硬件故障或者資源利用過載等亞健康狀態。
當網絡狀態被判定為亞健康狀態時,決策模塊會上報亞健康預警,同時結合機器學習算法,依據網絡優化規則和專家經驗等知識庫,生成一種或者多種網絡自優化策略,如調整光功率、對信號進行電再生、增加均衡站或啟動均衡功能、基于物理層感知的重路由計算等;在光網絡數字孿生系統中,對不同的自優化策略進行仿真驗證,模擬優化策略后的網絡狀態、性能等參數變化,最終找到最佳策略,反饋至管控系統,下發至實體網絡,實現網絡的自優化。
對于質量評估超過標準的鏈路和業務,數字孿生網絡推演質量劣化前后告警變化過程,分析告警故障原因,觸發故障分析定位功能,啟動自愈/優化策略實現網絡自愈/自優化。
光網絡數字孿生系統中可以模擬已發生或者未發生故障,從而進行溯源或者預防方案的制定,輔助光網絡系統具有更快的問題定位能力、更強的自愈能力,如圖6所示。通過數據采集平臺,實時感知獲取如光器件的收發功率、光通道誤碼率、光模塊的偏置電流及溫度等數據。通過性能監測任務,監測和評估光模塊、設備、光纖鏈路以及光通道是否有異常或者存在劣化的可能。

圖6 基于數字孿生的光網絡故障溯源及模擬
當存在異常/劣化、告警上報或發生故障時,啟動故障溯源分析及排障流程。結合拓撲、資源及業務所在物理設備,依照層次化規則和拓撲規則進行模型的選擇及編排。當光網絡出現劣化/異常預警時,數字孿生系統能夠根據當前網絡的實時狀態,通過修改模型的配置參數,模擬持續劣化下可能發生的故障及光網絡受到的影響;結合知識管理模塊及AI模塊的分析功能,根據模擬計算的結果分析可能的故障根源及衍生故障;能夠通過自優化策略模擬優化結果,并通過管控平臺進行配置下發。
當光網絡上報告警或已經處于故障時,數字孿生系統能夠結合知識管理中的故障相關性規則庫及故障場景規則庫,快速定位故障根源。對故障前T時間內的歷史狀態回溯,并運用知識推理技術,準確定位光網故障發生的位置。根據歷史數據進行狀態回溯,確定故障原因,并能夠進行排障模擬,當模擬結果滿足期望結果時,執行故障排除流程。
綜上所述,數字孿生技術將會成為網絡智能運維的重要技術,從設備到系統的全生命周期狀態感知和管理,包括網絡的“規劃、部署、運行、優化”全過程,都會在數字孿生體中體現;對于規劃和優化策略的預演只需較低的時間和資金成本,從而達到快速而準確的仿真,便于迭代找到最佳的規劃和優化策略,以部署于真實網絡中達到最佳性能;網絡拓撲可視化和性能實時監測,診斷網絡的狀態和進行故障預警,交互界面也更有利于運營商清晰查看網絡全生命周期動態和進行優化策略配置,這些優勢都是數字孿生技術將在光網絡中實現的價值。
數字孿生技術為光通信網絡發展提供了很大機遇,只要獲得足夠的數據和精準的模型,便能夠設計出完全吻合現實網絡的映射孿生體,對于網絡全生命周期運維都有很大的價值。但這同時也帶來一些問題:一方面,精準的模型需要足量的數據,如此大量的來自網絡不同部分的數據帶來了存儲和隱私問題;另一方面,精準的模型往往伴隨著復雜度過高,導致運算時間緩慢,影響實時動態智能運維的目標,所以在速度和精度上取得良好平衡是有待研究的問題,同時,數字孿生模型的不斷更新也對與真實網絡的實時交互提出了較高的需求。