

之前我們聊過關于AI與網絡切片對于5G網絡運維的影響。而對于智能化運維更深層次的內容。我們的展開還不夠。而諸見報端的各種口號。如“4G改變生活。5G改變社會”。如何去真正實現它。話題就多了。畢竟。2020年我們的消費者關注的是移動終端。而要發揮終端魅力。業內關心的更多是運維的執行力。既然5G網絡需要支持超大帶寬、超低延時及海量連接場景(可服務于自動駕駛、工業控制、智能電網、大視頻、AR/VR等豐富的垂直行業應用)。那么如何更具象地展開運維工作。就變成一件“糧草先行”的必然。
畢竟。在運營商傳統網絡運維中。巡檢、告警分析、故障處理等工作長期積累了豐富的經驗。其價值并未被充分挖掘。同時。目前的人工運維存在系統復雜耦合度高、數據來源多種多樣、人工維護風險度高。修復間隔時間過長、人員培養難度大等現狀。導致了性能相關告警不明確、無效告警篩查規則缺失、故障維護只能被動解決。優化維護工單重復派發等問題。影響網絡運維的效率和成本。
網絡切片是基準要素
5G時代使用的無線頻率高,相比4G時代單個基站的覆蓋減小,為了滿足覆蓋需求。基站將會非常密集。網元數幾倍乃至幾十倍的增一為運營商的運維工作帶來了巨大的挑戰。“5G相比4G時代網絡復雜性提升了一個數量級”這句話已經是老生常談了。更重要的是。5G時代帶來的不僅僅是網絡架構的變化,更是業務形態的變化。5G通過靈活的網絡切片滲透到網絡社會的各個角落。使能各種差異化的新業務包括高清視頻、車聯網工業物聯網等,成為垂直行業數字化轉型的利器和未來萬物互聯數字社會的基石。
在切片管理系統中引人人工智能。根據AI訓練平臺輸出決策依據。自動化執行管理策略,賦予網絡智能感知、建模、開通、分析判斷、預測等方面的能力,實現切片靈活性和管理復雜度之間的完美平衡。
毫無疑問。網絡切片是5G網絡的一個重要特性,通過對網絡資源靈活分配。能力靈活組合,基于一張物理網絡虛擬出網絡特性不同的邏輯子網,以滿足不同場景的定制化需求。網絡切片運維實質上就是提供切片實例的全生命周期管理,包含設計、開通、SLA保障、終結等階段。網絡切片帶來極大靈活性的同時,也增大了運維管理復雜度。基于人工智能來增強切片自動化管理能力是必然趨勢。
為高效地管理網絡切片。降低運維復雜度和成本。切片管理系統必須具備網絡自感知、自調整等智能化閉環保障能力。目前網絡策略仍是基于人工靜態配置,忽略了網絡的實際情況。引入AI后可基于時勵位置和移動特性,結合網絡中的流量、擁塞級別、負載狀態等進行智能分析和判斷,通過AI訓練平臺輸出切片管理動態策略。實現智能化調度。
另外。實時/歷史智能分析還提供健康評分、異常檢測預測、故障根因分析等參考數據,據此執行容量優化、配置優化、資源彈縮、問題定位等操作。實現切片閉環優化。5G智慧切片網絡將會經歷領域內探索、跨領域融合、高度自治三個階段、首先,5G網絡各子領域將分別與AI初步結合和應用。依托大數據與機器學習的支撐。在網絡資源分配等領域探索實現初級智能化;其次隨著技術發展。AI將可以學習跨領域的5G網絡大數據,部分子領域將出現融合智能,實現中級智能化:最后。5G和人工智能技術高度發展,將實現全網聯動和高度自治,大幅提升網絡全生命周期管理效率,基于人類控制網絡的意圖實現高級智能化。
之前我們在多篇文章里提到,運營商在5G全面運營的情況下,為了優化網絡運維的工作模式,提升網絡運維準確性及效率性,提出了多種“集中維護支撐服務”的項目,都是基于AI啲運維解決方案旨在強調實現以維護為中心,并依托大數據挖掘技術與深度學習算法,實現問題早發現。一句話:由被動處理問題改為積極預防問題,從而提高整體資源的利用率和維護效率。
找到核心推動因素
在當前云時代。基礎設施集中化且中心DC物理設備規模龐大,網絡功能分布式打散分布在不同的物理節點上,一旦出現故障,原有的軟硬件一體化主備倒換方式不再有效,需要更有效性自動化識別能力,識別故障根源是硬件原臥云平臺原臥還是上層VNF的原因。快速區別出故障的根本原因,才能快速對故障進行有效隔離和恢復。
實際上,當前伴隨著NFV和SDN技術的發展和成熟。通信行業逐步向ICT融合的All Cloud時代過渡。5G標準的確定以及云化核心網的商用。使網絡運維面臨更加復雜的運維環境:節點數;增加、跨層運維、多廠家管理、缺乏統一的運維工具等。換句話說。實現自動化和智能化的網絡運維,是5G成熟關鍵技術、智能監控、故障分析等是自動化運維中關鍵技術。
而且,面對網絡全云化。控制面、用戶面分離的分布式網絡架構演進,網絡運維在5G時代會面臨較大的挑戰,電信運營商需要通過運維轉型來提升網絡運維效率。降低網絡運維成本。這其中,NFV網絡NFV網絡的3層架構包括上層的VNF層。功能與傳統的CT網元功能一樣:中間層的CloudOS,實現向上提供基礎資源,向下管理通用硬件:下層的通用硬件層。包括物理的計算、存儲和網絡資源。
用比較生澀的專業術語來說。NFV的各層之間是解耦的。其中“完全解耦”是NFV發展的方向和業界趨勢,運營商可以擺脫對個別廠家的依賴。降低網絡建設成本。“完全解耦”部署和維護較復雜,但資源可以做到統一管理和調度。其最根本特征是各層間使用標準接口。但當前協議和標準進展緩慢。
實際上。我們所熟知的網絡,經歷了從各設備廠家物理機無統一標準的傳統設備演進到物理設備基本統一的X86服務器士層應用虛擬化。繼續演進到云、云原生。短短十年間,4G演進到5G,5G在2020年走向成熟、我們之前多次提到。4G走向5G,電信設備從傳統設備演進到虛擬化、云化、時代,軟硬件架構都發生了翻天覆地的變化、眾所周知,過去的運維工作都是在進行大量的事后處理工作,現在,通過運維專家梳理,選取動力環境、歷史工單、網絡性能、天氣停電、故常告警、綜合資管等多個維度特征,構建訓練數據集。同時。我們選取了多種AI模型進行對比測試,最終確定選用多層LSTM循環神經網絡實現小區退服告警預測,以達到故障預警分析的目的。實現了變被動處理為主動預防的運維思路轉變,擺脫“拆東墻補西墻”的運維狀態。達成對故障的事先預判。
所以。自動化運維的關鍵技術,除了故障監控和故障根源分層關聯分析,故障自愈能力、全局透視、跨域全方位數據采集能力、全網網絡拓撲管理、一鍵自動化測協一鍵自動化業務部署等,都是智能運維應具備的成熟商用能力。中興通訊智能運維方案。化繁為簡。降低5G云原生及服務化軟件架構帶來的系統維護復雜性,致力于聚焦5G業務本身,才能為我們的用戶創造真正的便利。
后記
從目前的情況看。我們的三大運營商(其實國際上的其他成熟運營商也都差不多)通過運營商網絡部、網管、分公司、縣公司一線維護人員目標使用者,基于AI的運維解決方案,可提高維護效率和能力。預防性主動運維能力、快速響應的報告能力、快速應急處理能力、自動化減少人為工作量、經驗移植減低人員要求、支持市場前線的分級保障能力。使平臺融入運維生產中,實現商業目標。電信業引入了很多IT的軟件架構、思維、方法等:開源、APP和基礎設施解耦等給電信應用帶來了很多好處、便利,同時也帶來了新的問題,其中對電信運維方式產生了較大的影響,這其中的意義不僅只是AI與網絡切片能夠闡述的。