鄭 軍
南京中興新軟件有限公司
5G網絡建設啟動后,各運營商為了盡快實現5G-SA網絡率先商用,對工程進度提出了嚴格的要求。快速建網的同時也暴露了諸多問題,部分網絡4G/5G的互操作成功率比較低,語音的接通率低,5G打5G的的話音接續時長比4G VOLTE長2s以上,很多5G用戶反饋使用微信、支付寶、游戲的體驗不如4G。此外業務組網發生極大變化,橫向跨域,縱向跨層,運維團隊對故障的感知、定位以及修復的難度加大,運維體系面臨調整。隨著5G網絡的規模商用,為提升客戶感知,組織開展網絡提質,建設標桿網絡顯得非常有必要。
具體來說,網絡主要面臨如下四個方面的問題:
(1)用戶感知較4G存在差距。5G建網初期無線環境成熟度不如4G,基于EPS FallBack語音體驗相對VoLTE變差,5G商用后關鍵KPI指標需要優化提升;5G終端版本和協議類問題待完善。
(2)虛擬化運維難度加大,問題定位涉及多網元多廠家,端到端出問題難定界,5G商用涉及5GC、EPC、IMS、無線、終端等多領域多專業,運維難度加大。
(3)網絡發展演進迅速。協議規范持續更新,各廠家兼容性問題較多,在虛擬化新平臺下,不同廠家首次磨合,VoNR等新網絡功能需要提前驗證。
(4)運維能力不足。云化核心網5GC是一個全新系統,運維人員了解相對較少。基于資源池的運維經驗較少,運維工具和極端情況下的應急手段欠缺,應急能力需要提升。
要助力三大運營商的網絡質量提升,不斷改善最終5G用戶的體驗,提升5G用戶的駐留比,不斷提升5G網絡的價值。同時也推動我司相關產品的可服務性能力、功能和性能進一步完善,鍛煉一支客戶導向、技能卓越、能打硬仗的交付團隊,推動工具的不斷完善,從而不斷提升數字化運維水平、有效降低網絡的運行風險,極大履行“精誠服務,凝聚客戶身上”的承諾。標桿網絡的建設涵蓋網絡質量提升、運維效率提升、創新課題落地和團隊能力提升等方面。
標桿網絡的建設是一個系統工程,涉及到多專業協同。我司高度重視,指派管理干部掛帥,各專業部門部長親自落實技術專家,各相關產品總監指派精兵強將參與,組建了一支跨專業,一體化的網絡提質攻堅團隊。按照網絡質量提升、運維效率提升、創新課題研究和能力提升四個維度推進各子課題落地。組織架構如圖1所示。

圖1 聯合攻堅團隊組織架構
此外,項目組建立必要的溝通機制,通過周例會溝通進度、問題流向、客戶訴求以及關鍵風險點等事宜。對重點APs(Action Points)加大推進力度,建立內外部溝通群組加強協同,使用iCenter空間等用于歸檔項目運作相關的知識資產,做到內部充分的信息共享;按期召開新產品新技術的交流會,進行新方案研討、新工具試用和典型案例共享。加強問題和需求清單式管理,日清日畢。
在內部充分溝通的基礎上,定期向客戶匯報進展,認真落實客戶交流匯報機制,各模塊對接不同客戶,主動向客戶匯報。每月拜訪關鍵客戶,傳遞工作進展和成果,了解客戶新需求,和客戶建立充分的信任關系。
制定十多項關鍵舉措,以促成目標達成。標桿網絡的守護離不開一支專業過硬、作風過硬的技術團隊。這些舉措體現了“兩手抓”的思想,既抓“硬件”——網絡質量,又抓“軟件”——運維工具的使用和團隊能力提升。
網絡質量提升的主要舉措有:①設備信息梳理;②技術通告核查;③軟參設置核查;④話務指標分析;⑤網絡隱患分析;⑥網間競對分析;⑦網絡容災演練;⑧ToB業務分析。運維效率提升的主要舉措有:①運維場景分析;②工具部署及應用、看板建設。具體參看圖2的5GC運維工具全景圖。
以X省為例,創新課題選擇了如下課題:①跨域聯合定位探索;②VoNR專題研究。在團隊能力方面,主要開展了運維理論培訓,開發精品課件并進行了團隊人員配備優化。在本次的標桿網絡的創建過程中,推動了工具的體系化,圖2是本次標桿網絡創建時間中使用的工具的全景圖。從硬件層、資源層、協同編排層,再到應用層有相關的工具可以協助日常運維,提高故障定位定界的能力。

圖2 5GC運維工具全景圖
通過Unitkits對服務器進行批量安裝和巡檢,通過LogTool對系統日志進行采集和分析,以定位服務器、存儲的問題。
通過Netinsight/BCN工具進行網絡的連通性檢查并進行抓包和流統,以進行數通類問題的快速定位;通過Inspector對云平臺進行巡檢,檢查PIM的告警、性能和配置問題。
現在不少教師一般注重知識的傳授和能力的提高,缺乏興趣激發有效手段,不能調動學生學習。高三學生對生物學習缺乏足夠的熱情,以為生物只須記憶,學習效果受到極大的影響。生物教師應從學科魅力、生物學獨到的研究方法、不斷涌現的生物進展、生產生活的密切聯系、多媒體教學手段等方面不斷暗示學生,激發學生的學習興趣和學習潛能,以忽略智力的不足。
通過NFVO+實現端到端拓撲,實現系統的集中監控、跨層故障定界和應用生命周期管理。
通過EMS,EMS+,UDE,MagicEye以及VMAX實現業務端到端的大數據分析、用戶投訴、網絡指標劣化和服務質量劣化的快速感知、迅速定位和及時修復。
這些工具在本次標桿網絡建設中得到了應用,在使用中暴露的健壯性、易用性問題也得到了改進和優化。
為有效度量網絡的品質,設計了如下的網絡質量監控體系,該指標涵蓋了無線、核心網以及業務體驗相關的指標。相比上網業務而言,語音業務的感知度問題更容易暴露,其質量提升更為緊迫。5G商用初期采用EPS Fallback的語音解決方案,從目前各省使用反饋,整體上5G語音感知相對VoLTE有所下降,所以將5G語音質量提升作為專題進行推進。
5G-SA網絡的語音業務相關的重點指標有5GC網絡注冊成功率、EPSFB成功率和PDU會話建立成功率。此外,針對4/5G互操作的成功率,在EPC網絡中可以統計切入成功率。在IMS網絡中重點關注初始注冊成功率、呼叫接通率和呼叫建立時延等。如圖3所示。

圖3 5G-SA網絡指標體系
分析用戶的投訴,主動進行拉網測試,和無線運維團隊一起開展多終端、多場景、多無線環境測試,對現網的問題復測并及時關閉,在解決問題的過程中形成經驗并輸出優秀案例,整理共性問題全網共享。具體流程如圖4所示。

圖4 拉網測試問題分析示意圖
(1)KPI分析法:從指標定義,分析涉及流程,明確采集數據,使用性能統計分析失敗類別,借助工具定界,回溯信令定位,找出優化點,總結推廣經驗。
通過信令跟蹤CTS,獲取呼叫流程,精確定位問題點;通過一鍵采集日志分析真實原因;通過性能統計,分析指標波動,找出失敗類別,總結分析優化方向等。
和客戶一起開展了跨域聯合定位、三網互視、5GC指標優化、5GC開戶流程優化、UPF系統容量以及帶寬評估工具、容災應急及信令風暴研究和智能運維工具研究等創新課題。
“跨域聯合定位”這個課題實現了Magiceye(語音域)和EMS+(分組域)的配置數據對接,并進行了數據和語音的全流程數據拉通,可以幫助解決5G語音 EPS FALLBACK等場景下的流程沖突和語音質量問題。
“三網互視”這個課題對硬件層、虛層以及APP層的資源匹配關系和網絡拓撲做了展示,體現了從上到下的立體的網絡交互關系,并在拓撲圖上進行告警信息的層層鉆取,以實現跨層故障的定界定位。
容災應急和信令風暴的課題主要分析在虛機、網元、機架乃至DC等各層面出現異常后如何快速啟用容災的具體方案,通過面向網絡能力的動態流控閾值設置,對容災倒換過程中可能產生的信令風暴進行抑制,以實現網絡的快速自愈。
智能運維主要通過上述運維工具對性能數據、告警、日志、CHR等進行分析,實現故障的快速感知和提前預防,進行跨域數據融合和關聯分析等大數據分析手段,實現網絡問題的的快速定界和根因的快速定位。智能運維的終極目標是實現L5級別的網絡自動駕駛。
以高效率、高要求、切實際、有深度、嚴把關的要求培養一線團隊維護工程師。
引用“講授法”,以實現系統地學習理解5GC的基本原理,老師們的講解通俗易懂、直接,且教和學效率高。
運用“導師制”,實現傳、幫、帶,一對一培養,端到端全流程輔導。
落實“理論與實踐一體化”培訓體系,統籌資源、深化融合,理論與實踐互融互通,深度錘煉人員技能。
先打基礎,重視5G通信原理和基礎知識的掌握,強化工程支撐,做好日常高頻操作的方案,開展容災和應急方案以及應急工具的培訓,掌握大數據分析工具的使用方法和網絡優化的分析方法,并通過看網講網、沙盤演練,鼓勵引導基礎能力比較好的員工開展創新課題,培養系統化的分析問題和解決問題的能力。最后通過考評、總結和大比武的方式來檢驗學習的效果。對專家人才進行進階式賦能,讓新手沿著技術能手、技術骨干和技術專家的路徑快速成長。
F省成為中國移動全國區域首個EPSFB成功率達到99%以上的省份,并把優化經驗同步分析到其他省份。全省EPSFB成功率由2月初的97.1%,提升到6月中旬的99.42%,超過集團制定的優化目標值99%,累計輸出EPSFB成功率、業務感知度提升、時延優化等相關重要案例10多篇。5G打5G時延從優化前的5.5s,優化縮短至3.88s,達到集團的考核指標;騰訊視頻、咪咕視頻、抖音、微信、手游和云游戲等常用的7類業務體驗的指標全部達到集團確定的基準值,其中11項指標超過集團定義的挑戰值。隨著無線覆蓋和網優工作的推進,指標會越來越好。通過一年多的標桿網絡創建行動,F省網管中心核心網室至少培養出5名認證級別達到3級(最高級別是6級)的技術骨干;F省辦事處培養出10名認證級別達到4-5級認證的專家;大大提高了F省設備的運維水平;合作發表了專業論文多篇。
參與標桿網絡建設的幾張網絡其主要指標均達標。經過為期一年的標桿網絡建設實踐,我司已經掌握了一套完整的標桿網絡創建的基本方法,這就是先夯實基礎網絡,大力推廣工具的應用,在此基礎上再努力開展運維創新和產品創新活動,從而拉動團隊運維能力上一個新的臺階。如此“4條主線18項舉措”的做法已經成功復制到多個省多個運營商,給運營商帶了實惠,促進了業務的進一步發展。實踐證明,我司的這套做法具有可借鑒推廣的價值。
隨著5G網絡無線覆蓋的進一步拓展、用戶的日益增長、業務的不斷發展,標桿網絡的建設是一個永不停歇的過程,要不斷提升數字化運維的能力,按照“15150”——1分鐘感知、5分鐘定位、15分鐘修復,重大故障為0的要求,不斷打造精品網絡,為客戶交付更加滿意的網絡。