高 鑫,馬 里,來 來
(中國電信股份有限公司杭州分公司,杭州 310066)
網絡運營質量提升的核心就是網絡的安全性提升[1],而網絡的安全則包含網絡架構安全、傳輸光路安全、業務承載安全,三者密不可分,層層遞進,將網絡安全這抽象概念從點到線,從線到面依次展開。網絡架構安全就是著重解決同板卡、單鏈路的隱患;傳輸光路安全在避免傳輸通道同纜、同路由問題的同時又要保證光路衰耗控制在正常范圍內;業務承載安全即評估各種型號設備的性能,保證業務在安全穩定環境下運行。試想,如果通過人工發現的方式去發現網絡安全問題,僅同板卡檢測就涉及到上千塊板卡,在幾萬端口中分類甄別是否是同板卡就猶如大海撈針,況且,這僅僅是一次檢查的工作量,而網絡安全和運營質量提升是一項常態化的工作,需要定期開展排查和整治。
顯然,采取傳統的手工方式根本無法應對如此多的工作,必須創新方式方法將人工干預的環節和時限降至最低,才有可能做好日常隱患排查,實現網絡運營質量提升。

圖1 隱患處理項
大數據技術,曾經被稱為數據倉庫的邏輯延伸。大數據就是一個大型的數據倉庫,一般有一個能支持業務決策的業務重點[2]。從電信級網絡維護的角度出發,大數據技術可以視為一種“從海量設備節點、光路節點中獲取各種參數,利用各自規則來主動發現問題、分析問題、定位問題[3],從而提高維護效率,進而提升網絡運營質量”的手段。
本文的研究方法在功能部署上分為統一數據采集、數據整合、統一數據分析和人工處理等四層(如圖2所示)。四個層級按照順序進行逐層執行,經過前三個層級的智能采集、整合和分析后,將會極大地降低需要人工處理的工作量,從而達到將人工干預的環節和時限降至最低的目的。

圖2 大數據功能部署圖

圖3 隱患排查處理工作流程
同時,我們設計一套基于上述四個層級模塊的隱患排查處理工作流程(如圖3所示),縱觀整個流程,所有工作項都是循環推行,都是發現到整改、再發現、再整改的過程。人工干預的環節僅僅在處理一項,掃描發現問題、分析隱患全部由系統自動完成。下文將詳細描述該方法在光功率整治這一網絡運營質量提升重要場景中的具體應用。
全網光功率控制是對杭州電信匯聚層及以上的4萬多個光口進行實時監控,范圍涉及到數據設備、IPRAN、無線L網、傳輸設備。過程涉及到采集、存儲、分析、查詢驗證四大環節。其中查詢涉及到多網管聯動,數據設備、IPRAN設備通過SNMP方式采集,采集結果通過FTP格式送至光功率采集模塊,傳輸設備直接在采集模塊上通過CORBA接口采集,無線的L網設備通向北向指令的方式采集。當采集完成后,光功率系統通過專業標示進行分類,送至不同的數據庫進入數據處理環節。同時引入分析庫進行分析(如圖4)。譬如,數據專業會引入中繼信息、綜合資源系統對全程光路、中繼平衡性進行分析,通過人工錄入的經驗值對衰耗大的光路一一標示,通過前后兩次采集值的差距來分析光路是否存在波動。最終形成清單和趨勢圖(如圖5)。

圖4 光功率系統對各專業的分析
從本文研究的方法投入到全網光功率整治中使用以來,根據今年年初的T0清單,當時合計發現267條隱患中繼,截止6月底完成量為245條,除部分郊縣節點(存在實際困難)完成率較低外,其余POP內的中繼光路整治效果良好,其中市區已經連續2個月未發現隱患中繼。同時,利用大數據,可以對隱患光口按區域、按業務屬性進行分類,光功率達標率直線上升,設備穩定運行,即便有光路挖斷、板卡吊死的“天災”,但是通過跨板卡,光路不同路由的保護,真正影響業務的故障少之又少,網絡整體質量穩步提升。

圖5 光功率的變化趨勢及清單
通過本文中方法的應用,在短短的幾個月的時間內,完成了之前幾年城域網建設和維護中遺留的隱患整治,網絡運營質量的提升離不開運維人員的辛勤努力,也離不開“自動化+大數據分析”[4]帶來的效率提升,充分印證“科學是第一生產力”是亙古不變的真理。
伴隨著CT技術的IT化和網絡技術的不斷演進,SDN/NFV已經成為了當前的產業大趨勢。SDN重新定義了網絡架構,給了運營商更強的網絡掌控能力;而NFV則改變了網元結構與狀態,極大提升了運營商的網絡與業務管理能力。無論是SDN還是NFV,都改變了運營商傳統的業務運營方式[5],對日常的網絡運營帶來了巨大的顛覆和挑戰,因此如何不斷與時俱進,不斷將大數據技術和其它新技術應用在日常的運維工作中提升效率就變成十分重要。