陳曉鴻+李潔瓊+王成龍+馬學森
【摘要】 為提升面向入駐省公司的跨省集中化運維服務質量,亟需加強網管支撐手段,推進對告警和性能問題的發現、評估、處理等全流程閉環管理。通過搭建入駐省監控關鍵指標信息展示平臺,推進實時分析閉環管控思路的落地,并綜合質量、資源、故障、工程等多維度信息來評估指標效能,為網絡運維故障排查提供有力輔助支撐。
【關鍵詞】 跨省集中化運維 展示平臺 閉環管控
一、引言
近些年,跨省集中化網絡運維模式逐漸建立起來,在當前本地運維和跨省集中化運維并存的階段,雙方運維團隊掌握的網絡信息、運維數據等內容缺乏一個實時溝通機制或手段來實現信息對稱。為進一步提升運維服務質量,更及時跟進解決網絡故障或客戶投訴,南方基地聯合入駐省公司開展了針對關鍵指標信息展示平臺的研究,從而實現對影響客戶感知問題的發現、評估、處理等閉環管理。
鑒于網管支撐能力受限,南方基地一直缺乏實時的評估分析和跟蹤解決手段;同時,業務流程日趨復雜、客戶要求日益提高,網絡運維故障率增高,客戶網絡投訴明顯上升。因此,網管支撐手段日漸成為當前跨省集中化運維質量管理的瓶頸問題。
為提升網管支撐能力,進而改善集中化運維服務質量,基地計劃通過實現跨網管的數據融合,實現對多個網管系統的告警和性能數據的集中管理,推進落實實時的分析閉環管控機制。此外,在構建的新展示平臺上綜合資源、故障、工程等多維度的信息,達到對指標效能的評估,為集中化運維中故障排查提供有力支撐。
二、思路與研究方法
網絡信息與運維數據包括多種網絡指標、嚴重故障、工程信息、值班人員等,跨省集中化網絡運維初期,這些信息分散在多套網管系統,如話務網管、數據網管、傳輸網管、生產信息系統等,若開發一套新系統,來完成這些數據的匯總呈現,按照以往的基于網管接口的開發方式,存在如下弊端:
1、需要針對不同網管的接口進行差異化開發,工作量大,開發時間長;
2、打通多套網管接口,溝通協調困難大。
針對跨省集中化網絡運維的特點與需求,本課題提出一種模擬人工操作實現網頁數據抓取的方法,繞過網管接口,通過特征匹配,直接獲取相關的網絡信息與運維數據,再篩選關鍵指標信息分類展示,最終建立一套入駐省監控關鍵指標信息展示平臺。
具體研究實現思路如下:
三、搭建試點入駐?。ㄎ鞑兀┍O控關鍵指標信息展示平臺
3.1 基本開發流程
按照上述研究思路,分解為功能模塊,編碼實現,具體程序流程如下:
3.2 數據采集過程
展示平臺的關鍵指標信息是分別從多套系統采集而來,針對每個系統均編寫了相應的采集程序。通過自定義一個服務,去統一調度這些采集程序。采集程序通過查詢數據庫中的采集調度表,來確認要采集的關鍵指標的采集頻率、具體路徑等一系列參數。
四、總結
在技術實現上,展示平臺的搭建采用了網頁抓取的方法,將多個網管系統的數據融合到統一平臺上呈現。在具體數據采集實現上,通過模擬人工登錄定位到目標采集頁面,抓取到需要的運維數據。正如上文所提及的,本次研究所采取的方法無需新平臺與其他系統打通接口,具有開發周期短、成本低的顯著有點。此外,還可以更為靈活地實現個性化新增需求,不需執行投資預算申請、系統接口開發與聯調等冗長流程。
通過搭建的展示平臺,南方基地與入駐省公司雙方的運維人員可以實時共享網絡信息,快速掌握入駐省公司的告警和性能情況。除資源整合效能外,本平臺的研究和搭建還帶來了明顯的生產效能,通過輪詢實現各項關鍵指標的實時更新,能夠直接服務于雙方監控人員對關鍵信息的統計與發布工作。
以“基站退服”指標為例,平臺上線后,基站退服超門限的嚴重故障信息發布歷時就由此前的25分鐘縮短至10分鐘左右。
在2016年該類嚴重故障月均次數同比增加150%左右的情況下,很好地保障了‘嚴重故障發布及時率運維指標穩定維持在100%,從而直接體現了本平臺的生產價值。
參 考 文 獻
[1]. 衛莉莉. 面向領域的Web文本采集與分類[D]. 西安建筑科技大學 2011
[2]. 郭邦財 蜜蜂群并行網頁抓取系統 [J]. 軟件理論與方法 2011(01)
[3]. 王佰玲,曲蕓,張永錚,田志宏. 基于數據流的網頁內容分析技術研究[J]. 電子學報. 2013(04)
[4]. 張常青. 基于Web技術的綜合信息管理系統的設計與實現[D]. 吉林大學 2015