【摘要】隨著金融業信息化建設步伐的加快,人民銀行網絡互聯范圍不斷擴大,接入機構逐年增加,承載的業務種類和業務量也在持續增加,對網絡運行環境和通信質量的要求越來越高。文章基于筆者工作實際,就構建基層央行網絡智能化監控平臺的探索與實踐進行探討。
【關鍵詞】網絡智能化監控 探索 實踐
為適應當前網絡管理需要,有效防范安全風險,提升網絡運維效能,實施科學、高效、規范管理,基層央行立足“全省科技一盤棋”的工作理念,整合全轄網絡管理需求,組織建設覆蓋省、市、縣三級的網絡智能化統一監控平臺(簡稱“監控平臺”)。該平臺的建成和使用為準確把握轄區業務網絡運行態勢,及時預警和處理網絡故障隱患,提升網絡運維管理效能發揮了顯著作用。
一、主要成效
(一)實現網絡設備和通信線路的智能管理
目前,監控平臺對全轄19家人民銀行分支機構業務網和金融城域網的57臺核心網絡設備,324個重要網絡端口,21條通信線路,以及與24家外聯機構互連的40條通信線路實施監測。省、市、縣各級網絡管理員在各自管轄范圍內可自主配置和調整監控對象、要素,查看設備與線路運行狀態,并負責處理異常事件和故障,初步形成了“集中監控,分級處置,齊抓共管”的分工格局,有效促進了全轄網絡管理整體水平與能力的迅速提升。
(二)實現網絡運行狀態的全方位智能監控
監控平臺從設備的在離線狀態、端口的up/down狀態、線路的連通狀態,到設備的處理器和內存使用情況、端口I/O流量與丟包情況、線路帶寬使用與擁塞情況、應用系統的網絡吞吐量等,為網絡管理員從多個層面、多種角度和粒度,應用多個檢測指標來觀察業務網絡運行狀況和健康水平提供強有力的技術支撐,有效拓寬了網絡管理員把握轄區網絡運行態勢的深度和廣度。
(三)實現風險的智能預警和重要事件告警
監控平臺按照風險與事件的重要程度,分等級、分類別通過監控客戶端、郵件、短信等多種形式向網絡管理員發送風險預警和故障事件告警。自2013年1月該平臺上線運行以來,及時告警了設備離線、端口故障、線路中斷等18起重要事件,并精確預警設備內存使用率較高、端口丟包率較高等近15起風險事件,為各級網絡管理員及時、準確把握風險與故障信息,采取應急處置措施避免風險發酵和減少經濟損失贏得寶貴時間。
(四)實現網絡運行數據的智能統計、分析和展示
監控平臺為用戶提供了定制監控指標、圖表樣式,繪制網絡監控拓撲圖,以及生成監控日、周、月、年報表等一系列靈活自主的監測配置和運行狀態展示功能,為深入把握網絡運行內在規律,及時察覺運行風險與異常,快速分析解決網絡性能隱患提供了智能、高效的輔助手段。
二、經驗與做法
(一)深入調研,明確平臺建設需求、架構和方案
平臺建設前,向轄區各分支機構深入調查平臺建設需求和在用網絡設備品牌、類型及使用情況,組織開展市場主流監控軟件和工具的調研,著重考察對不同生成廠商所生產設備的兼容情況。考慮到網絡監控技術開發難度大、成本高,通過采購現有成熟產品的方式來開展平臺建設,有利于縮短建設周期和減少成本。監控服務器部署在省會,各級分支機構通過遠程訪問實施管理。
(二)注重資源整合,實施集中統一監控
為優化網絡管理流程和內容,有效整合監控資源,避免重復建設,通過調整城域網的訪問限制,將全轄業務網和金融城域網的網絡設備和通信線路統一納入平臺的監控范疇,不僅有利于節約監控平臺建設成本,也便于對業務網和金融城域網實施集中監控和統一管理。
(三)注重實效,突出“準確、靈活、高效”三要素
監控實效與監控數據的及時、準確,平臺功能的靈活、人性化,平臺運行的穩定、高效息息相關。在平臺建設中,關注監控數據采集、統計和反饋的頻度、精度,關注平臺用戶的應用體驗,關注平臺數據處理和系統響應的效率,才能確保監控平臺在網絡管理過程中能夠充分發揮出其應有作用,扮演好智能助手的重要角色,促進網絡管理工作科學高效開展。