顏廣杰 深圳市天威網絡工程有限公司
HFC網絡是以光纖為骨干網絡,同軸電纜為分支網絡的高帶寬網絡,HFC擁有高度的靈活性和強大的功能,這些特性使得其成為了電信服務供應商和有線電視的首選技術。HFC通信網由于擁有種類繁多的各種通信設備,所以更需要借助專用網管系統來對其加以管理。HFC通信機房由于地理分布較廣,而CM、光發射模塊、交換機、CMTS等設備運行信息都需要被監控,所以設計一個HFC網通信設備集中監控告警系統來集中管理各種通信設備的告警信息是非常有必要的。
本文設計的HFC網絡設備集中告警系統主要通過集中告警平臺實現對HFC網絡相關通信設備實行集中告警。系統通過數據采集模塊從系統中各設備采集各種設備告警、性能越限告警和網絡告警等信息,通過將各孤立的設備、事件進行關聯,根據設備關聯關系、事件關聯關系,消除狀態閃爍變化而產生告警及關鍵節點引發的連鎖告警,同時根據告警時間、閾值、持續時間、消除持續時間等技術參數對告警進行智能壓縮,然后借助相關通訊手段呈現給系統運維人員,進而實現對告警信息的集中管理。借助本系統,系統運維人員能夠迅速知道各系統故障發生的位置,以及導致故障發生的可能原因等信息。
數據采集主要是指系統從各網絡設備中采集數據的功能。系統是通過SNMP接口自動采集各網元的設備告警、性能越限告警和設備數據等信息后,將越限告警/原始告警于數據庫中存儲,再通過過濾以及轉換,統一為相同告警格式,然后及時通知應用服務層,以便對告警信息進行分析與處理。根據網管接口,告警采集方式可以分為以下兩種:一是trap主動上報。各網絡設備主動將各種告警信息上報給系統。二是被動采集。系統從各網絡設備主動采集告警信息。正常情況下,系統主要是被動采集告警信息,但是限于一些需要進行告警同步和一些系統功能的應用場景,此時就需要系統采用trap主動上報。
采集的告警信息主要包含以下內容:告警源、告警級別、告警類型、告警名稱、告警產生以及恢復時間等。按告警嚴重程度,在本系統中將其依次分為告警恢復、提示告警、次要告警、重要告警、緊急告警五個級別。按告警狀態,在本系統中分為歷史告警和當前告警兩類。系統將根據不同級別、不同類型、不同設備的告警對過濾條件予以設置,針對同一告警信息重復出現的情況,系統會自動將其壓縮為一條信息,但是會給出初次發生時間、最后發生時間以及告警次數。
告警合并是NMS通過相關信息將網絡中各設備節點進行自動關聯,將相同、類似、可能相關的告警能夠自動合并。比如系統在分析光節點健康狀態時,檢查到市電丟失,同時檢查到,UPS供電不穩,光功率低,端口SNR低,CM在線率低,此時,該光節點的故障會合并為一條告警,之后該光節點的將不再產生告警,直到此次告警恢復為止。系統告警通過過濾壓縮之后,有效壓縮率可以達到90%,極大地提高了告警信息的可讀性和有效性。
例如告警:電壓不穩


系統在分析光節點健康狀態時,檢查到市電丟失,同時檢查到,UPS供電不穩,光功率低,端口SNR低,CM在線率低,此時,該光節點的故障會合并為一條告警,之后該光節點的將不再產生告警,直到此次告警恢復為止。
系統接收告警信息后,及時通知各告警終端,更新告警狀態,并及時通知運維人員。
本文設計的HFC網絡設備集中告警系統,實現了告警管理的前移,很好地解決了原網絡系統存在的信息分散,無法將告警信息及時主動借助相關通訊手段通知系統運維人員這一缺陷,并將系統與BOSS系統、TMS系統、資源管理系統、GIS系統、工單管理系統實現數據交換,進而實現從告警檢測、告警響應、告警處理、故障消除、告警報表管理的全過程管理,增加了HFC網絡專業的管理水平,更好地為HFC網絡生產服務。