逄成香 陳玉輝
(中國聯合網絡通信有限公司綏化市分公司,黑龍江 綏化 152001;中國聯合網絡通信有限公司安達市分公司,黑龍江 安達 151400)
電信網中交換機的集中網管系統的設計探討
逄成香 陳玉輝
(中國聯合網絡通信有限公司綏化市分公司,黑龍江 綏化 152001;中國聯合網絡通信有限公司安達市分公司,黑龍江 安達 151400)
研究和設計基于計算機技術的交換機網絡管理系統,可以使維護人員通過同一操作終端,對電信網絡的各種交換機設備進行集中監控,從而提高電信網運行效率和運行質量,減少維護管理人員,提高工作效率。
網管系統;功能設計;數據拆包;故障采集和處理
目前,電信網中主要有AXE10,EWSD,NEAR-61,SIGMA,SESS和華為CC08等交換機機型。由于交換機告警故障信息的原始報告類型和定義復雜,不同交換機型的告警原始報告的格式和內容差異較大,甚至是同一種交換機機型,不同軟件版本的告警原始報告也有差異,傳統網管系統為了準確分析和處理各種機型的告警原始報告,在網管接口機上開發多個告警分析處理模塊,分別處理一種特定的交換機機型的告警原始報告。告警分析處理模塊的功能包括:實時接收告警原始報告;提取告警原始報告中的告警時間、告警交換局、告警關鍵字、告警內容等信息;把處理后的告警信息保存在數據庫;同時通過Socket連接發送到前臺工作站。
這種方式使系統具有結構清晰、數據結構簡單、開發過程簡單的優點。但是對于新增機型和新版機型的告警原始報告,只要告警原始報告的格式發生變化,程序員必須對告警分析處理模塊進行相應的程序修改。完全依賴程序員對交換機告警原始報告進行分析,歸類,再轉化為計算機語言,對于缺乏交換機專業知識的程序員來說是一個艱巨的過程。為解決這個問題,在新系統開發中,告警故障信息集中采集和處理單元采用全新的設計方案,使系統具有處理所有交換機告警故障信息而不用依賴程序員修改程序的高靈活性。這種全新的設計方案可以處理所有交換機的告警報告,網管用戶只需通過前臺工作站自行定義告警信息的提取方法,添加、修改或刪除系統數據庫的相關設置,就能完成新型交換機或者新版交換機的網管接入,而不再依賴程序員修改告警分析處理模塊程序來實現。
某電信本地網12個NEC交換機局點、7個朗訊5ESS交換局點、10個C&C08交換機局點共200萬門的容量的交換設備,網管系統需要收集和處理的數據量巨大,如何保證告警故障信息集中采集和處理的高實時性將直接影響到整個系統的總體性能。在系統的開發過程中采取了許多措施來解決該問題。
(1)所有只能提供串口交換機設備的端口首先都通過IOLAN進行協議轉換,將RS232轉換為TCP/IP方式再通過網絡交換機接入到拆包服務器,提供網口方式的交換機直接通過網絡交換機接入到拆包服務器進行拆包處理,這種布局方式有利于大數據流的快速傳輸。
(2)采用快速、穩定的TCP/IP網絡。拆包服務器處理告警信息后必須通過TCP/IP網絡把告警信息送到前臺工作站,拆包服務器和網管監控室(24小時有專人值班)的計算機設備采用性能較高的3COM 100M網片,并且把所有拆包服務器與網管監控室的前臺工作站接入同一個CI SCO 100M網絡交換機上,提高網絡傳輸速率,縮短告警信息在TCP/IP網絡上的傳輸時延。
(3)提高拆包服務器的硬件配置,使拆包服務器擁有強大的處理能力,提高告警信息的處理速度。拆包服務器采用HP LH3000 PC服務器,2G雙核CPU,高速SCSI硬盤,內存2G。
(4)拆包服務器的系統拆包模塊在處理告警小報告時,每個交換機都有一個線程專門負責把重要告警信息通過SOCKET連接發送到前臺工作站告警監視程序,產生告警;另一個線程專門負責把告警信息錄入告警數據庫中。兩個線程并行運作,不通過數據庫提供告警信息,避免了由于數據庫故障而丟失告警信息的危險和錄入、查詢告警數據庫而產生的時延。新網管系統通過SOCKET實時連接到交換機告警端口,并發送一定的連接信息保持端口的長時間連接,如果發現端口中斷(由于網絡原因,或交換機重新啟動原因),接收程序立即(1分鐘內)對這個端口進行重連,重連三次(次數和重連開始時間可以通過配置文件由用戶設置)。重連三次如果發現這個端口還沒有連接上,系統進入等待狀態,等待下次重新連接(如三分鐘后),這樣循環嘗試,直到連接正常。同時將接收程序所有與端口有關的動作記錄到日志中,必要時可以查看接收程序的運行情況。
(5)拆包服務器采用熱備份的機制,盡可能提高系統的安全性,防止告警信息的大量丟失。系統設有專門拆包服務器健康偵察進程,如發現有拆包服務器停止工作時間達到設定時間,該拆包服務器上連接的交換機將自動接入事先在數據庫中設定的單臺或多臺備用拆包服務器,由備用拆包服務器負責故障拆包服務器所接入交換機的信息處理,直到故障拆包服務器恢復為止。
(6)完善前臺工作站告警監視程序語音告警功能,保證以最快的速度準確把告警信息通知用戶。前臺工作站告警監視程序能夠按照設定的告警等級和告警過濾條件,把過濾后的告警信息由重要到次要的順序產生語音告警,使重大故障的告警信息能夠最快的送到網管中心。
動態報表是指從數據庫流水表中讀取數據,用戶不必修改報表程序,而根據自己的需要自行定義報表,經過特定的運算產生個性化的圖表,做到及時了解故障的發生,又能快捷、準確地對故障進行智能化分析,作為通信設備維護工作的重要參考和依據。系統由報表生成工具和報表使用工具兩大模塊實現動態報表功能。
對采集到的各類告警,系統實時地以聲音和圖形界面提供給維護人員。具體顯示方式有告警監視總圖和各種告警列表。用戶可以自由決定某一類(根據告警類型、告警級別等)告警的到來是否需要聲音指示。在以地圖為背景的全局監視圖中,顯示全網所有交換局點的位置。
(1)顯示多種告警源:設備告警、性能告警、網管系統自身告警,從各局點可方便瀏覽到該局點目前各級別告警的統計信息,并可切換到設備告警列表,同時設備告警列表自動以該局作為過濾條件以進一步查詢該局點當前所有設備告警。
(2)系統收到告警發出相應級別的告警音,同時用相應告警級別的顏色進行直觀的閃爍指示,用戶可自定義告警級別、告警聲音和告警顏色?;顒痈婢玫酱_認后或者接收到對應告警的消除報告后,停止聲音指示并轉變為休眠告警。提供聲音/閃爍開關控制功能。
(3)設備告警列表:設備告警列表顯示的信息包括:交換機名稱、告警類型、告警級別和發生時間、告警確認時間等信息??梢园凑战粨Q局類型、局點、告警類型和告警級別等過濾顯示??捎檬髽它c擊告警以顯示詳細原始信息,告警列表上實時反映最新的告警,并按告警發生時間順序滾動顯示。當收到新的告警時,系統自動產生對應級別的告警音。
通過對分散的多機型的交換機告警信息集中采集和處理功能的開發,系統具有了告警故障監視、告警故障設置、告警信息統計和查詢等功能。可以縮短設備故障歷時,也可以通過分析和預處理查找故障隱患,將故障消除在萌芽狀態,從而有效地提高維護人員的工作效率和網絡的運行質量,為企業創造良好的經濟效益和社會效益。另外新系統實現了對所有交換機型的集中監控,取消了不同交換機自帶的網管系統,做到各個交換機房和光纖站無人值守或少人值守,使機房值守人員大約可以減少60%。
[1]韓瑩.軟交換技術構筑電信網的未來.天津市自動化學會第十四屆學術年會論文集, 2005-12-01.
TP302
B