曾慶毅
(梧州職業學院 廣西壯族自治區梧州市 543000)
網絡設備除了規格型號多樣性外,網絡設備定制化特點非常明顯,同時,隨著新網絡設備、新技術不斷應用,所有這些都對網絡設備生產、工程安調和售后服務帶來了很大的難度,對調試和維修人員的技術和經驗要求高,人員技術培訓難度大,人員轉換成本高,這種情況下,往往研發人員把大量的精力陷在生產、工程安調和售后服務的技術支持中,造成研發、生產、工程及售后服務工作效率低下。網絡設備的運行與普通設備不盡相同,網絡設備運行穩定性要求高。
目前單位的網絡設備的運行情況,所獲得的相應運行參數,都保存在設備運行監測系統中,但這些設備的運行參數、運行狀態一般為設備出現故障時,由單位的技術人員在維修過程中填寫,并上報到單位網絡設備資料庫中,這種基于人工采集數據的方式,數據獲取效率較低,并且在設備出現故障時才進行入庫,造成了單位的設備運維成本偏高。
網絡設備是用于服務各類網絡服務的基礎設備,如路由器、網關、連接器、網橋等,不同的網絡設備,其工作原理和運行性能各不相同,網絡設備的多樣性使之產生的故障點各不相同,因此網絡設備的故障診斷、檢測是網絡運維部門的重要工作,網絡設備故障診斷、分析以及故障管理的需求具體如下。
對網絡設備進行故障診斷、分析,其前提條件是了解設備的基礎信息,尤其是設備的基礎技術參數。設備基礎信息即為臺賬,應實現新增臺賬、修改臺帳以及刪除臺帳等,此功能是基本功能。
網絡設備的故障分析,其最初的診斷依據是設備在工作運行時的各類技術參數,通過這些運行參數來表示出設備的運行狀態。當網絡設備出現故障時,往往通過設備運行時的一些參數體現,因此對網絡設備故障診斷時,需要對這些數據進行采集,然后對其進行預處理。
能夠對運行的網絡設備故障實現記錄,并把相關信息進行留存。可以把相關故障記錄下來,由系統自動存儲這些故障信息,包括故障的表現、故障處理方式以及相關的消缺時間等。建立網絡設備故障信息庫,這些信息是對網絡設備未知、潛在的故障進行分析的數據依據。
需要根據設備狀態參數,自動完成故障的診斷,按照預警條件自動生成故障。
一般來說網絡設備包括各類集線器、交換機、網橋、路由器、網關、網絡接口卡(NIC)、無線接入點(WAP)、打印機和調制解調器、光纖收發器、光纜等,由于網絡設備的復雜多樣性,在網絡故障產生時,需要掌握網絡設備的具體指標。
(1)臺賬數據分析:從本地區所有的歷史臺賬數據進行數據分析,得到不同的網絡狀況的分類,有新的網絡檢測數據進入系統時,通過網絡設備進行評估,得到該網絡的狀況。
(2)網絡設備維護:臺賬是網絡巡檢系統的基礎,臺賬記錄了每個巡檢設備、線路的具體參數,在巡檢過程中,可隨時查詢網絡設備的臺賬信息。當設備個別參數進行變動時,可對其進行修改,如果某個設備不在巡檢的范圍內,則需要對其進行刪除,在對臺賬進行維護時,可通過查詢來實現網絡設備的查詢操作。
(3)網絡設備查詢:輸入網絡設備查詢條件,如不同網絡,其包括的設備也不相同,通過其檔案查詢,定出網絡設備的詳細信息。
(4)網絡設備統計:根據網絡設備統計的條件,來完成網絡設備的匯總統計等操作。
要想實現對網絡設備故障進行處理,首選需要完成故障信息的采集工作。但是網絡設備運行和監測系統是兩個不同的系統,而監測系統如果要分析設備運行數據離不開各項參數的支持,因此,對網絡設備運行指標的采集就成為了系統開發的關鍵。具體來說這些指標指的是設備的運行狀態與運行參數。在數據交互中需要借助Web服務的方式進行傳遞,然后再對系統進行分析和處理。
2.2.1 網絡設備運行數據導入
在系統中可以完成設備運行參數的導入操作,該功能的實現由管理員負責,并且如果數據的服務器地址變化了,那么也可以進行靈活的地址配置,確保數據導入的準確性。在系統中可以通過修改對應的配置文件來完成。
2.2.2 數據導入與查詢
該項系統功能實現主要是包括兩部分:
(1)客戶端對網絡設備參數的查詢,可以通過客戶端發起查詢請求,輸入對應的查詢條件,系統從服務器端進行數據查詢,然后反饋到客戶端。
(2)在客戶端可以實現網絡設備運行參數的批量導入管理,從而把本地獲取數據上傳到系統中,完成數據的全面共享。
2.2.3 客戶端數據返回

圖1:自動診斷活動圖
瀏覽器客戶端用戶如果要查看具體設備的運行情況,可以向服務器發送查詢請求。在客戶端設置對應的查詢關鍵字。運行管理員登錄到系統中,在進行服務測試時,按照網絡設備編號進行檢索,判定是否唯一,當應用程序在服務器上獲取數據以后,這些數據就會按照JSON格式向客戶端返回,從而實現解析和處理。
在網絡設備使用過程中,如果網絡設備出現故障信息時,需要把這些故障信息記錄下來,由系統自動存儲這些故障信息,包括故障的表現、故障處理方式以及相關的消缺時間等。
(1)新增設備故障信息:當網絡設備運行過程中,出現一些致使網絡設備無法正常工作的故障時,把這些網絡設備故障記錄在案。
(2)刪除設備故障信息:如果記錄的網絡設備故障有些描述錯誤,需要重新描述時,可通過刪除設備故障信息,對其進行刪除。
(3)修改設備故障信息:可對已錄入的網絡設備故障信息進行修改,修改部分故障信息,使其描述更具體。
(4)設備故障信息的導入:按照預置的Excel表格,在Excel表格中列出了不同時段的設備故障信息,可對其進行批量的導入,提高設備故障的錄入效率。
本系統對網絡設備故障的診斷分為兩種:即人工診斷和智能診斷。
(1)人工診斷:診斷人員通過查詢監測數據,完成診斷,并且輸入診斷結果。設備人工診斷通過查詢監測數據,完全依靠個人的經驗來完成,并把診斷結果輸入到系統中。
(2)智能診斷:即通過網絡設備的條件值,由系統按照網絡設備的監測日志(監測值)完成自動診斷。
一個完整的診斷流程如圖1所示。在進行診斷時,系統內置一個定時觸發器,可設定為5分鐘,如果在設備工作時進行診斷,需要定時較快更新時,設置為1分鐘、2分鐘、3分鐘不等。讀取數據監測監測數據后,存入到本數據庫中,然后由定時觸發器啟動診斷處理程序,首先讀取診斷方案,然后進一步讀取診斷規則,根據診斷規則讀取本地的監測數據,按時間進行檢索,判定是否達到診斷規則,如果達到了,則顯示出診斷提示,如果達不到則繼續讀取本地數據,診斷規則根據特殊情形是變動的。
在系統開發中要關注系統的響應能力,對網絡設備的檢測結果及時進行提醒,從而避免產生不必要的損失。使維護人員可以及時知曉問題和采取必要的保障措施,確保維護工作可以及時有效開展。在系統的響應能力保障上要通過硬件支持和軟件優化等多種方式進行保障。
根據目前用戶對系統的期望,系統要從便捷實用角度設計系統功能,包括醒目的系統可操作功能,準確的界面導航菜單,美觀的系統界面等,確保用戶在使用系統的時候既可以通過鼠標完成操作,也可以通過系統清晰的看到提示內容。
網絡設備與故障檢測系統是部署到服務器上的,在用戶使用過程中實現穩定服務支持,通過管理端實現對系統的資源進行監管,確保系統的使用穩定、響應及時,并且還會根據用戶量的多少引入更多的硬件資源支持,以保證實現系統運行穩定的持續性。
要在服務器硬件、軟件以及數據庫優化等多方面確保系統的響應速度。在系統開發中要注重系統架構的搭建,通過接口實現功能的靈活擴展需求,提升系統的后續擴展能力。
通過物理安全、數據加密以及數據傳輸加密等多種方式,提升系統的使用安全性。對系統中的用戶進行角色劃分,對應用系統采取物理安全保障,包括部署防火墻系統等,確保系統數據安全和使用安全。
注重系統的數據備份,采取本地備份和遠程備份相結合的方式進行,以便在系統出現異常的情況,可以對系統數據進行遠程恢復。
在系統開發中要遵照軟件開發規范,確保程序代碼結構清晰,編碼注釋清晰,并且留好對應的開發文檔以及接口文檔等,以便在后續開發中,系統維護人員以及升級人員可以對系統看得懂、升級方便。
本文詳細分析了網絡設備故障診斷、分析以及故障管理的具體需求,從設備運行數據采集、處理業務出發,以設備故障診斷的自動化處理,完成設備故障信息的管理,構建集信息采集、故障管理和故障診斷于一體的綜合應用平臺。分析了設備故障分析、檢測的相關流程,完成了網絡設備管理、監測數據采集、設備故障管理、故障診斷的功能分析,為網絡設備故障分析與檢測系統的實現提供了重要的研究依據。