【摘 要】本文概述了圖形化網絡監控系統的總體構成和功能,分析了圖形化監控系統的特點,分析并總結了針對性較強的圖形化監控系統在信息網絡運行維護中對網絡設備、網絡線纜、網絡通道、安全設備、服務器等方面起到的作用,以及保證企業網絡安全、穩定運行的重要意義。
【關鍵詞】圖形化;信息網絡;網絡管理;運行維護
0.引言
在當今時代,信息網絡系統已成為社會組成必不可少的一部分,而信息網絡系統在各個企業中已成為企業辦公、生產、運行管理等方面的重要支撐平臺,隨著社會發展和企業信息化規模擴大,網絡的規模也隨之越來越大,網絡的結構日趨復雜,局域網的運行維護任務也日益顯得復雜繁重,因此如何能夠簡單有效地管理和維護內部網絡已成為當前網絡管理研究的一個重要方面,迫切需要一種網絡管理方式可以簡化運維流程、減少運維步驟、快速查找故障、明確運維目標和提高運維效率。目前商用網絡管理軟件種類繁多,例如國內的北塔、網強等網絡管理系統。這些商用軟件網絡管理功能較為全面,但是針對信息網絡運行維護來說,還存在一些不足之處。
本文介紹了一種針對信息網絡運維而設計的網絡監控系統,該系統強調以圖形化的方式顯示當前網絡各節點狀態。以直觀的方式反映網絡故障或潛在的故障,具備節點控制、監測日志、統計以及多種智能報警功能,力求減輕網絡運維人員的工作量,提高工作效率。
1.概述
在大中型企業內部的整個網絡上面運行著各種服務器以及眾多的個人臺式機,點多面廣,管理維護難度和工作量都相對較大。僅靠單純的人工管理,被動式的檢查維護已無法滿足整個系統良好運轉的需要,面對并處理網絡中眾多設備發出的事件報告和短時間內檢測發現故障點等問題,所有的這些要求很清楚地擺在網絡管理人員的面前,因此迫切需要對網絡進行主動的監視,自動進行網絡故障的檢測與解決,以維護網絡的良好運轉,從而更好地服務于整個公司的業務系統。
圖形化監控系統可以更加直接地反映信息網絡系統狀態和故障,使運維人員明確網絡系統運行狀態,快速查找故障節點并進行處理。首先,收集網絡環境內所有網絡節點的信息資料和辦公環境圖紙,確定網絡節點物理位置,建設信息網絡節點圖形化管理系統,根據收集的信息建立圖形界面和聯動資料庫,包括用戶物理位置、用戶信息、設備信息、網絡連接狀態信息等;然后把信息網絡節點圖形化界面與現有的網絡管理系統進行接口配置,在圖形界面上產生網絡節點的實時狀態信息,同時可進行接口狀態操作,并進行網絡節點狀態聯動報警系統,當故障發生時,對預先指定的報警情況進行報警,報警方式可通過郵件和短信,使維護人員在第一時間得知并判別故障類型和嚴重程度,并通過圖形界面精確判斷故障地點,縮短網絡故障發現和處理時間。
2.圖形化網絡監控管理系統技術結構、技術優越性
2.1圖形化網絡監控管理系統技術結構
圖形化網絡監控管理系統由圖形部分、網絡管理功能部分、網絡健康度評估部分和運維流程部分組成。各部分的作用為:
2.1.1圖形部分
圖形部分是整個監控管理系統的銜接部分。其作用首先是系統本身各類功能的操作界面和針對網絡系統各環節物理位置的直觀展示,比如機房內設備位置圖、建筑結構圖和辦公室網絡布點圖等,以及網絡系統整體和部分的拓撲結構圖,用三維圖形和二維圖形結合進行展示;其次是對整個監控管理系統的各功能部分進行銜接,像前面提到的網絡管理功能部分、網絡健康評估部分和運維流程部分要通過圖形部分進行銜接,使各部分功能得到體現,監控人員通過其進行監控和管理。圖形部分的完整度和詳細度直接影響到整個監控管理系統的運行效果。
2.1.2網絡管理功能部分
網絡管理功能部分是整個監控管理系統的核心組成,按照分層架構設計思想進行建設,實現網管數據采集與處理的分離,數據處理與呈現的分離,共分為 3 個層次:數據采集層、數據處理層和功能顯示層,具有較強的靈活性和可擴展性。
數據采集層:數據采集層是位于數據處理層與管理對象之間的數據采集子系統,與 IP 網的網元設備和相關的業務系統交互,遵循標準的通信協議,完成系統所需的各類原始管理數據的采集,包括主機、網絡、數據庫、中間件、應用軟件、環境等數據源的原始信息,如配置數據、性能數據、故障數據和準確性數據等。
數據處理層:將數據采集層所獲得各種數據進行清洗、整理和標準化處理,提供各應用功能進行處理分析、統計及存儲,如通過觸發事件發生器,將收集的各類原始信息與KPI閾值對比后進行分析、配置或處理,形成資源分類的告警信息等。
功能顯示層:針對分類管理信息進行統一匯總和多維展現,實現網絡、系統硬件設備資源和軟件運行狀況的統一監控和管理,保障業務系統的正常運行。
另外按功能模塊劃分可分為六大模塊,包括數據采集組件、綜合網管服務、WEBService 應用組件、IE顯示層組件、數據流分析探針、外部數據庫,各模塊組件之間通過TCP/IP進行通信,支持靈活的集中或多服務器的部署策略,提高系統的可擴展性。下面是其中幾種模塊的功能簡介:
數據采集組件:接收各網管功能模塊的數據采集請求,定時其管理范圍內的被管對象中收集IT基礎設施信息,同時維護、提供性能數據緩存,存儲獲得的IT基礎設施的性能信息,從而達到:統一的數據獲取接口、多管理協議支持、可擴展的IT組件支持、數據有效性控制和智能化網絡訪問控制。
綜合網管服務:綜合網管服務(NMS)作為數據處理層,建立了網絡管理模型和資源數據訪問模型的標準化,NMS數據處理層中采用了O/R Mapping、IOC、Remoting等技術完成系統的架構和實現。NMS將實體對象的數據如網絡配置數據、資源數據存儲在關系型數據庫中,通過O/R Mapping 實現將關系模型映射到面向對象的數據模型,提供完整的面向對象的數據管理、訪問模型和接口,完成了網絡管理數據的對象化,包括:網絡配置數據、 設備網元數據、性能數據(歷史數據、實時數據)、告警規則配置數據、告警信息數據、服務資源數據和用戶權限配置數據。
WebService應用服務:與圖形化部分緊密結合,監控系統的應用管理、呈現層采用WEB架構實現,通過WEB2.0、AJAX、WEBSERVICE、JSCRIPT等技術,實現完整的B/S模式的應用管理、數據呈現等核心功能。通過管理控制臺集成了網絡拓撲管理、網絡監控、故障管理、報表管理、服務資源管理、資產管理和系統管理等。方便用戶統一執行管理任務。門戶功能模塊可歸納為三種類型:門戶基本框架和管理功能:提供門戶通用服務和基本功能。包含用戶管理,門戶系統權限管理等。對其它系統的集成功能:主要提供對于系統監控管理,流程管理,分析報表集成。管理門戶將作為這些系統的統一訪問入口,并為用戶提供單一登錄功能。開發定制的特定服務模塊:開發用戶要求的日志和審計功能模塊,用戶訪問統計模塊。
數據流分析探針:監控系統的性能數據采集能夠支持秒級單位的采樣周期。能夠提供原始采樣頻率的數據。監控系統經過一段時間的記錄,能夠通過對性能數據的對比,生成相應的閥值告警事件。監控系統通過Web訪問的方式為用戶展示物理拓撲結構,并通過物理拓撲結構為用戶提供全網的性能和狀態信息,并通過顏色表現表示出來,幫助用戶及時發現網絡潛在的故障隱患點,從而為用戶提供管理數據的分析、診斷機制和運維管理流程。
2.1.3網絡健康度評估部分
評價指標主要包括可用帶寬、單雙向時延、單雙向時延抖動和單雙向丟包。可用帶寬直接影響網絡業務的質量、網絡對即將開展業務的支撐能力以及網絡的擴容規劃和設計。單向時延、單向時延抖動和單向丟包之所以不可缺少是由于業務服務器和客戶終端內容交互的非對稱造成的。評估方式由系統采用基于端到端的網絡性能質量測試方法,指標是端到端之間的指標而不是單個設備、某一段甚至某一跳之間鏈路的指標。端到端的含義包括業務的起始點和業務的終止點整條路徑,是業務傳輸的全部環節,端到端的單向時延是從一個測量點(一個具體的IP地址)到另外一個測量點的數據報文傳遞所用的時間,這個時間是轉發時延、排隊時延和傳輸時延的總和,通過一系列測試后可以得出現有網絡健康度情況。
2.1.4運維流程部分
網絡運維流程從功能上可以劃分為六個模塊,各模塊功能如下:
任務工單管理。該模塊實現臨時性任務管理功能,如派發給縣公司的任務工單、接收來自公司的任務工單、部門內部用于任務分配的個人任務以及部門之間用于項目管理的部門任務等。
業務流程管理。該模塊實現對例行性網絡運維業務流程的管理功能,如資源調度流程、故障處理流程、網絡優化流程和業務開發流程,這些流程一般可分解為定義良好的任務、角色、規則和過程,通過與人和各種應用系統的交互來進行工作流程的執行和監控,達到提高網絡運維效率和網絡管理水平的目的。
統一工作任務列表。該模塊為用戶提供統一工作任務列表,包括當前任務、新建任務、已派發任務、已處理任務、閱知任務和待發任務。通過統一工作任務列表可以接收處理來自各方面的任務工單及來自工作流系統的業務流程。
工作任務統計分析。該模塊實現對個人工作和組織工作的統計分析功能,包括派發任務數量、接收任務數量、不同難度任務所占比例、任務完成及時率、任務完成質量及績效指標完成情況等。
接口適配。該模塊提供與網管部分、圖形部分以及資源管理平臺的接口適配功能,通過系統之間的數據交換和應用集成達到部分業務流程自動化的目標。
工作流管理系統。工作流管理系統是用于定義、實現和管理工作流運行的一套軟件系統,通過與人和各種應用系統的交互來進行業務流程的執行和監控。工作流管理系統是網絡運維流程支撐平臺的核心,包括圖形化建模工具、工作流引擎、管理監控工具和工作任務列表四個主要功能模塊。
2.2技術優越性
2.2.1網絡故障查找直觀明了,圖形化網絡監控管理系統的特點是實體圖形的大量使用,把網絡連接、設備位置、機房或房間布局、故障點描述等通過具體的圖形表現出來,再與網絡管理系統各個監測功能模塊集成,就可以直觀明了的對各類故障情況進行圖形化描述,信息網絡運維人員可通過該系統了解故障的等級、類別、具體位置,并以此得出相應的處理辦法,直接節約了普通故障查找的人力和時間,提高了工作效率。
2.2.2網管系統功能全面,由六大模塊組成,包括數據采集組件、綜合網管服務、WEBService 應用組件、IE顯示層組件、數據流分析探針、外部數據庫,涵蓋層次化管理、拓撲管理、網絡監控管理、IP地址管理、主機服務器管理、數據流分析、故障報警管理和報表管理多項功能,還可通過相關功能模塊對整體或部分網絡系統健康度進行評估,以此為依據指定相應的網絡整改方案。
2.2.3信息網絡運維流程明確,可通過網絡運維部分人為或自動進行運維工單下達,實現完備的流程化操作,包括任務工單管理、業務流程管理、統一工作任務列表、工作任務統計分析和工作流管理,從接受運維任務、任務分析、制定運維方式、資源調撥、人員派遣、運維操作、完成任務和對應不同變數選擇相應調配方式完成運維流程。
3.圖形化網絡監控管理系統的應用
3.1系統中圖形部分的應用
該部分應用包括系統本身操作界面圖形和具體信息網絡拓撲信息及實際物理環境圖形的規劃編制。首先是操作界面圖形的規劃編制,涵蓋層次化管理、拓撲管理、網絡監控管理、IP地址管理、主機服務器管理、數據流分析、故障報警管理、報表管理和系統管理,以及各大類下面具體分類的操作界面圖形,如下圖所示:
其次是具體信息網絡拓撲信息及實際物理環境圖形的規劃編制,要收集公司范圍內所有網絡節點的信息資料和辦公環境圖紙,確定網絡節點物理位置,具體到網絡設備、網絡線纜、網絡通道、安全設備、服務器的布點狀態,以及信息機房和辦公室的布局圖紙,如下圖所示:
然后用具體的網絡設備圖形反應實際網絡連接情況,如下圖:
最后可根據圖形的詳細顯示得出網絡故障節點位置和嚴重程度等信息,極大的便利了網絡運維工作。
3.2系統中網絡管理功能部分的應用
網絡管理功能部分是整個監控管理系統的核心組成,通過snmp協議讀取和寫入交換機、路由器、服務器等信息設備策略和數據信息,主要通過人工錄入和自動搜索相結合的手段進行設備發現和鏈路獲取,整合分析數據實現層次化管理、拓撲管理、網絡監控管理、IP地址管理、主機服務器管理、數據流分析、故障報警管理和報表管理多項功能,再通過設定網絡管理系統本身的報警策略定制報警數值和臨界點等信息,以圖形顏色標示、聲音、短信或郵件等方式對系統管理員進行告警。
網絡管理功能部分是整個系統的核心,圖形部分的功能顯示、網絡整體健康度評價和運行維護人員流程管控,都要通過功能部分進行實現和鏈接。
4.結論
圖形化網絡監控管理系統在信息網絡運維中的應用,將解決網絡運維側重于對網絡設備本身或網絡的維護與管理的問題,解決各類網管系統之間信息無法互通、管理內容龐雜、操作界面多樣等問題帶來的局限性,大大降低了信息網絡系統的運行風險,提高運維工作效率,實現對全網的綜合管理,包括全網故障分析、故障定位、全網性能綜合分析等功能,能夠從總體上提高企業的全網綜合管理水平和運維工作效果。
【參考文獻】
[1]張瑋,唐學文,馬穎.圖形化校園網絡監控系統的設計與實現.計算機與現代化[J],2007,5:72.
[2]盧艷軍.端到端網絡承載性能質量測評勢在必行.電信技術[J].2006,9:15.
[3]海空.網絡運維流程管理平臺的建設和應用.中國IT實驗室[N].2008,12:3.