萬燕珍 陳思超 高水 楊謝婷
(國網浙江杭州市蕭山區供電公司浙江省杭州市310000)
企業通用型網絡監測軟件研究
萬燕珍 陳思超 高水 楊謝婷
(國網浙江杭州市蕭山區供電公司浙江省杭州市310000)
隨著計算機技術的高速發展,人們的生活、工作都離不開網絡,而數據網絡在企業中也扮演著越來越重要的角色。作為公司各項業務系統的基礎支撐,保障信息網絡的穩定運行具有極為重要的意義。根據公司的要求,需要對重要業務系統以及終端機進行監控,一旦發生故障,需進行及時的恢復,以不影響正常工作為基本要求。
通用;網絡監測
21世紀是信息技術高速發展的一個時代,信息網絡已然滲透到了我們生活、工作的方方面面。隨著計算機技術和網絡技術的發展,我國信息化建設不斷取得進展,各行各業包括諸如政府、金融、教育、醫療等企業都逐漸將核心業務移植到網絡上來。企業IT部門的職責也在潛移默化中轉變:由被動實現業務需求到主動參與業務流程的制定、由建設層次向規劃層次過渡、由技術層次向應用層次過度等等。在這些企業中,基礎網絡往往支撐著多個重要的業務系統和終端,一旦系統故障,可能會造成不可估量的損失,因此保障網絡的可靠性、可用性和安全性具有舉足輕重的意義。
目前,筆者公司應用的為BTIM北塔網管軟件,能展現實際的網絡拓撲,并以圖形化界面展示網絡通斷情況,能滿足基本的網絡管理需求。然而,在應用該軟件的過程中,我們發現該軟件有幾個缺點:①故障提醒不夠及時,沒有警示彈窗,且不能將故障定位。②不能對終端機進行監控,監測對象全但并無重點。③過于專業化,在日常管理方面需要一個網絡方面的專業人員才能進行網絡狀況的監測。因此,有可能存在故障發現不及時、影響各項業務的正常運行等問題,為了解決上述問題,增強對各項重點業務的實時監控,使非專業人員也能進行網絡情況的監測,我們計劃在基于btim軟件的基礎上自行研制一種企業通用型網絡監測小型軟件,只需添加被監測的系統后點擊開始即可完成監測工作。
該監測系統不僅能讓網絡管理人員隨時隨地一目了然地了解整個IT系統的運行狀況,而且能從應用層面對IT系統的關鍵應用進行實時監測,一旦系統出現異常,通過手機短信息的方式及時通知相關人員進行故障處理,從而盡可能的的減少IT系統出現故障的可能,降低由此可能給單位的損失。完善的報告更能幫助網絡管理人員預防可能出現的故障,同時為單位網絡的戰略規劃提供依據。
軟件需求分析是開發軟件的第一步,首先,我們將本次軟件的研發定位為基于現有的btim軟件進行開發,這就意味著我們需要編寫程序后,再與btim系統建立接口,完成整個開發過程。
然后,我們將研究的要求進行逐步細化后,得到以下具體功能需求;
(1)結合btim網管系統,針對公司重點業務系統和終端進行實時監測。
(2)發生故障時,系統會彈窗提醒,并向網絡運維人員手機上發送短信。
(3)定位故障發生點,將最可能發生的故障點和可能的故障原因同時展現在彈窗中。
該軟件由三部分組成:管理器、監測程序和短信網關。其中,管理器指的就是一個圖形化界面,采用多窗口的模式的C/S架構應用程序,主要用于系統參數的設置、監測報告的查看等。
監測程序,主要基于ICMP和SNMP協議對預設的目標IP地址池進行網絡監測,可根據監測結果判斷出故障發生點,并形成監測報告和進行彈窗提醒。
短信網關,是指安裝在某臺主機上的短信收發網關,它支持包括GSM-MODEM、網絡接口等方式接收和發送手機短信,任何檢測器需要發送短信時都通過它完成。
軟件的開發過程中需遵從以下幾點原則:
(1)安全性:根據公司對信息網絡的安全要求,提供有效的安全保障。
(2)實用性:操作方式符合大多數人的Windows操作習慣,注重細節的人性化設計,讓操作盡量簡潔明了。
(3)適應性:能適應當前復雜的網絡情況,具有足夠的適用性,并且要充分考慮今后一段時間內網絡架構的變化情況。
(4)靈活性:從系統數據初始化、系統操作使用等多方面考慮到系統運維的靈活性,使各級人員的操作盡量簡單、方便。
了解系統的工作流程是軟件開發過程中的一個重要步驟,只有對系統流程有了充分的理解才能成功開發出所需求的系統。因此,我們根據前期的需求分析以及調研,結合現有的技術和條件,對系統流程進行了分析。分析后,我們將該系統的總體流程分為四個方面,分別為監測計劃、執行監測、異常告警和故障分析,具體流程圖如圖1。

圖1 系統總流程圖
4.1 監測計劃
在該階段:①我們需明確所監測的對象,即添加或刪除所需監測對象的IP地址,如若跳過這一步則視為監測默認的對象。②設定監測和輪詢的時間,在該時間內,對所需監測的對象進行不間斷的通斷檢測,以便在故障發生后的最短時間內進行識別。
4.2 執行監測
該步驟是整個架構中的關鍵,主要實現的功能是實現對重要業務系統及終端的監測,同時對監測結果進行判斷,根據判斷結果進入到下一階段。
4.3 異常告警
當檢測到系統或者主機發生故障后,為了讓技術人員第一時間發現故障,我們采取了兩種告警方式,分別是彈窗告警和短信通知,其中短信通知需通過短信網關發送到負責人處。
4.4 故障分析
在發送了告警之后,系統進入故障分析階段,通過一定的技術手段將故障發生點進行大致的定位,同時,通過對系統的各類反應分析出故障的類型,將這些內容形成一個報告后發送給管理者,在其進行搶修和做出其他應急決策時具有一定的參考價值。
ping技術:ping是一種電腦工具,用來測試數據包能否都通過IP協議到達特定主機。Ping的運作原理是向目標主機傳出一個ICMPecho要求數據包,并等待接收echo回應數據包。程序會按時間和成功響應的次率(丟包率)和數據包往返時間(網絡時延)來確定網絡的通斷情況。
Tracert(跟蹤路由)技術:用于確定IP數據包訪問目標所采取的路徑,其工作原理是通過向目標發送不同IP生存時間(TTL)值的ICMP回應數據包,跟蹤路由診斷程序會確定到目標所采取的路由。該技術可以在實際應用中找到網絡的中斷點,便于排查網絡故障。
SNMP(簡單網絡管理協議):SNMP協議以TCP/IP的協議為基礎,采用網絡管理站-代理的管理模型。網絡管理站是SNMP網絡管理的決策機構,它負責向遠程代理發出請求命令和接收來自代理的信息以實現對網絡設備的管理。而代理則運行于被管理的設備的內部,負責將來自管理站的一般化信息請求轉換為本地數據結構的等有效資源,并對該管理資源實施操作,然后返回操作結果,最后回到等待狀態。另外,代理也可以把在自身系統巾發生的車件主動通知給管理站。
在該系統成功研制之后,我們對其進行了應用,針對營業廳窗口視頻監控業務、變電站CAC油色譜在線監測業務的在線情況進行實時監控,并對多個重要的終端機進行了監控。在應用該成果之后,獲得了良好的安全效益和經濟效益。

圖2 系統軟件架構圖
6.1 安全效益
通過本項目的實施,對我公司信息網絡更高的運行保障率,及早的發現網絡的薄弱點。利用軟件自身判斷的特性,及早提醒運維人員網絡所發生的故障,提高安全效益。
6.2 經濟效益
本項目的實施也有利于提高信通專業網絡的支撐水平,同時還提高了生產、經營的效率,使信息網絡更好的為全局服務。保障重要業務系統和終端機的平穩運行,避免發生系統中斷,降低公司不必要的經濟損失。
該網絡監測管理系統實現了對網絡整體性能的監測,有助于及時發現、定位網絡故障,有助于優化網絡資源的利用,有助于提高了網絡管理的效率,有助于提高用戶服務質量。該系統滿足筆者公司的管理需要,并且具備一定的推廣價值,實現了系統的開發目標,并在應用中取得了良好的效果。
TP277
A
1004-7344(2016)16-0303-02
2016-5-16