■ 湖南有線長沙網絡有限公司 熊旺 趙軍 謝欽卿
編者按:本文筆者將介紹The dude 免費網絡運維管理工具并分享它在園區機房監控管理上發揮的作用,為企業網絡的日常管理和故障排除方面提出了良好的運維思路。
The dude監控系統,是一款省時省力、操作簡單、定制功能強大的免費管理工具。它是由Mikrotik 公司開發的良心工具,相信大家常用Ping 命令來監控主機在線狀態、抖動以及延時,通過SecureCRT 工具遠程telnet 登錄操作我們的網絡設備。這些對于網絡節點較少還能勉強應付,如果網絡規模較大呢? The dude 靈活的擴展特性建立一套適用的網管監控系統,可以定義子網內自動搜索或手動添加設備,繪制和生成網絡拓撲圖,或者讀取SNMP OID 節點記錄設備重要指標的實時及歷史趨勢數據,采用圖表的直觀展現分析,涵蓋了維護人員關注的重點,在服務中斷后發出報警提示,記錄到當前日志,并支持告警微信推送,有效輔助園區機房設備運維管理。
園區情況:園區機房為無人值守機房,該機房節點使用2G 專線完成與核心網連接,由于園區機房建立時并未納入動環網絡監控,從而成為網絡監管的盲區。雖然設備之間有連接,但是值班人員缺乏網絡監控手段,不能及時發現網絡故障。
設備情況:GPON 設備是整個園區重要節點,區域內用戶的匯聚點,一旦出現故障,將會造成片區內大面積斷網。
總體思路:利用The dud e 網絡管理監控工具,建立一套實時加歷史趨勢的監控體系,采用圖表直觀展現,有效輔助園區機房GPON 設備運行狀態的監控,達到改善園區機房的網絡環境和及時發現網絡故障的目的。
層次化的拓撲管理,由于監控園區機房和設備數量龐大,需要有一個清晰結構將設備的連接關系組織起來,因而借鑒網絡拓撲的組織形式,并繪制層次化結構圖。
運行軟件后進入The Dude 界面,選擇Network Maps,在右側框中點擊“搜索”,然后在彈出的對話框中設置搜索網段列如:172.16.0.1/24、服務種類(ping、telnet 等)設備種類如GPON 等相關參數,就可以完成網絡設備和拓撲自動發現。
應急處理故障的同時,我們還需要對園區機房溫度、電源以及網絡的可用性、帶寬占用等指標進行監控,園區機房采用220 V 交流和48 V 直流,GPON 設備采用是48V 直流供電,直流電源一體化整流模塊并安裝4 節電池保障。為了監控園區交流是否出問題,我們在GPON 設備下掛220V ONU。當監控ONU掉線,我們判斷園區停市電,這時我們準備發電。同時我們通過the dude 即時獲取帶寬利用率等指標,在網絡發生擁塞前,開展園區機房GPON 業務,網絡升級擴容。
具體操作:定義一臺GPON 標簽


圖1 Stunnel 界面
當有園區機房網絡中斷后或者預設閥值突破后,The dude 網絡管理工具及時報警,運維人員迅速響應,排除網絡故障。默認情況下,設備正常運行顯示為綠色,設備服務部分故障顯示黃色,設備網絡中斷故障顯示為紅色。網絡中斷故障發生報警音提醒微信推送,并將告警時刻記錄到系統日志中
The Dude 監控設備中斷和恢復時通過Email 發送,如果你申請一個139 或QQ郵箱,將郵件發送到139 或QQ 郵箱中,還可以自動發送短信、微信提醒。只要有網絡,不管是否是RouterOS,都可以用The Dude 監控,及時報警提醒你,畢竟這樣的免費軟件不多。
該功能從 wiki.mikroti k.com 上Dude 手冊中找到相關說明,Dude 自身有Email功能,但是不支持郵件發送,需要借助在Windows 上安裝相關的工具發送郵件。我們需要安裝一些工具和插件。通過Windows 系統搭建Blat+Stunnel+Dude+你的Email,完成The Dude 的Email 發送。
(1)Stunnel 工具
Stunnel 是一款免費的工具,Stunnel 是一個自由跨平臺軟件,用于提供全局的TLS、SSL 服務。針對本身無法進行TLS 或者SSL 通信客戶端及服務器,Stunnel可提供安全加密連接。
(2)Blat 工具
Blat 是一個命令行發郵件的小工具,僅支持簡單的SMTP 協議,需要SMTP 服務器的支持。
首先安裝Stunnel,安裝完成后再程序中找到圖1 所示,Stunnel 選擇Edit Configuration。
這里支持POP3、SMTP 等郵件功能,這里我選擇的是SMTP 的連接方式,筆者使用的是139 郵箱服務器,寫入以下代碼:

編寫完成后我們開啟Stunnel 服務。
解壓blat 文件后,在D:Dudelat 目錄下新建一個blat 文件,將blat.dll、blat.exe、blat.lib3 個文件拷貝到‘d:Dudelat’中,然后新建并編輯Emailblat.Cmd 的執行腳本。


圖2 通告界面

登錄139 郵箱,在設置--常規設備里開啟SMTP。
編輯完成后,我們打開Dude,并添加Notification,雙擊加入以下代碼如圖2 所示。
加入到對設備的監控中,一旦設備某項服務探測中斷或恢復都會發送Email。
這樣Dude 的郵件發送功能就完成了。
在139 郵箱里開啟短信提醒,這樣當設備狀態改變時,Dude 會發送139 郵件,同時手機也會收到Dude 的告警短信提醒。
在微信里設置QQ 郵件提醒,這樣只要微信開啟就可以收到Dude 實時告警推送。
The dude 網絡管理工具在園區機房監控已運行1 年多,穩定可靠。該軟件能有效改進園區機房管理方式,把運維人員從紛繁復雜的人工監控、發現、告警中徹底解放出來,其直觀形象的操作方式,能夠提高運維人員工作效率,并促進企業運維管理信息化水平的提升。