楊維發 鮑清
摘要:本文從氣象信息系統業務監控現狀入手,討論了HostMonitor軟件的功能和使用方法,并結合現有氣象信息業務進行了案例分析。
關鍵詞:HostMonitor;氣象信息網絡;監控
中圖分類號:TP393.18 文獻標識碼:A 文章編號:1007-9416(2018)02-0050-02
隨著我國氣象信息現代化建設的推進和網絡技術的蓬勃發展,各氣象部門的信息網絡系統資源日漸增多,業務系統的壓力也越來越大,其運維也需要有專門的管理人員進行管理。要保證氣象信息網絡業務系統的正常運作,在未影響業務正常運作之前發現故障十分關鍵。這就需要從底層資源,如服務硬件,內存,硬盤,CPU等保障,但僅僅靠這些分散單一的手段往往是不足以對業務系統正常運作進行完善的保障[1]。
1 HostMonitor監控模塊
HostMonitor監控對象分為網絡狀態監控、網頁監控、郵件監控、硬件資源監控、服務監控、進程監控、文件監控、數據庫監控、虛擬機監控、用戶自定義腳本監控等十多類監控對象。
1.1 網絡狀態監控
Ping命令是測試網絡連通性最基本的命令之一,通過策略配置讓本地主機或者遠程代理主機對目的IP地址進行測試,如發現丟包或無響應則等異常情況向管理員發出告警。此測試方法可用于測試服務器、交換機、路由器等網絡設備是否在線,網絡狀態監控Ping配置界面如圖1所示。
Trace命令可測試從源地址到目的地址之間經過的路由是否發生改變[2]。這種測試方法一般用在OSPF(動態路由)的備份網絡環境中,一旦主線路或者設備發生了故障,Trace命令經過的路由就會發生變化,從而觸發告警,網絡狀態監控Trace配置界面如圖2所示。
1.2 網頁狀態監控
網頁狀態監控主要包括對FTP、HTTP、和HTTPS服務的監控。在氣象信息傳輸業務中,FTP服務是最為常見的服務。例如自動氣象觀測站的觀測數據就是通過FTP協議傳輸到省局服務器。如果FTP故障而未被發現,將影響到全省自動觀測站數據的上傳時效。HTTP和HTTPS監控主要是對WEB服務進行監控,對氣象部門的門戶網站和內部公文傳輸系統的監控尤為重要,網頁狀態監控配置界面如圖3所示。
1.3 文件監控
目錄/文件更新監控功能可以對文件目錄或文件進行監控,即在設定的時間范圍內監測目錄中是否有新的文件產生,或者指定的文件的內容是否有更新[3]。此功能在氣象觀測上傳、CMACAST資料下發以及FTP文件分發等業務中起到重要作用。例如對FY2G衛星圖片每30分鐘上傳一次,可每40分鐘對此目錄進行掃描一次,如果目錄更新時間早于40分鐘,即說明傳輸可能出現問題。這樣就能在10分鐘內主動發現傳輸故障。另外部分農田小氣候站小時觀測資料的文件上傳方式為追加方式,可以通過監控文件的更新時間來監視每小時數據是上傳成功。
1.4 數據庫監控
數據庫軟件是信息網絡系統中重要的支撐軟件,HostMonitor支撐包括Oracle、Microsoft SQL、MySQL、PostgreSQL、Sybase、Interbase等主流數據庫服務的連通型測試。一旦發現數據庫連接失敗,會向系統管理員發出告警。數據庫監控還可以通過ODBC進行數據檢索查詢,并對查詢結果的指定字段進行對比,如果對比結果滿足設置的條件即出發告警。此方法結合SQL查詢語句可非常靈活地對數據庫進行監控。例如對自動站每小時的上傳數據進行查詢,并對結果進行比較,可監控自動站數據上傳的完整性和實時性。例如在整點5分鐘后執行SQL語句select count(*) from T_R_AGME_SPE_ELE t where t.v01000=Q6865 and t.observtime >sysdate-(1/144),可查出農田小氣候站Q6865前10分鐘是否有新的數據上傳,如果查詢結果少于1,則表示上時次數據未上傳。
1.5 進程監控
進程監控模塊可以對本機或者遠程代理端的進程進行監控,通過設置此進程數量的最大值和最小值來判定是否需要采取相應的措施。
2 HostMonitor告警操作方式
HostMonitor軟件具有30多種告警方式,其中包括界面提醒、聲音提醒、短信提醒、郵件提醒、ICQ提醒、停止服務、啟動服務、重啟服務、重啟系統、寫數據庫表、SNMP SET、通過TCP/UDP端口發送數據、運行外部腳本或程序等。一般最為常用的告警操作是短信告警、郵件告警、寫數據庫和執行外部腳本,短信告警需要購買短信貓設備。
通過配置可任意組合這些告警操作,并保存為告警操作文件,根據測試方法或業務需求直接選擇一些類告警操作。告警內容有可由160多個變量任意組成,包括測試方法、測試時間、測試結果、測試地址、成功次數、失敗次數、成功比例、失敗比例、狀態改變時間等。郵件告警功能中,可以配置4個告警角色,可以把不同的告警內容發送給不同的角色[4]。
3 氣象信息網絡系統統監控案例
3.1 視頻會商業務監控
省局視頻會商系統是全國天災害性天氣視頻會商系統的重要組成部分,全國天氣會商會議包括每天固定時間的早間全國天氣會商、氣象臺內部會商,每周一固定時間的全省天氣會商,每月旬最后一天的全國中期會商,行業服務用戶的視頻會議,以及臨時通知的不定期視頻會商,值班人員要提前30分鐘開啟會商系統。視頻會商系統的監控包括設備監控和業務監控,通過HostMonitor命令對MCU設備進行監控,一旦發現MCU設備死機或故障,可迅速采取應急措施,確保會商系統的正常運行。由于會商頻次多,時間不分散,為確保值班員延誤會商,可通過Ping命令對定時視頻會商進行監控。設定每次會商計劃前20分鐘通過Ping命令判斷會商系統的設備是否已開機。
3.2 RAID磁盤陣列監控
一般通用的應用監控軟件都無法對RAID磁盤陣列信息進行實時監控,管理員無法在最短的時間內獲得服務器硬盤故障信息,如果因為壞盤未被發現,可能導致系統奔潰或數據丟失。DELL公司針對DELL服務器開發的硬件監控程序可對RAID磁盤的狀態進行監控,發現故障后可運行外部程序進行告警。可寫一個創建空文本的腳本,一旦有硬件告警,會在指定目錄生成一個文件。HostMonitor可利用文件/目錄監控功能對此目錄進行監控,一旦發現有文件生成即通過語音、短信、郵件等方式通知管理員此服務器磁盤出現了故障。
3.3 數據傳輸業務監控
電話語音告警系統接入中心有一套基于數據庫的電話語音告警系統,系統實時監控數據庫表,如果表中有數據記錄,即根據協議自動撥號,并播放語音。HostMonitor的SQL Query告警方式能根據用戶配置數據庫表的寫操作,從而實現HostMonitor監控的電話語音告警。
4 結語
HostMonitor是一款非常實用、成熟的IT業務系統監控軟件,不僅功能齊全,而且價格便宜,特別適用于中小型機房和IT業務系統的運行保障。通過靈活的監控策略,結合完善的告警、日志、報表功能讓IT業務系統運行保障工作變得簡單輕松,運維工作大大減輕。
參考文獻
[1]賀朝暉,柏磊.Hostmonitor軟件在網絡和系統監控中的應用[J].華南金融電腦,2007,(1):85-86.
[2]孫旭,熊淑華,張朝陽,熊文.基于Hostmonitor的網站系統監控設計與實現[J].計算機技術與發展,2012,(5):173-176.
[3]胡玉良,程冬焱.HostMonitor監控軟件在山西地震前兆臺網的應用[J].地震地磁觀測與研究,2016,(1):131-135.
[4]齊振霞.一種基于HostMonitor軟件的寬帶城域網監控方法[J].河南科技,2013,(24):11-12.