姚會琴 李 悅 高 遜 楊 爽
(天津市地震局,天津 300201)
NagVis等開源監控軟件在天津地震前兆臺網的應用研究1
姚會琴 李 悅 高 遜 楊 爽
(天津市地震局,天津 300201)
NagVis是Nagios開源網管系統中的展示組件,它可采用多種模式對Nagios系統中的監控對象進行圖形化展示,本文主要闡述其在天津前兆臺網中的應用情況,包括NagVis的工作模式,監控圖形的配置管理和使用,NagVis在天津前兆臺網系統運行狀態監控與展示方面的情況以及應用后的效果對比等。本文為開源軟件在行業中的進一步應用提供了參考。
前兆 Nagios NagVis 監控
天津區域前兆臺網運行儀器有56套、測項分量有159個,儀器觀測類型包括“十五”地震項目、“九五”地震項目和人工觀測,它涵蓋了形變、地磁、地電和流體學科以及輔助觀測等。在日常工作中,每天通過軟件、聲音、短信、郵件、電話、人工等多種方式,對SQL Server數據庫系統、Oracle數據庫系統、供電系統、通訊鏈路、避雷系統等的運行狀態按照規范要求進行認真地檢查,若發現問題及時解決。同時隨著設備數量的增加,對于管理工作的要求也越來越高。而在采用了網絡化儀器后,相比以前提升了設備的在線監控能力。為了更好地實現對儀器的監控與管理,本文結合天津市地震局網絡中心建立的Nagios開源網絡監控的NagVis組件,實現了按區域、管理范圍分類的網絡化前兆儀器的在線運行狀態監控和展示(王建國等,2009;2010a;2010b)。
2010年天津市地震局網絡中心將建設好的Nagios(李剛等,2011a;2011b)開源網管系統開放到全局業務系統使用,其主要功能包括:網絡儀器設備在線狀態監控、網絡應用與服務監控、綜合監控圖形展示、故障聯動告警等幾大功能(李剛等,2012)。系統投入應用以來,對全局199臺網絡設備與儀器、103項網絡應用與服務以及虛擬化應用進行了24小時監控,涉及信息網絡、測震、前兆、強震、GNSS、應急指揮等各個領域。
Nagios是開源網管系統中應用非常廣泛的軟件系統,可以對各類主機、設備、服務等進行詳細監控,擴展功能強大,常用的組件包括Nagios-plugins、NDOUtils、NRPE、NSClient++、NagVis、Cacti等,其運行結構如圖1所示。

圖1 Nagios系統監控結構示意圖Fig. 1 Schematic structure of Nagios system monitoring
NagVis是Nagios的一個組件,簡單來說,Nagios是一個底層監控平臺,Nagvis是圖形化的前臺展示系統,它可以將各類信息以圖形化的方式展示給用戶,提高系統的可視化能力。它在用戶選擇的背景圖片上顯示主機和服務狀態,背景圖片必須是PNG格式,背景可以是圖、系統文檔圖片、機房照片或者系統環境的示意圖等,可以將監控對象放在背景圖上的任何位置。
在展示中,NagVis會根據監控對象的狀態顯示不同的顏色圖標。紅色表示嚴重告警狀態,黃色表示告警狀態,綠色表示正常狀態,灰色背景中的問號表示未知狀態。
在默認的NagVis中,主機采用矩形圖標,服務采用圓形圖標表示。
NagVis具備聲音告警功能,可對嚴重告警和告警狀態設置各類告警聲音,提醒用戶注意。注意:如果要用到NagVis的聲音報警功能,需要在PC機上安裝QuickTime媒體播放工具。
NagVis正常安裝與運行,需具備以下條件:①Nagios正常運行;②NDOUtils正常運行;③Web server支持PHP5.0或以上版本;④系統中安裝有版本要高于2.14的Graphviz組件;⑤PHP要包括PHP5-gd、PHP5-gettext、PHP5-mysql、PHP5-mbstring、PHP5-session、PHP5-xml等模塊。
在NagVis中建立監控圖形,要通過2個步驟:①在Nagios中建立監控對象;②建立背景圖片并通過NagVis將監控對象疊加到背景圖片。這里不再詳述Nagios系統監控配置方法,讀者可以查閱相關手冊或資料。
(1)用Visio制作拓撲結構圖生成png格式圖片。通過IE瀏覽器登錄NagVis,點擊[Edit current map]進入管理界面,右鍵打開管理菜單,選擇[Manage]->[Backgrounds]打開背景圖形管理窗口,如圖2所示。
(2)在圖1所示的窗口中,選擇[Upload background image]->[瀏覽]按鈕,選擇所用的png圖片,并通過[Upload]按鈕上傳到NagVis中,完成后,可在background管理窗口中看到上傳的圖片。

圖2 NagVis背景圖形管理窗口Fig. 2 Background graphics management window of NagVis
(3)在NagVis的管理窗口中,右鍵打開管理菜單,選擇[Manage]->[Maps]打開監控圖形管理窗口,在[Create map]部分,輸入或選擇如下內容:
Map name:NagVis_Test 要建立的監控圖形名稱,注意:名稱中不能有空格。
User with read permissions:EVERYONE具備查看此圖形的用戶,EVERYONE為所有人。
User with write permissions:nagiosadmin 能編輯與修改此圖形的用戶,默認只填寫nagiosadmin(或Nagios的管理員)。
Map Iconset:std_small 監控圖形中需要展示的圖形類型,默認為std_medium。
Background:nagvistest.png 監控圖形所用的背景圖片,選擇前面上傳的nagvistest.png。
完成后,點擊[Create]按鈕,即可生成新的監控圖形,如圖3所示。

圖3 NagVis中的監控圖形Fig. 3 The monitoring graphics of NagVis
(4)在圖3中,點擊[NagVis_Test]圖形,打開圖形監控窗口,點擊[Edit current map]進入到此圖形的編輯狀態,背景圖右鍵打開編輯狀態菜單選擇[Add object]->[Icon]->[Host],鼠標變成“十”字光標形狀,將光標放到要顯示監控信息的位置上單擊,打開主機對象添加窗口。在[host]欄目中選擇所需監控設備或主機,點擊[Save],即可以看到此對象的監控圖標已經對應地放置到監控圖形中。
在 host對象添加窗口中,有眾多選項,其中 host、x、y三項必須填寫,host是選擇在Nagios中已經監控的對象,x、y用于設定監控對象在背景圖上的位置,如果發現監控對象的圖標在背景圖上有偏差,可以通過調整x、y值進行修改。
(5)在監控對象添加完成后,在監控圖形上右鍵打開編輯菜單,選擇[Open in NagVis]->[NagVis_Test],即可在NagVis中打開監控圖形。此時在監控圖形中,把鼠標放到監控對象圖標中,即可以看到此對象的所有狀態信息。包括主機狀態,以及主機中的各項服務的狀態等。
根據上面的方法,就可以將所需監控的各類儀器、設備和應用個性化放置到圖形中,實現業務系統的可視化監控。
掌握了NagVis的管理與應用方法后,作者在Nagios系統中對天津前兆臺網所管理的各類IP儀器、設備和應用進行了監控,包括6臺服務器和網絡設備,30多套前兆儀器。對這些儀器和設備,按管理區域進行了劃分,建立了前兆臺網儀器設備拓撲圖、8個專業地震臺站的業務系統拓撲圖(見圖4),并為臺站人員建立訪問用戶,可實時在線查看前兆儀器和設備的運行狀態。表1為應用效果的對比。

圖4 前兆臺網和薊縣地震臺監控圖形界面Fig. 4 Monitoring graphic interfaces of the Tianjin precursory network and Jixian seismic station

表1 應用效果對比Table 1 Contrast of application effect
通過上述工作達到了以下目標:
(1)實現了對全局IP類前兆儀器和設備的統一監控,提升了對儀器設備和業務系統的監控能力,現在只要在行業網內的任何一臺計算機上,通過瀏覽器就可看到設定好的儀器的運行狀態圖,具備了可視化監控能力。
(2)有了良好的監控,對各類故障的響應能力也得到了大幅度的提升,在某些儀器出現網絡故障時,可在第一時間得到告警信息,通知相關人員及時檢查并排除故障,使系統的運行率得到了有效的保障。
NagVis作為Nagios開源網絡管理軟件的一個展示模塊,在日常工作中能很好的解決實際問題,且并運行穩定可靠。因此,作者認為在今后的工作中,可以進一步擴大對開源軟件系統的測試與應用,用很少的投資實現最好的應用。
李剛,周利霞,王曉磊等,2011a. 開源網管系統在地震監測網絡中的應用. 西北地震學報,33(4):380—385.
李剛,周利霞,宋軍等,2011b. 基于VMware Esxi軟件的服務器虛擬化技術在天津地震監測網絡中的應用. 震災防御技術,6(3):311—318.
李剛,王曉磊,孫路強等,2012. 基于Nagios軟件的綜合短信聯動告警系統在地震行業中的應用研究. 地震研究,35(1):133—138.
王建國,栗連弟,崔曉峰等,2009. 數字化地震前兆臺網日常工作管理軟件. 地震研究,32(1):79—83.
王建國,姚會琴,高遜等,2010a. 天津市地震前兆臺網的運行監控與維護管理.大地測量與地球動力學,30(A01)111—115.
王建國,聶永安,姚會琴等,2010b. 天津市地震前兆臺站綜合評比及軟件研制. 地震地磁觀測與研究,31(增刊1)82—84.
Application of NagVis Open-source Monitoring Software in Tianjin Earthquake Precursory Network
Yao Huiqin, Li Yue, Gao Xun and Yang Shuang
(Earthquake Administration of Tianjin Municipality, Tianjin 300201, China)
NagVis is display component of Nagios open source network management system. This paper mainly described service condition of NagVis in Tianjin earthquake precursory network, including NagVis work model,monitoring graphics configuration management,the application of NagVis in network system operation condition monitoring and display, and the contrast of application effect. All of these above provide the reference for applying open source software in the future.
姚會琴 ,李悅,高遜,楊爽,2012.NagVis等開源監控軟件在天津地震前兆臺網的應用研究.震災防御技術,7(3):329—333.
中國地震局地震科技星火計劃項目“區域(天津)地震前兆臺網運行管理方法研究與應用”(XH12004)和天津市地震安全基礎工程“前兆儀器更新改造”(ZAGC-8)聯合資助
2012-05-20
姚會琴,女,生于1980年。工程師。主要從事地震前兆臺網運行管理。E-mail: yhq@tjdzj.com
致謝:本項工作得到了天津市地震局信息中心全體人員的大力幫助與配合,在此表示感謝!
Κey words: Earthquake precursory; Nagios; NagVis; Monitor