摘 要:簡(jiǎn)述Nagios及其工作原理,重點(diǎn)研究該系統(tǒng)可采用的多種報(bào)警方式,并結(jié)合實(shí)例給出部分配置與實(shí)現(xiàn)方法。最后討論和分析各報(bào)警方法的特點(diǎn)與應(yīng)用前景,為有效實(shí)現(xiàn)網(wǎng)絡(luò)監(jiān)控與管理提供應(yīng)用參考。
關(guān)鍵詞:Nagios;網(wǎng)絡(luò)監(jiān)控;報(bào)警
引言
隨著各行業(yè)信息化進(jìn)程的快速發(fā)展,機(jī)房規(guī)模、設(shè)備數(shù)量、服務(wù)類型均不斷加大和豐富。保障系統(tǒng)的穩(wěn)定、可靠是高質(zhì)量服務(wù)的基礎(chǔ)和重要任務(wù),而龐大而繁雜的網(wǎng)絡(luò)環(huán)境運(yùn)維是每位管理員面臨的艱難挑戰(zhàn),因此科學(xué)的監(jiān)控方法與管理模式是系統(tǒng)維護(hù)的重要組成部分,有效的監(jiān)控管理系統(tǒng)是故障快速響應(yīng)與處理的必要手段。具有一個(gè)能夠完成對(duì)主機(jī)或服務(wù)進(jìn)行檢測(cè)的自動(dòng)化工具就非常重要,Nagios(Nagios Ain't Gonna Insist On Sainthood)就是實(shí)現(xiàn)對(duì)遠(yuǎn)程主機(jī)、服務(wù)以及網(wǎng)絡(luò)全面監(jiān)控的開(kāi)源管理軟件,其在眾多監(jiān)控系統(tǒng)中具有成本低廉、結(jié)構(gòu)簡(jiǎn)單、使用靈活、功能強(qiáng)大、可維護(hù)性強(qiáng)等諸多特點(diǎn)[1]。當(dāng)發(fā)生故障時(shí),基于Nagios的監(jiān)控系統(tǒng)能夠以多種報(bào)警方式通知維護(hù)人員,并且準(zhǔn)確地描述故障點(diǎn)位置,為高效地處理故障提供保障。本文以SUSE Linux 10.2、Nagios 3.2.3、apache2.2.3、php5.2.5為配置環(huán)境,對(duì)Nagios系統(tǒng)各種報(bào)警功能進(jìn)行測(cè)試與應(yīng)用描述。
1 Nagios及其工作原理
Nagios是一款基于GPLv2許可開(kāi)發(fā)的開(kāi)源網(wǎng)絡(luò)監(jiān)控軟件[2,3],其在Linux/Unix環(huán)境下運(yùn)行,基于瀏覽器的接口允許從任意平臺(tái)上進(jìn)行操作控制。Nagios采取靈活的模塊化設(shè)計(jì),其本身不包含任何監(jiān)控機(jī)制,主要利用其眾多插件對(duì)多種系統(tǒng)的主機(jī)和服務(wù)進(jìn)行檢查[4,5]。當(dāng)被監(jiān)控設(shè)備工作狀態(tài)發(fā)生異常變化時(shí),Nagios可通過(guò)Web頁(yè)面、聲音、電子郵件、短信等[6-10]多種報(bào)警方式通知管理員,從而縮短故障的響應(yīng)和排查時(shí)間,提升服務(wù)質(zhì)量與效率[11]。
2 報(bào)警方式與實(shí)現(xiàn)
2.1 Web頁(yè)面報(bào)警
Nagios提供web界面查看和管理,其Web頁(yè)面報(bào)警即登錄后通過(guò)瀏覽器觀看被監(jiān)控的對(duì)象及相關(guān)日志。Nagios定義了4種監(jiān)控狀態(tài),代表不同級(jí)別的告警,具體參見(jiàn)表1,除OK代表正常不用關(guān)心外,其余3種都要引起重視。
2.7 其它報(bào)警方式
Nagios的報(bào)警方式較為靈活,除以上常用報(bào)警方式外還有如MSN等即時(shí)通訊軟件結(jié)合使用,即時(shí)通訊軟件的服務(wù)器端分私有協(xié)議和基于開(kāi)放的XMPP(Jabber)協(xié)議,MSN是基于微軟研發(fā)的私有協(xié)議,報(bào)警信息與MSN結(jié)合,需要用MSN的機(jī)器人的PHP程序[7]。
3 特點(diǎn)分析與討論
通常在Nagios監(jiān)控應(yīng)用時(shí),在保證報(bào)警信息快速、準(zhǔn)確,一般會(huì)采用多種報(bào)警同時(shí)觸發(fā)的方式。Web、郵件報(bào)警方式需要維護(hù)人員定時(shí)查看記錄,時(shí)效性不理想,不過(guò)目前公共郵箱有接收到郵件后即時(shí)發(fā)送短信功能(如139郵箱等),可以結(jié)合這一功能以郵件和短信郵箱功能較好實(shí)現(xiàn)故障告警信息的接收,實(shí)際應(yīng)用中,該類故障告警從接收郵件或網(wǎng)絡(luò)延時(shí)會(huì)消耗一定的時(shí)間。聲音報(bào)警每次都需要網(wǎng)絡(luò)驗(yàn)證,且聲音告警必須在全部監(jiān)控點(diǎn)為正常狀態(tài)時(shí)才不發(fā)出告警音,否則將會(huì)總發(fā)出告警音(特別是報(bào)警音次數(shù)設(shè)置較多更為明顯)。
短信貓、飛信告警相對(duì)實(shí)用性較強(qiáng),短信貓方式從硬件設(shè)備到SIM卡短信發(fā)送都將產(chǎn)生一定費(fèi)用,增加了運(yùn)行成本。使用飛信則可以節(jié)約我們的設(shè)備和短信費(fèi)用,但由于飛信版本不定期進(jìn)行升級(jí),在升級(jí)期間飛信客戶端無(wú)法使用,這對(duì)監(jiān)控實(shí)時(shí)性要求較高的系統(tǒng)來(lái)說(shuō)則不夠完美,另外目前的開(kāi)源版本需要輸入驗(yàn)證碼,配置和應(yīng)用上增加了一定的繁瑣程度。該兩種方式也可結(jié)合郵件報(bào)警一并觸發(fā)。
Nagstamon報(bào)警對(duì)于管理員在工作時(shí)間的監(jiān)控管理非常實(shí)用,其能夠在第一時(shí)間發(fā)現(xiàn)故障的服務(wù)(如果是短信通知的話,一般都是監(jiān)測(cè)3次都失敗時(shí)才發(fā)送短信,但nagstamon是第一次發(fā)現(xiàn)時(shí)就發(fā)出提醒)。對(duì)于MSN等即時(shí)通訊軟件在日常工作時(shí)間的監(jiān)控也是一種很好的備用報(bào)警方式。
4 結(jié)語(yǔ)
Nagios利用其強(qiáng)大的服務(wù)檢測(cè)和報(bào)警功能,對(duì)于及時(shí)發(fā)現(xiàn)系統(tǒng)運(yùn)行時(shí)的問(wèn)題和隱患,對(duì)于節(jié)省信息化維護(hù)的費(fèi)用,保障信息系統(tǒng)的正常運(yùn)轉(zhuǎn)都具有重要意義。Nagios系統(tǒng)的應(yīng)用將有效的解放勞動(dòng)力,通過(guò)歷史監(jiān)測(cè)數(shù)據(jù)更可為改進(jìn)和優(yōu)化系統(tǒng)提供基礎(chǔ)依據(jù)。靈活的報(bào)警方式可準(zhǔn)確、及時(shí)的判斷故障信息點(diǎn),為快速進(jìn)行故障處理、提高工作效率提供保障。在實(shí)際應(yīng)用中,Nagios對(duì)服務(wù)監(jiān)控存在誤報(bào)的情況,因此需要對(duì)針對(duì)網(wǎng)絡(luò)的實(shí)際情況對(duì)監(jiān)控腳本的參數(shù)進(jìn)行優(yōu)化調(diào)整,從而實(shí)現(xiàn)最佳的監(jiān)控服務(wù)和報(bào)警功能。
參考文獻(xiàn)
[1]高俊峰.高性能Linux服務(wù)器構(gòu)建實(shí)戰(zhàn):運(yùn)維監(jiān)控、性能調(diào)優(yōu)與集群應(yīng)用:機(jī)械工業(yè)出版社 2012.
[2]Barth W: Nagios : system and network monitoring. U.S. ed. Munich,San Francisco: Open Source Press,No Starch Press,2006.
[3]Barth W: Nagios : system and network monitoring. 2nd ed. San Francisco,Munich: No Starch Press ,Open Source Press,2008.
[4]李晨光.Linux系統(tǒng)網(wǎng)絡(luò)管理模塊的實(shí)現(xiàn).鐵路計(jì)算機(jī)應(yīng)用2008,17:35-8.
[5]尤國(guó)君.淺談基于Nagios的網(wǎng)管系統(tǒng).價(jià)值工程2010,29:254-5.
[6]宋化,劉可,張亦梅,李垠.Nagios在地震網(wǎng)絡(luò)監(jiān)控中的應(yīng)用.長(zhǎng)江科學(xué)院院報(bào)2011,28:36-41.
[7]宋磊,王靜文.OpenBSD下基于Nagios的網(wǎng)絡(luò)服務(wù)監(jiān)控報(bào)警系統(tǒng)的研究.電腦編程技巧與維護(hù)2009:112-3.
[8]楊昌武,曹龍漢.飛信報(bào)警方式的Nagios網(wǎng)絡(luò)監(jiān)控系統(tǒng)在企業(yè)中的應(yīng)用.網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2012,7:013.
[9]李剛,王曉磊,孫路強(qiáng),姚蘭予,周利霞,齊士超,姚會(huì)琴,劉文兵.基于Nagios軟件的綜合短信聯(lián)動(dòng)告警系統(tǒng)在地震行業(yè)中的應(yīng)用研究.地震研究2012,35:133-8.
[10]李正,呂堅(jiān),付榮國(guó).淺談基于Nagios的故障告警系統(tǒng).江西通信科技2011:16-8.
[11]劉彥波,邵興華,李則河.淺談基于linux環(huán)境的網(wǎng)絡(luò)監(jiān)控技術(shù).經(jīng)濟(jì)技術(shù)協(xié)作信息2009:134-.
[12]李晨光.Linux系統(tǒng)網(wǎng)絡(luò)管理模塊的實(shí)現(xiàn).鐵路計(jì)算機(jī)應(yīng)用2008,17:35-8.
[13]魏根芽.基于Linux的Nagios服務(wù)器監(jiān)控系統(tǒng)的研究與實(shí)現(xiàn).計(jì)算機(jī)與現(xiàn)代化2010:170-2.
[14]劉穎,劉景,鄭海燕.Cacti在校園網(wǎng)絡(luò)流量監(jiān)測(cè)中的應(yīng)用.電腦與電信2008:10-1.
[15]姚會(huì)琴,李悅,高遜,楊爽.NagVis等開(kāi)源監(jiān)控軟件在天津地震前兆臺(tái)網(wǎng)的應(yīng)用研究.震災(zāi)防御技術(shù)ISTIC2012,7.
[16]張雷.基于飛信報(bào)警方式的Nagios網(wǎng)絡(luò)監(jiān)控系統(tǒng)的研究與實(shí)現(xiàn).考試周刊2011:144-5%@1673-8918.
作者簡(jiǎn)介:高東輝(1980-),男,工程師,主要從事地震信息網(wǎng)絡(luò)與應(yīng)急指揮技術(shù)系統(tǒng)運(yùn)維、管理與建設(shè)工作。