郭 旗,曾麒麟,魏光龍,劉 芳
(淄博市氣象局,山東 淄博 255000)
近年來(lái),隨著氣象信息化與氣象現(xiàn)代化工作的不斷推進(jìn),氣象信息網(wǎng)絡(luò)的規(guī)模不斷擴(kuò)大。省-市-縣氣象業(yè)務(wù)內(nèi)網(wǎng)帶寬不斷升級(jí),氣象業(yè)務(wù)平臺(tái)逐步更新升級(jí)、推陳出新。與此相適應(yīng)的,機(jī)房?jī)?nèi)網(wǎng)絡(luò)設(shè)備逐漸更新?lián)Q代,服務(wù)器資源、存儲(chǔ)資源等氣象業(yè)務(wù)基礎(chǔ)設(shè)施日益增加。而市級(jí)氣象部門(mén)專(zhuān)門(mén)從事信息網(wǎng)絡(luò)工作的人員非常有限,一人負(fù)責(zé)管理近百臺(tái)設(shè)備,單純靠人工方式對(duì)機(jī)房大量網(wǎng)絡(luò)設(shè)備、服務(wù)器等進(jìn)行維護(hù),十分影響故障監(jiān)控與發(fā)現(xiàn)的時(shí)效性,往往難以及時(shí)發(fā)現(xiàn)并處理各類(lèi)故障。
目前,淄博市氣象局還沒(méi)有一個(gè)系統(tǒng)的平臺(tái),可以將各類(lèi)網(wǎng)絡(luò)設(shè)備、服務(wù)器等統(tǒng)一納入實(shí)時(shí)監(jiān)控并提供故障告警,以幫助網(wǎng)絡(luò)系統(tǒng)管理員更清晰地掌握網(wǎng)絡(luò)與各類(lèi)設(shè)備的實(shí)時(shí)狀態(tài),并對(duì)監(jiān)控到的故障告警及時(shí)查看處理。針對(duì)這個(gè)需求,為了更高效地管理全市氣象信息網(wǎng)絡(luò),我們?cè)O(shè)計(jì)了一個(gè)信息網(wǎng)絡(luò)業(yè)務(wù)監(jiān)控報(bào)警系統(tǒng),對(duì)淄博市氣象局及各區(qū)縣局的網(wǎng)絡(luò)系統(tǒng)設(shè)備、服務(wù)器等的信息進(jìn)行匯總整合并監(jiān)控,并以Web 頁(yè)面的形式訪問(wèn),該系統(tǒng)可實(shí)時(shí)地監(jiān)控各設(shè)備的硬件狀態(tài)、接口信息等,根據(jù)監(jiān)控到的數(shù)據(jù)反映設(shè)備的最新問(wèn)題,并根據(jù)設(shè)備間的互聯(lián)情況手動(dòng)設(shè)計(jì)網(wǎng)絡(luò)拓?fù)鋱D,直觀地展示各設(shè)備之間互聯(lián)鏈路的通斷情況,從而迅速地反映出網(wǎng)絡(luò)故障,幫助系統(tǒng)管理員更高效地判斷和解決問(wèn)題。
本文設(shè)計(jì)的信息網(wǎng)絡(luò)監(jiān)控系統(tǒng)基于B/S 架構(gòu),服務(wù)器端使用Linux 系統(tǒng),客戶(hù)端以Web 頁(yè)面形式訪問(wèn)。系統(tǒng)運(yùn)行環(huán)境為在服務(wù)器端搭建的Nginx、MySQL 數(shù)據(jù)庫(kù)、PHP 以及Zabbix。Nginx 是一個(gè)輕量級(jí)、高性能的HTTP和反向代理Web 服務(wù)器,它的優(yōu)點(diǎn)是對(duì)內(nèi)存和CPU 等系統(tǒng)資源消耗低,且并發(fā)能力強(qiáng)。MySQL 作為數(shù)據(jù)庫(kù),可以存儲(chǔ)平臺(tái)監(jiān)控到的數(shù)據(jù),并使用PHP 語(yǔ)言作為服務(wù)器端腳本解釋器。Zabbix 是一個(gè)提供分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的開(kāi)源解決方案,它能監(jiān)視網(wǎng)絡(luò)設(shè)備與服務(wù)器的各種參數(shù),保證設(shè)備的安全運(yùn)行,并提供告警信息,以幫助系統(tǒng)管理員快速定位和解決存在的問(wèn)題。
Zabbix 由Zabbix server 與可選組件Zabbix agent 兩部分組成,服務(wù)器端可通過(guò)SNMP、Zabbix agent、ping 等方式對(duì)遠(yuǎn)程網(wǎng)絡(luò)設(shè)備、服務(wù)器進(jìn)行監(jiān)視與數(shù)據(jù)收集等,因此被監(jiān)控端可以不使用Zabbix agent,通過(guò)SNMP 協(xié)議實(shí)現(xiàn)監(jiān)控功能。對(duì)于不支持SNMP 的設(shè)備,則可使用Zabbix agent 配合server 進(jìn)行監(jiān)控。
服務(wù)器端配置及環(huán)境搭建完成后,我們可以通過(guò)瀏覽器訪問(wèn)前端Web 界面,添加需要監(jiān)控的網(wǎng)絡(luò)設(shè)備、服務(wù)器等,都可直觀地通過(guò)Web 頁(yè)面進(jìn)行操作。
我們以華為交換機(jī)為例來(lái)說(shuō)明如何在監(jiān)控平臺(tái)上添加網(wǎng)絡(luò)設(shè)備。首先需要在交換機(jī)上開(kāi)啟SNMP 功能。通過(guò)遠(yuǎn)程命令登錄交換機(jī)或直接連接交換機(jī)的console 口,進(jìn)入系統(tǒng)視圖模式。
(1)啟動(dòng)SNMP 服務(wù):
snmp-agent
(2)配置社區(qū)名稱(chēng):
snmp-agent community read cipher huawei@123(其中read 表示只讀權(quán)限,huawei@123 為只讀社區(qū)名稱(chēng))
(3)配置SNMP 版本:
snmp-agent sys-info version all(打開(kāi)所有的SNMP版本)
交換機(jī)配置以上命令后,NMS 可以從設(shè)備讀取告警信息。
(4)繼續(xù)添加以下配置可使設(shè)備主動(dòng)向NMS 發(fā)送告警信息:
snmp-agent target-host trap address udp-domain 192.168.1.205paramssecurityname huawei@123(IP 填入服務(wù)器的IP 地址,后面寫(xiě)明社區(qū)名稱(chēng))
(5)snmp-agent trap enable(開(kāi)啟設(shè)備Trap 告警開(kāi)關(guān),開(kāi)啟以后主動(dòng)向NMS 發(fā)送告警信息)
(6)display snmp-agent sys-info(查看已開(kāi)啟的SNMP 版本)
(7)display snmp-agent target-host(查看NMS 配置信息)
以上步驟配置完成后,就成功開(kāi)啟了交換機(jī)的SNMP 功能。華為、H3C 的交換機(jī)與路由器配置命令與以上基本一致,其他品牌的設(shè)備進(jìn)行相同的配置操作即可。
網(wǎng)絡(luò)設(shè)備的SNMP 功能開(kāi)啟后,下一步即可在平臺(tái)的Web 頁(yè)面添加該網(wǎng)絡(luò)設(shè)備。使用管理員賬戶(hù)登錄平臺(tái),在左側(cè)目錄選擇配置-主機(jī)菜單;選擇創(chuàng)建主機(jī)按鈕,跳轉(zhuǎn)到創(chuàng)建主機(jī)頁(yè)面。主機(jī)名稱(chēng)填入設(shè)備的IP 地址,可見(jiàn)的名稱(chēng)可以自定義,群組選擇設(shè)備將要放入的分組。接口(Interfaces)是用來(lái)監(jiān)控設(shè)備的接口,這里選擇SNMP,SNMP 地址填入設(shè)備的IP 地址,其他設(shè)置用默認(rèn)設(shè)置即可。此項(xiàng)完成后繼續(xù)選擇上方的“模板”菜單,進(jìn)行模板選擇。選擇鏈接到新模板(Link new templates),直接在搜索框中輸入模板名稱(chēng),如華為交換機(jī)直接輸入huawei,搜索到模板“Huawei VRP SNMP”,選擇該模板名稱(chēng)即可完成模板添加。這時(shí)繼續(xù)選擇上方的“宏”菜單,選擇“繼承以及主機(jī)宏”,找到{$SNMP_COMMUNTITY},修改為自己設(shè)置的社區(qū)名稱(chēng),修改完成后選擇添加,即可完成主機(jī)的添加。
接下來(lái)我們以Windows server 為例來(lái)說(shuō)明如何在監(jiān)控平臺(tái)上添加服務(wù)器。首先需要在服務(wù)器上開(kāi)啟SNMP服務(wù)。登錄到服務(wù)器后,從服務(wù)器管理器中添加功能“SNMP 服務(wù)”,功能安裝完成后,在服務(wù)器管理器界面選擇配置、服務(wù),找到SNMP 服務(wù)并將其啟動(dòng),打開(kāi)屬性設(shè)置界面,將代理菜單中的服務(wù)項(xiàng)全部啟用;陷阱菜單中填寫(xiě)社區(qū)名稱(chēng)(可自定義)并添加,陷阱目標(biāo)填寫(xiě)部署Zabbix 的服務(wù)器地址;在安全菜單中添加上面自定義的社區(qū)名稱(chēng),權(quán)限為只讀,主機(jī)填寫(xiě)Zabbix 服務(wù)器的地址,保存以上配置后重啟SNMP 服務(wù)。
服務(wù)器的SNMP 功能開(kāi)啟后,仍需要在平臺(tái)的Web頁(yè)面添加該服務(wù)器。創(chuàng)建主機(jī)時(shí)模板選擇Windows SNMP,其他配置與創(chuàng)建網(wǎng)絡(luò)設(shè)備時(shí)一致,這樣就完成了對(duì)一臺(tái)Windows 服務(wù)器的狀態(tài)監(jiān)控。
其他交換機(jī)、路由器等網(wǎng)絡(luò)設(shè)備以及服務(wù)器都可以通過(guò)開(kāi)啟SNMP 功能后在系統(tǒng)中添加主機(jī)完成監(jiān)控。
本文基于淄博市氣象局現(xiàn)有的網(wǎng)絡(luò)設(shè)備與服務(wù)器等搭建了一個(gè)信息網(wǎng)絡(luò)業(yè)務(wù)監(jiān)控報(bào)警平臺(tái),實(shí)現(xiàn)了對(duì)各設(shè)備的硬件狀態(tài)、接口信息等的監(jiān)控。隨后根據(jù)監(jiān)控到的數(shù)據(jù)反映設(shè)備的最新問(wèn)題,設(shè)計(jì)了網(wǎng)絡(luò)拓?fù)鋱D,直觀地展示出各網(wǎng)絡(luò)設(shè)備之間通信鏈路的通斷情況,從而迅速反映出網(wǎng)絡(luò)故障。以下是系統(tǒng)部分功能的展示,如圖1 所示。

圖1 系統(tǒng)主頁(yè)
系統(tǒng)主頁(yè)也稱(chēng)為儀表板,主要包含了系統(tǒng)信息、問(wèn)題分類(lèi)、問(wèn)題、數(shù)據(jù)概覽等幾個(gè)模塊,上面我們添加的還有拓?fù)鋱D和Zabbix 內(nèi)存占用模塊。各模塊可以自由挪動(dòng)位置、調(diào)整大小,也可以根據(jù)實(shí)際使用需求添加或刪除某些模塊,自定義編輯儀表盤(pán)。
在左側(cè)菜單打開(kāi)監(jiān)測(cè)的問(wèn)題頁(yè)面,問(wèn)題模塊會(huì)按照時(shí)間軸將系統(tǒng)收集到的所有故障信息展示出來(lái),并且可以通過(guò)上方的篩選框,按照某個(gè)群組或某個(gè)主機(jī)查看其相對(duì)應(yīng)的故障信息。當(dāng)某個(gè)故障解決后,問(wèn)題的狀態(tài)會(huì)變?yōu)橐呀鉀Q,見(jiàn)圖2。

圖2 問(wèn)題頁(yè)面
在監(jiān)測(cè)的最新數(shù)據(jù)頁(yè)面,可以展示系統(tǒng)收集到的所有數(shù)據(jù),同樣通過(guò)上方的篩選框可以對(duì)具體的主機(jī)和監(jiān)控項(xiàng)進(jìn)行篩選,通過(guò)歷史記錄或圖形可以直觀地看到數(shù)據(jù)的趨勢(shì),見(jiàn)圖3。

圖3 最新數(shù)據(jù)圖形記錄
在報(bào)表的可用性報(bào)表頁(yè)面,可以查看主機(jī)可用性報(bào)表的圖形,按照時(shí)間軸直觀地展示出主機(jī)各個(gè)監(jiān)控項(xiàng)的可用率,便于發(fā)現(xiàn)問(wèn)題出現(xiàn)的時(shí)間及頻率,見(jiàn)圖4。

圖4 可用性報(bào)表
在監(jiān)測(cè)的拓?fù)鋱D頁(yè)面中,可以自行創(chuàng)建拓?fù)鋱D,將需要添加的主機(jī)作為地圖元素進(jìn)行添加,并在兩個(gè)真實(shí)連接的主機(jī)之間添加鏈接作為實(shí)際存在的鏈路,對(duì)應(yīng)其相連的接口的通斷作為該條鏈路的鏈接指示器,并可設(shè)置該條鏈接線的顏色,若鏈路通則為綠色線,若鏈路斷則顯示為紅色線。拓?fù)鋱D創(chuàng)建完成后即可直觀地看到各主機(jī)及鏈路之間的連接情況,見(jiàn)圖5。

圖5 省市縣內(nèi)網(wǎng)拓?fù)鋱D
隨著氣象信息化工作的不斷開(kāi)展,氣象信息網(wǎng)絡(luò)的規(guī)模日趨龐大,建立一個(gè)氣象信息網(wǎng)絡(luò)業(yè)務(wù)監(jiān)控報(bào)警系統(tǒng)十分必要,它可以幫助系統(tǒng)管理員快速發(fā)現(xiàn)并定位網(wǎng)絡(luò)及服務(wù)器的故障信息,從而針對(duì)故障信息盡快解決問(wèn)題,大大提高了網(wǎng)絡(luò)保障的及時(shí)性,保障氣象信息網(wǎng)絡(luò)安全穩(wěn)定地運(yùn)行,才能更好地為社會(huì)和公眾提供更加快速、便捷、安全的氣象信息服務(wù)。