曾慶明
摘 要:采用自動監控技術和計算機技術建成的機房監控對機房環境和設備統一監控,能保障信息的安全可靠運行,可以實現科學管理,提出了高校機房監控總體解決方案。
關鍵詞:機房管理;網絡;監控系統
中圖分類號:C931.9 文獻標識碼:A 文章編號:1005-569X(2009)01-0024-03
隨著信息網絡技術的不斷發展,各類大、中型組織的網絡信息化建設的設備資金投入日趨增加,其職能運行與計算機網絡的結合日趨緊密。計算機網絡的建設與發展使人們極大地開闊了信息視野、也極大地提升了辦公、生活中信息處理、傳播效率。與此同時人們在工作、生活中對網絡的依賴性也日益增強,網絡的維護管理負擔也日趨繁重。
為保證組織的安全、穩定、高效運行,保證網絡設備的良好運行狀態和設備使用壽命與安全,實現用戶的最大投資效益,就有必要對網絡運行環境的電力供應、溫度、濕度、漏水、空氣含塵量等諸多環境變量,UPS、空調、新風、除塵、除濕等諸多設備運行狀態變量,進行24小時實時監測與智能化調節控制,以保證網絡運行環境的穩定與網絡軟硬件資源、設備的安全以及相關信息數據的安全。
因此設計建設一套能夠對網絡物理運行環境變量、設備狀態變量以及安防、消防狀況進行全方位監測、智能化自動調控報警,分布式遠程控制管理的系統,已經成為各類組織當前信息化建設的首要之務。
機房監控系統是對分布在機房內的各個獨立的動力設備和機房環境監控對象進行數據采集,實時監測系統和設備的運行狀態,記錄和處理相關數據,及時偵測故障,并作必要的控制操作,及時通知機房管理人員處理。機房監控系統包括供配電、UPS、空調、溫濕度、防漏水、防火、防雷、安防、門禁等監控要求,有的還包括攝像監控的要求。
1 機房監控系統
1.1 監控系統功能機房監控系統主要實現以下三種功能
1.1.1 數據采集和控制
數據采集是監控系統最基本的功能要求,必須精確和迅速;對設備的控制是為實現維護要求而立即改變系統運行狀態的有效手段必須可靠;對各種被監控設備如供配電、空氣開關、空調,UPS、消防設備、攝像設備等進行集中監控,為實現機房少人或無人值守創造了條件。
1.1.2 設備運行和維護
運行和維護是基于數據采集和設備控制之上的系統核心功能,完成日常的告警處理、控制操作和規定的數據記錄等。
1.1.3 維護管理
管理功能應實現以下四組管理功能:
(1)配置管理。配置管理提供包括系統配置、現場監控對象的一般配置、告警門限配置等各種配置的功能組。
(2)故障管理。故障管理提供對被監控對象運行情況異常進行檢測和報告的功能組。及時發現緊急事件,防止因設備原因造成系統中斷、機房失火等重大事件的發生。提供告警等級管理,告警信號的人機界面,告警確認,告警門限設置和告警屏蔽等。
(3)性能管理。性能管理提供對監控對象的狀態以及網絡的有效性評估和報告的功能組。例如提供設備主要運行數據及參數;停電、供電情況;設備故障、告警統計等。
(4)安全管理。安全管理提供保證運行中的監控系統安全的功能組。
1.2 監控系統結構
機房監控系統一般由監控管理中心(SC),監控管理站(SS)、監控單元(SU)組成,它們通過計算機網絡(WAN或LAN)互連起來,也即為三級監控管理結構模式。
SC(Supervision Center)監控管理中心:是整個監控系統的管理中心,它為適應集中監控、集中維護和集中管理的要求而設置。
SS(Supervision Station)監控管理站(又稱為監控管理分中心):區域管理維護單位,監控站為滿足區域管理要求而設置的,負責轄區內各監控單元的管理。
SU(Supervision Unit)監控單元:監控單元為最基本的測控單元,它完成對被監控對象的數據采集和必要的控制功能。在機房監控規模小的情況下,也可以采用二級管理,即省略監控管理站SS這一級,只保留監控管理中心SC和監控單元Suo在單個機房的情況下,整個系統就簡化為監控單元SU和監控管理中心SC同處一地了。監控單元通過串口(RS232,RS485)或網絡(TCP/IP)等通信方式與被監控設備互聯,采集被監控設備的實時數據。
1.3 監控對象
機房監控系統的監控對象一般有以下幾種。
1.3.1 低壓配電設備
三相電壓,三相電流,有功功率,無功功率,有功電度,無功電度,功率因數,頻率等電量,空氣開關狀態。
1.3.2 不間斷電源(UPS)
三相輸人電壓,直流輸人電壓,三相輸出電壓,三相輸出電流,輸出頻率,蓄電池電壓,蓄電池溫度,同步/不同步狀態,UPS/旁路供電,蓄電池放電電壓低,市電故障,整流器故障,逆變器故障,旁路故障。
1.3.3 空調設備
空調主機工作電壓,工作電流,送風溫度,回風溫度,送風濕度,回風濕度,壓縮機吸氣壓力,壓縮機排氣壓力,開/關機,電壓、電流過高/低,回風溫度過高/低,回風濕度過高/低,過濾器正常/堵塞,風機正常/故障,壓縮機正常/故障。
1.3.4 環境
溫度,濕度,煙感,水浸,紅外,玻璃破碎,門磁等。
2 高校機房監控總體解決方案
為保障校園網的運行在核心機房中通常有大量的外圍支持系統(UPS、空調、門禁等)和不同類型的設備(服務器、終端、交換機、路由器等)。系統實現的目標是在通常情況下通過現有的網絡(校園網)遠程監控各個機房里面的運行環境和網絡運行狀態,同時管理控制和維護各個機房的管理設備,在特殊情況下能利用公共通信平臺(傳統有線電話和移動電話網)對遠程機房實施控制和管理。對于環境監控深度要達到各種環境情況的檢測和視頻圖像的監控,對于網絡運行狀態能達到基于應用的檢測、對設備管理的深度能達到BIOS層,且能實現遠程開關設備電源。系統實現滿足以下原則:
實用性:系統的設置可以實現核心機房無人(或少人)值守,同時充分利用現有網絡資源和公共通訊平臺,使系統具有較高的性能價格比。
可靠性:系統的設置在不影響網絡安全、穩定的情況下,可穩定地工作,采集和傳輸各種信號。
實用性:可以及時傳輸和顯示各種數據和告警信息,并對被監控設備進行實時控制。
開放性:可以兼容不同的產品,靈活擴容。
靈活性:組網方式靈活,可以方便地增減控制信息和控制點。
高校校園網是學校科研和教學必不可少的基礎設施,由于學校在多處都有校區作為科研和教學場所,各校區都已建有各校區的校園網并已互聯成一個大的高校校園網。為了更好地保障校園網的正常可靠運行,高校將建設一套覆蓋各個校區的機房監控系統來監測機房內的輔助設備(如UPS、空調、供配電等)與環境參數。
2.1 高校機房監控系統總體結構[ST]
高校機房監控系統采用三級監控管理結構模式,即由高校機房監控系統管理中心、各校區監控管理站和監控單元組成。監控管理中心包括監控中心管理系統、監控數據庫及數據分析管理系統、圖像監控顯示系統、機房監控顯示界面等組成,它主要完成如下任務:
2.1.1 實時監控
實時監視各監控單元所采集的動力設備和環境的工作狀態和運行參數,接收故障告警信息;根據需要,查詢各校區監控管理站(SS)和監控單元(SU)采集的各種監測數據和告警信息;實時監視各監控管理站(SS)的工作狀態;可透過監控管理站(SS)對監控單元(SU)下達監測和控制命令。
2.1.2 告警管理
設定告警等級、用戶權限。
2.1.3 運行管理
具有統計功能,能生成各類統計報表及曲線圖;具有文件存檔和數據庫管理功能。
2.1.4 監控系統自身管理
在接管監控站(SS)的控制權后,對于告警信息的處理與監控管理站(SS)相同,也就是具有告警過濾能力;向各校區監控管理站定時下發時鐘校準命令;監視各校區監控管理站和各監控單元自身工作狀態,一旦發現各校區監控管理站和各監控單元故障及時報普。
[HTH][STHZ]2.2 監控管理系統[ST]
監控管理站包括監控管理站監控管理系統,它主要完成如下任務:
2.2.1 實時監控
實時監視各各監控單元所采集的動力設備和機房環境的工作狀態,接收故障告警信息;查詢監控單元(SU)采集的各種監測數據和告警信息。
2.2.2 告警管理
設定告警等級、用戶權限;設定各個監測量性能門限值,具有告警過濾能力。
2.2.3 運行管理
具有統計功能,能生成各種統計報表及曲線圖;具有數據存儲功能,告警數據、操作數據和監測數據應至少保存半年時間。監控系統自身管理。能同時監視轄區內SU的工作狀態并與監控管理中心(SC)保持通信;接收監控中心(SC)定時下發的時鐘校準命令;實時向監控中心(SC)轉發緊急告警信息,必要時(如監控站SS夜間無人值守),可設置成將所收到的全部告警信息轉送到監控管理中心(SC)。
3 結 語
計算機信息系統的發展使得作為其網絡設備、主機服務器、數據存儲設備、網絡安全設備等核心設備存放地的計算機機房日益顯現出它的重要地位,而機房的環境和動力設備如供配電、UPS、空調、消防、保安等必須時時刻刻為計算機信息系統提供正常的運行環境。目前國內普遍缺乏機房環境設備的專業管理人員,在許多地方的機房不得不安排軟件人員或者不太懂機房設備管理甚至根本不懂機房設備維護的人員值班,這對機房的安全運行無疑又是一個不利,因此監控系統已經越來越成為新建大型機房所必需的一部分,這將無疑的為信息化社會的建設管理大大的提高工作效率。
參考文獻:
[1] 高鴻峰,何禹,於斌,等.校園網無人值守核心機房的設計管理.2006.
[2] 鄧敏,周曉斌,胡才永,等.信息機房遠程網絡環境監控的實現.2005.