該中心機房網絡設備通過UPS供電,溫控系統(溫濕度監測器、空調)由市電供電,詳見圖1。該設計中市電給UPS和溫濕度提供220伏電,給機房空調提供380伏電,保證機房的正常運行。

圖1 機房供電系統
一旦市電斷電,UPS將給網絡設備和溫濕度監測器提供不少于3小時的應急供電??照{不具有自啟功能,設置在溫度20度,濕度55度,保證機房處于正常的溫濕度區間。溫濕度監測器監控監控機房的溫濕度情況,一旦在非正常范圍內,將以蜂鳴和短信方式自動報警。
該機房值班非全時段值班狀態,網管正常上下班,非工作時間正常休息。
在正常工作時間市電斷電的情況下,網管應實時檢測機房溫濕度情況,視情按照規定進行處置。如果市電斷電發生在休息時間,該設計就會出現以下兩種情況。
1.市電短暫停電(3小時之內)。UPS可在斷電情況下為機房內設備提供3小時后備電力,所以臨時停電未帶來網絡設備停機。但由于機房內空調直接由市電供電,所以本次停電使得機房內空調停止工作,同時因停電發生在休息日,無人對空調進行人工啟動,導致在電力恢復后,網絡設備依然運轉,空調卻關閉,最終導致了機房內溫度升高,出現危險。
2.市電長期停電(超過3小時)。由于UPS在保證網絡設備3小時供電后斷電,空調從斷電之時就關閉。因此這種情況不但威脅到了機房內硬件設備的安全,而且服務器和存儲設備中數據的安全也不能保障。
綜上所述,一旦在休息時間市電斷電將給機房安全帶來極大的威脅。雖然溫濕度監測系統也能在機房處于非正常工作狀態報警,但由于網管處于休息時間,考慮到網管能否能及時接收信息,當時所在地點與機房之間的距離遠近程度以及路途是否堵車等一系列不可控因素,能否及時趕到機房處理問題將是一個隨機的事件,但一旦機房出現嚴重事故,后果不堪設想。
解決此問題關鍵是要解決網絡設備不能在非正常溫度下工作太長時間,且網絡設備能夠正常關閉的問題。有以下3種解決方法:
1.購買發電機,發電機給機房所有設備供電,保證機房始終有電。但由于發電機價格昂貴,且使用油作為動力,既不環保,使用及儲存又有安全隱患。特別對于該機房,不屬于政府、金融等非常重要機構,從經濟角度、環保角度和可操作性上都不是最佳解決方案。
2.增加EPS給機房的空調供電,并且保證供電時間大于3小時。由于EPS能夠在市電斷電的情況下,瞬間自動給空調供電,保證了空調連續的運行。EPS的供電時長大于3小時,可以保證設備始終工作于正常的溫濕度環境中,保證硬件設備不會出現問題。但如果斷電時長超過3小時,網絡設備和空調都會斷電關閉,這樣服務器和存儲設備沒有正常的關閉,數據就有丟失的危險。因此也不是最好的方法。
3.建立一套市電斷電檢測及自動關閉所內應用的應急防護系統。這樣可以確保在市電非正常斷電的情況下,及時的通過操作系統級別將所內各應用自動關機,不但保證了硬件不會在非正常溫濕度環境下工作,還能確保服務器及數據的安全性。因此應該采用該方案。

圖2 系統連接示意圖
本系統考慮利用SNMP協議抓取UPS相關信息,在市電斷電后,UPS通過標準SNMP協議向監控主機發送信號,監控主機在獲取到相關信號后,根據預設規則向目標主機發送關機指令,各目標操作系統收到指令后正常關機,詳見圖2。
要實現以上功能,在現有信息系統環境下需增加幾個重要模塊:
UPS監控模塊:該模塊需要部署與UPS中,根據與UPS廠家咨詢,UPS出廠已經預設了監控和管理接口,本次需要采購對應的監控管理卡即可實現基于IP的狀態監測及管理。
監控軟件:監控軟件是本系統的核心,其功能為實時抓取UPS相關狀態信息,包括各電路的通斷、電池狀態、電壓電流狀態等。同時該軟件還應具有遠程關機功能。本軟件可采用UPS配套管理系統或自開發系統。
UPS配套管理系統無法實現在虛擬化環境下對物理主機的關閉,僅能從應用系統層面進行關閉,其優勢在于價格相對低廉。而自開發軟件可利用標準化SNMP協議抓取信息并發送遠程質量對應用系統及物理主機進行關閉,能夠更好的保護硬件及信息安全。
應用系統插件:監控軟件在收到斷電信息后,將與安裝在應用系統的插件進行通信并發送指令,插件收到指令后調用操作系統的相關關機指令進行關機。
該機房按照上述方案建立了市電斷電檢測及自動關閉應急防護系統后,使機房電源系統更加安全。在實際使用中,該系統及時防止了市電突然斷電帶來的安全隱患,收到了預想的效果。