潘志強
(浙江廣播電視集團,浙江 杭州 310005)
隨著計算機技術和企業信息化的發展,數據運算、存儲系統及配套設備的數量越來越多,計算機機房建設的數量及規模不斷擴大。對早期建設的基礎環境設施進行升級改造,為供配電源、不間斷電源(Uninterrupted Power Supply,UPS)系統、空調、安防等環境設施的運營狀態、運行參數實現智能遠程監測、報警系統,用現代化的手段實現科學管理,顯得更為重要。
UPS 是不間斷電源保障系統,當外部市電停供時,能在瞬間取代原有的電力供應,保障負載系統正常使用而不受影響。UPS 的電力由電池組提供,由于電子元器件快捷的反應速度,UPS 能夠在停電的4 ~8 ms 以內甚至不間斷的情況下繼續供應電力。其工作原理是:正常工作時,利用整流裝置將市電提供的交流輸入整流成直流電壓,一路直流電壓對蓄電池組充電,另一路提供給逆變器將直流電壓轉換成穩定的交流電壓必須輸出[1],經過靜態開關裝置供負載系統正常使用;當輸入市電中斷,蓄電池組內儲存的直流電力瞬間供給逆變器,逆變器轉換成相應的交流電壓供負載使用,直至外部市電恢復正常供應,蓄電池組才恢復原輸出轉換鏈路。
數據機房的動力、環境等狀態是機房設備正常運行的基本保障,是保證計算機系統機房安全可靠運行的基礎前提,一旦出現故障(如電力系統不穩定,機房的溫度、濕度過高,機房安全措施不完善等),很可能引發安全事故,導致重大或不必要的經濟損失。
為了保證基礎設施及計算機系統等設備的穩定、可靠運行,對機房內的電力、環境等設施進行自動化監測、預警和現代化的科學管理尤為必要。大型UPS 系統智能遠程監測、報警系統實現,是機房管理人員全面、實時了解機房運行情況并及時進行有效控制和管理,管理機房不可或缺的重要助手。
浙江廣播電視集團的制作樓GE 400 kVA UPS系統為各演播廳、非編機房、網絡核心機房以及融媒體技術中心中國藍云分布式數據中心機房等業務系統提供用電保障。該UPS 系統于2012 年投入使用,目前仍采用人工值班的方式查驗UPS 的運行狀態。為確保UPS 系統正常運行,保障制作樓各專業系統用電安全,需對UPS 電池進行整體更換,同時加裝電池遠程網絡監測系統進行實時監控。
本系統嚴格按照“少人值班或無人值守”和“可靠、合理、經濟、完善”的要求進行設計。系統必須全時段內不間斷實時監控、運行安全可靠,能促進運營管理水平不斷提升。監控目標主要包括市電供配設備、UPS 系統及視頻監控等。具體實現要求和原則如下。
第一,通用性。系統必須在符合國際工業監控標準的基礎上秉持開放式設計理念。
第二,可靠性。新系統不能影響被監測控制設備的正常運行,且必須有很好的電氣隔離性能及電磁兼容性。系統需符合國際電工標準,具有抗強干擾能力。監控系統必須采用工業級產品,可靠性極高,平均無故障時間長,并可以滿足7×24×365 全時段工作要求。
第三,兼容性。操作系統應使用實時多任務管理的Windows XP 或Windows 2000 操作系統,監控系統采用符合國際網絡協議標準的網絡通信協議,并使用開放式數據庫接口以滿足各類型數據庫應用。
第四,安全性。必須采用嚴格的密碼管理體系,確保系統運營安全。軟件系統必須能嚴格區分或設定維護人員和各級別用戶對系統的操作權限和訪問能力。
經過多方調研和專家論證,機房一體化遠程網絡監測、報警系統選用專業的環境監控組態軟件。通過對“Cowin 集中監控系統”案例的分析、論證,發現其可以很好地對大型UPS 系統進行智能遠程監測和報警系統實現,方便地實施對UPS 系統、供配電源監測、溫濕度實測、視頻監控等設備運行數據或狀態的存儲、調用和輸出等功能,各個子系統間的數據具有強大交互能力。該系統有多種報警方式,一旦監測到異常情況即自動執行預設的應對策略,同時發出相應報警功能,極大地提高大型UPS系統運行效率和可靠性的同時,減輕了機房環境維護人員的負擔,實現了對機房環境科學管理水平的有效提升。系統具體有以下特點。第一,多案例證實系統穩定可靠,采集平臺建設思路科學。系統采用模塊化的設計理念,靈活可靠,各模塊相互之間獨立,互不影響。針對多次接入網絡帶來的安全隱患,系統采用統一的網絡平臺滿足各監控子系統接入需求。第二,系統采用全開放的架構,兼容性強大。系統對外協議接口多樣,可與其他平臺實現無縫對接;采用平臺化設計理念,可根據不同需求提供用戶菜單式系統功能服務。第三,采用模塊化組合方式,實現不同類型、規模監控系統定制化組網應用。因是自主研發平臺,系統可以根據不同機房實現各種仿真或監控系統的組態要求,滿足用戶個性化組網方案。第四,支持在線專家診斷維護,實現隨需擴容。系統可以根據先期需求先建設使用,并能快捷提供用戶再次開發升級支持,后續機房或監控子系統實現隨需擴容、無縫接入[2]。
系統支持客戶端/服務器(Client/Server,C/S)模式,也可以支持瀏覽器/服務器(Browser/Server,B/S)模式,將各種(電力、環境、安防等)不同功能的子監控模塊無縫融合到一個統一監控平臺下[3],系統架構如圖1 所示。

圖1 系統架構
整個系統主要由實時數據采集層、監控主機、遠程IE(Internet Explorer,IE)瀏覽3 個部分構成。實時數據采集層對機房市電供配、UPS 系統、安防、空調等監控對象進行現場采集。采集到的數據經過系統分析、處理后傳輸給監控工作站。監控主機將現場實時采集到的數據進行本地化處理和存儲。遠程IE 瀏覽是通過網絡在遠程主機上以IE 的方式進行瀏覽,機房現場工作情況一目了然,很好地實現了管控一體化理念。
本系統可以通過監控App 查看設備所有取樣點的實時數據、通信狀態及告警事件,支持查看歷史事件和數據,還可在App 上查看系統當前所有告警事件并確認具體事件。一旦監測到數據或狀態超限,系統自動執行預設的應對程序,同時發出相應的報警信息。系統報警方式很多,如固定電話、彈出窗口、提示語音等,可以根據需求選擇其中一種或多種。當有多個報警同時發生,系統通過預設的等級或順序逐一發出報警信息。
3.3.1 UPS 監控系統
UPS 監控系統對機房內2 套UPS 系統主機各取樣點的數據進行實時監控管理,一旦監測到數據異常,相應的報警信息系統會自動發出。UPS 監控系統通過UPS 系統標配的RS-232/RS-485 通信接口,將各種實時采集數據送到服務器進行實時監控。UPS 監控系統實時監測UPS 系統內部蓄電池、整流器、逆變器等部件的現場采集數據,一旦數據超出正常范圍,自動發出報警信息并切換到相應的報警界面,將相應數據直觀地顯示在界面上,如圖2所示。

圖2 UPS 監測界面
報警界面內異常的數據或狀態顯示紅色并閃爍,系統對異常情況顯示相應處理信息,同時存儲記錄該事件,發出多媒體語音,通過系統預設等級的高低對外發出報警信息。監控系統界面能直觀顯示實時曲線、歷史曲線,可查詢某一時段內相應數據的具體時間和數值,并可將歷史曲線或數據生成excel 格式輸出。系統能形成圖文并茂的報告,管理人員能隨時了解UPS 系統工作狀況[4]。
3.3.2 蓄電池監控系統
蓄電池監控系統的監控對象為機房兩臺UPS主機(GE SG Series S1 400 kVA UPS),配置了2 組共240 節12 V 電池。
通過加裝蓄電池檢測系統,對單個電池和電池組的溫度、電流、電壓及功率等參數進行監測[5]。檢測到的數據轉換成RS-485 信號,直接接入多功能嵌入式控制器的串口,由其接入交換機,使監控主機能夠實時訪問其IP 地址,實現實時、全面監控蓄電池工作狀態。
采用電池檢測模塊實時采集每節電池的電壓、內阻及溫度。每組電池加裝一個電流模塊,監測一組電池的充放電流和環境溫度;加裝檢測采集主機,從電池檢測模塊中逐個讀取電壓、內阻與溫度值,進行分析處理與顯示,如圖3 所示。

圖3 蓄電池監測界面
當系統檢測到電池參數異常,與前述流程一樣,系統相應監控界面的狀態或數據會變紅色并閃爍,同時發出報警,提示相應的處理信息,進行記錄存儲和數據輸出。
通過UPS 系統電池改造及加裝智能遠程監測報警系統實現的運行效果顯示,系統的數據記錄完整,各子系統數據間交互功能強大,監測界面直觀,豐富的報警方式及圖文并茂的運行參數呈現等功能,在提高大型UPS系統運行效率和可靠性的同時,減輕了維護人員的工作壓力,實現了對機房運行管理水平的極大提升。系統實現7×24 h 全天監測,從大量數據中提取有用的關鍵信息,克服了人的局限性,時效性極大提高。