吳向陽,趙廣超,田 寧,王 琰
(中國人民解放軍63887 部隊,河南 洛陽 471000)
隨著通信技術的不斷發展,通信裝備性能不斷提高,對數據中心環境的要求也越來越高,其中供電系統在整個通信數據中心中處于核心地位。電源設備對數據中心環境要求越來越高,數據中心建設動力環境實時監控系統,對實現數據中心無人值守發揮著重要作用。動力環境監控系統的穩定、高效、便捷在整個公司內部網絡維護管理是不可缺少的一環。數據中心動力環境監控系統的正常運行和數據的實時監控,是確保整個公司內部網絡中通信設備正常運行的重要保障手段。本文探討了動力環境監控組網和軟件設計。
動力環境監控系統是一個由多個監控級通過自下而上逐級匯接的分布式計算機控制系統網絡。動力環境監控系統隨著通信機房(站)維護管理向無人值守的方向發展,越來越多的公司開展了對機房動力環境監控系統建設和研究。從最初機房建設到當前的動力環境系統建設,經過多年的發展,通信網絡技術日新月異,動力環境建設在無人化機房建設中日趨重要。從最初各個廠家自行建設各自的集中監控系統,初步實現了機房無人值守,主要對機房動力設備和環境的數據進行監測和顯示,遵循多監少控的原則。隨著動力環境監控系統技術的發展日趨成熟,以及通信機房增多、距離遠、分散在多處,各廠運行獨立、監控單一的功能己遠不能滿足動力設備和環境維護的需要。遠程集中動力環境監控系統已形成對各廠商增值應用,能夠提高機房無人值守管理效益,如對各種動力設備進行監控管理、資源環境監控管理、圖像監控、智能門禁、溫濕度監控等。當前這種動力環境監控系統功能存在一定的受限性,系統平臺對數據的收集分發處理能力不足。數據中心雖然能夠對所有機房內的數據進行監測,但是無法實現對實時數據進行遠程控制,這是當前動力環境監控系統的主要缺點,運維人員對實時數據的收集和分析處理的要求也在不斷提高。基于智能化、信息化建設逐漸成熟,動力環境監控系統也必將迎來新的發展并逐步完善各種不足,從而提高遠程運維水平。動力環境集中監控存在的問題如下:目前市場上動環產品類型繁多,各個廠家產品的協議不夠統一,對集中監控提出了更高的要求;建設時需要花費過高的人力成本和物力成本,對機房環境監控內容不夠全面;網絡架構、監控軟件在Web 科覽器上應用還有待進一步完善,包括自定義報表、故障報告、告警處理、圖形顯示以及數據分析等方面[1]。
根據動力環境監控統一管理的基本要求,動力環境監控系統在結構上為樹型多層級的數據、音視頻監控系統,主要分為3 個等級,分別為監控中心、監控站、監控單元 。其系統結構如圖1 所示。

圖1 系統結構
(1)監控單元是整個系統中最小管理子單元,可以根據客戶實際需求配置多個監控模塊和輔助設備,周期性采集各模塊傳送來的監控信息并進行處理,并通過網絡傳送給監控中心。
監控單元主要是連接監控中心和監控模塊之間的設備,實時不間斷地采集運行中的設備的各項參數和設備實時運行情況,時刻向上一級監控傳送實時數據信息,在監控中心實現報表統計、存儲、顯示等[2]。
(2)監控站是監控系統中信息采集和信息處理的關鍵設備,向下收集監控單元傳送來的實時數據,經過處理后向上傳送數據,在系統中起到承上啟下的作用,在整個系統中發揮著重要的作用。
(3)監控中心具有監視各監控站及其下級設備的實時工作狀態、數據、告警信息等功能,周期性采集設備傳送來的各類信息,對整個網絡中通信設備運行狀態及各項參數進行實時監控,并對各模塊發出的告警進行處理和管理,同時下發各類指令,完成對整個系統的監控。
監控模塊主要包括以下幾部分。一是環境監控模塊,包括水浸監控、溫濕度監控、空調監控。二是安防監控模塊,包括視頻監控、門禁監控、水浸監控、聲光監控。三是消防監控模塊,主要包括煙感監控。四是配電監控模塊,主要包括市電監控、蓄電池監控、高開監控、不間斷電源(Uninterruptible Power Supply,UPS)監控、電源分配單元(Power Distribution Unit,PDU)開關監控等。
動力環境監控系統主要依托單位現有光纖線路及網絡結構,采用分布式連接,主要有監控中心、監控站、監控單元3 級網絡結構,其中網管設在數據中心機房,具有管理網絡職能,監控站設置于各數據中心內。動力環境監控網上所有終端設備具有同等等級,在資源共享中具有同等級別,所有數據在網絡中實時透明傳輸,可實現系統穩定可靠[3]。監控系統的設備連接如圖2 所示。

圖2 設備連接
本系統網絡設計的基本原則是高效率、低時延、易操作,實時高效,具有高性能、N+1 冗余、環境適用性強、日常維護操作管理便捷等優點。
監控模塊和監控單元之間主要采用網絡接口(RJ45)來實現數據采集和傳送。蓄電池組的數據采集則通過增加數據采集器來完成,同樣通過網絡接口進行數據采集。監控單元和監控站通常在同一數據中心內,同樣需根據監控單元提供的網絡接口進行連接。
監控站和監控中心之間,兩者距離較遠,通常利用公司內部光纖線網絡實現通信,各站計算機在整個網絡中處于同等地位[4]。
監控中心與網管中心通常在數據中心內,距離較近,可以通過網線或者電纜直接連接。
動力環境監控系統采用模塊化、可視化結構設計,結構靈活、可擴展性強,監控系統網絡組網靈活并且能夠滿足客戶對各類不同監控對象的需要。監控系統的組成結構如圖3 所示。

圖3 監控系統的組成結構
(1)設施監控模塊。該模塊主要用于顯示各監控站分布圖、圖形,監控模塊在線狀態和實時監控數據。各模塊在線實時狀態顯示,在網絡中斷時,模塊圖標狀態變化;告警數量的顯示;自動記錄不同的監控站、監控模塊內容、模塊操作日志,并對操作記錄進行查詢、統計。
(2)門禁管理模塊。一是實時監控,主要對監控站大門在線狀態、進出時間實時記錄。二是控制器設備,增減門禁操作設置,增減人員管理,設置門禁密碼及IC 卡等。三是門禁設置,主要包括遠程開門設置、進出門時間段、門的狀態記錄、門號編設等。四是人員管理,即增減人員數量,編輯和管理人員信息。五是門禁記錄,記錄人員進出時間、進出方式等。
(3)系統管理模塊。該模塊主要對系統頁面、視圖進行管理,建立新用戶、設置用戶密碼,時間設置,登錄超時管理,系統配置及設置默認監控周期,配置導入導出,系統備份以及升級,操作日志等。
(4)工程配置模塊。該模塊主要由內容展示區和配置菜單構成,主要內容包括告警告知、告警配置、告警屏蔽、北向連接、存儲配置、聯動策略、復雜事件處理、端口透傳、函數管理等。
(5)工程組態模塊。該模塊主要編輯各監控站結構布局圖、模塊圖形標示、數據管理、設備連接等。它創建站點、增減及編輯模塊,可利用組態模塊編輯用戶所需監控內容。組態模塊可實現可視化編輯,用戶可根據需要自定義、刪除、增加、修改組件結構內容。
(6)告警模塊。該模塊能夠實現告警顯示、告警受理、告警定位、告警事件總覽頁面、告警彈框、告警等級(分為緊急告警、重要告警和次要告警)管理、告警事件確認、告警列表頭自定義、更多告警顯示等功能。
(7)歷史告警模塊。該模塊用于告警查詢、歷史告警顯示、告警受理、告警確認、表頭自定義、歷史告警總覽頁面等功能。
(8)報表報告模塊。該模塊可用于監控模塊參數查詢、告警查詢、查詢結果顯示、數據生成報表等功能,同時可以選擇報表模板,生成多樣式報表格式。
(9)故障管理模塊。顯示、處理、確認監控對象故障情況,對來自監控模塊設備的告警事件進行監控、報告和存儲;對故障進行定位和診斷,隔離故障,提出設備異常方案。
(10)幫助模塊。該模塊可以提供搜索、查找等功能,包括模塊手冊、事件搜索、工具欄提示、狀態欄提示。
隨著通信機房的不斷發展,智能化無人值守機房已成為眾多企業建設的主要方向,無人化管理這些機房已是企業節約成本、提高效益的主要方式,動環監測技術也在不斷成熟和發展,遠程集中監控動力環境監測是解決當前無人化機房的主要手段。隨著通信技術的發展,動力環境監測發展的趨勢主要有以下幾個方面。第一,智能化。通信機房可以采用智能化技術采集機房和設備的數據和自主控制系統,實時檢測、分析和顯示系統運行狀態,實現對整個機房動力環境的整體把控。第二,高效、節能。通過采用智能化設備,使得整個通信機房耗能更加精細化和智能化,降低運營成本并提高能效。提高系統的可靠性、可持續性和穩定性,減少故障和維護成本,確保所有設備的運行安全。未來,通信機房動力環境監測的發展將更加高效、可靠和可持續[5]。
本文主要分析了動力環境監控系統的結構、組網、軟件管理等內容,針對點位多、數據中心分散、遠距離等問題進行分析研究,提出了監控系統的組網結構,并重點對整個動力監控系統的軟件部分進行可視化、模塊化設計,實現了位點分散、無人值守數據中心動力環境集中監控,為公司內部的網絡通信穩定運行提供一定的支撐作用。