王華 肖榮軍
中國移動通信集團江蘇有限公司
隨著集團客戶市場全業務的快速發展,運營商需要考慮集團客戶機房設備、機房運行環境情況的監控,保證機房在優良的環境下工作。依托運營商的天然網絡覆蓋優勢和機房運維技術儲備優勢,將集團客戶側的動力環境變量進行遠程智能監控,將獲取的數據進行統計,通過一定的算法分析、告警匹配規則等,實現集團客戶業務、設備的主動性維護。對集團客戶的運維效率的提升具有重要意義和作用。
在信息化建設中,機房運行處于信息交換管理的核心位置。機房內所有設備必須時時刻刻正常運轉,否則一旦某臺設備出現故障,對數據傳輸、存儲及系統運行構成威脅,就會影響到全局系統的運行。如果不能及時處理,更有可能損壞硬件設備,耽誤業務系統正常運轉,造成不可估量的經濟損失。因此需要保障機房內的設備運行在標準的、合適的、穩定的機房動力環境中,這些保障涉及電源、UPS、空調等監控和維護,而動力環境監控系統在信息化機房中屬于基礎設施,能夠讓IT設備為核心業務運行提供強有力的保障,所以動力環境監控非常有必要,它是精細化管理要求的集中體現。
隨著網絡信息化和機房建設的迅猛發展,作為機房正常、穩定運行基本保證的空調、電源等設備的運行狀況以及機房環境的安全狀況也日漸凸顯出其重要性。由于許多重要機房是24小時不間斷運行,而管理人員很難保證時時刻刻對機房情況進行監控,因此通過技術手段實現24小時不間斷監控顯得非常必要。機房動力環境監控系統通過通信和軟件的集成,可以實現對機房環境和UPS、機房空調、發電機組等設備的集中監視,并實時采集報警信息發送給相關的管理人員。
主要通過配置傳感器來監控機房單相、三相市電的供電和恢復供電情況,針對機房的市電停電進行監控,能及時準確地把停電和來電的時間和信息通知管理人員,通過后臺數據算法分析機房供電質量和能源利用情況。
對環境的溫濕度進行實時監控,進而了解空調設備運行情況,保證設備在合適的電子環境下運行,防患于未然。環境溫濕度的監測首先實現環境告警,亦對采集的溫度信息、告警信息統計、分析,總結出運維規律,便于管理。
對機房的漏水情況進行監控,實現對客戶的技術場地不同環境和地點的監控,尤其對無人值守的小面積機房或機柜實現遠程無人值守的告警和掌控。因為無人值守且長期高負荷運轉,空調肯定有各種情況發生,空調漏水亦是其中一個很普遍的現象。
對供電設備開關機狀態、電流、電壓等參數的遠程監控,包括220VAC、48VDC、240VDC、600VDC等供電設備,實現設備參數異常和閾值越限上報,定期提供區域性的統計分析,進而隨時了解機房的負載和負荷的運轉情況。
對安防類的信號比如主動紅外對射,被動紅外微波雙鑒,門磁信號的監控。
其他類的模擬量和開關量的監控,需要下行控制的開關量(包括簡單的聯動控制,時間編程控制等)遠程控制類的需求,以及精密空調等智能設備的監控管理。
(1)專線方案拓撲圖

圖1 專線方案拓撲圖
(2)系統描述
根據客戶側采集器接入方式,專線方案系統拓撲圖所示:主要應用場景是一些采集量涵蓋比較齊全的機房。機房包含智能采集設備、開關量設備、模擬量設備。如果從專業角度劃分,又可主要分為環境量采集模塊和智能設備采集模塊。環境量是指機房溫度、濕度,煙霧探測和漏水探測;智能設備包括精密空調、UPS電源、開關電源、油機等,通過智能采集服務器UPT設備采集各傳感器和智能設備數據,經網絡實時上報到紫圖監控平臺。當機房有告警產生時,平臺首先會彈出相應告警對話框,顯示告警機房、告警設備、當前告警值及當前告警的開始時間。其次平臺會將告警短信通過無線短信貓發送到指定維護人員的手機上。
(1)無線接入方式方案拓撲圖

圖2 無線方式方案拓撲圖
(2)方案描述
根據客戶側采集器為無線接入方式所示:無線接入方式主要的應用場景是一些采集設備涵蓋量相對較少(主要以一些開關量設備或較少的模擬量設備或接入信號),需求相對較簡單的機房。雖然是簡易版,但在功能的實現上仍然可以保證需要監控的設備當有告警后能在第一時間知曉。這是因為簡易版所用的無線控制器也可以將一些模擬量設備、開關量設備接入進去,當有告警時會通過GPRS或者NB-IOT UDP方式上報平臺,亦可以短信的方式直接發送給相關機房負責人員。簡易版中平臺側的相關顯示和告警的處理與專業版系統一致。數據同樣是傳輸到移動的客戶監控管理平臺,平臺軟件的功能都可以滿足。
數據的采集、監控、統計、分析,必然依賴上述兩種傳輸方式的實現,依據客戶的需求,加上對客戶專業化的引導,從而滿足機房監控的需求,最終實現簡化客戶機房的運維管理、效率的提升和正確執行安全生產規范。

圖3 運維方式展現圖
本方案采用智能手機APP軟件和服務級綜合管理軟件平臺雙重方式管理,包括數據展示、統計、分析、告警信息的推送和遠程控制等。達到及時化辦公運維和隨時性移動運維相結合的運維管理的目的。

圖4 手機端平臺展示圖

圖5 客戶端平臺展示圖
(1)平臺基本功能
通過傳感器終端上報的監測數據進行統計分析呈現:活動告警信息、歷史告警查詢、采集數據統計分析、關聯分析、預防性維護預測等;通過曲線、圖型、列表,輔以圖標、顏色、等級,在電腦web界面、手機APP軟件上實現,且可以實現消息推送。
具體實現功能如下:
1)安全穩定的數據采集和動態展現;
2)權限的分配、地域的劃分等;
3)多途徑通訊,本地告警推送和平臺告警推送互為備份;
4)遠程控制設備運行及狀態確認返回;
5)及時獲取故障告警信息,查詢歷史告警信息;
6)多工種人員遠程使用,包括主管,專家,值班等;
7)結合平臺數據分析提供合理的機房治理維護建議。
(2)平臺擴展功能
整套機房的動環監控運維系統建設基于物聯網理念下的數據采集技術,數據采集只是實現整套系統的主體框架方式,最終目的在于更科學高效地運用采集到的“數據元素”,通過數據統計分析手段將這些元素重新拼接為機房運維工作中的“工作個體”,通過數據可視化形象具體地展示給維護人員。“數據元素“包括原始采集的信號、告警、時間、事件等,把原始的“數據元素”作為“生”數據,通過科學算法進行“適當加工”(比如邏輯的運算、時間的演算、字段關聯、自學習的應用和等)和傳統人工運維經驗的糅合,將原始的“生”數據變成“熟”數據,達到智慧運維、智能管理的目的。
舉例如下:
1)房間溫度和空調開啟當下關系時間軸線;
2)對電流經過若干組合后若干可能狀態,過濾后的最終狀態綜合值等;
3)其他由專家提出的各種邏輯運算后的綜合告警運算信號實現等。
(3)平臺智能巡檢
集客機房的巡檢管理。巡檢對保證設備穩定運行,提升用戶感知具有重要意義。隨著全業務規模的不斷擴大,切實要求轉變以往采用紙質化巡檢模式存在的監督和管理困難的現狀,研究電子化巡檢手段。遠程運維管理終端具有遠程巡檢按鈕,巡檢執行時觸發該按鈕,終端將巡檢時間、巡檢地點、所巡檢的設備等信息實時上傳到管理中心,管理中心可按照要求輸出巡檢報表。方案可實現巡檢人員終端的經緯度管理,通過集團客戶機房巡檢按鈕的簽到等手段實現智能巡檢業務。
針對政府、銀行、保險總部等大型/重點集團客戶,通過集團客戶需求收集及主動推介等方式拓展業務。業務監控終端可作為獨立產品組網,運營商維護人員參與制定機房監控一攬子解決方案,為集團客戶提供客戶側設備監控、市電整體檢測評估、溫度、濕度、無線信號質量、煙感等一體化服務。
針對中小企業客戶,遠程監控終端作為公司企業網關產品的一個功能模塊,可根據客戶實際需求選配,以滿足中小企業機房及設備監控需求。目前蘇州地區針對中小企業客戶監控試點情況是:在集團客戶業務接入機房內安裝一臺監控主機,主機上接有市電、溫度、水浸、煙感等傳感器(傳感器種類、數量可根據客戶需求選裝),傳感器將市電及環境量等實時信息傳送給監控主機,監控主機通過GPRS網絡將監控數據上報到中心服務器,可供維護人員瀏覽。由于監控主機上尚留有其它干接點通道,所以下一步還將研究將網絡接入設備的傳輸、運行等狀態信息上報監控主機。
集團客戶機房部署實施動力環境與數據分析運維監控系統,可以實現集團客戶側業務接入機房、集團客戶自有機房的設備監控、動環監控等,通過對機房業務監控實現主動性維護,及時發現故障,提高集團客戶的滿意度;同時可提高運營商公司對代維廠家巡檢、設備廠家售后維護的管理能力,實現自動巡檢。集團客戶機房動環數據分析運維監控系統由遠程運維管理終端和管理中心組成,接入設備發生異常情況時,遠程運維管理終端通過無線或有線網絡將告警信息發送給維護人員和管理中心,及時響應處理;或者維護人員通過手機訪問系統,實時獲取相關信息。系統給機房動環運維帶來了新的發展機遇,數據分析技術將會對未來動環系統發展及運行帶來革命性變化。