王雪峰
上海允登信息科技有限公司
在當今的信息時代,數據中心已經成為全球經濟發展的基石。目前中國數據中心的耗電量已連續八年以超過12%的速度增長,預計2020年總耗電量將達到2 962億kWh[1],數據中心能耗成本往往占數據中心總體運營成本的50%以上[2],讓數據中心的運營單位不堪重負。巨大的能耗成本使數據中心的運行維護成本已遠遠超過了數據中心的建設成本,即購買數據中心所必需的大量硬件設備和場地所花的費用。數據中心的節能問題正引發包括政府在內的廣泛關注,北京、上海、深圳等一線城市相繼出臺IDC節能政策。
減小數據中心能耗是學術界和工業界目前的共識[3-5]。對于已經建成投產的數據中心,如何實現有效的節能改造,需要考慮的因素更多更復雜。舊的數據中心需要因地制宜、發現問題,分析出最恰當的具體解決方法,通過智慧節能和精細化管理維護,在保證高可用性和高可靠性的前提下,最大化實現數據中心機房能耗的節能優化。本文介紹了節能機器人系統設計要求、工作原理以及數據采集分析優化,并通過實際應用案例分析其在數據中心節能中的應用。
數據中心的節能始終與溫濕度等環境參數密切相關,國際標準ASHRAE 2011 TC9.9[6](美國采暖、制冷與空調工程師協會)和數據中心設計規范國家標準GB50174-2017[7]對環境要求的規定如下:機房內冷通道或機柜進風區域的溫度維持在18~27℃;冷通道或機柜進風區域的相對濕度和露點溫度需滿足:露點溫度5.5℃~15℃,同時相對濕度不大于60%;同時滿足不結露的要求。
對照最新節能要求,企業在數據中心節能方面還存在如下不足之處:缺乏及時感知數據中心環境變化的手段和方法,如:無法及時感知溫度、壓力等的變化;即使具備對環境變化的分析能力,但由于缺乏專業知識和能力,缺乏環境控制的實用方法和手段,無法實現降低能耗、綠色低碳的目標。
傳統的測量方法都是采用密布傳感器的方案,機柜前面和后面分別部署3個溫度傳感器,用于計量溫度狀態的變化。對于已建成投產的數據中心,密布傳感器的施工對于客戶來說是一個巨大的安全挑戰,執行難度很大,并且其他環境參數如壓力、風速的采集也十分有限,基于此現狀,本文介紹一種節能機器人用于解決采集點少施工難的問題。
數據中心節能機器人系統分兩層體系架構,主要由機器人本體和節能管理云平臺組成。機器人可以通過局域網與云平臺進行數據、圖像、視頻等交互,云平臺進行任務部署、狀態監控、遠程遙控、數據分析、報表管理、日志管理及智能報警預測等基本功能。系統采用模塊化設計,除了節能管理功能,根據客戶需要還可以增加日常巡檢,環境巡檢,隨工安防等功能。
節能機器人系統采取分成設計架構。包括感知層、數據接口層、數據存儲層、認知層、應用層和平臺管理層,如圖1所示。
為了適應數據中心靈活行走轉彎的特性,機房巡檢機器人外觀設計成圓形,尺寸大小盡量控制在一塊地板之內。機器人結構由全自主運動底盤,溫濕度、噪音、空氣質量、風速、煙霧等多種傳感器和云臺監控設備組成。機器人設計了電源開關按鈕和一鍵急停按鈕。電源開關按鈕控制機器人各個設備上電,急停開關按鈕可以強制停止機器人底盤運動。機器人本體集多傳感器融合技術,無軌導航技術以及機器視覺為一體的智能機器平臺,可以運行于機房等區域,接受任務指令對相關區域進行環境參數的采集。

圖1 數據中心節能機器人系統架構圖
節能機器人系統以機器人為原點和測量核心,通過數據和算法驅動,精細化管理機房能效,以達到數據中心綠色、低碳和可持續發展。智慧節能方法首先自動收集數據中心能源使用效率(Power Usage Effectiveness,PUE)相關的環境和設備運行數據,進行數據提煉與整合;然后結合最新數據中心綠色實踐理論以及制冷系統運行優化專業知識,建立數據中心氣流模型和能效預測模型,以此為基礎設計持續優化深度增強學習模型與算法;最后通過模型訓練后提煉實施機房氣流組織優化、制冷系統的最優化調整控制策略,并且對策略實施結果進行預分析,在保證安全的前提下達到節能減排目的。
機器人是智慧節能的基礎,是保證機房運行安全的核心。機器人部署在機房后,可以實時、動態、全面收集機房環境數據,為智慧節能打下堅實的基礎;同時在節能實施過程中,機器人實時的檢測數據可以驗證機房環境安全,確保機房平穩運行。
節能機器人設備智能的結構設計,配有溫濕度和風速等傳感器,可以收集數據中心成千上萬的溫度、濕度和風量等環境數據,快速掌握機房散熱和氣流分布狀況。利用機房節能機器人設備采集到的實際數據和節能管理云平臺分析產生三維溫度分布圖,如圖2所示,形象地了解到現有數據中心的熱分布狀況和冷卻系統,深入分析并解決數據中心存在的問題,并鑒別、診斷和解決數據中心存在的熱點、故障和低能效問題。

圖2 機房溫度云圖
節能管理云平臺,通過大量實際數據建模分析現有的和將來的數據中心熱環境,了解數據中心的流場、速度場和溫度場等情況,分析空調等關鍵設備失效或者關閉期間數據中心的影響狀況,優化現有的或者將來的IT設備布局,給IT等硬件設備提供最有效的通風和冷卻條件,鑒定減少數據中心冷卻成本的可行性。最后應用最佳實踐理論,比如:空調的使用效率、氣流的有效利用、地板下冷空氣的平均溫度波動、空調的風量、入口熱點、水平熱點、垂直熱點以及AI算法模型分析數據中心的環境與能效狀況,提出量身定做的數據中心最佳能效優化實施策略。
本案例是國內某個典型的IDC企業設備托管數據中心,共有832 m2使用面積,鋪設了架高地板,采用下送風上回風,299個機柜組成18列,使用冷通道封閉布置,但是由于部分機柜里沒安裝盲板,冷熱通道空氣還有一定短路混合和熱空氣回流。IT設備包括服務器、存儲及網絡設備,設備多為前進風后出風散熱設計。機房有斯泰科CXD170DE水冷空調10臺,依米康SCA1102UE風冷空調9臺,總共19臺空調,18臺開啟。機房布局如圖3所示。

圖3 機房布局圖
通過機器人采集的大量實際數據以可視化方式表示機房的溫度分布。圖4是機房1米高度的機柜入口溫度圖,31.46℃以上為紅色,16.06℃以下為深藍色。

圖4 實施前機房溫度云圖
通過機房溫度云圖分析機柜的入口溫度分布情況,收集機柜中設備入口溫度數量有1 794個(每個機柜6個入口溫度,位置:從上到下平均分布),入口溫度最大值26.3℃,入口溫度最小值16.1℃,入口溫度平均值為22.8℃,沒有入口溫度值高于國際標準ASHRAE 2011 TC9.9和國家標準GB50174-2017規范建議范圍。國內外標準都建議將數據中心中IT設備的入口溫度范圍控制在18~27℃之間,可以確保IT設備安全、可靠地運行。入口溫度偏低(<18℃)位置個數為20個,入口溫度偏高(>27℃)位置個數為0個,如圖5所示。過冷點相對較多,說明機房有較多的節能空間。
機房內通風地板共有263塊,且僅有1種通風地板類型,共測量了261塊通風地板的出風量。通風地板風量最小值為595.8 m3/h,風量最大值為2 512.1 m3/h。通風地板平均送風量為1 630.2 m3/h。
在上述數據分析基礎上,使用節能管理云平臺數據分析模塊模擬預測機房環境、氣流的動態變化,并使用優化算法優化氣流組織和空調系統參數配置,并關閉了7臺空調,達到節約能耗的目的。優化實施后機房1米高度的機柜入口溫度圖分布如圖5所示,31.46℃以上為紅色,16.06℃以下為深藍色。為了確保機房IT設備安全運行,實施后機柜所有入口溫度都維持在18~27℃之間,入口平均溫度從實施前的22.8℃升高到24.8℃,入口最低溫度從16.1℃增加到18.3℃,見表1。

圖5 實施后機房溫度云圖

表1 實施前后溫度數據分析
利用動環監控系統對空調系統和IT設備的耗電監測數據進行對比分析,智慧節能優化實施前制冷系統耗電為373.9 kW,實施后制冷系統耗電為276.1 kW,節電率提升26.1%,按每kWh0.8元計算,一年可以節省電費685 382元。
本文針對已建投產數據中心的能效運維管理中引入節能機器人技術進行分析與研究,在機房內部署使用靈活方便的生產設備,對于數據中心的節能效果明顯,而且不涉及機房施工改造,是一種智慧管理節能的方法,具有推廣優勢。結合目前數據中心的實際運行情況,提出節能機器人系統的架構設計和工作原理,為下一步數據中心機房采用節能機器人大規模實際應用提供技術依據。
隨著機器人和人工智能等技術的發展和成熟,目前智能機器人已經陸續引入數據中心的智能運維中。除了本文陳述的節能功能,智能機器人還可以承擔數據中心的運維工作如日常巡檢、環境巡檢、隨工安防和資產盤點等,無人值守的數據中心離我們越來越近。