楊靈泉,包 衍,施瑜豪,婁潔良,趙 逸
(1.中國電信股份有限公司上海分公司,上海 200000;2.上海郵電設計咨詢研究院有限公司,上海 200000)
本次研究選取了某數據中心典型機房作為研究對象,該機房面積約 408 ㎡,采用傳統下送風布局方式,高架地板高度為 60 cm,機柜為標準3.5 kW機柜,送風方式為下進風后出風。地板下送風設計,主要平面布局如圖1所示。

圖1 某典型機房布局圖
從典型機房的特質分析:該機房為無人值守機房,該機房長 22.65 m,寬 18 m,高 3.6 m,以機房邊界隔熱條件完好為前提,主要熱源來自機房內的IT主設備、少量照明、消防等保障設備,同時IT主設備以顯熱為主,考慮功耗都轉為熱量,另加建筑圍護結構的傳導熱以80~100 W/m2,本文以100 W/m2計算[1]。
該機房內共 148 個機柜,單機柜設計功率為3.5 kW;全部為柜內底部進風、后/上出風的散熱設計;機柜內主要為服務器和網絡設備,遠期設計負載約為518 kW,目前IT 設備運行總功率約為 130.8 kW。
機房內發熱量為Q=130.8 kW+0.1×(22.65×18) kW=157.14 kW
機房兩側裝有 7 臺某品牌下送風精密空調,單臺制冷量為100 kW,送風量單臺為40 000 m3/ h,機房空調冷量足以冷卻機房內部熱負荷,并有較大冗余。
但機房存在制冷能耗高和局部熱區問題,判斷是由于部分服務器反向安裝,導致向機柜熱通道吸風,向冷通道排風,同時功率較大服務器集中布置,部分區域熱量需求遠大于其他區域,造成冷量不能有效送達和大量冷量浪費問題[2]。通過對每個機架封閉冷通道0.3、1.2、2 m的高度總計1 173個溫度測點進行了測量,相關測點的溫度分布如圖2所示。

圖2 機房熱點分布圖
空調目前的運行及設定情況見表1。

表1 某典型空調運行及設定表
同時機房存在過冷問題,為解決熱點區域問題,造成IT負荷較低機架的冷量不能有效利用,大量冷量浪費問題。部分機架冷量計算如表2所示。

表2 部分機架冷量計算表
電能使用效率(Power Usage Effectiveness,PUE)是衡量數據中心機房節能程度的最重要指標,TGG和ASHRAE給出的PUE的定義相同,為數據中心總能耗與IT設備能耗之比:

式中,Et為數據中心總能耗,EIT為數據中心IT設備總能耗。
由于衡量數據中心能效的規范、標準給出的方式都不盡相同,本文在計算中采用GB/T32910.3—2016《數據中心資源利用第3部分:電能能效要求和測量方法》的計算方法:
PUE=(IT 系統耗電量 + 機房照明統耗電量 + 空調系統耗電量 +UPS 自身損耗)/IT系統耗電量 (2)
(1)IT 設備的用電量:從列頭柜機房現場采集的 IT 設備功耗表我們可以得出該機房的 IT 設備總用電量為9 417.6 kW·h。
(2)機房照明部分:機房內照明按節能方式開啟,照明共計能耗為40.32 kW·h。
(3)空調部分:空調系統為風冷型精密空調。根據對應空調配電柜電量統計,空調機組瞬時能耗為4449.6 kW·h。
(4)UPS 設備部分機房配置的 UPS 設備為高頻機,輸出效率較高,根據UPS設備前后級配電屏功率計算,損耗為689.76 kW·h。
優化前該典型機房PUE=(9 417.6+40.32+4 449.6+689.76)/9 417.6 ≈ 1.55
基于以上典型機房物理結構、熱負荷、冷量數據等屬性的概述,著手進行CFD建模,保證模擬工況的準確性[3]。建立的三維模型包括:
(1)建筑圍護結構、門、窗、梁、柱、通風口、照明設備等。
(2)高架地板,地板通風格柵,吊頂開孔、通風口等。
(3)機柜:網絡機柜、服務器機柜、交換機、服務器等 IT 設備。
(4)電力系統:列頭配電柜。
(5)空調:下送風精密空調。
(6)送風系統:風機,風管等。
(7)走線架:強電走線架、弱電走線架等。
按照機房實際長寬高建立模型空間,建立可能影響出風與回風的立柱及橫梁,以實際架空地板高度0.6 m處建立架空地板,將7臺空調、8列頭柜及機架按照實際大小及安裝位置建模,如圖3所示。

圖3 某典型機房側視圖
由于典型機房機柜采用的是下進風后出風模式,因此需要對前進風后出風機柜模型進行調節優化[4]。每個機柜中按實際情況建立斜擋板導風、封閉進風口、調整出風開孔率、調整服務器安裝位置、按照實際情況將每個機柜中的服務器按U位建入其中并進行盲板封閉、按實際情況設置每臺服務器的能耗,如圖4所示。

圖4 機柜建模側視圖
經過前期模型校準,機柜進風溫度的模擬值已與現場實測值接近,由于現場測試條件所限,所用工具為點溫儀,適用于測量設備表面溫度,而CFD模擬算法模擬溫度為空氣溫度,因此與實測值有誤差,經過比對,最大誤差不超過6.5%,基本可以認定仿真數據有效,仿真數據與現場測量值對比如表3所示。

表3 仿真數據對比現場測量值對比
同時對進出風風速進行抽樣綜合比對,現場機柜各點風速與CFD模擬數據接近一致,空調回風風速、下送風風速由于測量條件限制有4%~6%的誤差[5]。
通過運用CFD軟件對某典型機房進行模擬,對比現狀的校驗和數據分析,某典型機房存在以下的情況和問題。
2.3.1 問題1
機房實測IT設備入口溫度范圍為18.5~35.7 ℃,溫度差為17.6 ℃,通過模擬發現現場開啟的5臺空調,輸出制冷能力雖然遠高于現場實際需求,但由于冷量分配不均,熱區滿足散熱需求的情況下,低負荷區域溫度已低于20 ℃,出現冷量過剩情況造成能耗的損失,機房A列—C列溫度分布如圖5所示。

圖5 A列—C列溫度分布
2.3.2 問題2
根據計算及現場測量,單列機柜前后進風量不均,距離空調最近的機柜由于架空地板下風速過高,實際輸送至機架內部的風量較小,B列機柜進風風速分布如圖6所示。

圖6 B列機柜進風風速分布圖
2.3.3 問題3
空調風機橫置安裝,出風并非均勻向前,同時受建筑立柱影響,部分區域存在渦旋現象,造成風冷的損失,氣流分布不均。
2.3.4 解決的相應策略
通過以上問題的分析,借助CFD工具對可行的策略模擬計算和經驗論證,進行了針對性的現場實施改造。
(1)策略1:根據CFD軟件模擬的結果,對于過冷區域,調節對該區域影響最大的空調,提高空調回風溫度并降低送風風速,消除存在的冷量過送問題。
(2)策略2:對于高負荷區域及部分機柜進風不足問題,采用主動將氣流導向機柜措施。為了起到良好的導流效果,擋板按一定夾角放置,同時,為了保證后方的空氣流通,將擋板中間挖空,使得下半部分的風可以從中穿過,如圖7所示。

圖7 氣流擋板示意
(3)策略3:機柜縫隙封堵,阻止了冷空氣從機柜底部開口直接進入熱通道造成冷量浪費,并提升空調的回風溫度,提高空調運行效率。通過加裝地板下導流裝置使氣流組織更有序化,將冷空氣送到指定區域,從而消除各列機柜底部風量波動,同時也減少了特定區域的溫度不均勻現象,改造前后效果對比如圖8所示。
根據熱負荷模擬,空調運行模式可以從5+2優化為4+3,同時提升2臺空調回風設定溫度,降低4臺開啟空調的風機轉速,現場根據模擬結果進行了實際調整,調節后空調運行及設定如表4所示。

表4 調節后空調運行及設定表
根據模擬,現場對A—C列功耗較高區域進行導流板安置,在每列頭部1號 2號機柜及尾部18號19號各安置一塊導流板。安置擋板對于對應機柜的散熱有著顯著的幫助,將機柜內溫度降低3.7 ℃,散熱溫度降低3.3 ℃,效果對比如表5所示。
通過擋板安置前后的數據對比,可以發現氣流導流對改善下進風機柜具有針對性效果,同時該方案有很強的可調配性,可以根據現場需求,調整擋板間夾角和位置,調整擋板下挖去部分的大小等。
結合一周的現場采集綜合數據,PUE計算結果如下:

表5 擋板前后效果對比
(1)IT 設備的用電量:從列頭柜機房現場采集的 IT 設備功耗表我們可以得出該機房的 IT 設備總用電量為22939.2 kWh。
(2)機房照明部分:機房內照明按節能方式開啟,照明共計能耗為:94.08 kWh。
(3)空調部分:空調系統為風冷型精密空調。根據對應空調配電柜電量統計,空調機組能耗為9 679.6 kWh。
(4)UPS 設備部分機房配置的 UPS 設備為高頻機,輸出效率較高,根據UPS設備前后級配電屏功率計算,損耗為1651.44 kWh。
優化后 PUE =IT 系統耗電量 + 機房照明統耗電量 + 空調系統耗電量 +UPS 自身損耗 /IT 系統耗電。
PUE=(22 939.2+94.08+9 679.6+1 651.44)/22 939.2 ≈ 1.498。
氣流優化是實現風冷數據中心能耗優化的一項重要措施,本文通過對機房現場問題的分析,以機房CFD建模作為主要分析工具,通過模型的校驗、數據對比中發現造成機房實際能耗偏高的問題原因,針對性進行優化策略的制訂,同時在現場部署前,通過對優化策略進行模擬,驗證策略的有效性,也驗證策略的安全性,確保機房運行的安全。通過在典型機房的試點,該優化方法取得了良好效果,可為類似情況提供借鑒。