殷佳輝 朱兵 張一鳴 黃金森 苗益川



關(guān)鍵詞:數(shù)據(jù)中心;氣流模擬;機(jī)器學(xué)習(xí);快速預(yù)測;熱參數(shù)
中圖分類號:TK221 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-8228(2023)11-71-06
0引言
傳統(tǒng)行業(yè)與云計算、人工智能、5G、物聯(lián)網(wǎng)技術(shù)呈深度融合的趨勢,數(shù)據(jù)及流量爆發(fā)式增長使數(shù)據(jù)中心向著大規(guī)模、高密度的方向發(fā)展[1],導(dǎo)致數(shù)據(jù)中心能耗逐年增加。數(shù)據(jù)中心的能耗由IT 設(shè)備、制冷系統(tǒng)、供配電和照明系統(tǒng)三部分組成。其中IT 設(shè)備占總能耗50%[2],其產(chǎn)生的熱量直接決定了空調(diào)負(fù)荷的大小,影響空調(diào)能耗;而空調(diào)運行參數(shù)的改變,反過來影響著IT 設(shè)備的運行環(huán)境及其運行能耗,兩者的能耗因熱環(huán)境而彼此耦合[3]。因此,以IT 設(shè)備的負(fù)載動態(tài)變化為基礎(chǔ),預(yù)測數(shù)據(jù)中心的溫度情況,探索數(shù)據(jù)中心熱環(huán)境與能耗之間的平衡、對于數(shù)據(jù)中心能源優(yōu)化管理具有現(xiàn)實意義。
基于計算流體力學(xué)(CFD)模擬的方法是預(yù)測數(shù)據(jù)中心溫度分布的主流辦法[4]。但CFD 預(yù)測過程中需求解復(fù)雜的數(shù)學(xué)物理模型,大型的數(shù)據(jù)中心機(jī)房往往需要劃分幾十萬到幾千萬的網(wǎng)格[5],求解過程困難,難以實現(xiàn)氣流的實時預(yù)測。近年來興起的機(jī)器學(xué)習(xí)預(yù)測方式使數(shù)據(jù)中心氣流組織的實時預(yù)測成為可能,對此國內(nèi)外學(xué)者已有一些研究。Song Zhihang[6]開發(fā)了基于計算流體動力學(xué)(CFD)仿真的人工神經(jīng)網(wǎng)絡(luò)(ANN)模型對高架地板入口氣流的溫度和速度預(yù)測。Tsukamoto 等[7]人開發(fā)了可基于低網(wǎng)格數(shù)CFD 模型計算出的機(jī)柜出口風(fēng)速對高網(wǎng)格數(shù)CFD 模型的機(jī)柜出口風(fēng)速做出預(yù)測的深度神經(jīng)網(wǎng)絡(luò)(DNN)回歸預(yù)測模型。Athavale 等[8]評估了人工神經(jīng)網(wǎng)絡(luò)(ANN)、高斯過程回歸(GPR)和支持向量回歸(SVR)三種機(jī)器學(xué)習(xí)方法對數(shù)據(jù)中心穩(wěn)態(tài)工況下機(jī)架入口溫度分布的預(yù)測性能。石桃桃等[9]建立了多參數(shù)POD 降階溫度場預(yù)測模型,基于POD-IDW 模型預(yù)測機(jī)柜進(jìn)出風(fēng)平面的溫度場分布。
上述學(xué)者在數(shù)據(jù)中心氣流組織優(yōu)化、模型開發(fā)和數(shù)據(jù)中心結(jié)構(gòu)設(shè)計等領(lǐng)域取得了大量研究成果,但在模型評估與優(yōu)化及穩(wěn)態(tài)熱環(huán)境實時預(yù)測等領(lǐng)域研究不夠深入。雖然CFD 模擬可以提供實驗難以得到的特殊工況下的氣流分布數(shù)據(jù),但目前CFD 計算中常用的湍流模型并不適合,準(zhǔn)確性較差,難以為快速預(yù)測模型提供高保真數(shù)據(jù)。基于此,本文為提高CFD 預(yù)測數(shù)據(jù)中心氣流組織穩(wěn)態(tài)熱參數(shù)的準(zhǔn)確性,以雪城大學(xué)/IBM 綠色數(shù)據(jù)中心(GDC)實驗室(RL)[10-11]為模型。通過參數(shù)化仿真,模擬了在不同機(jī)柜負(fù)載率下的穩(wěn)態(tài)溫度分布建立CFD 數(shù)據(jù)集,并基于CFD 數(shù)據(jù)集訓(xùn)練將其用于Elman 神經(jīng)網(wǎng)絡(luò),RBF 神經(jīng)網(wǎng)絡(luò)和SVR 支持向量回歸三種機(jī)器學(xué)習(xí)模型訓(xùn)練。從而實現(xiàn)對不同機(jī)柜負(fù)載率下空調(diào)回風(fēng)溫度的快速預(yù)測,并評估了不同機(jī)器學(xué)習(xí)模型穩(wěn)態(tài)熱參數(shù)預(yù)測性能。
1 數(shù)據(jù)中心模型
1.1 實驗?zāi)P?/p>
實驗室共設(shè)有R1、R2、R3 三個大功率模擬機(jī)架,每個機(jī)架長1m,寬0.61m,高2m,在滿載時可產(chǎn)生102kW 以上的熱量(每個機(jī)架約34kW),每個機(jī)架包含四個模擬機(jī)箱,每個機(jī)箱均設(shè)置有恒速風(fēng)扇和可變功率加熱器,模擬機(jī)箱的流量特性和瞬態(tài)熱響應(yīng)特性與真實IBM 刀片機(jī)箱相同。并且高架地板模型采取數(shù)據(jù)中心常用的的體積力模型;湍流模型采用standard k-e 湍流模型。每個機(jī)箱的最大功率見表1。
1.2 CFD 模型及邊界條件設(shè)置
如圖1 所示,機(jī)架吸入穿過高架地板進(jìn)入機(jī)房的空氣以及部分房間內(nèi)的再循環(huán)空氣冷卻機(jī)架,機(jī)架的排氣進(jìn)入機(jī)房與房間空氣混合,然后進(jìn)入空調(diào)回風(fēng)口進(jìn)行降溫,冷空氣進(jìn)入增壓室后穿過高架地板進(jìn)入房間完成循環(huán)。
將實驗室模型的計算域包含除機(jī)柜內(nèi)部和增壓室之外的整個房間,房間墻壁、天花板均為無滑移絕熱邊界、由于實驗時未開啟CRAH2 所以同樣將其設(shè)置為絕熱邊界,地板設(shè)置為溫度邊界,機(jī)柜前方十塊高架地板設(shè)置為速度入口,CRAH1 設(shè)置為質(zhì)量出口,本實驗研究房間級的氣流組織,未對機(jī)柜內(nèi)部氣流進(jìn)行分析,將機(jī)柜建模為一個黑箱,機(jī)柜入口為壓力出口,機(jī)柜出口為速度入口,根據(jù)實驗數(shù)據(jù)對機(jī)柜進(jìn)行設(shè)置,邊界條件及參數(shù)設(shè)置見表2。
穩(wěn)態(tài)仿真基于三個機(jī)柜全部滿載情況下進(jìn)行,數(shù)據(jù)中心實際運行過程中服務(wù)器負(fù)載變化范圍為0~100%,而負(fù)載率的變化直接影響機(jī)柜的出口溫度,因此在探究機(jī)柜出口溫度對針對12 個模擬機(jī)箱在不同的負(fù)載率下進(jìn)行仿真抽樣,為了確保數(shù)據(jù)集的填充,且盡量減少仿真次數(shù),使用拉丁超立方抽樣對12 個模擬機(jī)箱的負(fù)載率建立了容量為500 的樣本,使用黑箱模型計算出不同負(fù)載率下的機(jī)柜出風(fēng)口溫度,此外,由于實驗室模擬機(jī)箱均為恒速風(fēng)扇,因此機(jī)柜出口流量不發(fā)生變化。
2 機(jī)器學(xué)習(xí)模型訓(xùn)練
建立CFD 數(shù)據(jù)集后,將數(shù)據(jù)集用于機(jī)器學(xué)習(xí)模型的訓(xùn)練,為了建立更準(zhǔn)確的數(shù)學(xué)模型分別采用了三種機(jī)器學(xué)習(xí)算法,包括Elman 神經(jīng)網(wǎng)絡(luò)、RBF 神經(jīng)網(wǎng)絡(luò)與SVR 支持向量回歸機(jī)。將12 個模擬機(jī)箱的出風(fēng)溫度作為輸入?yún)?shù),空調(diào)回風(fēng)溫度作為輸出參數(shù),進(jìn)行了參數(shù)化仿真,完成500 組數(shù)據(jù)的仿真時間約為2500 分鐘,且避免了繁雜的后處理工作。
2.1 Elman 神經(jīng)網(wǎng)絡(luò)
Elman 神經(jīng)網(wǎng)絡(luò)特點是其在隱含層中添加了一個可進(jìn)行一步延時的承階層[12],承接層將隱含層的輸出進(jìn)行延時與儲存,并在下一時間步將其傳遞到隱含層的輸入,使其對歷史數(shù)據(jù)具有敏感性,從而使網(wǎng)絡(luò)可以適應(yīng)時變特性[13]。Elman 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。
2.2 RBF 神經(jīng)網(wǎng)絡(luò)
本文使用的RBF 基于MATLAB 神經(jīng)網(wǎng)絡(luò)工具箱,該神經(jīng)網(wǎng)絡(luò)由三個層組成包括輸入層,由隱藏層神經(jīng)元構(gòu)成的徑向基層和由輸出層神經(jīng)元組成的線性輸出層,構(gòu)建函數(shù)newrbe 可建立精確徑向基神經(jīng)網(wǎng)絡(luò),與常用的中心選取方法不同,該函數(shù)直接將樣本作為中心,并將第一層權(quán)值設(shè)置為輸入向量的轉(zhuǎn)置向量。其網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。
2.3 SVR 支持向量回歸
支持向量機(jī)是一種監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)模型,它用分類算法來解決二分類問題,可利用已經(jīng)標(biāo)記了類別的訓(xùn)練集來訓(xùn)練SVM 模型,然后用它來對新的文本進(jìn)行分類。支持向量機(jī)的分類問題求解思路是先將樣本映射到一個特征空間內(nèi),基于間隔最大化的原則在特征空間內(nèi)找到一個超平面對樣本進(jìn)行分割,對于多元分類問題,可將其分解為多個二分類問題進(jìn)行分割。支持向量機(jī)結(jié)構(gòu)如圖4 所示。
3 訓(xùn)練及預(yù)測結(jié)果評價分析
3.1 Elman 神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果分析
使用Elman 神經(jīng)網(wǎng)絡(luò)對空調(diào)回風(fēng)溫度進(jìn)行預(yù)測,隱含層神經(jīng)元數(shù)量設(shè)置為58 個,承接層神經(jīng)元數(shù)量為1 個,epochs 設(shè)置為10000 次,學(xué)習(xí)率設(shè)置為0.1,由圖5可知在訓(xùn)練集的期望輸出與預(yù)測輸出吻合較好,但在某些樣本點仍有一定程度的誤差。由圖6 可知在測試集與訓(xùn)練集的誤差情況大致相同,但在某些點仍有一定程度的誤差,沒有出現(xiàn)過擬合。Elman 預(yù)測性能指標(biāo)見表3。
由表3 可知Elman 神經(jīng)網(wǎng)絡(luò)表現(xiàn)出了很強(qiáng)的預(yù)測能力,訓(xùn)練集和測試集的均方根誤差分別為0.11424K和0.13722K,遠(yuǎn)低于0.5~1K 的測量不確定度,訓(xùn)練集和測試集的最大誤差分別為0.40172K 和0.3526K 說明Elman 神經(jīng)網(wǎng)絡(luò)對某些點的擬合情況不夠理想,但精度均在可接受范圍內(nèi),Elman 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間約為11 秒。
3.2 RBF 神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果分析
使用MATLAB 中的精確徑向基神經(jīng)網(wǎng)絡(luò)對空調(diào)回風(fēng)溫度進(jìn)行預(yù)測,結(jié)果如圖7 所示。
由圖7 可知,訓(xùn)練集的期望輸出與預(yù)測輸出吻合較好,沒有觀測到有明顯誤差的樣本。由圖8 可知,測試集的期望輸出與預(yù)測輸出吻合情況與訓(xùn)練集相似,沒有觀測到有明顯誤差的樣本,沒有出現(xiàn)過擬合。RBF 神經(jīng)網(wǎng)絡(luò)的預(yù)測性能指標(biāo)見表4。
由表4 可知,RBF 神經(jīng)網(wǎng)絡(luò)表現(xiàn)出了很強(qiáng)的預(yù)測能力,訓(xùn)練集和測試集的均方根誤差分別為0.04937K和0.05713K,訓(xùn)練集和測試集的最大誤差分別為0.16601K 和0.21838K,均方根誤差與最大誤差均遠(yuǎn)低于0.5~1K 的測量不確定度,在空調(diào)回風(fēng)溫度預(yù)測的問題中RBF 神經(jīng)網(wǎng)絡(luò)的精度明顯優(yōu)于Elman 神經(jīng)網(wǎng)絡(luò),此外RBF 神經(jīng)網(wǎng)絡(luò)還有更快的學(xué)習(xí)速度,訓(xùn)練用時1.56 秒。
3.3 SVR 預(yù)測結(jié)果分析
使用基于MATLAB 的SVR 工具箱中的RBF 核函數(shù)SVR 模型對空調(diào)回風(fēng)溫度進(jìn)行預(yù)測,由圖9 可知SVR 預(yù)測模型訓(xùn)練集的期望輸出與預(yù)測輸出吻合較好,沒有觀測到有明顯誤差的樣本。由圖10 可知測試集的期望輸出與預(yù)測輸出吻合情況與訓(xùn)練集相似,精度較高,沒有出現(xiàn)過擬合。SVR 預(yù)測性能指標(biāo)見表5。SVR 預(yù)測性能指標(biāo)見表5。
使用基于RBF 核函數(shù)的支持向量回歸機(jī)的預(yù)測結(jié)果各項數(shù)據(jù)均優(yōu)于RBF 與Elman 神經(jīng)網(wǎng)絡(luò),訓(xùn)練集和測試集的均方根誤差分別為0.0437K 和0.0481K,訓(xùn)練集和測試集的最大誤差分別為0.0.07863K 和0.13206K,均方根誤差與最大誤差均遠(yuǎn)低于0.5~1K 的測量不確定度,在空調(diào)回風(fēng)溫度預(yù)測的問題中SVR 表現(xiàn)出了比神經(jīng)網(wǎng)絡(luò)更高的精度,此外支持向量回歸機(jī)有比神經(jīng)網(wǎng)絡(luò)更快的學(xué)習(xí)速度,訓(xùn)練用時0.86 秒。
3.4 機(jī)器學(xué)習(xí)模型訓(xùn)練效果分析
由三種模型的模擬結(jié)果可知,在三種模型中Elman模型計算時間最長精度最差,RBF 模型計算時間大幅減少同時精度也有所提高,SVR 模型表現(xiàn)最佳,有最短的計算時間和最高的精度。從網(wǎng)絡(luò)結(jié)構(gòu)上看Elman 神經(jīng)網(wǎng)絡(luò)常用結(jié)構(gòu)為四層,在隱含層增加一個承接層,RBF 神經(jīng)網(wǎng)絡(luò)只有一個隱含層,并且輸入層到隱含層單元之間為直接連接,RBF 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)更加簡單,需要確定的模型參數(shù)更少。從訓(xùn)練方式上看,Elman神經(jīng)網(wǎng)絡(luò)需要確定的參數(shù)是連接權(quán)值和閾值,主要的訓(xùn)練算法為BP 算法或改進(jìn)的BP 算法;RBF 神經(jīng)網(wǎng)絡(luò)可以動態(tài)確定隱含層單元數(shù)、數(shù)據(jù)中心和擴(kuò)展常數(shù)等參數(shù),訓(xùn)練算法支持在線和離線訓(xùn)練,有較強(qiáng)的輸入和輸出映射功能,并且理論證明在前向網(wǎng)絡(luò)中RBF 網(wǎng)絡(luò)是完成映射功能的最優(yōu)網(wǎng)絡(luò)。RBF 神經(jīng)網(wǎng)絡(luò)從隱層空間到輸出層空間的變換是線性的,這樣可以有效地降低計算復(fù)雜度內(nèi)存消耗。因此,從理論上來說,RBF 神經(jīng)網(wǎng)絡(luò)具有更快的學(xué)習(xí)速度、更好的逼近性能、更優(yōu)的泛化能力、更簡單的結(jié)構(gòu)參數(shù)學(xué)習(xí)等優(yōu)點。
與RBF 神經(jīng)網(wǎng)絡(luò)和Elman 神經(jīng)網(wǎng)絡(luò)相比,SVR 結(jié)構(gòu)更簡單,參數(shù)更少,SVR 只需要在輸出層進(jìn)行誤差反向傳播和權(quán)重更新,而RB 神經(jīng)網(wǎng)絡(luò)需要在每個隱含層都進(jìn)行誤差反向傳播并根據(jù)梯度下降法進(jìn)行權(quán)重更新,因此SVR 的訓(xùn)練過程更簡潔,計算量更小。此外數(shù)據(jù)中心內(nèi)部熱參數(shù)具有較強(qiáng)的相關(guān)性,所以不必使用結(jié)構(gòu)較復(fù)雜的神經(jīng)網(wǎng)絡(luò),使用SVR 即可實現(xiàn)數(shù)據(jù)中心熱參數(shù)的準(zhǔn)確快速預(yù)測。SVR 相比于RBF 神經(jīng)網(wǎng)絡(luò)和Elman 神經(jīng)網(wǎng)絡(luò),不需要確定隱含層的結(jié)構(gòu)和數(shù)量,也不需要進(jìn)行復(fù)雜的誤差反向傳播算法,訓(xùn)練過程更加簡單和高效,SVR 可以有效地處理高維數(shù)據(jù)和小樣本數(shù)據(jù),而不會出現(xiàn)維數(shù)災(zāi)難或過擬合問題且SVR 可以通過調(diào)整核函數(shù)、懲罰參數(shù)和松弛變量等超參數(shù),來控制模型的復(fù)雜度和精度,具有較強(qiáng)的靈活性和魯棒性。
4 結(jié)論
通過參數(shù)化CFD 仿真建立不同機(jī)柜負(fù)載率下空調(diào)回風(fēng)溫度的數(shù)據(jù)集,分別使用Elman 神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)與SVR 支持向量回歸機(jī)對數(shù)據(jù)中心穩(wěn)態(tài)運行情況下的空調(diào)回風(fēng)溫度進(jìn)行預(yù)測,三種模型均在短時間內(nèi)實現(xiàn)了較為準(zhǔn)確的預(yù)測。在三種機(jī)器學(xué)習(xí)模型中,SVR 支持向量回歸機(jī)憑借其訓(xùn)練過程更簡潔,計算量小的優(yōu)勢成為精度最高、訓(xùn)練速度最快的機(jī)器學(xué)習(xí)模型,均方根誤差為0.048K,訓(xùn)練時間為0.86s。原因是數(shù)據(jù)中心負(fù)載率與空調(diào)回風(fēng)溫度具有較強(qiáng)的關(guān)聯(lián)性因此并不需要復(fù)雜結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)即可建立快速預(yù)測模型,因此結(jié)構(gòu)簡單、泛化能力強(qiáng)的SVR模型更具有優(yōu)勢。