許俊 胡孝俊 高健 姚貴策 賀曉
開放科學(資源服務)標識碼(OSID):
DOI:10.16661/j.cnki.1672-3791.2311-5042-5296
作者簡介:
許俊(1979—),女,本科,高級工程師,研究方向為數據中心基礎設施設計研究。
胡孝俊(1987—),男,碩士,高級工程師,研究方向為數據中心基礎設施設計研究。
通信作者:姚貴策(1989—),男,博士,副教授,研究方向為先進冷卻技術\智慧能源管理技術研究。E-mail:yaoguice@buaa.edu.cn。
摘??要:從局部離散流場數據點重構全局流場信息對數據中心機房的節能節碳具備重要的研究意義。基于局部散點對數據中心進行氣流組織溫度場快速重構,可以有效降低數據中心總能耗。主要通過發展一種基于多特征輸入的三維馬蹄形(convolutional networks for biomedical image segmentation,U-net)神經網絡架構,利用布設在數據中心機房的溫度傳感器數據值進行氣流組織溫度場重構。并研究了在不同學習率與數據集大小的設置下,該機器學習模型的訓練預測能力。對比結果表明:不同學習率對于模型訓練的結果有較大影響,應通過預實驗選取最佳學習率。在同等條件下,應優先選取較大的數據集進行訓練,便于提取高維物理特征。
關鍵詞:云計算???機器學習???計算流動動力學???氣流組織溫度場
中圖分類號:TP393
隨著云計算等新型數據通信模式的快速發展,算力正在成為一種新的生產力,而數據中心機房作為算力的物理承載,面臨著服務器運行時產生的熱負荷。當熱負荷過大時,將無法有效發揮計算集群的性能,因此需要高效的冷卻模式。為了降低制冷所需能耗,改善數據中心氣流分布,需要得到數據中心氣流組織溫度場,并基于溫度場結果進行結構布局優化,從而實現效益最大化。氣流組織溫度場可通過計算模擬或實驗手段得到,傳統的計算模擬方式為計算流動動力學(Computational Fluid Dynamics,CFD)模擬,但數據中心機房面積一般為百平米級及以上,對其直接進行CFD模擬將消耗大量的計算資源,無法應用于實際的工程優化中。因此,亟須發展出一種氣流組織溫度場快速重構的方法。
近年來,數據科學[1]與機器學習[2,3]獲得了井噴式的發展,這也為流體力學研究者提供了新的技術與方向[4,5]。其中,本征正交分解技術被廣泛應用于流場特征提取與重構,顯著降低了流場的計算成本。然而,該方法對于復雜流場結構的特征提取存在一定的局限性[6],特別是對高維特征的捕捉仍有不足。而神經網絡(Neural Network,NN)作為機器學習的典型算法,天然具備提取高維特征的能力[7],因此NN類算法可以一定程度上彌補POD類算法的不足。相比于全連接神經網絡(Fully-connected NN,FNN),卷積神經網絡[8](Convolutional NN,CNN)簡化了網絡結構復雜度,可以更加高效地從流場數據中提取高維特征[9]。在CNN的基礎上,將符號距離圖(Signed Distance map,SDF)作為輸入特征進行耦合,創造性地提出了DeepCFD框架[10],通過該框架可實現變構型流場重構。目前基于CNN的流場重構主要集中在二維構型,對三維構型的流場重構仍然存在不足。
本文在DeepCFD框架的基礎上,發展了一種基于多特征輸入的三維馬蹄形神經網絡架構,通過引入不同工況的溫度點陣圖等輸入,以及將二維卷積轉換為三維卷積,該機器學習方法可以有效地對數據中心機房三維氣流組織溫度場進行快速重構。此外,本文也對學習率進行了參數化研究。
1?訓練數據集生成
訓練機器學習模型需要大量的數據集,本文利用6SigmaDC軟件進行不同工況下的數據中心氣流組織溫度場模擬。首先,建立了如圖1所示的三維數據中心機房模型,機房面積為4.8 mx4.2 m,高度為
,在其中布設了6臺服務器。
由于數據中心機房服務器功率一般處于4~12?kW區間,空調溫度一般處于12~20?℃區間,因此在該范圍內,選擇了工程應用中較為常見的91組參數組合用于溫度場的工況模擬。由于6SigmaDC模擬生成的場數據為網格節點上的數據,具備一定的非均勻性(如圖2所示),因此采用最鄰近插值法對原始模擬數據進行三維插值,得到訓練模型需要的均勻數據集。
2?三維U-net網絡
三維U-net網絡主要由三維卷積、三維池化、三維反池化與三維殘差層構成,因此可以實現三維氣流組織溫度場的重構預測,其架構如圖3所示。該網絡架構主要分為兩部分,從輸入特征到U形底部之前為編碼部分,從U形底部之后到輸出預測結果為解碼部分。編碼部分從接收3個特征輸入圖開始,經過4次卷積以及池化的降維操作,將流場特征信息進行提取存儲。對輸入特征圖進行編碼后,再進行解碼過程,解碼過程除了卷積外,還加入了反池化與殘差,殘差網絡結構可以更好地利用編碼過程學習到的特征,同時對于訓練還可以有效抑制梯度爆炸問題。網絡最終的輸出即為單通道的溫度預測值矩陣。
3?結果分析與討論
利用6SigmaDC模擬產生的91組不同工況下氣流組織溫度場數據,采用交叉驗證策略進行多特征輸入三維U-net網絡的訓練,并針對不同的影響因素進行參數化研究。實際預測結果如圖4所示。經過91組數據的訓練,可成功得到三維溫度場的快速預測,并且誤差保持在較低水平。時間成本由原來的十幾個小時降低至秒級。
不通過學習率對預測結果的影響可以得出,學習率設置為0.03%時,訓練損失最低,預測結果最準確的。
4?結論
本文發展了一種基于多特征輸入的三維U-net神經網絡架構用于數據中心機房三維氣流組織溫度場快速重構,基于該機器學習方法的氣流組織溫度場重構技術很有希望應用于真實數據機房的快速預測與結構優化工程中。同時值得注意的是,在GPT(Generative Pre-training Transformer)炙手可熱的大環境下,人工智能算法層出不窮,今后的研究還可以利用更加強大的機器學習算法進一步提升模型的訓練速度與預測精度。
參考文獻
[1] DHAR V.Data science and prediction[J].Communications of the ACM,2013,56(12):64-73.
[2] BRUNTON S L,NOACK B R,KOUMOUTSAKOS P.Machine learning for fluid mechanics[J].Annual Review of Fluid Mechanics,2020,52:477-508.
[3] MAHESH B.Machine learning algorithms-a review[J].International Journal of Science and Research (IJSR)[Internet],2020,9(1):381-386.
[4] BRUNTON S L.Applying machine learning to study fluid mechanics[J].Acta Mechanica Sinica,2021,37(12):1718-1726.
[5] VINUESA R,BRUNTON S L.Enhancing computational fluid dynamics with machine learning[J].Nature Computational Science,2022,2(6):358-366.
[6] 李天一,萬敏平,陳十一.Gappy POD方法重構湍流數據的研究[J].力學學報, 2021,53(10):2703-2711.
[7] WEINAN E.The dawning of a new era in applied mathematics[J].Notices of the American Mathematical Society,2021,68(4):565-571.
[8] MALLAT S.Understanding deep convolutional networks[J].Philosophical Transactions of the Royal Society A: Mathematical,Physical and Engineering Sciences,2016,374(2065):20150203.
[9] HASEGAWA K,FUKAMI K,MURATA T,et al.CNN-LSTM based reduced order modeling of two-dimensional unsteady flows around a circular cylinder at different reynolds numbers[J].Fluid Dynamics Research,2020,52(6):065501.
[10] RIBEIRO M D,REHMAN A,AHMED S,et al.DeepCFD: efficient steady-state laminar flow approximation with deep convolutional neural networks[J].ArXiv Preprint,2020,2004:08826.