袁瑞明,章鋼,余劍宇,侍書成,張裕,賴學華
(中國電子科技集團第五十二研究所,杭州 311100)
隨著商用服務器性能和集成化程度越來越高,相關電子元器件散熱問題變得越來越突出[1]。因此,合理的服務器散熱設計對其能夠高效穩定的運行至關重要。目前,絕大部分服務器設備采用強迫風冷冷卻技術[2,3],而風冷系統的核心部分為風機和散熱器。強迫風冷冷卻技術雖然已經被廣泛應用于服務器散熱設計中,但如何優化風機和散熱器,提高服務器的散熱能力,依然是值得深入研究的課題。
近年來,關于風機性能研究主要集中在風機串并聯[4]、風機安裝方式[5,6]、風機結構參數[7-9]以及風道尺寸[10]方面的研究。文獻[4]研究了風機串并聯對電子設備散熱的影響,研究表明,系統的散熱性能與風機的排布形式有關,當系統風阻較大時,串聯風機應用能起到明顯的降溫作用。文獻[5]研究了風機距離蜂窩板的距離對風機散熱特性的影響,研究表明散熱風機與蜂窩板之間間距越小,風機的散熱性能越好。文獻[6]研究了風機中心與散熱中心的偏移程度對整機流場及散熱特性的影響。文獻[7]研究了不同風腔厚度對風冷系統散熱特性的影響,研究表明風腔厚度過小,風機性能受到明顯抑制,隨著風機厚度增大,風腔性能會隨之提升,當風腔厚度增大一定值時,再增加厚度,風機性能會隨之降低。文獻[8]研究了不同風機出口形狀對風機性能的研究,研究表明橢圓形支撐架較之方形和圓柱形支架,風機尾跡區內氣流流動明顯更加均勻,能量損失較小;文獻[9]研究了葉片安裝角、葉片高度、葉片數和轉速等因素對軸流風扇性能的影響,基于組合優化策略以多工作點平均流量系數最大為目標函數對多參數結構風扇進行快速優化,找到風扇的最佳設計安裝,將所設計的8025 軸流風扇性能提升14.5 %。文獻[10]研究了在不同進風口寬度以及不同風道寬度工況對整機散熱特性的影響。研究表明當風機內徑為D 時,進風口寬度一般為(1~1.2)D,長度方向上則選取風道的最外邊長度。
本文不同于以往單一風扇以及全速工況下性能的研究,而實際服務器是使用過程中,往往會考慮噪音要求,內部不同類型的風機往往不是全速狀態,基于這一背景,本文研究了服務器設備中不同類型風機耦合的情況對整機散熱特性影響的研究,同時考慮風扇不同旋轉特性對整機散熱特性影響的研究。
本文所研究的服務器設備為國產S2500 雙路高性能服務器,該設備研發過程中優先選用經過考驗、驗證,技術成熟的設計方案,充分考慮設計的繼承性。設備在設計過程中充分考慮降額設計、簡化設計、冗余設計、環境防護設計、電路防護設計和減震緩沖設計等。設備的平均失效間隔工作時間MTBF ≥10 000 h。設備為外形尺寸為736 mm×447 mm×87 mm,其中主控模塊主要發熱芯片包括2 個S2500 CPU 芯片和2 個8764 橋片,仿真模型示意圖如圖1 所示。
圖1 服務器設備仿真模型示意圖
本次研究的服務器中包含2 種風機,分別為系統風機和CPU 散熱器風機,系統風機尺寸為60 mm×60 mm×38 mm,CPU 散熱器風機尺寸為60 mm×60 mm×25 mm。圖2 展示了2 種風機的P-Q 曲線,從曲線中可知:系統風機風量范圍為(0~56.2)cfm,對應的風壓范圍為(43.9~0)mmH2O,CPU 散熱器風機風量范圍為(0~38.5)cfm,對應的風壓范圍為(13.2~0)mmH2O。
圖2 系統風機和CPU 散熱器風機P-Q 線
圖3(a)展示了本文所研究的服務器設備溫度測試實驗模型,實驗模型與計算模型配置一致。芯片表面布置測溫熱電偶,用于測量芯片表面溫度,本文選用的熱電偶為T 型熱電偶,測量范圍為(-40~350)℃,測溫精度為±1 ℃。本次實驗測試使用Fluke 多通道數據采集器,這是一種適應于測試要求的通用儀器,儀器的后部可以擴張多個 60 通道插槽,通過網線連接互相傳輸信號。通過多通道記錄儀可以把需要的溫度以數字的形式顯示出來。圖3(b)展示了本文所研究的服務器設備功耗測試實驗模型,芯片功耗測試需要針對芯片每種電壓,分別進行電流檢測,通過示波器獲取電流的數值進行統計計算,分別對每組電流電壓進行功耗計算,得出最終芯片總功耗。本文研究的服務器設備S2500 和8764 芯片功耗分別為136 W 和15.6 W。
圖3 服務器設備溫度和功耗測試圖
服務器設備工作溫度一般為(0~40)℃,為了使設備滿足高溫要求,服務器選用耐高溫、耐低溫、熱穩定性好的元器件和材料,機殼采用導熱良好的金屬材料,同時針對每個發熱芯片,單獨設計滿足芯片功耗的散熱器,保證設備滿足高溫散熱要求。表1 展示環境溫度40 ℃,系統風機轉速Q1為12 000 rpm,CPU 散熱器風機轉速Q2為8 000 rpm 時,主板模塊各芯片仿真和實測數據對比。從表中可以看出高溫40 ℃環境下,各芯片溫度均在許用節溫內(S2500 許用節溫90 ℃、8764 許用節溫105 ℃),留有較為充足的設計余量,滿足環境適應性要求,且實驗數據和仿真數據接近,誤差最大的為芯片8764-1,兩者之間的誤差為3 %,表明仿真數據真實可靠,為后面的結果討論提供數據支撐。
表1 環境溫度40 ℃仿真與實驗各芯片數據對比
圖4展示了環境溫度25 ℃,CPU 散熱風機轉速Q2為6 000 rpm 時,在系統風機不同旋轉方向(順時針和逆時針旋轉)下,服務器設備內各發熱芯片節點溫度隨系統風機轉速Q1關系圖。從圖4(a)可以看出:當系統風機為順時針旋轉時,設備內各發熱芯片節點溫度隨系統風機轉速的提高而降低;不同系統風機轉速下,S2500-2節點溫度都略低于S2500-1 節點溫度,而8764-2 節點溫度要明顯低于8764-2 節點溫度;而從圖4(b)可以看出:當系統風機為逆時針旋轉時,S2500-1 和S2500-2溫度分布同系統風機為順時針旋轉一致,而8764-1 和8764-2 節點溫度幾乎一致,完全不同于系統風機為順時針旋轉時的溫度分布。由此可知,當芯片靠近風機布置時,風機的旋轉方向對芯片節溫影響不大,而當芯片遠離風機布置時,風機的旋轉方向對芯片節溫產生很大影響。
圖4 不同風機旋向下服務器內芯片節點溫度隨轉速關系圖
圖5展示了系統風機不同旋轉方向下,服務器設備內同種各發熱芯片節點溫度隨系統轉速Q1關系圖。從圖5(a)和(b)可以看出,當芯片靠近系統風機布置時,S2500-1 和S2500-2 節點溫度在系統風機低轉速時,系統風機旋轉方向對芯片節點溫度影響不大,當系統風機處于高轉速時,順時針旋轉下的芯片節點溫度要略低于逆時針旋轉下的芯片節點溫度。從圖5(c)和(d)可以看出,當芯片遠離系統風機布置時,系統風機旋轉方向對芯片節點溫度影響很大,順時針旋轉下的8764-1 節點溫度溫要高于逆時針旋轉下的節點溫度,而順時針旋轉下的8764-2 節點溫度要低于逆時針旋轉下的節點溫度。由此可以,當芯片遠離風機布置,尤其是芯片靠板邊布置時,要充分考慮風機的旋轉方向對芯片節點溫度的影響。
圖5 不同轉速下風機旋轉方向對芯片節點溫度影響圖
圖6(a)展示環境溫度25 ℃,系統風機和CPU 散熱器風機轉速互為4 000 rpm 和6 000 rpm 兩種工況下,服務器設備內各發熱芯片節點溫度分布。從圖中可以看出當設備處于工況1 時,S2500-1 和S2500-2 節點溫度分別為73 ℃和70.1 ℃,略高于工況2 下S2500-1 和S2500-2 節點溫度(72.2 ℃和69.5 ℃),兩者工況下的芯片節溫均低于S2500 芯片許用節溫90 ℃。而工況1 下的8764-1 和8764-2 節點溫度分68 ℃和61.5 ℃,低于工況2 下8764-1 和8764-2 節點溫度(75.9 ℃和69.9 ℃),兩者工況下的芯片節溫也均低于8764 芯片許用節溫110 ℃。即2 種工況下,設備均可以安全穩定運行。但在這兩種工況下,設備噪音卻不一樣,設備噪音測試方法如圖6(b)所示,即測試設備前、后、左、右、上五個方向,測試點距離設備中心1 m,取五個方向機器穩定運行下的最大噪音。設備在工況1 下運行,設備噪音為65.8 dB,而設備在工況2 下運行下,設備噪音僅為58.9 dB。由此可知,在兼顧考慮整機散熱和噪音指標時,需要合理設置系統風機和CPU 散熱器風機轉速,尤其是對CPU 散熱風機轉速的控制。文中研究表明,當系統風扇轉速較低,CPU 散熱風機轉速較高時,不僅整機噪音更低,CPU 芯片(S2500-1&S2500-2)散熱性能也更優。
圖6 風機旋轉方向對芯片節點溫度及整機噪音測試圖
圖7展示了在相同外形尺寸下,設計2 款CPU 散熱器,分別為CPU 散熱器(新增風機)和CPU 散熱器(拉長翅片),用于對比研究有無CPU 散熱器風機對CPU 散熱影響。圖8 展示了環境溫度為25 ℃,CPU 散熱器風機轉速為6 000 rpm 時,CPU 散熱器(新增風機)和CPU 散熱器(拉長翅片)兩種工況下S2500-1 節點溫度在不同系統風機轉速下的分布情況。從圖中可以看出:相同系統風機轉速下,相比較CPU 散熱器(拉長翅片),CPU 散熱器(新增風機)下的芯片節點溫度要更低;當Q1=4 000 rpm 時,CPU 散熱器(拉長翅片)和CPU 散熱器(新增風機)下S2500-1 節點溫度Tj分別為85.6 ℃和72.2℃,節點溫度降幅Tj%為18.6 %,而當Q1=12 000 rpm,兩者對應的節點溫度Tj分別為64.7 ℃和64.6 ℃,Tj%僅為0.15 %,即相比CPU 散熱器(拉長翅片),CPU 散熱器(新增風機)下的CPU 節點溫度降幅Tj%隨Q1的提高而減小。
圖7 相同外形尺寸下兩款CPU 散熱器示意圖
圖8 兩款CPU 散熱器下S2500-1 節點溫度隨系統風機轉速影響圖
本文利用熱仿真軟件,研究了系統風機旋轉特性對整機散熱影響、系統和CPU 散熱器風機轉速對整機散熱及噪音影響、以及有無CPU 散熱風機對CPU 散熱影響。通過這些研究得出以下結論,這些結論對優化服務器散熱和噪音設計具有指導意義。
1)設備內各發熱芯片節點溫度隨系統風機轉速的提高而降低。當芯片靠近風機布置時,風機的旋轉方向對芯片節溫影響不大,而當芯片遠離風機布置時,風機的旋轉方向對芯片節溫產生很大影響。尤其是芯片靠板邊布置時,要充分考慮風機的旋轉方向對芯片節溫的影響。
2)在兼顧考慮整機散熱和噪音指標時,需要合理設置系統風機和CPU 散熱器風機轉速,尤其是對CPU 散熱風機轉速的控制。文中研究表明,當系統風扇轉速較低,CPU 散熱風機轉速較高時,不僅整機噪音更低,CPU 芯片(S2500-1&S2500-2)散熱性能也更優。
3)在相同外形尺寸和系統風機轉速下,相比于CPU 散熱器(拉長翅片),CPU 散熱器(新增風機)所對應的CPU 節點溫度要更低,但隨著系統風機轉速的提高,CPU 散熱器風機對芯片節點溫度的影響逐漸減小。