曾樂業,李翔
(1. 北京星網船電科技有限公司 湖南分公司,長沙 410006; 2. 電子科技大學 航空航天學院,成都 611731)
軍用加固計算機是指控系統的核心,是戰場指揮管理和武器控制的重要工具。隨著電子集成技術的發展,其向著多功能、高密度、高功率方向發展,由此帶來計算機的熱流密度不斷提高。為滿足復雜惡劣戰場環境下可靠性要求,對芯片的散熱提出了更高要求[1]。熱設計的目的是控制電子設備內部所有電子元器件的溫度,使其在設備所處的工作環境條件下不超過規定的最高允許溫度[2]。
熱管是傳熱領域在20 世紀最重要的發明之一,它利用工質的相變潛熱進行熱量傳遞。相比固體熱傳導,單位質量的熱管可多傳遞幾個數量級的熱量,且具有更優的等溫性、快速的熱響應性及可變換熱流密度的功能[3-5]。熱管的傳熱特性、長壽命及可靠性使其廣泛應用于機載、艦載等電子設備的熱控制。
文中以某軍用加固計算機的散熱冷卻為背景,研制了一種低熱阻結構的熱管冷板,進行了不同熱流密度下的常溫與高溫試驗,并與原結構熱管冷板在相同工況下進行了對比研究,以期為該新型結構的熱管冷板的實際應用奠定基礎。
加固計算機是基于CPCI 總線的標準19 英寸6U密封機箱,內裝模塊是6U CPCI 加固模塊。其中主板模塊寬度為4 HP,其主要芯片CPU 與GPU 的總熱設計功耗大于65 W。原主板模塊冷板采用經黑色陽極氧化的鋁合金,并在表面嵌入熱管構成,熱管采用導熱膠粘接,如圖1 所示。整機進行高溫+55 ℃試驗時, CPU 與GPU 溫度過高,甚至接近閥值。GJB 6603—2008 中6.1.2 款“模塊的功耗”規定了插件寬度為4 HP的模塊單件功耗不宜超過40 W[6],插件寬度為8 HP的模塊單件功耗不宜超過70 W[6]。因此,主板模塊的熱設計功耗超過了GJB 6603 的要求,原冷板難以滿足芯片及整機的可靠性要求[7]。

圖1 計算機與原冷板結構Fig.1 Structure of computer and the original cold plate
由于機箱為密封無風扇結構,熱傳導為主要傳熱方式,主板熱源芯片的傳熱可采用圖2 所示的熱阻網絡模擬[8]。

圖2 主板模塊傳導冷卻熱阻網絡Fig.2 Motherboard module conduction cooled thermal resistance network
芯片結溫Tj可表示為:

式中:Φ 為芯片耗散的熱量;Rs為總熱阻。根據熱阻網絡,Rs可表示為:

在主板功耗確定情況下,對原結構冷板進行優化設計時,只有從降低總熱阻Rs著手。當機箱散熱方式及冷板鎖緊機構方式確定后,采取降低模塊結構熱阻Rm及降低各界面接觸熱阻成為最有效途徑。文獻[9]介紹了一種測量板間接觸熱阻的新方法,文獻[10]采用有限元數值計算方法得到了接觸熱阻的近似計算公式,可表示為:

式中:hy為表面粗糙度;λ1、λ2、λ3為接觸面材料及間隙物導熱系數;k1、k2、k3為接觸面系數。
熱設計的原則就是自芯片至耗散環境之間,構建一條熱阻盡可能低的熱流路徑[4]。通過傳熱分析,新型冷板結構應盡可能降低模塊傳導熱阻Rm及各界面接觸熱阻Rt。與原冷板不同之處在于,新型冷板設計了CPU 與GPU 熱管模組,熱管模組采用熱管與紫銅塊焊接而成。將其蒸發段替代原紫銅塊與芯片接觸,其冷凝段為銅導軌,通過楔塊鎖緊機構與機箱壁搭接。利用熱管相變傳熱特性來降低Rm,將CPU 與GPU 的熱量以低熱阻路徑快速傳導至機箱上下側壁,如圖3 所示。為了降低各界面接觸熱阻Rt,采用高導熱系數的紫銅導軌及低溫焊錫膏替代鋁導軌及導熱膠,其中錫膏導熱系數達到50 W/(m·K),遠大于一般的熱界面材料(TIM)。

圖3 新型冷板結構與裝配圖Fig.3 Structure and assembly drawing of new cold plate
為了驗證新型冷板的傳熱性能,對改進前后兩種冷板進行了常溫及高溫試驗。將兩種冷板構成的單板測試平臺及加固計算機分別置于試驗環境中。試驗過程中,通過測試程序加載主板功耗,對比冷板在30 W及65 W 熱功耗情況下的傳熱性能。
試驗裝置由單板測試平臺、加固計算機、功率計、TP-700 多路數據記錄儀、K 型熱電偶、溫度試驗箱及軟件測試平臺等組成,測點及芯片結溫分別由數據記錄儀及監控軟件自動采集。試驗及測試程序按照既定的步驟進行:將熱電偶用導熱膠粘接主板、冷板及機箱測試點,搭載測試平臺(單板或整機)。高溫試驗需按照GJB 150.3A 中試驗方法將單板或整機進行保溫熱浸,觀察數據記錄儀及監控軟件在初始功耗(30 W)的溫度曲線,待溫度曲線平直后,通過測試程序Burin Test 加載功耗至65 W,直至各測點溫度再次達到穩態。
常溫試驗環境溫度為+23 ℃,兩種結構的熱管冷板在30 W 及65 W 兩種不同熱流密度下的單板及整機啟動性能及穩態性能如圖4 所示。圖中新型結構冷板芯片溫度以CPU+及GPU+表示,穩態溫度數據對比見表1。
由圖4 及表1 結果分析可知,當主板功耗為30 W時,由于CPU 為主要發熱芯片,單板及整機狀態下兩種冷板GPU 溫度達到穩定后基本相同,CPU 溫度分別下降了7.4 ℃及4.5 ℃。測試程序加載功耗到65 W 時(時間軸45 min 位置),即CPU 及GPU 均達到滿負荷工作,單板試驗中新型結構冷板使CPU 及GPU 溫度分別降低了14.3 ℃及5.4 ℃,而整機試驗中分別降低了7.2 ℃及6.1 ℃。

圖4 常溫試驗溫度響應對比Fig.4 Temperature response of normal temperature test: a) single chip; b) whole machine chip

表1 常溫試驗主板芯片穩態溫度Tab.1 Motherboard chip steady temperature in normal temperature test ℃
對于新型結構熱管冷板,由于其熱管模組采用焊錫膏焊接而成,極大地降低了界面熱阻。單板試驗時,熱量通過自然對流與輻射散發至熱沉,故CPU 及GPU 溫差極小,CPU+及GPU+曲線基本重合。整機試驗時,由于熱管模組的冷凝段作為導軌,與機殼上下內壁搭接,構建了由熱源至機殼的最短傳熱路徑,當主板功耗為65 W 時,改善效果非常顯著。
由于采用原結構冷板的加固計算機在高溫+55 ℃環境試驗過程中滿負載運行時出現高溫過載,需對優化設計后的熱管冷板在高溫環境下的傳熱性能進行驗證。試驗過程中,同樣加載主板功耗至65 W,兩種結構的熱管冷板在不同熱流密度下的單板及整機啟動性能及穩態性能如圖5 所示,高溫芯片的穩態溫度數據對比見表2。

圖5 高溫整機芯片溫度響應對比Fig.5 Temperature response of high temperature test: a) single chip; b) whole machine chip

表2 高溫試驗主板芯片穩態溫度Tab.2 Motherboard chip steady temperature in high temperature test ℃
由圖5 及表2 結果分析并對比常溫試驗響應曲線,高溫試驗時,新型結構熱管冷板響應特性與常溫相同。當主板功耗為30 W 時,單板及整機CPU 溫度分別下降了7.2 ℃及9.4 ℃;將主板功耗加載到65 W,單板試驗中新型結構冷板使CPU 及GPU 溫度分別降低了10.2 ℃及4.2 ℃,而整機試驗中分別降低了9.1 ℃及7.5 ℃。
由表2 可知,原冷板在單板滿負載運行時,CPU結溫為100.5 ℃,而在整機試驗時已達到105.1 ℃,已接近芯片的允許結溫,會影響芯片壽命及產品的可靠性。對于半導體器件,溫度每升高10 ℃,其可靠性將會降低50%,采用優化設計后的熱管冷板能明顯地提高芯片工作壽命及整機可靠性。
對改進前后的熱管冷板進行了常溫與高溫試驗研究,并考察了不同熱流密度下冷板的傳熱特性,試驗得出以下結論:
1)采用熱阻網絡模型對芯片散熱進行傳熱分析,通過降低模塊傳導熱阻及界面接觸熱阻,冷板傳熱特性得到改善。
2)當主板熱流密度達到最大負荷運行時,原結構冷板已不能滿足高溫試驗要求。改進后的熱管冷板使CPU 及GPU 溫度在極限工況下分別下降了9.1 ℃及7.5 ℃,有效解決了高溫高熱流密度狀態下散熱問題,提高了整機環境適應性和可靠性。
該熱管冷板結構設計方法可應用于采用CPCI、CPEX 及VPX 等總線架構的加固計算機產品中,對其他電子設備散熱設計也有較好的借鑒作用。