黃由立

摘 要 本文介紹采用TMP411配合CPU處理器和外圍系統實現對處理器芯片內核溫度與網絡設備內部溫度的測控,及過溫保護的研究和設計。設計并實現了整套系統電路,通過專業接口將TMP411與CPU及CPLD接口連接,實現監控處理芯片內核溫度和設備內部溫度,并通過連接必要數據通信線路和控制線路控制外部系統形成設備散熱自動調控及過溫自動保護系統。實現了在不同使用環境下,設備實時監控CPU處理器芯片內部核心的結溫與設備內部空氣溫度,一旦溫度高出就會自動報警并自動風扇調速加強散熱,極端過溫環境下能自動下電保護芯片及設備不受損壞的功能。
關鍵詞 TMP411 MIPS多核處理器 CPLD 溫度監控 過溫保護
中圖分類號:TN919文獻標識碼:A
0引言
隨著技術發展,MIP多核處理器的芯片主頻和性能不斷提升,導致相應的芯片功耗也越來越高。使用處理器的網絡設備用于多種不同的使用環境,容易出現在密閉機柜或散熱不良情況下,出現設備內部空氣過熱問題,導致CPU芯片內部核心溫度升得過高,超過芯片結溫上限后會導致芯片燒毀。而CPU處理器損壞整套網絡設備就癱瘓無法工作,市面上已經有多例的故障案例造成較高經濟損失。此情況下部分設備設計選擇用簡單的定速風扇散熱設計,風扇按照默認全速運行在常溫下有如下問題:風扇噪聲很大,超出國標的噪聲標準而無法通過認證、功耗較大消耗較多資源不夠綠色環保、在環境溫度升高變化后的彈性保護不足。因此急需設計實現一套系統方案能實時監控芯片內核溫度與設備內部溫度,基于溫度實現散熱系統既能滿足噪聲認證要求也能自動調整加強保護彈性,極端情況下還能自動下電保護避免芯片及設備出現物理損傷,具有較高實際意義和市場經濟價值。
1系統功能設計
溫度采集和自動散熱調整及下電保護裝置是本文的重點研究內容。溫度采集模塊用于實時收集CPU處理器芯片內核溫度和設備內部環境溫度,配合外部控制電路實現基于溫度的自動散熱能力調整及過溫自動下電保護功能。此功能需要解決如下問題:一個是需要滿足噪聲認證指標下的可自動調整的彈性散熱方案;另一個是極端環境CPU溫度過高的情況下避免CPU持續運行導致內部晶體管過溫擊穿燒壞的下電保護措施。
對于噪聲認證標準,國標的噪聲測試要求在25度的常溫環境下不超過40dB,此時風扇并不需要以最高的能力散熱,當CPU或設備內溫度升高到一定閾值的情況下,才開啟最高的散熱能力。因此設計風扇有兩個級別的散熱能力:一種是低溫低速,滿足噪聲指標并具有一定的散熱能力;一種是高溫高速,滿足最高的散熱指標。
對于CPU燒壞問題,直接的原因是CPU的溫度過高,一般CPU給出的最高內核結溫時105度,如果給予足夠的散熱能力CPU不至于燒毀,但是外部環境和散熱系統可能會變化,比如風道被堵、風扇損壞、散熱片未鎖緊、導熱硅脂老化失效等情況,不能只依靠被動散熱,需要一套主動的過溫保護方案,通過主動獲取CPU DIE的溫度,當溫度達到一定閾值后對CPU進行下電保護。
綜合以上功能,設計三個溫度點,THERM_A,THERM_B和THERM_C,設置THERM_A THERM_A:表示CPU溫度稍高,需要提升風扇散熱能力。 THERM_B:表示CPU溫度過高,需要高溫報警,提示用戶。 THERM_C:表示CPU溫度極高,超過CPU工作溫度,需要下電保護。 系統功能設計如下: (1)當CPU溫度未達到THERM_A溫度點,風扇低速運轉,無任何提示,系統正常運行。 (2)當CPU溫度超過THERM_A的時候,風扇自動切換高速運行,直到CPU溫度降低到THERM_A度之后風扇才變為低速。 (3)當CPU溫度達到THERM_B及以上的時候,設備發出一次高溫警告,記錄信息并提示客戶,系統紅燈告警。直到溫度低于THERM_B溫度的時候,才系統燈恢復綠色。 (4)當溫度達到THERM_C的時候,過溫保護,系統燈顯示紅色,切斷CPU的電源,直到CPU溫度降低到THERM_C-10度后才恢復上電,復位重啟。 2系統選型設計 2.1溫度檢測器件選型 根據溫度檢測需求選擇TMP411作為溫度檢測芯片。TMP411是德州儀器TI推出一款準確度在?℃范圍內的遠程結溫傳感器與本地溫度傳感器集成一體的器件,可用于同時監控CPU、微處理器中的熱敏二極管數據及自身本地溫度傳感器數據。 TMP411使用二極管測溫功能,測溫原理是基于二極管對溫度十分敏感的特性,溫度的變化將改變二極管壓降:溫度上升時管壓降減小;溫度下降時管壓降增加,同時二極管的溫度和壓降的線性度相當好,所以被用來進行測試要求精密的測溫。其能在-40℃~+125℃的溫度范圍內穩定工作,可測量溫度范圍則可高達 150℃,標稱溫度精度是+-1度。該器件不僅具備可編程串聯電阻抵消與二極管非理想性校正功能,而且支持標準 I2C/SM BUS 兼容的雙線接口上操作設置可編程過溫與欠溫閾值,以及對外設計有可對設置的閾值超標報警引腳,可對潛在危險散熱環境做出即時響應,靈活方便的實現溫度監控和過溫保護控制功能。 2.2系統硬件設計 系統硬件電路主要由CPU處理器,TPM411模塊,CPLD模塊,以及外圍配合的風扇二級調速模塊,DC-DC電源模塊,復位模塊,點燈控制模塊組成,系統連接如圖1所示。 CPU處理器模塊的內置熱敏二極管的管腳THERMAL_D+和THERMAL_D-連接TMP411的對應D+和D-管腳,利用二極管測溫原理實現CPU處理器內核的溫度檢測。CPU模塊通過I2C總線連接TMP411的SCL/SDA管腳作管理通道,實現對TMP411的初始化和設置,并可操作讀取溫度。I2C總線是OD門,需要1k到10k電阻上拉到3.3V,根據負載大小和信號實測調整確定。 TMP411模塊的THERM_2#和THERM#為溫度觸發信號,分別對應設定溫度THERM_A和THERM_C,THERM_A#表示超過設定的THERM_A溫度點,用于控制風扇轉速控制。THERM_C#表示超過設定的THERM_C溫度點,用于CPU高溫下電保護。這兩個管腳為OD門需通過4.7K~10K電阻上拉到3.3V連接到CPLD模塊。 CPLD模塊與CPU之間用數據總線交互,用于傳遞各模塊狀態信息,可訪問溫度相關的寄存器,數據線位寬設計為4bit連接。為控制風扇噪聲問題,CPLD通過風扇控制信號管腳連接風扇二級調速模塊,實現風扇高速和低速調整切換,溫度正常時風扇處于低速狀態滿足綠色環保噪聲要求,溫度超標再高速運行保證足夠散熱。CPLD的電源控制管腳連接到電源模塊,用于實現CPU過溫時必要的下電保護控制以及溫度降低恢復后的重新上電操作。為了保護芯片不受異常下電動作的損壞,通過CPLD連接控制復位信號到復位模塊,對整機復位電路進行控制,保護設備CPU及其他主要芯片。為了更加直觀展示過溫狀態并提醒用戶,因此連接CPLD與點燈模塊,在警告期間和過溫保護期間讓系統指示燈顯示紅色,正常狀態下顯示綠燈。 3系統軟件設計 3.1軟件操作流程 見圖2。 系統運行流程如下: (1)設備上電啟動并進入初始化,此時CPLD默認設置風扇高速運轉。 (2)軟件開始對TMP411溫度寄存器進行預設及必要的初始化。 (3)設置過溫溫度閾值,開啟過溫保護功能,之后就進入硬件執行流程:當溫度正常,保持正常工作。當CPU溫度極高,進入過溫保護狀態,CPU的core電源關閉,復位信號被拉低,系統燈變成紅色。直到溫度低于THERM_C-10度的時候還原,CPU電源上電,芯片進入復位重啟流程。 (4)設置風扇控制溫度,設置后風扇控制由TMP411的硬件信號THERM_A#電平決定。THERM_A#=1,則風扇低速運轉;THERM_A#=0,表示超過THERM_A設定溫度,則風扇高速運轉。 (5)主程序下開啟定時器中斷,通過定時軟件輪詢TMP411的寄存器:定時讀取CPU溫度,如果CPU溫度高則串口打印高溫報警,軟件控制系統狀態燈變成紅色,低于則退出中斷。 3.2實際應用測試 系統設置therm_A=60℃,therm_B=80℃,therm_C=100℃,實際對處理器進行加熱模擬環境變化,驗證風扇調速和保護結果: (1)設備啟動3~5s時間內風扇高速運轉,然后低速運轉 (2)設備運行過程中處理器結溫溫度<60℃,風扇低速運轉 (3)當60℃<處理器結溫溫度<80℃,風扇高速運轉 (4)當80℃<處理器結溫溫度<100℃,風扇高速運轉,設備告警,系統燈亮紅色 (5)當100℃<處理器結溫溫度,風扇高速運轉,關閉處理電源,進入保護狀態,處理溫度降低后重新進入步驟1)重新啟動。 實際驗證確認該系統具備自動風扇調速,能良好保護處理器不被過溫擊穿。 4結論 處理器芯片主頻和功耗不斷提升,但芯片主要材質還是硅,無法承受高溫。但是應用處理器的網絡設備卻需要適應高溫的使用環境,同時還需要符合國標的相關認證標準。本文通過設計實現硬件平臺電路配合軟件系統實現基于處理器結溫的網絡設備自動散熱調整和過溫保護的功能。經驗證結果表明網絡設備使用本系統能完全符合國標認證噪聲標準,同時具備良好的散熱彈性調節,在極端情況能及時下電保護設備,滿足設計要求,可以在許多場合進行廣泛應用。 參考文獻 [1]湯鍇杰,栗燦,王迪等.基于DS18B20 的數字式溫度采集報警系統設計[J].傳感器與微系統,2014,33(03):99-102. [2]牛剛.熱電偶測溫的原理與應用[J].華東科技:學術版,2012(12):3. [3]羅繼軍.AltiumDesigner在PCB 板設計中的應用[J].科技展望,2016,26(29):117-118. [4]潘曉妮.單片機溫度檢測控制系統[J].中國科技信息,2019(05):54-55. [5]劉旭娟,梁嘉浩,孫濤,馬歡港,陳壯.汽車車室智能溫度檢測與調控裝置的設計[J].南方論壇,2019,7(01):44-67. [6]范寒柏,謝漢華.基于NTC 熱敏電阻的三種高精度測溫系統研究[J].傳感技術學報,2010,23(11):1576-1579.