摘要:為解決芯片在不同溫度下性能變化導致的可靠性問題以及相關系統在不同溫度下的穩定性問題,對芯片寬溫測試進行研究,在測試芯片選擇上提出通過芯片漏電流分布進行篩選,并覆蓋工藝偏差導致的工藝角芯片,提升了不同性能芯片的覆蓋面;軟件策略以不同溫度的固定頻率下最小可運行電壓(Vmin)及固定電壓下最大可運行頻率(Fmax)為參考數據進行頻率電壓分檔,保證系統穩定的同時兼顧常溫功耗最優;測試方案上通過增加終端用戶寬溫使用場景來設計測試用例,更加貼合產品化需求;在測試前后對Fmax/Vmin/功耗/漏電流/功能等芯片電氣特性進行跟蹤,有效地為芯片可靠性評估提供數據支撐。
關鍵詞:芯片;寬溫測試;可靠性;穩定性
中圖分類號:TN407 文獻標識碼:A
0 引言
芯片寬溫測試是指在不同溫度條件下對芯片進行測試驗證,以確保芯片及相關系統在極端條件下穩定運行,相較于消費級產品,芯片需要更嚴格的溫度條件及測試標準。隨著技術的發展,寬溫芯片的應用越來越廣泛,尤其在汽車、航天、工業、電力等領域,不同領域也對芯片工作的環境溫度范圍進行了標準化規范。例如,汽車電子委員會標準AEC-Q100將溫度范圍分為5個等級:級別 0為-40~150℃;級別 1為-40~125℃;級別 2為-40~105℃;級別 3為-40~85℃;級別 4為0~70℃;同時,對芯片可靠性也提出了明確的要求,如高溫工作壽命(high temperature operating life,HTOL)、高溫存儲壽命(high temperature storage life,HTST)、溫度循環(temperature cycling,TC)等[1],但缺乏產品應用端的驗證及測試過程中電氣特性的跟蹤。本文結合用戶場景對芯片進行測試,保證終端產品在寬溫環境下的穩定運行,同時通過對電氣參數、物理特性以及功耗變化進行數據分析,制定更全面的測試方案,規范硬件方案及軟件策略,提升了寬溫測試的全面性及有效性。此外,本文基于聯合電子設備工程委員會(Joint Electron Device Engineering Council,JEDEC)標準,優化了寬溫芯片及相關軟件系統穩定性和芯片特性變化等驗證方法[2-3]。
1 芯片與硬件選擇
由于制造工藝偏差可導致芯片個體差異,寬溫測試需要盡可能覆蓋不同性能的芯片,印制線路板(printed circuit board,PCB)上的其他器件也需要符合寬溫測試溫度范圍。由于高低溫下芯片性能及電氣特性會發生變化,軟件策略也需要根據這些變化進行調整。
1.1 芯片選擇
本文根據漏電流(leakage)分布對芯片進行篩選,TT(typical NMOS,typical PMOS)芯片是至少覆蓋正態分布2個標準差的芯片,在芯片選擇上還需要覆蓋其他4種工藝角類型:FF(fast NMOS,fast PMOS)、SS(slow NMOS,slow PMOS)、FS(fast NMOS,slow PMOS)、SF(slow NMOS,fast PMOS),并且根據測試數量均勻分布;在測試之前對測試芯片進行最小可運行電壓(Vmin)、最大可運行頻率(Fmax)、功耗、leakage、功能等基礎信息進行收集,便于在測試過程及測試結束后比較相關數據,判斷測試結果。
1.2 硬件選擇
根據測試溫度范圍進行硬件選擇,如-40~85℃,測試硬件需要根據這個溫度范圍進行其他器件選擇,主要影響器件包括雙倍速率同步動態隨機存取存儲器(double data rate synchronous dynamic random access memory,DDR SDRAM/DDR)、內嵌式存儲器(embedded multi media card,eMMC)、晶振等;高性能芯片在高溫、高負載的情況下,需根據產品特性選擇加散熱片并約束客戶散熱行為。
2 軟件方案
芯片在高低溫下電氣特性會發生變化,如低溫下需要的Vmin會更大;高溫下功耗會逐步增大,芯片溫升變大,軟件需要保證其在高溫情況下工作性能正常,這可以通過主動降頻、降壓處理,以防止芯片溫度過高導致觸發過溫機制和壽命損耗。
2.1 頻率電壓
在高低溫下,需要對不同性能芯片的Vmin進行測試,覆蓋工藝角芯片,基于Vmin數據,軟件方案可以進行對應抬壓或降頻。由于在低溫下,溫升不是重要因素,建議最低電壓不低于集成電路(integrated circuit,IC)設計的標準驗證電壓(singoff電壓);在高溫下,溫升和功耗指標較為重要,不能通過抬壓來保證穩定性,因此可選擇降頻方案,但需要考慮產品端高溫條件的性能需求[3]。
2.2 軟件策略
根據Vmin的測試數據,寬溫軟件策略是在低溫時抬壓,主要考慮中央處理器(central processing unit,CPU)/圖形處理器(graphics processing unit,GPU)/DDR/神經網絡處理單元(neural processing unit,NPU)/邏輯電路等主要穩定性相關電源域,最低電壓需高于IC設計的singoff電壓,溫度閾值需根據每個溫度點Vmin數據來選擇。例如,當芯片溫度傳感器檢測的溫度低于0℃時開始抬壓,高于0℃后則恢復至常溫所使用的頻率電壓;高溫下啟用溫控策略,在保證產品端高溫性能需求的同時進行線性降頻,并保證芯片不過溫;高溫下DDR/eMMC等相關電子器件也存在穩定性變化,需要根據JEDEC標準進行軟件調整,如高溫下抬高DDR刷新率。
3 測試方案
結合產品化場景,對芯片進行存儲、冷熱循環、定值運行、功能檢查等測試,根據測試結果來判斷芯片在高低溫環境下使用的穩定性;在測試過程中同步跟蹤芯片電氣特性變化,根據電氣性能變化幅度判斷芯片是否出現可靠性異常。本文以AEC-Q100級別3:-40~85℃為例,進行相關測試。
3.1 高低溫存儲測試
(1)目的:驗證芯片/設備在-40℃和85℃環境下長時間儲藏后,芯片/設備的各項功能是否正常。
(2)測試用例:不上電,芯片/設備閑置在高低溫環境下,高低溫存儲測試方案如表1所示。
(3)測試結果判斷:測試前進行芯片系統級測試(system level test,SLT),測試結束后復測SLT,判斷功能是否正常。
3.2 冷熱沖擊測試
(1)目的:驗證芯片及相關軟件系統應變的穩定性。
(2)測試用例:視頻循環播放+變頻變壓,冷熱沖擊測試方案如表2所示。
(3)測試結果判斷:測試過程是否出現死機、重啟或其他功能模塊異常等情況。
3.3 冷熱循環測試
(1)目的:驗證芯片及相關軟件系統在溫度循環下運行是否穩定。
(2)測試用例:上下電(芯片及系統啟動)、50%負載+變頻變壓、用戶典型場景,冷熱循環測試方案如表3所示。
(3)測試結果判斷:測試過程是否出現死機、重啟或其他功能模塊異常等情況。
3.4 高低溫定值運行測試
(1)目的:驗證產品在-40℃和85℃環境溫度下長時間運行是否正常。
(2)測試用例:上下電、變頻變壓、高負載、低負載、用戶典型場景、安卓系統(Android系統)自動化測試,高低溫定值運行場景用例如表4所示。
(3)測試結果判斷:設備正常運行,在反復壓力測試過程中未出現死機、重啟或其他異常。
3.5 高低溫功能性驗證
高低溫功能性驗證是指驗證芯片/設備在-40℃和85℃環境下,各功能模塊是否正常。從芯片角度出發,使用三溫機臺進行溫度調節,使用芯片測試座/插座(Socket測試板)針對不同性能芯片進行SLT功能檢驗;從系統角度出發,根據芯片數據手冊(datasheet)及硬件設計的板級功能設計測試用例,在規定溫度下進行功能性驗證,如MIPI/USB/TypeC/PCIE/HDMI/Wi-Fi/BT/以太網/Uart/耳機/TF卡/Camera等。
4 電氣特性跟蹤
溫度對芯片可靠性的影響較為顯著。在高溫條件下,芯片可能會遇到熱應力問題,導致芯片內部的物理結構發生變化,如熱膨脹和熱疲勞,從而影響其性能和壽命。低溫則可能影響材料的電氣特性,如電阻率和介電常數,這可能會改變芯片的操作特性和功耗。
跟蹤寬溫測試過程中的芯片電氣特性變化是判斷芯片可靠性及壽命的重要指標,通過分析該指標能夠及時發現早期失效的芯片或芯片設計缺陷,重點跟蹤Vmin、Fmax、leakage、功耗、功能等指標數據(表5),并將其作為JEDEC測試中HTOL、HTST、TC等可靠性測試補充數據,用于評估芯片壽命[1]。
5 結語
本文在遵循JEDEC標準的基礎上,對測試芯片的選擇進行了規范,要求覆蓋不同性能的芯片用于測試,提升了寬溫測試的全面性。在軟件方案制定上,根據芯片在不同溫度下的Vmin、Fmax等性能數據,測試軟件進行頻率和電壓分檔,進一步提升軟件方案的穩定性。在測試用例選擇上,根據用戶場景制定測試方案,在保證芯片可靠性的同時,確保用戶在溫度范圍內能穩定使用相關系統,優化了寬溫測試的有效性和產品化需求。在寬溫測試前后,進行芯片電氣特性的跟蹤,通過對比Vmin、Fmax、leakage、功耗、功能等數據,來評估芯片在寬溫測試前后的可靠性及性能變化。
參考文獻
[1] 任艷,周圣澤,王之哲,等. AEC-Q100 H版標準規范解讀[J].電子產品可靠性與環境試驗,2022,40(增刊1):112-115.
[2] 孔憲偉,李秦華.集成電路測試與標準化領域研究綜述[J].信息技術與標準化,2023(7):39-43.
[3] 湯朔,李錕.集成電路國際標準分析[J].中國標準化,2021(增刊1):170-177.