曾慶鍇,崔帥,陸宇歷,衡婷,張逸凡,張愛麗
(1.中科院微小衛星創新研究院,上海 201203; 2.上海復旦微電子集團股份有限公司,上海 201203)
隨著微電子技術的發展,單個集成電路的功能越來越強大,與之伴隨的是對外引腳密度的要求越來越高。其中,外引線呈面陣式排列的球柵陣列(BGA, Ball Grid Array)封裝結構在引腳超細間距指標上具有極大的優勢[1]。然而,由于焊球高度所限,元器件與印制板間距較小,BGA在長壽命、極端溫度應力、惡劣機械應力等應用環境下存在風險[2]。為滿足軍用、宇航等高可靠應用場景,柱柵陣列(CGA, Column Grid Array)作為一種加強型BGA封裝隨之產生。CGA采用焊柱作為外引線,有效提高了物理高度,使外引線具有更好的柔韌性。相比于BGA封裝,CGA封裝在散熱和焊點疲勞等技術問題上做出有效的優化,成為高可靠領域的理想方案[3]。
本文對型號研制過程中某CGA封裝集成電路的失效案例進行了電性分析、材料分析和故障復現驗證。試驗結果表明非密封型金屬-陶瓷封裝結構會發生與塑封器件類似的popcorn效應從而導致器件失效。通過本案例的分析,為加強器件固有可靠性和電裝質量提供了思路。
上海微小衛星工程中心承研的某批產衛星M9、M10單機在地面整機測試階段,發現某型號規格FPGA器件執行回讀刷新功能時報回讀錯誤,除回讀錯誤外其它系統功能正常。發生回讀錯誤的器件分別位于M9單機2號位置(下文簡稱“M9_#2”)和M10單機1號位置(下文簡稱“M10_#1”),并確認兩只問題器件為同一批次產品。
經定位,回讀異常區域在die左上角接近IO bank5位置,回讀錯誤發生在相同位線(BL_580)。針對M9_#2和M10_#1的FPGA中回讀錯誤的位,測試CLB中邏輯功能,回讀失效區域。通過對涉及的CLB模塊進行測試,發現M9_#2最左邊第一個CLB、M10_#1最左邊兩個CLB在實現配置SRAM寫0功能時輸出異常,如圖1所示。
圖1 回讀異常區域所在die物理位置示意圖
從芯片測試定位到同一位線上的所有配置SRAM讀錯誤,以及該讀錯區域部分SRAM輸出控制功能錯誤,判斷局部故障SRAM區域發生寫讀錯誤,初步判斷位線存在弱上拉到電源的情況,SRAM內部電路可能存在異常。因系統板上供給電源測試正常,以及電源阻抗測試,除2.5 V電源存在異常外,其他電源測試正常,初步判斷排除SRAM供電電源問題,另因未出現同一字線上的SRAM讀寫錯誤,所以排除SRAM字線異常。現場分析故障樹如圖2所示,灰色框為已排除事件。
對現場故障定位后的失效樣品進行解焊和鏟柱處理,通過ATE機臺進行出廠功能性能測試分析。測試報錯結果詳細信息如表1、表2所示。
圖2 現場分析故障樹
通過表1、表2對比可知,兩只失效樣品存在VCCO_5靜電電流、bank5區域的直流參數、配置功能失效等相同錯誤,與此同時M10_#1樣品還存在bank9區域參數、IO功能失效等錯誤。從而說明M10_#1樣品報錯區域大于M9_#2樣品。
通過酒精浸泡使導熱膠變軟的方法去除失效樣品的頂部散熱片。然后分別對die區域進行微光顯微鏡(EMMI)和超聲波掃描顯微鏡(C-SAM)分析。
圖3是M9_#2和M10_#1樣品5倍放大倍數下的EMMI照片。從圖中可以看到在die的左上角位置有明顯的異常亮點。圖3(a)中M9_#2樣品的亮點與eFA發現的ROW2 BL_1037位置接近。圖3(b)異常點與M10_#1樣品eFA結果中BL_1053位置接近。
異常亮點基本處于同一水平線位置并略有分散,這與故障定位時發現的BL金屬線弱連接到電源的現象一致。對于在同一水平位置區域出現斷續多處亮點的現象,被認為是底層SRAM器件因bl或bln金屬線短路到高壓VCCO(3.3 V)導致的底層晶體管失效。晶體管失效產生的漏電區域即為被EMMI顯微鏡捕獲的異常亮點。
圖4為M9_#2和M10_#1樣品C-scan模式下的聲掃結果。兩只樣品在die的左上角區域焊球(solder-ball)有明顯異常,多個焊點呈現“黑圈白心”同心圓現象。C-scan模式下倒裝芯片出現的該缺陷通常判定為die表面出現裂紋(dielectric crack)。
M9_#2樣品異常區域面積較小,M10_#1異常區域較大,這與eFA發現的M10_#1樣品較M9_#2樣品失效block更多的現象相符。與此同時C-SAM結果的缺陷位置與EMMI缺陷位置都出現在die的左上角相關位置。說明兩種不同的材料分析手段較好的將外觀缺陷和電學失效定位在同一范圍。
圖5為器件封裝結構示意圖,die與基座采用倒裝焊(flip-chip)工藝進行互聯,焊膏選用SAC305材料(錫96.5 %,銀3 %,銅0.5 %)。焊球間的空隙使用填充膠(underfill)進行填充。芯片背面和散熱板間通過4450導熱膠粘接固化。引腳焊柱為Sn10Pb90材料(無涂覆)。
表1 M9_#2的eFA匯總
表2 M10_#1的eFA匯總
圖3 M9_#2和M10_#1樣品5倍放大倍數下的EMMI照片
圖4 M9_#2和M10_#1樣品C-scan模式下的聲掃結果
圖5 器件封裝結構示意圖
圖6 C-scan模式die邊緣對應IO處出現“黑圈白心”同心圓現象
該型號規格FPGA產品屬于非密封性金屬-陶瓷封裝結構。經測定器件濕敏等級為MSL 3,因此需按照JSTD-020標準對貯存環境和電裝工藝進行管控。經核實單機方在器件電裝前已進行80 ℃+4 h烘烤,但不滿足標準規定的125 ℃+24 h的烘烤條件,因此存在濕氣未完全排出風險。器件在后續電裝過程中,填充膠內部殘留的水汽因高溫應力產生膨脹,局部膨脹應力過大,會導致die表面產生裂紋,最終造成器件失效。
基于此FPGA器件為非密封性封裝結構,器件因吸濕后未充分烘烤,在經受高溫后產生popcorn效應導致失效的假設,選取3只同型號規格樣品先后按照JESD22-A110、JESD22-A113標準進行uHAST(130 ℃+85 %,96 h)和預處理(pre-condition)驗證試驗。
驗證試驗后對3只樣品進行電性能測試,結果全為fail。電性能測試顯示3只樣品均有die邊緣位置IO失效,且其中2只樣品出現了die附近VCCO電流失效。對VCCO電流失效的2只樣品進行C-SAM掃描分析,C-scan模式同樣發現die邊緣對應IO處出現“黑圈白心”同心圓現象(如圖6所示),與裝機失效器件結果吻合。
通過故障復現試驗的驗證結果,我們認為M9_#2、M10_#1兩只器件的失效原因符合非密封封裝產生popcorn效應的失效機理。
本文針對某型號用FPGA發生的失效問題進行了分析。器件故障定位確定為配置回讀錯誤。經eFA分析,認為die內部配置SRAM的位線與VCCO電源線相鄰,可能發生物理關聯故障,導致同一位線上的配置SRAM讀寫錯誤,進而導致其配置的功能錯誤。經EMMI和C-SAM兩種pFA分析方法,雙重印證了die物理缺陷位置與eFA分析的推論。根據實際工藝情況提出了器件在電裝工藝中由于水汽未完全排出,導致popcorn效應產生失效的假設。通過uHAST + pre-condition的快速試驗方法對假設進行了驗證,得到與裝機器件相同的失效現象與結果,從而證明了失效機理和正確性。
針對以上分析,筆者提出改進建議:
1)針對非密封封裝器件電裝工藝應嚴格按照JSTD-020標準管控;
2)國內應盡快形成適用于宇航應用的非密封封裝元器件鑒定、篩選、安裝行業標準指導工程應用;
3)針對FPGA等高性能器件,應加大對用戶未調用資源的測試覆蓋性,消除潛在風險。