郝思萍,崔詩瑤
(中國電子科技集團公司第四十七研究所,沈陽 110000)
在科技高速發展的今天,信息化水平高低對于現代戰爭而言已是至關重要,隨之而來的,對電子設備的穩定性要求越來越高。高可靠集成電路已逐漸成為軍事科技進步發展的關鍵點和核心。隨著可靠性技術的發展,失效分析與失效機理研究已成為集成電路的重點研究領域之一。由于高可靠集成電路應用環境場合的特殊性及不可預見性,要求其在能夠承受高強度機械沖擊的同時,還要能適應極端環境下的溫度、輻射、電磁等干擾,對此類產品的選用,更要在普通集成電路的篩選考核標準之上附加額外的考量。
所謂失效,就是產品由于質量問題或者使用過程中的正常損耗導致產品失去應有的功能。從理論上分類,電路失效可以根據失效的性質分為致命、漂移性以及間歇性失效。從集成電路的工藝流程出發,則可以分為設計、制造以及使用失效。考慮到集成電路內各單位的整體性、連貫性以及失效之間的關聯性,可以分為獨立失效與序列失效。考慮操作失誤、測試過度等意外因素,集成電路的失效可以從源頭上分為人為、現場以及試驗失效。結合工程實踐尤其是“浴盆曲線”規律,還可分為早期、偶然以及損耗失效。典型的電子器件壽命浴盆曲線[1]如圖1所示。

圖1 典型的電子器件壽命浴盆曲線
如圖,電子器件的失效率會遵從“浴盆曲線”規律。在最初使用的一段時間之內,失效率會逐漸下調,這一階段被統稱為早期失效期;經過早期失效期之后,失效率都將維持在一個較低常數,這一階段被稱為偶然失效期;在偶然失效期之后,由于電子元器件正常的使用損耗,失效率會隨時間延長而升高,這一區間稱為損耗失效期。
鑒定使用壽命是篩選集成電路的重要環節之一,GJB 548B-2005《微電子器件試驗方法和程序》中關于壽命試驗,要求初始鑒定時間取4000h或出現75%失效的第一個值,其余時間為1000+72-24h或出現50%失效的第一個值[2]。但此方法更適用于實驗室試驗,對于實際來說,投入時間資源與得出的回報并不對等。所以通常進行老煉試驗來剔除某些具有缺陷的器件,這些器件所具有的缺陷會造成與時間相關的失效。試驗時間-溫度的選擇在GJB 548b-2005方法1015.1的老煉試驗中有所體現,詳細數據參見表1。

表1 老煉試驗時間-溫度對應關系
高可靠集成電路按照表1通過老煉篩選試驗后進入偶然失效期,可以出廠供貨。而整機單位在拿到產品后還要進行進一步的篩選、考核,以降低產品的失效率。
在實際中,因選擇集成電路不當,而非因其本身質量問題引發的故障不占少數。在對集成電路的初次選用過程中,應該根據實際使用情況,充分考慮到集成電路的性能參數、環境條件、封裝形式、以及外形、體積等方面的要求。
從廠家出廠到用戶使用,集成電路往往需要進行兩次篩選,目的是能夠在用戶使用產品之前盡可能淘汰質量不過關的產品,獲得更高的可靠性。通過二次篩選,篩選掉在一次篩選中漏選或者一次篩選未能發現問題以及由于自身問題過早失效的不合格劣質品。由于國內技術、材料、生產工藝等一系列因素的局限性,國產的集成電路還無法達到比肩國際的先進水平,所以對于集成電路,尤其是高可靠集成電路,更加需要進行二次篩選。
對于篩選和DPA分析過程中失效的產品都需要進行進一步失效分析。失效分析是利用物理、化學等多種手段來準確地查明失效原因,向設計以及生產制造工藝及時地提供反饋信息并幫助其修正[3]。由于集成電路生產制作復雜繁瑣,每一工藝環節的加入,失效概率都會呈指數性增長。失效分析的主要目的就是從失效的案例中提取數據,不斷地整合、分離、試錯、修正,最終構成一套完整的、容錯率高的失效分析體系,以此提高可靠性。失效分析的基本流程如圖2所示[4]。

圖2 失效分析基本流程
破壞性物理分析(Destructive Physical Analysis,DPA)的主要目也是在于判斷一個元器件是否符合設計與工藝的要求,它要對器件進行分解、試驗以及檢驗。DPA是揭示產品工藝缺陷的有效途徑,也是產品工藝質量控制和元件失效分析驗證的重要手段,用以驗證電子元器件能否滿足預定使用要求。DPA是元器件可靠性研究新發展出來的一種方法,可以發現在常規篩選檢驗中不一定能暴露的問題,對準確找出失效的原因,起著十分重要的作用[5]。
GJB 4027A-2006《軍用電子元器件破壞性物理分析方法》作為指導開展電子元器件分析的標準,包括了13大類38小類元器件的DPA方法和程序[6]。從DPA試驗項目可以看出,DPA不進行電學性能測量,而是針對電極系統中的內引線、外引線、金屬層或金屬鍍層以及芯片貼合程度等易引發元器件失效的諸多部位進行特檢。在進行DPA試驗過程中,如果發現產品有缺陷,可重新抽樣做試驗或者拒收。DPA作為補充檢測手段,可以高效快捷地獲取檢測對象的質量、可靠性情報以及存在的問題,為提高整機可靠性打下良好基礎。
現代軍事對集成電路可靠性的要求越來越高。為了能夠更好地應對高可靠集成電路發生故障的特殊情況、更快更準確地發現并解決問題。通過分析產品常見拒收原因、失效的現象[7],結合二次篩選及失效分析的數據,可總結出高可靠集成電路中的典型失效模式,包括:引線鍵合失效、體硅缺陷、氧化層缺陷、鋁-金屬缺陷等。
1)引線鍵合失效
引線鍵合失效會使鍵合點在保持完整的前提下無法與鍵合區有效貼合,甚至進一步的脫離鍵合區。其發生原因不一,由于電流過大、溫度升高造成金屬變性,由于設計漏洞等技術問題造成引線過度繃緊,或由于芯片自身存在裂紋等質量問題,均可引發引線鍵合失效。金鋁鍵合會在溫度的作用下,使金向鋁中擴散,形成AuAl2,即發生可肯德爾效應,使鍵合強度急劇下降,最終導致脫鍵等狀況發生。
2)體硅缺陷
由晶體缺陷所導致的故障,或因為硅體材料純度不夠,以及元器件在生產過程中因擴散問題導致的工藝缺陷等都會導致元器件失效。
3)氧化層缺陷
靜電放電和通過引線擴展的高壓瞬變都可擊穿較薄的氧化層,這樣的氧化層上的一些裂紋或者劃痕以及氧化物中的雜質均能致使器件失效。
4)鋁-金屬缺陷
造成鋁-金屬缺陷的原因也很多樣,包括:高電場引起的按照電流方向發生的鋁電遷移;大電流產生的電過應力造成的鋁導體損毀、鋁腐蝕;焊接引起的金屬磨損;接觸窗口上的異常金屬沉積;鋁層間產生的小丘和裂紋等,諸如此類,往往會造成器件失效。
從某產品中實際隨機抽取多種類型的共50個批次、每批次10只、共計500只的已失效器件,進行開蓋,開蓋后通過顯微鏡進行目檢,得到主要失效模式,分為引線鍵合失效、體硅缺陷、氧化層缺陷和鋁-金屬缺陷各類,具體分布情況如表2所示。實驗中有代表性的失效器件實際案例如圖3所示。

表2 主要失效類型統計表

圖3 主要失效類型圖例
從表2可知,鋁-金屬缺陷是主要的失效原因。電流過大會直接導致溫度升高從而發生熱過載,當超過承受溫度或者處于最高可承受溫度時間過長,金屬材料會融化,塑料會碳化、翹曲等。芯片的損壞也會導致其它損害。一般而言,電路的工作溫度應維持在150℃以下。利用阿列尼斯公式可計算得出當器件結溫從160℃降到135℃時電路的失效率[8],據觀察,此處失效率可減小至一半。
體硅缺陷是是另一個導致器件不合格的主要原因,在對芯片進行檢驗過程中,更需仔細嚴格,將體硅缺陷因素盡可能地排除掉。
通過對集成電路的考核方式及失效模式兩個方面展開研究討論,總結歸納出考核方式的種類、機理以及典型失效模型,有利于對失效原因的總體把握,也是處理高可靠集成電路失效問題的基礎。在實驗中針對實例提出的解決方法,令失效率得到明顯下降。集成電路的選用及考核方式是其穩定性可靠性的根本保障,為適應高可靠集成電路不斷提高的需求,更需要進一步的深入、全面的研究與探索。