孫曉君
(北京空間科技信息研究所 北京 100086)
對于電子產品可靠性的分析大體分為4個步驟:第一步為調研,主要針對電子產品可靠性問題的嚴重性、環境應力及失效機理的影響,可靠性總體工作內容等進行;第二步為試驗,主要是對電子產品進行壽命試驗及環境試驗,定量地得出電子元器件或整機的可靠性水平,同時制定出各種環境試驗方法的標準;第三步為可靠性物理研究階段,主要是對可靠性問題的本質 (故障或失效模式及其機理進行分析研究,并探討和提出各種加速度試驗的方法;第四步為可靠性保證,即在了解可靠性現象和本質的基礎上,從產品的研制開始到使用的各個階段加強可靠性管理和保證、評價、認證及控制,建立可靠性數據收集、交換體系和數據中心。由此結合到一個具體的電子產品案例系統,可以相應的將整個可靠性分析過程分為4個階段[1]:
1)對產品使用條件、試用期內產生的失效現象及其影響的匯總和問題的初步分析;
2)根據失效現象審視設計,對可能存在的明顯問題進行改進,后采用試驗手段進一步實現失效定位,得到產品的高風險環節及相應的改進措施;
3)針對產品中存在的高風險器件/部件的常見失效模式、失效機理、失效模型進行匯總,并采用模型預計的方式求出壽命,并分析是否合理;
4)將前期所有分析得到的高風險環節、失效模式進行匯總,在制造過程中加以控制,并建立故障數據庫,以保障可靠性的管理和控制。
由此可見,高風險環節的識別在整個產品的可靠性分析、評價過程中處于極為關鍵的地位,現階段人們一般采用FMEA等分析評估方法和手段,希望能準確的識別,以對某一高風險環節有針對性的進行分析和改良,最終實現產品可靠性的提高。然而由于這些方法多是對失效模式和影響的分析,并沒有考慮產品在實際使用環境和應力環境下可能的失效形式的出現概率[2],同時失效的影響在不同產品中的描述亦有不同,這樣,對于積累的失效模式、失效機理等的經驗和理論利用率并不高。如何解決和提高就成了當務之急。
筆者將從產品涉及的使用條件、失效特征、測試標準、設計需求、所處環節、帶來的影響后果等因素的關系出發,得到“元器件-失效模式-失效機理-影響因素”這一分析路徑,并針對一個電子產品案例,通過簡要分析失效模式和失效機理,確定其高風險環節,最后利用相關標準中的失效模型進行可靠性分析,完成利用這一關聯形式分析的全過程。
每個電子產品的基礎都是元器件和連接件,產品的可靠性必然與這些元器件/連接件密切相關,一個薄弱的環節將可能導致整個產品的失效,故要保障整個產品的可靠性。必須對每個元器件,特別是高風險關鍵元器件進行分析,保障它們的可靠性。一般來說,元器件的可靠性評價與多種因素相關,如:使用條件、失效特征、測試標準、設計需求、所處環節、帶來的影響后果等,這些因素之間存在的關系如圖1所示。

圖1 元器件各因素之間的聯系Fig.1 Relation between the factors of component
注:圖1中所示的關系簡述如下:
1)元器件-失效模式-根因:不同元器件可能的失效模式及造成的根本原因;
2)元器件-失效模式-失效機理-影響因素:不同元器件可能的失效模式、機理及其影響因素;
3)失效模式-試驗測試-工業標準:用于測試不同失效模式的試驗與標準;
4)失效機理-試驗測試-工業標準:用于測試不同失效機理的試驗與標準;
5)試驗測試-工業標準:不同類型試驗測試的目前已有的工業標準;
6)元器件-結構與部位-設計準則:不同元器件在不同部位的相應設計準則;
7)失效模式-后果:不同失效模式造成的后果。
對于一個電子產品進行可靠性評價,其關鍵在于確定產品的高風險易失效環節。而每個元器件及連接件都有自身常見的失效模式與失效機理,并且隨著產品的結構、加工、制造、使用環境的不同,失效形式也會隨之變化。所以,可以利用“元器件-失效模式-失效機理-影響因素”這樣一個關聯形式,首先,通過分析在產品設計、生產過程中,產品各組成單元潛在的各種故障模式、故障機理及其對產品功能、性能和長期退化的影響,明確產品的高風險環節有哪些;其次,判斷在產品實際使用條件下,各種失效機理被激發的可能性,即:對元器件的結構、材料、工序和工藝等的失效模式、機理、影響、嚴重程度與發生的概率進行評估,以概率最高環節作為整個產品的最高風險環節;最后配以試驗、標準或理論進行可靠性分析。接下來,本文將以一個分析案例驗證這一分析方法。
本案例分析的產品對象是一種用于高可靠性環境實時監測的傳感器網絡系統,分為采集和接收兩部分,其主要工作方式為:采集部分實時對周圍環境的狀態進行監控,并采用無線數字傳輸技術,將測量的溫度、濕度數據發送到中心監控主機(接收部分),并將歷史數據保存至主機[3]。
在本系統中,就整個信號傳輸過程而言,將系統分為以下主要的基本環節:電源、傳感器、運算放大器、具有無線傳輸功能的nRF芯片(采集、接受各一個)、PC電腦。系統結構如圖2所示。

圖2 系統基本構成Fig.2 Basic elements of system
案例中影響最終輸出結果的器件主要是:傳感器、運算放大器、無線芯片、焊點、PCB鍍通孔幾部分,器件類型極其功能如表1[3]所示。

表1 案例使用器件類型和功能Tab.1 Type and function
以案例中的幾種器件類型的失效模式、失效機理及影響因素進行分析匯總[4-6](形式如表2[10-11]所示),若使各器件發生失效的影響因素包括:電應力(高電流密度、高電壓作用)、熱應力(熱循環、高溫條件)、潮濕環境、機械應力(振動、沖擊)等。
分析本研究產品的使用環境可知,該產品所處環境并不惡劣,一般正常使用放置條件下無振動、沖擊等強烈機械應力作用;同時也不存在于高溫條件(處于商用溫度范圍-40~85℃);且使用電源為普通5 V商用穩壓電源[3],電路無明顯出現應力集中的設計,故不易出現高電流密度和高電壓的現象,由此可以認為由電應力、高溫條件、機械應力激發的失效機理不會是產品失效的主要原因。而由圖3可知,潮濕環境帶來的失效對器件影響較小,且產品工作于一般實驗室環境,潮濕也不會是失效的主要原因[7]。

表2 器件的失效模式、失效機理及影響因素示例表Tab.2 Failure mode,failure mechanism and influencing factor

圖3 環境應力對器件失效的影響Fig.3 Failure ratio under different environmental stress
對于剩余的溫度循環應力條件,對器件、鍍通孔、焊點均有影響。然而有研究表明,在溫度循環應力條件下,焊點的失效率要高于器件的失效率(如圖4所示)[8-9];同時,對于焊點和鍍通孔兩種連接件而言,鍍通孔的制造過程是專業化的機器流水線生產,加工一致性較好,而焊點則存在手動加工的問題,不同操作者的焊接水平參差不齊,會帶來較大分散性,故焊點相對鍍通孔而言更易于失效。
綜上所示,本案例的高風險易失效環節是焊點,即:整個產品的可靠性取決于焊點的可靠性。接下來將利用焊點的失效物理模型對案例產品的可靠性進行分析。

圖4 溫度循環應力條件下焊點、器件失效率曲線Fig.4 Failure probabilities for electronic component and surface mount solder attachment
IPC的焊點壽命評價模型包括了疲勞壽命模型、失效分布模型和損傷累計模型3類。其中疲勞壽命模型是整個壽命評價體系的基礎。在標準IPC-SM-785[8]和IPC-D-279[9]中,采用了最廣泛使用的 Engelmaier-Wild焊點疲勞壽命模型,為了完整度量應力松弛過程,冪指數定義為溫度和時間的函數,表述的疲勞損傷與平均壽命之間的關系如下:

其中:考慮到存在周期性粘塑性變形能,用周期疲勞損傷因子來描述,該參數取決于焊料在時間、溫度、應力共同作用下,發生蠕變/應力松弛時帶來的潛在損傷大小。疲勞延展系數在共晶合金和60/40的SnPb焊料中一般取0.325。
疲勞延展指數c是與溫度、時間相關的參數,對它的修正考慮了熱循環加載頻率與加載溫度的效應,以及彈塑性應變的影響。當應力釋放不完全時:

其中:TSJ是焊點所受循環溫度;tD是半周期循環持續時間(單位:分鐘)。與循環的形式和頻率相關,并最終代表了所能承受的應力松弛和蠕變時間。。
對于無引腳SM元器件焊點在一定的應力作用下,當應力強度超過焊料屈服強度并導致焊料塑性屈服時,循環疲勞損傷參數為:

對于有引腳元器件焊點,在熱疲勞應變時所受應力會低于屈服應力水平,循環疲勞損傷參數為:

案例中的產品設計壽命為10年,考慮室外使用環境,器件-外部溫度循環范圍:ΔT=40 ℃,一天為一個循環[3,13]。
1)元器件(選擇產品中最小的焊點進行計算)
①無引腳器件:36個I/O引腳QFP芯片,間距1.27 mm,耗散功率0.06 W。高、低溫環境中,元器件的穩態工作溫度分別是60℃和10℃。
②有引腳器件:間距2.54 mm插接件,耗散功率0.23 W。高、低溫環境中,元器件的穩態工作溫度分別是70℃和10℃。
2)基板:普通FR4環氧樹脂印刷電路板
①當焊接無引腳器件時,高、低溫環境中基板的穩態工作溫度分別是55℃和10℃。
②當焊接有引腳器件時,高、低溫環境中基板的穩態工作溫度分別是65℃和10℃;
根據壽命Nf計算公式對器件進行可靠性評價 (無引腳、有引腳前后用//分開)。

由此可見,當使用有引腳器件時,其壽命是無引腳壽命的近兩倍,也就是說,當焊點是產品高風險環節時,在設計空間的允許范圍內,建議采用有引腳器件保證焊點可靠性,從而保證整個產品的可靠性。
產品涉及的使用條件、失效特征、測試標準、設計需求、所處環節、帶來的影響后果等因素之間具有密切的聯系,這些關系可以構成多種可靠性分析路徑。為了充分繼承積累的失效模式和失效機理的經驗,也更多的在分析過程中考慮實際使用環境和應力載荷的影響,確保可靠性分析的準確性,“元器件-失效模式-失效機理-影響因素”這一分析路徑則比僅考慮失效模式的影響要更為準確。
由文中利用一個電子產品案例,開展的初步的完整分析過程,可以看出,對常見潛在失效模式、失效機理及可能的誘發環境因素進行調研匯總,并參照研究產品設計時定義的工作環境,逐個排查,確定產品失效的主要原因和高風險環節,利用失效物理模型,計算了在使用環境下的可靠性相關因素,可以有力的推動產品的可靠性設計和評價。
[1]李能貴.電子元器件的可靠性[M].西安:西安交通大學出版社,1990.
[2]李永紅,徐明.MIL-HDBK-217可靠性預計方法存在的問題及其替代方法淺析[J].航空標準化與質量,2005(4):40-43.
LI Yong-hong,XU Ming.A simple analysis on the problems existing in the methods for estimating reliability in MILHDBK-217 and the alternative methods[J].Aeronautic Standardization&Quality,2005 (4):40-43.
[3]翁璐,孫曉君,胡冬,等.無線傳感器網絡的運行失效定位案例研究[J].電信科學,2010,26(11A):221-226.
WENG Lu, SUN Xiao-jun, HU Dong,et al.Case study of analyzing and isolating the random failures of a wireless sensor network[J].Telecommunications Science, 2010,26(11A):221-226
[4]黃云,恩云飛.電子元器件失效模式影響分析技術 [J].電子元件與材料, 2007, 26(4):65-67.
HUANG Yun,EN Yun-fei.Failure modes effects analysis of electronic components[J].Electronic Components&Materials,2007, 26(4):65-67.
[5]Mathew S,Das D,Rossenberger R,et al.Failure mechanisms based prognostics[C]//Prognostics and Health Management International Conference,2008:1-6
[6]Michael PG.Prognostics and Healt.h Management of Electronics [M].USA:Wiley-Interscience,2008.
[7]何國偉.可靠性試驗技術[M].北京:國防工業出版社,1995.
[8]IPC-SM-785,Guidelines for Accelerated Reliability Testing of Surface Mount Solder Attachments[S].IPC,1992.
[9]IPC-D-279,Design Guidelines for Reliable Surface Mount Technology Printed Board Assemblies[S].IPC,1996.
[10]姚立真.可靠性物理[M].北京:電子工業出版社,2004.
[11]上官東愷.無鉛焊料互聯及可靠性[M].劉建影,孫鵬,譯.北京:電子工業出版社,2008.
[12]Engelmaire W.Functional cycles and surface mounting attachment reliability[J].Silver Spring,MD:Int.Soc.for Hybrid Microelectronics,1984(1):87-114.
[13]孫曉君,胡冬,謝勁松,等.焊點疲勞壽命的量化評價方法及其影響因素[J],電子元件與材料,2010,29(11):68-71.
SUN Xiao-jun, HU Dong, XIE Jin-song, et al.Quantitative evaluation method and influencing factors on solder joint fatigue life[J].Electronic Components&Materials 2010,29(11):68-71.