黃 菊, 譚晟吉, 袁 強, 李彥平
(中國兵器裝備集團自動化研究所, 四川 綿陽 621000)
目前在航空、航天、船舶、兵器、電子、核工業等各種武器裝備和軍事設備中廣泛應用以集成電路為代表的各種電子元器件的計算機、電力、金融、通信等電子設備[1]。目前我國大部分高端集成電路從日本、美國、歐洲等國家進口。 據中國海關數據統計,2019 年我國芯片的進口金額為3040 億美元,較去年同期減少80 億美元,同比下降2.6%。2020 年7 月我國半導體器件進口量為482.8 億個,同比增長12.7%, 進口金額為2069 百萬美元, 同比增長23.3%,2020 年8 月我國半導體器件進口量為481 億個,同比增長12%,進口金額為1991.6 百萬美元,同比增長18.6%。 2020 年8 月前我國半導體器件進口量不斷增長。引用“中國半導體產業戰略規劃和企業戰略咨詢報告”國外壟斷高端電子元器件會面臨停產斷檔、 限制出口與禁運、存在安全隱患以及假冒偽劣等問題,嚴重影響和制約我國國民經濟和武器裝備的發展,甚至危及國家安全。國家層面出臺了電子元器件行業, 各個地方政府也是大力支持本土電子元器件的行業發展,憑借政策支持、資金投入,積累技術經驗和人才儲備,拉近與國外的差距,逐步占據產業戰略高地。
LC 領域國內企業開始發力進入市場, 尤其是在國家大力推進“智能制造2025”的大背景下,行業增速一直保持在20%以上,國內企業的市場份額也在逐步增加。 看好國內企業在滲透率提升和進口替代國外企業雙重機遇下的發展潛力。 芯片國產化是中國制造崛起之匙,國產設備迎來了歷史機遇,目前處于快速發展階段,器件的可靠性還存在問題,需采取相應的手段提高設備的可靠性。
電子設備的基礎是電子元器件, 提高電子元器件的可靠性即可提高設備的可靠性。 國產電子元器件可解決我國電子設備尤其是軍用電子設備選用進口電子元器件面臨的多種問題,主要包括設備的性能指標、質量與可靠性水平以及供貨保障能力。
隨著高新技術的發展, 現代武器系統和民用設備具有電子化、自動化、智能化的特點。 電子設備系統越復雜,其可靠性問題就越尖銳[2]。 “引用電子元器件可靠性增長的分析技術”目前國產電子元器件處于剛起步的階段,元器件的可靠程度低,可能由不可靠產品引起的巨大經濟損失、戰爭教訓使可靠性工程的重要性越發明顯。 目前國防對武器裝備性能和可靠性的要求提高到一個前所未有的高度,航空、航天都在進行可靠性增長工程,如果元器件的可靠性沒有相應地跟著增長,航空、航天等領域產品的可靠性增長必將受到極大的影響。電子元器件作為電子設備和電子系統的基本組成單元其可靠性得到了高度重視,因此,電子元器件的可靠性技術也顯得越來越重要。
在可靠性增長中, 通過失效試驗與分析→控制失效模式→提高產品的可靠性是最主要的方法, 但失效分析是事后分析,實現可靠性增長的周期較長、費用很高。 通過故障模式、失效機理、失效原因以及影響設備的可靠性因素進行分析及試驗,從而采取可靠性增長的設計措施。
為了提高電子設備的可靠性需進行可靠性增長,通過逐步改進產品設計和制造中的缺陷,不斷提高產品可靠性的過程。需要明確產品可靠性管理階段的劃分、 可靠性增長方法等內容。產品的全壽命周期階段分為工程研制階段、 設計定型階段、生產定型階段。 提高電子設備可靠性的方法包含可靠性分析、可靠性增長試驗等。
可靠性分析工作之前需要明確分析的電子設備的功能與結構組成, 明確設備故障的故障判據,盡量采用定量描述,少用定性的描述,是可靠性工程的基礎。
可靠性分析工作之前需進行數據收集, 收集電子設備全壽命周期的失效信息, 包括設備在生產、 測試、FMEA、試驗及現場使用等過程中各組成單元(含元器件)所有可能出現的故障模式、故障原因、影響分析。
電子設備的常見的故障模式包含功能喪失、 功能降低、間歇性故障、非預期的功能。故障原因是造成故障模式的原因,一般分為開路、短路、參數漂移。 故障原因是由某些物理、化學等失效機理造成的,如疲勞、溫度過高、機械應力等。 針對測試、試驗中出故障的元器件,可采用DPA的方法進行故障分析,DPA 是元器件故障分析的有效的手段,根據DPA 結果明確故障模式及故障原因的分析。
故障模式及影響分析又稱FMEA, 是提高設備可靠性的重要方法。在電子設備設計、生產、試驗過程中,通過對電子設備各組成單元的各種可能出現的故障進行故障模式與對系統影響進行分析, 進而提出改進措施的一種分析方法。
在不同的階段可實施不同程度的FMEA, 在方案階段一般進行功能FMEA,在工程研制階段進行硬件FMEA與工藝FMEA,本文著重于功能和硬件FMEA 進行說明。FMEA 工作要點包含:明確產品的功能、故障模式、故障原因、產品功能故障的判據確認及影響后果、改善措施。
本文中某型國產電子設備的功能為某車載系統的控制系統,使用千兆以太網通信實現車載系統的控制,如果千兆以太網出現故障則會造成系統故障。 以某型國產電子設備的功能FMEA 為例進行說明,故障模式、故障原因及影響分析見表1。

表1 某型國產電子設備的功能FMEA 表
可靠性增長是貫穿于電子設備壽命周期內, 為達到逐步改正產品設計和工藝缺陷、 提高產品可靠性而進行的“試驗、故障分析、改進”[3]。在電子設備研制階段可以通過可靠性增長摸底試驗及可靠性增長試驗實現設備可靠性增長。 可靠性摸底試驗的受試產品需具備產品規范要求的功能和性能,在設計、材料、結構與布局及工藝等方面能基本反映將來生產的產品的技術狀態。 在試驗前需經過全面的功能、性能試驗,以確認產品的技術狀態已經滿足可靠性增長摸底試驗的要求。 同時應通過環境應力篩選,同批次產品完成規定的環境試驗項目。根據工程經驗, 通常可靠性增長摸底試驗的試驗時間取100~200 小時較為合適, 也可取該產品MTBF 設計定型最低可接受值的10%~20%。 可靠性增長試驗與摸底試驗相比,試驗階段不一致,可靠性增長試驗一般在工程研制后期,在鑒定試驗之前。可靠性增長試驗取決于選擇的可靠性模型,工程經驗及對產品的可靠性要求,一般取產品MTBF 目標值的5~25 倍。同時也可根據工程經驗加大可靠性增長的應力, 但需注意的是應力在不破壞產品且不會引起與實際使用時不相符的故障前提。
可靠性增長試驗需要模擬產品實際的使用條件制定試驗剖面,包括環境條件、工作條件和使用維護條件。 其中環境條件及其隨時間變化的情況應能反應受試產品現場使用和任務環境的特征,選用模擬現場的綜合環境條件。綜合環境條件實施時,先確定一個綜合環境試驗剖面,該試驗剖面一般由溫度、濕度、振動等環境應力和電應力構成。
已知某型國產電子設備的任務剖面和壽命剖面共同確定試驗剖面,試驗剖面含溫度、濕度、振動的環境應力和電應力。采用可靠性增長模擬試驗進行可靠性增長,試驗的時間選取200 小時。
本文中某型國產電子設備在可靠性增長摸底試驗過程中出現高溫工作時, 出現設備意外關機且恢復環境溫度為室溫后重啟設備,設備啟動正常的故障。需針對該故障進行分析,以實現設備可靠性增長。經過故障檢測分析手段,得到某國產電源芯片長期工作在高溫環境下,器件溫升較大可能會導致器件失效,從而導致設備故障。
結合可靠性分析與可靠性增長試驗, 可實現設備的可靠性增長。其中可靠性設計是事前措施,而可靠性增長是時候試驗評估。 可靠性增長試驗中發現問題通過可靠性分析可以反饋到設計中,為其提供指導,兩者是提高產品可靠性的重要環節[4]。 為了解決該故障,后續設計時在PCB 設計中增大熱焊盤的面積,加大該芯片在PCB 上的熱量, 同時可以在結構設計針對該器件增加專用的散熱手段,最終使得設備可靠性提高,能以高概率通過可靠性鑒定與驗收試驗,提高裝備的費效比。
電子設備可靠性增長的核心在于元器件的可靠性,要有效的控制或消除設備的失效, 需要實現對設備準確的失效分析,采用有效的可靠性增長失效,并實現全生命周期失效數據的收集, 才能針對電子設備的特點采取有效。 本文從元器件級到設備級進行全壽命周期內故障信息收集、FMEA、 可靠性增長試驗的工作, 通過詳細的測試、分析、試驗得到設備可能出現的失效模式、失效原因及影響程度,從而提出有效的可靠性增長措施,提高產品的可靠性。