金春華
(1.北京科技大學 東凌經濟管理學院,北京 100192;2.北京信息科技大學 經濟管理學院,北京 100192)
基于故障物理的可靠性體系
金春華1,2
(1.北京科技大學 東凌經濟管理學院,北京 100192;2.北京信息科技大學 經濟管理學院,北京 100192)
建立在數理統計基礎上的可靠性工程模式需要耗費較大的時間及經濟成本,不利于可靠性工作的企業化應用及后續發展,基于故障物理的可靠性工程體系正是解決這一問題的最佳途徑。介紹了故障物理的基本原理,形成了以故障物理為中心的可靠性體系框架,理清了故障物理的分析過程,說明了基于故障物理的可靠性提升方式。為企業進一步提高產品可靠性提供了新的理論方向,實施方法和具體思路。
可靠性體系;故障物理分析;可靠性提升
基于數理統計的可靠性工程體系從形成至今已有近60年的歷史,曾為產品可靠性提升提供系統的工作流程和模式[1]。然而隨著產品日趨復雜、應用范圍不斷擴大、使用環境條件日益多樣化,往往要求在有限的時間和成本下提升產品的可靠性,而通常可靠性的驗證試驗需要耗費較長的時間和較大的成本,使得企業在推行可靠性工程中遇到巨大阻力。另外一方面,基于數理統計的可靠性在宏觀趨勢分析以及產品的比較等方面上具有很大的優勢,然而宏觀的數據分析并不能追究故障發生的具體原因,也無法提出產品可靠性提升的具體要求,因而不能為設計開發提供有效地輸入和指導,使得可靠性工作與設計開發脫節,為產品可靠性提升帶來困難。
故障物理可靠性是與數理統計同步發展的可靠性工程體系。故障物理的研究方法是從原子分析的角度出發,來解釋材料、元件、組件及產品的失效現象,以便為材料、元件、組件、產品的改良、分類、評價、使用以及產品的可靠性的設計、維修等提供依據,它是物理和工程學的基礎性技術,可以說故障物理是對可靠性工程起支撐作用的最基礎技術。
國內目前絕大多數軍工、航天等產品大多以數理統計可靠性為主,然而隨著可靠性的民品化、以及可靠性要求的提升等,基于故障物理的可靠性工作將越來越受到重視。然而國內目前關于故障物理的介紹不夠系統和全面,本文期望通過對故障物理的系統描述,為企業提升可靠性提供新的方法和思路的參考。
物質的變化均由能量引起,而能量來自外界的能量和物質自身的能量。外界的能量包括來自于物質本身之外的機械能、熱能、化學能、核能、電磁能以及生物因素等,而內部能量則來自于內部分子原子等的相互作用力,以及在加工過程中產生的內應力等。通常產品出廠時,產品處于能量相對平衡的狀態,而隨著產品的使用過程,受到環境應力和工作應力。當這些應力經過位移、時間等過程,將變成能量作用于產品之上,這些能量將使產品材料發生變化。固體材料的性質通常有結構的鈍感性和敏感性兩類,導致故障、退化發生的主要因素來自后者。產品的失效由結構敏感性上最薄弱環節所決定當產品結構發生變化,導致強度(包括:機械強度、耐高溫性、耐腐蝕性、抗靜電、抗電強度、抗電磁強度等)變化,并形成不可逆過程時,將直接或間接對產品的參數產生影響,當參數的變化達到故障定義的狀態時,便產生了故障[2,3]。
故障物理的研究任務包含兩方面的內容:
1) 故障物理的理化模型。主要研究材料在應力(能量)、時間的作用下發生物理、化學變化的規律;
2)故障物理的數理統計模型。加載在產品上的應力或者能量是服從一定的分布規律的,同時由微觀物理因素導致的故障在時間和空間上都是隨機發生的,因此故障物理的另一個任務是研究故障物理的數理統計模型。
失效的發生是微觀的過程,又是總體上宏觀變化的過程。因此,故障物理的理化模型和數理統計模型二者相輔相成。
可靠性本質上是通故障作斗爭的學科,因此其核心問題是如何降低產品的故障。對企業而言,故障的改進通常從已發生的故障著手,通過故障分析得到故障的理化模型和統計模型,并將這些模型應用于可靠性的設計和驗證等工作。通過上述工作,企業可建立材料庫、結構庫以及應力庫,作為產品在壽命周期可靠性保障的基礎信息。如同質量體系的PDCA循環具有自發的持續改進過程一樣,一旦建立與故障做斗爭的正確理念和方法,產品的可靠性同樣可以再發的持續提升。
以故障物理為中心的可靠性體系如圖1所示。
2.1 故障物理分析輸入
故障物理分析的輸入是產品生命周期各階段所產生的故障。故障分析,首先應有故障品。沒有故障品,故障物理的研究失去了研究對象,研究過程和研究結果就無從談起,因此保護好故障品極為重要。對于電子產品,如器件損壞,考慮電路板整體所受應力,則應連同損壞的器件的電路板及其輸入輸出的接口部分一同定義為故障品。連同故障品一同作為故障分析輸入的內容還有故障履歷,包括:故障發生的時間、地點、環境條件、工作狀態、故障表現、故障部件和故障嚴重程度等,故障履歷信息將為分析產品的強度、應力以及分析相應的退化過程提供重要的信息輸入。于此同時,還應記錄故障統計信息,包括故障發生率、故障分布和母本大小等信息。統計信息將有助于企業集中精力解決重點故障,同時可建立故障的數理統計模型。
2.2 故障物理分析過程
故障物理的分析過程通常是故障點的定位,故障現象和故障模式的分析,對故障機理的探究,從而找到故障原因,進行改進。
2.2.1 故障點定位
故障物理的分析首先從故障點的定位開始,其難易程度隨產品形態的不同有很大的差異。對于機械產品某些帶有自監測功能的產品通常故障點定位相對容易。而對于電子產品故障點的定位有時需要借助一定的測試方法,尤其是在集成電路中,對故障點的定位需要用到聲學掃描、X-ray掃描、開封、染色等多種手段結合進行定位。對故障點的定位越精確,越容易揭示其失效的過程。
2.2.2 故障模式分析
故障模式即故障的表現形式。更確切地說,故障模式一般是對產品所發生的、能被觀察或測量到的故障現象的規范描述。通常機械及電子行業對發生頻率較高的試下模式均已有規范化的描述。如:機械產品中常見的:磨損、斷裂、變形和腐蝕等。當發生故障時,應首先判斷其是否歸納到已有的故障模式中,如是新的故障模式,則應謹慎規范地定義其故障模式。
某些機械的故障模式是比較容易檢測到的,但是某些電子產品失效模式則可能需要通過破壞性物理分析(DPA)才能夠發現。隨著新產品、新技術的不斷出現,產品的失效模式的確認方法、檢測技術和檢測設備正在以更快的速度發展[4]。

圖1 以故障物理為中心的可靠性體系框架
2.2.3 故障機理分析
故障機理即導致故障的物理、化學以及其他的過程。因此失效機理注重的是對過程的研究,這是故障物理的核心和難點。
出廠為合格的產品,經過儲運、使用的過程最終產生故障,原理上均是由于能量作用導致材料變化的結果。因此,故障物理的研究應首先明確作用在產品上的能量。要完整分析這些能量的來源,首先應分析產品的壽命剖面及任務剖面所有經過的環境和時序,以及在這些剖面下環境應力和工作應力。
產品在壽命剖面和任務剖面所受的環境應力和工作應力,在形式上將變現為機械能、熱能、化學能、生物能、核能和電磁能六種能量作用于產品中。能量以不同的方式加載在產品的材料上,將對材料不同的影響,因此需要考慮能量的速度、能量的大小、能量的變化規律和能量的作用點等。能量的大小將決定產品破壞的程度、能量的速度和變化規律將決定破壞的形式,如:快速的能量作用,可能將引發材料瞬間過應力,典型的例子是過電應力;能量的作用點將決定材料破壞的起始點,故障點的定位將與此互相印證。
能量的上述因素對材料的影響大致可分為兩類:一類為可逆的變化,一類為不可逆的變化。產品材料、結構的不可逆變化,在宏觀上將表現為產品性能變化,而性能變化到不能達到規定的功能時,換而言之就是越過了故障定義產生各種故障的變現形式,即故障模式。
2.2.4 故障原因分析
故障原因是觸發故障機理產生的因素。從產品的壽命剖面中明確其發生的階段,找尋出發故障機理的各類因素。原則上說,故障機理的發生是正向過程,而尋找故障原因則是逆向過程,即從產品發生的故障推測其發生的過程,進一步推測出發這些過程的因素,并對其進行驗證。確認故障原因后,對產品的改進可以有兩種途徑:一種途徑是阻隔失效發生的原因,另一種途徑是改變產品的失效機理,即需改變產品的材料、結構、進而改變產品的強度。由于后者會有產生新的失效的風險,因此通常在企業會選擇阻隔失效發生的原因,如:該進設計、該進工藝及檢驗手段、人員培訓、該進儲運環境、增加環境防護設計、增加保護電路、作業標準化、使用過程簡易化等。
2.2.5 可靠性數據平臺
產品故障分析過程是企業積累材料、結構、應力、時間等關系的過程,是企業寶貴的資產,企業有必要將這些分析結果數據平臺化。各企業建立的平臺的模式可不盡相同,應包含故障相關的基礎數據庫即:材料庫、結構庫、應力庫、故障模式庫(包含故障模型)等,以為企業的可靠工作持續提升提供基礎保障。
1)提出可靠性要求
在沒有故障物理基礎的情況下,制定可靠性要求通常有兩個途徑:一是基于相似產品的可靠性指標;二是基于客戶或定制方(如:軍方)提出的要求;但由于新技術、新材料、產品的新應用等日新月異,有可能還未得到歷史產品的數據,新的產品又要投入了,因此基于相似產品提出可靠性指標已越來越困難,客戶端提出可靠性指標也面臨著同樣的問題。故障物理技術為確定可靠性指標或要求提供了新的依據和方法:即通過對產品在壽命剖面和任務剖面上所受的環境應力和工作應力,應力的作用方式和作用點的分析,以及產品在應力作用下所產生的失效方式及失效機理,同時通過數理統計,明確產品失效的概率,從而確定可靠性的指標和要求。
2)可靠性設計
基于故障物理的理化模型和數理統計模型由于比較客觀的反應了事物的發展的宏觀和微觀的規律,因此能夠為可靠性設計提供極具價值的設計輸入信息。如:類似產品的失效形式(過應力、累計損傷),可明確產品提高可靠性的途徑是需要提升產品的強度還是要減緩其退化的過程;通過最弱環模型可以明確產品應提升可靠性的具體單元、零件、直至材料;同時通過應力分析,可以提出對產品的材料在強度和在環境應力和工作應力下的退化要求,從而為新材料、新技術的研究和應用提供方向。
3)可靠性預計
可靠性預計是對產品可靠性特征參數進行預先估計的一種工作。可靠性預計為今后的產品的備品備件、保障服務等工作提供必要的信息。傳統的可靠性預計方法來源于美軍標MIL-HDBK-217及其衍生手冊,這些手冊基本來源于軍用產品的使用環境,并給出相應的修正系數,然而由于很多產品與軍品在環境上有很大差異,而且隨著技術發展,很多修正系數等已不再適用,這些因素導致預計結果與產品的實際運行情況相差巨大,成為產品售后保障的障礙。而根據故障物理模型所開展預計可通過可靠性建模和仿真[5,6],比價準確的預計產品的可靠性狀況,一方面為產品改進提供有力的依據,另一方面也為產品的售后保障提供準確信息,確保資源的合理使用。
4)可靠性驗證
可靠性驗證按照施加應力的原則分為模擬實驗與激發試驗。模擬實驗又稱為正常應力試驗,激發試驗又分為加速應力試驗、加速壽命試驗和加速退化試驗等。模擬試驗是盡可能地模擬任務剖面的真實條件進行試驗,以評估產品的可靠性。用此種方式評估要求單臺產品的試驗時間至少是4.3倍MTBF。隨著可靠性的越來越來高,產品的試驗所需耗費的時間和成本也越來越大。因此激發試驗的應用越來越廣泛,通常加速試驗是用更高的應力來換取時間,因此需要在應力—時間——故障機理上建立模型,來確保產品在不改變失效機理的前提下能夠用更短的時間更有效的進行可靠性試驗和可靠性評估。同時由于故障物理模型是在充分考慮產品的壽命剖面和任務剖面上的應力及產品的強度變化的過程上的,因此在可靠性性驗證過程中,可進行仿真建模,并利用計算機進行隨機試驗[7~9],得到相應的數理統計模型,從而能夠在不易進行試驗的情況下,可獲得相對比較準確的驗證結果。
目前我國的制造業急需從做大到做強的轉型,可靠性作為產品的核心競爭力已毋庸置疑。而基于數理統計的可靠性工程正日益面臨著時間、成本與效果的挑戰。可靠性本質上是與故障做斗爭的學科,而故障物理從本源上揭示故障的發展規律,使企業能夠將有限的資源投入到產品的可靠性分析和預防中,而非耗費巨大時間和成本的可靠性試驗中。本文為企業如何開展故障物理的可靠性工作提供了有價值的參考。同時,故障物理可靠性的開展必然在產業鏈中形成對新材料、新技術的強力推動,從而建立穩固、上升的產業鏈,為我國的制造業轉型發展提供良好的土壤。
[1] 黃志偉.可靠性系統工程的理論與技術結構框架分析[J].硅谷,2014,(13):154-161.
[2] 胡林忠.失效機理在可靠性工程中的應用[J].環境技術,2008,(02):14-18.
[3] 劉柳,周林,邵將.電子產品故障物理模型研究與應用進展[J].裝備環境工程,2015,(02):54-58.
[4] 何勝宗,武慧薇.失效分析在智能電能表可靠性提升中的應用[J].電子產品可靠性與環境試驗,2016,(06):26-30.
[5] 駱明珠,康銳,劉法旺.電子產品可靠性預計方法綜述[J].電子科學技,2014,(02):246-256.
[6] 曹勝.基于故障物理的電子產品可靠性預計與試驗研究[D].電子科技大學,2016.
[7] 邵帥,劉柳,鐘季龍.電子產品故障物理模型仿真分析與試驗驗證[J].測控技術,2016,(11):141-145.
[8] 陳穎,高蕾,康銳.基于故障物理的電子產品可靠性仿真分析方法[J].中國電子科學研究院學報,2013,(05):444-448.
[9] 梁奕坤,胡寧,黃進永,余昭杰.基于失效物理的可靠性仿真技術及軟件設計[J].電子產品可靠性與環境試驗,2016,(03):76-79.
Reliability system based on physics of failure method
JIN Chun-hua1,2
TB114.3
:A
:1009-0134(2017)05-0153-04
2017-04-28
金春華(1974 -),男,江蘇蘇州人,博士研究生,研究方向為質量與可靠性工作。