孫富強,李艷宏,程圓圓
(1.北京航空航天大學 可靠性與系統工程學院,北京100083; 2.中國電子科技集團第五十二研究所,杭州310012)
高可靠、長壽命產品在復雜環境作用下,經常會出現性能隨時間發生退化的現象。同時,產品在工作過程中還會不斷遭受諸如單粒子效應、溫度振動沖擊等外部環境和壓力流量過載、電壓電流突變等工作應力帶來的沖擊損傷。此類產品的失效可視為性能退化失效與隨機沖擊導致的突發失效之間競爭的結果[1-2]。突發失效與退化失效之間往往是相互影響的,即二者之間存在相依關系[3],具體表現為:一方面,退化會使系統更加脆弱,增加突發失效發生的概率;另一方面,隨機沖擊可能導致系統退化過程出現階躍退化增量或退化速率加速的現象。因此,忽略退化與沖擊之間的相依性進行系統可靠性評估,往往會得到可信性較低的結果,對決策造成嚴重的誤導。
此外,很多產品對于隨機沖擊還具有一定的承受能力,本文借鑒材料科學中沖擊韌性的概念描述此種現象[4-5]。沖擊韌性是指材料在沖擊載荷作用下吸收塑性變形功和斷裂功的能力,反映材料抵抗沖擊載荷的能力。例如,某空間用存儲芯片在設計時采用了冗余、限流電路、檢錯糾錯碼技術,使得該系統在遭受單粒子效應沖擊后,能夠自動采取糾正措施恢復正常運行。當然,由于各種限制因素,系統的沖擊韌性是有限的,僅能夠在一定范圍內發揮作用。故而,在退化-沖擊競爭失效建模過程中還需要考慮系統的沖擊韌性。
退化-沖擊競爭失效建模的關鍵是分別建立退化模型和沖擊模型,并在此過程中對二者之間的相依關系進行考慮。目前,國內外研究者大都采用泊松過程建立沖擊模型,以描述系統所經受的不同類型的沖擊過程[6-7]。現有關于退化-沖擊競爭失效建模的文獻主要使用線性回歸模型對系統的退化行為進行描述[8],并在此基礎上考慮隨機沖擊對退化過程的影響[9-12]。然而,線性回歸模型假定系統退化過程是確定的。但在實際中,受產品運行環境的多樣性、測量的不確定性、個體退化過程的差異性等不確定因素的影響,隨機性是工程實際中產品退化的一個普遍現象與重要特點[13]。由于隨機過程方法在描述退化過程的隨機性方面具有天然的優勢,采用隨機過程建立退化模型是更理想的選擇。文獻[14-15]采用線性Wiener過程建立退化模型,文獻[16]則采用伽馬過程對退化過程進行建模,并假設隨機沖擊服從非齊次泊松過程,該沖擊仍造成退化量階躍式增加,基于這些假設建立競爭失效可靠性模型。但在實際工程中,由于系統結構和失效結構的復雜性,系統退化行為往往存在非線性[17]。所以,進行競爭失效系統退化過程建模,還應該考慮系統的非線性退化行為。另外,現有競爭失效研究僅考慮隨機沖擊對退化過程中退化量的影響,對退化速率的影響尚未涉及。事實上,隨機沖擊還可能對系統的退化速率造成影響。文獻[3,18-19]考慮隨機沖擊對線性回歸退化模型中退化量和退化速率的綜合影響,建立了相應的競爭失效模型。針對沖擊韌性,目前相關研究非常少。文獻[4]針對具有容錯特點的競爭失效系統,使用Wiener過程對其退化過程建模,并針對系統的容錯設計提出了m-δ沖擊模型。
針對上述問題,本文使用非線性Wiener過程構建一種綜合考慮退化過程非線性、系統沖擊韌性、退化-沖擊相依性的競爭失效系統可靠性評估模型,為更準確地分析系統的可靠性提供新的方法,對于指導系統的可靠性設計及制定科學合理的維修質保計劃具有重要的參考意義。
本文的研究對象是具有退化失效和突發失效競爭特點和沖擊韌性的系統。例如,某空間用存儲單元在服役過程中會發生性能退化現象,同時還會受到單粒子效應的沖擊損傷。因為對系統進行了容錯設計,單粒子效應導致的某些邏輯錯誤可以通過錯誤檢測與糾正(Error Detection and Correction,EDAC)設備檢測和糾正,系統具有一定的沖擊韌性。但其容錯能力受到分配資源的限制,當很短的時間內發生了多次錯誤,超過系統的容錯能力,系統則發生突發失效。令m個連續沖擊之間的時間間隔為Bj=tj+m-1-tj,tj表示第j次沖擊的到達時刻,Wj表示第j次沖擊的幅值,Yj表示第j次沖擊造成的階躍退化增量,j=1,2,…,∞,d為退化失效閾值。則上述沖擊現象可表述為:當m 個連續沖擊之間的時間間隔Bj<δ時(或δ時間內發生的沖擊數量大于或等于m時),系統發生突發失效,稱為m-δ模型[4]。其余情形下,因系統具有沖擊韌性,沖擊不會造成突發失效,但會對退化過程的退化增量和退化速率造成影響。如圖1所示,當m=4時,B1>δ、B2>δ,系統出現階躍退化增量,且退化速率加快;B3<δ,系統發生突發失效。

圖1 考慮沖擊韌性的退化-沖擊相依競爭失效機制Fig.1 Degradation-shock dependence competing failure mechanism considering shock toughness
針對上述具有沖擊韌性的退化-沖擊相依競爭失效系統,提出如下假設:
1)系統狀態可由一個性能參數表征,若該性能參數的累積退化量X(t)超過其臨界退化失效閾值d,就會導致系統發生退化失效。
2)系統在工作過程中還受到隨機沖擊的作用,若m次連續沖擊之間的時間間隔大于閾值δ,即Bj>δ,則每次隨機沖擊將對退化過程造成2種影響:階躍退化增量和退化速率增大;若m次連續沖擊之間的時間間隔小于等于閾值δ,即Bj≤δ,則系統發生突發失效。
3)隨機沖擊對退化過程的影響可通過退化速率影響因子和階躍退化增量來表征,其中退化速率影響因子是與沖擊損傷量值有關的函數,階躍退化增量用復合泊松過程來表示。
4)假設隨機沖擊到達速率λ(t)為一個隨時間遞增的函數,表征退化過程對于系統抵抗隨機沖擊能力的影響,即隨著系統性能退化,其發生突發失效概率會增加。
5)系統存在2種競爭失效機制:m-δ沖擊導致的突發失效,以及系統性能參數的累積退化量超過其臨界退化失效閾值導致的退化失效。
現有退化-沖擊競爭失效研究中,基本上都是采用泊松過程建立沖擊模型,以描述系統所經受的不同類型的沖擊過程[6-7]。使用泊松過程對隨機沖擊過程建模主要基于以下幾點考慮:①泊松過程是一種重要的點過程,用來表征隨機沖擊這種單事件效應現象是合理的;②泊松過程具有無記憶屬性,換句話說,沖擊是隨機發生的[20];③泊松過程的到達速率λ(t)可以是任意形式,如若選取得當,其可以很好地描述隨機沖擊的出現頻次。

目前,大部分競爭失效研究采用線性回歸模型X(t)=a+bt來描述系統的退化過程[8-12,21-22]。但線性回歸模型無法刻畫系統退化過程中存在的波動性和非線性特征。本文采用非線性Wiener過程對退化過程進行建模,以更加準確地描述系統的退化行為。
基于非線性Wiener過程的退化模型M0為

式中:X(t)表示t時刻退化過程的退化量,為了簡化此處假設X(0)=0;μ為漂移系數,用來表征退化速率,μ(t;θ)=μdΛ(t;θ)/d t=μΛ′(t;θ),Λ(t;θ)為非減時間尺度函數,表征退化過程的非線性特征,θ為時間尺度參數,如Λ(t;θ)=tθ;σB為擴散系數;B(·)為標準布朗運動。
退化量X(t)首次超過規定的臨界退化失效閾值d,則判定產品發生退化失效。這個時間T被稱為首穿時(First Passage Time,FPT),可視為系統發生退化失效的壽命。對于退化模型M0,由于Λ(t;θ)的非線性影響,難以得到退化失效分布的概率密度函數(Probability Density Function,PDF)的封閉表達式。為此,文獻[23]將其轉化為標準布朗運動超過時變閾值的首穿時分布求解問題,并基于一個溫和的假設,給出了退化失效概率密度函數的近似解析式為

當系統未經受隨機沖擊時,可采用退化模型M0描述其退化軌跡。然而在工程實際中,系統處于復雜的工作環境中,會不斷遭受外界環境的隨機沖擊影響。根據前面的假設,沖擊對退化過程有2種影響機制:階躍退化增量和退化速率增大。本文將綜合考慮這2種影響,通過對退化模型M0進行修正來表征退化與沖擊間的相依性。
2.3.1 沖擊對退化增量的影響
單個沖擊對于退化過程的損傷是不同的,令每次沖擊造成退化過程的階躍退化增量為Yj。假設Yj服從正態分布,即Yj~N(μA,σ2A),將其對退化過程造成的累積退化增量記為S(t),用一個復合泊松過程來表示,具體形式為

2.3.2 沖擊對退化速率的影響
通常,沖擊在影響系統退化增量的同時,還可能會改變其退化速率。針對系統受到沖擊作用之后出現退化速率加速的現象,本文退化過程模型中引入退化速率影響因子Q(t)來考慮二者之間存在的相依性。

式中:μ為漂移系數,表征t時刻的退化速率;μ0為初始退化速率;r表征了沖擊對退化速率的加速效應,取值范圍為[0,∞)。
因此,考慮沖擊對退化過程的上述2種影響,在經受N(t)=0,1,2,…,k次沖擊后,系統退化過程可采用如下修正模型M1表示:




結合退化模型M1和m-δ沖擊模型,構建退化-沖擊相依競爭失效系統的可靠性模型,直接計算比較困難,因此根據隨機沖擊的出現次數,將該競爭失效過程的可靠度計算分為以下3種情況進行:
1)t時刻沒有隨機沖擊出現時,系統的可靠性模型為

該模型全面考慮了競爭失效系統中的退化過程非線性、退化-沖擊相依性、系統沖擊韌性等因素,具有一般性和通用性。對于一些對隨機沖擊具有一定的承受能力的產品來說,該模型更符合其可靠性分析與預測的特點,可以得到更為全面、客觀的評估結果。
某空間用存儲芯片在服役過程中會同時經受空間輻射中單粒子翻轉效應和總電離劑量效應的影響。單粒子翻轉是會導致單元突發失效的事件,如存儲器存儲邏輯1或邏輯0,當單粒子翻轉發生時,存儲的邏輯值將變為0或1,該翻轉事件可被視為一個沖擊。單粒子翻轉與總電離劑量密切相關,當重離子線性能量轉移大于閾值時,可能會發生單粒子翻轉。而當設備吸收大量電離劑量時,線性能量轉移閾值通常會降低,設備更易發生單粒子翻轉,表現為單粒子翻轉的發生率增加。錯誤檢測與糾正設備可在一定程度上防止單粒子翻轉的影響,但由于資源限制,當m個連續沖擊之間的時間間隔小于δ,仍然會發生故障;總電離劑量大于或等于預定值,存儲芯片也將失效。
采用本文所提出的競爭失效模型對此類具有沖擊韌性的系統進行可靠性建模,相關參數如表1所示,其中退化模型M1中的時間尺度函數假設為Λ(t;θ)=tθ。
圖2給出了考慮沖擊韌性情形的m-δ沖擊模型的競爭失效可靠度曲線及不考慮隨機沖擊影響的退化系統可靠度曲線。通過對比可以發現,當考慮隨機沖擊時,產品的可靠度要明顯小于不考慮沖擊作用時的可靠度。這表明外界沖擊對退化過程的影響較大,不考慮隨機沖擊的情形過高地估計了產品的可靠性水平,有可能導致較為冒進的結果,對確定產品服役時間造成不利影響。計算結果可用于評價空間環境下器件的可靠性水平,幫助設計人員合理確定產品的服役時間,進而為制定設備在軌服務計劃與壽命管理提供技術支撐。

表1 競爭失效系統可靠性分析的參數設定Tab1e 1 Parameter setting for re1iabi1itv ana1vsis of competing fai1ure svstem
在此基礎上,為了分析競爭失效模型參數對系統可靠度的影響,對模型中的相關參數d、m進行了敏感性分析,結果如圖3和圖4所示。
圖3給出了性能參數的臨界退化失效閾值d不同取值時對應的可靠度曲線。可以看到,臨界退化失效閾值d對系統可靠度R(t)有顯著影響,可靠度隨著d取值增大而逐步增長。因為d取值越大,說明對退化增量的寬容度越大,可靠度越高。為了延長存儲芯片的使用壽命,工程師必須考慮總電離劑量的影響,并進行適當的加固設計。

圖2 競爭失效系統的可靠度曲線Fig.2 Reliability curves of competing failure system

圖3 參數d的敏感性分析Fig.3 Sensitivity analysis of parameter d

圖4 參數m的敏感性分析Fig.4 Sensitivity analysis of parameter m
圖4對容錯模型中的連續沖擊次數m的影響進行了分析。可以看出,系統可靠度R(t)對m/δ的比率比較敏感,通過增加比率(δ固定為500,m從4增加到8),R(t)的形狀變化很大。因為m/δ表示單位時間內允許的最大隨機沖擊次數。具有較大m/δ的系統可具有更好的可靠性能。另外,m=7和m=8(δ固定為500),可靠度曲線幾乎重合,這表示當m≥7時,容錯設備可以消除單粒子翻轉引起的突發失效。
綜上,隨機沖擊相關參數m和臨界退化失效閾值d對于系統可靠性均有很大的影響,在設計過程中可以考慮通過控制相關參數進行改善。
本文對于具有沖擊韌性的退化-沖擊相依競爭失效系統進行了可靠性分析,提出了一種基于非線性Wiener過程的競爭失效系統可靠性模型。該模型具有以下優勢:
1)使用非線性Wiener過程刻畫競爭失效系統的退化行為,與現有的廣義軌跡模型和線性Wiener過程相比,能夠更準確表征系統退化行為中的隨機性和非線性。
2)綜合考慮了隨機沖擊對退化過程的2種影響機制:退化量階躍增加和退化速率加速,更符合工程實際。
3)采用m-δ沖擊模型描述了沖擊韌性對于競爭失效系統可靠性的影響。
本文僅研究了含有一個退化過程和隨機沖擊的競爭失效可靠性模型,今后將考慮多性能參數同時退化的產品,如何進行隨機沖擊與多退化過程的相依競爭失效建模。