陶 鶴,劉 偉,付晶園
(1.蘭州財經大學隴橋學院;2.甘肅省高校區域循環經濟重點實驗室,蘭州 730101)
近年來,隨著科技水平的發展,產品安全性和可靠性引起了人們的普遍關注。一旦產品零部件發生故障,將影響產品正常運行,甚至影響消費者的人身安全。可靠性分析在產品系統和零部件安全性中得到廣泛應用。由于產品內部結構復雜,為其可靠性分析帶了困難。對于大部分耐用型消耗品,使用時間越長,其零部件磨損程度越大,可靠性越低,保障費用和維修次數也在逐漸增加。研究產品的可靠性可以減少維修費用和使用費用,從而提高了消費者的經濟效益。本文已有研究基礎上[1-9],主要討論的是產品可靠性問題,零部件可靠性評估是可靠性評估的基礎。結合神經網絡以及MCMC算法提出了關于產品對數正態分布可靠性模型的測定方法。
可靠性數學理論大約起源于20世紀30年代,最早研究的領域之一是機器維修問題。可靠性是指產品在規定時間內,規定條件下,完成規定功能的能力(ISO,1986)。產品的可靠性通常是用概率指標進行度量的,其壽命是一個非負隨機變量,研究其特征主要采用的工具是概率論。
通常產品的壽命用一個非負隨機變量T來表示,其分布函數為:

產品在t時刻以前都正常使用的概率,即產品在時刻t的可靠度函數為:

產品的平均故障時間為:

其中,E(T)表示時間T的期望值,MTTF也稱期望壽命。
對于不可維修產品,可靠性數量指標主要是可靠度函數(R(t))及平均故障時間(MTTF)。假設時刻t=0汽車電池開始正常工作,若T是它的壽命,則產品的運行時間的進程圖,如圖1所示。由于產品是不可維修產品,一旦失效便一直處于失效狀態。可靠度函數和平均故障時間描述了產品零部件的可靠性特征。

圖1 產品使用進程圖
服從對數正態分布的故障時間t的概率密度函數為:

式中:μ和σ分別為對數故障時間x=log(t)的均值和標準差。對數正態分布的故障率和可靠度函數分別為

式中:f(x)是對數正態概率密度函數;φ(·)是標準正態分布的累積分布函數。
從圖2和圖3(見下頁)中可以看出,在先驗分布中σ的取值不同,得到的曲線形狀有一定的區別,選擇先驗分布需征求專家意見和參考大量文獻。基于貝葉斯的零部件可靠性分析,主要分為兩部分,首先確定可靠性分布即確定先驗分布。其次,根據現場實驗數據,對產品先驗信息獲取與預處理,給出似然函數,利用貝葉斯公式給出后驗分布。

圖2 對數正態分布的密度函數

圖3 對數正態分布的累計分布函數
人工神經網絡是模擬生物神經網絡,主要模擬大腦的某些機理以實現一些特定的功能。可以將大量的功能簡單的神經元通過一定的拓撲結構組織起來,構成群體并行處理的計算結構。神經網絡的學習也稱為訓練,是指神經網絡調整自身網絡參數的過程。神經網絡的設計與應用遵循以下幾個步驟,分別為:數據收集、創建網絡、設計網絡的結構、初始化權重與閾值、訓練網絡、驗證網絡、使用網絡。
收集故障數據作為原始的小樣本數據,建立對數正態分布模型,利用Gibbs算法,計算經驗可靠度值。作為神經網絡的輸入,原始數據作為輸出,訓練BP神經網絡,對訓練完成的BP神經網絡進行模擬仿真,輸入隨機可靠度值,輸出擴充后的可靠性數據。確定原始數據的分布模型,并進行可靠性評估。但是先驗分布在樣本比較少的情況下,通常會產生很大的誤差,為了減少誤差,可采用以下三個公式計算可靠度。
海森公式:

近似中位秩公式:

數學期望公式:

公式(7)至公式(9)對于不同分布模型的參數估計,其誤差不同。
近年來,隨著馬爾可夫鏈蒙特卡羅算法(MCMC)的出現,高維積分計算問題得到了解決,可靠性領域的研究也更近了一步。常見的MCMC算法有兩類,分別是Metropolis-Hastings算法和Gibss算法。但是,Metropolis-Hastings算法的應用依賴于一個重要的前提條件:先驗分布的密度函數必須較為接近真實的后驗分布密度函數。在產品零部件的研究中,這一條件很難滿足。在專家的建議下,給出的先驗密度函數可能出現“過窄”和“過寬”的情況。若給出的先驗密度函數比后驗密度函數“過窄”,Metropolis-Hastings算法將大部分時間都在先驗分布的密度函數覆蓋區域內進行迭代,而無法訪問到后驗分布函數所覆蓋的其他區域。此算法計算的結果有較強的自相關性,導致得到的有效的獨立樣本量很小。若先驗密度函數“過寬”,將導致該算法在成百上千次迭代后仍停留在一個狀態,產生的有效樣本非常少。Gibbs抽樣也有其缺點,必須要推導出所有參數或者參數向量的全條件概率分布。但是實際應用中并不是所有參數的全條件概率分布都可以通過解析推導出來。在Gibbs算法中,能夠獲得全條件概率分布的參數可以用這種算法進行仿真實驗,而不能獲得的參數則利用M-H算法進行處理。在產品零部件故障模型中,μ和σ的條件分布可以計算出其解析解。為避免Metropolis-Hastings算法對先驗密度函數要求過高,這里采用Gibbs算法。針對產品零部件的故障時間數據,具體算法如下所示:
記故障時間為Ti,i=1,2,…,n,并假設對數正態模型為:

取先驗分布為:

μ和σ2的后驗分布為:

經計算得出μ和σ2的條件后驗分布為:

使用Gibbs抽樣算法計算對數正態分布可靠度步驟如下:
(1)對故障時間取對數,令yi=log(ti);
(2)令μ=μ(i-1),σ=σ(i-1);
(4)生成隨機數μ,μ~N(m,s2);
(5)令μ(i)=μ;
(7)生成隨機數τ,τ~Gamma(a,b);
(8)令σ2=τ以及σ(i)=σ;
(9)循環結束,輸出μ和σ均值及標準差;
(10)計算可靠度后驗中值。
以上步驟是Gibbs抽樣在產品零部件可靠性分析中的應用。本文是使用R語言進行編程,將零件故障的原始數據輸入,輸出其可靠度后驗中值。然后,采用貝葉斯x2對各個模型進行相關檢驗。最后,對得到的結論作出相關的文字分析說明。
對于任意一個統計模型,不可或缺的環節是檢驗模型的適用性。這種方法是由Pearson提出的貝葉斯x2擬合優度檢驗法。通過貝葉斯x2擬合優度檢驗衡量對數正態分布的適用性。
假設t1,t2,…,tn是來自f(t|θ)的獨立同分布的樣本,其累計函數是F(t|θ),θ的值已知。假設0=a0<a1<a2<…<aK-1<aK=1表示規定的均勻分布的分位點,并定義pj=aj-aj-1。最后,假設mj表示ti的觀測值,并且有aj-1<F(ti|θ)<aj。則皮爾遜x2檢驗統計量R0,具體數值為:

如果模型合適,則R0將服從一個具有自由度為K-1的x2分布。因此,可以通過R0的實際值與作為參考的x2分布的對比來進行擬合優度檢驗。
由試驗可知,汽車電池壽命近似服從對數正態分布。選用某型號汽車電池進行壽命統計實驗。選取13個單位做為樣本,具體故障時間數據如表1所示。

表1 蓄電池使用壽命
假設樣本數據服從對數正態分布:

式中μ和σ2相互獨立,分別表示對數故障時間的均值和方差:

使用Gibbs方法,可以獲得(μ,σ2)的聯合后驗分布曲線。第一步,根據最新μ的仿真樣本,從σ2的條件InverseGamma分布中生成σ2的樣本;第二步,根據最新的σ2樣本中生成μ的樣本。以上兩個步驟交替進行,直到平穩,獲得滿意的結果。(見表2)。

表2 經驗可靠度
當訓練誤差小于0.001,結束訓練。本文將得到樣本量為100的擴充樣本,將0~1區間內的100個隨機數按從大到小的順序排列成向量,輸入已經訓練完成的BP神經網絡進行仿真,得到100個新的故障數據,將其作為原始數據的擴充樣本,進行進一步研究。
對擴充的數據進行對數正態分布參數估計,通過從(μ,σ2)聯合后驗分布中抽樣,得出可靠度函數的后驗分布,結果如表3所示。

表3 對數正態模型的后驗分布
對擴大數據樣本,采用Gibbs抽樣進行對數正態分布的估計,其結果如表3所示。對數正態分布模型在海森公式下,其擴充數據樣本與原始數據的參數估計最接近,即通過仿真實驗可知,海森公式的誤差最小。擴充數據的相關系數相比原始數據的相關系數更接近與1,即擴充數據比原始數據恨到的參數估計更加準確,可靠性評估效果更好。隨著樣本量的增大,對數正態分布模型參數的MCMC仿真的誤差越來越小,估計結果就越來越接近真值,說明可靠性模型的適用性。對數正態分布變量的均值和方差分別為:

利用公式(16)和公式(17)計算汽車電池使用壽命的均值和方差估計結果,如表4所示。

表4 汽車電池使用壽命的均值和方差估計結果
對數正態分布模型可以作為汽車電池可靠性評估的分布模型,這與對數正態分布曲線形狀是相符的,且通過模型的判別和選取,可以根據曲線擬合的相關系數來實現。
下面對此模型進行擬合優度檢驗,取K=130.4=3,將(0,1)區間劃分為3個等概率的子區間,α=(0,0.3333,0.6666,1)。從后驗分Normal(7.0594,0.10200)中抽取一個樣本,?=7.0266,m=(4,5,4)。

汽車電池是不可維修產品,研究相對可維修產品相對更復雜一些。本文對產品的使用壽命進行可靠性分析,利用海森公式、近似中位秩公式和數學期望公式,對原始數據樣本和擴充都得數據樣本,建立了對數正態分布模型,使用MCMC方法對模型進行仿真,得到參數估計值。在數據擴充的同時需要考慮各個經驗公式計算的誤差,選擇合適的經驗公式很有必要。在對數分布模型下,海森公式的誤差最小,模擬的結果最為接近真實值。擴充后的數據與原始數據的變化規律基本相同,得到的結果,作為可靠性指標參數估計的參考數據。最后,對模型進行了Bayes可靠性檢驗,通過檢驗證明模型的適用性。通過R語言編制程序,可應用于汽車電池數據分析,從而為可靠性工程研究人員解決實際問題提供行之有效的方法。