趙愛紅 岳德權
(燕山大學 理學院,河北 秦皇島 066004)
在可靠性試驗中為了節約試驗時間和經費,即使采用加速壽命試驗的方法往往也很難得到完全樣本數據,得到的樣本數據往往是截尾的。截尾壽命試驗分為定時截尾壽命試驗和定數截尾壽命試驗兩種。定時截尾壽命試驗指試驗到指定時間就立即停止,定數截尾壽命試驗是指試驗到指定的失效個數停止。II型截尾數據是定數截尾壽命試驗下產生的樣本數據。在壽命試驗中,有時候不能連續測量產品的壽命,或者產品壽命本身就是離散型的數據,比如開關的使用壽命。因此需要對連續型壽命分布進行離散化,得到離散化的壽命分布,以擬合實際的壽命試驗數據,并且根據試驗數據對產品總體的可靠性進行統計推斷。Gusmao F R S和Ortega E MM等[1]提出了廣義逆威布爾分布,并且對該分布的一些性質進行了研究。Para B A和Jan T R[2]提出三參數離散廣義逆威布爾分布(簡稱DGIWD),給出了DGIWD完全樣本下參數的極大似然估計。
基于截尾數據的可靠性統計推斷,學術界有頗多研究。Zaizai Yan和TiefengZhu等[3]研究了基于II型截尾數據針對不同壓力試驗下威布爾回歸模型的點估計和區間估計,以及生存函數參數估計和平均失效時間等可靠性相關的統計推斷。彭秀云[4]在廣義逐次截尾數據的基礎上給出了逆威布爾分布基于貝葉斯統計方法的可靠性推斷,并推廣到其他的威布爾分布,提出了一個新的修正的威布爾分布。Zheng Zhang和Wenhao Gui等[5]基于II型逐次截尾數據,對廣義瑞利(GR)分布進行了統計推斷,得到了參數的最大似然估計,構造了參數和可靠度的置信區間;基于平方誤差損失函數,提出可靠性函數的貝葉斯估計,得到了點估計和最大后驗密度的置信區間估計。在小樣本方面,Yi Cui和YongboZhang等[6]提出了一種新的以區間統計為基礎的可靠性分析手段,解決了小樣本情況下數據缺少的問題,提高了估計的精確度。劉金萍[7]基于Bayes理論對小子樣的壽命分布進行可靠性統計分析,提供了一種新的混合威布爾分布的解析方法,在無失效數據情況下給出產品可靠度估計,改進了電力系統中離散馬爾科夫鏈模型出現在同一時間狀態停留時間長的缺點,使其可以快速分析電力系統的可靠性。Singh SK和Singh U等[8]在II型截尾數據下,針對連續型逆威布爾分布,給出了參數的貝葉斯估計,并且通過數值模擬對極大似然估計和貝葉斯估計的結果進行了比較。Sultana T和AslamM等[9]針對三變量混合逆威布爾分布的參數進行了貝葉斯估計,并且分別討論了先驗分布采用有信息先驗和無信息先驗兩種情況下的貝葉斯估計。
綜上,本文基于II型截尾數據,在小樣本情況下運用貝葉斯估計的方法對DGIWD的可靠性進行統計推斷,首先給出DGIWD三參數未知情況下參數、可靠度以及失效率的極大似然估計。其次討論先驗分布選取經驗分布情況下參數、可靠度以及失效率的貝葉斯估計,并且給出相應的最大后驗概率密度區間。最后通過數值模擬進行貝葉斯估計的模擬求解,并且對極大似然估計和貝葉斯估計進行比較。




接下來將討論在小樣本情況下更適用的DGIWD的貝葉斯估計。針對先驗分布采用經驗分布的情況,首先給出DGIWD的三個參數、可靠度和失效率的貝葉斯估計。其次給出貝葉斯區間估計。最后,通過數值模擬對DGIWD的貝葉斯估計和極大似然估計進行比較。
貝葉斯學派認為,任何一個未知參數都可以看作是一個隨機變量,可以用一個概率分布去描述這個隨機變量,而這個分布被稱為先驗分布。在經典統計學中,隨機變量X依賴于參數θ的分布函數記為p(x;θ);在貝葉斯統計中應當被記為 p(x|θ),被稱為 X的條件密度函數。
設從某總體X中抽取n個獨立同分布樣本,樣本的觀測值記為x1,x2,…,xn。則此時的樣本聯合條件密度函數為:

設未知參數θ的先驗分布為π(θ),由文獻[12]可知θ的后驗分布可以寫為:

其中符號“∝”表示式(3.2)兩邊只差一個與θ無關的常數。
在得到參數θ的后驗分布之后,進一步要從其后驗分布中提取信息,常用的準則是后驗均方誤差原則,即選擇使后驗均方誤差達到最小的統計量。在均方誤差準則下,參數θ的貝葉斯估計就是參數的后驗期望 E(θ|x)[13],即:

并且此時的最小后驗均方誤差正是后驗方差Var(θ|x)。類似地可知,未知參數的函數g(θ)在均方誤差準則下的貝葉斯估計為:



顯然,上述式(3.13)至式(3.17)無法給出顯式解。所以,本文要利用蒙特卡洛馬爾科夫鏈(MCMC)方法進行數值求解。在對各參數進行MCMC采樣時,需要知道各參數的滿條件后驗分布,上述各參數的滿條件后驗分布分別為:

貝葉斯區間估計主要有兩種,一種是可信區間,一種是最大后驗密度(HPD)可信區間。根據文獻[13]對可信區間和最大后驗密度可信區間的描述可知,在給定可信水平的情況下,通過后驗分布獲得的可信區間不唯一,所以本文中的區間估計將采取最大后驗密度(HPD)可信區間。HPD可信區間的定義如下:
設參數θ的后驗密度為π(θ|x),對于給定的概率1-α(0<α<1),若在 θ 的直線上存在這樣一個子集 C,滿足下列兩個條件:
(1)P(C|x)=1-α;
(2)對任給 θ1∈C和 θ2∈C,總有 π(θ1|x)≥π(θ2|x)。
則稱為C的θ可信水平為1-α的最大后驗密度可信集,簡稱(1-α)HPD可信集。如果C是一個區間,則稱C為(1-α)HPD可信區間。
對于上述(1-α)HPD可信區間,在采用MCMC進行模擬時,根據文獻[8]可知,可以從MCMC采樣得到的被估參數的序列,通過序列可以得到被估參數的(1-α)HPD可信區間。方法如下:
設{θi,i=1,2,…,M}是 MCMC 采樣過程中產生的被估參數的樣本序列,其中M是采樣總量。對MCMC采樣產生的樣本序列按照從小到大進行排序可得排序后的序列{θ(i),i=1,2,…,M}。那么參數 θ 的 100(1-ψ)%HPD可信區間為:

其中j*需滿足以下條件:

在式(3.18)和式(3.19)中,[x]指不超過 x的最大整數。
本節將進行數值模擬求解。本文采用MCMC中的M-H算法,通過不同的抽樣方案,給出了三個參數的極大似然估計值和貝葉斯估計值,并且在x=4處給出了可靠度和失效率的極大似然估計值和貝葉斯估計值。進一步,給出相應的置信水平為95%的HPD可信區間。在此,從服從q=0.005,β=1,α=0.8的DGIWD中模擬采樣。待估參數先驗分布的參數選取a=2,b=2,c=2,d=1.6。已知抽樣樣本量為n,截尾數量為r,現給出在不同截尾方案下,貝葉斯估計的估計結果如表1和表2所示。在表1和表2中,MLE表示極大似然估計值,MSE1表示極大似然估計的均方誤差。Bayes表示貝葉斯估計值,MSE2表示貝葉斯估計的均方誤差,HPDI表示HPD可信區間。

表1 不同試驗方案下極大似然估計和貝葉斯估計(r=12)

表2 不同試驗方案下極大似然估計和貝葉斯估計(r=16)
從表1和表2可以看出,極大似然估計的均方誤差和貝葉斯估計的均方誤差都非常小,說明在II型截尾數據下,不管采用極大似然估計還是貝葉斯估計,都能獲得比較有效的估計結果。因此,在進行產品可靠性統計推斷時采用II型截尾數據即能兼顧估計的準確性,又能在壽命試驗時節省大量經濟成本。
當固定樣本量n,增大截尾數量r時,可以看到參數q的極大似然估計值和貝葉斯估計值分別從0.00318211和0.00383738提升到0.00501721和0.00497780,更加接近參數q的真實值0.5。但是,其他未知參數變化很小。因此,增大樣本截尾量對估計的準確度雖有一定的提高,但是要考慮提高準確度帶來的收益和增大截尾數量導致的經濟成本之間的平衡關系。
通過表1和表2可以看到,抽樣的樣本量為20,屬于小樣本。雖然截尾方案不同,但各參數的貝葉斯估計的均方誤差大部分小于極大似然估計的均方誤差。在小樣本情況下,貝葉斯估計的準確度顯著高于極大似然估計的準確度。并且,貝葉斯估計的HPD區間覆蓋了參數的真實值。因此,在小樣本情況下,貝葉斯估計要優于極大似然估計。
本文研究了小樣本情況下,基于II型截尾數據離散廣義逆威布爾分布的可靠性統計推斷。首先,給出了參數、可靠度和失效率的極大似然估計。其次,在小樣本情況下,給出了參數、可靠度和失效率的貝葉斯估計,并且給出了相應的貝葉斯區間估計。最后,數值模擬結果表明,小樣本下貝葉斯估計的準確度顯著優于極大似然估計的準確度。同時,結果表明選擇II型截尾數據是進行產品可靠性推斷的一種非常經濟有效的選擇。