邱雷顰
(閩江師范高等專科學校計算機系,福州 350002)
EM算法在基于區間數據的加速壽命試驗統計分析中的應用
邱雷顰
(閩江師范高等專科學校計算機系,福州 350002)
在步進加速壽命試驗中,當壽命服從廣義指數分布且獲得的數據是區間數據時,給出試驗安排,并通過“各應力下產品失效機理保持不變”等幾個基本模型假定,得出各應力水平下形狀參數相等的結論以及不同應力水平下的試驗時間t1-t0,t2-t1,…,ti-1-ti-2折算到某一應力水平下的時間τi-1的折算公式,進而得出求相關參數的極大似然估計的隱性表達式。進一步討論利用EM算法求解,先由E步求出期望,再由M步求出使得期望極大化的點,給出具體的迭代過程。最后采用Monte Carlo數據模擬方法分別在大樣本和小樣本場合下給出了參數真值的估計值,結果表明,該方法在大樣本場合下更具有效性。
區間數據;廣義指數分布;EM算法
加速壽命試驗,是指將樣品置于超過正常應力水平下,通過觀察樣品的失效時間(即壽命),從而利用統計方法推斷在正常應力條件下產品的各項可靠性指標的一種壽命試驗。目前常見的類型有恒定應力加速壽命試驗,步進應力加速壽命試驗,序進應力加速壽命試驗。文獻[1]中討論了加速壽命試驗的類型和理論基礎。本文討論步進應力加速壽命試驗,簡稱步加試驗,是先選定一組加速應力水平S1<… 然而,針對Gupta和Kundu提出的廣義指數分布[11],利用EM算法對區間數據的統計分析的研究并不多見。文獻[12]指出,在分析很多壽命數據時,廣義指數分布往往比其它分布更能有效利用。近年來,雙參數廣義指數分布已經很廣泛的運用到分析壽命數據。文獻[13]研究了廣義指數分布的尺度參數的極大似然估計基于隨機截尾模型。文獻[14]介紹了形狀參數的增加,使得這一分布族產生了更多的靈活性,使它可以被用來分析刪失數據,如區間數據。 本文將主要討論當獲得的壽命數據為區間數據,而壽命分布服從廣義指數分布時相關參數的統計分析。 1.1 試驗安排 1.2 基本假定 假定1 在應力水平Si(i=1,2,…,m)下,產品的壽命分布為廣義指數分布,分布函數為Fi(t)=(1-e-λit)αi,密度函數為fi(t)=αiλi(1-e-λit)αi-1·e-λit,其中λi和αi分別是尺度參數的倒數和形狀參數,和應力水平Si有關。 假定2 在應力水平Si(i=1,2,…,m)下,產品的失效機理保持不變[1]。 假定3 產品在應力水平S下,滿足線性加速模型lnλi=a+bφ(Si),其中φ(Si)是與應力水平Si有關的已知函數,下記φi,i=1,2,…,m。 假定4 產品的剩余壽命僅依賴于當時已累積失效的部分和當時的應力水平,而與累積的方式無關[15]。 引理1 在應力水平Si(i=1,2,…,m)下,產品的壽命分布為Fi(t)=(1-e-λit)αi,則αi≡α(i=1,2,…,m)。 由基本假定2,在應力水平Si(i=1,2,…,m)下,產品的失效機理保持不變,即加速系數是與R無關的常數,因此要求αi≡α(i=1,2,…,m)。 引理2 若記τi-1為產品經歷了水平S1,S2,…,Si-1的步加試驗后,各段試驗延續時間t1-t0,t2-t1,…,ti-1-ti-2折算到Si應力水平下總的折算時間,則 證明 由基本假定4知τi-1滿足 又由假定1和假定2得: (1-e-λiτi-1)α=(1-e-λi-1(ti-1-ti-2+τi-2))α 得到, e-λiτi-1=e-λi-1(ti-1-ti-2+τi-2) 由此得到遞推公式 又由τ0=0得 其中,i=2,3,…,m。由基本假定知, 所以,τi-1為b的函數,下記τi-1(b), i=1,2,…,m。 估計a,b,α三個參數。記n個樣品的失效時間為Xk,k=1,2,…,n,它們是獨立同分布的隨機變量,密度函數為f(x)=αλ(1-e-λx)α-1·e-λx, x>0,λ>0,α>0。只能觀測到落在區間[ti,ti+1)中的樣本數ni,其中i=0,1,2,…,m,0=t0 x落在區間[ti,ti+1)中的概率為 P(x∈[ti,ti+1))=Fi+1(ti+1)-Fi(ti)= [1-e-λi+1(ti+1-ti+τi(b))]α-[1-e-λi(ti-ti-1+τi-1(b))]α 其中記t-1=τ-1(b)=0,λ0=λm+1=0。 定理1 參數a,b,α的極大似然估計可以由隱性表達式求解。 (1) (2) (3) 其中, 證明 容易得到似然函數為 對數似然函數為 式(1)、式(2)和式(3)無法得出a,b,α的顯性表達式,于是考慮用EM算法實現。 為了便于表述,n個樣品的失效時間Xk,k=1,2,…,n的全體記為X,觀測結果即落在區間[ti,ti+1)中的樣本數目ni, i=0,1,2,…,m, 0=t0 于是 [1-exp[-ea(k)+b(k)φi(t-ti-1+τi-1(b(k)))]]α(k)-1· exp[-ea(k)+b(k)φi(t-ti-1+τi-1(b(k)))] 其中, [1-exp[-ea(k)+b(k)φi(ti-ti-1+τi-1(b(k)))]]α(k)- [1-exp[-ea(k)+b(k)φiτi-1(b(k))]]α(k) 所以 其中, AiAi(a,b,t)1-exp[-ea+bφi(t-ti-1+ τi-1(b))] (4) a= (5) (6) 迭代過程: (1)當k=0時,給定參數初始值a(0),b(0),α(0),及任意小的正數ε。 (2)當k≥1時,現有的參數估計為a(k),b(k),α(k)。 ①取式(4)右邊的,b=b(k),即可找到α(k+1), ②取式(5)右邊的b=b(k),a=a(k),α=α(k),即可找到a(k+1), ③令式(6)為零,即可解出b的顯示表達式,令表達式中a=a(k),b=b(k),α=α(k)找到b(k+1), 其中, (t-ti-1+τi-1(b(k)))] 滿足迭代終止的條件后繼續進行20次迭代,取所得到的20個參數迭代值的平均值作為對真實參數的估計 考慮步進加速壽命試驗過程中的應力為溫度,其中T1=240,T2=350,T3=470,φi=φ(Ti)=1/Ti,t0=0,t1=1.20×104,t2=1.55×104,t3=1.66×104,參數真值為a=-20,b=104,α=2,取迭代初始值a(0)=-18,b(0)=12000,α(0)=2.5。 在小樣本場合下,取n0=n1=n2=5,ε=10-3,在大樣本的場合下,取n0=n1=n2=100,ε=10-3運用以上迭代過程得到參數真值的估計,見表1。 表1 模擬結果 由數據模擬結果表1可知,在大樣本場合下,估計值與參數真值的相對誤差有所減小。因此,在產品壽命服從廣義指數分布的情況下,基于獲得的數據為區間數據的步進加速壽命試驗,在大樣本場合下利用EM算法給出參數的最大似然估計顯得更為有效。 [1] YANG Y H,ZHOU Y Q.Theoretical foundation of accelerated life testing[J].Journal of Propulsion and Technology,2001,22(5):353-356. [2] ZHAO W,ELSAYED E A.A general accelerated life model for step-stress testing[J].IIE Trans,2005,37:1059-1069. [3] MOHAMED T.Step-Stress Accelerated Life Tests[C]//Miodrag Lovric.International Encyclopedia of Statistical Science,Springer,America:2011:1547-1517. [4] DEMPSTER A P,LAIRD N M,RUBIN D B.Maximum likelihood from incomplete data via the EM algorithm[J].Math SciNet Google Scholar.JR Stat Soc Ser B,1977,39:1-22. [5] WU C F.On the convergence properties of the EM algorithm[J].The Annals of Statistics,1983,11(1):95-103. [6] AMBROISE C.The EM Algorithm and Extensions[J].Journal of classification,1988,15(1):154-156. [7] CHARLES B,PAUL P B.Handbook of Mathematical Methods in Imaging[M].New York:Springer-Verlag,2015. [8] HUANG W H,CHEN Y G.The multiset EM algorithm[J].Statistics & Probability Letters,2017,126:41-48. [9] SUVRA P,BALAKRISHNAN N.Destructive negative binomial cure rate model and EM-based likelihood inference under Weibull lifetime[J].Statistics & Probability Letters,2016,116:9-20. [10] JEAN-PATRICK B,GILLES C.EM for mixtures[J].Statistics and Computing,2015,25(4):713-726. [11] GUPTA R D,KUNDU D.Generalized exponential distributions[J].Australian & New Zealand Journal of Statistics,1999,41:173-188. [12] CHIANG-SHENG L,HSINE-JEN T.A note on the generalized linear exponential distribution[J].Statistics & Probability Letters,2017,124(5):49-54. [13] NAMHYUN K.Approximate MLE for the scale parameter of the generalized exponential distribution under random censoring[J].Journal of the Korean Statistical Society,2014,43(1):119-131. [14] DEBASIS K,RAMESHWAR D G.An extension of the generalized exponential distribution[J].Statistical Methodology,2011,8(6):485-496. [15] NELSON W B.Accelerated life testing-step-stress models and data analysis[J].IEEE Transaction on Reliability,1980,29(2):103-108. Statistical Analysis Based on EM Algorithm for Accelerated Life Testing Under Interval Censored Samples QIULeipin (Department of Computer Science, Minjiang Teachers College, Fuzhou 350002, China) An accelerated life test carried out by step stress is considered when the the life time follows a generalized exponential distribution and the failure data obtained is interval censored. The test procedure is presented and the exchange formula of time is given by some assumptions. With the help of the expectation-maximization (EM) algorithm which is widely used when the observations can be viewed as incomplete data, the maximum likelihood estimates are computed. Moreover, an example by Mote Carlo data simulation is given to illustrate the procedure and show that this method is available, especially in large sample case. interval censored; generalized exponential distribution; EM algorithm 2017-06-06 福建省教育廳中青年課題(JAT160827) 邱雷顰(1980-),女,福建石獅人,講師,碩士,主要從事概率與數理統計方面的研究,(E-mail)qiuleipin@163.com 1673-1549(2017)04-0081-06 10.11863/j.suse.2017.04.15 0212.7 A
1 試驗安排及基本模型假定

2 參數估計








3 EM算法求極大似然估計













4 數據模擬
