羅修輝,韋程東,王一茸
(廣西師范學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,南寧 530023)
大數(shù)定律決定了傳統(tǒng)的概率統(tǒng)計(jì)在進(jìn)行可靠性分析時(shí),需要有足夠的樣本容量來對未知分布特征進(jìn)行估計(jì),然而在工程實(shí)踐中、特殊產(chǎn)品壽命分析或者在對高科技新型裝備進(jìn)行可靠性分析時(shí),往往產(chǎn)生的是珍貴的小樣本(在工程實(shí)踐中,一般以樣本容量n≤30為小樣本),此時(shí)數(shù)據(jù)少的問題就顯得極為突出。在此情況下,如果將大樣本理論引用到對小樣本可靠性分析時(shí),顯然會(huì)導(dǎo)致估計(jì)精度降低,使得可靠性分析不那么可靠。因此,如何在小樣本情況下估計(jì)所研究未知分布的可靠性參數(shù)是一個(gè)急需解決的問題。
目前,小樣本可靠性參數(shù)估計(jì)主要有Bayes方法、Bayes Bootstrap方法和蒙特卡羅仿真方法[1-4]。但大多數(shù)文獻(xiàn)都是基于正態(tài)分布進(jìn)行研究的,而在大多情況下典型的可靠性分布都是非正態(tài)的,因而基于其他分布下去研究可靠性參數(shù)估計(jì)是非常必要的,本文正是在小樣本條件下研究指數(shù)分布可靠性的參數(shù)估計(jì)。
當(dāng)產(chǎn)品可靠性能指標(biāo)X~Exp(λ)且任務(wù)要求X≤x時(shí),產(chǎn)品可靠度可由式(1)計(jì)算:

其中F(x)為指數(shù)分布的分布函數(shù),I{A}表示A的示性函數(shù)。
由于參數(shù)λ真值無法獲取,于是,在估計(jì)產(chǎn)品的可靠度時(shí),首先需要通過樣本對參數(shù)λ進(jìn)行估計(jì)。

所以有λ=1/EX,故λ的矩估計(jì)為:

在指數(shù)分布中,有時(shí)記θ=1/λ,則θ為指數(shù)分布的數(shù)學(xué)期望。
另外,又因?yàn)椋?/p>

由此可得X方差為:

所以,根據(jù)替換原理,λ的矩估計(jì)也可以取為:

其中s為樣本標(biāo)準(zhǔn)差。由此可得到不同的矩估計(jì),這是矩估計(jì)的一個(gè)缺點(diǎn)。為了計(jì)算簡便,此時(shí)應(yīng)該選用低階矩來估計(jì)。
例1:由指數(shù)分布Exp(3),產(chǎn)生如下10個(gè)來自該分布的樣本數(shù)據(jù),0.920、0.143、0.1268、0.146、1.136、0.217、0.678、0.022、0.0004、0.0966,可認(rèn)為是產(chǎn)品某性能指標(biāo)服從Exp(3)的10個(gè)樣本,其樣本均值=0.349,現(xiàn)要求產(chǎn)品的性能指標(biāo)不大于1.5時(shí),根據(jù)式(3)可計(jì)算λ的估計(jì)值為=1/=2.865 ,再依據(jù)公式(1)可計(jì)算其可靠性為=0.9864。
對指數(shù)總體Exp(λ)設(shè)有樣本,則其似然函數(shù)為:

其對數(shù)似然函數(shù)為:

將lnL()λ關(guān)于λ求導(dǎo)并令其為0得到似然方程:

解之得:

由于:

于是,是極大值點(diǎn)。
所以,=1/是λ的極大似然估計(jì)。這與式(3)的矩估計(jì)結(jié)果一致。
經(jīng)典學(xué)派方法是根據(jù)總體信息和樣本信息進(jìn)行統(tǒng)計(jì)推斷;而貝葉斯方法與經(jīng)典學(xué)派方法主要不同之處在于:還需利用先驗(yàn)信息進(jìn)行統(tǒng)計(jì)推斷。其基本步驟如下:
(1)總體依賴于未知參數(shù)θ的概率密度函數(shù)為p(x|θ),其表示θ取某個(gè)值時(shí)總體的條件概率密度函數(shù)。
(2)確定θ的先驗(yàn)分布 π(θ)。
(3)分兩步產(chǎn)生樣本X=(x1,x2,…,xn),首先從 π(θ)中產(chǎn)生θ0,然后再從p(x|θ0)中產(chǎn)生X=(x1,x2,…,xn),由此可得到X的聯(lián)合條件概率密度函數(shù)為:

它包含了總體信息和樣本信息。
(4)由于按上述方法得到的θ0還是未知量,所以仍需兼顧其他可能的θ值,即要用π()θ進(jìn)行綜合,這樣可得樣本X與未知參數(shù)θ的聯(lián)合分布為:

這個(gè)聯(lián)合分布包含了上述三種信息。
(5)將h(X,θ)作如下分解:

其中m(X)是X的邊際概率函數(shù):

由此可以得到參數(shù)θ的后驗(yàn)分布計(jì)算公式:

(6)選取后驗(yàn)分布均值:

或后驗(yàn)分布的其他特征量做估計(jì)。但是根據(jù)以下定理,一般選取后驗(yàn)分布均值作為參數(shù)θ的估計(jì)量。
定理1[5]:設(shè)損失函數(shù)L(θ,a)=(θ-a)2,且Eθ2<∞則:

為參數(shù)θ唯一的Bayes估計(jì)。
仍然以指數(shù)分布為例,討論其參數(shù)λ的Bayes估計(jì)。設(shè)X1,X2,…,Xni.i.d.~Exp(λ)。取θ的共軛先驗(yàn)分布為伽瑪分布 Γ(b,α),其中超參數(shù)b,α已知,求λ的Bayes估計(jì)。
設(shè)X=( )X1,X2,…,Xn,則X的密度函數(shù)為:

從而λ的似然函數(shù)為:

其中∝的含義是:其余因子與λ無關(guān),而λ的共軛先驗(yàn)分布為 Γ(b,α),即:

則λ的后驗(yàn)分布:

添加正則化常數(shù)后,得到:

此后驗(yàn)分布為伽瑪分布Γ( )n+b,nx+α。
故由定理1可知,取λ后驗(yàn)期望估計(jì)為其Bayes估計(jì):

仍然采用例1的數(shù)據(jù),根據(jù)以上推導(dǎo),運(yùn)用Open BUGS軟件采用Gibbs抽樣法抽取10000個(gè)樣本編程對其可靠性進(jìn)行MCMC模擬可以得到=3.006,其可靠性估計(jì)值為R=0.9889。其參數(shù)迭代過程及參數(shù)分布圖如圖1和圖2所示。

圖1 Bayes參數(shù)估計(jì)迭代圖

圖2 Bayes方法參數(shù)分布圖
Bootstrap方法最早是由斯坦福大學(xué)教授Efron于1977年提出的。此方法認(rèn)為經(jīng)驗(yàn)分布函數(shù)能夠較好地?cái)M合總體分布,但在小樣本條件下,其擬合效果可能會(huì)比較嚴(yán)重,導(dǎo)致過大的估計(jì)誤差,因而可以考慮通過再抽樣來增加樣本量。Bayes Bootstrap方法(亦稱為隨機(jī)加權(quán)法),它的基本思想是:通過隨機(jī)加權(quán)來擴(kuò)充小樣本的樣本量,以此對參數(shù)進(jìn)行估計(jì)。這兩種方法都是通過計(jì)算機(jī)模擬,從小樣本中抽取再生樣本來獲得大樣本,由此對未知分布進(jìn)行模擬。
下面是Bootstrap方法的基本步驟:

(2)從Fn中抽取N組自助樣本具體方法為:
①從[0,M](M>>n)中產(chǎn)生隨機(jī)整數(shù)η,其必須滿足獨(dú)立性和均勻性的要求。
②令i=η%n,i為n整除η得到的余數(shù)。
③從原生樣本中以xi作為再抽樣本x*,其中xi為與i對應(yīng)下標(biāo)的觀測樣本,則x*可作為所需的隨機(jī)樣本。
(3)計(jì)算以下的自助統(tǒng)計(jì)量:

(4)用Rn(在給定經(jīng)驗(yàn)分布Fn的條件下)的分布去模擬Tn的分布。即有,于是可得到N個(gè),由此可求出θ的分布和特征量。
將Rn換成隨機(jī)加權(quán)統(tǒng)計(jì)量:

沿用例1的數(shù)據(jù),不考慮先驗(yàn)信息的情況下,由于樣本量n=10。設(shè)Fn是樣本X的經(jīng)驗(yàn)分布函數(shù),=1/是指數(shù)分布F參數(shù)的估計(jì)。則估計(jì)誤差:

構(gòu)造并產(chǎn)生N=10000組自助統(tǒng)計(jì)量:


圖3 Bootstrap方法參數(shù)分布圖

表1 評估結(jié)果比較表
構(gòu)造并產(chǎn)生N=10000組自助統(tǒng)計(jì)量:

由Bayes Bootstrap方法估計(jì)參數(shù)λ得到其服從的分布如圖4所示,其估計(jì)值見表1。

圖4 Bayes Bootstrap方法參數(shù)分布圖
通過表1所列結(jié)果,可以看出貝葉斯方法和Bayes Bootstrap方法相對于另外兩種方法對可靠性的估計(jì)結(jié)果更為精確。但是本算例中貝葉斯方法是基于伽瑪分布的先驗(yàn)信息情況下進(jìn)行的統(tǒng)計(jì)推斷,然而實(shí)際的可靠性分析中先驗(yàn)信息不一定容易獲得,此時(shí)Bayes Bootstrap就體現(xiàn)出了其優(yōu)勢。另外,由圖3和圖4發(fā)現(xiàn)由Bootstrap和Bayes Bootstrap方法估計(jì)得到的參數(shù)仿真曲線符合伽瑪分布概率函數(shù)曲線,這與λ的后驗(yàn)分布一致,這也給我們提供了在沒有先驗(yàn)信息情況下,如何運(yùn)用Bayes方法提供了一種思路,即先用Bootstrap和Bayes Bootstrap方法模擬出參數(shù)估計(jì)的分布概率密度曲線,以此確定先驗(yàn)分布的形式,然后再運(yùn)用Bayes方法進(jìn)行估計(jì)。因此,在具體分析中,幾種方法綜合運(yùn)用能起到更好的估計(jì)效果。
本文以指數(shù)分布為例對小樣本情況下的可靠性參數(shù)估計(jì)問題進(jìn)行了對比研究,并通過數(shù)值模擬說明了算法的有效性。模擬結(jié)果表明,在具有先驗(yàn)信息情況下,Bayes方法和Bayes Bootstrap方法更為適用;并給出了在沒有先驗(yàn)信息情況下,Bayes方法和Bayes Bootstrap方法結(jié)合使用的思路。但是如何通過改進(jìn)Bootstrap方法擴(kuò)充樣本容量來提高估計(jì)的精度還有待進(jìn)一步的研究。
[1]Efron B.The Jackknife,the Bootstrap and other Resampling Plans[M].Philadelphia:SIAM,1982.
[2]孫慧玲,胡偉文.小樣本條件下參數(shù)估計(jì)方法比較研究[J].統(tǒng)計(jì)與決策,2014,(24).
[3]馬智博,朱建士,徐迺新.有關(guān)正態(tài)分布的小樣本可靠性評估[J].核科學(xué)與工程,2003,23(4).
[4]曹軍海,杜海東,申瑩.基于改進(jìn)Bayes-Bootstrap方法的系統(tǒng)可靠性仿真評估[J].裝甲兵工程學(xué)院學(xué)報(bào),2016,30(1).
[5]陸璇.數(shù)理統(tǒng)計(jì)基礎(chǔ)[M].北京:清華大學(xué)出版社,1998.