代 瑩,王蓉華,徐曉嶺
(1.上海師范大學 數理學院,上海 200234;2.上海對外經貿大學 統計與信息學院,上海 201620)
非負隨機變量X服從參數為θ的Lindley分布,則其概率密度函數f(x)和分布函數
Lindley分布是由Lindley[1,2]提出的一種分析壽命數據的新的分布。該分布在應力-強度模型的可靠性研究中具有非常重要的作用,而且Ghitany等人在文獻[3]中指出,Lindley分布具有的很多數學性質比指數分布的還要靈活,利用Lindley分布模型來擬合壽命數據在很多方面比用指數分布模型的效果還要好。Zakerzadeh和Dolai在文獻[4]中提出了廣義Lindley分布。文獻[5]和文獻[6]中也分別對Poisson-Lindley分布和zero-truncated Poisson-Lindley分布進行了討論。杜偉娟等在文獻[7]中討論了獨立同分布樣本情形下Lindley分布參數的經驗Bayes(EB)單側檢驗問題,利用密度函數的遞歸核估計構造了參數的EB檢驗函數,在適當條件下證明了所提出的EB檢驗函數的漸近最優性,并獲得了其收斂速度。龍兵在文獻[8]中研究了Lindley分布參數的區間估計和假設檢驗問題,在全樣本場合下給出了參數的置信區間和假設檢驗的拒絕域,并通過Monte-Carlo模擬說明了所給方法的應用。
Lindley分布有如下基本性質:
定理1[3]:設非隨機變量X服從參數為θ的Lindley分布,則:

(6)當θ≥1時,f(x)嚴格單調下降;當 0<θ<1時,f(x)呈“倒浴盆”形;
設產品壽命X服從參數為θ的Lindley分布,隨機從一批產品中抽取n個樣品進行壽命試驗,定時截尾時間為t0,若記xk為第k個樣品的壽命,則第k個樣品的試驗時間Sk(t0)是如下隨機變量:

其試驗總時間為:

顯然,S1(t0),S2(t0),…,Sn(t0)是獨立同分布的隨機變量,若記其分布函數為G(t),則在t≤0時,Sk(t0)的分布函數G(t)=0,當t>0時有:

上式的第一項為:

上式第二項為:

由此可得Sk(t0)的分布函數為:

由Sk(t0)的分布函數可以看出,諸Sk(t0)是既非離散又非連續的隨機變量,由于Sk(t0)又都是有界隨機變量,它的期望與方差總存在,分別為:

容易驗證,當t0→+∞時,上述期望和方差分別為Lindley分布的期望和方差。
S1(t0),S2(t0),…,Sn(t0)是獨立同分布的有界隨機變量,所以由中心極限定理知,當n很大時,總試驗時間S(t0)近似服從正態分布,即:

首先給出定時截尾下參數θ的極大似然估計。設X1,X2,…,Xn為來自參數為θ的Lindley分布總體X的一個容量為n的樣本,試驗進行到t0(t0是預先給定的正數)時刻停止。設在時刻t0以前有r個產品失效,記相應的失效時間為x(1)≤x(2)≤…≤x(r)≤t0
似然函數為:


則上述方程的根即為參數θ的極大似然估計。
引 理 :對a>0,θ>0 的 方 程有唯一正實根。

則所求方程有唯一正實根。
下面用所得的參數θ的極大似然估計部分替換樞軸量H(θ)中的θ,從而容易得出近似置信區間和近似置信限。
記Uα2為標準正態分布的上側α2分位數,則參數θ的置信水平為 1-α的近似置信區間為 [1,2],其中1,2分別為如下方程的根:

也即:

首先產生來自Lindley分布θ=0.5,θ=1,θ=1.5,θ=2,θ=2.5,θ=3的隨機樣本,其樣本容量分別為10,15,20,25,30,然后取置信水平為α=0.1,根據上述公式計算θ的近似置信區間,如此重復1000次計算出各個樣本量和各種截尾次數下近似置信區間的覆蓋率及區間長度如表1所示。

表1 近似置信區間的覆蓋率和平均長度
從上述模擬結果可以看出,在置信水平方面該方法還是可行的。
例1:取n=35,θ=0.5隨機產生一組服從Lindley分布的數據:
0.0862 ,0.2368,0.5039,0.5777,0.8323,0.9287,1.0101,
1.1329 ,1.1397,1.3328,1.3364,1.3729,1.4431,1.5088,
1.5890 ,1.7558,1.9672,2.0647,2.2915,2.4510,2.5994,
3.0736 ,3.3280,3.4773,3.8549,3.9115,4.5798,5.0378,
5.1388 ,5.7566,6.7986,7.1352,7.3523,9.5156,10.8070
取截尾時間t0=5,取置信水平為α=0.1,標準正態分布的分位數U0.05=1.64,在定時截尾樣本下θ的極大似然估計為=0.5266,按上述方法得到的近似置信區間為[0.3656,0.8547]。
例2:文獻[9]中某一型號坦克維修過程中,經過47次觀察得到基層Ⅰ級預防性維修二級保養時間的現場觀測值如下(單位:小時):
0.80 ,1.00,1.00,1.41,1.50,1.50,1.50,2.00,2.00,2.00
2.00 ,2.50,2.50,2.75,3.20,3.30,3.70,3.80,3.80,4.00
4.00 ,4.00,4.00,4.00,4.00,4.10,5.00,5.00,5.50,5.50
5.50 ,6.00,6.50,7.00,7.16,7.75,8.00,8.00,9.50,9.73
10.00 ,11.40,12.00,12.00,14.00,15.21,15.50
先對樣本數據進行擬合檢驗,檢驗其是否服從Lindley分布:
在文獻[9]中對樣本數據進行了χ2擬合優度檢驗,按照文獻[9]的分組方法對樣本進行分組,假設H0:該型坦克的基層Ⅰ級預防性維修二級保養時間服從艾拉姆伽分布,參數t0的極大似然估計為:t?0=5.4598,檢驗結果如表2所示。

表2 原假設H0的 χ2檢驗計算結果
χ2擬合優度檢驗的自由度取值為:區間數-未知參數個數-1,在文獻[9]中將樣本分成了6個區間,艾拉姆伽分布的分布函數中含有一個未知參數θ,但其檢驗的自由度取3,這是不正確的,所以此處取自由度為4更為妥當。
χ2擬合優度檢驗依賴于區間的劃分,即使原假設H0:F(x)=F0(x)不成立,在某種劃分下還是可能有F(ai)-F(ai-1)=F0(ai)-F0(ai-1)=pi0,i=1,2,…,m,從 而不影響統計量的值。所以,下面用柯爾莫哥洛夫檢驗對樣本數據進行檢驗。
柯爾莫哥洛夫檢驗:設隨機變量X的分布函數F(x)未知,X1,X2,…,Xn為從中抽取的簡單隨機樣本,F0(x)為給定的某個分布函數。檢驗問題H0:F(x)=F0(x)。首先,將樣本觀測值從小到大排列為x(1),x(2),…,x(n),求出F(x)的經驗分布函數為:

給出檢驗水平α,查表得到檢驗的臨界值Dn,α,在n較大時可近似的決定檢驗的臨界值,其中,當α給定時,λ可查表求出。若Dn>Dn,α則拒絕原假設H0,否則就接受原假設H0。
柯爾莫哥洛夫檢驗此樣本是否服從Lindley分布:取置信水平為α=0.05 ,查表得λ1-α=1.36,則檢驗統計量:

故接受原假設H0,即認為這批產品的壽命服從Lindley分布。
如取定時截尾時間為t0=9,置信水平為α=0.1,標準正態分布的分位數U0.05=1.64,在定時截尾樣本下θ的極大似然估計為=0.3137,按上述方法得到的近似置信區間為[0.1714,0.5058]。
[1]Lindley D,Introduction to Probability and Statistics from a Bayesian Viewpoint[J].Cambridge University Press,1965.
[2]Lindley D V,Fiducial Distributions and Bayes’theorem[J].Journal of the Royal Statistical Society,1958,(20).
[3]Ghitany M E,Atieh B,Nadarajah S.Lindley Distribution and Its Application[J].Mathematics and Computers in Simulation,2008,78(4).
[4]Zakerzadeh H,Dolati A.Generalized Lindley Distribution[J].Journal of Mathematical Extension,2017.
[5]Sankaran M,The Discrete Poisson-Lindley Distribution[J].Biometrics,1970,(26).
[6]Ghitany M E,Al-Mutairi D K,Nadarajah S.Zero-truncated Poisson-Lindley Distribution and Its Application[J].Mathematics and Computers in Simulation,2008,79(3).
[7]杜偉娟,彭家龍,李體政.Lindley分布參數的經驗Bayes檢驗的收斂速度[J].統計與決策,2012,(21).
[8]龍兵.Lindley分布中參數的區間估計和假設檢驗[J].廣西民族大學學報,2014,20(1).
[9]呂會強,高連華,陳春良.艾拉姆咖分布及其在保障性數據分析中的應用[J].裝甲兵工程學院學報,2000,16(3).