龍沁怡, 徐麗平*, 龍 兵
(1.長江大學信息與數學學院, 湖北 荊州 434023; 2.荊楚理工學院數理學院, 湖北 荊門 448000)
Pareto分布作為一種統計模型,在工資收入、保險精算、城市規劃以及可靠性工程等領域有著極為廣泛的應用. 因此,對 Pareto產品進行可靠性試驗具有實際意義. 在本文中假定Pareto分布有如下的累積分布函數和概率密度函數:
(1)
(2)
其中,α(>0),θ(>0)分別被稱為尺度參數和形狀參數.為書寫簡便,將F(x;α,θ)和f(x;α,θ)分別簡記為F(x)和f(x).

對于截尾樣本來說,根據觀測數據預測未失效產品的信息是一個至關重要的問題.在試驗的早期階段可以告訴我們測試的成本有多高,以及是否需要重新設計試驗方案.目前關于預測方面的研究成果較多[13-17].本文假設受試產品的失效時刻服從Pareto分布,在雙定時混合截尾樣本下對產品的失效時刻進行了預測.
在這里將對文獻[12]中提出的雙定時混合截尾方案進行再次描述,該試驗方案如下.
假設在0時刻把n個獨立同分布的樣品投入試驗,它們的失效時刻分別為X1,X2,…,Xn,正整數m 記 即在時刻t1之前的失效樣品數為m1個,而在時刻t2之前的失效樣品數為m2個,m1,m2為隨機變量.如果m1≥m,則在時刻t1停止試驗,沒有失效的n-m1個樣品退出試驗,其中0 記 基于上述試驗數據,省略正則化常數后似然函數為 (3) 其中,I(·)為示性函數. 根據(3)式,利用極大似然法可得參數θ和α的極大似然估計分別為 (4) (5) [1-F(y)]n-k-s[1-F(t)]-(n-k), (6) 其中,y≥t. 對于Pareto分布(1)式,可以把(6)式變形為 (7) 在似然預測方法中,將運用極大似然法得到未知參數的估計和未來失效時刻的預測.基于觀測數據可以得到Y和(α,θ)的預測似然函數為 根據(3)和(7)式,則Y和(α,θ)的預測似然函數為 (8) 顯然α的極大似然估計為 (9) 取α=x1:n,去掉常數項后,對數預測似然函數為 nθlnx1:n-θ(s-1)lnt-[θ(n-k)+ (10) 根據(10)式,分別求對數預測似然函數關于θ和y的偏導數,則θ,Y的預測似然方程為 (11) (12) 由方程(11)和(12)可以得到Y=X(s+k):n的極大似然預測為 下面求出Y的條件分布的中位數,以此作為對Y的預測,并被稱為條件中位數預測. 根據(7)式,利用二項式展開 因此Y=X(s+k):n的條件概率密度函數可以變形為 (13) dj=n-k-s+j+1. 即 由條件概率密度函數(13),可以得到 (14) 由條件概率密度函數(13)不難得到Y=X(s+k):n的100(1-γ)%等尾預測區間為(L1,U1),其中L1和U1分別滿足下面的2個方程, (15) (16) 在Bayes統計分析中,未知參數先驗分布的選取是非常重要的,很多文獻中選擇Gamma分布作為先驗分布.在這里也選取θ的先驗分布為Gamma分布,其概率密度函數為 (17) 這里,超參數a>0,b>0,Γ(·)表示Gamma函數. 由(3)和(17)式,利用Bayes公式可得θ的后驗概率密度函數為 (18) 由(13)和(18)式可得Y=X(s+k):n的Bayes預測密度函數為 b]-(k+a+1). (19) 根據(19)式可以得到Bayes預測生存函數為 (20) 因此Y=X(s+k):n的100(1-γ)%的Bayes等尾預測區間的下限L2和上限U2分別滿足 (21) (22) 可以用數值方法求出方程(21)和(22)的解,從而得到Bayes預測區間(L2,U2).事實上,利用Bayes預測密度函數(19)式也可以求出Y=X(s+k):n的Bayes預測值. 采用Bayes方法可以借助先驗信息來提高統計推斷的精度,如果沒有先驗信息可以利用,也可以取無信息先驗分布,在這里取θ的無信息先驗分布為 (23) 由(3)和(23)式,可得θ的后驗密度函數為 (24) 實際上在(18)式中取a=0,b=0就得到后驗概率密度函數(24)式,因此Y=X(s+k):n的Bayes預測概率密度函數為 (25) 由(25)式可得到Bayes預測生存函數為 因此Y=X(s+k):n的100(1-γ)%的Bayes等尾預測區間為(L3,U3),其中下限L3和上限U3分別滿足 根據Z的概率密度函數(2)式,可得生存函數為 當α已知時,θ的極大似然估計為 根據后驗概率密度函數(18)式,可以得到第n+1個失效數據Z=Xn+1的后驗預測密度函數為 (k+a)(A+b)k+az-1× (lnz-lnα+A+b)-(k+a+1),z≥α. (26) 根據(26)式得到的Bayes預測生存函數為 (27) 由(27)式可得Z=Xn+1的Bayes中位數預測值為 zU=exp[(A+b)(γ-1/(k+a)-1)+lnα]. 下面將對文獻[18]中的數據集進行分析,把這些數據按照從小到大的順序排列如下:0.500 9、0.504 0、0.514 2、0.522 1、0.526 1、0.541 8、0.547 3、0.583 4、0.609 1、0.625 2、0.640 4、0.649 8、0.675 0、0.703 1、0.709 9、0.716 8、0.791 8、0.846 5、0.903 5、1.114 3. 借助上面的完全數據可以得到不同的雙定時混合截尾數據.已知α=0.5,利用文中的結論能夠計算出被截尾樣品未來次序失效時刻的預測值和預測區間(γ=0.05),相關結果列于表1中. 表1 Y=X(s+k):n的預測值和預測區間(a=0.5,b=0.2) 根據不同的雙定時混合截尾數據也可以得到Z=Xn+1的預測值和預測區間(γ=0.05),相關結果列于表2中. 表2 Z=Xn+1的預測值和預測區間 從表1可以看到,Y=X(s+k):n的3種預測區間的下限比較接近,當t1,t2,m和s固定時Y=X(s+k):n極大似然預測小于條件中位數預測,經典預測區間的長度最小,兩種Bayes預測區間的長度比較接近,真正的觀測值都落在3個預測區間的內部.在表2中對于超參數a,b的2種不同的取值及不同的雙定時混合截尾試驗數據,Xn+1的預測值和預測區間都比較接近,當t1,t2和m固定時,中位數預測值小于Bayes中位數預測值.從這個例子中也可以看到利用文中的結論所得到的失效時刻的預測值和真實的失效時刻還是比較接近的. 本文根據觀測到的雙定時混合截尾試驗數據,討論了未來失效數據的預測問題.當試驗樣品的失效時刻服從Pareto分布時,利用經典方法得到了被截尾樣品未來失效時刻的預測值.在取兩種不同的先驗分布時計算了未來失效時刻的預測區間.對于獨立同分布的任一產品,對它的失效時刻進行了預測.通過數值例子的計算,所得到的結果也是符合實際情況的.利用本文中的方法可以隨時根據觀測到的失效數據對未來的失效時刻進行預測,以便于估算試驗的費用,進而考慮是否需要重新確定試驗的終止時刻,在控制費用的情況下盡可能提高統計推斷的精度.另外在雙定時混合截尾試驗數據下,也可以討論其它壽命分布模型產品失效時刻的預測問題.2 極大似然估計及條件分布

3 未來觀測值的經典預測
3.1 似然預測方法


3.2 條件預測方法



3.3 經典預測區間

4 未來觀測值的Bayes預測

4.1 Gamma先驗分布

4.2 無信息先驗分布
5 任一觀測值的預測



6 數據分析


7 結論