宗鳳喜,李如兵,2
(1.曲靖師范學院 數學與統計學院,云南 曲靖 655011;2.上海財經大學 經濟學院,上海 200433)
排序集抽樣是Mclntyre[1,2]首次提出的,在樣本容量相同的情況下,與簡單隨機抽樣相比,排序集抽樣得到的樣本包含更多的總體信息,從而能夠對總體做出更準確的推斷。有時候,對樣本的測量可能比較困難,比如成本較高,或者花費時間較長,或者具有破壞性,但是通過簡單的方法容易對樣本的大小進行排序,比較適合用排序集抽樣方法。很多學者都研究了基于排序集抽樣的情況下,某些分布未知參數的Bayes估計。例如,Adatia[3]介紹了half-logistic分布在排序集抽樣下的Bayes估計;Shaibu和Muttlak[4]介紹了在排序集抽樣下正態分布、指數分布以及Gamma分布的Bayes估計和相關性質;Sinha等[5]研究了在排序集抽樣下正態分布和指數分布參數的最優線性無偏估計;Stokes[6]研究了在排序集抽樣下位置-尺度分布族參數的最大似然估計;Al-Saleh等[7]探討了在排序集抽樣下基于平方損失函數指數分布參數的Bayes估計,Sadek等[8]研究了在排序集抽樣下指數分布參數的Bayes估計。
Pareto分布是意大利經濟學家Pareto(1987)將其作為一種收入分布最先研究的,一個多世紀以來,被廣泛應用在很多領域,比如,個人收入、城市人口、股票價格、保險風險、商業失效、某種藥理過程后病人的存活時間等都可以用Pareto分布來描述。因此,研究Pareto分布具有重要的理論意義和實用價值。國內外很多學者都討論過Pareto分布的性質:Abu-Dayyeh等[9]研究了排序集抽樣下Pareto分布形狀參數及尺度參數的最大似然估計、最小方差無偏估計;Omar等[10]研究了在極值排序集抽樣下Pareto分布形狀參數及尺度參數的矩估計以及最小偏差無偏估計;Ouyang等[11]對壽命分布為Pareto分布的n個元件進行定數截尾實驗,當觀測到有r個元件失效后,研究了剩余元件的失效時間以及還需要的實驗時間的Bayes預測;李海芬和峁詩松[12]討論了Pareto分布的R2檢驗法;李艷穎[13]在平方損失及Q-對稱熵損失下給出了Pareto分布形狀參數的貝葉斯估計,并討論了估計的容許性;康會光等[14]和韋瑩瑩等[15]研究了Linex損失下Pareto分布族參數的經驗Bayes估計。
本文針對Pareto分布的尺度參數,首先給出基于簡單隨機樣本(SRS)下的Bayes估計,接著研究基于排序集樣本(RSS)下的Bayes估計,最后通過Monte Carlo模擬來比較各種估計的偏差和均方誤差,結果表明,相同條件下基于RSS得到的估計比基于SRS得到的估計更有效,并且在相同條件下基于共軛先驗得到的估計比基于Jeffreys先驗得到的估計更有效。
設總體的概率密度和分布函數分別為f(x),F(x),容量為n的排序集樣本按如下程序獲得:首先從總體中獲取容量為 n2個簡單隨機樣本:X11,X12,…X1n;X21,X22,…,X2n;…;Xn1,Xn2,…,Xnn。對每組樣本按從小到大的順序進行排序:X(1)1,X(1)2,…X(1)n;X(2)1,X(2)2,…,X(2)n;…;X(n)1,X(n)2,…X(n)n。記Yi=X(i)i,i=1,2,…,n。則稱Y1,Y2,…,Yn為一組只有一個循環的排序集樣本,如將上述過程循環m次,則可以得到有m個循環的排序集樣本:Y11,Y12,…Y1n;Y21,Y22.,…,Y2n;…;Ym1,Ym2,…,Ymn,簡稱 RSS。在上述獲取RSS的過程中,如果假設排序過程中不存在誤差,或誤差非常小可以忽略不計,則Yi或Yjii=1,2,…,n;j=1,…,m的概率密度即為容量為n的簡單隨機樣本(SRS)的第i個次序統計量的概率密度,具有如下表達式:

Pareto分布的概率密度和分布函數分別為如下表達式:

其中,θ為形狀參數,α為尺度參數,也稱為門限參數,在這里假設是已知的。
損失函數是Bayes估計中非常重要的一部分,下面給出本文中涉及到的三種損失函數:平方損失函數(squard error loss function)、Q-對稱熵損失函數(Q-symmetric entropy loss function)、Linex 損失函數(Linex loss function),表達式分別為:

其中,δ是θ的估計值。
研究Bayes估計的前提是要給出待估參數的先驗分布,本文主要考慮共軛先驗分布即Gamma分布,以及Jeffreys先驗分布,其表達式分別為:

當β=λ=0,共軛先驗分布就變成了Jeffres先驗分布。
設X1,X2,…,Xn為來自Pareto分布的簡單隨機樣本(SRS),x1,x2,…,xn為相應樣本的觀測值;設Y1,Y2,…,Yn為來自Pareto分布的只有一個循環的排序集樣本(RSS),y1,y2,…,yn為相應樣本的觀測值;Y11,Y12,…Y1n;Y21,Y22.…,Y2n;…;Ym1,Ym2,…,Ymn為來自Pareto分布的有m個循環 的 排 序 集 樣 本 ,y11,y12,…,y1n;y21,y22,…,y2n;ym1,ym2,…,ymn為相應樣本的觀測值,本文用 π(θ|x),π(θ|y)分別表示在給定SRS(X)和RSS(Y)下的參數θ的后驗概率密度。
基于SRS的Bayes估計,很多文獻都進行了研究,這里只是以定理的形式列舉出來,而要推導出定理中涉及的結論,要用到的關鍵內容以引理的形式給出,這些引理在后面推導基于RSS的Bayes估計時也要用到,并且下面的引理適用于任何分布的參數以及任何給定的先驗分布。
引理1[16]:在給定先驗分布及平方損失函數下,θ的Bayes估計為后驗分布 π(θ|X)的均值,即:

并且該估計是唯一的,是可容許的。
引理2[13]:在給定先驗分布及Q-對稱熵損失函數下,θ的Bayes估計為:

并且該估計是唯一的,是容許的。
引理3[13]:在給定先驗分布及Linex損失函數下,θ的Bayes估計為:

并且該估計是唯一的,是容許的.
下面以三個定理的形式給出基于平方損失、Q-對稱熵損失以及Linex損失下θ的Bayes估計。
定理1[13]:在SRS和平方損失函數下:基于Gamma先驗分布θ的Bayes估計為:

而基于Jeffreys先驗分布的Bayes估計為:

定理2[13]:在SRS和Q-對稱熵損失函數下,基于Gamma先驗分布θ的Bayes估計為:

而基于Jeffreys先驗分布θ的Bayes估計為:

定理3[13]:在SRS和Linex損失函數下,基于Gamma先驗分布,θ的Bayes估計為:

而基于Jeffreys先驗分布θ的Bayes估計為:

定理4:在只有一個循環的RSS和平方損失函數下,基于Gamma先驗分布θ的Bayes估計為:

而基于Jeffreys先驗分布的Bayes估計為:

其中Cij(j)同上
證明:由式(1)至式(3)式可知Yj的概率密度為:

由于Y1,Y2,…,Yn是相互獨立的,因此只有一個循環的RSS的聯合概率密度為:

因此,當先驗分布為Gamma分布時,θ的后驗概率密度 π(θ|Y)有如下性質:


根據Gamma分布概率密度的性質,由引理1可得在只有一個循環的RSS和平方損失函數下,基于Gamma先驗分布θ的Bayes估計為:

當上式中的β=λ=0時,可得在只有一個循環的RSS和平方損失函數下,基于Jeffreys先驗分布的Bayes估計為:

定理5:在只有一個循環的RSS和Q-對稱熵損失函數下,基于Gamma先驗分布θ的Bayes估計為:
其中Cij(j)同上

而基于Jeffreys先驗分布的Bayes估計為:

注:由引理2、定理4中的式(20)以及Gamma分布概率密度的性質,定理5很容易得到證明。
定理6:在只有一個循環的RSS和Linex損失函數下,基于Gamma先驗分布θ的Bayes估計為:

而基于Jeffreys先驗分布的Bayes估計為:

與定理4中的相同。
注:由引理3、定理4中的式(20)以及Gamma分布概率密度的性質,定理6很容易得到證明。
下面介紹在有m個循環的RSS下Pareto分布尺度參數θ的Bayes估計。
定理7:在有m個循環的RSS和平方損失函數下,基于Gamma先驗分布θ的Bayes估計為:

而基于Jeffreys先驗分布的Bayes估計為:


其中:

因此,當先驗分布為Gamma分布時,θ的后驗概率密度 π(θ|Y)有如下性質:


根據Gamma分布概率密度的性質,由引理1可得在有m個循環的RSS和平方損失函數下,基于Gamma先驗分布θ的Bayes估計為:

當上式中的β=λ=0時,可得在有m個循環的RSS和平方損失函數下,基于Jeffreys先驗分布的Bayes估計為:

定理8:在有m個循環的RSS和Q-對稱熵損失函數下,基于Gamma先驗分布θ的Bayes估計為:

而基于Jeffreys先驗分布的Bayes估計為:

注:由引理2、定理7中的式(27)以及Gamma分布概率密度的性質,定理8很容易得到證明。
定理9:在有m個循環的RSS和Linex損失函數下,基于Gamma先驗分布θ的Bayes估計為:

而基于Jeffreys先驗分布的Bayes估計為:

注:由引理3、定理7中的式(27)以及Gamma分布概率密度的性質,定理9很容易得到證明。
在上文中,在Matlab中利用Monte Carlo法,通過比較偏差和均方誤差來比較得到的各種估計的優劣,偏差與均方誤差越小,估計就越好。借鑒文獻[8],本文取n=3,4,5,6;λ=β=1;C=1,-1;關于Pareto分布,本文選取文獻[10]中涉及到的一個真實模型:α=1.625,θ=2.314.q=1。模擬結果見下頁表1和表2。
從表1發現,關于參數θ的所有Bayes估計都是有偏的,但偏差隨著樣本容量n的增加而減小;相同條件下,基于Gamma先驗分布得到的參數θ的Bayes估計值與基于Jeffery先驗分布得到的Bayes估計值相比,偏差要小一些;最重要的是,在相同條件下,基于RSS得到的參數θ的Bayes估計與基于SRS得到的Bayes估計相比偏差要小得多。
從表2發現,所有Bayes估計的均方誤差隨著樣本容量n的增加而減小,符合點估計的一般要求;相同條件下基于Gamma先驗分布得到的參數θ的Bayes估計值與基于Jeffery先驗分布得到的Bayes估計值相比,均方誤差明顯的小很多;最重要的是,在相同條件下,基于RSS得到的參數θ的Bayes估計與基于SRS得到的Bayes估計相比,均方誤差要小的多.當c=-1時,定理6中的式(24)對數中出現了負數,所以此時的偏差與均方誤差都是復數,在表1和表2中復數沒有列出。表1和表2的結果充分表明了,針對Pareto的形狀參數,本文介紹的基于RSS的Bayes估計是有效的。

表1 Bayes估計的偏差

表2 Bayes估計的均方誤差