徐美萍,段景輝
(1.北京工商大學 應用數學系,北京 100037;2.中國人民大學 統計學院,北京 100872)
統計推斷是在不知道總體全部特征的情形下,通過樣本提供的信息來推斷總體分布或數字特征的一種統計程序。作為統計學中不可缺少的研究手段,它的重要性是不言而喻的。Bayes統計作為統計學中的兩大主要學派之一,其推斷的基礎是后驗分布。Bayes推斷利用總體分布中未知參數θ的先驗分布 π(θ)與樣本觀測值 x=(x1,x2,…,xn)提供的信息,得到后驗分布h(θ|x)。由于h(θ|x)綜合了總體、樣本和先驗信息,包含了θ所有可供利用的信息,所以有關θ的估計和檢驗的統計推斷都按一定方式從后驗分布中提取信息,其提取方法相對于頻率學派的經典統計推斷,簡單明了;對小樣本一般也有較好的推斷效果。
根據統計判決理論,在使用統計推斷結果時必需與得失聯系在一起考慮,即用d=δ(x)作為未知參數θ的估計會帶來一定的損失,其損失函數通常用w(θ,d)表示。由于w(θ,d)作為θ的函數是不可觀測的,所以有必要對w(θ,d)作精度估計。假設r是損失函數w(θ,d)的一個精度估計,文獻[1]引入新的損失函數

該損失函數把w(θ,d)與其精度估計γ集合起來,給出了γ關于 L(θ,d,γ)的 Bayes估計 γB(x),恰好是 θ 的 Bayes估計 δB(x)的后驗損失,即

從頻率學派的觀點考慮[2],總希望損失函數w(θ,d)的一個估計 γ(x)是一個保守估計,即滿足 Eθ[γ(x)]≥R(θ,δ(x))=Eθ[w(θ,d)],那么從總體上來說可使r(x)不會低于平均損失。為此給出γ(x)成為一個保守估計的未知參數θ需滿足的一般條件就顯得非常重要。
在統計、工程和數學文獻中我們經常會遇到Laplace分布。它具有較高的尖和稍厚的尾,常用于模擬長尾對稱數據,如誤差、收益率等。Laplace分布還具有幾何無限可分性,即,若設vp服從均值為1/ρ的幾何分布,{Xi,i=1,2,…,}為獨立同分布的隨機變量序列,且與vp獨立,則存在實數ap>0,bp使得當p→∞時的極限分布為Laplace分布。在金融資產定價中我們總是用幾何布朗運動來解釋Laplace分布的這種無限可分性質[3]。
文獻[5]、[6]等分別討論了一些常見分布的參數估計的損失函數和風險函數的Bayes推斷,得出了一些有用的結果。本文將討論Laplace分布參數估計的損失函數和風險函數的Bayes推斷問題,給出其損失函數和風險函數的Bayes估計為保守估計的一般條件,并對上證指數收益率數據作實證分析。
本文討論的Laplace分布的密度表達式為

設x=(x1,x2,…,xn)是來自(3)的一組樣本觀測值,則有似然函數

若 θ 取(4)式的共軛先驗分布 IΓ(α,λ),即

其中 α>0,λ>0,則 θ 的后驗分布為

即 IΓ(n+α,t+λ)[7]。
取 w(θ,d)為平方損失函數(θ-d)2(其中 d=δ(x)是未知參數θ的估計),則θ的Bayes估計為

式(6)增加了未知參數θ的先驗信息,可以看作是其最大似然估計θ^的一個修正。
設 w(θ,d)的精度估計為 γ,則 w(θ,d)關于損失函數 L(θ,d,γ)=w(θ,d)γ-1/2+γ1/2的 Bayes估計為

由(6)式,θ的Bayes估計δB(x)的風險函數為

從上式可看出R(θ,δB)是未知參數θ的函數,所以可對它進行估計。又由于 R(θ,δB)是 w(θ,δB(x)的均值,故我們還可以把R(θ,δB)的估計作為 w(θ,δB(x)的估計。 在平方損失下,R(θ,δB)的Bayes估計為

定理 1 對給定的 α>0,λ>0,γB(x)為保守估計的充要條件是θ滿足:

注意到保守估計的定義及(8)式,要使 Eθ[γB(x)]≥R(θ,δB),當且僅當

移項整理即得(10)式。
定理 2 對給定的 α>0,λ>0,φ(δB)為保守估計的充要條件是θ滿足:

接下來的證明與定理1類似。
綜合上述討論,φ(δB)與 γB(x)作為平方損失函數 w(θ,d)的精度估計各有優勢,我們可以結合的先驗信息,根據實際需要及具體計算結果,選取其中之一作為損失函數的精度估計。如果樣本容量較大,先驗信息又告訴我們的可能取值較小,那么選取φ(δB)要好, 而當 θ的可能取值較大時,取 γB(x)作為 w(θ,d)的精度估計不失為一種良策。下面的實證分析結果表明當θ接近于 1,而n、α、λ的值較大時,保守性是較易滿足的一種條件。

圖1 上證指數收益率數據的累積分布與laplace分布函數圖
本文數據來源于 http://www.google.cn/finance/historical。我們選取了2000.1.4~2009.5.15的上證指數收盤價共2253個數據,通過繪制上證指數收益率(單位:%)數據的累積分布與laplace分布函數圖發現它們的擬合度很高(圖1)。KS(Kol?mogorov-Smirnov)檢驗結果顯示它們之間的最大距離為D=0.0149,相伴概率為0.6968,可以認為上證指數收益率服從Laplace分布。由于收益率數據常常近似獨立,所以我們從原始數據中隨機抽樣500次,每次抽取容量為1000的一個樣本,計算θ的最大似然估計,并把它們作為θ的一組樣本觀測值,得到θ的樣本平均值為1.1995,樣本方差為0.0009。由于我們假定 θ 取先驗分布 IΓ(α,λ),所以 E(θ)=λ/(α-1),Var(θ)=λ2/(α-1)2(α-2),由矩估計法可解得 α=1600.667,λ=1918.8。再做KS檢驗,結果表明θ的樣本觀測值與先驗分布之間的最大距離為D=0.0362,相伴概率為0.5302,不能拒絕θ服從IΓ(α,λ)分布,符合假定。 易算得此時 γB(x)與 φ(δB)均為平方損失函數的保守估計。
[1]Rukhin A L.Estimated Loss and Admissible Loss Estimators[C].In Proceedings of Forth Purdue Symposium on Decision Theory,Ed J O Berger and S S Gupta,1987,1.
[2]Kiefei J.Conditional Confidence Statements and Confidence Esti?mators[J].J Am Statist Assoc,1977,72.
[3]蔣春福,李善民,梁四安.中國股票收益率分布特征的實證研究[J].數理統計與管理,2007,26(4).
[4]Parsian A,Nematollahi N.Estimation of Scale Parameter under Entropy Loss Function[J].Statist Plan Inference,1996,52.
[5]夏亞峰,馬素麗.對數正態參數估計的損失函數和風險函數的Bayes推斷[J].蘭州理工大學學報,2008,34(1).
[6]李楊.正態參數估計的損失函數和風險函數的Bayes推斷[J].沈陽化工學院學報,2000,14(2).
[7]茆詩松.貝葉斯統計[M].北京:中國統計出版社,1999.