靳永濤, 尹長明, 吳 迪
(廣西大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院, 廣西 南寧 530004)
似然是參數(shù)模型推斷參數(shù)時(shí)討論和應(yīng)用最為重要的概念之一,如最為經(jīng)典的極大似然估計(jì)[1]。經(jīng)驗(yàn)似然(EL)是Owen[2-3]在Thomas和Grunkemeier[4]提出的非參數(shù)似然比問題的想法下的一種非參數(shù)統(tǒng)計(jì)推斷方法。在分布函F未知情況下,參數(shù)β(F)的經(jīng)驗(yàn)似然比統(tǒng)計(jì)量在一定條件下收斂到卡方分布并且可以進(jìn)行假設(shè)檢驗(yàn)和區(qū)間估計(jì)等。此后Owen[5]和Kolaczyk等[6]將經(jīng)驗(yàn)似然方法拓展到線性回歸模型和廣義線性模型中,比較均值經(jīng)驗(yàn)似然比估計(jì)檢驗(yàn),經(jīng)驗(yàn)似然的適用范圍得以擴(kuò)大。Qin和Lawless[7]將Owen求經(jīng)驗(yàn)似然比的限制條件進(jìn)行修改,提出了一個(gè)包含參數(shù)信息無偏的限制條件,并給出在滿足一定條件下經(jīng)驗(yàn)似然比統(tǒng)計(jì)量的各種性質(zhì)與Owen的結(jié)果一致。Bai等[8-10]對(duì)在縱向數(shù)據(jù)下經(jīng)驗(yàn)似然方法做了富有成果的研究。Li和Pan[11]提出在不服從獨(dú)立同分布的縱向數(shù)據(jù)下將廣義估計(jì)方程中含參數(shù)信息的模型加入求經(jīng)驗(yàn)似然比的限制條件中,進(jìn)一步拓展了經(jīng)驗(yàn)似然方法的適用范圍。
上面給出經(jīng)驗(yàn)似然方法的應(yīng)用范圍和理論支撐,但選取的模型較為簡單,同時(shí)模型的理論證明條件較強(qiáng),不易驗(yàn)證。本文在上述作者研究的基礎(chǔ)上,分析含有參數(shù)信息GEE模型下的經(jīng)驗(yàn)似然方法,在較易驗(yàn)證的條件下給出經(jīng)驗(yàn)似然估計(jì)存在性、相合性和漸近正態(tài)等的理論證明,并運(yùn)用R語言進(jìn)行統(tǒng)計(jì)模擬。

Qin和Lawless[7]的EL模型是在Owen早期EL模型的推廣,EL模型如下
(1)
(2)

廣義估計(jì)方程(GEE)是Liang和Zeger[12]在廣義線性模型的基礎(chǔ)上建立的,它在分析數(shù)據(jù)的相關(guān)性、對(duì)重復(fù)次數(shù)數(shù)據(jù)的研究,特別是對(duì)縱向數(shù)據(jù)的研究很實(shí)用。GEE的一般形式如下:
(3)
(4)

基于經(jīng)驗(yàn)似然和廣義估計(jì)方程的介紹,現(xiàn)把求經(jīng)驗(yàn)似然比最小值(1)式中的g(xi,β)換為式(4)的Si(β)。需要注意這并非簡單的替換,因?yàn)樵贕EE中xij是不服從獨(dú)立同分布的縱向數(shù)據(jù),在給出本文主要結(jié)果之前,先給出假設(shè)條件如下


(A3):Ri(α)≥c,即Ri(α)有正下界;


其中
定理1表明經(jīng)驗(yàn)似然比統(tǒng)計(jì)量最小值的存在性問題,即參數(shù)β的相合性問題。定理2給出參數(shù)β的漸近正態(tài)性質(zhì)。在給出定理證明之前,先給出合適的引理如下:


可知要證明
只需要證明
→0 (n→∞)
由條件(A1)-(A5)可知
則引理得證。
引理2[7]在滿足(A1)-(A4)的條件下


Op(n-1/2)
證明由限制條件可知
上式經(jīng)化簡可得



通過逆矩陣的除法得

命題得證。
引理4在滿足條件A1下有:
(5)
(6)
證明首先證明式(5),根據(jù)已知條件有:

其次證明式(6)如下:
由引理2和引理3可知上式


可得:
op(1)
(7)
其中由引理4可知:
將(7)式在β0處運(yùn)用泰勒展開式有:

op(1)=
op(1)
上式化簡得:
2cδ+δ2]ξ∈(0,tτSi(β))=
(8)
(9)
比較(8)式和(9)式可以發(fā)現(xiàn)當(dāng)n趨于無窮大時(shí),兩式中的如下部分:



定理2的證明運(yùn)用引理1的正態(tài)收斂性質(zhì)和定理1的結(jié)論可證。首先有:
在不服從獨(dú)立同分布下運(yùn)用大數(shù)定理有
A22=0

其中
d1=Q1n(β0,0)+op(δn),d2=op(δn)
運(yùn)用矩陣求逆可得:


定理得證。
例1本例是AnestisTouloumis[17]提到的GEE算法模型與本文EL模型相比較的統(tǒng)計(jì)模擬分析,建立模型Pr(Yiτ=1|xiτ)=F(0.5xi)。其中分布F均值為0,方差為π/3。邊際分布的工作相關(guān)陣R(a)定義如下

運(yùn)用R語言運(yùn)行GEE和EL方法的結(jié)果見表1和表2。

表1 100樣本下GEE和EL方法的比較

表2 10000樣本下GEE和EL方法的比較
表1和表2分別是在100個(gè)體和10000個(gè)體下GEE和EL方法的運(yùn)算結(jié)果。首先定義個(gè)體數(shù)量和每個(gè)個(gè)體觀察次數(shù)T=4;其次隨機(jī)產(chǎn)生相應(yīng)個(gè)體100×4的標(biāo)準(zhǔn)正態(tài)分布;然后在邊際分布工作相關(guān)陣的基礎(chǔ)上產(chǎn)生高維縱向數(shù)據(jù);最后用兩種方法進(jìn)行分析。表中對(duì)應(yīng)的GEE方法用z統(tǒng)計(jì)量,經(jīng)驗(yàn)似然方法用t統(tǒng)計(jì)量。當(dāng)樣本量充分大時(shí)EL方法較GEE方法x的回歸系數(shù)更接近0.5,表明EL方法比GEE方法更優(yōu)。
將GEE和經(jīng)驗(yàn)似然方法相結(jié)合,既保留了GEE方法的誤差方差最小的性質(zhì),又有經(jīng)驗(yàn)似然方法構(gòu)造置信區(qū)間域保持性和變換不變性等優(yōu)點(diǎn)[1-3]。同時(shí)在不服從獨(dú)立同分布和較弱的限制條件下給出經(jīng)驗(yàn)似然估計(jì)存在性、相合性和漸近正態(tài)性等的理論證明,有別于經(jīng)典研究的獨(dú)立同分布,拓展了經(jīng)驗(yàn)似然方法在縱向數(shù)據(jù)下的研究領(lǐng)域,更為精確的給出經(jīng)驗(yàn)似然方法的適用范圍。將來可進(jìn)一步在理論證明中對(duì)約束條件進(jìn)行弱化[18-21]。此外運(yùn)用R語言給出統(tǒng)計(jì)模擬對(duì)理論證明進(jìn)行補(bǔ)充,對(duì)比GEE方法結(jié)果表明縱向數(shù)據(jù)下經(jīng)驗(yàn)似然方法更優(yōu),對(duì)于縱向數(shù)據(jù)在實(shí)際應(yīng)用中有較好的參考價(jià)值。