馮敬海, 劉 茹菲, 黃玉潔,2
(1.大連理工大學數學科學學院,遼寧大連 116024;2.鞍山師范學院數學系,遼寧鞍山 114005)
廣義線性模型在形式上是常見的正態線性模型的直接推廣.它可適用于連續數據和離散數據,特別是后者,如屬性數據、計數數據.這在實用上,尤其是生物、醫學和經濟、社會數據的統計分析上,有重要的意義.廣義線性模型的個別特例起源很早.Fisher在1919年曾用過它.最重要的Logistic模型,在20世紀四五十年代Berkson、Dyke和Patterson等曾使用過.1972年Nelder等[1]引進廣義線性模型一詞,此后研究工作逐漸增加.1982年McCullagh等[2]出版了系統論述此專題的專著并于1989年再版.關于廣義線性回歸似然或擬似然方程解的存在與唯一和解的大樣本性質,在文獻[3~6]中已有很多討論.
在廣義線性模型問題的研究中參數估計一直是大家關注的焦點問題之一.文獻[7、8]用極大似然方法來估計廣義線性模型的參數,文獻[9]說明了用極大似然法估計未知參數時具有非穩健性,擬似然法也是如此.在統計實際應用中,估計的穩健性又是必須要考慮的.由于M-估計有較好的穩健性[10],于是本文采用M-估計來估計所提出的廣義線性模型的參數,在適當的假設下,研究模型參數估計的強相合性與漸近正態特性.
考慮廣義線性模型(generalized linear model)

參數空間H是有界閉集,β0為取值于H上的p維未知參數真值,且β0為H的內點.{X i,i∈N}為平穩遍歷序列[11],εi為ε的樣本,{εi}是獨立同分布的誤差,且{εi}與{Xs,s≤i}獨立.F(·)為已知單調函數,F′(·)有界,v(·)為已知非負連續有界函數,并設上界為M0.
首先,給出如下假設:
(1)本文中所討論積分和極限均可換序;
(2)設ρ(u)為已知的對稱凸函數,ρ(0)=0,ρ(u)在正半軸上單調遞增(可以增至+∞),且ρ″(u)有界,設上界為C1,由ρ(u)為凸函數知0≤ρ″(u)≤C1.令Mb(a)=E(ρ(a+bε)),并設對于任意b>0,Mb(a)在a=0時達到最小.由假設(1)知

令L(b)=E((ρ′(bε))2),并設L(b)連續;

在證明定理之前,先來證明下面的命題.









在固定設計中,建立模型如下:

其中參數空間H、函數F(·)與v(·)的定義如前.此模型中,{x ni,i=1,2,…,n}為固定的p維向量組,且一致有界,x ni代表第n批第i次試驗結果.{εni,i=1,2,…,n,n≥1}為獨立同分布的隨機變量組.記


在模型中,設X服從二元泊松分布,參數真值為β0=(β01β02)T,誤差變量ε服從標準正態分布.用蒙特卡羅方法產生n個服從二元泊松分布的X與一元標準正態分布的ε,得到相應響應變量的值.再將該操作重復m次,算出平均誤差作為模型誤差.仿真結果見表1、2.
表1 仿真結果1(β0=(0.8 1)T,樣本容量為100)
Tab.1 Simulation result 1(β0=(0.8 1)T,sample size is 100)

mn β01 β02MSE1MSE2 10 20 0.847 1 1.083 9 0.044 4 0.102 4 30 50 0.873 2 1.070 1 0.043 3 0.067 1 50 50 0.876 8 1.075 6 0.038 7 0.080 6

表2 仿真結果2(β0=(1 2)T,樣本容量為100)Tab.2 Simulation result 2(β0=(1 2)T,sample size is 100)
由上表可以看出,模型的M-估計具有良好的性能,不失為一個好的估計方法.
本文針對廣義線性模型提出了對參數的M-估計方法,在適當的假設條件下證明了這種估計的強相合性與漸近正態性.最后通過數值模擬結果可以看出這種估計的優良性.本文提出的這一模型與估計方法在實用上,尤其是生物、醫學和經濟、社會數據的統計分析上有重要的意義.
[1]NELDER J A,WDDERBURN R W M.Generalized linear models[J].Journal of the Royal Statistical Society,1972,135(3):370-384
[2]MCCULLAGH P,NELDER J A.Generalized Linear Models[M].2nd ed.London:Chapman and Hill,1982
[3]HABERMAN S J.Maximum likelihood estimates in exponential response models[J].Annals of Statistics,1977,5(5):1148-1169
[4]高啟兵,吳耀華.廣義線性回歸擬似然估計的漸近正態性[J].系統科學與數學,2005,25(6):738-745
[5]尹長明,趙林城.廣義線性模型中極大擬似然估計的漸近正態性與強相合性[J].中國科學A輯:數學,2005,35(11):1236-1250
[6]FAHRMEIR F,KAUFMANN H.Consistency and asymptotic normality of the maximum likelihood estimator in generalized linear models[J].Annals of Statistics,1985,13(1):324-368
[7]岳 麗,陳希孺.廣義線性模型中擬極大似然估計的強相合性及收斂速度[J].中國科學A輯:數學,2004,34(2):203-214
[8]尹長明,趙林城.廣義線性模型極大似然估計的強相合性與漸近正態性[J].應用概率統計,2005,21(3):249-260
[9]HUBER P J.Robust Statistical Procedures[M].Philadelphia:Society for Industrial Mathematics,1989
[10]茆詩松,王靜龍,濮曉龍.高等數理統計[M].北京:高等教育出版社,2006
[11]何書元.應用時間序列分析[M].北京:北京大學出版社,2003:35-36
[12]POLLARD D.Convergence of Stochastic Process[M].New York:Springer-Verlag,1984:170-171