陳顯彬,林 松,尹長明
(廣西大學 數學與信息科學學院, 南寧 530004)
廣義估計方程是對縱向數據進行回歸分析的一類重要方法,由Liang等[1]于1986年對廣義線性模型推廣而得到。1983年,McCullagh等[2]出版了專著來系統地論述廣義線性模型。對于自然聯系函數的情況,極大似然估計的弱相合性和漸近正態性的條件在文獻[3-5]中都有列出。特別關于Logit模型的條件,文獻[6-8]也給出了論述。對于非自然聯系函數,文獻[9]給出了相應的漸近結果,但沒有嚴格的假設和條件,而文獻[10]則需要非常強的條件。由于之前研究存在一定的局限性,1985年L.Fahrmeir和H.Kaufmann發表了文獻[11],論述了極大似然估計的漸近性質;1986年,兩人在文獻[12]中具體分析了離散相應變量的漸近推斷,又豐富了廣義線性模型的相關理論。
本文設在試驗中對第i個個體的第j次觀測得到q×1維響應變量Yij,pn×q維協變量Xij,i=1,…,n,j=1,…,m。設來自不同個體的觀測值相互獨立,來自相同個體觀測值則是相關的,但相關系數未知。令Yij=(Yij1,…,Yijq)T的期望為
(1)

(2)
方差記為
(3)

(4)
若Yij服從三項分布(觀測次數是1),即q=2,期望

(5)

(6)
就得到兩步Logit模型[13-14]。
Wang[15]在一定條件下證明了經典Logit廣義估計方程
(7)


對兩階段Logit模型,假設以下條件成立:






(8)

為了證明定理1,需要以下引理:

下面4個引理的證明分別與文獻[4]引理3.1、3.3、3.4、3.5類似,故在此省略。
引理2 若假設條件①~⑤成立,則
引理3 若假設條件①~⑤成立,則?Δ>0,an,bn∈Rpn,有

引理4 若假設條件①~⑤成立,則?Δ>0,an,bn∈Rpn,有
引理5 若假設條件①~⑤成立,則?Δ>0,an,bn∈Rpn,有
定理1的證明
根據引理1,證明方程Sn(βn)=0根的存在性且式(8)成立,只需證明?ε>0,存在一個Δ>0,對足夠大的n有如下式子成立:
(9)
由微分中值定理,
(10)

(11)


(12)
其中εi(βn)=Yi-hi(βn)。所以
(13)
由引理2和假設⑤得
(14)

(15)
由引理3和假設⑤得:
(16)
(17)
由引理4和引理5及假設⑤得:
(18)
由假設②~④可得

(19)
由式(16)~(19)知In2≤-CΔ2pn,再由式(13)和(14)知|In1|=ΔOp(pn),可見當Δ足夠大時式(8)(9)成立。
[1] LIANG K Y,ZEGER S L.Longitudinal data analysis using generalized linear models[J].Biometrika,1986,73:12-22.
[2] MCCULLAGH P,NELDER J A.Generalized Linear Moders[M].New York:Chapman&Hall,1989.
[3] HABERMAN S J.Maximum likelihood estimates in exponential response models[J].The Annals of Statistics,1977,66:815-841.
[4] ANDERSEN E B.Discrete Statistical Models with Social Science Applications[J].North Holland,Amsterdam,1980(3).
[5] NORDBERG L.Asymptotic normality of maximum likelihood estimators base on independent,unequally distributed observations in exponential family models[J].Scandinavian Journal of Statistics,1980:27-32.
[6] HABERMAN S J.The Analysis of Frequency Data Univ[M].Chicago:Chicago Press,1974.
[7] MCFADDEN D.Conditional logit analysis of qualitative choice behavior[M].Academic,New York:[s.n.],1974.
[8] GOURIEROUX C,MONFORT A.Asymptotic properties of the maximum likelihood estimator in dichotomous logit models[J].Econometrics,1981(2):83-97.
[9] MATHIEU J R.Tests ofχ2in the generalized linear model[J].Statistics:A Journal of Theoretical and Applied Statistics,1981(3):509-527.
[10] FAHRMEIR L,KAUFMANN H.Consistency and asymptotic normality of the maximum likelihood estimator in generalized linear models[J].The Annals of Statistics,1985(3):342-368.
[11] FAHRMEIR L,KAUFMANN H.Asymptotic inference in discrete response models[J].Statistische Hefte,1986(4):179-205.
[12] FAHRMEIR L,TUTZ G.Multivariate statistical modelling based on generalized linear models[M].New York:Springer-Verlag,1994.
[13] MORAWITZ B,TUTZ G.Alternative parametrizations in business tendency surveys[J].Zeitschrift Operations Research,1990,34:143-156.
[14] WANG L.GEE analysis of clustered binary data with diverging number of covariates[J].Annals of Statistics,2011,39(1):389-417.
[15] ORTEGA J M,RHEINBOLDT W C.Iterative solution of nonlinear equations in several variables[M].San diego:Academic press,1970.