胡學葉張正家
(廣西師范大學 數學與統計學院,廣西 桂林 541004)
經驗似然是由Owen[1-3]提出的一種非參數統計推斷方法,石堅[4]研究了線性模型誤差方差的經驗似然估計.廣義線性模型是經典線性模型的推廣,陳希孺[5]對廣義線性模型的數學原理進行系統的闡述.而Logistic回歸模型是常用的廣義線性模型之一.舒常江[6]在隨機設計情形研究了Logistic回歸模型誤差方差的經驗似然估計.考慮到固定設計情形在應用領域中亦有廣泛的應用,本文利用經驗似然方法得到了固定設計情形下Logistic回歸模型誤差方差的經驗似然估計,結果表明其方差比傳統殘差平方和方法得到的估計更小.考慮Logistic回歸模型

且連接函數g滿足,其中,x∈R p是固定設計矩陣,Y∈R1是響應變量,β∈R p是參數向量,e∈R1是隨機誤差.這里,只有(x,Y)是可觀測的.
令ωi=ηi(1-ηi),1≤i≤n,記W(n)=diag(ω1,…,ωn),并作如下假定:
(A.1)e1,…,e n為獨立同分布的隨機變量,且
(A.2)存在ε>0,使得E│e1│4+ε<∞,記

(A.3)存在正定矩陣S0,S1,使得當n→∞,有,且存在常數C>0,使得,其 中未知,║·║是R p上的歐式模;
(A.5)當n→0,→∞,其中,易知對某個常數C>0有
注1:為敘述方便,始終假設C表示一不依賴于n的大于0的常數,且C每次出現可以取不同的值.
設有來自模型的獨立同分布樣本(x1,Y1),…,(x n,Y n),其中x i=(x i1,…,x ip)′,1≤i≤n,相應地有一組不可觀測的隨機誤差e1,…,e n,使得Y i=η(x i)+e i,1≤i≤n.記x(n)=(x1,…,x n)′,Y(n)=(Y1,…,Y n)′,E(n)=(e1,…,e n)′,E(nn)=(e n1,…,e nn)′.在廣義線性模型中,對于參數估計常用的方法是極大似然估計.Logistic回歸模型中響應變量Y服從二項分布,其概率分布列為:

其中ηi=η(x i),似然函數為

相應地對數似然函數為

對其取導數,從而得到似然方程的解:

由于上式沒有顯示解,我們采用牛頓迭代方法[7]求解,得到滿足(3)式的β^為β的極大似然估計.具體操作如下:
3)由上述公式得到,若收斂即為所求;否則返回上一步,用代替得到,如此反復迭代直至收斂,即為所求.
為了得到誤差方差σ2的估計,利用殘差平方和得到:


由拉格朗日數乘法得到:

其中λ滿足:

因此可以得到誤差方差σ2新的估計,記為

定理1 若條件(A.1)~(A.6)成立,當n→∞,有

且

由定理知,經驗似然得到的誤差方差的漸近方差比傳統殘差平方和得到的漸近方差小.
引理1 設B1,B2,…,B n為獨立同分布的隨機變量序列,若存在α>0,使得E(│B1│α)<∞,則有

證明:見Ghosh[8]的引理3.
引理2 若條件(A.1)~(A.5)成立,則有:

證明:(12)式的證明:由于滿足(3)式,即



即(12)式得證.
由│e ni│≤│e i│+║x i║│β^-β│,得到
即(13)式得證.
引理3 若條件(A.1)~(A.5)成立,則有

其中v j=E(e ji),j=3,4.
證明:(14)式的證明.因為



其中A n=(I n-W(n)x(n)(x′(n)W(n)x(n))-1x′(n))=(a ij),其中
由獨立隨機變量求和的矩不等式得到

(15)式的證明:

由于0≤ωi≤1,


令ζi=λe ni,那么,max|ζi|=max|λe ni|=|λ|max|e ni|=n-1/2r nO p(1)o p(n1/(4+ε))=o p(1),
即max|ζi|=o p(1).

定理1中(9)式的證明:

定理1中(10)式的證明:



即(10)式成立.從而定理1得證.