劉 彭,張 超,柳平增
(山東農業大學a.應用統計與農業信息化實驗室;b.大數據中心,山東 泰安 271000)
經驗似然方法是Owen[1]在1988年提出的一種非參數統計推斷方法,這種方法具有很多優點:可以完全根據數據來決定變量對應的置信區間,便于將多元數據進行組合,還可以合并偏度信息,使得刪失數據或缺失數據的樣本更易于處理,具有糾偏性、無需構造統計量等。因此,經驗似然方法在半參數回歸模型的各個領域應用廣泛。
半參數回歸模型既含有參數分量,又含有非參數分量,結合了線性回歸模型和非參數回歸模型的優點,因此不論是在理論研究上,還是在實際應用中都具有重要意義。經驗似然方法已大量應用于半參數回歸模型中,本文考慮變系數部分線性模型:

對于模型(1)的經驗似然推斷已有了大量的研究,如Hu[2]在2009年對變量有誤差的變系數部分線性模型進行了研究,在兩種不同的情況下,提出了參數部分經驗對數似然比,構造了參數部分的置信區間,Huang[3]在2009年對模型(1)利用經驗對數似然方法構造了非參數部分的置信區間,同時得到了估計的經驗似然比服從標準卡方分布。本文針對變量有測量誤差的變系數部分線性模型,提出了非參數部分的經驗似然,并用對數似然法構造了非參數部分的置信區間,證明了估計的經驗似然比服從標準卡方分布:

其中Eη=0,Eη2=Ση,且η與( )X,Z,U,ε獨立。
為了定義經驗似然估計量,先假設β已知,可以利用約束,其中f(u)為U的密度函數,并有一個緊支撐S(f)。由此,引入如下輔助隨機向量:

其中h是帶寬,Kh(·)=h-1K(·h)且K(·)是核函數。
如果β已知,由于是獨立的且,則可以構造估計方程,此方程的解為α(u)的最小二乘估計,同樣可以通過經驗似然方法得到,因此,下面定義剖面經驗對數似然比函數:

若α(u)為真參數,則 ?n(α(u) )服從自由度為p的標準χ2分布,但是這里β未知,要對 ?n(α(u) )進行分析,比較可行的方法就是用估計量β?來代替β,下面就來估計β:
對l=1,…,p用kl個基函數的線性組合來逼近變系數函數為kl×1基函數向量,為kl×1未知函數向量,此方法的優點在于:kl可任意增大,從而存在的線性組合很好地逼近任何光滑函數αl(U),故其逼近的均方誤差可任意小。
定義K×1階矩陣逼近,此時,式(2)等價于:

令:

又式(2)可以寫成矩陣形式:


下面用修正的最小二乘法估計:

即得到估計量:



其中λ滿足:

若α(u)為真參數,則分布,要得到這個結論,下面先給出一個定義和一些條件:
定義1:?是一個函數類,如果?中任一函數g(x,z)滿足:
上述定義的詳細介紹參考文獻[4]。
條件1:u的密度函數f(u)有緊支撐S(f),對所有l,k=1,…,p,γl,k(u),f(u)在u0處有連續一階導,對每個r=1,…,p,αr(u)在u0處的二階導數為連續有界函數;
條件2:核函數K(u)為有界對稱密度函數,其導數有界,且滿足
條件 3:存在τ>1,使得
條件6:①對每個K,存在非奇異陣B,使得的最小特征值在K上一致有界大于 0;②存在滿足和K=Kn的序列ζ0(K),使得,其中S是(x1,u1)的支集。
定理1:在條件1至條件7下,且滿足h→0,nh3→∞,nh8→0, 若α(u0)為 真 參 數 ,那 么
根據定理1,α(u0)的置信區間可以由式(10)構造,對任意的的置信區間。
為了構造α(u)的分片置信區間,這里借助部分剖面經驗似然方法來定義αr(u)的經驗對數似然比函數:考慮估計方程,這里er是第r個元素為1,其余元素為0的p維向量,α?(·)為的最小值,這里假設Q(u)可逆,對任意的h,聯合式(11)得:

其中,α?(u)等價于最小二乘估計,具體參考文獻[5]。
對數似然比函數為:

從定理2可將αr(u0)的置信區間定義為:



根據大數定律有:




下面逐項證明:

其中:


顯然結論得證。
引理2:在定理1的條件下,如果α(u0)是真參數,則有

這里僅證A4,A5,其他的類似可以得到。
對任意的δ>0,

故A4=op(nh)12,A5=op(nh)12,即結論成立。
引理3:在定理1的條件下,如果α(u0)是真參數,那么:

引理4:在定理1的條件下,如果α(u0)是真參數,那么:

引理5:在定理1的條件下,如果α(u0)是真參數,則,其中λ在式(12)中定義。
引理3、4、5的證明參考文獻[2],這里不再詳述。
定理1的證明:結合引理,對式(11)利用Taylor展開式得:

根據式(12)可以得到:

由上面三個式子定理1易證。
定理2的證明參考文獻[6]。
本文介紹了協變量有誤差的半參數變系數部分線性模型的似然推斷,提出了經驗似然在半參數誤差模型中的應用。對于刪失數據、缺失數據在廣義線性模型、線型混合模型中的經驗似然推斷有所欠缺,還有待進一步的研究。