盧一強,陳中威
(解放軍信息工程大學電子技術學院,河南鄭州 450004)
部分線性模型的光滑樣條推斷
盧一強,陳中威
(解放軍信息工程大學電子技術學院,河南鄭州 450004)
運用光滑樣條估計部分線性模型中的非參數函數,利用限制最大似然或廣義交叉驗證(GCV)的方法選擇光滑參數,主要考察了部分線性模型的光滑樣條估計以及有關非參數函數部分的假設檢驗.基于光滑參數的選擇方法,提出了部分線性模型中的非參數函數是否為多項式函數的假設檢驗方法,并通過模擬例子研究本文提出的推斷效果.
部分線性模型 光滑樣條 限制最大似然(RML)廣義交叉核實法(GCV)假設檢驗

部分線性模型為{yi,Xi,ti}ni=1為觀察數據,εi~N(0,σ2)為隨機誤差,yi為響應變量,Xi=(xi,…,xip)T和ti為回歸變量,ti是標量,β=(β1,…,βp)T為未知的回歸參數,(f t)為非參數函數.模型(1)由Engle et al.[1]首先提出,相對于線性回歸模型,模型(1)能夠顯著減少模型偏差,同時保持線性模型的易于解釋等優點.模型(1)的估計及性質在文獻中得到了深入的研究和廣泛應用,如Heckman[2]和Speckman[3]分別研究了模型(1)的光滑樣條估計和核估計,Chen[4]討論了模型(1)中參數估計的收斂速度,Cuzick,Severini and Staniswa[5]和Carroll etal.[6]分別將模型(1)推廣到部分線性可加模型和廣義線性模型等,還有許多該模型的應用,可參考相關文獻.但是,有關部分線性模型的檢驗研究的不是很多,本文運用Gu[7]中介紹的光滑樣條方法估計模型(1)中的非參數部分,將Liuand Wang[8]中非參數回歸的一些檢驗方法推廣到部分線性模型(1),基于限制最大似然 (RML)和廣義交叉驗證(GCV)的方法提出了檢驗模型(1)中的非參數函數是否為多項式函數的檢驗方法,并做了大量的模擬研究,模擬研究表明利用本文的方法能夠對部分線性模型進行很好的估計和檢驗.
不失一般性,假設t∈[0,1],f(t)為未知非參數函數,且f(·)∈Wm,其中Wm={g|g,…,g(m-1)絕對連續g(m)∈L2[0,1]}.
最小化

可得部分線性模型的光滑樣條估計,其中λ為光滑參數.設φv(t)=tv-1/(v-1)!

當m=1時,R(x,y)=x>y,當m=2時,R(x,y)=(x>y)2(3(x<y)-(x>y))/6,其中x<y=max(x,y),x>y=min(x,y).由Gu[2],f(t)的光滑樣條估計可表示為

令T=(φj(ti))n×m,T的(i,j)元為φj(ti).Σ=(R(ti,tj))n×n,Y=(y1,…,yn)T,X,t,c,d,ε可類似定義.由光滑樣條方法估計的性質,懲罰項等于

由此可得(2)式等價于

令Z=(X,T)T,θ=(βT,dT)T,則θ和c是下列線性方程組

在光滑樣條估計中,光滑參數在所估函數的光滑性與數據的擬合度之間起調節作用.因此,光滑參數的選擇是至關重要的.常見的有限制最大似然(RML)和廣義交叉驗證(GCV)等光滑參數的選擇方法.
2.1 限制最大似然法
仔細分析可得,由最小化(3)式得到的θ和c的估計等價于混合效應模型

的最小二乘估計,其中θ=(βT,dT)T為固定參數,

為隨機效應,ε~N(0,Inσ2)為隨機誤差.由此可知,

其中b=σ2/(nλ).在選擇光滑參數時,為了消除固定參數的影響,常作變換W=F2TY,其中F2見(5)式.由式(8)易見

其中q為W的列數.設F2TΣF2的譜分解為

其中U為正交矩陣,T=diag(λ1,…,λq)為對角矩陣,λν為F2TΣF2的特征值.令


實際應用中,我們經常需要檢驗模型(1)中的非參數函數是否為某一個參數模型.特別的,檢驗(1)中f(x)是否為m-1次多項式.由(7)可知,當λ=∞或b=0時,c=0,f(x)為m-1次多項式.因此,檢驗(1)中f(x)是否為m-1次多項式等價于檢驗


基于限制似然函數(12)式,定義似然比檢驗統計量TL越小,越不利于假設H0.拒絕域的形式為{TL<c}.

TGCV越小,越不利于假設 H0.拒絕域的形式為{TGCV<c}.

(1)生成Z~N(0,Iq);
(2)由(13)或(14)計算出λ^;
(3)計算檢驗統計量TL和TGCV;
(4)重復 (1)~(3)l次,可得檢驗統計量在H0下的l個樣本x1,…,xl,H0的P值近似為

其中x0為基于實際數據計算的檢驗統計量的值.
為了檢驗文中所提出的方法的推斷效果,我們作如下模擬研究.設

ε~N(0,0.32).t~U(0,1),X1,X2,X3服從均值為0,方差為1,相關系數為0.70的正態分布.對于模型(15) a分別選為a=0,3,5.當a=3,f(t)的光滑樣條估計見圖1-a,β的估計為1.194(0.026),3.006(0.023),-2.002(0.027).對于模型(16)分別選為a=0,0.5,1.
當a=0.5,f(t)的光滑樣條估計見圖1-b,β的估計的經驗均值和標準差為1.200(0.030),3.003 (0.027),-2.003(0.028).
我們作了非參數部分是否為線性函數的檢驗,即取m=2,檢驗

當a=0時,H0成立.a值越大,H0越不可能是線性.取樣本容量為300,重復500次實驗,每次實驗中Boostrap樣本為10000.假設檢驗的顯著水平取為0.05,表(1~2)列出了模擬實驗中H0拒絕的比例.

圖1 模型(15)在a=3以及模型(16)在a=1.5的估計:實線為真實函數,虛線為光滑樣條估計.

表1 在500次研究中模型(15)的拒絕比例

表2 在500次研究中模型(16)的拒絕比例
從表中可以看出,當a=0時,H0拒絕的比例接近顯著水平,隨著a的增大,檢驗的功效明顯增大.
從以上的模擬研究可以看出,部分線性模型不僅能夠運用光滑樣條的方法得到很好的估計,而且也能夠運用本文的方法對非參數部分進行有效的檢驗,基于RML和GCV兩種檢驗方法得到相似的檢驗功效.
[1]EngleRF,GrangerCW J,Rice J,etal.Semiparametricestimatesof the relation betweenweatherand electricity scales[J].JAmer Statist Assoc,1986,81:310-320.
[2]Heckman N E.Spline smoothing in paitial linearmodels[J].JRoy Statist Soc Ser BVol,1986,48:244-248.
[3]Speckmen P.Kernel smoothing in paitial linearmodels[J].JRoy Statist Soc Ser B Vol,1988,50:413-436.
[4]Chen H.Convergence rates for parametric components in paitial linearmodels[J].Ann Statist,1988,16:136-146.
[5]Severini T A,Staniswalis JG.Quasilikelihood estimation in semiparametricmodels[J].JAmer Statist Ass,1994,89:501-511.
[6]Carroll R J,Fan J,Gijbels I,etal.Generalized partially linear single-indexmodels[J].JAmer Statist Assoc,1997,92:477-489.
[7]Gu C.Smoothing spline ANOVA models[M].New York:Springer-Verlag,2002.
[8]Liu A,Wang Y D.Hypothesis testingin smoothing splinemodels[J].Journal of Statistical Computation and Simulation,2004,70 (8):581-597.
The Smoothing Sp line Inference Test o n Partially Linear M odel
LU Yi-qiang,CHEN Zhong-wei
(Institute of Electronic Technology,PLA Information Engineering University,Zhengzhou Henan,450004)
This article mainly considers the smoothing spline estimate of partial linear model and the test of the hypothesis whether the nonparametric function in partially linearmodel is some polynomial.The nonparametric function partially linearmodel are estimated by the use of smoothing spline.The smoothing parameter is selected using the methods of restricted maximum likelihood (RML)or generalized cross-validity(GCV).Based on the procedure of selection of the smoothing parameter,the testingmethodswere developed.Simulations show that the methods developed in this paper have the good performance for inference on partially linear model.
s emiparametricmodel;smoothing spline;restrictedmaximum Likelihood(RML);generalized cross-validity(GCV);hypothesis test
O212.7
A
〔編輯 高海〕
2009-10-06
國家自然科學基金項目[10501053]
盧一強(1971-),男,河南濟源人,博士,教授,研究方向:概率統計.