馮井艷,張志強,李華鵬
(山西大同大學數學與計算機科學學院,山西大同 037009)
變系數模型誤差方差的估計
馮井艷,張志強,李華鵬
(山西大同大學數學與計算機科學學院,山西大同 037009)
變系數模型是由古典的線性模型發展而來,它們可以很好地檢驗函數系數隨著協變量的變化程度.本文用PLR提出了變系數模型的誤差方差的估計,并研究了它的漸近正態性,進一步用一個模擬例子來說明估計的結果是有效的.
變系數模型 誤差方差 Profile最小二乘估計 漸近正態性
變系數模型產生于實際需要,它可以很好地探索動態數據特征使得模型更好地擬合數據,因此廣泛應用到各科學領域中,比如:經濟學,政治學,醫藥學,生態學等.
Hastie和Tibshirani[1]提出了變系數模型,其定義如下



到目前為止,對于具有不同光滑變量的變系數模型的研究還是比較少[4],其定義如下

其中,X=(X1,X2,…,XP)T∈RP,Z=(Z1,Z2,…,ZP)T∈RP為協變量,Y∈R為響應變量,ε為隨機誤差,且ε與(X,Z)獨立,滿足E(ε)=0,Va(rε)=σ2.{aα(·)}pα=1是從R到R上的未知可測函數.文獻[4]已經估計了函數系數{aα(·)}pα=1,類似的討論還有文獻[5].但是,有時候,對誤差方差σ2=E(ε2)的估計的研究也是很有必要的,它可以有利于置信區間的建立,模型檢驗及選擇等.在本文中,由最小二乘法得到了誤差方差σ2的估計,并得到了它的漸近性質.
假定{Yi,Xi,Zi,i=1,…,n}是模型(2)的一個簡單隨機樣本,{aα(·)}pα=1是Lipschitz連續的,那么a(αXα)在Xα的支撐內的一點xα附近能夠用一個線性函數表示,即

關于{aα}pα=1和{bα}pα=1極小化,其中,Xiα,Ziα分別是X,Z的第i個觀測值的第α個分量;Kα,hα(·)=h-1αKα(·/ hα),Kα(·)是一個有緊支撐的關于0對稱的有界非負的Lipschitz連續的概率密度函數;hα=hnα是一個正數數列,稱作窗寬.設(αx),α=1,…,p,是使(3)式達到極小化的前p個值.由最小二乘理論,可得

其中x=(x1,…,xp)T,eα,2p是第α個分量為1的單位向量,U是一個n×2p矩陣,它的i行是

在(4)式的基礎上,使用平均方法定義函數系數aα(Xα)的平均估計為

其中,a=(a1(X1),…,ap(Xp))T.我們可以定義誤差方差σ2的估計為

假設:A1隨機變量X是有緊支撐的,它的密度函數f(·)是Lipschitz連續有界的,且大于某一正數.
A3存在s,k分別有s>2滿足E‖z‖2s<∞,k<2-s-1滿足n2k-1h→∞.
A4{aα(·),α=1,…,p}有二階導數.
A5核函數K(·)是有緊支撐的,關于0對稱的,有界非負的Lipschitz連續的概率密度函數;窗寬h滿足nh8→0,nh2(/log n)2→0.
定理1若假設 A1~A5成立,如果Eε41<∞,E‖X1‖4<∞,當n→∞時,則有

定理2若假設 A1~A5成立,如果Eε41<∞,當n→∞時,則

推論1在定理1和定理2的條件下有

這一節我們應用Monte Carlo模擬方法來說明如上提出的估計方法的有效性.假定模擬例子為:




它的證明類似于Zhou和You[6]的定理3.2的證明.則有I3=οp(1).定理1證畢.
表1 2的均值和標準誤差

表1 2的均值和標準誤差
■ σ)σ2 0.04 0.25 0.64 0.04 0.25 0.64 Mean 0.057 0.072 0.533 0.073 0.836 0.065 SD 0.009 0.038 0.085 0.006 0.029 0.075 ε~N(0,σ2) ε~U(- 3■ σ, 3


則,J3=οp(1),J4=οp(1),J5=οp(1).則只需證明 J2=οp(1),它的證明類似于I2=οp(1)的證明,則定理2證畢.
[1]Hastie T,TibshiraniR.Varying-coefficientmodels[J].Royal Statistical Society,2003,55(4):757-796.
[2]Hoover D R,Rice JA,Wu C O,et al.Nonparametric smoothing estimates of time-varying coefficientmodels with longitudinal data[J].Biometrika,1997,85:809-822.
[3]Fan J,Zhang J.Functional linearmodels for longitudinal data[J].JRoy Statist Soc B,2000,62:303-322.
[4]Zhang Riquan,Li Guoying.Efficient estimation of functional-coefficient regression models with different smoothing variables[J].Acta Mathematica Scientia,2008,28B(1):989-997.
[5]張日權,張志強,馮井艷.一類新的變系數模型的積分估計[J].山西大同大學學報:自然科學版,2007,23(5):1-5.
[6]Zhou X,You J.Waveletestimation in varying coefficientpartially linear regressionmodels[J].Statist probab Lett,2004,68:91-104.
Error V ariance E stimation of V arying C oefficient M odels
FENG Jing-yan,ZHANG Zhi-qiang,LIHua-peng
(School ofMathematics and Computer Science,ShanxiDatong University,Datong Shanxi,037009)
Varying coefficientmodels are a useful extension of classical linear models.These models can easily examine how regression coefficient change over different groups characterized by certain covariates.In this article,the estimator of error variance by profile least-squares procedure is proposed and its asymptotic normality is studied.Furthermore,some simulations are conducted to examine the performance of our estimating approach and the results are substantial.
varying coefficientmodels;error variance;profile least-squares estimation;asymptotic normality
O212.7
A
〔編輯 高海〕
1674-0874(2010)01-0005-03
2009-11-30
國家自然科學基金項目[10871072];山西省自然科學基金項目[2007011014]
馮井艷(1982-),女,山西太原人,碩士,助教,研究方向:數理統計.