袁進義,楊宜平
(1.重慶大學經濟與工商管理學院,重慶400030;2.重慶工商大學數學與統計學院,重慶400067)
縱向數據下工具變量線性回歸模型的經驗似然推斷
袁進義1,楊宜平2
(1.重慶大學經濟與工商管理學院,重慶400030;2.重慶工商大學數學與統計學院,重慶400067)
文章考慮縱向數據下工具變量線性回歸模型,基于工具變量和二次推斷函數方法,提出了回歸參數的經驗對數似然比統計量。在一些正則條件下,證明了所提出的經驗對數似然比統計量漸近于標準卡方分布,由此構造興趣參數的置信域。
縱向數據;工具變量;二次推斷函數;經驗似然;工作相關陣
經典線性回歸模型在研究響應變量與解釋變量之間的關系時,往往假定解釋變量是外生變量。基于該假定,采用最小二乘法可以獲得回歸系數無偏的和相合的估計。但是在大多實際問題的研究中,尤其在社會、經濟等許多領域解釋變量往往是內生的。如Angrist和Krueger[1]在研究教育對收入的影響時,教育是一個內生變量;Frankel和Romer[2]在考慮國際貿易對經濟增長的影響時,國際貿易是一個內生變量。工具變量的引入有效地解決了內生解釋變量所帶來的問題。Angrist和Krueger[1]選擇“出生季節”作為教育年限的工具變量,對收入水平建立工具變量線性回歸模型來分析教育對收入的影響;Frankel和Romer[2]使用“地理因素”作為工具變量來解決國際貿易對經濟增長的促進作用所面臨的內生解釋變量的問題。關于工具變量回歸模型的相關研究已有大量文獻。Basmann[3]提出了兩階段最小二乘法估計工具變量線性回歸模型中的回歸系數;Buse[4]研究了工具變量估計的偏差問題;Chamberlain和Imbens[5]討論了工具變量隨機效應模型的估計問題;張衛東[6]討論了線性模型中的測量誤差問題與工具變量方法;胡毅和王美今[7]提出了工具變量估計的最優工具變量選取方法。
上述文獻都是在獨立數據下討論工具變量線性回歸模型的估計問題。在分析實際問題時,往往會遇到縱向數據。當前,關于縱向數據下工具變量回歸模型的研究很少。因此,本文考慮如下縱向數據工具變量線性回歸模型:

其中Yij是響應變量,Xij是p×1內生變量,即E(Xijεij)≠0,β是p×1未知參數,Π為p×k維未知參數矩陣,εij為模型誤差,Zij是k×1工具變量,與解釋變量Xij相關,且與模型誤差εij不相關,即滿足
E(Zijεij)=0且E(Zijeij)=0,i=1,…n,j=1,…,ni
本文的目的是利用0wen[8]提出的經驗似然方法研究模型(1)中回歸參數β的置信域的估計問題。關于該方法的相關研究參見文獻[9-10]。為了處理模型中縱向數據的組內相關性,我們提出了基于工具變量和二次推斷函數法的經驗對數似然比函數,并證明了所提出的經驗對數似然比函數漸近于標準卡方分布,進而構造回歸參數β的置信區間。本文方法的優點在于:(1)利用二次推斷函數法處理縱向數據的組內相關性,無需估計工作相關陣;(2)與傳統的正態逼近方法構造置信區間相比,經驗似然方法具有其獨特的優勢——不需要任何漸近方差的估計且區間估計的形狀完全由數據決定。

由于模型(2)中Xi是內生變量,Zi是工具變量,則可以利用工具變量將內生變量進行分解。
由條件E(Zijeij)=0,結合模型(2)可得E(X|Z)=πZ。采用最小二乘法可得π的估計

因此,

采用Liang和Zerger[11]提出的廣義估計方程方法,可以構造參數β的廣義估計方程:

其中Vi是工作相關陣。在實際應用中Vi通常是未知的,且依賴有限維的討厭參數,即將Vi進行分解成Vi=,其中Ai=diag(var(Yi1),…,var(Yini)),R(ρ)是含討厭參數ρ的工作相關陣。為了避免錯誤估計討厭參數ρ對估計效的影響,利用Qu等[12]的思想,可將工作相關陣的逆R-1(ρ)表示為一些基矩陣的線性組合,即

其中ai(i=1,…,m)是未知的常數,Mi(i=1,…,m)是已知的基矩陣。一些常見的工作相關陣都可以由式(4)很好地逼近,具體參見文獻[11]。將式(4)代入式(3),得到如下估計方程:


注意到估計方程(5)是輔助隨機向量式(6)中元素的線性組合。如果β是參數真值,經簡單計算可得利用該信息,可以構造回歸參數β的經驗對數似然比函數

由Lagrange乘子法,l(β)可表示為

其中λ是ps×1向量,且滿足

我們討論經驗對數似然比函數l(β)的漸近性質。為了得到定理1,需給出一些正則條件。
C1:參數β定義域是Rp上的一個緊集,真值β0是其一個內點。
C2:{} ni是有界的正整數列。
定理1:假定條件C1—C3成立,如果β是參數真值,則
基于定理1,可以構造β的1-α(0<α<1)的置信域:
Rα(β)
為了證明定理1,需要下面引理。
引理1:假定條件C1—C3成立,如果β是參數真值,則


其中


其中Q2,s表示Q2的第s個分量。這就證得用Q3,s表示Q3的第s個分量,那么
定理1的證明:對l(β)進行Taylor展開,可得

上式結合引理1可得定理1。
本文針對解釋變量是內生變量的線性回歸模型,提出了基于工具變量的經驗似然推斷。在構造輔助隨機向量時,為了消除縱向數據的組內相關性,對工作相關陣采用一些已知的基矩陣來逼近,避免了工作相關陣中討厭參數的估計。進一步,為了避免內生變量對區間估計的影響,借鑒工具變量線性回歸模型中兩階段最小二乘估計的思想,引入工具變量,利用工具變量將解釋變量進行分解。在一些正則條件下,證明了所提出的經驗對數似然比函數漸近于標準卡方分布。
[1]Angrist JD,Krueger A B.DoesCompulsory School Attendance Affect Schooling and Earning?[J].Quarterly Journal of Economics,1991, (106).
[2]Frankel J,Romer D.Does Trade Cause Growth?[J].American Eco?nomic Review,1999,89(3).
[3]Basmann R L.A Generalized Classical Method of Linear Estimation ofCoefficients in a Structural Equation[J].Econometrica,1957,(25).
[4]Buse A.The Biasof Instrumental Variable Estimators[J].Econometri?ca,1992,(60).
[5]Chamberlain G,Imbens G.Random Effect Estimator With Many In?strumentalVariables[J].Econometrica,2004,72.
[6]張衛東.線性模型中的測量誤差問題與工具變量方法[J].統計與決策,2008,(8)
[7]胡毅,王美今.IV估計的最優工具變量選取方法[J].數量經濟技術經濟研究,2011,(7)
[8]Owen A B.Empirical Likelihood Ratio Confidence Intervals for a Sin?gle Function[J].Biometrika,1988,75(2).
[9]Xue L G.Empirical Likelihood for Linear ModelsWith Missing Es?ponses[J].JournalofMultivariate Analysis,2009(100).
[10]Zhao P X,Xue L G.Empirical Likelihood Inferences for Semipara?metric Instrumental Variable Models[J].Journal of Applied Mathe?maticsand Computing,2013,(32).
[11]Liang K Y,Zeger SL.Longitudinal Data Analysis Using Generalized LinerModels[J].Biometrika,1986,(32).
[12]Qu A,Lindsay B G,Li B.Improving Generalized Estimating Equa?tionsUsingQuadratic Inference Functions[J].Biometrika,2000,(87).
(責任編輯/易永生)
0212.7
A
1002-6487(2016)19-0073-03
國家自然科學基金資助項目(11301569);國家社會科學基金資助項目(11CTJ004);重慶市基礎與前沿研究計劃項目(cstc2015jcyjA00023);重慶市教委科研項目(KJ1500614)
袁進義(1982—),男,湖北咸寧人,博士研究生,研究方向:知識管理。楊宜平(1981—),女,湖北荊州人,副教授,研究方向:非參數統計。