陳海燕
(重慶工商大學 長江上游經濟研究中心,重慶 400067)
2005年以來,以面板單位根檢驗和面板協整檢驗為主體的非平穩面板數據建模已成為計量經濟學實證研究的主要分析方法之一。以“面板單位根檢驗——面板協整檢驗——面板協整模型估計——面板誤差修正模型”為基本研究范式,在經濟、社會、金融、貿易、教育、能源等各方面均得到了廣泛地應用和深入分析。早期的非平穩面板數據建模假定模型滿足同方差、無序列相關、無結構變化、無截面相關等假設條件,第一代的面板單位根檢驗和協整檢驗均假設截面獨立和無結構突變[1]。但是,經典假設往往是最理想的狀態,并不能完全滿足現實問題分析需要。由于面板數據具有時間和截面的雙重特征,一般表示為(i,t)雙下標形式,不同的變量可以記為 yit、xit、zit等。所以,面板數據具備時間序列數據可能存在的序列自相關和結構變化特征,也會有橫截面數據可能存在的異方差性。同時,面板數據的截面個體之間還可能存在截面相關,以及與截面相關具有交互作用的結構變化。違背經典假設的序列自相關和異方差性的檢驗與修正方法在時間序列數據和橫截面數據研究中已比較成熟,在面板數據分析時可以直接借用[2]。但是面板數據的截面相關及其與結構變化的交互影響尚待進一步研究。由于共同因子結構是面板數據截面相關最常用也是最易處理的表現形式,所以本文中截面相關主要以共同因子結構來體現。
理論方法研究中,諸多文獻是將截面相關和結構變化的處理與單位根檢驗或協整檢驗一同進行的,即是在構建非平穩面板數據模型檢驗統計量的同時,通過某種方式消除了共同因子或結構變化的影響,并通過大量模擬論證了檢驗方法的穩健性[3,4]。但是,實證研究中面對的是實際客觀數據,最優的模型形式需要經過多重檢驗才能獲得,直接套用已有模型將導致估計結論無效,這也是諸多文獻中提及的計量經濟模型無為表現的原由之一:理論構建與實證應用邏輯上的差異導致經濟問題分析產生了偽結論。那么面板數據是否存在截面相關或結構突變,以及是以怎樣的形式存在都將影響最優模型的選擇過程,影響最終的分析結論。因此,在實際問題研究中應當首先通過恰當的方法去確定面板數據的基本結構,以構建最適宜的模型形式。王珂英和張鴻武(2016)[5]、王維國等(2013)[6]在構建非平穩面板數據模型之前首先就考慮了共同因子和結構變化,并采用了適宜的方法予以論證,但是在處理結構變化和共同因子時往往是將此兩種情形分別進行檢驗和處理,均未考慮二者之間的交互影響效應。
當面板數據存在共同因子時,每個截面個體的結構變化可能會因為其他截面的變化而發生改變。那么,共同因子的存在是否會改變橫截面個體的結構變化?基于這樣的考慮,本文在對已有的面板數據截面相關和結構變化檢驗方法進行分析的基礎上,給出非平穩面板數據模型中截面相關與結構變化交互影響的實證分析結果,為采用基本研究范式進行實證提供前期參考,為非平穩面板數據模型的深入發展呈現新的思路。
對于存在截面相關的非平穩面板數據模型,忽視截面相關將導致估計結果不一致或檢驗結果無效。當橫截面個體數量N較少、時間序列維度T比較長時,可以構建似不相關回歸(Seemingly unrelated regression,SUR)模型,并采用廣義最小二乘估計法進行參數估計。但是當時間維度不夠長,或者當N>T時,SUR模型就不可行了,對于N>T的情形目前主要有空間相關和殘差共同因子結構兩種處理方式[7]。本文主要考慮因子結構的情形。
為了檢驗截面個體之間是否存在相關性,早期較為常見的方法是Breush和Pagan(1980)提出的基于LM的截面相關存在性檢驗,檢驗的原假設為對于所有的t,當i≠j時,有cov(uit'ujt)=0。統計量為:

其 中為原模型OLS回歸的殘差。但是,統計量CDlm在N>T的情況下表現欠佳,所以,Pesaran(2004)[8]提出了另一個修正的檢驗統計量:

并論證了該統計量在結構變化和異質動態面板數據模型中檢驗的穩健性。韓本三等(2011)[9]、Pesaran等(2008)[10]均對CD統計量進行了再修正研究,分別提出了NLM和MCD檢驗統計量。
截面個體之間的相關是以怎樣的形式或者程度存在的,還需要進一步研究。截面相關面板數據的因子結構可以分為截面弱相關(cross-sectionally weakly dependent,CWD)和截面強相關(cross-sectionally strongly dependent,CSD)。對于給定的時間點t∈Γ,滿足條件=0,則稱序列{zit}為截面弱相關;若滿足條件≥K>0,則稱序列{zit}為截面強相關。其中,Γt-1為信息集為加權平均值且wt和zt滿足兩個假設條件,具體信息可以參見文獻[7]。在實際應用過程中,需要考慮不同的信息集,對于動態數據模型,信息集應該包含所有的滯后變量,比如在平穩面板數據模型中,信息集可以是截面個體的無條件協方差均值。
對于共同因子模型:

其中,共同因子 fjt為零均值方差為1的協方差平穩過程。條件方差為在多因子模型中,如果則因子 fjt為強因子;若K<∞,則因子 fjt為弱因子。Chudik等(2011)[7]中還對半強或半弱的因子進行了定義。
在處理截面相關時,Coakley等(2002,CFS)提出了用OLS殘差的主成分來進行擴展回歸,得到主成分估計量以處理截面相關。但是因為OLS估計時模型是存在截面相關的,且不可觀測的因子與因變量之間可能還存在相關性,導致該估計量不滿足一致性,所以建議用代理變量來進行截面相關的處理。Pesaran(2006)[11]考慮了兩種不同但存在內在聯系的方法來處理CFS統計量的不一致性,給出了具有一致性的CCE估計量(Common correlated effects estimators),分別構建了基于組平均的CCEMG統計量和基于混合估計的CCEP統計量,用于處理面板回歸模型中的多因子誤差結構。Kapetaniosdeng等(2011)[12]將CCE方法擴展到非平穩共同因子結構。
Bai和Ng(2004)[13]將截面相關處理為共同因子結構,采用主成份方法進行退因子處理。因子模型為:

其中,eit為I(0)的誤差序列,k為截面間共同因子的個數為因子載荷向量,Ft=(F1t'F2t'…'Fkt)′為共同因子。Bai和Ng(2002)[14]給出了確定k的取值k?的檢驗標準,分別為PC和IC統計量:
PC(k)=V(k)+kg(N'T)'IC(k)=lnV(k)+kg(N'T)
共同因子和因子載荷可以通過最小化式(4)進行估計:

面板數據結構變化點的檢測,最早在Joseph和Wolfson(1992,1993)中有研究,他們建立了每個橫截面序列都有突變點的隨機突變模型(Random Breaks Model),并假設所有突變點都是獨立同分布的。面板數據結構變化的檢驗研究根據序列突變前后分布是否變化、突變序列的時間T是否固定(突變點是否會隨總體時間長度而變化)、突變類型是均值突變還是方差突變、突變點是否內生等不同問題展開,這些問題與傳統的時間序列結構變化研究比較類似。而面板數據結構變化比較獨特的應用在于多個橫截面個體的突變點是同質結構變化(homogeneous breaks)還是異質結構變化(heterogeneous breaks)。Bai和Carrion-i-Silvestre(2009)[15]中對面板異質結構變化進行了較廣的定義,當不同截面個體具有不同的突變時間點,或者具有不同的突變程度,或者有不同數量的突變點,或者均值和方差突變發生在不同的時間點,都可以稱為異質結構變化。本文以面板數據橫截面個體結構變化時間點是否同期作為結構變化分類的唯一標準,其他情況在后續研究中再加以討論。
這里將面板數據同質結構變化理解為同期結構變化,即每個橫截面個體的突變點時間是一致的。Bai(2010)[16]建立了面板數據共同突變點的估計方法,分別運用OLS和QML方法構建了均值和方差變化點的檢驗統計量,同時考慮了時間長度固定與變化兩種情況,構建了面板數據模型共同突變點的一致估計量,并提出了用于研究其極限分布的新框架。鑒于Bai(2010)中檢驗方法簡單且實用,下面著重介紹該方法。
均值變化模型為:

其中,i=1'2'...'N,μi1≠μi2,k0為未知結構變化點,eit為平穩過程,且E(eit)=0。為了估計均值結構變化點,構造了如下統計量:

其中為基于OLS方法的目標函數。一致性條件為
方差變化模型為:

其中,i=1'2'...'N ,μi1≠μi2,σi1≠σi2,k0為未知結構變化點,ηit為線性過程,且滿足 E(ηit)=0 ,var(ηit)=1。為了估計方差結構變化點,構造了如下統計量:

其中為基于偽極大似然(quasi-maximum likelihood)方法的目標函數一致性條件為
Joseph和Wolfson(1993)中較早地考慮了面板數據模型的異期隨機突變點。面板數據異期結構變化點主要是將時間序列結構變化點的檢驗方法直接擴展到面板數據模型中,一般是直接采用時間序列結構變化點的估計方法去估計面板數據中各橫截面個體的突變點。Costantini&Gutierrez(2007)[17]基于遞歸ADF檢驗統計量的聯合概率構造異質非平穩面板數據模型的結構變化檢驗統計量;運用時間序列模型中參數估計的t統計量最大值構造結構變化點的檢驗統計量,并直接運用到面板數據模型中[18];而文獻[6,15]均采用了Bai和Perron(2003)[19]中提出的SSR統計量用于結構變化點的檢驗。
面板數據模型中檢驗異質結構變化點的SSR統計量構造如下:

其中為 基 于OLS方法的殘差平方和,為第i個橫截面個體的結構變化點。
在非平穩面板數據模型構建過程中,已有諸多研究針對同時存在結構變化和截面相關情形的非平穩面板數據模型進行了研究[3,4,6,15]。在處理結構變化和截面相關時往往是將此兩種情形分別進行檢驗和處理,均未考慮二者之間的交互影響效應。當假設面板數據截面獨立時,單個個體結構變化不受其他截面變化的影響,此時與傳統的單一時間序列結構變化類似,但是當面板數據存在截面相關時,每個截面個體的結構變化可能會因為其他截面的變化而發生改變。那么,截面相關的存在是否會改變橫截面個體的結構變化?是否會引起結構變化點的發生時間?結構變化的存在是否會影響截面相關的因子結構?下面通過實證研究分析結構變化和截面相關之間的交互效應。
外商直接投資與經濟增長之間的影響關系歷來受到研究者們的關注,面板數據模型是常用的分析工具之一。鑒于經濟增長與外商直接投資關系研究的廣泛性和實用性,本文采用中國30個省份(西藏除外)1995—2015年的國內生產總值GDP為被解釋變量,外商直接投資FDI為解釋變量,分析其基本結構和交互影響關系??紤]到物價和計量單位的影響,在計算時采用變量的對數形式。
首先采用Pesaran(2004)[8]提出的截面相關CD檢驗統計量進行相關結構判斷。考慮的模型形式為:

原假設為不存在截面相關,檢驗統計量CD=81.9235,概率 p-value=0.00,檢驗結果說明模型存在截面相關。
再采用Pesaran(2007)[20]中提出的適宜截面相關的面板單位根檢驗方法,原假設為存在單位根,檢驗形式為帶趨勢項和常數項,檢驗結果為CIPSlog(GDP)=-0.49,CIPSlog(FDI)=-1.43,當顯著性水平選定為0.05時log(GDP)和log(FDI)均存在單位根,屬于非平穩面板數據。
借鑒文獻[3,4,6]中非平穩面板數據模型形式,設:

其中,xit和 yit分別為解釋變量和被解釋變量,μi為個體常數項,Ft為共同因子,λi為因子權重值。表示均值結構變化表示方差結構變化,Dit=θiDUk+σiDTk表示結構變化函數。
00
為了分析共同因子與結構變化之間的交互效應影響,假設原假設為 H0:θi=0'σi=0 。備擇假設為 H1:θi≠0或σi≠0。模型調整為:

若原假設不成立,說明回歸殘差zit存在均值或方差結構變化,反之,若不存在均值或方差結構變化,說明原假設成立。
在原假設成立的情況下,首先采用Bai和Ng(2004)[13]中的方法計算共同因子,并對去掉因子影響的殘差vit進行截面相關檢驗,檢驗統計量CD=-1.8964,概率 p-value=0.971,表明已不存在截面相關,這說明模型中Ft項是存在的。
采用Bai和Perron(2003)[19]和Bai(2010)[16]中提出的方法檢驗結構變化,并對去共同因子的序列和帶共同因子的序列分別進行檢驗以說明共同因子對結構變化的影響,其中T=21 ,N=30 ,k0=floor[τ×T] ,τ∈[0.1'0.15,…,0.85,0.9],有17個結構變點。圖1為原始數據log(GDP)和log(FDI)的分析圖,SSR取值滿足一致性條件且有最小值,說明二者均存在均值和方差結構變化。圖中縱坐標為統計量SSR的值,橫坐標為結構變化點的序號。 floor[·]為R程序里的一個取值函數。

圖1 log(GDP)與log(FDI)數據結構變化檢驗圖
在原假設成立的情況下,圖2為按照調整模型(11)計算而得的殘差序列結構變化檢驗圖,結果顯示殘差zit存在均值和方差結構變化點,即其數據生成方式為zit=Dit+但是圖2右邊去掉共同因子以后殘差序列結構變化檢驗圖
顯示,均值結構變化的SSR取值范圍為4.93×10-29~5.49×10-29,方差結構變化的SSR取值范圍為-43350~-43182,不滿足結構變化一致性條件,不存在均值和方差結構變化,說明有均值和方差結構變化,其去掉共同因子后沒有結構變化,前后檢驗結果發生了矛盾,這說明模型結構的設定出現了問題,模型形式與數據結構不符合,有可能是共同因子的存在改變了截面個體的結構變化狀態,這正是本文質疑且尚待檢驗的問題。

圖2 殘差序列結構變化檢驗圖
進一步地,借鑒式(9)的檢驗公式對共同因子結構進行結構變化檢驗,結果見下頁圖3。因子權重λi是橫截面數據,樣本量為N=30,其數據結構變化體現為地域異質性,這里不作考慮。盡管如此,圖3中仍然給出了因子權重序列的SSR值,圖形顯示存在多個極小值,這說明所選30個省市權重值差異較大,存在多種類型。對于共同因子序列Ft,當k0=18,即2012年時均值結構檢驗的SSR值達到最小,說明共同因子Ft存在均值結構變化,同時,在k0=8,即2002年時均值結構檢驗的SSR值有極小值,這與方差結構檢驗一致。由此,可以認為共同因子序列Ft存在均值和方差結構變化。這說明模型(10)中的結構變化并不是獨立存在的結構變化,而是由共同因子結構變化體現出來。這表明截面相關與結構變化之間的交互效應確實存在,而且正影響著非平穩面板數據傳統建模基本范式的使用。

圖3 因子結構變化檢驗圖
表1給出了結構變化具體時點。經過實證分析得出了有別于常規應用模型設定的結論:首先,中國區域GDP增長率在2004—2005年發生了較為明顯的結構變化,這源于1995—2005年、2006—2015年兩個時間段內區域經濟增長模式、經濟結構均發生了較大的改變。區域FDI增長率在2005年發生了較為突出的結構變化,這與2005年中國匯率制度改革、外貿政策調整是分不開的。模型回歸殘差分別在2008年和2004年表現出均值和方差結構變化,說明對GDP增長率產生影響的其他因素在這期間也有不同程度的結構改變。

表1 結構變化時點說明
其次,影響GDP和FDI結構變化的主要來源是2002年的共同因子,與其他誤差項關系不顯著。2002年是我國加入WTO的第一年,各省市面臨的對外貿易國際環境發生了巨大改變,全國采取了一系列有效舉措促進國際貿易全面發展,以拉動國民經濟快速增長。這些來自全國的經濟結構調整和戰略部署形成了影響30個省市的共同因子,而權重系數的區間異質則表明不同省市之間的實施力度是有差異的。
最后,對中國30個省份1995—2015年的國內生產總值GDP和外商直接投資FDI建立如前設計的模型是不恰當的。在研究國內生產總值與外商直接投資的協同關系時,若以回歸殘差的結構變化作為協同關系的結構變化是有誤的,因為二者協同關系的結構變化主要來源于共同驅動因素,而不是其他誤差因素。因此,更適宜的模型形式應當為:

截面相關的非平穩面板數據建模一般優先考慮建立帶共同因子的面板協整模型,模型形式的設定關系著檢驗結果的準確性,因此數據結構內在邏輯至關重要。本文發現已有文獻中對截面相關和結構變化采取分別處理的方式進行建模研究,忽視了二者之間的交互效應,進而對非平穩面板數據建模基本范式的使用過程提出質疑,認為面板數據基本結構分析是所有模型構建和參數估計的根本,不適宜的模型搭建將給出不恰當的分析結論。
本文采用實際經濟數據進行分析,得出非平穩面板數據模型中共同因子和結構變化的交互效應確實存在的結論,這說明對基本范式的部分質疑成立。結果顯示在非平穩面板數據模型中要區分結構變化的來源因素,特別是由共同因子結構帶來的結構變化,否則將導致模型中傳統結構變化處理方法失效。所以,在實證模型構筑之前應當進行數據基本結構檢驗,以最適宜的模型形式貼近數據真實生成過程。
[1]陳海燕.面板數據模型的檢驗方法[M].北京:經濟科學出版社,2012.
[2]Baltagi B H,Song S H,Kwon J H.Testing for Heteroskedasticity and Spatial Correlation in a Random Effects Panel Data Model[J].Computational Statistics&Data Analysis,2009,53(8).
[3]Banerjee A,Carrion-i-Silvestre J L.Cointegration in Panel Data With Breaks and Cross-section Dependence[J].Journal of Applied Econometrics,2015,30(1).
[4]Westerlund J,Edgerton D L.A Simple Test for Cointegration in Dependent Panels With Structural Breaks[J].Oxford Bulletin of Economics and Statistics,2008,5(70).
[5]珂英,張鴻武.城鎮化與工業化對能源強度影響的實證研究——基于截面相關和異質性回歸系數的非平衡面板數據模型[J].中國人口·資源與環境,2016,26(6).
[6]王維國,薛景,于剛.基于結構突變和截面相關的面板協整檢驗[J].數量經濟技術經濟研究,2013,(5).
[7]Chudik A,Pesaran M H,Tosetti E.Weak and Strong Cross-section Dependence and Estimation of Large Panels[J].Econometrics Journal,2011,(14).
[8]Pesaran M H.General Diagnostic Test for Cross Section Dependence in Panels[J].University of Cambridge&USC,2004.
[9]韓本三,徐鳳,黎實.面板數據模型的截面相關檢驗研究[J].統計研究,2011,28(12).
[10]Pesaran M H,Ullah A,Yamagata T.A Bias-Adjusted LM Test of Error Cross Section Independence[J].Econometrics Journal,2008,(11).
[11]Pesaran M H.Estimation and Inference in Large Heterogeneous Panels With a Multifactor Error Structure[J].Econometrica,2006,74(4).
[12]Kapetanios G,M H Pesaran,T Yagamata.Panels with non-stationary Multifactor Error Structures[J].Journal of Econometrics,2011,160.
[13]Bai J,Ng S.A Panic Attack on Unit Roots and Cointegration[J].Econometrica,2004,72(4).
[14]Bai J,Ng S.Determining the Number of Factors in Approximate Factor Models[J].Econometrica,2002,70.
[15]Bai J,Carrion-i-Silvestre J L.Structural Changes,Common Stochastic Trends,and Unit Roots in Panle Data[J].The Review of Economic Studies,2009,(76).
[16]Bai J.Common Breaks in Means and Variance for Panel Data[J].Journal of Econometrics,2010,157(1).
[17]Costantini M,Gutierrez L.Simple Panel Unit Root Tests to Detect Changes in Persistence[J].Economics Letter,2007,(96).
[18]Kapetanios G.Unit Root Testing Against the Alternative Hypothesis of up to M Structural Breaks[J].Journal of Time Series Analysis,2005,(26).
[19]Bai J,Perron P.Computation and Analysis of Multiple Structural Change Models[J].Journal of Applied Econometrics,2003,18(1).
[20]Pesaran M H.A Simple Panel Unit Root Test in the Presence of Cross-section Dependence[J].Journal of AppliedEconometrics,2007,22(2).