胡 毅,王美今,汪壽陽
(1.中國科學院大學管理學院,北京100190;2.中山大學嶺南學院,廣東廣州 510275;3.中國科學院數學與系統科學研究院,北京 100190)
矩約束模型的最優矩條件選取方法
胡 毅1,王美今2,汪壽陽3
(1.中國科學院大學管理學院,北京100190;2.中山大學嶺南學院,廣東廣州 510275;3.中國科學院數學與系統科學研究院,北京 100190)
大量經濟、金融以及企業管理等領域研究對象的行為特征可以通過矩約束模型來刻畫。然而,該模型中參數的估計對矩條件的選取非常敏感。如何選取最優的矩條件,進而得到更準確的參數估計和更精確的統計推斷,是實證研究面臨的重要問題。本文從估計量均方誤差(MSE)最小的角度,研究了一般矩約束模型兩步有效廣義矩(GMM)估計的最優矩條件選取方法。首先,利用迭代的方法,推導出兩步有效GMM估計的高階MSE,然后通過Nagar分解,求出了兩步有效GMM估計量的近似MSE。接著,基于近似MSE表達式,給出了兩步有效GMM估計矩條件選取準則的一般理論,即定義了最優的矩條件,提出了兩步有效GMM估計的最優矩條件選取準則,并證明了選取準則的漸近有效性。模擬結果表明,本文提出的矩條件選取方法能夠很好地改善兩步有效GMM估計量的有限樣本表現,降低估計量的有效樣本偏差。本研究為實證研究中面臨的矩條件選擇問題提供了理論依據。
矩約束模型;GMM估計;高階MSE;近似MSE;選取準則
矩約束模型被廣泛應用于經濟、金融以及企業管理等領域的實證研究。例如,經濟分析中常用的線性回歸模型、金融領域著名的資產定價模型以及企業管理中最優資本結構模型等均可看作為矩約束模型。該模型的參數通常采用廣義矩方法(GMM)估計。從Hansen[1]提出GMM以來,該方法逐漸成為計量經濟學的基本估計方法。Hansen也因此而獲得2013年諾貝爾經濟學獎。然而,盡管在相當一般的正則性條件下,GMM有著非常好的漸近性質,但是它的有限樣本表現卻不盡如人意。同極大似然估計(MLE)一樣,GMM沒有精確分布,實證中,通常利用GMM估計量的漸近分布來近似其有限樣本分布,進而進行推斷。然而,大量研究表明,基于這種近似做出的推斷的精度比較低,如Hansen和Singleton[2]的消費資產定價模型,Holtz,Newey和Rosen[3]的動態面板模型,Angrist和Krueger[4]自然實驗的例子等等。通常,有兩個方面的原因會影響GMM估計量的有限樣本性質:一是多矩條件(many moments)的應用;二是弱識別矩條件(weak identification moments)的存在。
為了解決上述問題,近年來,GMM估計已經由傳統的漸近理論發展到多漸近理論(many asymptotic)、弱漸近理論(weak asymptotic)以及同時考慮多和弱的漸近理論(many weak asymptotic)[5-7]。另一個改善GMM估計量的有限樣本的方法是對矩條件進行選取??紤]到矩條件的數目的增多會增大GMM估計量的漸近有效性,但同時也會加大估計量的有限樣本偏差。因此可以考慮尋找到一組矩條件,使得估計量的偏差和方差之和最小,也即使得估計量的均方誤差(MSE)最小。
Andrews[8]首次提出GMM中基于正交性條件的矩條件選取準則(MSC),并給出了MSC的一致性證明。該文考慮研究者面臨著一組矩條件,其中一部分矩條件是正確的,另外一部分矩條件是錯誤的。MSC的目的就是一致地選出正確的矩條件。
Hall,Inoue,Jana和Shin[9]則是從信息的角度來考慮矩條件的選擇。通常認為,總體矩條件包含待估參數的信息,因此,所選取的矩條件應該盡可能的反應估計和推斷所需的信息。該文指出,GMM估計量極限分布的熵(entropy)可以用來度量總體矩條件中包含信息的大小。在此基礎上,他們提出了基于熵的矩條件選取準則,該準則能一致地選出相關的矩條件,稱為相關的矩條件選取準則(RMSC)。和MSC不同的是,RMSC旨在改善參數估計值方差陣的精度。
Donald,Imbens和Newey[10]研究了條件矩約束模型中矩條件的選取,該文將Donald和Newey[11]的研究結論推廣到異方差的情形。與Donald和Newey[11]的研究思路類似,該文首先根據條件矩約束模型構建無條件的矩條件,然后對無條件的矩條件進行兩步GMM估計,再根據高階漸近理論對兩步GMM估計量進行分解,由分解結果求出估計量的線性組合的近似MSE。實際計算中,最小化該近似MSE的一致估計量可以得到最優的矩條件數目。與Andrews[8]的研究出發點不同,該文是在矩條件外生性滿足的條件下,選出最優數目的矩條件來最小化GMM估計量的近似MSE。相比Hall等[9],該文不但考慮了估計量的方差,還考慮了估計量的偏差。但是該文還有以下兩點值得改進的地方。第一,和Donald和Newey[11]的選取準則類似,該文的選取準則也依賴于一個未知的向量,但是該未知向量如何確定,文中并沒有明述。第二,該文假定了研究者對矩條件的強弱有著先驗信息,可以對矩條件的強弱進行排序,但是實證研究中這一假定并不能確保滿足。
本文在Donald等[10]研究的基礎上,做了如下拓展:第一,研究了一般的矩約束模型下兩步有效GMM估計量的高階展開,相比條件矩約束模型,一般的矩約束模型非線性程度更高,處理更復雜,結論也更一般。第二,選取準則直接通過對估計量的近似MSE求跡構造,因而不依賴于未知向量的選取。第三,不必事先假定矩條件的強弱并進行排序。根據Andrews[8]的思想,利用一個選擇向量進行矩條件的選取。
大量經濟和金融模型可用總體矩條件的形式來表示,這種矩條件通常是數據與參數的非線性函數??紤]如下總體矩條件:

其中,z為kz維隨機向量,β0為p維系數向量,g(·)為L維的向量,且L≥p。
假定1 β0∈B,B是有界閉集。
假定2 {zi,i=1,2,…,n}是相互獨立的隨機向量序列。
假定3 (識別條件)E[g(zi,β)]=0當且僅當β=β0。
假定1和3是關于GMM估計的經典假設,是證明GMM估計漸近性質的必要條件。假定2相對于傳統的平穩遍歷性條件有進一步約束,要求觀測值之間相關獨立,這主要是為了簡化后文選取準則的計算。雖然這里要求了獨立性假定,但是沒有要求同分布,允許異方差的存在。對于大多數截面數據來說,該假設是合理的。

根據Hansen[1],在假定1-假定3下,一致且服從漸近正態分布。大量模擬研究表明的有限樣本表現并不盡如人意,Newey和Smith[12]指出的有限樣本偏差會隨著矩條件數目的增多而變大。本文接下來通過高階漸近理論推導出的 MSE,并以此為基礎給出GMM估計的矩條件選取方法,進而改善GMM估計的有效樣本表現。
本部分推導GMM估計量高階MSE的過程借鑒了Ristone,Srivastava和Ullah[13]的研究思路。即利用迭代的方法,逐步將估計量的低階展開代入估計量的高階展開,最后求出估計量的高階展開式,進而求出求高階MSE。與胡毅和王美今[14]線性IV估計不同的地方在于非線性模型下,GMM估計無法求出顯示解,因此其高階MSE的推導過程與最終表達式更為復雜。為方便后文論述,首先定義一些接下來常用的符號。
為了對GMM估計量進行高階展開,進一步給出下述針對矩條件的假設條件。
假定4 在β0的某個鄰域,gi至少3階連續可微,且E(‖?rgi,j‖2)<∞,其中r=0,1,2,3,i =1,2,…,j=1,…,L。
假定5 在β0的某個鄰域,‖?rgi,j(β)-?rgi,j(β0)‖≤‖β-β0‖Mi,j,其中E(Mi,j)<∞,r=0,1,2,3,j=1,…,L,i=1,2,…。
假定4是矩條件可以進行高階Taylor展開的必要條件;假定5也是文獻中常見的針對矩條件的假設條件,類似假定可見Rilstone等[13]、Donald、Imbens和Newey[15]、Anatolyev[16]、Bao和Ullah[17]以及Donald等[10],其目的是為了控制Taylor展開的余項;假定6是技術假設,該假定可以大大簡化高階展開式,參見Alvarez和Arellano[18]、Donald等[10]以及Okui[19]等;假定7是進一步的識別條件;假定8是高階展開中常用的一種處理方法,目的是為了控制高階展開后的余項[15]。

優化問題(2)的一階條件為:τ1+τ2=3,τ1、τ2為非負整數,j=1,…,L,k= 1,…,p,r=1,…,L,i=1,2…。
本文考慮的模型設定允許矩條件的個數大于參數的個數,即存在過度識別的情形。此時若直接對矩條件進行Taylor展開,對于展開后的式子,一階項為L×p的矩陣,無法通過求逆獲得估計量的表達式。為了解決這一問題,本文采用Newey和Smith[12]的 方 法,定 義 輔 助 向 量=-,上述一階條件可以等價為:


對于該式,參數的個數與方程的個數均為K。對上式在θ0=(β′0,0′)′處進行二階Taylor展開,可以得到:

其中,Σ=Φ-1-Φ-1Γ0Ω-1Γ0′Φ-1,Ω= Γ0′Φ-1Γ0,Tβ=Op(L/n),Rβ=op(L2/n3/2),Tλ=Op(ζ(L)L/n),Rλ=。

其中,h=Op(1),=== Op(ζ(L)L/n),Zh=op(L2/n)。
根據定理1的分解,進一步可以得到GMM的高階MSE表達式。

定理2給出了一般的矩約束模型的高階MSE表達式,從該式可以看出,該MSE依賴于Ξ,而Ξ又依賴于更為具體的模型設定。求解具體模型的MSE過程可以利用Nagar[21]近似的思想,即對于估計量,若=Z)=R+S+T,且有,則的近似MSE(n倍)可以近似為R+S。
采用一個L維的列向量c來選取矩條件,c的取值為0或1,若cj=1,表示gi的j個矩條件被選出,反之,則不被選出。令gi(c)表示選出的矩條件,則|c|=c′c為選出的矩條件個數。定義可行的矩條件選擇向量集為C={c|ci=0或1,|c|≥p,c∈RL,j∈N}。根據gi(c)求出的β0的GMM估計量記為,對應的高階MSE為:

其中,Ω(c)和Ξ(c)分別表示,利用選出的矩條件求得的Ω和Ξ。
AMSE(c)=Ω(c)-1+Ω(c)-1Ξ(c)Ω(c)-1
以AMSE(c)作為模型選取的標準。具體比較時,采用 AMSE(c)的對角線元素和,即tr{AMSE(c)}作為比較對象。定義:

為最優的矩條件選取向量,也稱為理論的矩條件選取向量。
AMSE(c)中涉及的變量均為參數的真實值。實際應用中,利用這些參數的一致估計量來代替。定義:

可行的矩條件選取向量由下式給出:

這也即本文提出的矩條件選取準則。
為了證明^c的漸近有效性,進進一步給出如下識別條件。
假定9 (識別條件)c0是唯一存在的。
根據胡毅和王美今[14],可以證明下面定理成立。
定理3 (選取準則的漸近有效性)對于(2)式定義的GMM估計量,若假定1-假定9成立,則當n→∞時:

即由選擇準則(13)選出的矩條件在近似MSE的意義下是最優的。
接下來通過Monte Carlo模擬,考察提出的矩條件選取準則的有限樣本表現。
本節的模擬部分包括三個方面的內容。第一,考察理論的矩條件選取準則的有限樣本表現,即考察通過理論矩條件的選取后,對GMM估計量的有限樣本表現是否有所改善;第二考察可行的矩條件選取準則的有效樣本表現;第三,考察矩條件選取準則本身的有限樣本表現。
5.1 模擬設計
模擬設計類似于胡毅和王美今[14],即考慮結構方程同時存在一個內生變量與一個外生變量的情形,但放松了同方差的假定。
DGP設定如下:

其中,Z1i為d3維的外部工具變量,d=d3+1為全部工具變量(矩條件)個數,c為d3維選擇向量。
具體模擬時,各個參數的設定分別為:n∈{500,1000},d3=20,γ0=0.1,δ0=0.2。σεv= {0.1,0.5,0.9},σεv可以用來控制模型內生性的強弱,σεv的值越大,模型的內生性問題越嚴重。第一階段回歸的擬合優度可以用來控制工具變量(矩條件)整體的強弱,根據Hahn和Hausman[21],第一階段回歸的理論擬合優度為,設定∈{0.1,0.3},的值越小,表明所用的工具變量越弱,此時對應的矩條件也越弱。此外,由的表達式,可以看出,π1越大,越大,因此,π1的系數大小可以體現工具變量(矩條件)的重要程度。另外,φ(Z)用來控制模型的異質性,考慮兩種函數形式。其一是φ(Z)=,即考慮異方差的情形;其二是φ(Z)=1,模型退化胡毅和王美今[14]考慮的同質的情形。
對于參數π1的設定,令π12=0.05;對于外部工具變量的系數π11,則考慮如下兩個模型:
模型A:系數遞減

模型B:π11向量前五個元素的值相等,后面元素的值為0。根據的公式,即:

相比較而言,模型B對工具變量(矩條件)的強弱有更好的區分度。最后,模擬重復次數為1000。參數一旦給定,在重復模擬中不再改變。
5.2 模擬結果分析
首先,考察不同參數設定下,β0=(γ0,δ0)′的估計量的有限樣本表現。本文采用四種方法估計β0,分別是最小二乘估計(OLS)、利用全部工具變量(矩條件)的兩步GMM估計(GMM-all)、利用可行的矩條件選取準則選出的矩條件進行的兩步GMM估計(GMM-sel)以及利用真實的矩條件選取向量選出的矩條件進行的兩步GMM估計(GMM-opt)。對于每個估計,分別計算其偏差的中位數(Med.Bias)、絕對偏差的中位數(Med.AD)以及四分位數間距(Dec.Rge);前兩個指標可以用來刻畫估計量的偏差程度,后一個指標刻畫估計量分布的變異程度。對比這些估計量,可以考察矩條件的選取準則對GMM估計量的有限樣本性質的改善情況。模擬結果見表1。n=1000以及模型B的結論類似,為節省篇幅,結果備索。
表1給出了擾動項異方差時,模型A在樣本容量為500下的結果。在模型A的設定下,第一階段回歸模型的外部工具變量的回歸系數逐漸遞減,意味著由這些工具變量構造的矩條件的重要程度也逐漸減弱。從表1我們可以得到以下結論:(1)幾乎在所有設定下,GMM-opt有著最小的偏差與絕對偏差。在模型的內生性問題很弱并不嚴重的情形,即σεv=0.1時,經過矩條件選取后的GMM估計量與利用全部矩條件的GMM估計量在偏差上并沒有明顯改善,從后面的選取個數的分析可以看出,此時選取準則基本選出了全部的矩條件,因此GMM-opt與GMM-all的結果很接近。但是值得注意的是,此時GMM-all的表現本身已經較好,從表中可以看出,=0.1時GMM-all的偏差不到內生性問題嚴重時(σεv=0.5)的十分之一,因此可供改善的空間并不大。當模型的內生性問題變得嚴重時,選取準則的優勢便很明顯地體現出來,GMM-opt的偏差只有GMM-all的二分之一或是更少。(2)GMM-sel的偏差與絕對偏差介于GMM-all與GMM-opt之間,且當模型的內生性問題變得嚴重或是第一階段回歸的擬合優度變大時,GMM-sel的偏差與絕對偏差相對于GMM-all越來越小,且越來越接近GMM-opt的偏差與絕對偏差。這意味著本文提出的可行的矩條件選取準則表現良好,可以有效地減小兩步GMM估計量的偏差。(3)從OLS到GMM-opt,四分位數間距Dec.Rge的值有逐漸增大的趨勢,驗證了選取過程是一個偏差和方差相互權衡的過程。但是GMM-opt與GMM-all相比,Dec.Rge增加的也并不是太多。(4)隨著工具變量與內生解釋變量的相關性變強,所有估計量的偏差都顯著變??;而隨著模型內生性問題變得嚴重,所有估計量的偏差都變大,但相比之下,GMM-opt與GMM-sel的偏差變大幅度要遠小于OLS與GMM-all偏差變大的幅度。這進一步體現了本文提出的矩條件選取方法的優勢所在。(5)與胡毅和王美今[14]的模擬結果類似,結構方程的外生解釋變量的偏差在所有設定情形下均很小,幾乎不受內生性問題的影響。
接著考察定理3的表現,也即選取準則本身的有限樣本表現。根據定理3,選取準則的漸近有效性要求tr[AMSE]/tr[AMSE(c0)]以概率為1趨于1,有限樣本下,該值越趨近于1越好。定義Ratio=tr[AMSE)]/tr[AMSE(c0)],對于給定的參數設定,每次模擬時計算Ratio的值。表2給出了1000次模擬中,Ratio的四分之一分位數(LQ)、中位數(Med)以及四分之三分位數(UQ)。從表3可以看出,在所有設定中,Ratio的Med均非常接近于理論值1,且根據LQ與UQ的值可以看出,Ratio的變異程度很小。這表明本文提出的矩條件選取準則本身的有限樣本表現非常良好。
最后,本文還考察了各種參數設定下,1000次模擬中,分別利用矩條件選取準則和最優的矩條件選取向量選出的矩條件個數的中位數(見表3)。結果表明:當模型的內生性問題不嚴重時,無論是模型A還是模型B,選取準則和最優的矩條件選取向量幾乎都選出了全部的矩條件,這與胡毅和王美今[14]IV的情形有所不同。主要原因是模型的內生性并不嚴重時,增加矩條件的數目并不會使得估計量的偏差變得很大,但是會顯著的減小估計量的方差,綜合來看,增加矩條件的數目會改善估計量的MSE性質。當模型內生性問題變得嚴重時,利用矩條件選取準則和最優矩條件選取向量選出的矩條件數目均為全部矩條件的三分之一或是更少,兩者的數目也非常接近。這說明了兩點:一是在模型存在內生性問題時,矩條件選取的必要性;二是進一步的印證了定理3的結論。從表3的模型B還可以看出,當模型的內生性問題相當嚴重時(σεv=0.9),利用矩條件選取準則和最優矩條件選取向量均只選出了五個有效的矩條件,這也進一步的表明本文選取方法的有效性。

表1 模型A,n=500,d3=20

表2 Ratio=tr[AMSE(c_hat)]/tr[AMSE(c0)]

表3 選擇準則選出矩條件個數的中位數,d3=20
本文對一般的矩約束模型的兩步GMM估計量進行高階Taylor展開,進而通過迭代的方法,求出兩步GMM估計量的高階MSE和近似MSE表達式。利用該近似MSE表達式,首先給出了兩步GMM估計量矩條件選取的一般方法,并證明了該方法的漸近有效性。然后,通過一個擾動項存在異方差且帶有內生解釋變量的回歸模型,利用Monte Caro模擬考察了各種參數設定下,本文提出的選取準則的有限樣本表現。模擬結果表明:提出的最優矩條件選取向量以及可行的矩條件選取準則均可以大幅降低傳統的兩步GMM估計量的有限樣本偏差。這一研究為實證研究中面臨的矩條件選取問題提供了理論依據。
本文的矩條件選取準則并不依賴于對矩條件重要程度的排序。實際應用中,當矩條件數目比較少時(少于10個),可以利用枚舉法來尋找最優的矩條件選取向量;當矩條件數目較大時,則可以考慮通過模擬退火算法來實現[22]。
[1]Hansen L P.Large sample properties of generalized method of moments estimators[J].Econometrica,1982,50(4):1029-1054.
[2]Hansen L P,Singleton K J.Generalized instrumental variables estimation of nonlinear rational expectations models[J].Econometrica,1982,50:1269-1286.
[3]Holtz-Eakin D,Newey W,Rosen H S.Estimating vector autoregressions with panel data[J].Econometrica,1988,56(6):1371-1395.
[4]Angrist J D,Krueger A B.Does compulsory school attendance affect schooling and earnings?[J].The Quarterly Journal of Economics,1991,106(4):979-1014.
[5]Stock J H,Wright J H.GMM with weak identification[J].Econometrica,2000,68(5):1055-1096.
[6]Han C,Phillips P C B.GMM with many moment conditions[J].Econometrica,2006,74(1):147-192.
[7]Newey W K,Windmeijer F.Generalizedmethod of moments with many weak moment conditions[J].Econometrica,2009,77(3):687-719.
[8]Andrews D.Consistent moment selection procedures for generalized method of moments estimation[J].Econometrica,1999,67(3):543-563.
[9]Hall A R,Inoue A,Jana K,et al.Information in generalized method of moments estimation and entropy-based moment selection[J].Journal of Econometrics,2007,138(2):488-512.
[10]Donald S G,Imbens G W,Newey W K.Choosing instrumental variables in conditional moment restriction models[J].Journal of Econometrics,2009,152(1):28-36.
[11]Donald S G,Newey W K.Choosing the number of instruments[J],Econometrica,2001,69(5):1161-1191.
[12]Newey W K,Smith R J.Higher order properties of GMM and generalized empirical likelihood estimators[J].Econometrica,2004,72(1):219-255.
[13]Rilstone P,Srivastava V K,Ullah A.The second-order bias and mean squared error of nonlinear estimators[J].Journal of Econometrics,1996,75(2):369-395.
[14]胡毅,王美今.IV估計的最優工具變量選取方法[J].數量經濟技術經濟研究,2011,28(7):122-136.
[15]Donald S G,Imbens G W,Newey W K.Empirical likelihood estimation and consistent tests with conditional moment restrictions[J].Journal of Econometrics,2003,117(1):55-93.
[16]Anatolyev S.GMM,GEL,serial correlation,and asymptotic bias[J].Econometrica,2005,73(3):983-1002.
[17]Bao Yong,Ullah A.The second-order bias and mean squared error of estimators in time-series models[J]. Journal of Econometrics,2007,140(2):650-669.
[18]Alvarez J,Arellano M.The time series and cross-section asymptotics of dynamic panel data estimators[J]. Econometrica,2003,71(4):1121-1159.
[19]Okui R.The optimal choice of moments in dynamic panel data models[J].Journal of Econometrics,2009,151(1):1-16.
[20]Nagar A L.The bias and moment matrix of the general k-class estimators of the parameters in simultaneous equations[J].Econometrica,1959,27:575-595.
[21]Hahn J,Hausman J.A new specification test for the validity of instrumental variables[J].Econometrica,2002,70(1):163-189.
[22]胡毅,王美今.基于模擬退火算法的工具變量選取方法[J].系統工程理論與實踐,2014,34(4):892-898.
Choosing the Optimal Moments in Moment Restriction Models
HU Yi1,WANG Mei-jin2,WANG Shou-yang3
(1.School of Management,University of Chinese Academy of Sciences,Beijing 100190,China;2.Lingnan College,Sun Yat-sen University,Guangzhou 510275,China;3.Academy of Mathematics and Systems Science,Chinese Academy of Sciences,Beijing 100190,China)
Many behavior characteristics in the area of economics,finance and business management can be depicted by moment restriction models.Nevertheless,the parameters estimation in these models is sensitive to the selection of moments.How to choose the optimal moments,and then get more accurate parameter estimation and statistical inference is a crucial problem in empirical research.A method is proposed in this paper to select moments for two-step generalized method of moments(GMM)estimators in moment restriction models with many moments.The basic idea of this method is choosing moments such that the MSE of the GMM estimator is smallest.Firstly,iterative techniques are used to derive the higher order mean squared error(MSE)for two-step GMM,and obtain the approximate MSE for the estimators using Nagar decomposition.Then the optimal selection criterion is proposed and the asymptotic efficiency is shown.Monte Carlo simulations indicate that the proposed selection criterion could improve the finite sample properties of two-step GMM,and reduce the finite sample bias of two-step GMM,significantly.This research provides a theoretical basis for selection of moments in empirical studies.
moment restriction models;generalized method of moments;higher order MSE;approximate MSE;selection criterion
F224.0
A
1003-207(2014)07-0026-08
2013-07-16;
2014-02-18
國家自然科學基金資助項目(71301160);中國博士后科學基金資助項目(2012M520420)
胡毅(1985-),男(漢族),湖北荊州人,中國科學院大學管理學院,講師,研究方向:計量經濟學模型及其在經濟管理中的應用.