李國正,張明璽,謝艾香(1.北京工業大學 a.經濟與管理學院,b.應用數理學院 北京10014;.北京大學 光華管理學院,北京 100871)
抽樣調查校準估計法應用研究
李國正1a,張明璽2,謝艾香1b
(1.北京工業大學 a.經濟與管理學院,b.應用數理學院 北京100124;2.北京大學 光華管理學院,北京 100871)
文章歸納梳理了抽樣調查校準估計法的理論發展,對最短距離法、工具向量法和參數校準法的基本理論與操作進行了對比分析。在此基礎上,進一步對抽樣調查的兩階段校準估計法原理及應用進行了分析,并選取了我國混合所有制經濟國有企業中進行了國企產權改革的企業為樣本,并基于這三種校準估計方法得到混合所有制國企產權改革的績效數據與實際的績效數據進行了比較,以判斷抽樣調查校準估計方法的有效性。研究發現,從均方誤差和相對偏差的角度來看,最短距離法、工具向量法和參數校準法這三種抽樣調查校準估計法都能很好的估計混合所有制國企產權改革績效,但參數校準法更加有效。
抽樣調查;校準估計法;混合所有制;國企產權改革;國企績效
在抽樣調查中,樣本結構與總體結構會存在著偏差。不管這些偏差是基于何種原因產生,都會影響抽樣調查的精度和效度。當調查指標與目標量高度相關時,此時樣本結構與總體結構的偏差若較大,會影響目標估計量的估計結果。此時,若要更好地估計出總體的相關信息并提高估計結果的精度,需要對調查樣本結構進行調整。此時,校準估計法即利用現有的已知調查總體的輔助信息,在一定的約束條件下對樣本進行調整,并使得樣本結構盡量擬合總體結構估計方法。校準估計方法可以很好的減少樣本總體與結構總體的差異性,提高抽樣精度和偏差以及估計精度。
自從Deville and Sarndal(1992)提出校準估計量方法以來,大量的文獻對這一研究方法進行了研究。現有對校準估計法的研究目前仍處于不斷發展中,也在國外的抽樣實踐中得到了相對較好的應用。但在我國,對校準估計量方法的理論研究相對較少,主要以學習較少為主,特別是實踐應用方面相對較少。事實上,相對于經驗研究中占據主導地位的計量實證方面,校準估計的作用遠被低估。因此,本文將在對抽樣調查校準估計的現有研究進行對比分析的基礎上,利用兩階段校準估計法原理,以我國混合所有制國企產權改革績效為研究對象,研究抽樣調查校準估計法在我國具體實踐中的應用問題。
對于抽樣調查校準估計法,基本思路如下:假設總體k的入選概率為πk,原始設計權重為
此抽樣調查時,根據相關的輔助信息對原始設計權重不斷調整,形成新的校準權重wk。在這種情形下,新的樣本結構可以更好地擬合總體結構,從而使得估計的精度得到提高。
現階段,校準估計法主要有以下三種方法:
1.1 最短距離法
為了使得距離函數最小,最短距離法試圖利用新的校準權重wk來代替原始設計權重dk以達到這一目標。令輔助變量集合xk=(xk1,...,xkj,...,xkJ)′,其中k∈s。總體X=(x1,x2,...,xJ)為已知參數。令原始設計權重與校準權重之間的距離定義為G(wk,dk),為一個包含了比例因子qk的函數,其中qk>0。令G(w ,d)對w的偏導g(w ,d)連續可微且g(0 ,0)=0。通常來講,距離函數需要滿足gk(w ,d)=是一個嚴格單調遞增的函數,且滿足g(1)=0, g′(1)=1。
對于最短距離法而言,其目標在于抽樣調查時搜尋到最接近原始設計權重dk的校準權重wk,使得在約束條件下能得到最小的值。基于Lagrange乘子法,可以得到校準權重和總體的校準估計量:

通常來講,常見的距離函數包括以下幾種,用表1來表示:

表1 常見的距離函數
校準估計法是利用距離函數,其校準估計量都漸進接近于廣義的線性回歸估計量,盡管不同的距離函數會導致校準估計量的方差有較小的變化。
1.2 工具向量法
為了得到無偏一致的校準估計量,有學者將最短舉例法中的約束等式用包含兩個參數的簡單函數F(·)來表示,只需要校準權重wk滿足這一函數即可(Estevao and Sarndal,2000,2006)。
假設輔助向量xk的IV定義為其中k∈s。矩陣是一個J×J維的非奇異矩陣。此時,校準權重將滿足:

其中,F(·)和前面的最短距離法有同樣的效果。而λ則由校準式子決定。當本文將F(·)的函數形式設定為1+u=1+λ′zk時,此時有進而可以得到:

通常來講,zk是xk的函數。工具向量可以表示為:

1.3 參數校準法
一般來講,校準估計量會設定目標變量與輔助變量之間存在著線性關系,但若兩者之間不存在線性關系時,此時得到的校準估計結果將à叉。為此,有學者提出了參數校準方法,利用模型估計的方法來解決這一問題(Wu and Sitter,2001)。具體來講,其基本思路如下:當對于任何k∈U,xk是已知時,此時輔助信息是信息完全的,可以充分利用每個總體單位的所有輔助信息。
假設y與x之間滿足以下關系:

此時,總體的輔助信息可以用以擬合方程μ(xk,?),模型的校準估計量可以表示為:

相應的約束條件可以表示為:

根據式(8)的約束條件可以得到校準權重。相應的卡方距離函數為
利用基于Lagrange乘子法:

相應的,參數校準估計量的漸進方差以及其估計量可以表示為:

Rueda等(2010)利用非參數估計的方法,對有限總體分布函數進行了估計。具體來講,基于局部線性Kernel回歸來回歸得到分布函數的校準估計量。
對比這三種方法,最短距離法是工具變量與參數校準法的一個特例。工具向量法和最短距離法相比,同樣可以保證無偏與一致性,但其校準權重的得到方式更加多樣化,并且其校準估計量也相對豐富。而參數校準法則可以解決總體目標變量與輔助變量之間的非線性問題,估計結果相對較好。同時,這三種方法對于輔助信息的要求程度也有較大不同。對于工具向量法和最短距離法而言,需要得到輔助變量的總體總值以及所有樣本的輔助變量取值。而參數校準法對輔助信息的要求是最高的,還需要知道總體變量的總體總值以及所有總體單位的輔助變量取值。
2.1 抽樣調查的兩階段校準估計法原理
目前,校準估計法常用的是兩階段估計方法,其具體方法如下:
兩階段校準估計法的第一步是計算中間校準權重w1k,此時的校準約束條件可以表示為:

相應的中間校準權重為:

兩階段校準估計法的第二步是得到最終的校準權重wk,此時的校準約束條件可以表示為:


其中,zk是一個有效的IV。相應的校準估計量
2.2 兩階段校準估計法在混合所有制國企產權改革抽樣調查中的應用
假設所有混合所有制企業的樣本總體為U={1,...,k,...,N},存在N1個單元,分別為U1,...,Ui,...,UN1。此時,兩階段抽樣過程如下:
第一步,依據抽樣方案 pI(·),從U1中抽取初始單元樣本sI,后者在抽樣方案pI(·)中的概率為抽樣方案πIi,
對于混合所有制國企產權改革,本文將群i的目標變量y(c)i的輔助變量為x(c)i。因此,對于總體k的目標變量y(u)k的輔助變量為x(u)k。此時,兩階段抽樣的輔助信息包括兩個方面的信息:(1)群水平。任意i∈sI與輔助變量x(c)i,并且是預先可知的;(2)總體單位水平。對于任意k∈s與輔助變量并且也是預先可知的。
接下來,本文將利用群水平和總體單位水平上的輔助信息來估計得到和當群校準權重wIi與總體單位的校準權重wk并不相關時,則此時群水平和總體單位水平上的約束信息可以表示為:

根據這些約束條件,可以得到群水平上相應的目標變量總值YI和總體單位水平上相應的目標變量總值Y的校準估計量。

此時,新的校準約束可以表示為:


求解上式可以得出:

zk是有效的IV。
此時,可以得到相應的校準估計量:

3.1 算例分析
對于我國而言,國有企業改革不斷深化。以中央企業為例,截止2012年,中央企業的登記戶數超過了21萬戶,其中混合所有制企業的登記戶數超過6000戶數,占登記企業總數28.5%以上。我國混合所有制企業的基本情況如表2所示。

表2 我國混合所有制企業的基本情況
本實驗選取了我國混合所有制經濟國有企業中進行了國企產權改革的企業為樣本,共獲得了1000家混合所有制國有企業。現有研究表明,國企產權改革會提升國企績效(劉春、孫亮,2013;陳林、唐楊柳,2014)。為此,本文計算出了2008—2012年期間,這些國有企業的利潤率提升(pr3)這一指標,用以衡量其績效:

其中 pr3表示混合所有制經濟中國企改革之后國企的績效提升,用改革后3年的利潤率提升(相對于改革前的最后一年)加權平均數來表示,rt表示第t的利潤率提升水平。
通過上文所述的三種校準估計方法得到混合所有制國企產權改革的績效數據,與實際的績效數據進行比較,進而判斷本文的抽樣調查校準估計方法的有效性。
在模擬中,本文生成了一個獨立同分布、樣本量為1000的有效總體。由于模擬總體的真實值pr3是已知的,因此為了便于比較估計結果和真實值的差異,本文將用相對偏差(RB)和均方誤差(MSE)來衡量:

3.2 研究結論
此時,本文可以得到這三種校準估計方法下國企業績效改革的均方誤差和相對偏差,見表3和表4。

表3 不同校準估計方法下混合所有制國企業改革績效的均方誤差

表4 不同校準估計方法下混合所有制國企業改革績效的相對偏差
從表3和表4可以看出,在最短距離法、工具向量法和參數校準法這三種抽樣調查校準估計法下,得到的均方誤差都相差不大,但對于模擬中生成的5個總體,工具變量法得到的調整估計量要小于最短距離法得到的校準調整估計量,而參數校準法得到的調整估計量要小于工具變量法得到的調整估計量。對于相對偏差而言,三種的差距也不大:從絕對值的角度,工具變量法得到的調整估計量仍要小于最短距離法得到的校準調整估計量,而參數校準法得到的調整估計量同樣要小于工具變量法得到的調整估計量。
[1]Estevao V M,Sarnda C E.A Functional Form Approach to Calibration [J].Journal of Official Statistics-Stockholm,2000,16(4).
[2]Estevao V M,Sarndal C E.Survey Estimates by Calibration on Com?plex Auxiliary Information[J].International Statistical Review,2006, 74(2).
[3]Harms T,Duchesne P.On Calibration Estimation for Quantiles[J].Sur?vey Methodology,2006,32(1).
[4]Rueda M,Sanchez-Borrego I,Arcos A.Model-Calibration Estimation of the Distribution Function Using Nonparametric Regression[J]. Metrika,2010,71(1).
[5]Wu C,Sitter R R.A Model-Calibration Approach to Using Complete Auxiliary Information From Survey Data[J].Journal of the American Statistical Association[J].2001,96(453).
[6]劉建平等.輔助信息在抽樣調查中的應用模型與方法[M].北京:中國統計出版社,2008.
[7]劉春,孫亮.政策性負擔、市場化改革與國企部分民營化后的業績滑坡[J].財經研究,2013,(1).
[8]陳林,唐楊柳.混合所有制改革與國有企業政策性負擔——給予早期國有產權改革大數據的實證研究[J].經濟學家,2014,(11).
[9]張明志,鐵瑛,林娟.宏觀經濟學的經驗研究方法:校準與估計之爭[J].經濟學動態,2014,(1).
(責任編輯/易永生)
C81
A
1002-6487(2016)24-0012-04
國家社會科學基金資助項目(14BGL038;13BGL054)
李國正(1986—),男,山東臨沂人,博士,講師,研究方向:公司治理。
張明璽(1986—),男,湖北武漢人,博士后,研究方向:消費金融。
謝艾香(1993—),女,湖北黃岡人,碩士研究生,研究方向:應用統計。