從時空維度著眼,可以將計量經濟學的應用數據分為三類:一是橫截面數據;二是時間序列數據;三是縱向數據或面板數據。
一、橫截面數據(Cross-sectional data)
1.橫截面數據的概念、特點及其問題。橫截面數據是指在某一時點收集的不同對象的數據。它對應同一時點上不同空間(對象)所組成的一維數據集合,研究的是某一時點上的某種經濟現象,突出空間(對象)的差異。橫截面數據的突出特點就是離散性高。橫截面數據體現的是個體的個性,突出個體的差異,通常橫截面數據表現的是無規律的而非真正的隨機變化。即計量經濟學中所謂的“無法觀測的異質性”。在分析橫截面數據時,應主要注意兩個問題:一是異方差問題,由于數據是在某一時期對個體或地域的樣本的采集,不同個體或地域本身就存在差異;二是數據的一致性,主要包括變量的樣本容量是否一致、樣本的取樣時期是否一致、數據的統計標準是否一致。
2.橫截面數據異方差性的檢驗與修正。異方差性的檢驗。對異方差的檢驗大多集中于線性模型情形,檢驗方法很多。主要的檢驗異方差性的方法有:圖示檢驗法、等級相關系數檢驗法、戈里瑟檢驗(Glejser Test)、巴特列特檢驗、布魯奇-培根檢驗(The Breusch-Pagan Test)、戈德菲爾德-匡特檢驗(The Goldfeld-Quandt Test)、沃特檢驗(Wald Test)、拉格朗日乘數檢驗、似然比檢驗、懷特(White)大樣本檢驗等。這些檢驗方法在性能上各有優劣,互為補充,在具體操作時宜結合使用,相互驗證,不應單憑個別檢驗結論做出歧視性或排他性的斷言。
3.異方差性的修正。(1)已知Ω時使用加權最小二乘法(WLS)。對于線性回歸模型y=xβ+ε,其GLS估計量為。考慮最一般的情況:,則Ω=;對原模型進行變換(y*=py,x*=px;其中p=Ω-1/2)并應用OLS進行估計得到加權最小二乘(WLS)估計量:,其中WI=1/WI。
(2)Ω含有未知參數的估計方法
①兩階段GLS法。首先估計OLS殘差估計量。OLS殘差,由于,可構造一個回歸,。因此,近似地有,該回歸模型表明可將OLS殘差平方作為因變量以估計某些未知參數。如果得到Ω中未知參數的估計量,即可使用FGLS(Feasible GLS)對原模型進行參數估計,可得到一致的估計量。
然后把代入原模型的GLS估計量中得到:。
②最大似然估計(MLE)。考慮異方差的一般化模型,令,其中θ為Ω中未知參數的向量,是某個協變量zi的函數,。對數函數可變換為:
對該函數分別對βδ2、θ取偏導并求期望,可得到漸近有效的參數估計量。
二、時間序列數據(Time-series data)
1.時間序列數據的概念、特點及其問題。時間序列數據是指對同一對象在不同時間連續觀察所取得的數據。它著眼于研究對象在時間順序上的變化,尋找空間(對象)歷時發展的規律。利用時間序列作樣本時,要注意幾個問題:一是所選擇的樣本區間內經濟行為的一致性問題;二是樣本數據在不同樣本點之間不可比,需要對原始數據進行調整,消除其不可比因素;三是樣本觀測值過于集中,因而時間序列數據不適宜于對模型中反映長期變化關系的結構參數的估計;四是模型隨機誤差的序列相關問題。
2.時間序列數據序列相關性的檢驗與修正。(1)時間序列數據序列相關性的檢驗。計量經濟學模型一旦出現序列相關性,如果仍采用OLS估計模型參數,則會產生與異方差類似的諸多不良后果:OLS參數估計量雖仍具有無偏性,但不具有有效性;變量顯著性檢驗失去意義;模型的預測失效。關于序列相關性檢驗的主流的檢驗方法有三種:一是德賓-沃森(Durbin-Watson)型檢驗;二是馮-諾曼(Von-Neumann)比檢驗;三是逐次回歸檢驗。其他的檢驗方法還包括有圖示檢驗法、布羅施-戈弗雷檢驗、博克斯-皮爾斯檢驗等。
(2)時間序列數據序列相關性的修正。①已知Ω時的估計方法。A、廣義最小二乘(GLS)估計法。如果Ω為已知,GLS估計量為,樣本方差。對于AR(1)過程,,對原模型數據進行變換(y*=py,x*=px)后再次使用OLS方法對參數進行估計,估計結果已消除序列相關性。
對于高階自回歸過程的參數估計方法類似,但變換過程越來越復雜。同樣地,對于高階MA過程和ARMA過程均可通過GLS近似地估計,這里不再做詳細介紹。
B、最大似然估計(MLE)。如果擾動過程的參數已知,AR(1)模型可使用最大似然方法進行估計。為得到正態分布擾動的似然函數,我們利用:。基于變換后的y*,x*(),對數似然函數為:
對函數求偏導即可得到參數β,的估計量。
②自回歸條件異方差(ARCH)。異方差性通常與橫截面數據相聯系,而時間序列則一般地被認為是具有同方差性的。然而,恩格爾(1982)和克拉格(1982)研究發現時間序列模型中存在著一種異方差,其中預測誤差的方差取決于后續擾動項的大小。恩格爾并因此創立自回歸條件異方差(ARCH)模型以選擇。該模型表述如下:
,其中ut是標準正態的。
而且,,以εt-1為條件,εt是異方差的。同時,恩格爾還給出此模型的對數似然函數:
。
然后通過四步FGLS進行估計:
1.運用OLS和所有可用的觀測值將y對x回歸得到b和e;
2.將對回歸以獲得a0和a1的初始估計,記[α0,α1]=a;
3.計算,然后計算漸近有效估計,其中dα為對(1/ft)和/回歸的OLS系數向量。的漸近協方差矩陣為2(z’z)-1,其中z為此回歸的回歸量矩陣;
4.運用α計算ft,然后計算和。估計,其中dβ是etst/rt對xtrt回歸的OLS系數向量。的漸近協方差矩陣為(w’w)-1,其中W是在此回歸的回歸量矩陣。
三、縱向數據(Longitudinal data)或面板數據(Panel data)
1.面板數據兩種常用的估計方法。(1)固定影響模型(Fixed Effect Model)。固定影響模型也被叫做“虛擬變更模型”(Dummy Variables Model)。假設每個橫截面樣本都有各自的截距,我們可以用虛擬變量的形式來表達:
這里β0i是第i個橫截面樣本的截矩。欲準確地估計此模型中的參數,須分以下幾步:
(1)首先求出變量在時間序列上的均值,即
(2)再求出變量的每個樣本與其對應均值的差并設立新變量,即
(3)基于新變量建立模型,即,這里。
(4)計算虛擬變量的參數估計值β0i,即。
運用同樣的估計步驟亦能夠估計出假設時間段(樣本)各有其截矩的面板數據模型的參數值,只須在第一步中改求變量在橫截面上的均值,后三步則相似。
2.隨機影響模型(Random Effect Model)。隨機影響模型也被叫做“誤差成份模型”,模型設定如下,這里誤差項εti期望值為0,方差為。假設β0i為隨機的、相互獨立的變量,其均值為,方差為,則β0i可被寫成:,這里誤差項ηi期望值為0,方差為,且相互獨立,cov(ηi,ηj)=0。而且還假定ηi與εti不相關,cov(ηi,εti)=0。即原模型可改寫為
欲估計此模型的參數,可分如下幾個步驟進行:
(1)首先運用虛擬變量模型來估計參數。假定時間段(樣本)有相對固定的差異,可用虛擬變量來表示,即,可估計出參數值。
(2)將實際數據代入估計模型中以求得誤差項,即
(3)計算出變量的均值,并將它們設為新變量,即
使用新變量設立回歸模型()并運用OLS估計分析。
(4)利用上式模型估計結果求得其誤差項,即
(5)計算校正系數,對原數據進行修正并設立新變量
利用這些修正的變量建立新的回歸模型,即。利用OLS對此模型進行估計,即可得出最佳的、線性的無偏估計量。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。