王正宇 王紅玲
(安徽大學經濟學院,安徽合肥230601)
時間序列分析,在預測一個時間序列未來的變化時,不再使用一組與之有因果關系的其他變量,而只是用該序列的過去行為來預測未來,不僅考察預測變量的過去值與當前值,同時對模型同過去值擬合產生的誤差也作為重要因素進入模型,作為一種精確度相當高的短期預測方法,近年來在經濟預測過程中廣泛應用并取得了相當好的結果。
ARIMA模型是一類常見的隨機時間模型,它是由美國統(tǒng)計學家博克斯和英國統(tǒng)計學家詹金斯于20世紀70年代提出來的,亦稱B-J方法。其基本思想是將預測對象隨時間推移而形成的數(shù)據序列視為一個隨機序列,用一定的數(shù)學模型來近似描述這個序列。這個模型一旦被識別后就可以從時間序列的過去值及現(xiàn)在值來預測未來值。
Box-Jenkins方法在應用中的常見模型形式為:自回歸移動平均模型(Autoregressive Moving Average Model,簡記ARMA):若時間序列Yt為它的當前與前期的誤差和隨機項,以及它的前期值的線性函數(shù):

則稱該時間序列yt為自回歸移動平均模型,記為ARMA(p,q)。參數(shù) φ1,Λ,φp 為待估自回歸參數(shù),θ1,Λ,θq為待估移動平均參數(shù),殘差μt為白噪聲序列。顯然,AR(p)模型和MA(q)模型都是ARMA(p,q)模型的特例。Box-Jenkins模型要求時間序列為平穩(wěn)序列,而實際應用中時間序列往往表現(xiàn)為長期趨勢,季節(jié)變動、循環(huán)變動的非平穩(wěn)數(shù)列,這時可通過差分法反復差分以消除其趨勢,于是上述ARMA(p,q)又經常以自回歸移動求積平均模型(Autoregressive Integrated Moving Average Model,簡記ARIMA)的形式加以標記。其模型符號為ARIMA(p,d,q),p代表自回歸階數(shù)d,表示對非平穩(wěn)數(shù)列進行差分處理的次數(shù),q代表移動平均的階數(shù)。
該方法把時間序列建模表述為三個階段:
第一,模式識別:確定時間序列應屬的模型類型,其基本原理是根據數(shù)據的相關特性進行鑒別;
第二,估計模型的參數(shù),并結合定階準則和殘差檢驗對模型的適用性進行診斷檢驗;
第三,應用模型進行預測。
從中國統(tǒng)計局統(tǒng)計年鑒上摘錄的1978—2008年中國GDP(生產法)依次如下(單位:億元):

從數(shù)據的散點圖上來看,我國GDP對時間折線圖序列表現(xiàn)出趨勢性,經驗判斷是不平穩(wěn)的。
方法上序列的平穩(wěn)性可以用自相關分析圖(自相關函數(shù)ACF圖和偏自相關函數(shù)PACF圖)判斷:如果序列的自相關系數(shù)AC很快地(滯后階數(shù)K大于2或3時)趨于0,即落入隨機區(qū)間,時序是平穩(wěn)的,反之非平穩(wěn)。經過檢驗該序列非平穩(wěn)。
也可以檢驗對所有k>0,自相關系數(shù)都為0的聯(lián)合假設,這可通過如下Q統(tǒng)計量進行,該統(tǒng)計量近似地服從自由度為m的χ2分布(m為滯后長度)。因此,如果計算的Q值大于顯著性水平為ɑ的臨界值,則有1-ɑ的把握拒絕所有自相關系數(shù)同時為0的假設。若樣本較小,則m一般取[n/4]。
從Q統(tǒng)計量的計算值看,滯后8期的計算值為71.83,超過5%顯著性水平的臨界值15.51拒絕所有相關系數(shù)都為0的假設。
在現(xiàn)實中,常見的時間序列多具有某種趨勢,但許多序列通過差分可以平穩(wěn)。如果原序列非平穩(wěn),經過d階逐期差分后平穩(wěn),則新序列稱為齊次序列。平穩(wěn)序列可以建立ARMA(p,q)模型。原序列可表示為ARIMA(p,d,q)模型。判斷時間序列的趨勢是否消除,只需考察經過d階差分后序列的自相關序列圖,自相關系數(shù)是否很快趨于0。
首先進行一階差分,經過一階差分的序列仍然不平穩(wěn)。因此需要繼續(xù)差分。
進行二階差分后,對二階差分GDP做ADF檢驗,以檢驗序列是否有單位根,即是否非平穩(wěn),二階差分后的序列ADF單位根檢驗結果證實了它的平穩(wěn)性。
模型的識別與建立:
在需要對一個時間序列運用B-J方法建模時,應運用序列的自相關與偏自相關對序列適合的模型類型進行識別,確立 p,q。
參看二次差分后的自相關序列圖,自相關系數(shù)在k=1和k=3時顯著不為0,可以考慮q=1,2,3。同理偏自相關系數(shù)在k=1和k=3時顯著不為0,可以考慮p=1,2,3。
綜上,序列 ddgdp可以建立 ARMA(1,1)或 ARMA(1,2)或 ARMA(2,1)或 ARMA(2,2)或 ARMA(3,1)或ARMA(1,3)或 ARMA(3,2)或 ARMA(2,3)或 ARMA(3,3)。經過篩選對比,將ARMA(p,q)模型的滯后多項式倒數(shù)根落入單位圓外的模型排除,僅考慮ARMA(1,2)和ARMA(2,3)。對序列 gdp 來說就是 ARIMA(1,2,2)和ARIMA(2,2,3)。
對ARIMA(1,2,2)模型建立本文通過Eviews軟件采用命令方式,在主窗口命令行輸入
ls d(gdp,2,0)ar(1)ma(1)ma(2)
這里,對參數(shù)t檢驗顯著性水平的要求并不像回歸方程中那么嚴格,更多的是考慮模型的整體擬合效果。調整后的決定系數(shù)、AIC和SC準則都是選擇模型的重要標準。
再建立 ARIMA(2,2,3)模型:

經過比較,ARIMA(2,2,3)模型t檢驗更加滿足顯著性水平,同時調整后的決定系數(shù)也大了不少,AIC和SC準則值比前面模型更小,說明這個ARIMA(2,2,3)模型是更適合的。

參數(shù)估計后,應該對ARIMA模型的適合性進行檢驗,即對模型的殘差序列進行白噪聲檢驗。若殘差序列不是白噪聲序列,意味著殘差序列還存在有用信息沒被提取,需要進一步改進模型。通常側重于檢測殘差序列的隨機性,即滯后期k>0,殘差序列的樣本自相關系數(shù)應近似為0。檢測方法可以通過觀察樣本自相關序列圖:對ARIMA(2,2,3)模型從k=8這行找到檢驗統(tǒng)計量Q值為1.5323,從Prob列得到值為67.5%,拒絕原假設犯錯的概率為67.5%,即殘差序列相互獨立為白噪聲的概率很大。因此檢驗通過,殘差序列是純隨機的。

從擬合回歸圖看擬合圖形的趨勢走向和幅度較為一致。
基于序列 ARIMA(2,2,3)模型我國2007—2011年GDP預測值


本文利用ARIMA模型對我國經濟進行了預測與分析,實證分析表明,該模型對于分析及預測我國GDP是簡單而又非常有效的。從圖中MAPE項可以看出與實際值預測值(2007、2008兩年)之間誤差百分比是比較小的。另外值得注意的是,ARIMA模型一般在短期內的預測比較準確,隨著預測的延長,三年以上預測誤差相對增大,這也是ARIMA模型的一個缺陷。但盡管如此,如果在建立模型過程中不斷補充近期數(shù)據,調整和優(yōu)選新模型并實現(xiàn)動態(tài)預測,則預測效果還可進一步提高,與其它的預測方法相比,其預測的準確度還是比較高的。同時,這里采用的Box-Jenkins建模思想,由于不需要對時間序列的發(fā)展模式作先驗的假設,方法本身又可反復識別修改,直到獲得滿意的模型,因此非常適合各種經濟時間序列,包括在辨別序列資料的典型特征十分困難和復雜情況下的預測。
[1]易丹輝.統(tǒng)計預測方法與應用[M].中國統(tǒng)計出版社,1988.
[2]李子奈.計量經濟學[M].北京:高等教育出版社,2000.
[3]古亞拉提.經濟計量學精要[M].機械工業(yè)出版社,2006.
[4]易丹輝.數(shù)據分析與Eviews應用[M].中國統(tǒng)計出版社,2002.