摘要:貴州省農業總產值是反映貴州省農業生產的總規模和總水平的重要指標。文章利用時間序列分析理論,對1978年至2010年的貴州省農業總產值進行了分析,建立了ARIMA模型并以此對貴州省農業總產值做了分析與短期預測。
關鍵詞:貴州??;農業總產值;ARIMA模型;短期預測
一、引言
農業總產值反映的是一個國家或地區農業生產的總規模和總水平。隨著改革開放的深入,農業問題一直都是我國政府工作的重中之重。時間序列分析是用一段時間的一組屬性數值發現模式從而來預測未來值,ARIMA 模型是較為常用的用來擬合平穩序列的預測模型。
二、ARIMA模型簡介
ARIMA模型全稱為差分自回歸移動平均模型,又被稱為Box-Jenkins模型或博克思-詹金斯法。模型的基本思想是:預測對象會隨著時間推移而形成的數據序列被視為一個隨機序列,用數學模型來近似描述這個序列,并認為該序列會按蘊含的規律遵循下去。這個模型被識別后就可以從時間序列的過去值及現在值進行外推,以此來預測未來值。而ARIMA模型在實證研究中被研究人員廣泛運用于時間序列分析和模型預測領域。ARIMA模型研究的對象是平穩時間序列,因此對一個離散的時間序列進行建模時,應當首先考察其平穩性,再分析和判斷時間序列的生成過程。根據生成機制的不同,ARIMA模型實包含3種類型的模型:
(一)AR模型
AR模型也稱為自回歸模型。它是通過過去的觀測值和現在的干擾值的線性組合預測, 它是僅用時間序列{Yt}的不同滯后項作為解釋變量的模型,其數學形式為:
Yt=?覬1Yt-1+?覬2Yt-2+?覬3Yt-1+......+?覬pYt-p+et
式中:p為自回歸模型的階數;?覬i(i=1,2,......p)為模型的自回歸系數,et為誤差,Yt為一個時間序列。
(二)MA模型
MA模型也稱為移動平均模型。它是通過過去的干擾值和現在的干擾值的線性組合預測,它是僅用誤差的不同滯后項作為解釋變量的模型,其數學形式為:
Yt=et-θ1et-1-θ2et-2-θ3et-3-......-θqet-q
式中:p為模型平均移動階數;θj(j=1,2,......q)為模型的移動平均系數;et為誤差; Yt為觀測值。
(三)ARMA模型
ARMA模型是自回歸模型(AR)和移動平均模型(MA)的組合,構成了用于描述平穩隨機過程的自回歸滑動平均模型ARMA,數學形式為:
Yt=?覬1Yt-1+?覬2Yt-2+?覬3Yt-1+......+?覬pYt-p+et-θ1et-1-θ2et-2-θ3et-3-......-θqet-q
三、ARIMA模型的建立
(一)數據的選取
本研究選用貴州省1978年至2010 年農業總產值的統計數據,數據來源于《貴州省統計年鑒》,經整理后見表1。
令進出口總額為Xt,根據貴州省1978年至2010年農業總產值數據,在Eviews軟件中建立時序圖(見圖1)可以看出,該折線圖是向右上方傾斜的,表明此時間序列存在增長的趨勢。所以貴州省1978年至2010年農業總產值的時間序列數據是不穩定的。
進一步對該時間序列進行單位根檢驗,從輸出結果可知ADF檢驗p的值為0.9996,沒有通過檢驗,因此{Xt}序列是非平穩的,因此先對數據做平穩化處理。
(二)數據平穩化處理
對貴州省1978年至2010年農業總產值時間數據取對數得,并進行二階差分。并對二階差分的數據作單位根檢驗。
對貴州省1978年至2010年進農業總產值時間序列數據取對數并進行二階差分后,得到的ADF檢驗p的值為接近零,因此能通過檢驗,拒絕原假設。對處理后的數據作時序圖(見圖2),可知此圖圍繞某條水平線上下波動,數據無明顯的上升或下降趨勢,說明處理后的數據已經是平穩的,且d=2。
(三)參數的估計與模型的定階
對處理后的數據作滯后16期的自相關(autocorrelation function,ACF)圖和偏相關(partial autocorrelation function,PACF)圖,如圖3。
從該圖可以看到,自相關函數在12步后截尾,所以q=12;偏自相關函數在12步后截尾,所以p=12。
對模型進行檢驗,由于常數項C沒有通過顯著性檢驗,即C對模型沒有顯著性影響故舍掉。AR(12)的p值為0.008,MA(12)的p值接近于零,均能通過單個系數的顯著性檢驗;且擬合優度R2=0.827,擬合情況還算是可以的。因此,p=12,q=12,d=2處理后數據的模型為。由此得到的估計方程為:
D[D(logXt)]=-0.4353D[D(logXt-12)] -0.9408εt-12+εt①
(四)模型的檢驗
如果殘差序列是白噪聲序列即純隨機序列,則表明所建立的模型包含原序列的所有趨勢,模型用于預測是合適的。反之,殘差序列不是白噪聲,說明殘差序列中還有某種信息即還有規律,所建模型不合適,應重新建模??梢岳脷埐畹淖韵嚓P分析圖直觀判斷,其準則是:殘差序列的自相關與零無顯著不同,或者說基本落入隨機區間,殘差序列為白噪聲;反之殘差序列不是白噪聲。
由圖4可以看出,所有Q值都小于檢驗水平為0.05的卡方分布臨界值,最后得出結論:模型的隨機誤差序列是一個白噪聲序列。
建立模型的目的之一是對未來值進行預測。對未來貴州省農業總產值進行預測前, 先檢驗模型的預測能力。模型的預測能力一般用平均絕對百分比誤差(mean absolute percentage error,)度量, 它的計算公式如下:
MAPE=■·■■×100%
通過計算MAPE=1.106<10,說明模型的預測精度較高。通過實際值與預測值的擬合圖可以看出(見圖5),擬合情況是比較理想。
(五)對貴州省農業總產值的預測
通過估計方程①對2011年貴州省農業總產值的預測值為:D[D(logX2011)]=09,925234,經計算得出X2011=670.63億元(2011年的實際值為655.30億元),誤差為2.33%。同時預測貴州省2012年農業總產值為773.85億元。
四、總結
本文構建的貴州省農業總產值自回歸預測模型,經統計檢驗估計方程整體顯著性很好,由此證實了ARIMA模型是一種很好的短期時間序列農業總產值的預測方法,適用于貴州農業總產值的預測研究,可以為貴州農業經濟發展規劃提供決策依據。
值得注意的是,ARIMA模型的短期預測效果好,長期預測效果不好,盡管如此,與其他的預測方法相比,其預測的準確度還是比較高的。
參考文獻:
[1]徐國祥,統計預測與決策(第二版)[M].上海:上海財經大學出版社,2005.
[2]張曉峒.計量經濟學(第三版)[M].天津:南開大學出版社,2007.
[3]易丹輝.時間序列分析方法與應用[M].北京:中國人民大學出版社,2011.
[4]王燕.應用時間序列分析[M].北京:中國人民大學出版社,2005.
(作者單位:貴州大學經濟學院)