[摘要] 運用時間序列分析方法之一的單整自回歸移動平均模型(ARIMA)法,對中國社會消費品零售總額進行時間序列分析。分析顯示,ARIMA模型可以提供比較準確的短期預測效果,可以為中國社會消費品零售總額的預測提供一定的依據。
[關鍵詞] ARIMA 時間序列 社會消費品零售總額
一、問題的提出
中國社會消費品零售總額是指各種經濟類型的批發零售貿易業、餐飲業、制造業和其他行業對城鄉居民和社會集團的消費品零售額和農民對非農業居民零售額的總和。這個指標反映通過各種商品流通渠道向居民和社會集團供應生活消費品來滿足他們生活需要的情況,是研究人民生活、社會消費品購買力、貨幣流通等問題的重要指標。由于目前消費需求已經成為經濟增長的重要組成部分,而且今年來社會消費品零售總額呈現遞增的趨勢,如何利用適當的模型對其進行分析和預測,并通過預測的結果了解中國社會消費品零售總額的發展態勢,為有關部門做出正確的決策提供合理的依據,已經成為一個需要我們進行探討和解決的迫切問題。
二、研究方法
ARIMA模型的建模思想。時間序列分析方法是伯克斯·詹金斯(Box-Jenkins1)在1970年提出來的。這種建模方法不考慮以經濟理論為依據的解釋變量的作用,而是依據變量本身的變化規律,利用外推機制描述時間序列的變化。模型建立的前提是時間序列必須具有平穩性。如果時間序列是非平穩的,建立模型之前應先把它變換成平穩的,同時仍保持原時間序列的隨機性。時間序列的基本模型主要有三種:自回歸模型、移動平均模型及單整自回歸移動平均模型。
單整是指將一個時間序列由非平穩性變為平穩性所要經過的差分的次數,這是對非平穩時間序列進行時間序列分析的必經步驟。假設一個隨機過程含有d個單位根,其經過d次差分之后可以變換為一個平穩的自回歸移動平均過程。則該隨機過程稱為單整自回歸移動平均過程。模型中AR稱為自回歸分量,P為自回歸分量的階數;MA為移動平均分量,q為移動平均分量的階數;I為差分,d為使時間序列具有平穩性所需要的差分次數。
1.自回歸過程(AR(P)),是指一個過程的當前值是過去值的線性函數,如:如果當前觀測值僅與上期(滯后一期)的觀測值存在線性函數的關系,則我們就說這是一階自回歸過程,記作AR(1)。推而廣之,如果當前值與滯后P期的觀測值有線性關系則稱:P階自回歸過程,記作AR(P)。其一般表達式為:
。其中,i=1,…p是自回歸參數,ut是白噪聲過程,則稱xt為p階自回歸過程,用AR(p)表示。xt是由它的p個滯后變量的加權和以及ut相加而成。
2.移動平均過程(MA(q)),如果一個線性隨機過程可用下式表達:xt=ut+θ1ut-1+θ2ut-2+…θqut-q=(1+θ1L+θ2L2+…θ2Lq)ut=Θ(L)ut。
其中θ1,θ2,…θp是回歸參數,ut為白噪聲過程,則上式稱為q階移動平均過程,記為MA(q)。之所以稱“移動平均”,是因為xt是由q+1個ut和ut滯后項的加權和構造而成,“移動”指t的變化,“平均”指加權和。
3.ARIMA(p,d,q)模型的一般表達式為:
,即
或Φ(L)=Θ(L)ut。
ARMA(p,q)過程的平穩性只依賴于其自回歸部分,即Φ(L)=0的全部根取值在單位圓之外(絕對值大于1);其可逆性則只依賴于移動平均部分,即Θ(L)=0的根取值應在單位圓之外。
在對含有季節、趨勢等成分的時間序列進行ARIMA模型預測時,就不能像對純粹的滿足可解條件的ARIMA模型那么簡單了,一般的ARIMA模型有多個參數,沒有季節成分可以記為ARIMA(p,d,q),如果不需要利用差分來消除趨勢或循環成分時,差分的階數d=0,模型為ARIMA(p,0,q)即ARIMA(p,q);在有已知的固定周期S時,模型多了四個參數,可計為ARIMA(p,d,q)(P,D,Q)S,這里除了周期S已知之外,還有描述季節本身的ARIMA(p,d,q)的模型識別問題,在實際建模過程之中,需要反復的比較。
ARIMA(p,d,q)(P,D,Q)S模型,它的一般表達式為:
,這里的Φ,Θ為類似于 ARIMA(p,q)模型中的算子,,θ只是描述季節序列,它們定義為:
三、模型的應用
1.時間序列的特征分析。我們將1980年1月~2005年12月的數據作為模型中時間序列的數據,將2006年以后的數據作為預測數據,來判斷模型在預測方面的準確性和有效性。
第一步:通過EVIEWS繪制如圖1所示的社會消費品零售總額的折線圖,可以看出序列具有明顯的增長趨勢,并且包含周期為12個月的季節波動。同時我們對該時間序列進行ADF檢驗,結果顯示它的ADF=1.94735,分別大于不同檢驗水平的三個臨界值(1%-3.4521;5%,-2.87103;10%,-2.5719),因此,該時間序列是非平穩的時間序列。
第二步:對時間序列sale首先做對數處理,得到時間序列sale01,這樣就消除了原始數據中的異方差性。同時,為了使非平穩的時間序列具有平穩性,我們對時間序列sale01進行一次差分。對于經濟時間序列,差分次數,即模型ARIMA(p,d,q)中的參數d通常只取0,1或2,同時通過對時間序列單位根的檢驗來獲得它的ADF值,并判斷參數d的階數。
對時間序列sale01進行單位根的檢驗,其ADF的檢驗結果顯示,ADF=-1.7651分別大于不同檢驗水平的三個臨界值(1%,-3.4512;5%,-2.8706;10%,-2.5717),時間序列接受原假設,即存在單位根的結論。我們繼續對時間序列作差分處理,并對差分后的時間序列進行ADF檢驗,最終經過兩次差分得到時間序列sale03,其檢驗結果顯示,ADF=-18.5949分別小于不同檢驗水平的三個臨界值(1%,-3.4512;5%,-2.8706;10%,-2.5717),二階差分序列在1%的顯著水平下拒絕原假設,接受不存在單位根的結論,因此可以確定時間序列是2階單整序列。
第三步:對時間序列sale01經過兩次差分后,我們通過EVIEWS繪制如圖2所示的折線圖,可以看到序列的趨勢基本消除;我們從它的自相關圖可以看出,當k=12或是24時,自相關系數仍然有較大的峰,說明序列含有季節性,需要進一步作季節差分。再對時間序列作周期S=12的季節差分,差分后時間序列的自相關圖和偏相關圖如圖3所示,序列的樣本的字相關系數和偏相關系數很快落入隨機區域,序列趨勢基本消除,但是當k=12時取值依然很大,季節性依然很明顯,對其作第二次季節差分,發現季節性仍然沒有完全改善,故只做一階季節差分。
通過以上在EVIEWS中的操作分析,可得到ARIMA模型中的參數d=2,D=1。
2.根據時間序列模型的識別規則,建立相應的模型:
(1)若平穩的時間序列自相關函數托尾,而偏相關函數是截尾的,則可斷定此時間序列適合AR(P)模型。
(2)若平穩的時間序列自相關函數截尾,而偏相關函數是托尾的,則可判斷時間序列適合MA(Q)模型。
(3)若平穩的時間序列的字相關函數和偏相關函數都是托尾的,則時間序列適合于ARMIA(p,d,q)模型。
3.模型的識別。通過分析,我們選用ARIMA(p,d,q)(P,D,Q)S模型,其中d和D已經得出,d=2,D=1。通過觀察時間序列sale04(經過兩次差分和一次季節差分后的序列)的自相關圖和偏自相關圖,我們得出p=1、2、3或4,q=1;由圖2可以看到,當k=12時,自相關系數仍有較大的峰,表明存在季節自回歸和季節移動平均,我們選擇P=1,Q=1。
4.進行ARIMA(p,d,q)(P,D,Q)S模型的定階,然后對暫定的模型進行參數的估計,檢驗其是否有統計意義。
經過以上的分析,我們初步確定模型為ARIMA(1,2,1)(1,1,1)12,ARIMA(2,2,1)(1,1,1)12,ARIMA(3,2,1)(1,1,1)12,ARIMA(4,2,1)(1,1,1)12或ARIMA(5,2,1)(1,1,1)12,我們運用最佳準則函數定價法,即Akaike提出的Aic準則,該準則在極大似然值的基礎上對模型的階數和參數給出一組最佳估計。Aic準則是在給出不同模型的Aic計算公式的基礎上,選取使Aic值最小的那一組階數為最佳階數。對于模型ARIMA(1,2,1)(1,1,1)12,ARIMA(2,2,1)(1,1,1)12,ARIMA(3,2,1)(1,1,1)12,ARIMA(4,2,1)(1,1,1)12和ARIMA(5,2,1)(1,1,1)12,我們通過EVIEWS軟件得出它們的Aic值分別為3.2185、3.2196、3.2218、3.2226和3.2544。根據Aic準則,ARIMA(5,2,1)(1,1,1)12的AIC值小于其他ARIMA(p,d,q)(P,D,Q)S模型的 Aic值,因此我們選擇模型ARIMA(1,2,1)(1,1,1)12。
5.診斷和檢驗。下圖4是原始數據以及由ARIMA模型得到的擬合值和對2006年12個月的預測值,以及對殘差的acf圖和pacf圖。如果時間序列模型擬合的很好的話,它的殘差的acf圖和pacf圖應該沒有任何模式,并且數值很小,那么該序列就是有一些無關的互相獨立的隨機變量組成。我們觀察模型ARIMA(1,2,1)(1,1,1)12的殘差序列 acf圖和pacf圖,可以看出它們沒有任何模式,說明該模型擬合的比較成功。
我們應用模型ARIMA(1,2,1)(1,1,1)12來對2006年的社會消費品零售總額進行預測,并對真實值和預測值進行比較,其中2006年1月份至12月份的預測值(以下數據單位為億元)分別為6620.1、6087.3、5857.2、5713.2、6101.4、5983.7、5981.7、6088.9、6554.4、6916.3、6978.7、7946.5;真實值分別為6641.6、6001.9、5796.7、5774.6、6175.6、6057.8、6012.2、6077.4、6553.6、6997.7、6821.7、7499.2;預測值與真實值之間的誤差率分別為-0.32%、1.42%、1.04%、-1.20%、-1.22%、-0.51%、0.19%、0.01%、
-1.16%、2.30%、5.96%。
同理,我們根據模型ARIMA(1,2,1)(1,1,1)12來對2007年的社會消費品零售總額進行預測,其中2007年1月份至12月份的預測值(以下數據單位為億元)為7771.3、7231.56977.6、6820.7、7061.3、7087.3、7080.9、7186.8、7661.5、8030.9、8089.6、9082.7,1月份至5月份的真實值分別為7488.3、7013.7、6685.8、6672.5、7157.5;1月份至5月份的預測值與真實值之間的誤差率分別為3.78%、3.10%、4.36%、2.22%、-1.34%。
四、結束語
通過以上分析,我們可以看出運用ARIMA(p,d,q)(P,D,Q)S在對中國社會消費品零售額的預測中,對于2006年每月的預測之值與真實值之間的誤差率都很小,隨著時間跨度的增加,該模型的預測值與真實值之間的誤差率逐漸增大。
從短期來看,ARIMA模型在社會消費品零售額的預測上具有一定的可信度,政府可以根據預測結果來制定相應得政策,來調控宏觀經濟的整體運作,使社會消費品方面的投資比例達到一個合理的比例,促進經濟的良好健康發展。
從長期來看,ARIMA模型還存在先天的缺陷,隨著預測期的延長,其預測誤差會逐漸增大,但是短期內的預測準確度還是比較高的,因此我們可以用該模型來進行短期的政策指導。
參考文獻:
高鐵梅:計量經濟學分析方法與建模 Eviews應用及事例.北京:清華大學出版社,2006(1):126~168
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。