摘要:研究中國(guó)消費(fèi)品零售總額的SARIMA模型,發(fā)現(xiàn)用稀疏系數(shù)法處理其季節(jié)性所得模型,比常規(guī)方法(既做季節(jié)差分又做一階差分)所得模型好;在用EViews做預(yù)測(cè)時(shí),對(duì)預(yù)測(cè)對(duì)話框的“Sample range for forecast”的值應(yīng)該設(shè)置為真實(shí)的預(yù)測(cè)范圍,才能得到好的預(yù)測(cè)。
關(guān)鍵詞:SARIMA模型;稀疏系數(shù);中國(guó);消費(fèi)品零售總額
中圖分類號(hào):F71文獻(xiàn)標(biāo)志碼:A文章編號(hào):1673-291X(2010)19-0176-03
一、問(wèn)題提出
EViews軟件是在科學(xué)數(shù)據(jù)分析與評(píng)價(jià)、金融分析、宏觀經(jīng)濟(jì)預(yù)測(cè),銷售預(yù)測(cè)和成本分析等領(lǐng)域應(yīng)用非常廣泛的統(tǒng)計(jì)分析和預(yù)測(cè)軟件,其前身是時(shí)間序列回歸軟件TSP。TSP軟件基于DOS的操作系統(tǒng),EViews軟件在Windows環(huán)境下運(yùn)行,更多地使用菜單和窗口方式,操作直觀,界面友好,很多視窗操作都使用默認(rèn),使本來(lái)復(fù)雜的數(shù)據(jù)分析過(guò)程變得易學(xué)易用[1~4]。
盡管如此,在應(yīng)用時(shí)也是困難重重的,還需要技巧。例如,作者用B-J法對(duì)1993年1月至2007年12月的中國(guó)消費(fèi)品零售總額(月度數(shù)據(jù),數(shù)據(jù)來(lái)自《中華人民共和國(guó)國(guó)家統(tǒng)計(jì)數(shù)據(jù)庫(kù)》,http://219.235.129.54/cx/index.jsp)建立ARIMA模型。觀察圖形時(shí)發(fā)現(xiàn)數(shù)據(jù)具有季節(jié)性,于是應(yīng)該建立SARIMA模型。建模時(shí)是先進(jìn)行季節(jié)差分還是進(jìn)行常規(guī)的一階差分?預(yù)測(cè)時(shí)采用默認(rèn)預(yù)測(cè)范圍還是要改變預(yù)測(cè)范圍?這都是問(wèn)題,是初學(xué)者要花很多時(shí)間才能弄清楚的問(wèn)題[1~4]。
現(xiàn)將探索到的技巧托出,供養(yǎng)各位同仁,惟愿各位同仁得到真實(shí)利益。
二、建立中國(guó)消費(fèi)品零售總額的SARIMA模型
(一)觀察序列圖的趨勢(shì)
先作原序列中國(guó)消費(fèi)品零售總額ccs的線圖,前后波動(dòng)幅度不一致,知道數(shù)據(jù)存在異方差。作對(duì)數(shù)變換并令變量名為lncc。由lnccs的線圖知道前后波動(dòng)幅度基本一致,可以認(rèn)為lncc的方差是齊性。下面對(duì)序列l(wèi)nccs建立ARIMA模型,其模型可以用于對(duì)序列進(jìn)行分析,也可以用于預(yù)測(cè)。
(二)建立SARIMA模型
1.模型一。由lncc的線圖可知,序列具有季節(jié)性且非平穩(wěn)的,對(duì)lnccs實(shí)施差分以平穩(wěn)化:Series dlnccs=dlog(ccs,1)。得到lncc一階差分序列dlncc。對(duì)其進(jìn)行平穩(wěn)性檢驗(yàn)(單位根檢驗(yàn)),檢驗(yàn)結(jié)果:dlnccs是平穩(wěn)的。結(jié)合多種模型選擇原則,對(duì)平穩(wěn)序列dlnccs選定的ARMA模型如下:
dlnccst=-0.4195dlnccst-1+0.9311dlnccst-12+0.4297dlnccst-13+
εt-0.2641εt-2-0.6147εt-12+0.3998εt-14-0.1380εt-20(1)
其中,各參數(shù)的P值prob均<0.01,{εt}為白噪聲序列。其中模型的確定系數(shù)R2=0.864 5是較理想的; DW=1.920 4,說(shuō)明其殘差檢驗(yàn)基本通過(guò),再者模型(1)殘差的相關(guān)圖全部落隨機(jī)區(qū)間(略),所以殘差近似服從白噪聲分布。AIC=-4.229,S.E=0.0286,Log likelihood=358.0099。其中稀疏系數(shù)表示了圖中呈現(xiàn)的季節(jié)性,季節(jié)步長(zhǎng)為12。即log(ccs)~稀收系數(shù)的ARIMA(13,1,18)。稀疏系數(shù)的選擇,根據(jù)序列的相關(guān)圖,選擇超出隨機(jī)區(qū)間的項(xiàng)予估計(jì)之。
2.模型二。如模型(1),序列{dlnccst}呈現(xiàn)了步長(zhǎng)為12的季節(jié)性,因此根據(jù)EViews幫助文檔以及易丹輝[1,P145.]、高鐵梅[2,P165.]提出模型(1)可以用如下的命令估計(jì)
LS DLOG(CCS,1) AR(1) SAR(12) MA(2) SMA(12)
所得結(jié)果如下
dlnccst=-0.3484dlnccst-1+0.9555dlnccst-12+εt-0.2703εt-2
-0.6420εt-12(2)
其中,各參數(shù)的P值均有prob<0.01,{εt}為白噪聲序列。其中模型的確定系數(shù)R2=0.8464是較理想的;其中DW=2.0318,說(shuō)明其殘差檢驗(yàn)基本通過(guò),再者模型(2)殘差的相關(guān)圖(略)全部落隨機(jī)區(qū)間,所以殘差近似服從白噪聲。AIC=-4.158,S.E=0.0299,Log likelihood=349.136。所以模型(2)也是適宜的,它比模型(1)更簡(jiǎn)潔,但是根據(jù)模型選擇的各種準(zhǔn)則,模型(2)沒(méi)有模型(1)優(yōu)。
3.模型三。由lncc的線圖觀察到了序列的季節(jié)性,由此也可能想到對(duì)季節(jié)序列的一般方法:先對(duì)其季節(jié)差分序列slnccs=dlog(ccs,0,12)建模,但此序列是非平穩(wěn)的,而其一階差分序列是平穩(wěn)的。所以根據(jù)常規(guī)可以對(duì)上述序列的階差分序列dslnccs=dlog(ccs,1,12)建立ARMA模型。篩選得模型(3)。
dslnccst=-0.4068dslnccst-1-0.3003dslnccst-2-0.5798dslnccst-12-0.1361dslnccst-13-0.2949dslnccst-24(3)
其中各參數(shù)的P值prob均<0.05,{εt}為白噪聲序列。其中模型的確定系數(shù)R2=0.4736太小了,不是較理想的;其中DW=2.0318,說(shuō)明其殘差檢驗(yàn)基本通過(guò),再者模型(3)殘差的相關(guān)圖(略)全部落隨機(jī)區(qū)間,所以殘差近似服從白噪聲。AIC=-4.0385,S.E=0.03158,Log likelihood=293.7540。由此可以看到,模型(3)雖然也是適宜的,但是根據(jù)各種準(zhǔn)則,模型(3)沒(méi)有模型(1),(2)優(yōu)良。但原因是什么呢?可能是“過(guò)差分”的原因。dslnccs=dlog(ccs,1,12)實(shí)際上是對(duì)log(ccs)進(jìn)行了兩次差分:
dslnccs=dlog(ccs,1,12)=(1-L)(1-L12)log(ccs)
其中,L是滯后算子。所以形成如下規(guī)律:
對(duì)于只有一個(gè)單位根(一階差分平穩(wěn))的序列,即使原序列有季節(jié)性,也只能對(duì)一階差分?jǐn)M合ARMA模型,而其季節(jié)性可以用稀疏系數(shù)反映。即模型(1)和模型(2)的形式。
所以,在對(duì)中國(guó)消費(fèi)品零售總額的對(duì)數(shù)序列建模型時(shí),模型的選擇應(yīng)是稀疏系數(shù)的的ARIMA模型。
三、基于EViews的預(yù)測(cè)
(一)預(yù)測(cè)技巧1
1.用原序列建立模型。在EViews中 ,為了對(duì)原序列進(jìn)行預(yù)測(cè),必須對(duì)原序列建模,否則在預(yù)測(cè)多期數(shù)據(jù)時(shí),要用方程逐步地算,很復(fù)雜。對(duì)原序列建立模型(1)、(2)、(3)的命令分別為
LS DLOG(CCS,1) AR(1) AR(12) AR(13) MA(2) MA(12) MA(14) MA(18)(4)
LS DLOG(CCS,1) AR(1) SAR(12) MA(2) SMA(12)(5)
LSDLOG(CCS,1,12) AR(1) AR(2) AR(12) AR(13) AR(24)(6)
分別以名字EQ01、EQ02、EQ03表示模型(1)、(2)、(3)的方程。基于EViews的預(yù)測(cè),可以在命令行用命令:eq01.forecast ccsf1。也可以用菜單操作之。打開(kāi)eq01的窗口,點(diǎn)擊forecast即可打開(kāi)預(yù)測(cè)對(duì)話框(如圖1)。預(yù)測(cè)對(duì)話框的左上角有兩個(gè)選擇,一者對(duì)原序列CCS進(jìn)行預(yù)測(cè),二者對(duì)方程的響應(yīng)變量DLOG(CCS,1)進(jìn)行預(yù)測(cè)。若不用原序列重建方程,而用差分后的序列如模型(1)的命令
Ls DLNCCS AR(1) AR(12) AR(13) MA(2) MA(12) MA(14) MA(18)(7)
則選擇只有一項(xiàng):預(yù)測(cè)DLNCCS。所以,我們?cè)谔剿髂P蜁r(shí),要逐步進(jìn)行數(shù)據(jù)差分變換,在預(yù)測(cè)階段,要用原序列重建模型,以便用EViews進(jìn)行預(yù)測(cè)。
2.擴(kuò)展樣本范圍。為了預(yù)測(cè)未來(lái),還需要擴(kuò)展時(shí)間范圍。例如為了預(yù)測(cè)2008年各月份的中國(guó)消費(fèi)品零售總額,擴(kuò)展時(shí)間的命令是:Expand 1993.01 2008.12。在擴(kuò)展時(shí)間范圍后,打開(kāi)預(yù)測(cè)對(duì)話框。在對(duì)話框中,大多數(shù)同仁選擇動(dòng)態(tài)預(yù)測(cè)“Dynamic”,將Sample range for forecast修改為”1993:012008:12”。點(diǎn)擊”ok”即可[1~4]。但這種預(yù)測(cè)通常是不精確的。
(二)基于EViews的兩種預(yù)測(cè)
EViews有兩種預(yù)測(cè)方法:Dynamic和Static(如上圖1),有兩種選擇Dynamic或Static。
Dynamic預(yù)測(cè)方法:用滯后被解釋變量的前一個(gè)時(shí)期的預(yù)測(cè)值對(duì)預(yù)測(cè)區(qū)間(樣本范圍的第一期除外)的各項(xiàng)進(jìn)行預(yù)測(cè)。即是逐步迭代的。從“sample range for forecast” 的第一期開(kāi)始迭代。如圖4的CCSF1是從樣本的第二期開(kāi)始預(yù)測(cè)并迭代的,所以到最后就預(yù)測(cè)誤差大。
Static預(yù)測(cè)方法:它是指運(yùn)用真實(shí)值來(lái)進(jìn)行預(yù)測(cè)。所以這種預(yù)測(cè)方法只能預(yù)測(cè)超前一期的值。
如圖2,對(duì)中國(guó)消費(fèi)品零售總額序列CCS的預(yù)測(cè),CCSF1是動(dòng)態(tài)預(yù)測(cè)(Dynamic),而CCSF1S是靜態(tài)預(yù)測(cè)(Static)。
CCS的圖形是下凸的,這種數(shù)據(jù)的動(dòng)態(tài)預(yù)測(cè)偏差大,如圖2方程EQ01(模型(1))的動(dòng)態(tài)預(yù)測(cè)與原始數(shù)據(jù)的比較圖。CCSF1S是靜態(tài)預(yù)測(cè)圖,基本與原始值CCS重合。而動(dòng)態(tài)預(yù)測(cè)值(CCSF1)越往后越偏大。
圖3是模型(1)、模型(2)與模型(3)的動(dòng)態(tài)預(yù)測(cè)值的比較,CCSF1是模型(1)的動(dòng)態(tài)預(yù)測(cè)值,CCSF2是模型(2)的動(dòng)態(tài)預(yù)測(cè)值,CCSF3是模型(3)的動(dòng)態(tài)預(yù)測(cè)值。顯然模型(3)的動(dòng)態(tài)預(yù)測(cè)值的后期偏離很大。這種動(dòng)態(tài)預(yù)測(cè)是不可取的。
(三)預(yù)測(cè)技巧2
根據(jù)時(shí)間序列的條件預(yù)測(cè)原理,設(shè)已知樣本y1,y2,…,yT,則預(yù)測(cè)值:
=Y,(t=1,2,…,T);=f(y,y,…,y,,…,),(t>T)
其中f(·)表示模型的方程。于是我們從t=T+1期開(kāi)始預(yù)測(cè)即可。仔細(xì)觀察預(yù)測(cè)對(duì)話框圖2,“Sample range for forecast”即是要預(yù)測(cè)的樣本范圍,所以為了要得到中國(guó)消費(fèi)品零售總額在2008的預(yù)測(cè)值,“Sample range for forecast”應(yīng)改為“2008:012008:12”,即真實(shí)預(yù)測(cè)范圍。實(shí)施方法(如圖4)。
如圖5,是方程eq01即模型(1)的三個(gè)預(yù)測(cè)序列:原序列CCS,CCSF1S是靜態(tài)預(yù)測(cè)序列,CCSF是改變樣本范圍的動(dòng)態(tài)預(yù)測(cè)。在t≤T=180(15×12)時(shí)是重合的,陰影部分是CCSF的樣本外預(yù)測(cè),是改變樣本范圍的動(dòng)態(tài)預(yù)測(cè)值。表1是模型(1)、模型(2)預(yù)測(cè)精度分析。
表1 也驗(yàn)證了2.2.2節(jié)的結(jié)論:模型(2)沒(méi)有模型(1)優(yōu)。
四、結(jié)論
1.關(guān)于季節(jié)差分的問(wèn)題。對(duì)于一階差分平穩(wěn)的非平穩(wěn)序列(只有一個(gè)單位根),即使原序列有季節(jié)性,也只能對(duì)一階差分?jǐn)M合ARMA模型,而其季節(jié)性可用“稀疏系數(shù)”反映,其模型是稀疏系數(shù)的ARIMA模型。如果按常規(guī),先進(jìn)行季節(jié)差分,而季節(jié)差分又不平穩(wěn),所以還要進(jìn)行一階差分再建立ARMA模型,就會(huì)產(chǎn)生“過(guò)差分”的問(wèn)題,如模型(3)就不適宜的模型。
2.關(guān)于EViews的動(dòng)態(tài)預(yù)測(cè)問(wèn)題。EViews的靜態(tài)預(yù)測(cè)(Static)只能得到樣本外一期的預(yù)測(cè)值,如果欲得到多期的預(yù)測(cè)值,就要用動(dòng)態(tài)預(yù)測(cè)(Dynamic)。如果預(yù)測(cè)范圍仍然從樣本的第一期開(kāi)始,經(jīng)過(guò)多次迭代到后期勢(shì)必會(huì)預(yù)測(cè)誤差增大。特別是下凸的序列,預(yù)測(cè)誤差很大。作者探索的結(jié)論是:不默認(rèn)“Sample range for forecast”起始值,而是將“Sample range for forecast”的值修改為“真實(shí)”的預(yù)測(cè)范圍。例如,本文作者欲預(yù)測(cè)2008年各月份的中國(guó)消費(fèi)品零售總額,則“Sample range for forecast”的值修改為“真實(shí)”的預(yù)測(cè)范圍:“2008:01 2008:12”。而不是文獻(xiàn)[1~4]中默認(rèn)的“1993:01 2008:12”。
參考文獻(xiàn):
[1]易丹輝.數(shù)據(jù)分析與EViews應(yīng)用[M].北京:中國(guó)人民出版社,2008.
[2]高鐵梅.計(jì)量經(jīng)濟(jì)分析方法與建模[M].北京:清華大學(xué)出版社,2008.
[3]張曉峒.計(jì)量經(jīng)濟(jì)學(xué)軟件EViews使用指南[M].天津:南開(kāi)大學(xué)出版社,2003.
[4]田應(yīng)福,基于EViews的ARIMA模型及其預(yù)測(cè)——以貴州省人口時(shí)間序列為例[J].貴州大學(xué)學(xué)報(bào)(自),2008,(5)(增刊二).