李少雄,李本光
(1.中國工商銀行北京分行,北京100031;2.貴州大學 經濟學院,貴陽550025)
SARIMA模型源于自回歸移動平均模型(ARIMA模型)。ARIMA模型適用于非季節時間序列短期預測。對于季節時間序列,則需要進行正規差分、季節差分和自回歸自動平均調整,才能轉化為ARIMA模型。由這種方法最終所確認的ARIMA模型,由于通常包含季節差分的有關參數,同時由幾部分的乘積形式構成,因此被稱為季節乘積模型,即SARIMA模型。SARIMA模型的一般表達式為:

其中,d、D分別表示正規差分、季節差分,s為季節差分階數,p是自回歸階數,q是移動平均階數,ΦP(Ls)和ΘQ(Ls)分別為季節P階自回歸算子、季節Q階移動平均算子,μt為白噪聲過程。該模型可以簡化為SARIMA(p,d,q)(P,D,Q)。
航空模型是季節乘積模型的具體表現形式,此模型廣泛用于季度時間序列建模[1]。航空模型的表達式:

其中s是序列的周期,μt是白噪聲序列,|θ|<1,|Θ|<1。航空模型的AR部分由正規差分和季節差分兩部分組成,而MA部分包括兩個參數。該模型具有一些顯著的性質。假設Yt=(1 -L)(1 -Ls)Xt,ρ為Yt的樣本自相關函數函數,則:

對于l>0且l≠1,s-1,s+1,有ρl=0。因此,如果Yt是季節時間序列,Yt經過正規差分和季節差分后的序列的樣本自相關函數只在滯后階數為1、s-1、s、s+1時非零,那么可以考慮對季節時間序列Yt建立航空模型。
一個經濟時間序列(Yt)受多種因素影響。通??梢园堰@些因素分解為趨勢成分(Tt)、循環成分(Ct)、季節成分(St)和不規則成分(It)。季節調整就是對原始數據中隱含的由季節因素引起的影響加以糾正的過程。在季節調整模型方面,經典的時間序列模型有兩種:
(1)加法模型Yt=Tt+Ct+St+It
(2)乘法模型Yt=Tt×Ct×St×It
按照加法模型,季節調整后的時間序列At=Tt+Ct+It;按照乘法模型,季節調整后的時間序列At=Tt×Ct×It。對于一個時間序列,采用哪種模型進行季節分解取決于各成分之間的關系。一般來說,若4種成分相互獨立則采用加法模型,相互關聯采用乘法模型;若季節因素的規?;颈3植蛔儯浑S原始序列水平的增減而變化,就使用加法模型;若季節因素的規模與原始序列水平成比例變化,使用乘法模型[2]。
在季節調整方法方面,X-11是國際上通用的季節調整方法。1980年,加拿大統計局在X-11季節調整方法的基礎上引入ARIMA模型開發X-11-ARIMA程序,實現了序列向前、向后預測和補充數據,以保證移動平均季節調整過程中數據的完整性。20世紀90年代,美國普查局在X-11-ARIMA的基礎上開發X-12-ARIMA程序。X-12-ARIMA能夠對數據進行更加豐富的預處理,檢測和修正不同類型的離群值,估計并消除日歷因素的影響,對季節調整的效果進行更為嚴格的診斷檢驗。由于趨勢成分和循環成分不容易分離,以上季節調整方法將趨勢成分和循環成分視為一種成分進行分解和調整。通過對季節調整各分解因素的預測,可以實現對原始序列的預測。
本文以貴州省1998—2015年固定資產投資季度數據為樣本,分別建立SARIMA模型和使用X-12-ARIMA季節調整方法,對2016年固定資產投資季度數據進行預測,將預測值與實際值作比較,通過相對誤差比較兩種模型的精確程度。所有數據根據國家統計局網站貴州省固定資產投資月度數據整理而得,見表1。本文使用的操作軟件為R語言,使用seasonal擴展包進行X-12-ARIMA季節調整,使用car擴展包進行DW自相關檢驗。

表1 貴州省固定資產投資季度數據
2.2.1 季節差分
首先對貴州省固定資產投資季度數據取對數,見圖1。這里進行對數變換有兩個原因:一是處理序列是指數增長。事實上,該時序圖證實了取對數后的序列的確是線性增長的。二是穩定序列的波動。從圖1中也能看出序列總體呈現直線上升的趨勢,上下起伏震蕩,序列不僅存在自相關還存在明顯的的季節波動。因此可以采用季節乘積模型建模。

圖1 貴州省1998—2016年固定投資季度數據時序圖
圖2 (a)表示對貴州省固定資產投資季度數據取對數后序列的自相關函數,從中可以看出取對數后貴州省固定資產投資季度數據序列具有明顯的自相關性,是非平穩的。圖2(b)表示的是對貴州省固定資產投資季度數據取對數后進行正規差分后的自相關函數,從中可以看出序列在季節滯后上的自相關系數不同于0值。圖2(c)表示的是對貴州省固定資產投資季度數據取對數后進行季節差分后的自相關函數。圖2(d)表示的是對貴州省固定資產投資季度數據取對數后進行正規差分后再進行季節差分后的自相關函數。

圖2 樣本自相關圖

這里表at示殘差序列。對于貴州省固定資產投資季度數據對數序列,該模型不充分,一個顯著的原因是季節移動平均部分的系數在5%顯著性水平下不顯著。第二步,根據5%顯著性檢驗,季節移動平均部分系數不顯著,重新改進模型如下:

2.2.2 模型識別、建立和診斷
時間序列數據建模,數據僅僅是可利用信息的一部分。對所研究的問題,可能積累一些先驗知識。在這種情況下,這些先驗知識對于模型選擇非常重要,可以把先驗知識和數據結合起來進行交叉驗證,不斷改進模型。
對于貴州省固定資產投資對數序列,這里通過一個兩步過程實現模型設定。第一步,建立初始模型。圖2給出了貴州省固定資產投資對數序列的樣本自相關函數圖,雖然不完全滿足航空模型樣本自相關函數的表現,但是可以采用航空模型作為建模的初始模型,擬合結果為:
這里系數標準誤差為0.0946,5%置信區間(-0.9568,為-0.5860)。雖然模型殘差平方和略有增加,但參數通過了顯著性檢驗,AIC值有所降低。圖3給出了模型殘差的一些檢驗圖,殘差在開始部分有個別異常值,但整體來講,該模型是充分的。

圖3 殘差檢驗
2.2.3 預測
對未來4季度貴州省固定資產投資季度數據進行預測。為了得到2016年貴州省固定資產投資季度數據的預測值,而不是取對數后的值,這里需要利用正態分布與對數正態分布之間的關系,對預測值進行反對數變換,具體結果見表2。與實際值比較,可以看出,預測相對誤差均很小,不超過4,說明模型預測具有一定準確性。但是相對誤差均為正數,說明預測值具有偏大的傾向,容易過高估計未來固定資產投資季度數據。

表2 SARIMA模型預測
2.3.1 季節調整及原始數據的分解
為提取貴州省固定資產投資季度數據中的趨勢成分、循環因素、季節成分和不規則成分,現通過seasonal擴展包直接對貴州省固定資產投資1998年第1季度至2015年第4季度當期季度數據進行季節調整。由于分解因素相互關聯,且季節成分隨原始數據規模增長而增加,因此在X-11季節調整過程中采用乘法模型。由于X-11體系的季節調整程序將趨勢成分和循環成分視為一種成分,因此這里按照加法分解模型將貴州省固定資產投資季度數據分解為趨勢-循環因素(TCt)、季節因素(St)和不規則因素(It)三種成分??紤]到原始數據的指數增長特性和較大的季節波動性,在季節調整過程中取對數變換。在季節調整過程中,自動識別1999年第3季度、2000年第2季度、2008年第1季度3個離群點,如圖4所示。通過季節調整,分別得到分解成分,如圖5。

圖4 原始序列和季節調整后序列
2.3.2 趨勢-循環成分的預測
原始數據經過季節調整之后,依然保留有趨勢-循環成分。這時可利用回歸分析的方法對其進行擬合和預測。觀察圖5可知,隨著時間的變化,季節調整后固定資產投資呈現上升的趨勢,總體數據同樣呈現曲線增長的趨勢。由于曲線難以完全用拋物線和對數曲線擬合,在這里截取2010年第2季度至2015年第4季度共22個樣本點采用拋物線重新擬合,以時間t為自變量,以季節調整后的FAI數據為因變量,擬合結果為:

圖5 季節調整分解圖

采用car擴展包進行DW自相關性檢驗,DW統計量為1.7369,p值等于0.422,不能拒絕原假設,因此不存在顯著的自相關性??梢灶A測2016年4個季度固定資產投資趨勢-循環成分,結果見表3。

表3 FAI的預測過程和預測值
2.3.3 季節成分的預測
從圖5中看出,季節因子具有不穩定的特性。羅中德(2016)[3]采用規范化的方法計算季節指數,將其作為下一年度季節因子的預測值。本文假設季節因子不變,直接截取2015年4個季度的季節因子作為2016年4個季度的季節因子進行預測,結果見表3。
2.3.4 對季度數據的預測
由于不規則成分樣本自相關函數、偏自相關函數不具有截尾特征,在滯后10階通過了Q檢驗,因此可以不考慮不規則成分變動的影響,直接采用公式Yt=TCt×St預測2016年貴州省固定資產投資季度數據。2016年貴州省固定資產投資季度數據的預測值等于2016年固定資產投資趨勢-循環預測項與季節因子預測項兩項的乘積。具體結果見表3。
兩種方法對原始數據都有比較好的預測效果。SARIMA模型采用ARIMA乘積的形式對季度數據進行擬合和預測;X-12-ARIMA將原始時間序列分解,分別對分解成分進行預測,對數據的處理更加完善。從預測精度上看,SARIMA模型預測的相對誤差在2%~4%之間;而X-12-ARIMA季節調整方法的相對小于2%。值得注意的是,SARIMA模型預測的相對誤差都大于零,預測值具有大于實際值的趨勢,而X-12-ARIMA季節調整模型的預測值的相對誤差在零附近波動,有正有負,相對誤差率更小且合理。表4(見下頁)為兩種預測的比較。

表4 模型比較
固定資產投資時間序列主要是受到趨勢性和季節性的影響,目前主要采用ARIMA或者SARIMA模型進行預測。SARIMA模型具有較高的預測精度,但是隨著時間序列數據跨期增多,長期預測結果不理想;且從預測結果來看,其預測值具有被高估的傾向。故可以采用X-12-ARIMA季節調整方法進行預測,其預測值更加精確合理。