王 錦,商 豪
(湖北工業大學理學院,湖北 武漢 430068)
近年來用于刻畫時間序列長記憶性特征的模型層出不窮,其中,Granger[1]和Hosking[2]提出的ARFIMA模型成為描繪時間序列長期記憶性常用的工具。ARFIMA模型克服了傳統時序模型只能描繪短期記憶性的缺陷,通過引入分數維差分參數,使其具備擬合時間序列過程長記憶性的能力。ARFIMA模型得到廣泛應用,但有學者指出該模型在擬合長期記憶性較弱的時間序列過程中是失效的[3-4]。基于此問題,Meerschaert[5]等人發現調和分整過程展現出的半長期記憶性(semi-long range dependence)能夠很好地刻畫長期記憶性較弱的時間序列過程。這種半長期記憶性具體表現為序列過程的自相關函數在前期緩慢下降,呈現雙曲線形式,后期則以指數率迅速衰減。由此Meerschaert[6]在研究大氣湍流速度數據的過程中首次在ARFIMA模型的基礎上加入調和參數,提出了調和分整自回歸移動平均模型(ARTFIMA),用以擬合具有半長期記憶性的平穩時間序列過程。
本文通過分析中國居民消費者價格指數的記憶特征,針對過程中存在的長期記憶性特征建立ARTFIMA模型,并與ARFIMA模型進行對比,最后通過譜密度擬合函數和預測效果驗證ARTFIMA模型在中國居民消費者價格指數的擬合和預測方面比ARFIMA模型更具優越性。
分整自回歸移動平均模型ARFIMA(p,d,q)可以定義為整數階差分ARIMA(p,D,q)模型的推廣形式,其差分參數拓展到分數維[7]。ARFIMA(p,d,q)表達形式如下:
式中:d∈R且d<0.5,p,q∈Z;Φ(B)=1-φ1B-φ2B2,…,φpBp,Θ(B)=1+θ1B+θ2B2+…+θqBq分別為p階自回歸多項式與q階移動平均多項式,Φ(B)=0,Θ(B)=0的所有根都在單位圓外,且沒有重根;B為滯后算子;(1-B)d為分數維差分算子,即
則稱yt=xt-μt為分整自回歸移動平均模型。當d<0.5,零均值的ARFIMA(p,d,q)過程是協方差平穩的;如果0 調和分整自回歸移動平均模型ARTFIMA(p,d,λ,q)在上述ARFIMA(p,d,q)模型的基礎上加入了調和參數λ。具體表達式如下: 式中:d∈R,λ>0,p,q∈Z;Φ(B)=1-φ1B-φ2B2,…,φpBp,Θ(B)=1+θ1B+θ2B2+…+θqBq分別為p階自回歸滯后算子與q階移動平均滯后算子,Φ(B)=0,Θ(B)=0的所有特征根都在單位圓內,且沒有公因子;B為后移算子;(1-e-λB)d是加入調和參數的分數維差分算子,即 (1-e-λB)df(t)= 本文的實證分析對象為中國居民消費者價格指數(CPI),數據來源于中國統計年鑒。選取從2000年2月到2019年3月共230個月度數據,數據無缺失和異常情況。初步的描述性統計分析結果顯示樣本數據呈現輕微右偏和尖峰分布。運用Jarque-Bera統計量檢驗得出CPI序列不滿足正態分布。 表1 CPI序列的基本統計特征 從CPI序列的時間序列圖(圖1)可以看出,CPI序列沒有明顯的趨勢性,但不具備平穩性特征。利用ADF方法檢驗CPI序列的單位根情況,結果顯示序列非平穩。故對CPI進行一階差分后得到一組新的時間序列,記為CPID1。一階差分后的CPI序列的時序圖如圖2所示。CPI和CPID1的ADF檢驗結果見表2,從檢驗結果可以看出CPID1為平穩的時間序列過程,具備經典時間序列模型平穩性建模的前提條件。 圖1 CPI原始數據時間序列圖 圖2 一階差分后CPID1時間序列圖 表2CPI和CPID1樣本序列的單位根檢驗結果 D-F統計量值P值結果CPI-2.5520.107接受原假設,存在單位根CPID1-9.117<0.01拒絕原假設,不存在單位根 Hurst提出的重標極差分析法(R/S方法)是分析時間序列是否具有長期記憶性的有力工具,此方法通過計算Hurst指數判斷時間序列數據存在的記憶特征。當Hurst指數介于數值0.5與1之間時,說明該序列存在持續性狀態,即具有長期記憶性,且當Hurst指數越接近1,相關性越強,持續性狀態越明顯;Hurst指數越接近0.5,說明存在越大的噪聲,持續性狀態越微弱。Hurst指數H的計算原理如下[9]: 1)定義待研究的時間序列數據為{xt,t>0},將其劃分為長度為n的A個連續子序列區間,每一個子序列區間記為Ia,a=1,…,A; 2)對各個子序列區間計算其均值 3)對每個子序列區間計算累積均值離差 4)計算每個子序列區間的標準差 5)計算A個子序列區間的平均重標度極差 其中Ra=max(yk,a)-min(yk,a),k=1,…,n是單個子序列區間的極差; 6)利用Hurst提出的模型,建立關系式 (R/S)n=(c×n)H 兩邊取對數可得 log(R/S)n=H×logn+logc 通過最小二乘回歸求解H值。 利用上述R/S方法計算CPI序列的H指數,結果見表3。 表3 R/S長記憶性檢驗結果 根據R/S長記憶檢驗方法計算步驟,通過線性回歸計算得出H=0.621,結合擬合優度R2統計量可知線性擬合效果較好。從H指數的數值來看,中國消費者價格指數序列存在長記憶性,但長記憶性較弱。 根據長記憶性檢驗結果,建立可以擬合時間序列長記憶性的ARTFIMA模型。首先針對一階差分后的CPID1樣本序列建立ARIMA模型,用以消除原始序列中存在的短期相關性。結合最小AIC和BIC準則(表4)選取p=2,q=2作為相對最優階數。運用R軟件和極大似然估計法[8]對CPI序列建立ARTFIMA(2,d,λ,2)模型并進行參數估計,參數估計結果見表4。ARTFIMA(2,d,λ,2)模型的參數估計結果見表5。 表4 ARIMA模型信息準則表(CPID1) 表5 ARTFIMA模型參數估計結果 模型表達式為: 結合前人的研究[10]和上述長記憶性檢驗的結果,建立長記憶ARFIMA(2,d,2)模型。利用極大似然估計法得出參數估計結果(表6)。 表6 ARFIMA模型參數估計結果 模型表達式如下: 3.4.1 譜密度擬合函數對比運用R軟件畫出上述建立的ARFIMA模型(圖3)與ARTFIMA模型(圖4)的譜密度函數擬合圖,該圖采用對數刻度反映頻率與譜密度之間的冪律關系,其中黑色實心曲線為模型的光譜擬合情況。從譜密度函數擬合圖的對比中可以看出,ARTFIMA模型在調和參數的作用下,對中低頻處的數據進行了更好的擬合。 圖3 ARFIMA模型譜密度函數擬合圖 圖4 ARTFIMA模型譜密度函數擬合圖 3.4.2 預測效果對比運用上述建立的ARFIMA和ARTFIMA模型對中國居民消費者價格指數進行3期預測,結果如表7所示。 表7 預測效果對比 從預測結果可以看出,ARTFIMA模型預測誤差為28.57%,而ARFIMA模型的預測誤差達到37.34%,說明ARTFIMA模型在中國居民消費者價格指數序列的預測方面比ARFIMA模型更具優越性。 對上述兩個模型產生的殘差進行白噪聲檢驗,用于驗證建立模型的有效性。具體方法為:分別對殘差序列和殘差平方序列進行Ljung-Box純隨機性檢驗,僅當殘差和殘差平方序列同時通過Ljung-Box檢驗,才認為此殘差是白噪聲序列。從檢驗結果可以看出,各殘差序列均是白噪聲序列,說明模型擬合是合理的。 表8 殘差白噪聲檢驗 通過上述實證分析發現,中國居民消費者價格指數雖具有長期記憶性特征,但序列的相關性較弱,說明中國的消費者市場沒有表現出隨機游走的特性,并不是一個完全獨立的過程,具有非線性、依賴性和潛在的可預測性。針對該序列表現出的長期記憶性建立ARTFIMA模型,取得了較好的擬合和預測效果,為針對時間序列過程記憶性的建模方法提供了新的視角和可能。1.2 調和分整自回歸移動平均模型

2 數據說明及預處理




3 實證分析
3.1 CPI序列的長記憶性檢驗

3.2 建立ARTFIMA模型


3.3 建立ARFIMA模型

3.4 模型對比



3.5 模型有效性檢驗

4 結束語