□劉嘉誠
采購經理指數(Purchasing Managers' Index,簡稱PMI)是通過對企業采購經理的月度調查匯總出來的指數,因其具有及時性、先導性、綜合性和指導性等特點,使得該指數在經濟預測和商業分析等方面都有著重要的意義。PMI 具有較強的實際應用性,本文以舟山制造業月度PMI 數據為基礎,通過建立SARIMA 模型對舟山制造業PMI 的預測能力進行評價。
本文選取2015 年3 月至2019年4 月舟山制造業月度PMI 共50 組數據,其中使用2015 年3 月至2018年10 月的44 組數據進行建模,用2018 年11 月 至2019 年4 月 的6 組數據進行模型檢驗。此外,為了減少異方差的影響,對這組序列進行自然對數轉換,其中pmi 表示舟山制造業月度PMI 序列,lpmi 表示進行對數轉換后的序列,dlpmi 表示進行一階逐期差分平衡后的序列,sdlpmi 表示進行一階逐期差分和季節差分之后的序列。
SARIMA 模型的建立主要包括四個步驟:平衡性檢驗、模型的定階與識別、模型的參數估計、模型的診斷與檢驗。
(一)平衡性檢驗。
在對一個時間序列進行建模前,首先應當考察該序列的平穩性。如果序列是不平穩的,則需要對序列進行差分,使得差分后的序列成為平穩時間序列。本文對序列的平穩性檢驗采用最為常用的ADF 單位根檢驗方法。
從圖1 單位根檢驗結果可以看到,原始序列lpmi 是非平穩序列,在進行一階逐期差分處理后的序列dlpmi 是平穩序列,因此dlpmi是一階單整序列,可以得到d=1。進行一階逐期差分和季節差分處理后的序列sdlpmi 是平穩序列。同時該序列已消除了原時間序列lpmi的季節性,因此D=1。從dlpmi 的自相關和偏相關圖分析,序列在k=12時顯著不為零,可以得出序列存在以12 個月為周期的季節波動,經過上述檢驗和處理,原始序列lpmi 滿足建模要求,可以以序列sdlpmi 為基礎建立SARIMA 模型。

圖1 ADF 單位根檢驗結果
(二)模型的定階與識別。
由于上文確定原始序列lpmi的非季節差分階數d=1;季節差分階數D=1,故考慮建立SARIMA(p,d,q) (P,D,Q)12 模型進行分析與預測,接下來確定p、q、P、Q 的取值。

圖2 sdlpmi 序列的自相關和偏相關圖
觀察分析序列sdlpmi 的相關圖和偏相關圖(如圖2),如果把自相關函數看作截尾特征(K>13 后截尾),把偏自相關函數看作是拖尾特征,應該有一個乘積季節移動平均模型,推出q、Q 可以等于1,考慮建立(0,1,1)(0,1,1)12。如果把自相關函數看作拖尾特征,把偏自相關函數看作截尾特征(K>13 后截尾),應該加入一個乘積月度自回歸模型,推出p、P 可以等于1,考慮建立(1,1,0)(1,1,0)12。
通過觀察序列的自相關和偏相關圖,結合上述的判斷,對可能性最大的六個模型進行比較測試評價,分別是(1,1,1)(1,1,1)12、(1,1,0)(1,1,1)12、(1,1,0)(1,1,0)12、(1,1,1)(1,1,0)12、(1,1,1)(0,1,1)12、(0,1,1)(0,1,1)12。
接下來依次對六個模型進行單位根檢驗,如果模型的單位根有個等于1,說明模型是不可逆的,過程是不平穩的。通過對六個模型單位根的判斷可以得出,除(1,1,0)(1,1,1)12和(1,1,0)(1,1,0)12兩個模型之外,其他四個模型中的單位根均存在等于1 的根。
接下來對這兩個模型進一步評價。在選擇模型時,一般根據AIC 值和SC 值最小的準則作出選擇。(1,1,0)(1,1,1)12模 型:AIC=-3.21267,SC=-3. 027639;(1,1,0)(1,1,0)12模型:AIC=-3.238941,SC=-3.100168。因此,選擇模型(1,1,0)(1,1,0)12較為合適,結果更理想。
(三)模型的參數估計。
建立模型(1,1,0)(1,1,0)12,用2015 年3 月至2018 年10 月的月度數據對模型進行參數估計,得到結果如下:

其中,R2=0.52,DW=2.13,Q(16)=9.68,χ20.05(15)=24.99
(四)模型的檢驗。

圖3 殘差序列的自相關和偏相關圖
對模型估計結果進行檢驗,包括模型特征根值的檢驗、參數估計的t 檢驗和殘差序列的Q 檢驗。
首先是特征根值的檢驗,該模型的特征根值都在單位圓之外,說明模型滿足檢驗要求。其次參數估計的t 檢驗,殘差序列的自相關系數均落入隨機區間內,且P 值均較為顯著,說明殘差序列不再有自相關成分,且模型參數具有顯著性,通過t 檢驗。最后是殘差序列的Q 檢驗,以Q(16)為例,Q(16)=9.68<χ20.05(15)=24.99,模型的誤差項通過Q 檢驗。綜上分析,可以確定最終建立的模型為(1,1,0)(1,1,0)12模型。
根據建立的模型,首先對樣本內2017 年5 月-2018 年10 月 共18 個月的PMI 進行靜態預測,通過實際值與預測值的比較來判斷模型的預測精度,然后繼續利用模型對樣本 外2018 年11 月-2019 年4 月 共6個月的PMI 進行動態預測。
從衡量指標看,模型的擬合結果是較好的。首先分析評估靜態預測結果,均方根誤差(RMSE) 為2.1858、平均絕對誤差(MAE) 為1.8026,兩個數值均較小;平均相對百分比誤差(MAPE)為3.77%,泰勒不等系數(TIC)為0.0227,其中泰勒不等系數(TIC)越小,擬合度越好;總體而言這些衡量指標說明該模型具有較好的擬合效果。
從實際值與預測值的誤差率來看,預測效果是不理想的。首先看靜態預測結果,如表1 所示,相對誤差平均值為3.78%,誤差率最高為9.09%,最低為0.2%。18 組靜態預測結果中,只有兩組的相對誤差在1%以下,說明預測數據的相對誤差率是較高的。再看動態預測結果,6 組動態預測結果中,只有1組的相對誤差率在1% 以下,如2019 年2 月的相對誤差率竟然達到13.59%。綜上,從實際預測結果看,該模型的預測誤差率較高,預測值與實際值存在較大差距,模型的預測結果是不理想的。

圖4 靜態預測結果

圖5 動態預測結果
(一)逐步擴充基礎歷史數據序列。如前文所述,盡管SARIMA方法可以為任何周期的經濟時間序列建模,但需要足夠多的基礎數據(序列觀測值)作為支撐。建立SARIMA 模型,對于季度序列最好在100 個以上,對于月度序列則應該更多。而本文基于月度序列建立的模型,其序列觀測值個數只有44 個,在進行一階逐期差分和季節差分之后,觀測值更少。另一方面,月度PMI 基本在50 上下波動,月度波動的幅度非常非常小,有時只有0.1%或0.2%左右,這就需要模型具有非常好的擬合性和非常低的誤差率。而分析本文中所建立的模型,盡管從幾個衡量指標看具有擬合效果和一定的預測的作用,但是就實際誤差率而言,預測效果是不理想的,是無法解釋當前的時間序列。為此要逐步擴充基礎歷史數據(序列觀測值),通過觀測值來進一步識別合適的P、Q 等參數,建立較理想的SARIMA 模型,進一步提升數據支撐力度,增強模型的擬合效果。
(二)持續探索合適NBS 季調參數。除數據序列預測值不夠多這個明顯缺陷之外,月度PMI 數據匹配性協調性較差,也是導致模型預測效果不理想的原因。就季節調整本身而言,一方面,時間序列越長季節調整的效果越好,通常不能少于10 年,最好是一個經濟周期的時間。舟山制度業PMI 調查從2012 年開始,月度PMI 的正式試算從2015 年開始,顯然還沒有經歷一個完整周期,所以季節調整本身就不是很完善,存在很多缺陷。另一方面,目前月度PMI 數據都是通過NBS 數據處理軟件,經過季節調整推算而來,NBS 季調軟件中參數的設定,包括arima 模型、工作日效應、交易日效應以及節假日參數的設定等等,都會導致最后季調結果的不同。因此建議要不斷研究NBS軟件的運行原理,探索符合舟山實際經濟發展狀況的各項參數,確保季調后的PMI 數據不失真,更有匹配性、協調性。
一方面,以舟山制造業月度PMI 數據為序列是可以建立合適的SARIMA 模型,而且建立的模型也具有一定的擬合效果和預測能力,同時也說明建立相應的模型對PMI自身進行短期或長期的預測具有較強的可行性。另一方面,受限于數據序列觀測值很少,數據匹配性協調性較低等自身的缺陷,再加上PMI 序列具有很低的波動性等高要求,本文中模型的預測誤差率還是偏高的,預測值與實際值存在較大幅度的差距,無論是靜態預測還是動態預測,其預測結果是不理想的,預測能力也是有限的。綜上所述,基于SARIMA 模型的舟山制造業PMI 預測能力目前來看是較低的,但是從長期來看具有較大的上升提高空間。如果能逐步擴充基數數據序列并不斷提高數據匹配性協調性,SARIMA 模型的預測能力也會得到進一步的提高,預測效果得到進一步的增強。