陳書愉 劉雨晴 王曉燕(通訊作者)
(南通大學理學院 江蘇南通 226000)
隨著時代經濟的不斷發展與進步,人們的消費需求不斷增長。新冠疫情對經濟的沖擊下,刺激消費已經成為拉動經濟發展的一輛重要馬車,而社會消費品零售總額很好地反映了消費要素的特征。利用社會消費品零售總額可以了解國民需求,進而了解南通市的經濟增長狀況。
本文分別選用因素分解模型和ARIMA乘積季節模型(SARIMA模型)對2010—2021年南通市社會消費品零售總額月度數據(以下簡稱“社消零”)進行建模分析并預測,比較在兩種模型下真實值與預測值的相對誤差大小,進而分析南通市社會消費水平發展趨勢。
本文選取南通市 2010年1月至2021年8月 的“社消零”月度數據為樣本,由于“社消零”月度數據為該年首月到當前月的累計值,并非當期值;以累計值做時間序列是不合理的,因為每個月的趨勢效應、隨機效應等均被累計,計算當期值。鑒于每年月度數據線性趨勢明顯,因此我們采用簡單的線性插值法補全缺省數據,數據繪制成時序圖1。從圖1粗略可見該時間序列具有明顯的長期遞增趨勢,并且隨著趨勢的遞增,每個周期的振幅逐漸增大(2020年數據的異常是由于疫情的影響)。此外,基本上每一年數據都呈現先上升再下降,這一現象反映出該序列的季節性。因為序列具有趨勢性和季節效應,故采用因素分解模和SARIMA模型兩種季節時間序列模型對序列進行建模分析。

圖1 2010年1月至2021年8月南通市“社消零”當期值時序
從圖1可以看出:隨著趨勢的遞增,每個季節的振幅也隨之增加,即季節效應受到趨勢的影響,如虛線所示,周期波動范圍隨著趨勢增加而擴大,呈現喇叭形,因此選用因素分解的乘法模型。
2.1.1 利用R軟件對序列進行乘法模型的因素分解
由圖2可見:從現實出發2月為中國農歷春節,消費者在此月會加大支出,消費額會大幅增加,故2月的季節指數理應最高;接著,3月、4月陸續上班,季節指數應逐步下降,而當5月時,勞動節來臨,市民外出旅游增加消費,季節指數達到階段性小高峰;此外,10月國慶長假消費者外出旅游加大消費,季節指數上升達到小高峰,12月年底市民開始陸續準備年貨,季節指數呈現上升趨勢。故季節指數符合現實意義,分解得當。2010—2019年,南通市“社消零”呈現上升趨勢,但在2020年新冠疫情蔓延,南通實行封城居家隔離政策,因此趨勢下降;隨后疫情逐漸得到控制,常態化管理下居民得以外出工作、消費,故而趨勢又上升;分解出的趨勢效應符合現實意義,因此分解得當。此外分解后隨機序列在值1附件波動,可以認為其是白噪聲序列。

圖2 因素分解效果
2.1.2 基于Holt-Winters三參數指數平滑預測
由于上面因素分解可見時序既有趨勢又含有季節,下面利用Holt-Winters三指數平滑對序列進行預測。基于最優擬合原則計算出平滑系數,進而得到向前任意k期的預測值:

式(1)中j為t+k期對應的季節,Sj為季節因子。得到三個參數的最后迭代值a(t)=328.6404768,b(t)=1.6966638,Sj的最后的12個估計值對應的是12個月的季節指數,分別為0.990197、1.0542752、0.9669401、0.9889556、0.9388016、0.9959767、0.9919118、0.9411289、1.0146027、1.0605129、0.9645991、0.991402。從預測值來看,模型很好地反映的季節效應與趨勢效應,在1、2、5、10與12月均有明顯增加。
2.2.1 序列的平穩化處理
根據圖1分析結果,對原序列做1階12步差分消除趨勢和季節效應,數據的趨勢性也已被基本消除,基本可視為平穩序列,進一步對此做平穩性的ADF檢驗。檢驗結果顯示P值均小于顯著性水平0.01,數據在1%檢驗水平下拒絕原假設,此時時間序列已經平穩,故差分后序列通過平穩性檢驗。此外,通過純隨機檢驗,延遲6階和延遲12階LB檢驗統計量的P值都顯著小于0.05,該模型是非白噪聲序列。
2.2.2 模型定階和參數估計
為了給模型的定階,畫出其延遲36階的自相關與偏自相關圖(見圖3)。

圖3 自相關和偏相關
由圖3進行模型選擇,觀察非季節性部分:自相關系數(ACF)由圖顯示在一階顯著超出二倍標準差,其他階數均小于二倍標準差,可認為該序列自相關系數一階截尾;偏自相關系數(PACF)圖可見一階二階顯著超出二倍標準差,可判斷該序列偏自相關系數二階截尾,也可理解為均是拖尾的。觀察季節自相關和偏自相關特征:自相關圖顯示延遲36階和48階的自相關系數均顯著非零,偏自相關圖顯示延遲24階的偏自相關系數顯著非零,而延遲36階和48階的偏自相關系數均落入兩倍標準差內,可以認為偏自相關系數2周期截尾。因此可以認為季節自相關系數是自相關拖尾(Q=0),偏自相關2周期截尾(P=2)。通過以上分析,選SARIMA季節乘積模型ARIMA(1,1,2)×(P,D,Q)S來進行擬合,且根據 AIC 準則進行模型篩選。我們在所定階數的附近采用逐次升階策略計算各模型的AIC準則,經多次嘗試,模型的AIC相對于其他模型要小,且模型參數不能拒絕參數為 0 的假定,因此認為該模型優于其他定階模型。模型擬合顯式表達為:
2.2.3 模型適應性檢驗與序列預測
經過檢驗發現:模型系數均大于兩倍標準差,表示參數是顯著的;殘差序列的白噪聲檢驗結果可以看出各階延遲下白噪聲檢驗統計量的P值都顯著大于0.05,可以認為擬合模型的殘差序列屬于白噪聲序列,認為擬合模型顯著成立。可以進行序列的預測,由圖4預測圖可見,模型的擬合值和實際的變動具有較好的一致性。

圖4 SARIMA季節乘法模型預測效果圖
利用因素分解模型(1)對 2021年9月至2022年3月的“社消零”總額當期值進行預測,并將實際值與預測值進行比較。通過計算比較,從表1中可以看出預測值與實際值的相對誤差控制在10%以內,通過計算得平均相對誤差為5.63%。在 SARIMA模型(2)下,數據的相對誤差控制在 7%以內,平均相對誤差為4.62%。從預測的結果來看,雖然兩種模型都考慮到了時間序列數據趨勢性和季節性,但預測效果都一般。對比因素分解模型,SARIMA模型更能較為準確地預測南通的“社消零”的季節變化,相對誤差較小。從預測趨勢可見南通市未來短時間內的“社消零”仍將保持高速增長,新冠疫情對南通消費水平影響不大。

表1 兩種模型預測結果
本文運用因素分解模型和SARIMA模型對南通市城鎮居民社會消費品零售總額當期值進行預測,SARIMA模型預測的誤差較小,說明采用SARIMA模型預測南通市社會消費品零售總額當期值是可行的,短期預測具有一定的可信度,可為南通市宏觀經濟決策提供參考,促進地方經濟發展。