□薛 潔 馮 楠
居民消費價格指數(CPI)能夠衡量居民所購買日用品以及服務的價格水平變化,既是國民經濟核算的重要基礎,也是衡量通貨膨脹程度的關鍵指標,是宏觀經濟分析與決策的科學依據。準確預測CPI 在評價居民生活水平、把握宏觀經濟運行狀況、制定貨幣和財政政策等方面均發揮著積極作用。
迄今為止,已有眾多學者對宏觀經濟進行預測研究,預測方法可概括為三類:統計預測方法[1](包括時間序列模型、回歸模型等)、機器學習方法[2](包括人工神經網絡、支持向量機、隨機森林等)和組合模型預測方法[3]。傳統的統計預測方法大多為線性模型,很難準確描述經濟系統中復雜的非線性關系。而神經網絡能夠表示任意非線性關系,具有自適應性、容錯性等優越特性。陳夢根和任桃萍(2020)分別使用最小二乘回歸、LASSO 回歸、嶺回歸、時間序列方法ARMA、BP 神經網絡、隨機森林和支持向量回歸進行CPI 預測,結果表明BP神經網絡的預測結果優于其他方法[4]。盡管傳統的人工神經網絡具有上述優勢,但它無法體現樣本之間的時序關系。相比之下,長短期記憶網絡(LSTM)能夠捕捉時間序列的長短信息,更適合預測宏觀經濟數據。同時,LSTM 網絡也常與其他方法結合建立組合模型,以提升預測效果。趙軍豪等(2018)將微博情感分析與LSTM 網絡相結合對宏觀經濟進行預測,發現組合模型與ARIMA、線性回歸、BP 神經網絡和LSTM 網絡相比具有更好的準確性和泛化能力[5]。
而LSTM 模型的預測性能受數據特征和建模框架影響。一方面,冗余特征變量可能會降低預測精度和計算效率。CPI 的影響因素較多,彼此可能存在多重共線性,故建模之前需要去除冗余變量,選擇與CPI 相關性強的變量進行建模;另一方面,精確的建模框架依賴于選擇合適的超參數。超參數的選擇方法包括隨機搜索、網格搜索、粒子群優化算法,前兩種方法費時費力,而PSO 算法簡單、對被優化函數的要求少、能夠快速收斂。因此,為了降低依賴經驗選取超參數的隨機性和計算復雜度,可以運用PSO 算法對LSTM 網絡的超參數進行尋優。
綜上,本文采用LASSO 方法對CPI 影響因素進行篩選,并利用改進PSO 算法優化LSTM 網絡中的超參數,從而建立組合模型對我國CPI 月度數據進行預測。
LASSO 方法由統計學家Tibshirani 于1996 年提出,在回歸系數的絕對值之和小于一個常數的約束條件下,使得一些變量的系數壓縮為零,從而獲得精練模型。
假設有線性模型y=β0+β1x1+β2x2+…+βpxp+ε,其中β0為常數項,β1,β2,…,βp為回歸系數,ε為隨機擾動項,因變量和自變量數據分別經中心化、標準化處理。
LASSO 方法通過求解如下最小化問題對回歸系數β進行估計:

LSTM 是一種改進的時間循環神經網絡,主要由一個記憶單元和三個控制記憶單元狀態的門結構組成,三個門結構分別是遺忘門、輸入門和輸出門。遺忘門控制單元遺忘或保留歷史狀態,輸入門控制傳入信息更新單元狀態,輸出門控制單元狀態傳輸到下一個單元。圖1展示了LSTM 記憶單元的內部結構。

圖1 LSTM 記憶單元結構
圖中,xt為當前時刻的輸入;hi-1、Ct-1為上一時刻的輸出和單元狀態;ht、Ct為當前時刻的輸出和單元狀態;ft、it、ot分別為遺忘門、輸入門和輸出門的狀態計算結果;為單元狀態的更新向量;tanh(·)、σ (·) 分別為tanh 和sigmoid 激活函數。
PSO 算法是一種模擬鳥群覓食時遷移和群集行為的群體智能優化算法。每個粒子代表搜索空間中的個體,其所在位置代表優化問題的一個解,依據粒子自身及群體的經驗不斷調整運動速度,從而實現最優解的搜尋。粒子移動的方向和距離由速度控制,在每一次迭代過程中,粒子通過跟蹤個體極值和群體極值更新自身的速度和位置。
假定D 維搜索空間中,存在粒子群X=(X1,X2,…,Xn),第i個粒子的當前位置為Xi=(xi1,xi2,…,xid),移動速度為Vi=(vi1,vi2,…,vid),個體極值為Pi=(pi1,pi2,…,pid),群體極值為Pg=(pg1,pg2,…,pgd)。
粒子速度和位置更新公式為:

式中,k為迭代次數;粒子數i=1,2,…,n;維度d=1,2,…,D;ω 為慣性權重;c1、c2分別為個體加速因子和社會加速因子;r1、r2為[0,1] 范圍內的隨機數。
雖然標準PSO 算法在解決復雜優化問題上有顯著效果,但仍存在收斂速度慢、易陷入局部最優等問題。為了提升算法的性能,本文從以下兩個方面進行了改進:
1.慣性權重改進。慣性權重ω決定了粒子當前速度的保留程度。本文對標準PSO 算法中的線性遞減權重策略進行改進,提出了一種非線性遞減權重策略。粒子在迭代前期因較大的ω 而快速進行全局探索,之后ω 非線性遞減,粒子逐漸縮小搜索范圍并不斷向最優值靠近。具體改進公式如下:

式中,t為當前迭代次數;Tmax為最大迭代次數;ωstart、ωend為ω的初始值和最終值。
2.加速因子改進。加速因子c1和c2決定了粒子向個體極值和全局極值移動的步長大小。在迭代初期,c1需要大于c2,以加快搜索速度,提高全局搜索能力;在迭代后期,c2需要大于c1,以提升局部搜索能力,加速收斂到全局最優解。本文對標準PSO 算法中固定的加速因子進行線性調整,公式如下:

式中,t為當前迭代次數;Tmax為最大迭代次數;為c1的初始值和最終值。
本文將LASSO 變量選擇方法、改進PSO 算法和LSTM 網絡相融合,構建LASSO-IPSO-LSTM 模型用于CPI 預測,具體建模流程如圖2 所示。

圖2 LASSO-IPSO-LSTM 模型
1.數據預處理。運用LASSO 方法對CPI 序列及各影響因素進行選擇,對篩選后的數據進行標準化處理,并按8∶2 的比例劃分為訓練集和測試集。
2.初始化種群。設置種群規模、粒子維數、最大迭代次數、慣性權重、加速因子。將LSTM 神經網絡的隱藏層單元個數和學習率作為種群粒子,隨機初始化粒子群位置。
3.計算適應度值。根據粒子位置對LSTM 模型的超參數賦值,使用訓練集數據進行模型訓練,以訓練結果的均方誤差作為粒子的適應度值。
4.確定個體極值和群體極值。計算并比較各粒子位置的適應度值,確定單個粒子所經歷最優適應度值位置為個體極值,粒子群所經歷最優適應度值位置為群體極值。
5.更新速度和位置。依據式(2)、(3)的粒子速度和位置更新公式,以及式(4)、(5)的慣性權重和加速因子改進公式,由個體極值和全局極值對粒子的速度與位置進行更新。
6.判斷是否滿足終止條件。當迭代次數達到最大時,滿足終止條件,即得到LSTM 網絡最優超參數取值;否則,返回步驟3,不斷迭代,直至滿足終止條件。
7.建模預測分析。根據改進的PSO 算法優化獲得的最優超參數值,構建LASSO-IPSO-LSTM 預測模型,輸入測試集數據進行預測,并對預測結果進行分析。
由于CPI 的變動與經濟活動密切相關,且受多方面因素的影響。本文綜合考慮經濟活動所涉及的多個領域,從消費、生產、財政、貿易、投資、消費環境和消費心理這七個層面,選取社會消費品零售總額、工業生產者出廠價格指數、外匯儲備、進出口總值、固定資產投資額、郵電業務總量、消費者信心指數等20 個指標,作為同比CPI 序列的影響因素。具體衡量指標如表1 所示。

表1 同比CPI 序列影響因素的衡量指標
考慮到數據的可得性與科學性,本文選取數據的樣本期為2011 年1月至2020 年12 月,數據來源于國家統計局網站、中國人民銀行網站以及東方財富網站,所有價格指數均為同比價格指數(上年同期值為100)。對于個別缺失數據,采用鄰近兩期線性插值法進行補全。
由于各指標數據具有不同量綱,數據差異大,不能直接進行比較,需要對數據進行規范化處理以消除數據量綱,本文采用最大最小值法對數據進行歸一化處理。
為驗證本文提出的LASSOIPSO-LSTM 預測模型的有效性,以我國CPI 數據為例,構建5 個預測模型進行實驗對比,分別是經LASSO 指標篩選的BP、LSTM、PSO-LSTM、IPSO-LSTM 模型和未經LASSO 指標篩選的IPSO-LSTM模型。實驗中,將2011 年1 月至2018 年12 月的96 組數據作為訓練集,將2019 年1 月至2020 年12 月的24 組數據作為測試集。
本文通過10 折交叉驗證方法進行模型選擇,經過模型計算最終保留10 個指標(結果如表2 所示)。其中,因消費環境和消費心理所對應指標對CPI 的影響不大,故被篩選剔除。由回歸系數可知,商品零售價格指數、貨幣和準貨幣供應量同比增長、人民幣對美元匯率、國房景氣指數和新增信貸對CPI 起正向作用,且商品零售價格指數對CPI 的影響最大。

表2 LASSO 指標篩選結果
為準確驗證模型的預測性能,選取均方誤差(MSE)、均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)作為評價指標對模型預測效果進行定量評價,其中,平均絕對百分比誤差的公式如下:

式中,n為樣本數;yi為樣本i的觀測值;為樣本i的預測值。
LSTM 網絡模型由輸入層、一個隱藏層和輸出層組成。由于輸入為CPI 的10 個影響因素,輸出為CPI 序列,故LSTM 模型輸入層的神經元個數為10 個,輸出層的神經元個數為1 個;模型采用均方差函數作為損失值函數,并采用自適應矩估計(Adam)算法作為優化算法,對LSTM 網絡的內部參數進行訓練,訓練次數為100 次,訓練目標為0.0001;同時,為了防止網絡在訓練過程中過擬合,使用丟棄法進行正則化,設置dropout 為0.1。隨后,將LSTM 網絡的隱藏層單元個數h 和學習率η 作為種群粒子,取值范圍分別為[1,20] 和[0.001,0.01];最后,將改進的PSO 算法設置如下:種群規模為30,最大迭代次數為100,慣性權重的初始值和最終值分別為ωstart=0.9、ωend=0.4,加速因子c1的初始值和最終值分別為
利用本文提出的LASSO-IPSOLSTM 預測模型和其他四個并行預測模型進行CPI 預測,預測結果如圖3 所示,各預測模型的評價指標計算結果如表3 所示。分析可知:與其他四種并行預測模型相比,本文提出的LASSO-IPSO-LSTM 模型的預測曲線更接近真實值曲線,且更符合實際的變動趨勢,模型預測誤差在各評價標準下都低于其他模型,說明融合LASSO 變量選擇方法、改進的粒子群優化算法和LSTM 網絡的組合模型具有更好的預測性能。

表3 各預測模型評價指標比較

圖3 各模型預測結果比較
接下來,對兩兩預測模型進行具體的對比分析:(1)相較于LASSO-BP 模型,LASSO-LSTM 模型的預測誤差更小,且能夠更好地捕捉數據隨時間變化的趨勢,表明LSTM 模型更適合處理復雜的非線性時間序列問題;(2)將LASSOIPSO-LSTM 模型和LASSO-LSTM 模型對比,MAE、MAPE、RMSE 下降了約50%,MSE 下降了65.5%,說明改進的粒子群優化算法能夠解決依據經驗選取超參數而造成的模型擬合能力不足的問題;(3)將LASSO-IPSO-LSTM 模型與LASSOPSO -LSTM 模型對比,MAE、MAPE、RMSE 略有下降,MSE 下降了52.65%,說明利用改進的PSO 算法優化LSTM 網絡能夠彌補標準PSO 算法的缺陷,有效提高模型預測準確率;(4)從IPSO-LSTM 模型和LASSO-IPSO-LSTM 模型的實驗結果可以發現,使用LASSO 方法后模型預測精度顯著提升,RMSE、MAPE、MAE 下降了幾近一半,MSE 下降了63.85%,驗證了使用LASSO 方法篩選指標的重要性,同時說明應用LASSO 方法選取的指標是影響CPI 的最顯著因素。
由于CPI 的影響因素較多,具有復雜的非線性特征,傳統的統計預測方法難以建立準確的預測模型,而傳統的人工神經網絡不能充分利用時間序列的長短信息,并且網絡模型的預測性能受數據特征和建模框架的影響較大。綜合考慮以上局限性,本文利用CPI 的影響因素指標,構建了基于LASSO-IPSOLSTM 網絡的CPI 預測模型,并通過實驗測試模型的預測性能。得到如下結論:
(1)應用LASSO 變量選擇方法選取的指標進行預測可以減少冗余信息,顯著降低預測誤差,篩選后的商品零售價格指數、貨幣和準貨幣供應量同比增長、人民幣對美元匯率、國房景氣指數等10 個指標是影響CPI 的最顯著因素。(2)將具有記憶功能的LSTM 網絡運用到CPI 預測中,能夠更好地捕捉數據隨時間變化的趨勢,提高中長期預測精度。(3)采用PSO 算法對LSTM 網絡中的超參數進行優化,克服了人為確定超參數的缺點;同時,利用非線性遞減的慣性權重和線性變化的加速因子改進PSO 算法,增強了算法的全局尋優能力,從而有效提高模型預測精度。(4)將LASSO 方法、IPSO 算法和LSTM網絡相結合,構建了LASSO-IPSOLSTM 組合預測模型,與其他模型相比,提出的組合預測模型具有更好的預測性能。
實證結果顯示,本文所提組合預測模型可為建立良好的CPI 預測機制提供建模思路,有利于及時掌握宏觀經濟發展趨勢。