燕學博,曹 雨(福建理工大學,福建 福州 350118)
鐵路貨運量是我國物流的重要組成部分,也是衡量鐵路貨運發展水平和能力的重要指標。近年來,由于國內經濟社會的發展以及我國城市化步伐的加速,城市居民對各種商品的需求量不斷增加,這導致了鐵路貨運量呈逐年遞增的趨勢。為了滿足社會對貨運服務的需求,進一步提高鐵路貨運服務質量,加強對鐵路貨運組織建設和發展戰略的研究,對鐵路貨運量的精準預測十分必要。傳統的貨運量預測模型主要包含統計模型預測法、神經網絡預測法以及組合模型預測法。
黃雪婷[1]分別對比了SARIMA 模型、LSTM 模型與組合模型的預估數據,結果表明,組合模型無論在較短周期還是在較長周期的預估上,表現結果均強于單一模型;張冠東等[2]改進了傳統LSTM 模型,提出一種多維度LSTM 模型,并分別對鐵路、公路、航空貨運量進行預估,結果表明多維LSTM 模型預測效果優于傳統LSTM 模型;賈春苗等[3]采用ARIMA 與多元回歸模型相結合的綜合模型對陜甘鐵路貨運量進行了預估,結果顯示,復合模型的預測效果優于傳統單一模型;冉葉子[4]利用ANN 與LSTM 深度學習模型對貴州省貨運量進行預測,并與傳統時間序列預測法ARIMA 進行比較,結果表明深度學習模型預測效果優于傳統模型;楊飛[5]采用了Logit 加權方法,將BP 神經網絡、霍爾線特性趨勢指數平滑算法與ARIMA 相結合構建了全新的組合模型,將該模型與基于等權分配法的組合模型加以比較,結果表明采用Logit 加權方式的組合模型表現效果明顯高于采用等權分配的組合模型;周昌野等[6]基于網格搜索算法對LSTM 模型進行改良,得出全新的GS-LSTM 模型,實驗結果表明,經過改良的GS-LSTM 模型泛化能力要強于傳統LSTM 模型。
以上研究表明,組合模型的泛化能力要強于單一模型,而對組合模型的權重分配法中,等權分配法表現較差。組合模型中能夠更好實現對單一模型的優點整合,特別是強化數據預測中線性部分與非線性部分的有機結合。本文以國家統計局公布的2005 至2022 年全國鐵路貨運量為例,分別利用傳統ARIMA 模型,深度學習中LSTM 模型與二者相結合的ARIMA-LSTM 組合模型對數據進行擬合,選取最優預測方案。
ARIMA (p,d,q)模型是經過差分處理的AR(p)模型與MA(q)模型的組合,它包含三個方面,分別為自回歸函數AR,函數階數I 與移動平均函數MA,其中參數p,q 分別表示自回歸函數與移動平均函數階數,d 代表差分次數,ARIMA (p,d,q)模型基本公式為:
式中:yt與yt-i分別代表預測值與歷史值;μ 為白噪聲項;γi與θi分別代表自相關系數與誤差項系數;p 與q 分別代表自回歸階數和移動平均階數;εt與εt-i代表模型的誤差和時間點i 之間的偏差。
ARIMA (p,d,q)模型步驟包括數據平穩性檢測、模型定階、模型選取、白噪聲檢驗等,具體流程如圖1 所示。

圖1 ARIMA 模型預測流程圖
長短時記憶網絡(Long Short Term Memory Network,LSTM)模型是由Schmidhuber 和Hochreiter 于1997 年提出,它的基本原理為循環神經網絡(Recurrent Neural Network,RNN)模型,它針對傳統RNN 模型中經常出現的梯度消失,長時訓練信息無法保留等問題進行優化,在此基礎上首次引入“門”的概念,使每一個神經元同時具有輸入門、遺忘門和輸出門。LSTM 模型基本工作原理如圖2 所示,
模型中ft、it、Ot分別代表遺忘門、輸入門和輸出門,Ct代表細胞更新狀態,ht代表當前時刻輸出值,σ、tanh 均為激活函數,其中:σ 采取Sigmoid 激活函數,tanh 則采用正切激活函數。遺忘門、輸入門、輸出門、細胞更新狀態、當前節點輸出計算方式分別如下:
其中:Wf、Wt、Wo、Wc、bf、bi、bo、bc依次代表遺忘門、輸入門、輸出門和細胞更新狀態的時間權重及其偏置項,ht-1表示上一時刻隱藏層的向量,Xt則代表當前時刻輸入。
組合模型可以解決單一預測模型的不足,進一步提升預測的精度,組合模型通常采取串聯、并聯兩種模式,其具體流程如圖3、圖4 所示:

圖3 串聯模型流程圖
本文數據來源均為國家統計局公布數據,實驗軟件分別為SPSS Statistics 20.0 與Matlab 2018b。為保證實驗準確性,ARIMA模型采用SPSS 中專家建模的結論,最終模型為ARIMA (0,1,0)(0,1,1);LSTM 模型選用單隱層模型,隱層節點數為70,優化器為Adam,最大循環次數為300,初始學習率為0.01。
為量化評估模型精度,本文選取平均絕對誤差(Mean Absolute Error,MAE)指標,平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)指標,均方誤差(Mean Square Error,MSE)指標和均方根誤差(Root Mean Square Error,RMSE)指標作為評估依據,指標計算公式如下:
其中:Yi為i 時刻實際值,為i 時刻模型預測值,n 代表樣本個數。
串聯模型中,首先通過ARIMA 模型對原始數據進行估計判斷,得出預測結果A(t);而后通過LSTM 模型對ARIMA 模型預測中出現的殘差項進行預測,并得出預測結果L(t),串聯模型最終預測結果Y(t)為:
對比單一模型與串聯耦合模型下的MAE、MAPE、MSE、RMSE 指標,對比結果如表1 所示。通過對比可以得出結論,組合模型各項指標值均低于單一模型,表明組合模型的泛化能力明顯強于單一模型。

表1 單一模型與組合模型對比結果
并聯組合模型基本方法是分別利用各模型對原始序列進行預測,而后確定單一模型所占權重Wi、Wj,基本運算如下:
當前多模型權重確定方法包括算術平均法、方差倒數法、均方倒數法、簡單加權法和熵權法。本文對各權重方法產生的組合模型進行比較,選取最優組合作為并聯組合模型解。
3.2.1 算術平均法
算術平均法通常也叫做等權平均法,即對各模型均賦予相同權重,權重確定公式為:
其中:Wi為第i 個模型權重,I 為模型總數。
3.2.2 方差倒數法
方差倒數法是對算術平均法的改進,以預測誤差的平方和作為權重確定依據,基本公式為:
式中:Di為誤差平方和,其基本公式為:
式中:xt為真實值,為模型的預測值。
3.2.3 均方倒數法
均方倒數法是對方差倒數法的改進,體現在單一模型的誤差平方和越大,所屬模型在組合模型中權重越小,其基本公式為:
式中:Di定義與方差倒數法Di定義相同。
3.2.4 簡單加權法
簡單加權法確定權重方法是先將各模型預測誤差的方差之和進行排序,排名越靠前的預測模型,其組合模型中加權系數越小,計算公式為:
3.2.5 熵權法
熵權法是通過衡量指標變異性的能力來判斷客觀權重。熵權法認為,某指標信息熵越小,則表明指標變異程度大,所能反映的信息量越多,因此其相對權值越大,熵權法基本運算公式為:
式中:1-ej代表信息效用,ej代表第j 個指標的信息熵,其計算公式為:
對比結果顯示,采用方差倒數法確定權重的并聯模型為最優組合模型,且所有指標均小于其他模型,表明了該模型泛化能力及預測精準度較其余模型更佳。不同方法所確定組合模型權重及精度對比如表2、表3 所示:

表2 組合模型權重表

表3 多模型預測精度對比表
分別對比ARIMA 模型、LSTM 模型以及ARIMA-LSTM 組合模型的參數,最終選定基于方差倒數的組合模型為最優模型。對各模型的預測值與原始數據進行擬合,可以明顯看出組合模型的擬合效果要好于單個模型,如圖5 所示。

圖5 多模型數據擬合圖
圖6 為各模型與真實數據的絕對誤差值。由圖6 可以清晰看到組合模型誤差波動整體較單一模型要小,其絕對誤差值也低于單一模型,表明ARIMA-LSTM 組合模型的穩定性及誤差較單一模型表現較好。

圖6 多模型絕對誤差對比
為進一步量化參數,對各模型預測效果進行評價,分別對比各模型MAE、MAPE、MSE、RMSE 指標,結果如表4 所示。通過對比可得,組合模型較ARIMA 模型的MAE、MAPE、MSE、RMSE 指標分別降低15.26%、15.62%、24.64%、17.12%,較LSTM 模型分別降低25.32%、32.67%、43.66%、28.33%。

表4 多模型指標對比
本文以全國2005 年1 月至2022 年10 月鐵路貨運量為研究目標,并分別采用ARIMA 模型、LSTM 模型與ARIMA-LSTM 組合模型對原數據進行預測,在組合模型中,采用ARIMA 模型與LSTM 預測殘差所共同構建的串聯模型,以及采用算數平均法、方差倒數法、均方倒數法、簡單加權法、熵權法構建的并聯模型,并以MAE、MAPE、MSE、RMSE 指標作為評價模型依據,研究結論表明:(1)任意組合模型擬合效果均強于單一模型。(2)組合模型中采取不同的權重賦予方式會導致組合模型預測精度不同,通過對比五種權重確定方式,以方差倒數法確定的權重組合模型表現最佳。(3)鐵路貨運量數據兼具線性與非線性特征,在時間維度原始數據包含趨勢性與季節性特征,單一線性模型預測效果較差,在對以上數據進行預測時應兼顧線性與非線性特征,采取線性與非線性相組合模型對該數據進行預測。