劉 杰
(重慶工程職業技術學院 智能制造與交通學院,重慶 402260)
隨著我國高速鐵路的迅猛發展,高速鐵路客流預測成為鐵路運營管理的重要任務之一,同時也是提升服務和管理水平的重要依據。目前已經有許多針對鐵路領域的客流預測研究。汪健雄等[1]基于鐵路客流的時間特征提出了一種BP神經網絡改進模型,在春運客流預測中取得了較好的預測效果;李曉俊等[2]利用人工神經網絡具有的高度非線性映射能力,提出徑向基神經網絡鐵路短期客流預測模型,在T15次列車硬座席別客運量預測上取得較好效果;楊曉等[3]在考慮高速鐵路短期客流的周期性和波動性基礎上,提出一種改進重力模型對客流進行預測,結果表明該方法有較好的適用性;SUN Yuxing等[4]將小波分析和支持向量機模型結合對客流做短期預測,預測結果不僅精度高,還具有較強魯棒性;李麗輝等[5]在分析影響短期鐵路客流因素的基礎上,提出基于隨機森林回歸算法預測模型,在上海到北京2015年7月—8月的客流預測中精度達到0.92;王貴平[6]運用改進的四階段法和弗雷特法得到滇中全方式客流分布,最后建立Logit模型成功預測了鐵路網絡客流;LAI Qingying等[7]考慮了列車服務頻率的影響,提出一種高速鐵路短期客流預測混合模型,并以2012年6月—2016年12月北京南站至上海虹橋車站客流數據為驗證對象,取得了較好的預測效果;M.MILO等[8]將季節自回歸集成移動平均方法用在塞爾維亞鐵路客流預測上,取得了較好的效果。以往國內外研究主要分為傳統時序模型和機器學習模型兩類。傳統時序模型使用簡單,但對復雜非線性數據預測精度不高。機器學習模型需要構建較多的特征信息才能保證其精度要求,但這樣增加了研究的成本和難度。
鐵路客流預測的困難源于客流數據本身的非線性復雜性和外部因素的影響。要想提高預測精度,一種方法是收集外部數據增加特征數量,但這就會導致預測成本的極大增加。另一種方法是充分挖掘已有歷史數據特征信息,但一般預測方法的非線性特征挖掘能力有限,導致部分有效信息丟失。筆者在不增加預測成本的原則下,利用人工神經網絡強大的非線性特征挖掘能力,提出一種基于棧式自編碼的高速鐵路客流預測模型,并通過案例驗證其可行性。
以“天”為單位統計的渝萬線各車站站間客流為研究對象??土鲾祿举|就是時間序列數據,因此客流預測問題就是時間序列預測問題,其客流數據描述表達式為:
(1)

在不考慮政治、經濟等外部因素影響的情況下,只利用歷史數據信息進行預測,預測結果為:
(2)



表1 本征特征說明
G=(g1,…gk…,gK)
(3)
式中:G為關聯特征向量;gk為第k個提取特征;K為特征總數。
(4)
式中:xs為第s個樣本;X為樣本集;S為樣本總數;L標簽集。
有了樣本集和標簽集就可以用來訓練客流預測模型。
選擇神經網絡作為建??蚣艿脑蛟谟谙啾葌鹘y的預測模型,神經網絡模型在大規模數據量和高維度數據特征上相比傳統預測模型更具備優勢,而數據量和維度也是直觀體現數據復雜度的兩個關鍵指標,大量研究表明數據復雜度越高,神經網絡的優勢越明顯,如圖1。模型構建分為兩個部分,第一部分利用棧式自編碼模型預訓練神經網絡參數;第二部分在第一部得到的初始參數基礎上重新訓練神經網絡得到預測模型。

圖1 神經網絡模型和傳統模型性能對比
要構建一個有H個隱藏層的神經網絡客流預測模型,如果直接采用樣本集和標簽集進行有監督訓練會出現梯度彌散現象,導致預測效果不佳,因此采用棧式自編碼技術解決這一問題。棧式自編碼的思想就是利用自編碼訓練的方法逐層貪婪的訓練神經網絡,最終得到神經網絡每一層的神經元初始參數,具體步驟如下[10]:
第1步:為訓練有H1個神經元的第1層隱藏層參數,需要構建一個含輸入層,隱藏層和輸出層的3層自編碼網絡,自編碼網絡的輸入和輸出層神經元數量相同,將所有樣本作為該自編碼網絡的輸入和輸出,如圖2,最后選定合適的激活函數和損失函數后開始無監督訓練,樣本集訓練完成后得到第1層隱藏層神經元所有參數,記為W(1)。

圖2 第1層隱藏層參數訓練網絡模型


圖3 第2層隱藏層參數訓練網絡模型
第3步:重復以上步驟直到訓練完H個隱藏層為止,從而得到所有隱藏層參數(W(1),W(2),…,W(H))。
訓練客流預測模型前,首先保留棧式自編碼訓練得到的所有隱藏層結構和參數,然后將樣本作為輸入,與樣本對應的標簽作為輸出,有監督的重新訓練一次,最終得到客流預測模型,如圖4。

圖4 神經網絡客流預測模型




(5)
式中:|T|為預測時間天數。
計算結果和綜合自回歸移動平均模型(以下簡稱ARIMA)、霍爾特-溫特斯模型(以下簡稱Holt-winters)、長短期記憶模型(以下簡稱LSTM)、季節趨勢分解法(以下簡稱STL)4種常用預測模型對比。5種模型在不同階段的預測精度表現不一樣,根據結果將整個預測時間分為3個階段進行分析,第1階段0~93 d,第2階段94~229 d,第3階段230~322 d,結果如圖5。
從圖5可以看出,在第1階段除Holt-winters外,其它模型誤差隨預測時間的增加,總體呈遞增趨勢。Holt-winters雖然在2~14 d誤差呈遞減趨勢,但誤差整體水平遠高于其它模型。通過計算,整體平均相對誤差由低到高依次為文中模型、LSTM、ARIMA、STL和Holt-winters,數值分別為9.16%、10.2%、12%、13%和33.9%。可見在3個月短期客流預測中文中模型表現最好。

圖5 第1階段平均相對誤差變化情況
通過計算,第2階段整體平均相對誤差由低到高依次為LSTM、文中模型、ARIMA、STL和Holt-winters,數值分別為12.1%、13.2%、17.9%、23%和31.4%。文中模型和LSTM對比,在94~112 d誤差水平基本一樣,在113~220 d文中模型整體平均相對誤差比LSTM略高1.4%,在221~229 d兩個模型預測精度基本又一樣。整個第2階段LSTM表現最好,如圖6。

圖6 第2階段平均相對誤差變化情況
通過計算,第3階段整體平均相對誤差由低到高依次為文中模型、LSTM、ARIMA、Holt-winters和STL,數值分別為11.5%、12.9%、18.6%、24.3%和28.9%。第3階段文中模型表現最好,如圖7。在分析完3個階段各模型誤差變化情況后,最后對5種模型所有預測數據相對誤差取平均值得到3個階段整體平均相對誤差值,如表2。

表2 各模型整體平均相對誤差情況

圖7 第3階段平均相對誤差變化情況
從表2可知,在渝萬線高鐵客流數據集的測試中,提出模型整體平均相對誤差指標低于其它4種模型,相比同樣是基于神經網絡框架的LSTM模型誤差小1.18%。其余3種模型誤差指標均超過18%,在數據集上表現最差的模型為STL。雖然在第2階段LSTM表現略優于本文模型,但文中模型整體性能是最好的。
1)在渝萬線高鐵客流數據集實驗發現文中模型適應于3個月內的短期客流預測,因此文中模型在其它數據集中應用時可以將此數值作為經驗值使用。
2)基于神經網絡框架的模型,如LSTM和文中模型整體表現優于基于趨勢分解的模型,如ARIMA、STL和Holt-winters,這說明高鐵客流除了具有周期性、波動性這些常規特性之外,還具有很強的非線性特性,這導致傳統趨勢分解預測模型預測效果不佳。
3)在100 d以上的客流預測不建議采用基于歷史數據特征挖掘的模型,因為從文中結果可以看出神經網格框架模型雖然有很強的擬合能力,但是中遠期客流預測中社會和經濟大環境等宏觀因素不能忽略,因此需要增加外部特征數據,利用擬合能力再強的模型預測精度都不會很理想。
高速鐵路客流預測是提高高鐵服務水平的基礎,從理論研究角度來看,將特征提取和自編碼等機器學習技術應用于高鐵客流預測有助于充分挖掘歷史數據信息,實證分析也獲得了較好的預測效果。探索了一種有效的高鐵站間短期客流預測方法,但隨著數據規模的擴大,神經網絡的訓練時間會顯著增加,因此如何提升算法效率以適應大規模數據集是下一步研究的重點。另外由于政治、經濟等外部因素的數據收集難度較大,所以對于中長期的客流預測還是一個難點,有待進一步研究。