劉 杰
(重慶工程職業(yè)技術(shù)學(xué)院 智能制造與交通學(xué)院,重慶 402260)
隨著我國高速鐵路的迅猛發(fā)展,高速鐵路客流預(yù)測成為鐵路運(yùn)營管理的重要任務(wù)之一,同時(shí)也是提升服務(wù)和管理水平的重要依據(jù)。目前已經(jīng)有許多針對鐵路領(lǐng)域的客流預(yù)測研究。汪健雄等[1]基于鐵路客流的時(shí)間特征提出了一種BP神經(jīng)網(wǎng)絡(luò)改進(jìn)模型,在春運(yùn)客流預(yù)測中取得了較好的預(yù)測效果;李曉俊等[2]利用人工神經(jīng)網(wǎng)絡(luò)具有的高度非線性映射能力,提出徑向基神經(jīng)網(wǎng)絡(luò)鐵路短期客流預(yù)測模型,在T15次列車硬座席別客運(yùn)量預(yù)測上取得較好效果;楊曉等[3]在考慮高速鐵路短期客流的周期性和波動性基礎(chǔ)上,提出一種改進(jìn)重力模型對客流進(jìn)行預(yù)測,結(jié)果表明該方法有較好的適用性;SUN Yuxing等[4]將小波分析和支持向量機(jī)模型結(jié)合對客流做短期預(yù)測,預(yù)測結(jié)果不僅精度高,還具有較強(qiáng)魯棒性;李麗輝等[5]在分析影響短期鐵路客流因素的基礎(chǔ)上,提出基于隨機(jī)森林回歸算法預(yù)測模型,在上海到北京2015年7月—8月的客流預(yù)測中精度達(dá)到0.92;王貴平[6]運(yùn)用改進(jìn)的四階段法和弗雷特法得到滇中全方式客流分布,最后建立Logit模型成功預(yù)測了鐵路網(wǎng)絡(luò)客流;LAI Qingying等[7]考慮了列車服務(wù)頻率的影響,提出一種高速鐵路短期客流預(yù)測混合模型,并以2012年6月—2016年12月北京南站至上海虹橋車站客流數(shù)據(jù)為驗(yàn)證對象,取得了較好的預(yù)測效果;M.MILO等[8]將季節(jié)自回歸集成移動平均方法用在塞爾維亞鐵路客流預(yù)測上,取得了較好的效果。以往國內(nèi)外研究主要分為傳統(tǒng)時(shí)序模型和機(jī)器學(xué)習(xí)模型兩類。傳統(tǒng)時(shí)序模型使用簡單,但對復(fù)雜非線性數(shù)據(jù)預(yù)測精度不高。機(jī)器學(xué)習(xí)模型需要構(gòu)建較多的特征信息才能保證其精度要求,但這樣增加了研究的成本和難度。
鐵路客流預(yù)測的困難源于客流數(shù)據(jù)本身的非線性復(fù)雜性和外部因素的影響。要想提高預(yù)測精度,一種方法是收集外部數(shù)據(jù)增加特征數(shù)量,但這就會導(dǎo)致預(yù)測成本的極大增加。另一種方法是充分挖掘已有歷史數(shù)據(jù)特征信息,但一般預(yù)測方法的非線性特征挖掘能力有限,導(dǎo)致部分有效信息丟失。筆者在不增加預(yù)測成本的原則下,利用人工神經(jīng)網(wǎng)絡(luò)強(qiáng)大的非線性特征挖掘能力,提出一種基于棧式自編碼的高速鐵路客流預(yù)測模型,并通過案例驗(yàn)證其可行性。
以“天”為單位統(tǒng)計(jì)的渝萬線各車站站間客流為研究對象。客流數(shù)據(jù)本質(zhì)就是時(shí)間序列數(shù)據(jù),因此客流預(yù)測問題就是時(shí)間序列預(yù)測問題,其客流數(shù)據(jù)描述表達(dá)式為:
(1)

在不考慮政治、經(jīng)濟(jì)等外部因素影響的情況下,只利用歷史數(shù)據(jù)信息進(jìn)行預(yù)測,預(yù)測結(jié)果為:
(2)



表1 本征特征說明
G=(g1,…gk…,gK)
(3)
式中:G為關(guān)聯(lián)特征向量;gk為第k個(gè)提取特征;K為特征總數(shù)。
(4)
式中:xs為第s個(gè)樣本;X為樣本集;S為樣本總數(shù);L標(biāo)簽集。
有了樣本集和標(biāo)簽集就可以用來訓(xùn)練客流預(yù)測模型。
選擇神經(jīng)網(wǎng)絡(luò)作為建模框架的原因在于相比傳統(tǒng)的預(yù)測模型,神經(jīng)網(wǎng)絡(luò)模型在大規(guī)模數(shù)據(jù)量和高維度數(shù)據(jù)特征上相比傳統(tǒng)預(yù)測模型更具備優(yōu)勢,而數(shù)據(jù)量和維度也是直觀體現(xiàn)數(shù)據(jù)復(fù)雜度的兩個(gè)關(guān)鍵指標(biāo),大量研究表明數(shù)據(jù)復(fù)雜度越高,神經(jīng)網(wǎng)絡(luò)的優(yōu)勢越明顯,如圖1。模型構(gòu)建分為兩個(gè)部分,第一部分利用棧式自編碼模型預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)參數(shù);第二部分在第一部得到的初始參數(shù)基礎(chǔ)上重新訓(xùn)練神經(jīng)網(wǎng)絡(luò)得到預(yù)測模型。

圖1 神經(jīng)網(wǎng)絡(luò)模型和傳統(tǒng)模型性能對比
要構(gòu)建一個(gè)有H個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò)客流預(yù)測模型,如果直接采用樣本集和標(biāo)簽集進(jìn)行有監(jiān)督訓(xùn)練會出現(xiàn)梯度彌散現(xiàn)象,導(dǎo)致預(yù)測效果不佳,因此采用棧式自編碼技術(shù)解決這一問題。棧式自編碼的思想就是利用自編碼訓(xùn)練的方法逐層貪婪的訓(xùn)練神經(jīng)網(wǎng)絡(luò),最終得到神經(jīng)網(wǎng)絡(luò)每一層的神經(jīng)元初始參數(shù),具體步驟如下[10]:
第1步:為訓(xùn)練有H1個(gè)神經(jīng)元的第1層隱藏層參數(shù),需要構(gòu)建一個(gè)含輸入層,隱藏層和輸出層的3層自編碼網(wǎng)絡(luò),自編碼網(wǎng)絡(luò)的輸入和輸出層神經(jīng)元數(shù)量相同,將所有樣本作為該自編碼網(wǎng)絡(luò)的輸入和輸出,如圖2,最后選定合適的激活函數(shù)和損失函數(shù)后開始無監(jiān)督訓(xùn)練,樣本集訓(xùn)練完成后得到第1層隱藏層神經(jīng)元所有參數(shù),記為W(1)。

圖2 第1層隱藏層參數(shù)訓(xùn)練網(wǎng)絡(luò)模型


圖3 第2層隱藏層參數(shù)訓(xùn)練網(wǎng)絡(luò)模型
第3步:重復(fù)以上步驟直到訓(xùn)練完H個(gè)隱藏層為止,從而得到所有隱藏層參數(shù)(W(1),W(2),…,W(H))。
訓(xùn)練客流預(yù)測模型前,首先保留棧式自編碼訓(xùn)練得到的所有隱藏層結(jié)構(gòu)和參數(shù),然后將樣本作為輸入,與樣本對應(yīng)的標(biāo)簽作為輸出,有監(jiān)督的重新訓(xùn)練一次,最終得到客流預(yù)測模型,如圖4。

圖4 神經(jīng)網(wǎng)絡(luò)客流預(yù)測模型




(5)
式中:|T|為預(yù)測時(shí)間天數(shù)。
計(jì)算結(jié)果和綜合自回歸移動平均模型(以下簡稱ARIMA)、霍爾特-溫特斯模型(以下簡稱Holt-winters)、長短期記憶模型(以下簡稱LSTM)、季節(jié)趨勢分解法(以下簡稱STL)4種常用預(yù)測模型對比。5種模型在不同階段的預(yù)測精度表現(xiàn)不一樣,根據(jù)結(jié)果將整個(gè)預(yù)測時(shí)間分為3個(gè)階段進(jìn)行分析,第1階段0~93 d,第2階段94~229 d,第3階段230~322 d,結(jié)果如圖5。
從圖5可以看出,在第1階段除Holt-winters外,其它模型誤差隨預(yù)測時(shí)間的增加,總體呈遞增趨勢。Holt-winters雖然在2~14 d誤差呈遞減趨勢,但誤差整體水平遠(yuǎn)高于其它模型。通過計(jì)算,整體平均相對誤差由低到高依次為文中模型、LSTM、ARIMA、STL和Holt-winters,數(shù)值分別為9.16%、10.2%、12%、13%和33.9%。可見在3個(gè)月短期客流預(yù)測中文中模型表現(xiàn)最好。

圖5 第1階段平均相對誤差變化情況
通過計(jì)算,第2階段整體平均相對誤差由低到高依次為LSTM、文中模型、ARIMA、STL和Holt-winters,數(shù)值分別為12.1%、13.2%、17.9%、23%和31.4%。文中模型和LSTM對比,在94~112 d誤差水平基本一樣,在113~220 d文中模型整體平均相對誤差比LSTM略高1.4%,在221~229 d兩個(gè)模型預(yù)測精度基本又一樣。整個(gè)第2階段LSTM表現(xiàn)最好,如圖6。

圖6 第2階段平均相對誤差變化情況
通過計(jì)算,第3階段整體平均相對誤差由低到高依次為文中模型、LSTM、ARIMA、Holt-winters和STL,數(shù)值分別為11.5%、12.9%、18.6%、24.3%和28.9%。第3階段文中模型表現(xiàn)最好,如圖7。在分析完3個(gè)階段各模型誤差變化情況后,最后對5種模型所有預(yù)測數(shù)據(jù)相對誤差取平均值得到3個(gè)階段整體平均相對誤差值,如表2。

表2 各模型整體平均相對誤差情況

圖7 第3階段平均相對誤差變化情況
從表2可知,在渝萬線高鐵客流數(shù)據(jù)集的測試中,提出模型整體平均相對誤差指標(biāo)低于其它4種模型,相比同樣是基于神經(jīng)網(wǎng)絡(luò)框架的LSTM模型誤差小1.18%。其余3種模型誤差指標(biāo)均超過18%,在數(shù)據(jù)集上表現(xiàn)最差的模型為STL。雖然在第2階段LSTM表現(xiàn)略優(yōu)于本文模型,但文中模型整體性能是最好的。
1)在渝萬線高鐵客流數(shù)據(jù)集實(shí)驗(yàn)發(fā)現(xiàn)文中模型適應(yīng)于3個(gè)月內(nèi)的短期客流預(yù)測,因此文中模型在其它數(shù)據(jù)集中應(yīng)用時(shí)可以將此數(shù)值作為經(jīng)驗(yàn)值使用。
2)基于神經(jīng)網(wǎng)絡(luò)框架的模型,如LSTM和文中模型整體表現(xiàn)優(yōu)于基于趨勢分解的模型,如ARIMA、STL和Holt-winters,這說明高鐵客流除了具有周期性、波動性這些常規(guī)特性之外,還具有很強(qiáng)的非線性特性,這導(dǎo)致傳統(tǒng)趨勢分解預(yù)測模型預(yù)測效果不佳。
3)在100 d以上的客流預(yù)測不建議采用基于歷史數(shù)據(jù)特征挖掘的模型,因?yàn)閺奈闹薪Y(jié)果可以看出神經(jīng)網(wǎng)格框架模型雖然有很強(qiáng)的擬合能力,但是中遠(yuǎn)期客流預(yù)測中社會和經(jīng)濟(jì)大環(huán)境等宏觀因素不能忽略,因此需要增加外部特征數(shù)據(jù),利用擬合能力再強(qiáng)的模型預(yù)測精度都不會很理想。
高速鐵路客流預(yù)測是提高高鐵服務(wù)水平的基礎(chǔ),從理論研究角度來看,將特征提取和自編碼等機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于高鐵客流預(yù)測有助于充分挖掘歷史數(shù)據(jù)信息,實(shí)證分析也獲得了較好的預(yù)測效果。探索了一種有效的高鐵站間短期客流預(yù)測方法,但隨著數(shù)據(jù)規(guī)模的擴(kuò)大,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間會顯著增加,因此如何提升算法效率以適應(yīng)大規(guī)模數(shù)據(jù)集是下一步研究的重點(diǎn)。另外由于政治、經(jīng)濟(jì)等外部因素的數(shù)據(jù)收集難度較大,所以對于中長期的客流預(yù)測還是一個(gè)難點(diǎn),有待進(jìn)一步研究。