楊鑫宇,陳隊(duì)永
1.河北科技學(xué)院汽車工程學(xué)院,河北 唐山 063200;2.石家莊鐵道大學(xué)河北省交通安全與控制重點(diǎn)實(shí)驗(yàn)室,河北 石家莊 050043;3.石家莊鐵道大學(xué)交通運(yùn)輸學(xué)院,河北 石家莊 050043
地鐵作為新型交通出行方式之一,具有快捷、準(zhǔn)時(shí)、高效等優(yōu)點(diǎn),地鐵站內(nèi)通行客流量較大,易引發(fā)客流擁堵、踩踏等安全事故。準(zhǔn)確的地鐵站客流預(yù)測對保證地鐵站內(nèi)正常的公共秩序及相關(guān)部門宏觀管控有重要意義。
馬延龍等[1]將主成分分析法與隨機(jī)森林算法結(jié)合預(yù)測廣州地鐵客流;Du等[2]采用深度非規(guī)則卷積殘差神經(jīng)網(wǎng)絡(luò)模型預(yù)測某城市地鐵站客流;梁強(qiáng)升[3]采用融合門控循環(huán)單元和圖卷積神經(jīng)網(wǎng)絡(luò)的時(shí)空神經(jīng)網(wǎng)絡(luò)模型預(yù)測2019年廣州地鐵國慶節(jié)假期7 d的客流量;曹夏玲[4]采用自回歸移動平均-支持向量機(jī)回歸組合模型預(yù)測2018年西安地鐵客流;王秋雯等[5]基于卷積長短時(shí)記憶(convolutional long short-term memory,ConvLSTM)神經(jīng)網(wǎng)絡(luò)建立地鐵換乘站客流預(yù)測模型;龍小強(qiáng)等[6]采用深度信念網(wǎng)絡(luò)-支持向量機(jī)回歸組合模型預(yù)測成都地鐵火車北站的客流量;孫曉黎等[7]采用極端梯度推進(jìn)決策樹法預(yù)測西安地鐵2號線客流;蔡昌俊[8]采用誤差融合模型預(yù)測廣州地鐵18號線的短時(shí)客流。已有文獻(xiàn)對節(jié)假日及大型活動期間的地鐵站客流預(yù)測居多,方法以單一時(shí)間序列或神經(jīng)網(wǎng)絡(luò)模型為主,此類模型參數(shù)量化有一定的偶然性與隨機(jī)性,預(yù)測準(zhǔn)確度較低,可信度較差。貝葉斯優(yōu)化算法(Bayesian optimization algorithm,BOA)[9-11]可幫助神經(jīng)網(wǎng)絡(luò)模型篩選符合要求的超參數(shù)并確定最優(yōu)值,多用于計(jì)算機(jī)仿真與經(jīng)濟(jì)學(xué)系統(tǒng)中,目前在地鐵客流預(yù)測領(lǐng)域的應(yīng)用較少。
本文針對地鐵站常態(tài)期間的客流預(yù)測問題,采用Python語言將BOA與長短時(shí)記憶(long short time memory,LSTM)神經(jīng)網(wǎng)絡(luò)相結(jié)合,構(gòu)建BOA-LSTM地鐵站客流預(yù)測模型,以石家莊地鐵1號線北國商城站為例,驗(yàn)證模型的可行性與適用性,為類似站點(diǎn)的客流預(yù)測提供參考。
Pelikan等學(xué)者于1998年提出BOA,包括概率代理模型和采集函數(shù)[12-13]。概率代理模型也稱為高斯過程(Gaussian processes,GP)模型[14],由均值函數(shù)μ(x)、協(xié)方差函數(shù)k(x,x′)組成,公式為:
F(x)~G[μ(x),k(x,x′)],
(1)
式中:F(x)為絕對誤差函數(shù),G為高斯分布,x為自變量數(shù)據(jù),x′為隨機(jī)生成變量數(shù)據(jù)。
根據(jù)歷史數(shù)據(jù),設(shè)搜尋的下一個(gè)自變量為xt+1,則協(xié)方差矩陣
(2)
GP模型中的Ft和Ft+1分別為xt、xt+1的待預(yù)測值,二者均服從聯(lián)合高斯分布N,假設(shè)其μ(x)=0,對應(yīng)的分布公式為:
(3)
通過邊緣密度函數(shù)得到Ft+1的后驗(yàn)概率
(4)

選取EI函數(shù)作為采集函數(shù)的運(yùn)算方式,公式為:
(5)
式中:f(x+)為已知目標(biāo)函數(shù)的最小值;ε(z)為概率密度函數(shù),z=(μ(x)-f(x+))/σ(x);δ(z)為分布函數(shù);σ(x)為方差函數(shù)。
EI函數(shù)需引入權(quán)衡標(biāo)量ε(ε>0),代入式(5)后得到新的EI函數(shù),公式為:
(6)
式中z=[μ(x)-f(x+)-ε]/σ(x)。
進(jìn)行后驗(yàn)分布評價(jià),后驗(yàn)概率函數(shù)
P(f|D)=P(D|f)P(f)/P(D),
(7)
式中:f為目標(biāo)集合,D為參數(shù)樣本,P(D|f)為似然函數(shù),P(f)為前驗(yàn)概率函數(shù),P(D)為邊際似然函數(shù)。

圖1 LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
LSTM神經(jīng)網(wǎng)絡(luò)為循環(huán)神經(jīng)網(wǎng)絡(luò)的改進(jìn)形式,在原有網(wǎng)絡(luò)基礎(chǔ)上加入門控單元,可篩選歷史樣本數(shù)據(jù)并保存一定時(shí)間內(nèi)的數(shù)據(jù),加入記憶與遺忘2個(gè)神經(jīng)單元,有效解決梯度消失問題[15-17]。LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
由圖1可知:LSTM神經(jīng)網(wǎng)絡(luò)由4部分構(gòu)成,輸入層輸入原始數(shù)據(jù),LSTM層解決梯度消失問題,全連接層對值域數(shù)據(jù)進(jìn)行降維處理,輸出層輸出最終結(jié)果。
LSTM層包含遺忘、輸入、輸出3個(gè)門控單元。遺忘門的輸出
ft=σ(Wf[ht-1xt]+bf),
(8)
式中:σ為Sigmoid激活函數(shù),Wf為遺忘門的權(quán)重矩陣,ht-1為短記憶t-1時(shí)刻的輸出,xt為t時(shí)刻的輸入,bf為遺忘門的偏置。
輸入門的輸出
it=σ(Wi[ht-1xt]+bi),
(9)
式中:Wi為輸入門的權(quán)重矩陣,bi為輸入門的偏置。
輸出門的輸出
ot=σ(Wo[ht-1xt]+bo),
(10)
式中:Wo為輸出門的權(quán)重矩陣,bo為輸出門的偏置。
長記憶
Ct=ftCt-1+itgt,
(11)
式中:Ct-1為t-1時(shí)刻的歷史信息;gt為新記憶,gt=tanh(Wg[ht-1xt]+bg),其中Wg為新記憶的權(quán)重矩陣,bg為新記憶的偏置,tanh為雙曲正切激活函數(shù)。
短記憶
ht=ottanh(Ct)。
(12)
通過BOA的全局尋優(yōu)能力彌補(bǔ)LSTM神經(jīng)網(wǎng)絡(luò)參數(shù)隨機(jī)性取值的短板,獲取所需最佳參數(shù)。LSTM神經(jīng)網(wǎng)絡(luò)中9個(gè)超參數(shù)如表1所示[18]。

表1 LSTM神經(jīng)網(wǎng)絡(luò)中的超參數(shù)
根據(jù)模型及參數(shù)特點(diǎn),優(yōu)化數(shù)據(jù)處理的批次和棄權(quán)系數(shù),計(jì)算得到數(shù)據(jù)處理的最優(yōu)批次為100,最優(yōu)棄權(quán)系數(shù)為0.5,其他參數(shù)依據(jù)數(shù)據(jù)變化特征賦值。采用平均絕對誤差(mean absolute error,MAE)EMAE、平均絕對百分比誤差(mean absolute percentage error,MAPE)EMAPE、均方誤差(mean square error,MSE)EMSE、均方根誤差(root mean square error,RMSE)ERMSE作為目標(biāo)函數(shù),評價(jià)模型的預(yù)測性能,公式分別為:
(13)
(14)
(15)
(16)
式中:xi為實(shí)際值,xi′為預(yù)測值,n為樣本總數(shù)。

圖2 BOA-LSTM模型結(jié)合流程
BOA-LSTM模型結(jié)合的核心是超參數(shù)優(yōu)化,類似于求解黑盒問題,主要包括選定超參數(shù)集、構(gòu)建目標(biāo)函數(shù)、實(shí)時(shí)優(yōu)化和輸出最優(yōu)參數(shù)4部分。采用樹狀結(jié)構(gòu)(tree-structured parzen estimator,TPE)的BOA建立超參數(shù)組合與目標(biāo)函數(shù)間的黑盒,尋找使目標(biāo)函數(shù)g(x)最小化的超參數(shù),最優(yōu)參數(shù)集
x*=argming(x)。
(17)
優(yōu)化過程中存在誤差,為最大程度降低誤差影響,采用最小二乘法擬合校正輸出參數(shù)Fi,經(jīng)誤差校正后的參數(shù)
Fi′=Fi+g′(x)-F1,
(18)
式中:F1為擬合曲線第1個(gè)點(diǎn)的參數(shù),g(x′)為擬合校正后的目標(biāo)函數(shù)。
判斷模型是否滿足初始化要求,若滿足,代入式(1)~(4)的高斯模型中,反之,產(chǎn)生初始樣本點(diǎn),通過高斯模型的μ(x)和k(x,x′)進(jìn)行修正;根據(jù)式(5)~(7)的采集函數(shù)篩選數(shù)據(jù),將過濾后的集合代入式(8)~(12)的LSTM神經(jīng)網(wǎng)絡(luò)中,采用式(17)(18)對式(13)~(16)的目標(biāo)函數(shù)進(jìn)行迭代更新,直至滿足LSTM神經(jīng)網(wǎng)絡(luò)超參數(shù)輸出要求。BOA-LSTM模型結(jié)合流程如圖2所示。
收集石家莊地鐵1號線北國商城站2021-07-05—2021-08-29每日07:00—22:30的進(jìn)出站客流數(shù)據(jù),如圖3所示。

圖3 石家莊地鐵1號線北國商城站進(jìn)、出站客流量
由圖3可知:地鐵1號線北國商城站的進(jìn)、出站客流量變化趨勢基本相同,有明顯的波動性;受新線開通影響,進(jìn)站客流量小于出站客流量;最小客流量出現(xiàn)在8月初,最大客流量出現(xiàn)在7月初。將客流量劃分為多個(gè)區(qū)間,采用BOA-LSTM模型對規(guī)律性較強(qiáng)的某區(qū)間進(jìn)行客流預(yù)測。
匯總收集的客流量數(shù)據(jù),得到約296萬條數(shù)據(jù),進(jìn)、出站客流的檢票方式以城市軌道交通微信小程序掃碼、人工刷卡為主。自助檢票系統(tǒng)數(shù)據(jù)信息主要包括:刷卡/掃碼時(shí)間、線路編號(A為1號線、B為2號線、C為3號線)、站點(diǎn)編號(北國商城站編號為9)、設(shè)備編號、刷卡/掃碼狀態(tài)(0為出站,1為進(jìn)站,2為換乘)、用戶代碼、刷卡/掃碼類型(1為公交一卡通,2為儲值卡,3為學(xué)生卡,4為單程卡,5為紀(jì)念計(jì)次卡,6為職工卡,7為微信小程序掃碼)。
已獲取的客流數(shù)據(jù)中存在部分不完整和重復(fù)序列,采用軟件Python中的第三方擴(kuò)展庫Numpy、Pandas處理數(shù)據(jù)序列,剔除樣本數(shù)據(jù)中的缺失項(xiàng)和重復(fù)項(xiàng),保留數(shù)據(jù)信息中的刷卡時(shí)間、站點(diǎn)編號、刷卡狀態(tài)、用戶代碼,以30 min為單位將每日客流量劃分為31個(gè)時(shí)間片段,篩選編號為9的進(jìn)、出站客流數(shù)據(jù),以“.csv”格式保存文件。
歸一化是指采用機(jī)器學(xué)習(xí)算法將初始數(shù)據(jù)同比例縮小再放大的過程[19]。采用標(biāo)準(zhǔn)化方法進(jìn)行數(shù)據(jù)歸一化,歸一化客流量數(shù)據(jù)

BOA-LSTM客流預(yù)測模型主要包括超參數(shù)優(yōu)化、LSTM神經(jīng)網(wǎng)絡(luò)訓(xùn)練及客流預(yù)測3部分,預(yù)測流程如圖4所示。

圖4 BOA-LSTM模型預(yù)測客流過程
創(chuàng)建初始參數(shù)集,根據(jù)概率代理模型和采集函數(shù)修正參數(shù)集,將結(jié)果代入LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行迭代,直至滿足目標(biāo)函數(shù)要求,將輸出結(jié)果代入BOA-LSTM客流預(yù)測模型,預(yù)測目標(biāo)站點(diǎn)的客流量。
4.4.1 可行性驗(yàn)證
為驗(yàn)證預(yù)測模型的可行性,分別采用自回歸移動平均(autoregressive integrated moving average,ARIMA)模型、LSTM神經(jīng)網(wǎng)絡(luò)與BOA-LSTM客流預(yù)測模型預(yù)測工作日與自然日的地鐵站客流量,以2021-07-05—2021-07-09的進(jìn)站客流量為工作日的訓(xùn)練集,以2021-07-26的進(jìn)站客流量為工作日的測試集,以2021-07-10—2021-07-11的進(jìn)站客流量為自然日的訓(xùn)練集,以2021-07-31的進(jìn)站客流量為自然日的測試集。ARIMA模型、LSTM神經(jīng)網(wǎng)絡(luò)與BOA-LSTM模型的進(jìn)站客流量預(yù)測結(jié)果如圖5所示。由圖5可知:與ARIMA模型、LSTM神經(jīng)網(wǎng)絡(luò)相比,BOA-LSTM模型的預(yù)測結(jié)果與實(shí)際進(jìn)站客流量的偏差較小。3種模型的進(jìn)站客流量預(yù)測結(jié)果誤差如表2所示。

a)工作日 b)自然日 圖5 不同模型的進(jìn)站客流量預(yù)測結(jié)果
由表2可知:BOA-LSTM模型預(yù)測結(jié)果的4類誤差均最小,LSTM神經(jīng)網(wǎng)絡(luò)的誤差較大,ARIMA模型的誤差最大,說明BOA-LSTM模型在實(shí)際地鐵客流預(yù)測中具有可行性,且預(yù)測準(zhǔn)確度較高。
4.4.2 適用性驗(yàn)證
驗(yàn)證BOA-LSTM客流預(yù)測模型的適用性。以2021-07-05—2021-07-09的出站客流量為工作日的訓(xùn)練集,以2021-07-12、2021-07-19、2021-07-26、2021-08-02、2021-08-09、2021-08-16、2021-08-23、2021-08-30的出站客流量為工作日的測試集;以2021-07-10—2021-07-11的出站客流量為自然日的訓(xùn)練集,以2021-07-17、2021-07-24、2021-07-31、2021-08-07、2021-08-14、2021-08-21、2021-08-28的出站客流量為自然日的測試集,BOA-LSTM模型的出站客流量預(yù)測結(jié)果如圖6所示。

a)工作日 b)自然日 圖6 BOA-LSTM模型的出站客流量預(yù)測結(jié)果
由圖6可知:BOA-LSTM模型的預(yù)測結(jié)果與實(shí)際出站客流量基本吻合,預(yù)測客流量數(shù)據(jù)擬合效果較好,周期規(guī)律明顯,都有7個(gè)波峰,最大日客流量均出現(xiàn)在08:30—09:00。
分別計(jì)算工作日與自然日時(shí)BOA-LSTM模型出站客流量預(yù)測結(jié)果誤差如表3、4所示。

表4 自然日時(shí)BOA-LSTM模型預(yù)測結(jié)果誤差
由表3、4可知:預(yù)測出站客流量與實(shí)際出站客流量的4類誤差均隨時(shí)間的延長而逐漸增大,但變化范圍均未超出可接受范圍[20],結(jié)合表3、4中日期推算BOA-LSTM客流預(yù)測模型的適用期為1~2個(gè)月。
為預(yù)測常態(tài)期間地鐵站客流量,基于BOA優(yōu)化LSTM神經(jīng)網(wǎng)絡(luò)的參數(shù),提出BOA-LSTM地鐵站客流預(yù)測模型,以石家莊地鐵1號線北國商城站2021-07-01—2021-08-31的進(jìn)、出站客流為例,驗(yàn)證模型的可行性與適用性。
1)采用第三方擴(kuò)庫NumPy和Pandas對石家莊地鐵1號線北國商城站的自動售檢票系統(tǒng)刷卡數(shù)據(jù)進(jìn)行集成、歸一等處理,顯示該站7、8月的進(jìn)、出站客流整體較高。
2)根據(jù)BOA計(jì)算LSTM神經(jīng)網(wǎng)絡(luò)的最優(yōu)超參數(shù),分別采用ARIMA模型、LSTM神經(jīng)網(wǎng)絡(luò)、BOA-LSTM模型預(yù)測北國商城站的客流,結(jié)果表明:BOA-LSTM模型的預(yù)測客流量與實(shí)際客流量的誤差最小,預(yù)測準(zhǔn)確度較高,適用期為1~2個(gè)月。