張軍芳 杜鵬 房月華 張利民 趙鑫
摘 要:大數據背景下傳統(tǒng)的公交到站時間預測方法在預測精度和訓練速度方面已經不能滿足人們的期望。文章以衡水市公交運行實際數據為例,運用深度學習中的長短時記憶網絡(LSTM)和人工神經網絡(ANN)混合模型,綜合考慮運行時段、天氣狀況、道路基礎設施、是否交叉路口、是否高峰路段等因素,對公交車的到站時間進行預測研究,結果顯示混合模型在預測公交車在前一個站點的停靠時間和站間的行使時間方面均具有較高準確性。
關鍵詞:長短時記憶網絡 人工神經網絡 預測 準確性
Research on Bus Arrival Time Prediction based on Deep Learning
Zhang Junfang, Du Peng, Fang Yuehua, Zhang Limin, Zhao Xin
Abstract:Under the background of big data, the traditional bus arrival time prediction method cannot meet people's expectations in terms of prediction accuracy and training speed. Taking the actual bus operation data of Hengshui City as an example, this paper uses the hybrid model of long-term and short-term memory network(LSTM)and artificial neural network(ANN)in deep learning to predict the bus arrival time by comprehensively considering the factors such as operation time, weather conditions, road infrastructure, whether there is an intersection and whether there is a peak section. The results show that the hybrid model has high accuracy in predicting the bus stop time at the previous stop and the travel time between stops.
Key words:long-term and short-term memory network, artificial neural network, prediction, accuracy
1 引言
公交到站時間預測是智能公共交通信息服務系統(tǒng)的重要組成部分,精確的到站時間能有效緩解站臺等車乘客的焦慮情緒,讓出行者合理安排出行計劃。調查結果表明,公交乘客根據預測信息合理選擇乘車的時間,能使乘客節(jié)約63%的等待時間;而對于管理者而言,準確的到站時間信息是實現靈活調度、科學管理的前提[1]。目前城市公交公司已經將到站預測運用于公交公司的運營調度中,然而車輛的到站時間受實時的天氣、交通狀況、交通需求等諸多因素的影響,所以實時準確的公交到站時間預測既是智能公共交通服務系統(tǒng)的重點,又是公交運行管理的難點。
目前,國內的公交車輛普遍安裝了車載GPS裝置。國內上海、南京、廣州等一些大城市,在市區(qū)內的一些特殊線路候車站點上都安裝了電子停車標志,以告知乘客車輛的預計到達時間。一些互聯網公司也通過開發(fā)手機軟件來發(fā)布實時公共交通信息,比較美國的谷歌地圖,國內的高德地圖,百度地圖等,基本上都配置了公交線路實時信息查詢的功能,用戶可以登錄手機應用程序查看市區(qū)內的公交線路,公交站點與站點的地圖,以獲得車輛的到達時間[1]。
根據衡水市公交運行數據,結合公交運行與調度情況,綜合考慮衡水市公交運行時段、天氣狀況、道路基礎設施、是否交叉路口、是否高峰路段等因素,建立混合模型,預測公交運行的準時性。
2 方法介紹
研究發(fā)現,人工神經網絡(ANN)只能記憶短時期的信息,信息隨著學習量的增多或者學習周期的增長將會導致梯度消失或者梯度爆炸現的發(fā)生象[2,3]。長短時記憶網絡 (LSTM)是一種特殊的RNN網絡模型,由 Hochreiter等人[4]于1997年提出,后期被 Alex Graves進行了改進和應用[3,5],該模型可以記憶長時期的規(guī)律,并且有效避免梯度消失現象[3,4]。相對于RNN網絡模型,LSTM模型中增加了輸入門、輸出門、忘記門用于控制記憶的序列信息,如圖1所示。記憶塊中有記憶線和輸入輸出線主線,其中,記憶線時刻完成的運算為其前一時刻的記憶狀態(tài)經過忘記門狀態(tài)和輸入門狀態(tài)處理后得到該時刻記憶線輸出;輸入輸出線的運算為在時刻輸入一組新的變量值,并與前一時刻隱層輸出狀態(tài)共同通過輸出門狀態(tài)的運算后,再參考記憶線在該時刻的輸出,得到隱層的輸出結果。流程如圖2所示[3]。
3 數據處理
3.1 數據來源
本文使用的數據來自衡水市公交公司2020年9月1日至9月20日的數據,共包含5804條數據。數據結構如表1所示。
3.2 數據預處理
一般地,時間切片的最優(yōu)值為5min,所以將一天劃分為190個時間切片。在實際行車過程中,車輛可能會遇到突發(fā)事件,因此在統(tǒng)計的數據中存在一些異常數據,將時間窗的上限設置300s,下限設置為25s,從而過濾異常數據以減少噪聲干擾[6]。
3.3 公交車到站時間預測
一般地,公交車到站時間可通過下式進行預測:
式中為k第輛公交車到達目標站點的預測時間;為第k輛公交車到達前一個站點的實際時間;為第k輛公交車在前一個站點處的預測停靠時間;為第k輛公交車在前一個站點到目標站點間的預測行使時間。
公交到站時間預測可以轉化為:預測公交車在前一個站點的停靠時間和在站間的行使時間。
以衡水市實際公交數據為例,運用深度學習中的長短時記憶網絡LSTM和人工神經網絡ANN混合模型對公交車運行時段、天氣狀況、道路基礎設施、是否交叉路口、是否路段因素對公交在前一個站點的停靠時間和公交在站間的行使時間進行預測[7],結果顯示預測具有較高的精確性,結果如圖3。
4 結論
作為智能公共交通系統(tǒng)的重要組成部分,公交到站時間預測為提供實時準確的公交到站時間可以實現如下經濟社會效益:
(1)對于出行者而言,出行者可以合理的規(guī)劃出行,節(jié)省在站點的等車時間,緩解出行者等車期間的焦慮情緒;(2)對于公交企業(yè)而言,提供實時準確的公交到站時間一方面可以優(yōu)化公交調度,另一方面有利于多模式交通方式間的協調;(3)對于政府而言,可以提高公交吸引率,緩解城市交通擁堵,提升城市形象;(4)從社會效益方面而言,公交到站時間預測研究會降低公交車到站時間的預測誤差,推動公交服務類軟件的進一步應用。
基金項目:
衡水學院2020年度校級自然科學類課題(2020ZR01):基于多源公交數據和LSTM的公交到站時間預測研究。
衡水學院2020年度校級自然科學類課題(2020ZR08):高效薄膜硅-晶體硅異質結電池器件結構模擬及產業(yè)化工藝研究。
河北省教育廳資助青年基金項目自然科學類(QN2020529):基于大數據和人工智能的網絡輿情挖掘及預測研究。
參考文獻:
[1]葉之放.基于多源公交數據和LSTM的公交到站時間預測研究[D].華南理工大學,2019.
[2]FUR,ZHANG Z,LI L.Using LSTM and GRU Neural Network Methods for Traffic Flow Prediction [C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation(YAC).Wuhan:IEEE,2016:324-328.
[3]李高盛,彭玲等.基于LSTM的城市公交車站短時客流量預測研究[J].公路交通科技,2019,36(2):128-132.
[4]HOCHREITERS,SCHMIDHUBERJ.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[5] Graves A.Supervised sequence labeling with recurrent neural networks[M]. Berlin: Springer-Verlag,2012.
[6]張欣環(huán),劉宏杰等.基于時空特征向量的長短期記憶人工神經網絡的城市公交旅行時間預測[J]. 計算機應用, 2021.3 (41):875-880.
[7]張瑜.基于城市公交軌跡數據的車輛到站時間預測算法研究[D].大連海事大學,2020年.