李明明,雷菊陽,趙從健
(上海工程技術大學 機械與汽車工程學院,上海 201620)
智能交通系統[1]的發展為緩解道路擁堵、提高交通服務水平提供了新的手段和方法,而交通流的預測是城市智能交通管控系統的重要基礎.通過對當前交通網絡流量變化的特征提取,準確合理地推測出未來一小段時間的交通分布,可有效地指導交通出行,最大限度提升交通路網的通行能力,為人們達到節約出行時間、減少交通事故的目的.
道路交通系統是一個有人參與的、時變的、復雜的非線性大系統,具有高度的不確定性.在過去的幾十年中,各位專家學者提出了許多數據分析模型來解決短期交通預測,包括歷史平均和平滑,統計和回歸方法,基于交通流理論的方法和機器學習技術等[2,3].Kumar[4]等人應用人工神經網絡研究短時交通流預測.Wang[5]等人提出一種改進貝葉斯組合模型預測公路交通流量.Xie[6]等人提出一種用于短時交通流量預測的小波網絡模型.LSTM最初由 Hochreiter和Schmidhuber (1997)引入[7],LSTM的主要目標是模擬長期依賴性并確定時間序列問題的最佳時滯[8].
短時交通流量預測具有高度的非線性和不確定性的特點,且同時間的相關性較強,由于傳統的線性模型難以解決多變量或多輸入問題,而神經網絡如LSTM則擅長于處理多個變量的問題,該特性使其有助于解決時間序列預測問題[9].本文采用了長短時記憶神經網絡預測模型(LSTM)和BP神經網絡結合的LSTM-BP組合模型算法,該模型比單一模型能更好地提取交通流數據長時間依賴關系的特征,能把前次輸入的特征產生影響量化后與當前時間輸入的內容一起反映到網絡中去參與訓練,又具有BP神經網絡模型較強的非線性映射能力和泛化能力,提高了數據的使用范圍.
傳統RNN隨著時間間隔的增加,容易出現梯度爆炸或梯度彌散,為解決這一問題,提出了長短時記憶神經網絡(LSTM).LSTM[10,11]采用了門限機制來控制信息的累計速度,并可以選擇性的遺忘之前的累計信息.該模型主要包括輸入門i、輸出門o、遺忘門f和細胞更新狀態c.輸入門決定更新哪些信息到細胞狀態中;輸出門決定細胞狀態中將要輸出哪些信息;遺忘門決定細胞狀態中要忘記哪些信息.這3個門是控制信息流的關鍵,進而解決梯度消失的問題.LSTM模型的控制特點使其能夠長時間的記憶歷史數據的狀態及自動匹配最佳的時間間隔.
LSTM的基本儲存單元架構如圖1所示.

圖1 LSTM儲存單元基本架構
圖1中,xt、yt分別為輸入序列和輸出序列,it,ot,ft分別是t時刻的輸入門,輸出門和遺忘門,∫為激活函數.其整個存儲單元計算過程可以用如下公式表示:

式中,it,ot,ft分別是時刻t的輸入門,輸出門和遺忘門,ct是t時刻的存儲單元的計算公式,ht是t時刻LSTM單元的所有輸出.σ和tanh分別代表Sigmoid和雙曲線正切函數.w和b表示相應的權重系數矩陣和偏置.
城市道路網的某段路中,當下時間段的交通流量與前幾個時間段的交通流量有關,且具有24小時內準周期的特性.在交通流的預測中,不考慮交叉路口,突發情況的影響,假設交通流呈現連續流狀態,定義Δt為統計交通流數據的時間間隔,xt為第t個時間間隔中該路段的交通流量,觀測到數據總數為T,交通流序列可表示為:

預測模型輸入輸出序列分別表示為:

式中,Xi=(xi?3Δt,xi?2Δt,xi?Δt,xi),Yi=(xi+Δt,xi+2Δt,xi+3Δt),i=4,5,…,T.輸入序列經過LSTM預測模型,用連續的4個時間段數據預測未來3個時間段的交通流量.
根據交通流預測模型的預測過程,實驗采集4天的交通流量數據,時間間隔 Δt=15 min觀測到的每天數據總數T=96個.為驗證LSTM算法的有效性,用前3天288個數據對網絡預測模型進行訓練,用第4天的92個數據來對預測模型進行測試.
LSTM網絡模型:輸入層為4個神經元,隱層LSTM結構單元設定為20,輸出層為3個神經元.最大迭代次數為1000,當誤差小于10-5時,跳出循環.
BP網絡模型:輸入層為5個單元,輸出層為1,通過不斷調整參數試錯法,確定BP 神經網絡的隱層數為3層,學習系數為0.1,誤差控制率為0.001,最大訓練次數為1000次.
基于LSTM-BP算法,構建了交通流預測模型,其流程圖如圖2所示.主要包括:

圖2 LSTM-BP交通流預測流程圖
(1)數據獲取和對數據進行歸一化預處理,并劃分為訓練集和測試集;
(2)訓練LSTM模型,初始化預測模型的參數.將訓練樣本數據集輸入模型,多次訓練,反復迭代,求出使MAPE最小的模型參數,直至達到預設的目標準確率,構建出LSTM預測模型.
(3)訓練BP模型,將訓練集的連續五個時刻(xi?Δt,xi,xi+Δt,xi+2Δt,xi+3Δt),i=4,5,···,T交通流數據作為輸入,xi+Δt時刻的數據作為輸出,對BP網絡模型進行訓練,直到達到預設的準確率,保存訓練后的參數.
(4)用測試集數據輸入訓練好的LSTM-BP模型中,對模型輸出的數據反歸一化,將數據仿真結果與已知的樣本進行對比.
文中采用的交通流數據來自于美國University of Minnesota Data Research Laboratory (TDRL)[12],該實驗室提供了美國Minnesota的St.paul和Minneapolis之間公路路網的交通流量和占用率數據.以2018年8月6日到 9日期間的第100號探測器采集的時間間隔為15 min的交通流數據進行分析.交通流原始數據如圖3所示,交通流數據本身是一種非平穩隨機序列,但在連續的時間序列上表現出一定的規律性,并且具有明顯的趨勢向.

圖3 TDRL的15 min原始交通流數據
在采集數據時,由于設備故障、網絡不佳、惡劣環境以及人為因素等影響,傳感器采集所得的原始數據難免出現數據缺失、數據異常等情況.這些“臟數據”會導致數據處理成本和相應時間的增加[13].
此外,數據都要進行歸一化處理,把車輛流的特征量化在[-1,1]區間內,消除數據的單位限制和范圍較大的特征值所帶來的影響,從而提高模型訓練的精度和收斂的速度.
數據預處理中,可采用式(9)線性插值的方法對數據缺失進行修復處理.并采用式(10)對數據進行歸一化處理.

式中,xa+i為a+i時刻缺失的數據,xa、xa+i分別為a和a+j時刻原始數據值;xi是原始數據歸一化后的數據,xmax、xmin為原始數據中的最大值和最小值.ymax、ymin在此為默認數據,分別為-1和1.
本文模型的目標是預測下一時刻交通流量,為能更好地分析預測效果,采用3個常見的評價指標[14]:絕對平均誤差(MAE)、平均絕對百分比誤差(MAPE)和均方根誤差(RMSE).RMSE用來衡量觀測值同真值之間的偏差.

將短時交通流預測結果與原始流量數據進行比較,然后比較不同方法的性能,以驗證所提出的LSTMBP組合網絡模型預測的準確性.
從圖4可以分析出LSTM-BP組合模型的預測結果與實際交通流數據誤差在一個小范圍內,基本反映了交通流隨時間變化的規律,模型在一定程度上可近似擬合真實交通流的變化趨勢,預測結果與原始數據接近,MAPE為14.75%.圖5展示了高峰時間段的真實值與預測值絕對百分比誤差,圖中大部分時間的絕對百分比誤差處在一個較低的水平值(小于0.4%),故LSTMBP組合模型在高峰時段,百分比誤差較小,交通流數據吻合度高,能夠達到較好的預測效果.

圖4 預測值與真實值對比圖

圖5 不同預測時間點的絕對百分比誤差圖
為了驗證所提出的LSTM-BP網絡的預測準確度,再分別用LSTM模型,小波神經網絡(WNN)[15]和傳統的BP神經網絡進行訓練,將預測的結果進行比較.
根據式(11)、式(12)和式(13)分別計算出3種模型的MAE,MAPE和RMSE結果,如表1所示.從圖6和表1可以直觀的看出LSTM-BP組合模型具有較小的MAE,MAPE和RMSE.LSTM-BP組合模型和WNN評價指標數據差別很小,但LSTM-BP組合模型具有更小的平均絕對百分比誤差(MAPE).從圖6可看出LSTMBP組合模型對時間序列的預測性能和數據的泛化能力都優于單一的LSTM模型和BP神經網絡模型,故LSTM-BP組合模型可作為一種有效的短時交通流量預測模型.預測模型MAE評價指標MAPE(%)RMSELSTM-BP 18.95 14.75 39.18 LSTM 23.30 19.19 46.48 BP 22.96 20.26 44.21 WNN 19.40 18.62 38.18

圖6 不同模型預測情況對比圖
在實際預測模型中,每次預測的值都在變動,這是由于LSTM模型和BP神經網絡模型的初始參數的隨機生成,每次由梯度下降法得到的權值參數都有變化,造成預測結果不同,但是變動都在較小的范圍內波動.
(1)本文設計了基于LSTM-BP組合算法,并建立短期交通流時間序列分析及預測的模型框架,借助Matlab完成從數據處理和模型程序的構建,實現了基于LSTM-BP組合模型的短時交通流的精確預測.
(2)通過與3種不同類型的預測網絡模型(即LSTM,BP和WNN)進行比較,表明LSTM-BP組合模型在預測短時交通流具有較高的精度和穩定性.
(3)該模型的搭建,可對交通分布的預測、交通方式的劃分、實時交通流的分配提供依據和參考.
(4)為進一步提高模型的準確度,需增加訓練的實驗數據,改進算法設計,使模型有更好的準確性和泛化能力.本文只是對單一的路口進行預測,接下來要研究不同路口之間的關聯性,進而對整個復雜的路網系統做出預測,提升整個智能交通系統的實用性.