張 陽 胡 月 陳德旺 陳云飛
(福建工程學院交通運輸學院1) 福州 350118) (福州大學計算機與大數據學院2) 福州 350118) (福建工程學院電子電氣與物理學院3) 福州 350118)
道路交通流的變化是一個實時性、非線性及非平穩性的隨機過程.采樣間隔時間越短,交通流變化的隨機性和不確定性越強,越難以準確分析其變化規律[1].
目前,城市道路的短時交通流預測方法包括傳統方法和機器學習方法.傳統方法主要利用時間序列預測短時交通流,如卡爾曼濾波模型(KF)、自回歸移動平均(ARIMA)模型、多元線性回歸模型等.Kumar等[2]將短期交通流預測與季節性ARIMA模型相結合,并通過有限的數據來使用ARIMA模型預測交通流.Kumar等[3]提出了一種只需有限的數據即可進行交通流量預測的方法,即基于卡爾曼濾波模型來解決依賴大量數據進行開發的不足.
常用的機器學習模型通過自適應學習不斷調整自身參數來捕捉復雜的非線性關系,如支持向量回歸(SVR)、K近鄰(KNN)等.雖然這些模型可以解決傳統方法性能差的問題,但追求高精度容易導致模型訓練時間成本大、數據樣本要求過高[4].李林超等[5]提出一種基于核函數切換的預測方法,根據不同時刻的核函數的SVR模型在處理交通流時的差異性,在不同時刻選擇最合適的核函數進行短時交通流量預測.Cai 等[6]在考慮道路網絡時空關聯性的前提下,提出使用高斯加權方法,來增強KNN模型的預測精度.
深度學習是近年來機器學習領域中的主要研究方向,包括循環神經網絡(recurrent neural networks,RNN)、長短時記憶網絡(long short-term memory,LSTM)等深度學習模型.這些模型雖然能有效地學習交通流序列的長期相關性以及捕捉復雜的時間特征,但對于交通路網的空間性這一特性鮮有考慮,因此難以解決路網間的交通流預測問題.Bruna等[7]提出使用圖卷積網絡(graph convolutional network,GCN)來解決道路網絡空間相關性問題,通過利用圖形結構信息提取道路網絡拓撲結構,再處理圖結構中的不規則數據來實現交通預測.Xie 等[8]提出了一種新的基于RNN-GCN和BRB的交通流預測方法.Wu等[9]用GCN提取交通數據中的拓撲結構特征,使用LSTM結構提取時間特征,結合ResNet優化整體模型,減少網絡退化中梯度消失或爆炸的發生,最終實現交通流預測.張陽等[10]利用長短時記憶神經元提取時間關聯性,并利用卷積傳輸提取空間關聯性,從而對交通流進行預測.
由于現有的交通預測模型很少從路網的角度考慮,只是單純的從單一道路的角度考慮,沒有將路網拓撲結構融入預測模型中,預測精度有待提高.文中在以往預測模型的基礎上,通過提取道路路網拓撲結構,考慮路網路段交通狀態和交通流時空相關性,以此來實現短時交通流預測,并以實例驗證了模型的預測精度.
交通流預測的準確度得益于鄰近交通信息和時間信息的使用[11].用圖卷積網絡可以通過捕捉交通數據空間相關性來預測路網交通流,進而提高交通流預測的精度.
假設有一批N個節點的圖數據,構成N*D矩陣X,然后節點間形成N*N矩陣A,車流特征矩陣X和鄰接矩陣A為圖卷積模型的輸入,中間層和中間層之間的傳播模式為
(1)
圖1 圖卷積神經網絡結構圖
(2)
(3)
式中:Aij為節點i和節點j之間的連接關系.
在LSTM體系結構中,遺忘門、輸入門和輸出門這三種特殊的結構賦予了其處理短期和長期時間序列內相關性的能力[12].遺忘門丟棄原單元狀態中的信息,輸入門存儲來自外部狀態的信息用來更新單元狀態,輸出門得到所有結果,計算并生成LSTM結構的輸出.
遺忘門取xt和ht-1作為輸入信息,利用sigmoid激活函數丟棄信息,為
ft=σ(Wf[ht-1,xt]+bf)
(4)
it=σ(Wt[ht-1,xt]+bi)
(5)
(6)
(7)
結合當前記憶Ct和長期記憶Ct-1,形成新的細胞狀態Ct.
輸出門產生ht的最終輸出.整個過程分為兩個階段,為
ot=σ(Wo[ht-1,xt]+bo)
(8)
ht=ot×tanh(Ct)
(9)
式中:tanh函數為雙曲正切激活函數;σ為Sigmoid函數;Wf,Wt,Wo,Wc為遺忘門、輸入門、輸出門和記憶單元的權重系數矩陣;bf,bt,bo,bc分別為遺忘門、輸入門、輸出門和記憶單元的偏置條件.
本文使用雙向LSTM模型來提取交通流數據的時間周期特征.雙向LSTM的組成是由前向LSTM和反向LSTM疊加,從當前節點的正向和反向兩個角度分析交通數據的時間周期性,它不僅可以捕獲未來數據的信息特征,而且可以捕獲過去數據的信息特征.所以在發現重復出現的交通模式,以及在處理數據時比單向LSTM效果更好.使預測結果更加準確.雙向LSTM網絡結構見圖2.
圖2 雙向LSTM網絡結構圖
定義G=(V,E)為交通道路網絡的拓撲結構.每條道路都被視為一個節點,V為一組道路節點,E為邊集,鄰接矩陣A為道路之間的連接,特征矩陣X為網絡中節點的屬性.因此,交通流預測的時空問題可以看作是路網拓撲結構G和特征X通過一系列變換得到的映射函數f(本文中f表示GCN-BiLSTM模型).即:
Xt=f(G;(Xt-n,…,Xt))
(10)
GCN-BiLSTM模型由圖卷積神經網絡和雙向長短時記憶網絡這兩部分組成.本次研究將長度為n的時間序列數據輸入模型,利用GCN結構解析道路網絡監測流量的拓撲結構,提取交通流量的空間特征;將具備空間特征的時間序列數據輸入BiLSTM中來學習時間特征,通過線性回歸層得到預測數據,見圖3.
圖3 GCN-BiLSTM模型體系
本文利用地感線圈、浮動車等采集的交通流量、速度等數據,實現基于GCN-BiLSTM的短時交通流預測.該方法主要實現步驟如下.
步驟1采集預測目標路段的歷史交通流流量和速度等數據,路網區域內其他路段與目標路段之間的距離以及路網區域內其他路段的歷史交通流流量和速度數據.并對采集的數據進行分析和預處理.
步驟2設定GCN模型的結構和參數,將數據集轉換成拓撲圖結構的形式,作為GCN模型的數據輸入.設定BiLSTM模型的參數,確立輸入層、隱含層和輸出層等網絡結構.
步驟3構建基于GCN-BiLSTM的短時交通流預測模型,設置卷積層、池化層、全連接層等顯隱層結構,各層神經元利用LSTM模型構建,初步設定顯隱層節點數、隱層層數等參數指標.
步驟4選取預測區域內路段的交通流量數據作為訓練集和測試集.利用訓練集訓練短時交通流預測模型,再用測試集測試訓練好的模型.
步驟5將預測結果和真實值進行分析,檢查預測精度是否達到預期目標,如達到則輸出預測結果,若未達標則返回步驟2,對模型結構參數指標進行重置,直至精度達標.
本次實驗研究范圍為福州市晉安區,道路網絡由福新路、福新中路、五一北路、五一中路、國貨西路、國貨東路、連江北路、福馬路和古田路等道路構成,具有圖結構的區域相關性圖見圖4.本實驗以福馬路某斷面為預測對象,研究范圍內的其他道路為區域內的空間相關道路.
圖4 研究對象路網結構示意圖
實驗隨機采集福馬路2019年11月4—18日共14 d的交通流時間序列數據,以5 min為時間步長,每天可劃分為288個時間段,共有4 032個數據樣本.考慮到周一至周五工作日的交通特性與周末的交通特性有一定的差異,分別對工作日和周末的不同時間段進行交通預測,全面驗證算法性能.故選取前14 d中的工作日和周末這兩個時間段為兩個訓練樣本集.
為了定量分析 GCN-BiLSTM模型性能,引入三種常用的性能指標來比較流量預測模型.
均方根誤差(RMSE):
(11)
平均絕對誤差(MAE):
(12)
平均絕對百分比誤差(MAPE):
(13)
將本文提出的GCN-BiLSTM與其他算法的短時預測效果進行比較,利用性能指標對預測結構進行評估.預測結果見圖5和表1~2.
表1 GCN-BiLSTM模型和其他基準模型在工作日預測結果對比
表2 GCN-BiLSTM模型和其他基準模型在周末預測結果對比
圖5 工作日及周末預測結果對比
將GCN-BiLSTM模型的預測性能與以下2個基準模型進行比較:①DCRNN 擴散卷積遞歸神經網絡,提出交通流建模為向上的擴散卷積,將交通流的空間和時間結合起來,預測未來時刻的交通數據.②T-GCN 時間圖卷積網絡,該模型通過使用GCN和GRU相結合的方法來同時捕捉空間和時間的依賴關系,進行交通速度預測.
本文提出的短時交通流預測算法的主要參數設置如下:使用AdamOptimizer自動優化,設置初始學習率為0.001,設置批量大小為32,設置訓練次數為1 000.圖卷積核設為2.
當GCN圖卷積層數設置為2,BiLSTM層數設置為4時,模型的預測效果最好.選擇兩個圖的卷積層,加上四個BiLSTM和一個全連接層的組合模型進行預測.交通流數據具有一定的周期性和規律性,周末與工作日的交通流所表現的數據特性差異性較大.分別對工作日和周末進行交通流預測,將1 h設置為一個時間周期,使用過去1 h的歷史數據來預測后15 min的交通流數據,并與測試集中的真實值進行比較.
由圖5和表1~2可知:本文提出的GCN-BiLSTM模型在工作日和周末預測效果均優于其他兩種經典的預測算法.相較于DCRNN,工作日與周末RMSE指標分別少了12.24%和13.20%,MAE指標少了9.31%和9.39%,MAPE指標減少了3.81%和5.96%.由實驗結果表明,GCN-BiLSTM在捕獲時空相關性方面效果更好.將GCN-BiLSTM和T-GCN這個預測模型進行比較,GCN-BiLSTM和T-GCN這兩個模型都利用了圖卷積的方法從交通數據中提取空間相關性特征.相較于T-GCN,對于工作日與周末的預測結果,其中RMSE指標分別減少了5.87%和2.68%.MAE指標分別減少了5.32%和5.50%.MAPE指標分別減少了0.57%和5.07%.在數據集上的15 min交通流預測任務中,GCN-BiLSTM的預測準確率高于T-GCN.該實驗結果表明了GCN-BiLSTM模型在挖掘交通信息的時空相關性特征方面具有優勢.
本文提出了一種基于GCN-BiLSTM的城市道路網絡預測交通流模型.該模型通過建立觀測點鄰接矩陣,利用GCN和BiLSTM分別捕捉道路交通流數據的時間特征和空間特征.結果表明:GCN-BiLSTM組合模型具有較高的預測精度,預測的交通流數據相比與另外兩個模型與真實交通流數據保持了較高的一致性,是一種實用的短時交通流預測模型.后續研究將考慮天氣、事故等外部因素對交通流量的影響,進一步提高模型的預測精度.