




摘 要:交通流預測在交通管理和城市規劃的應用中具有重要意義,然而現有的預測方法無法充分挖掘其潛在的復雜時空相關性,為進一步挖掘路網道路網絡數據的時空特性以提高預測精度,提出一種多時空圖卷積網絡(multi-spatial-temporal graph convolutional network,MST-GCN)模型。首先,利用切比雪夫圖卷積(ChebNet)結合門控循環單元(GRU)構建時空組件以深度挖掘節點的時空相關性;其次,分別提取周相關、日相關、鄰近時間的序列數據,輸入三個時空組件以深度挖掘不同時間窗口間的時間相關性;最后,將時空組件與編碼器—解碼器網絡結構(encoder-decoder)融合組建MST-GCN模型。利用加利福尼亞州交通局(Caltrans)性能評估系統中高速公路數據集PEMS04和PEMS08進行實驗,結果表明新模型的性能明顯優于門控循環單元模型和最近提出的擴散卷積循環神經網絡(DCRNN)、時間圖卷積網絡(T-GCN)、基于注意力機制的時空圖卷積神經網絡(ASTGCN)和時空同步圖卷積網絡(STSGCN)模型。
關鍵詞:交通流預測; 時空相關性; 編碼器—解碼器; 切比雪夫多項式; 圖卷積網絡
中圖分類號:TP18;U491.1 文獻標志碼:A
文章編號:1001-3695(2022)03-023-0780-05
doi:10.19734/j.issn.1001-3695.2021.08.0361
基金項目:國家自然科學基金資助項目(61771265);江蘇高校“青藍工程”項目;南通市科技計劃項目(MS22021034,JC2021198);南通市“226”科研項目(131320633045);南通大學信息科學技術學院研究生科研與實踐創新計劃項目(NTUSISTPR21-007)
作者簡介:戴俊明(1998-),男,江蘇揚州人,碩士研究生,主要研究方向為智能信息處理;曹陽(1986-),男,江蘇如皋人,教授,博導,博士,主要研究方向為科學計算、智能信息處理;沈琴琴(1984-),女,江蘇如皋人,高級實驗師,博士,主要研究方向為智能交通;施佺(1973-),男(通信作者),江蘇海門人,教授,博導,博士,主要研究方向為智能信息處理(sq@ntu.edu.cn).
Traffic flow prediction based on multi-spatial-temporal graph convolutional network
Dai Junminga, Cao Yanga,b, Shen Qinqinb, Shi Quana,b?
(a.College of Information Science amp; Technology, b.College of Transportation amp; Civil Engineering, Nantong University, Nantong Jiangsu 226019, China)
Abstract:Traffic flow forecasting is of great significance in the application of traffic management and urban planning. However, the existing forecasting methods cannot fully exploit the potential complex spatio-temporal correlations. In order to further explore the temporal and spatial characteristics of road network data to improve the prediction accuracy, this paper proposed an multi-spatial-temporal graph convolutional network (MST-GCN) model. Firstly, by using Chebyshev graph convolution (ChebNet) combined with gated recurrent unit (GRU) to construct spatio-temporal components to deeply mine the spatio-temporal correlation of nodes. Secondly, it extracted weekly, daily, and recent time sequence data separately, and entered three spatio-temporal components to deeply explore the time correlation between different time windows. Finally, it combined the spatio-temporal component and the encoder-decoder network structure to form the MST-GCN model. Experiments were conducted using the highway datasets PEMS04 and PEMS08 in the California Department of Transportation (Caltrans) performance evaluation system. The results show that the new model has significantly better performance than the gated recurrent unit model and the recently proposed diffusion convolutional recurrent neural network (DCRNN), temporal graph convolutional network (T-GCN), attention based spatial-temporal graph convolutional networks (ASTGCN) and spatial-temporal synchronous graph convolutional network (STSGCN) models.
Key words:traffic flow prediction; spatio-temporal correlation; encoder-decoder; Chebyshev polynomial; graph convolutional network (GCN)
0 引言
隨著智能交通系統的快速發展,越來越多的學者關注交通流預測。交通流預測問題是根據城市路網或高速公路的道路交通現狀進行建模,以預測未來一段時間內的交通狀況,準確有效的預測能夠幫助交通管理部門更合理地引導車輛,達到緩解交通擁堵,提高道路通行效率的目的[1]。
現有的交通流預測方法主要分為模型驅動和數據驅動兩類方法。模型驅動方法又稱為參數方法,主要的代表模型有差分自回歸移動平均模型[2]、卡爾曼濾波模型[3]、灰色預測模型[4]等,這類模型通常具有嚴格的假設條件和固定的算法結構,然而交通流容易受到隨機干擾因素(如交通事故、天氣、出行者行為等)的影響,不確定性較強,參數方法無法挖掘交通流的非線性特征,導致預測精確度普遍較低。數據驅動方法又分為傳統機器學習方法和深度學習方法。前者的典型代表有支持向量機[5]、K近鄰[6]、貝葉斯網絡[7]等。后者主要為人工神經網絡及其各類變種[8],這類模型具有較強的非線性映射能力,對數據的要求沒有模型驅動方法嚴格,因此能夠較好地適應交通流的不確定性,有效地提高預測效果。
近年來,為了全面挖掘交通流特征,混合神經網絡逐漸成為主流網絡結構。大多數研究基于循環神經網絡的變種(long short-term memory,LSTM[9]和gated recurrent unit,GRU[10])與其他模型組合進行預測,取得了較好的預測性能。谷遠利等人[11]引入基于熵的灰色關聯分析方法來捕獲路段間的空間特征,提出一種新的深度學習模型,對車道級的交通速度進行預測;Lin等人[12]結合自注意力機制和卷積長短期記憶網絡,提出一種新的自注意力記憶網絡來捕捉空間和時間域方面的特征;包銀鑫等人[13]結合時空殘差模型和卷積神經網絡,對交通柵格數據進行相關性分析,并融合LSTM捕獲周期性和鄰近性的長期時間特征。
盡管當前交通流量預測已存在較多有效的方法,然而捕捉交通流的時空相關性,提高模型的預測性能仍然是一個具有挑戰性的問題?,F有的預測方法無法充分挖掘時空相關性主要存在以下兩個原因:
a) 觀察點的位置分布一般為不規則圖狀拓撲結構,普通方法難以充分利用數據內部有效的空間信息,無法完全捕獲道路之間高階鄰居的微弱信息擾動。
b) 不同時期的歷史數據對未來不同時間的交通流量有不同的影響,在時間維度上表現出很強的動態性。
由于觀察點的空間結構是非結構化的,無法利用常規的卷積神經網絡提取相鄰觀察點間的空間特征。因此,圖卷積網絡(GCN)[14~16]受到了廣泛的關注。Li等人[17]為捕獲交通數據的時空依賴性,對GRU的門控進行改進,提出擴散卷積門控循環單元(DCGRU),結合編碼器—解碼器提出seq2seq的DCRNN模型;Zhao等人[18]在DCRNN模型的基礎上,提出一種基于GCN和GRU的時間圖卷積網絡模型(T-GCN),與DCGRU相比,DCGRU對輸入和隱藏記憶單元進行圖卷積,T-GCN僅對輸入進行圖卷積。針對時間依賴,Guo等人[19]使用三個不同的時空組件提取歷史數據的信息,綜合交通網絡的圖結構和交通數據的動態時空模式表征鄰居節點與預測節點間的時空相關性,提出一種基于注意力機制的時空圖卷積神經網絡(ASTGCN);Song等人[20]利用三個連續時間片構建局部時空圖,同時使用滑動窗口分割出不同的時間周期,堆疊多個圖卷積層組成時空同步圖卷積網絡(STSGCN)提取長期時空相關性。
由于T-GCN使用兩層圖卷積網絡聚合一階和二階鄰居的空間信息,未深度挖掘高階相鄰節點間的空間相關性,所以利用能覆蓋k階鄰居節點的k階切比雪夫圖卷積完成空間卷積操作,提取高階鄰居的空間相關性;此外,T-GCN使用單一時間窗口的時間序列進行預測,未從不同時間窗口的角度挖掘時間依賴,因此本文分別提取周相關、日相關、相鄰時間相關序列數據,并通過對時間序列進行語義編碼和解碼,以捕獲時間相關性。
綜上,本文提出多時空圖卷積模型(multi-spatial-temporal graph convolutional network,MST-GCN),旨在從交通數據中獲取復雜的時空特征,并應用到高速公路的交通流預測上。
1 相關工作
1.1 問題定義
本文主要針對路網交通流的單步預測問題,利用無向圖G(V,E)描述路網的拓撲結構,其中V為路網節點集合,節點之間的連接情況表示為邊,E為邊的集合。
假設當前時刻為t,則t+1時刻交通流的函數形式可以表示為
1.2 時間圖卷積T-GCN
T-GCN模型由圖卷積網絡和門控循環單元組成,其前向傳播過程如圖1所示:a)利用兩層圖卷積網絡聚合一階和二階鄰居的空間信息,捕捉交通流的空間相關性;b)結合門控循環單元模型,通過單元之間的信息傳遞捕捉時間相關性;c)通過全連接層得到預測結果。
T-GCN單元的計算過程如圖2所示,具體流程如下:
a)T-GCN利用兩層GCN捕捉交通流的空間相關性。
圖卷積操作計算[15]如下:
其中:ht-1和ht為t-1時刻和t時刻隱藏層的輸出;ut為t時刻的更新門;rt為t時刻的重置門;ct為t時刻的記憶單元;W和b為訓練過程中的參數;tanh為非線性激活函數。
GCN是切比雪夫圖卷積[16]的一階簡化,忽略了一階以上鄰居節點間有效的空間信息。T-GCN使用兩次圖卷積進行疊加,僅僅聚合了一階和二階鄰居的空間信息,未深度挖掘高階相鄰節點間的空間相關性。因此本文利用k階切比雪夫圖卷積改進T-GCN單元的兩層圖卷積操作。
2 多時空圖卷積MST-GCN
2.1 空間相關性
GCN是切比雪夫圖卷積在k=1,λmax=2時的推導結果,由于切比雪夫圖卷積的k階卷積算子能覆蓋k階鄰居節點,所以k=1表示GCN僅能夠提取一階鄰居間的空間相關性,忽略了一階以上鄰居節點間有效的空間信息。本文利用k階切比雪夫圖卷積改進T-GCN單元的兩層圖卷積操作,k階切比雪夫多項式函數形式為
其中:L為對稱規范化的拉普拉斯矩陣,由不添加自連接的鄰接矩陣A和度矩陣D構成;λmax為L的最大特征值;Tk為k階的切比雪夫多項式;βk是訓練的權重參數,與Tk構成卷積核。由于切比雪夫多項式的定義域在[-1,1],所以將L歸一化為。
切比雪夫圖卷積的k階卷積算子能夠覆蓋k階鄰居節點的特征,通過調整k值,改變卷積感受野范圍,能夠確定有效的空間特征影響范圍,提高模型空間相關性挖掘的能力。
2.2 時間相關性
為捕獲交通流的時間動態相關性,本文使用三個不同的時空組件提取交通歷史數據特征。按照不同時間片類型劃分輸入數據,選取最近Tw周、最近Td日的相似時間間隔的時空數據Xw和Xd,與最近Tm個鄰近時間間隔的時空數據Xm作為多源同構數據。
Y為圖3中黑色部分(見電子版),表示預測時段的交通流量值。
Xw為周序列,由最近Tw周中與預測時段相同的時間段組成,它們具有與預測周期相同的周屬性和時間間隔,如圖3藍色部分所示(見電子版)。通常,在交通狀況的變化趨勢和峰值上,工作日的交通流量與上一周工作日的交通流量具有一定的相似性,并區別于非工作日。因此,加入周相關數據以捕獲工作日與非工作日的周期特征。
Xd為日序列,由最近Td天中與預測時段相同的時間段組成,如圖3紅色部分所示(見電子版)。由于出行者的活動軌跡具有一定的規律性,交通流呈現出周期性的波動,例如工作日的早高峰和晚高峰可能具有相似的交通流量。因此,加入日相關數據提取時空動態相關性。
Xm為鄰近序列,是預測時段近期的一段歷史時間序列,時間步長為Tm,如圖3綠色部分所示(見電子版)。從宏觀角度分析,交通擁堵的形成和擴散是循序漸進的,因此,加入鄰近時間的交通流以捕獲交通流的變化趨勢。
使用三個時空組件分別挖掘周相關、日相關、鄰近時間的序列數據的時空相關性。如圖4所示,時空組件由一個切比雪夫圖卷積模塊、一個門控循環單元模塊組成。首先,利用切比雪夫圖卷積對在空間維度上交通時空數據進行k次卷積操作,并將卷積結果聚合,得到k階擴散后的節點信息;其次,使用門控循環單元在時間維度上挖掘交通流的周期性,動態挖掘時間相關性;最后利用全連接對門控循環單元的輸出規整化到預測維度。
2.3 多時空融合
本文采用三個時空組件與編碼器—解碼器網絡結構融合組建多時空圖卷積網絡(MST-GCN)模型,如圖5所示。將周序列、日序列的兩個時空組件作為周編碼器和日編碼器,其輸出Cw和Cd作為解碼器記憶單元的初始值,解碼器以鄰近序列作為輸入,輸出為交通流量的預測值。
本文提出的MST-GCN模型分別提取周相關、日相關、鄰近時間的交通流數據,使用三個時空組件與編碼器—解碼器網絡結構融合來深度挖掘不同時間窗口之間的周期性。其中,為深度挖掘節點的時空相關性,時空組件結合了切比雪夫圖卷積和門控循環單元來獲取更大的感受野。
3 實驗
3.1 數據集
為評估模型性能,利用Caltrans性能評估系統(PeMS,https://pems.dot.ca.gov)中高速公路數據集PEMS04和PEMS08進行分析。
PEMS04為采集自舊金山灣的交通數據,其中包含29條道路上的3 848個傳感器,選擇其中307個傳感器的數據進行預測。該數據集的時間跨度為2018年1月1日到2月28日,共59天的數據。
PEMS08為2016年7月1日至8月31日共62天圣貝納迪諾的交通數據,其中包含8條道路上的1 979個傳感器,選擇其中170個傳感器的數據進行預測。
3.2 預處理
PEMS04和PEMS08均為每5 min聚合一次流量數據,每個傳感器每天包含288條數據記錄,每一條記錄包含三個特征,分別是該時間段響應傳感器的交通流量、平均車輛速度和占有率。
以6∶2∶2的比例將時空數據劃分為訓練集、驗證集和測試集。同時對每一個特征進行極差歸一化,將數據保持在[0,1],具體計算公式如下:
通過利用傳感器之間的距離,使用閾值高斯核[21]建立圖的鄰接矩陣A,閾值高斯核的計算過程如下:
其中:Wij代表傳感器vi到傳感器vj之間邊的權重;dist(vi,vj)表示傳感器vi與vj之間的距離;σ2是距離的方差;s是閾值。由于數據集中沒有超過1 000 m的傳感器,所以閾值s取1 000。
3.3 評估指標
本文使用三個度量函數來評估MST-GCN模型的預測效果,分別是平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percentage error,MAPE):
其中:yij和ij代表第i個樣本中第j條道路的實際交通流和預測交通流;M代表樣本數;N代表道路數;是樣本集的平均值。
3.4 實驗參數設置
為驗證模型的有效性,將本文提出的MST-GCN模型和經典的GRU模型、近期提出的DCRNN、T-GCN、ASTGCN、STSGCN模型進行對比。
表1為各個模型的超參數設置。其中,layers表示隱藏層層數,units代表每個隱藏層的計算單元個數,實驗中所有模型隱藏層使用相同個數的計算單元,k表示時空組件中圖卷積的階數,Tw和Td為周序列和日序列長度,Tm為鄰近序列長度,也可以看做時間序列模型的時間步長。
3.5 實驗結果
實驗結果如表2所示。在PEMS08數據集中,MST-GCN模型在精度上始終優于其他基準模型。在PEMS04數據集中,MST-GCN有最小的MAE和MAPE,RMSE略大于STSGCN。以MAPE為評價指標,MST-GCN相比GRU平均提升23.48%,相比DCRNN提升13.61%,相比T-GCN提升21.29%,相比ASTGCN提升24.39%,相比STSGCN提升5.06%。
圖6和7分別展示兩個數據集使用不同模型的預測結果。GRU僅考慮時間相關性,未利用路網的空間相關性,因此GRU的精度不及利用時空相關性的方法;DCRNN和T-GCN模型分別對空間相關性和時間相關性進行建模,然而它們僅利用單一時間窗口來提取長時依賴,忽略了不同時間窗口的周期性;ASTGCN和STSGCN均使用不同的時空組件對時間窗口提取時空相關性,然而它們忽略了不同時間窗口之間的有序性,因此捕捉時空長時依賴的性能就會相對降低。本文的MST-GCN方法考慮了不同時間窗口之間的有序性,利用編碼器—解碼器結構對時空組件進行融合,來捕獲不同時間窗口之間的時空長時依賴。因此,本文模型在預測精度上均優于現有模型,取得了較好的預測效果。
此外,實驗還比較MST-GCN隨著超參數變化的性能變化情況,包括圖卷積的階數k、周序列長度Tw、日序列長度Td及鄰近序列長度Tm(即時間步長)。實驗結果如圖8所示,圖卷積的階數和鄰近序列長度對預測結果影響較大,而周序列長度Tw和日序列長度Td影響相對較小。因此,選定k=3,Tw=2,Td=6,Tm=8為最佳參數配置。
4 結束語
針對使用時空數據進行交通流預測建模的問題,本文提出一種多時空圖卷積網絡模型(MST-GCN)來捕獲時空依賴關系。首先,為深度挖掘節點的時空相關性,結合切比雪夫圖卷積和門控循環單元獲取更大的感受野;其次,分別提取周相關、日相關、鄰近時間的序列數據,使用三個時空組件來深度挖掘不同時間窗口的周期性;最后,將多個時空組件與編碼器—解碼器網絡結構融合組建MST-GCN模型。利用Caltrans性能評估系統中的高速公路數據集PEMS04和PEMS08進行實驗,結果表明新模型的性能明顯優于其他模型,可以應用于實際路網提高交通路網的通行效率。下一步研究將收集城市路網的數據集,探索模型在復雜城市路網下的適應能力。
參考文獻:
[1]Vlahogianni E I, Karlaftis M G, Golias J C. Short-term traffic forecasting: where we are and where we’re going[J].Transportation Research, Part C: Emerging Technologies,2014,43:3-19.
[2]韓超,宋蘇,王成紅.基于ARIMA模型的短時交通流實時自適應預測[J].系統仿真學報,2004,16(7):1530-1532,1535.(Han Chao, Song Su, Wang Chenghong. Real-time adaptive prediction of short-term traffic flow based on ARIMA model[J].Journal of System Simulation,2004,16(7):1530-1532,1535.)
[3]Kumar S V. Traffic flow prediction using Kalman filtering technique[J].Procedia Engineering,2017,187:582-587.
[4]沈琴琴,王玥,黃悅,等.改進初值的灰色Verhulst-Markov模型及其應用[J].統計與決策,2020,36(7):30-33.(Shen Qinqin, Wang Yue, Huang Yue, et al. Grey Verhulst-Markov model with improved initial value and its application[J].Statistics and Decision,2020,36(7):30-33.)
[5]Feng Xinxin, Ling Xianyao, Zheng Haifeng, et al. Adaptive multi-kernel SVM with spatial-temporal correlation for short-term traffic flow prediction[J].IEEE Trans on Intelligent Transportation Systems,2018,20(6):2001-2013.
[6]張濤,陳先,謝美萍,等.基于K近鄰非參數回歸的短時交通流預測方法[J].系統工程理論與實踐,2010,30(2):376-384.(Zhang Tao, Chen Xian, Xie Meiping, et al. Short-term traffic flow prediction method based on nonparametric regression of K-nearest neighbors[J].Systems Engineering Theory and Practice,2010,30(2):376-384.)
[7]王建,鄧衛,趙金寶.基于貝葉斯網絡多方法組合的短時交通流預測[J].交通運輸系統工程與信息,2011,11(4):147-153.(Wang Jian, Deng Wei, Zhao Jinbao. Short-term traffic flow forecast based on Bayesian network multi-method combination[J].Transportation Systems Engineering and Information,2011,11(4):147-153.)
[8]Do L N N, Taherifar N, Vu H L. Survey of neural network-based models for short-term traffic state prediction[J].Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery,2019,9(1):e1285.
[9]Ma Xiaolei, Tao Zhimin, Wang Yinhai, et al. Long short-term me-mory neural network for traffic speed prediction using remote microwave sensor data[J].Transportation Research, Part C: Emer- ging Technologies,2015,54:187-197.
[10]Fu Rui, Zhang Zuo, Li Li. Using LSTM and GRU neural network methods for traffic flow prediction[C]//Proc of the 31st Youth Academic Annual Conference of Chinese Association of Automation.2016:324-328.
[11]谷遠利,陸文琦,李萌,等.基于組合深度學習的快速路車道級速度預測研究[J].交通運輸系統工程與信息,2019,19(4):79-86.(Gu Yuanli, Lu Wenqi, Li Meng, et al. Research on expressway lane-level speed prediction based on combined deep learning[J].Transportation Systems Engineering and Information,2019,19(4):79-86.)
[12]Lin Zhihui, Li Maomao, Zheng Zhuobin, et al. Self-attention ConvlSTM for spatio-temporal prediction[C]//Proc of the 34th AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2020:11531-11538.
[13]包銀鑫,曹陽,施佺.基于改進時空殘差卷積神經網絡的城市路網短時交通流預測[J].計算機應用,2022,42(1):258-264.(Bao Yinxin, Cao Yang, Shi Quan. Urban road network short-term traffic flow prediction based on improved spatio-temporal residual convolutional neural network[J].Journal of Computer Applications,2022,42(1):258-264.)
[14]Bruna J, Zaremba W, Szlam A, et al. Spectral networks and locally connected networks on graphs[C]//Proc of the 2nd International Conference on Learning Representations.2014.
[15]Kipf T N, Welling M. Semi-supervised classification with graph con-volutional networks[C]//Proc of the 5th International Conference on Learning Representations.2017.
[16]Defferrard M, Bresson X, Vandergheynst P. Convolutional neural networks on graphs with fast localized spectral filtering[C]//Advances in Neural Information Processing Systems.2016:3844-3852.
[17]Li Yaguang, Yu Rose, Cyrus S, et al. Diffusion convolutional recurrent neural network: data-driven traffic forecasting[C]//Proc of the 6th International Conference on Learning Representations.2018.
[18]Zhao Ling, Song Yujiao, Zhang Chao, et al. T-GCN:a temporal graph convolutional network for traffic prediction[J].IEEE Trans on Intelligent Transportation Systems,2019,21(9):3848-3858.
[19]Guo Shengnan, Lin Youfang, Feng Ning, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]//Proc of the 33rd AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2019:922-929.
[20]Song Chao, Lin Youfang, Guo Shengnan, et al. Spatial-temporal synchronous graph convolutional networks: a new framework for spatial-temporal network data forecasting[C]//Proc of the 34th AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2020:914-921.
[21]Shuman D I, Narang S K, Frossard P, et al. The emerging field of signal processing on graphs:extending high-dimensional data analysis to networks and other irregular domains[J].IEEE Signal Processing Magazine,2013,30(3):83-98.