劉鈺斐 許琳 李佩 嚴帥 劉云海



摘要 隨著城市人口的日益增長,交通出行需求快速上升,如何精準預測交通流量、對道路交通進行管控提供依據,成為亟待解決的關鍵問題。文章提出了一種基于時空圖注意力網絡的交通流量預測模型。對于流量的時間特征,提出圖卷積神經網絡與長短期記憶神經網絡相結合的方法:使用圖卷積神經網絡捕獲流量的空間特征以及使用長短期記憶神經網絡捕獲流量的時間特征。同時,為了充分考慮不同時刻的流量信息對預測的作用,引入了注意力機制來計算不同時刻流量信息的重要性。在揚州公路數據集上的實驗結果表明,文章提出的模型各項評估指標均優于基線模型,從而驗證了模型的有效性和適用性。
關鍵詞 交通流量預測;圖卷積神經網絡;長短期記憶神經網絡;注意力機制
中圖分類號 U491.1+4 文獻標識碼 A 文章編號 2096-8949(2024)04-0004-04
0 引言
道路流量預測在城市交通規劃和管理中扮演著至關重要的角色。隨著城市化進程的加速和車輛數量的不斷增加,道路擁堵問題已經成為當今城市面臨的一個極為緊迫的挑戰。有效地預測道路流量對于交通管理部門而言至關重要,因為它能夠為更加合理和有效地制定交通規劃和管理措施提供基礎數據和準確指導,從而改善交通擁堵狀況并提高道路通行效率[1-5]。
為考慮交通流量的時序特性,研究者提出使用長短期記憶神經網絡(LSTM)進行交通流量預測[6]。然而,由于LSTM無法考慮交通流量的空間關系,研究者提出使用卷積神經網絡(CNN)來捕獲交通流量的空間特征[7]。然而,CNN僅適用于歐幾里得數據,對于交通網絡等非歐幾里得數據,輸入容易被打亂,無法有效保留交通網絡的拓撲信息。為克服這一缺點,圖卷積神經網絡(GCN)應運而生,具備高效提取空間特征的能力,目前在交通流量預測領域成為主流的深度學習模型。通常,GCN與其他模型結合構建深度學習框架。研究者提出使用立體卷積核提取交通流量的不規則時空特性,以及使用多層深度圖卷積網絡提取全網交通流量的時空特性[8]。此外,研究者將GCN與雙向LSTM相結合,并引入k-hop矩陣,將鄰接矩陣與站間的出行矩陣相結合,取得了更好的預測性能[9]。
現有研究對流量預測進行了較為深入的探索,但是大多數研究僅采用單一模型來提取流量特征。在使用LSTM進行流量預測時,通常需要結合一些特征工程來獲取與流量相關性較高的數據,以作為空間特征的補充。然而,這種方法往往導致預測效果不佳。類似地,使用CNN和GCN模型的研究也面臨相似的問題。因此,如何構建一種深度學習框架,以充分挖掘流量的時空特性,是當前亟待解決的問題之一。同時,一些先進的深度學習技術,例如注意力機制對各類序列問題都有良好的適應性和表現。然而,在流量預測領域,對于注意力機制的應用較為有限。因此,如何利用最先進的深度學習技術來提高預測的精度,也是另一亟待解決的問題。
為了解決上述問題,該文提出了一種創新的時空圖卷積網絡,旨在更好地捕捉道路流量數據中的潛在時空關系。該模型不僅能夠有效地利用道路網絡中各個節點的空間相關性,還能夠充分考慮時間維度上的演化和趨勢。為了進一步提升預測精度,該文引入了注意力機制,以提取道路流量中的重要信息和關鍵特征。通過在揚州市真實道路流量數據上進行的實驗,驗證了該文所提出模型的有效性和優越性。實驗結果表明,該模型在預測道路流量方面具有出色的性能,能夠為交通管理部門的決策制定和交通規劃提供有力支持,為解決城市交通擁堵問題提供了可行的方案。
1 模型構建
1.1 長短期記憶神經網絡
循環神經網絡(Recurrent Neural Network,RNN)是一種能夠對序列數據進行建模的神經網絡模型。與傳統的前饋神經網絡不同,RNN通過引入循環連接,使得網絡能夠捕捉到序列中的時序依賴關系。RNN的關鍵特性是其隱藏狀態(hidden state),它在每個時間步中都會被更新并傳遞給下一個時間步。為了解決這些問題,研究人員提出了對長短期記憶神經網絡進行改進。它通過引入門控機制來解決傳統RNN中的梯度消失和梯度爆炸問題,以及更好地處理長期依賴關系。LSTM的核心思想是細胞狀態(cell state),它類似于RNN的隱藏狀態,但具有更強的記憶能力。
然而,傳統的RNN存在著梯度消失和梯度爆炸的問題。LSTM通過三個門控單元來控制細胞狀態的更新:遺忘門(forget gate)、輸入門(input gate)和輸出門(output gate)。遺忘門決定了前一時刻細胞狀態中哪些信息需要被遺忘,輸入門決定了當前輸入的哪些信息需要被記憶,而輸出門決定了當前時刻的細胞狀態中哪些信息需要被輸出到下一層或下一個時間步。LSTM的結構如圖1所示。
定義輸入序列:X=(x1,x2,…,xT),隱藏狀態序列:H=(h1,h2,…,hT),細胞狀態序列:C=(c1,c2,…,cT),遺忘門輸出序列:F=(f1, f2,…, fT),輸入門輸出序列:I=(i1,i2,…,iT),輸出門輸出序列:O=(o1,o2,…,oT)。長短期記憶神經網絡的計算公式如下:
1.2 圖卷積神經網絡
圖卷積神經網絡(Graph Convolutional Neural Networks,GCN)是一種用于處理圖結構數據的深度學習模型。GCN的主要目標是在節點級別上學習節點的表示,同時利用圖結構信息進行信息傳播和特征提取。
GCN的核心思想是通過局部鄰居節點的信息聚合來更新每個節點的表示。對于每個節點,GCN將其特征與鄰居節點的特征進行加權和,權重由圖結構和節點之間的關系確定。然后,通過一個非線性激活函數,如ReLU,將聚合的結果作為節點的新表示。這樣,通過多次迭代圖卷積操作,GCN可以逐漸豐富節點的表示,并將圖結構中的信息傳播到整個網絡。
對于每個節點vi,其鄰居節點集合為N(vi),表示為
在計算得到注意力權重的基礎上,獲取到了各個輸入信息的重要性。接下來只需要通過加權求和即可得到最終的輸入,計算公式如下:
1.4 模型框架
為通過使用完全由數據驅動的方法來實現道路交通流量短時進站流量預測,該文構建了一種端到端的深度學習框架:基于時空圖卷積注意力網絡的流量預測模型。該模型的框架如圖2所示。模型由時空圖卷積模塊和注意力機制兩大部分組成。其中,時空圖卷積模塊分別由圖卷積神經網絡(GCN)來捕獲流量的空間特性,長短期記憶神經網絡(LSTM)來捕獲交通流量的時間特性。
2 實驗設計
2.1 數據集描述
為了驗證該文提出模型的有效性,采用揚州市真實道路交通流量數據進行實驗。實驗基于2023年6月揚州市高速公路G328數據集,由攝像頭數據采集到的交通流量數據,共有44個路段。通過高德地圖爬取路段之間的連接關系,構造鄰接矩陣。
預測以15 min作為時間間隔,所有路段過去8個時段的流量形成輸入x,而下一個時段所有路段的流量形成輸出y。最后,按照8∶2的比例將數據集劃分為訓練集和測試集。
2.2 評價指標
為了驗證模型預測精度,需要根據流量預測值與真實值來計算相應的指標進行評估。在模型評估方面,該文選擇以下三個常用的評估指標:
(1)均方根誤差(RMSE):
(2)平均絕對誤差(MAE):
2.3 實驗結果分析
對比模型:
(1)歷史平均法(HA):歷史平均法是一種用于計算數據趨勢的統計方法。它通過將多個時間點的數據平均化,以獲得一個更平滑的趨勢線,從而減少噪音和波動的影響。
(2)圖卷積神經網絡:使用了原始的圖卷神經網絡,其中,計算單元采用ChebNet,階數K設置為3。
(3)TGCN[10]:TGCN是一種基于圖卷積神經網絡和門控循環單元的模型,它可以同時捕捉空間和時間相關性,來充分提取流量的時空特性。
在實驗數據集的測試集中,該文將提出的模型與三種基線模型進行了對比。為了全面評估交通流量預測性能,采用了RMSE、MAE和R2這三個評估指標。如表1所示,基線模型HA的預測效果最差,其R2值僅為0.70。相比之下,GCN和T-GCN明顯優于HA。該文的模型在所有評價指標上表現最佳,RMSE為38.67,MAE為18.39,R2為0.93。這證明該文的模型能夠有效地捕捉交通流量的時空特征,并具備出色的流量預測能力。考慮使用的數據集是真實的道路交通流量數據,預測的復雜性很高,場景也非常復雜,因此需要綜合考慮流量的時空特征以及其重要性。與HA模型僅從時間序列角度進行預測相比,GCN考慮了流量的拓撲關系,從空間角度提取了流量特征,因此預測效果更好,但總體上仍有待改進。T-GCN同時考慮了流量的時間和空間特征,從而提升了預測精度,然而由于未考慮流量的重要性程度,其預測效果仍不如該文提出的模型。
3 結語
該文提出了一種基于時空圖注意力網絡的交通流量預測模型,旨在解決城市交通規劃和管理中的道路擁堵問題。為了捕捉流量的時間特征,該文結合了圖卷積神經網絡(GCN)和長短期記憶網絡(LSTM)的方法。GCN用于捕獲流量的空間特征,而LSTM則用于捕獲流量的時間特征。為了充分考慮不同時刻的流量信息對預測的影響,該文引入了注意力機制來計算不同時刻流量信息的重要性。通過在揚州公路數據集上進行實驗,該文驗證了所提出模型的有效性和適用性。實驗結果表明,該文的模型在各項評估指標上均優于基線模型,驗證了其在交通流量預測中的有效性和適用性。
在未來的研究中,可以進一步考慮現實中影響交通流量的其他因素,如天氣因素、重大事件、突發情況等,將它們作為特征加入模型中。這樣做可以使模型更貼近實際交通運行環境,進一步提高交通流量預測的準確率。綜合考慮更多的因素,能夠更好地理解交通流量的動態變化,從而為城市交通規劃和管理提供更精確的參考和決策支持。
參考文獻
[1]陳治亞, 王小軍. 基于多維度LSTM模型的短時交通流預測[J]. 鐵道科學與工程學報, 2020(11): 2946-2952.
[2]蔡昌俊, 姚恩建, 王梅英, 等. 基于乘積ARIMA模型的城市軌道交通進出站客流量預測[J]. 北京交通大學學報, 2014(2): 135-140.
[3]王瑩, 韓寶明, 張琦, 等. 基于SARIMA模型的北京地鐵進站客流量預測[J]. 交通運輸系統工程與信息, 2015(6): 205-211.
[4]段金肖, 丁川, 鹿應榮, 等. 考慮動態波動性的軌道交通站點短時客流預測方法[J]. 交通信息與安全, 2017(5): 62-69.
[5]趙鵬, 李璐. 基于ARIMA模型的城市軌道交通進站量預測研究[J]. 重慶交通大學學報(自然科學版), 2020(1): 40-44.
[6]Luo X, D Li, Yang Y, et al. Spatiotemporal Traffic Flow Forecasting with KNN and LSTM[J]. Journal of Advanced Transportation, 2019(PT. 1): 537-546.
[7]羅文慧, 董寶田, 王澤勝. 基于CNN-SVR混合深度學習模型的短時交通流預測[J]. 交通運輸系統工程與信息, 2017(5): 68-74.
[8]Han, Wang, Ren, et al. Predicting Station-Level Short-Term Passenger Flow in a Citywide Metro Network Using Spatiotemporal Graph Convolutional Neural Networks[J]. International Journal of Geo-Information, 2019(6): 243.
[9]Chen P, Fu X, Wang X. A Graph Convolutional Stacked Bidirectional Unidirectional-LSTM Neural Network for Metro Ridership Forecasting[J]. IEEE Transactions on Intelligent Transportation Systems, 2021(99): 1-13.
[10]Zhao L, Song Y, Zhang C, et al. T-GCN: A Temporal Graph Convolutional Network for Traffic Prediction[J]. 2018.
收稿日期:2023-12-29
作者簡介:劉鈺斐(1982—),男,碩士研究生,高級工程師,研究方向:公路運營管理。
通信作者:李佩(1999—),男,碩士研究生,研究方向:智能交通系統。
基金項目:國家自然科學基金青年科學基金“面向公共交通接駁的自動駕駛共享電動汽車調度優化研究”(72301066)。