中圖分類號:U495 文獻標志碼:A
隨著城市化進程的加快和車輛數量的增加,城市交通擁堵問題日益突出,已成為制約社會經濟發展、影響人們生活質量的重要因素。交通流量預測是結合歷史流量數據和路網結構等特征,對路網中的未來交通流量作出預測的過程。它是智能交通系統的重要組成部分,對提升城市交通管理、交通規劃、路徑優化以及交通控制的效率具有重要意義[1]
目前,國內外已經對交通流量預測展開了大量的研究。現有的交通流量預測模型主要可以分為3類:分別是基于統計學的預測模型,基于機器學習的預測模型和基于深度學習的預測模型。統計學方法在交通流預測研究的早期較為常用,其中具有代表性的方法包括向量自回歸模型(vectorauto-regression,VAR)[2]、自回歸移動平均模型(autore-gressive integrated moving average,ARIMA)[3」和卡爾曼濾波模型(Kalman filtering,KF)[4],但它們通常難以對非線性特征建模[5]。常見的機器學習預測模型有支持向量回歸模型(supportvectorregres-sion,SVR)[]和K近鄰算法( k -nearest neighbor,KNN)[7]。相較于統計學模型,機器學習模型能夠較好建模交通數據中隱含的非線性關系,預測精度大大提升。但淺層的架構針對現實場景中復雜的交通數據集擬合能力有限[8]
隨著深度學習的發展,神經網絡模型因其強大的非線性特征擬合能力而被廣泛應用于交通預測中[9]。為了充分捕捉空間依賴和時間依賴,研究人員通常采用組合模型的方式來提升預測性能。在空間維度,圖卷積網絡(graphconvolutionalnet-works,GCN)能夠有效捕獲圖結構數據的節點特征及拓撲關系,因此常用于建模交通網絡中的空間依賴。研究人員將GCN模型與時間序列模型相結合,在準確性、穩定性和適用性上,相較于傳統模型均獲得較大提升。LI等[0]最先將GCN與循環神經網絡(recurrentneuralnetwork,RNN)結合,分別提取空間和時間特征,提出了擴散卷積循環神經網絡(diffusion convolutional recurrent neural network,DCRNN)模型,取得了良好的預測效果。此后,YU等[11]提出的時空圖卷積網絡(spatio-temporal graphconvolutionalnetworks,STGCN)模型將GCN與卷積神經網絡(convolutionalneuralnetwork,CNN)結合,在保證精度的同時減少了計算量。GUO等[12]在STGCN的基礎上引入了時空注意力機制,來學習交通數據的動態時空相關性。然而,上述模型中采用的圖構建方式都是基于連通性或距離,沒有考慮道路網絡間潛在的空間相關性。WU等[13]針對此問題提出了GraphWaveNet模型,該模型通過學習獲得的自適應圖,來挖掘潛在空間相關性。同時,在時間卷積網絡(temporalconvolutionalnet-work,TCN)引入膨脹因果卷積,在不增加卷積層數量的情況下獲得更大的感受野來捕捉長期時間依賴。TA等[14]提出自適應時空圖神經網絡(adap-tivespatio-temporal graph neural network,Ada-ST-Net)模型,從宏觀和微觀兩個角度分別描述長期和短期的空間關系。ZHAO等[15]提出了多時空融合圖循環網絡(multi-spatio-temporal fusion graph re-currentnetwork,MSTFGRN)模型,該模型能夠自主從實時交通數據中生成加權圖,半自主地生成每個時間段的動態圖。YU等[1提出了一種新的多頭流注意力GCN,與門控循環單元(gatedrecurrentu-nit,GRU)結合來描述道路網絡中的時空相關性。
在上述研究中,時間序列模型主要采用了RNN、CNN及其變體。在建模交通流量的時序特征時,模型需要同時捕捉局部(短期)和全局(長期)的時間依賴,以充分理解數據的動態變化。短期依賴反映突發事件或瞬時波動,而長期依賴則描述周期性模式或趨勢性變化。RNN由于梯度消失和爆炸問題,難以有效建模長期時間依賴;CNN通過局部卷積提取短期時間特征,并通過多層堆疊擴大感受野捕捉長時間依賴,但這種可能遺漏全局依賴關系,難以充分建模時間特征。為解決上述問題,本文提出了一種基于時間圖卷積網絡的時空預測模型(spatial-temporal predictionmodelbasedontemporal graph convolution network,ST-TGCN)。該模型在時間維度中構建完全圖,將歷史各時間步視為圖的節點,通過GCN對時間依賴進行建模。并將其與應用在空間維度的GCN結合,進一步提取復雜時空依賴性。該模型通過美國加利福尼亞州高速路網Pems公開交通數據集進行驗證,結果表明所提出的ST-TGCN在平均絕對誤差(meanabso-luteerror,MAE)均方根誤差(rootmeansquareer-ror,RMSE)和平均絕對百分比誤差(meanabsolutepercentageerror,MAPE)指標上達到了較為先進的預測性能。
1 問題定義
本文以圖結構
來表示交通網絡,其中 V={v1,v2,…,vN} 是道路網絡上 N 個節點的集合, E 表示節點之間連通性的邊的集合。A∈RN×N 表示圖 G 的鄰接矩陣;如果道路之間沒有相連,則 A 的相應元素為0;如果有連接,則 A 的相應元素為1。交通網絡 G 中所有道路上的傳感器在時間步 ΨtΨt 觀測到的流量可以表示為
。研究的問題是給定一張圖 G 及其歷史 P 個時間步交通流量
,學習一個函數 f 預測未來 Q 個時間步的交通流量 Y=
,定義如式(1):
Y=f(X,G)
2 模型構建
本文針對傳統RNN和CNN在全局時間依賴建模方面的不足,將GCN應用于時間維度,構建交通流各時間步之間的全局關系,提出了基于時間圖卷積網絡的時空預測模型ST-TGCN模型。模型的結構如圖1所示。

ST-TGCN由堆疊的多個時空圖卷積塊組成,每個時空圖卷積塊中依次堆疊門控時間圖卷積層、空間圖卷積層以及殘差和批歸一化層。其中:線性層和全連接層用于將流量特征轉化為合適的維度;門控時間圖卷積層和空間圖卷積層利用GCN分別提取交通流量的時間依賴和空間依賴;殘差和批歸一化層用于緩解深層網絡引起的網絡退化和梯度消失問題;跳躍連接用于將各層輸出融合,以建模多尺度特征。該模型的具體流程如下:
1)將原始歷史流量數據用z分數方法進行歸一化處理獲得歷史 P 個時間步流量 X={xt-P+1 ,χt-P+2,.,x,}∈RNxP
2)用獨熱編碼為歷史流量在一周中所處哪一天和哪一時間步進行時間標記,獲得時間信息
,以更好地捕獲交通流周期性。在本文一天中有 Td=288 個時間步(每 5min 一個時間步)。
3)將 X 和 Xtime 串聯,并通過線性層映射為高維隱藏向量
,其中 D 為隱藏維度。
4) Hi-1 輸人第 i 個時空圖卷積塊中,先經過門控時間圖卷積層(詳見2.1)提取時間依賴,獲得輸出 Zi∈RD×N×P ,如式(2):

5) Zi 通過空間圖卷積層(詳見2.2)提取空間依賴,獲得輸出
,如式(3):
Ui=SGCN(Zi,A)
式中: A∈RN×N 為基于連通性的鄰接矩陣。
6)然后通過殘差連接和批歸一化處理來緩解網絡退化和梯度消失問題,獲得第i個時空圖卷積塊的輸出
,如式(4):

7)重復執行步驟4) ~6 ) I 次, I 為時空圖卷積塊的數量。然后將每個時空圖卷積塊中門控時間圖卷積層的輸出 Zi 通過跳躍連接機制融合,建模多尺度時空特征,獲得輸出Z'∈RNxP如式(5):

8)最后通過兩個全連接層來預測未來 Q 個時間步交通流量
,如式(6):

2.1 門控時間圖卷積層(Gated_TGCN)
傳統的組合模型中往往選用RNN、CNN或及變體來提取時間依賴,這些方法傾向于提取局部(短期)時間依賴,難以對全局(長期)時間依賴進行建模。針對此問題,本節設計了一個應用于時間維度的圖卷積模塊。該模塊在時間維度中構建完全圖,將歷史各時間步視為圖的節點。將各個時間步之間的關系權重用一個可學習的時間維度自適應鄰接矩陣 At∈RP×P 來表示,利用GCN同時捕捉歷史交通流量的局部和全局時間依賴。受啟發于門控時間卷積網絡(gatedtemporalconvolutionalnetwork,GatedTCN),本文引人門控機制來控制圖卷積層之間的信息流以提高模型的性能。Gated_TGCN的定義如下:


首先,上一個時空圖卷積塊的輸出 Hi-1∈ RD×N×P 會作為該模塊的輸入,通過時間維度自適應鄰接矩陣 Ai 進行 K 次擴散,并將結果相加獲得時間圖卷積的輸出 gi∈RD×N×P 。其中, Wi,kt 為模型中可學習的參數, Atk 代表 At 的 k 次冪。 Ar∈RP×P 自適應鄰接矩陣的定義如式(9):

這個矩陣不需要任何先驗知識,通過訓練學習獲得。其中, Etl 和 E? 分別代表時間節點的源節點嵌入和目標節點嵌人。然后將 Etl 和 E?v 相乘,得到時間節點間的關系權重。ReLU和SoftMax函數分別用于消除弱連接和矩陣歸一化。
其次,應用門控機制控制信息流,將 gi 輸入兩個不同的激活函數sigmoid和 tanh 。最后,在激活函數的輸出之間執行哈德曼乘法,獲得第 i 個門控時間圖卷積層的輸出Z:∈RxNxP
2.2 空間圖卷積層(SGCN)
交通流量數據中除了復雜的時間依賴,還蘊含豐富復雜的空間依賴,本文采用GCN來捕獲這些空間依賴。將道路視為空間節點,用基于連通性的鄰接矩陣
來表示空間節點間的結構關系,用空間維度自適應鄰接矩陣 As∈RN×N 來表示空間節點間的隱含關系。SGCN的定義如式(10):

式中:
是第 i 個空間圖卷積層的輸出。 Wi,k1s , Wi,k2s ,和 Wi,k3s 為可學習參數; Af= A/rowsum(A) 和
為前向轉移矩陣和后向轉移矩陣。 As 自適應鄰接矩陣的定義如式(11):

式中: Esl 和 Es2 分別代表空間節點的源節點嵌入和目標節點嵌入。
3 實驗結果與分析
3.1 數據集介紹
為了評估ST-TGCN的性能,本文在兩個來自美國加利福尼亞高速路網的真實交通流量數據集 [17]Pems04 和Pems08上進行了一系列實驗。這
些數據集以每 5min 作為一個時間步對交通流量數據進行聚合,它們在之前的大量研究中被廣泛使用。具體數據集詳細信息如表1所示。

3.2 實驗參數
根據交通流量預測領域標準基準設置,原始交通流量數據通過
分數標準化處理,然后劃分為訓練集( 70% )驗證集( 10% )和測試集( 20% )。歷史時間步數 P 和未來時間步數 Q 都設置為12,也就是利用歷史一小時流量預測未來一小時流量。模型的訓練輪數設置為200,批次大小設置為32,優化器選擇Adam,損失函數為平均絕對誤差。初始學習率設置為0.001,如果在訓練過程中8輪內驗證集的損失沒有下降,學習率就會減半。隱藏維度 D 設置為32,時空圖卷積塊的數量為6。
3.3 對比實驗
為了驗證本文提出的 ST-TGCN的模型的性能,將它與VAR[2]、ARIMA[3]、DCRNN[10]、STGCN[11]基于注意力的時空圖卷積網絡(attentionbasedspa-tial-temporal graph convolutional networks, AST-GCN)[12]、Graph WaveNet[13]、時空融合圖神經網絡(spatial-temporal fusion graph neural networks,STF-GNN)[18]、動態時空感知圖神經網絡(dynamicspatial-temporal awaregraphneuralnetwork,DSTAGNN)[19]、MSTFGRN[15]、STWave[20]、空間特定圖卷積循環Transformer網絡(space-specificgraph convolutional recurrent transformer network,SSGCRTN)[21]、時序感知的結構-語義耦合圖網絡( temporal-awarestructure-semantic-coupled graphnetwork,TASSGN)[22]共12個基線模型進行比較。并采用3種常用的交通流預測評價指標,包括MAE、RMSE和MAPE。表2列出了它們在Pems04和Pems08兩個數據集預測未來一小時流量的平均性能。
從表中可以看出,ST-TGCN在兩個數據集的3個評價指標上都達到了最先進的性能。VAR和ARIMA作為傳統統計學方法表現最差,因為它們只對時間相關性建模,忽略了交通數據復雜的空間相關性。包括DCRNN、STGCN、GraphWaveNet和STFGNN在內的方法使用圖結構來模擬空間相關性,因此性能優于傳統方法。ASTGCN和DSTAGNN在設計中引入了時空注意力機制,從而提高了模型的性能。STWave利用一種解耦融合框架更精確地建模交通的動態變化特性。SSGCRTN和TASSGN這兩種最新的時空預測方法也取得了優秀的成果。與上述方法相比,ST-TGCN將圖卷積網絡應用于時間維度,同時捕捉歷史交通流量的局部和全局時間依賴,更準確地建模各個歷史時間步之間的關系,所以它的性能始終優于基線模型。這也證明了該模型捕獲交通流量時空特征的優勢。

3.4 消融實驗
本文提出的ST-TGCN模型有兩個關鍵的模塊:門控時間圖卷積層和空間圖卷積層。為了驗證它們捕捉時空依賴的有效性,在PemsO4和Pems08兩個數據集上進行了消融實驗。此外,為了進一步驗證所提出門控時間圖卷積在挖掘時間依賴的優越性能,用兩個流行的時間序列模型TCN和GRU來替換該模塊。所使用的變體模型如下:
1)NoSGCN:在模型中移除了空間圖卷積層。
3)UsingTCN:用TCN替代時間圖卷積。
4)UsingGRU:用GRU替代時間圖卷積。
2)NoTGCN:在模型中移除了門控時間圖卷積層。
消融實驗結果如表3所示。NoSGCN和NoT-GCN的性能均低于ST-TGCN,驗證了所設計模塊的有效性。其中,NoSGCN的效果最差,表明在交通流預測中,空間特征的影響顯著高于時間特征。此外,ST-TGCN的預測精度優于UsingTCN和U-singGRU,顯示本文提出的時間維度圖卷積能夠更有效地從數據中提取時間信息,且在捕捉時間依賴方面相較于傳統的CNN和RNN具有更大的優勢。

4結論
交通流量預測是城市交通系統中不可缺少的重要組成部分。本文針對以往時間序列預測模型難以準確建模交通流量數據的全局時間依賴的問題,提出將圖卷積應用于時間維度的方法。具體地說,將歷史的各個時間步看作圖中的節點,利用自適應鄰接矩陣學習節點間的全局關系,從而充分提取時間依賴,提升預測的準確性。并且,為了同時捕獲交通流量復雜的時空依賴,將時間圖卷積與空間圖卷積結合,提出了一種新型深度學習模型ST-TGCN。所提出的模型在兩個公開數據集上的交通預測中取得了最先進的性能,為交通流預測領域提供了一種新的方法,可為城市交通系統中的交通流量預測工作提供參考借鑒。此外,時間維度圖卷積也可以擴展到其他時間序列預測領域。
參考文獻:
[1]陸化普,孫智源,屈聞聰.大數據及其在城市智能交 通系統中的應用綜述[J].交通運輸系統工程與信 息,2015,15(5):45-52.
[2]LU Z,ZHOU C,WUJ,et al. Integrating granger causalityand vector auto-regression for traffic prediction of largescale WLANs[J]. KSII Transactions on Internet and InformationSystems(TIIS),2016,10(1):136-151.
[3]AHMED M S,COOK AR.Analysis of freewaytraffic time-series data by using Box-Jenkins techniques[M]. Washington DC:Transportation Research Board,1979 (722):1-9.
[4]OKUTANI I, STEPHANEDESYJ.Dynamic prediction of traficvolumethroughKalmanfilteringtheory[J].Transportation Research PartB:Methodological,1984,18 (1):1-11.
[5]MANIBARDO E L,LANA I,DEL SER J. Deep learning for road traffic forecasting:does it make a difference? [J].IEEE Transactions on Intelligent Transportation Systems,2021,23(7) :6164-6188.
[6]DINGAL,ZHAOXM,JIAOLC. Traffic flow time seriesprediction based on statistics learning theory[C]// The IEEE 5th International Conference on Intelligent Transportation Systems.IEEE,2002:727-730.
[7]ZHENGZD,SUDC.Short-term trafic volume forecasting:a k-nearest neighbor approach enhanced by constrained linearly sewing principle component algorithm [J].TransportationResearch PartC:Emerging Technologies,2014,43:143-157.
[8]劉圣卿,馬飛虎.基于GAT-LSTM模型的高速公路站 點流量預測方法[J].應用科學學報,2024,42(3): 540-548.
[9]LECUN Y,BENGIO Y,HINTON G. Deep learning[J]. Nature,2015,521(7553):436-444.
[10]LIYG,YUR,SHAHABIC,et al. Diffusion convolutional recurrent neural network:data-driven traffic forecasting[C].Vancouver:International Conferenceon Learning Representations,2018.
[11]YU B,YIN HT,ZHU Z X. Spatio-temporal graph convolutional networks:a deep learning framework for traffic forecasting[C]. Stockholm:Proceedings of the 27th International Joint Conference on Artificial Intelligence, 2018:3634-3640.
[12]GUOSN,LINYF,FENGN,etal.Attentionbased spatial-temporal graph convolutional networks for traffic flow forecasting[C].Proceedings of the AAAI Conference onArtificial Intelligence,2019,33(1):922-929.
[13]WU ZH,PAN SR,LONG GD,et al.Graph wavenet for deep spatial-temporal graph modeling[C]//Proceedings of the 28th International Joint Conference on Artificial Intelligence. Association for the Advancement of Artificial Intelligence(AAAI),2019:1907-1913.
[14]TA XX,LIU ZH,HUX,et al. Adaptive spatio-temporal graph neural network for traffic forecasting[J]. Knowledge-Based Systems,2022,242:108199.1-108199.5.
[15]ZHAOW,ZHANGSQ,ZHOUB,etal.Multi-spatiotemporal fusion graph recurrent network for trafic forecasting[J].Engineering Applicationsof Artificial Intelligence,2023,124:106615.1-106615.10.
[16]YUL F,LIUWB,WUD,et al.Spatial-temporal combination and multi-head flow-attention network for traffic flowprediction[J].ScientificReports,2024,14(1): 9604.1-9604.18.
[17]SONGC,LINYF,GUOSN,etal.Spatial-temporal synchronous graph convolutional networks:a new framework for spatial-temporal network data forecasting[C]. Proceedingsof the AAAI Conference on Artificial Intelligence,2020,34(1):914-921.
[18]LI M Z, ZHU Z X. Spatial-temporal fusion graph neural networksfor traffic flow forecasting[C].Proceedingsof theAAAI Conferenceon Artificial Intelligence,2O21,35 (5):4189-4196.
[19]LANSY,MA YT,HUANG WW,et al. Dstagnn: dynamic spatial-temporal aware graph neural network for traffic flow forecasting[C]//International Conference on MachineLearning.PMLR,2022:11906-11917.
[20]FANGYC,QINYJ,LUO HY,et al.When spatiotemporal meet wavelets:disentangled traffic forecasting viaefficient spectral graph attention networks[C]//2023 IEEE 39th International Conference on Data Engineering (ICDE).IEEE,2023:517-529.
[21]YANGSY,WUQY,WANGYH,etal.SSGCRTN:a space-specific graph convolutional recurrent transformer network fortraffic prediction[J/OL].Applied Intelligence,2024:1-17(2024-09-07)[ 2024-11-04].https://doi.org/10.1007/s10489-024-05815-1.
[22]CHEN M,HAN L Z,XU Y,et al. Temporal-aware structure-semantic-coupled graph network for traffic forecasting[J].Information Fusion,2024,107:102339.1- 102339.14.
(責任編輯:曾 晶)
Traffic Flow Spatial-Temporal Prediction Model Based on Temporal Graph Convolution Network
LIN Tingyu 1,2,3 , WU Qunyong *1,2,3 , WANG Keyue 1,2,3 (1.KeyLabofSpatialData MiningandInformation SharingofMinistryofEducation,Fuzhou University,Fuzhou350108, China;2.Nationalamp;Local JointEngineeringResearchCenterforComprehensiveApplicationofSateliteGeospatial Information Technology,Fuzhou 350108,China;3.The Academyof Digital China(Fujian),Fuzhou 350108,China)
Abstract:Traffc flow prediction plays a crucial role in intellgent transportation systems.To address the limitations of recurrent neural networks and convolutional neural networks in modeling global temporal dependencies,this paper proposes a spatial-temporal prediction model based on temporal graph convolution network(ST-TGCN).The model employs graph convolutional network(GCN) in the temporal dimension by representing time steps as nodes within a graph,enabling the construction of global temporal relationships and the effective capture of temporal dependencies.Furthermore,by incorporating GCN in the spatial dimension,the model further extracts complex spatial-temporal dependencies.The performance of model is validated on the public transportation datasets Pems for California’shighway network.Experimental results demonstrate that the ST-TGCN model can more effectively capture temporal dependencies in traffc flow prediction tasks,thereby improving prediction accuracy.
Keywords: traffic flow prediction; temporal graph convolution network ; time series