







摘 要:針對交通速度預測方法主要考慮實際交通路網而忽略人群活動熱點區域的影響問題,提出一種層次時空圖卷積網絡模型(hierarchical spatio-temporal graph convolutional network, H-STGCN)。首先,通過計算路段節點之間的距離構建路網結構圖,并使用聚類算法得到熱點區域的聚類圖;其次,利用圖卷積網絡層和時空注意力機制層來提取交通速度數據的時空特征;最后,引入過往鄰近時間段、昨天相同時間段及上周同一時間段3個時間分量的交通速度數據分別進行訓練,以挖掘交通速度在相同時間段的規律。實驗結果表明,模型在預測時長為30、60和120 min時,相比于經典的時空圖卷積模型,平均絕對誤差分別降低了6.9%、13.6%和14.6%,實現了更準確的預測,能更好地服務于智能交通系統。
關鍵詞:交通速度預測;圖卷積;注意力機制;時空特征;智能交通系統
中圖分類號:U491.14;U491.2 DOI:10.16375/j.cnki.cn45-1395/t.2024.04.012
0 引言
為了緩解交通擁堵,提高人們出行的舒適度,許多國家開始研究智能交通系統(intelligent traffic system, ITS)[1]。在智能交通系統中,交通速度預測是一個非常重要的問題?,F有的交通速度預測方法主要分為3類:基于統計分析、機器學習及深度學習的預測方法。在基于統計分析的預測方法中,具有代表性的有歷史平均值法(history average, HA)[2]、卡爾曼濾波模型[3-5]及ARIMA(autoregressive integrated moving average)模型及其變形[6]。文獻[7]提出一種基于無跡卡爾曼濾波的交通預測模型,預測精度較高且比較穩定,然而其計算代價相當高;實驗表明ARIMA模型在交通狀態周期性變化較強時,預測效果比較好,但面對非平穩的交通數據時,預測準確性會大幅降低[8]。
研究表明統計分析方法在交通狀態變化周期性較強時,效果較好,但面對非平穩的交通數據時,預測準確性會大幅降低。相較于傳統的統計分析方法,機器學習方法因其在結構和參數上的靈活性,使其在處理一些非線性數據的問題上更加具有優勢,典型的代表有支持向量機(support vector machine, SVM)模型和K近鄰模型(K-nearest neighbor, KNN)等。但基于機器學習的交通速度預測方法對輸入數據的質量非常敏感,在實際應用中需要綜合考慮各種因素。
神經網絡模型具有強大的表示能力,廣泛應用于計算機視覺、自然語言處理和交通預測[9-11]等領域。如典型的遞歸神經網絡(recurrent neural network, RNN)、長短期記憶網絡(long short term memory, LSTM)[12]和門控遞歸單元(gated recurrent unit, GRU)[13]等。但傳統的神經網絡模型往往忽略了道路網絡的自然連接,無法充分挖掘交通速度數據的空間特征[14-15]。圖卷積遞歸網絡(graph convolution recurrent network, GCRN)[16]和門控時空圖卷積網絡[17]通過將圖卷積網絡(graph convolution network, GCN)與RNN或門控CNN相結合來解決交通預測的序列建模問題。然而,這些方法均未能充分挖掘交通數據中潛在有價值的時空關系,實際的預測效果相對較差。
本文基于GCN提出了一種層次時空圖卷積網絡模型(hierarchical spatio-temporal graph convolutional network, H-STGCN),旨在提高模型對時空信息的學習能力。具體而言,引入過往鄰近時間段、昨天相同時間段以及上周同一時間段3個時間分量的交通速度數據分別進行訓練,挖掘交通速度在相同時間段的規律。通過計算路段節點之間的距離構建路網圖,并使用聚類算法得到了熱點區域的聚類圖,捕獲交通速度數據的空間特征。利用圖卷積網絡層和時空注意力機制層來提取交通速度數據的時空特征,充分挖掘交通速度數據的時空依賴關系。最后,將3個時間分量的輸出進行合并,并進行預測。
1 算法構建
1.1 問題描述
交通預測可以被視為一個函數,該函數將觀測到的路網交通數據映射到未來的交通數據上,具體包括流量、速度等。同時,交通預測也是一個序列建模問題,通過使用滑動窗口技術來建立歷史數據與未來數據之間的關聯。在本研究中,以交通速度預測作為目標,即通過歷史數據來預測未來一段道路上的交通速度,將這一過程公式化如下:
[Xt+1, Xt+2,…, Xt+T′=fXt-T,…, Xt-1, Xt] , (1)
式中:t表示時間;[T]表示輸入的序列長度;[T′]表示要預測的序列長度;[X∈RN×t]為特征矩陣,R為實數集,N表示道路節點總數。將交通網絡定義為無向圖[G=(V, R, A)],其中[V]是路段節點的集合,[R]是邊的集合,表示節點之間的連通性,[A∈RN×N]表示圖[G]的鄰接矩陣。
1.2 模型結構
H-STGCN模型的整體框架圖如圖1所示,包含5大模塊,分別為數據準備模塊、熱點區域圖生成模塊、時空注意力模塊、圖卷積模塊、特征融合模塊。實驗中分別對過往鄰近時間段、昨天相同時間段以及上周同一時間段3個歷史時間段進行訓練,使用參數矩陣來進一步合并3個時間的分量輸出,并融合熱點區域特征,以獲得最終的預測結果。為了提高訓練效率,還采用了殘差學習框架[18]。
1.3 數據準備
假設使用的速度數據每天記錄q次,當前時間為[t0],那么當前需要預測的交通速度的時間段[Tp]往往和過往臨近時間段[Th]有關,且與昨天相同時間段[Td]以及上周當日相同時間段[Tw]存在著極強的相似性,其中[Th]、[Td]和[Tw]都是[Tp]的整數倍。
[Xc,it∈R]表示節點i在t時間的第c個特征值,并且[Xit∈RF]表示節點i在時間t的所有特征的值。[Xt=(X1t, X2t,…, XNt)∈RN×F]表示t時間所有節點的所有特征值,F表示特征值大小。[X=(X1, X2,…, Xτ)∈RN×F×τ]表示τ時間段內所有節點的所有特征的值。此外,設置[yit=Xf,it∈R]表示未來節點i在t時刻的交通速度。則3個時間段的交通速度數據[Xh]、[Xd]、[Xw]表示公式為
[Xh=Xt0-Th+1, Xt0-Th+2,…, Xt0∈RN×F×Th], (2)
[Xd=Xt0-q+1, Xt0-q+2,…, Xt0-q+Tp∈RN×F×Th], (3)
[Xw=Xt0-7×q+1, Xt0-7×q+2,…, Xt0-7×q+Tp∈RN×F×Th.] (4)
1.4 熱點區域圖生成
基于路網結構得到鄰接矩陣,對鄰接矩陣的拉普拉斯矩陣進行譜聚類,得到路網的劃分,分區的每個簇看作一個熱點區域節點。熱點區域節點的值是該區域內路網節點交通速度數據平均值和最小值的組合。而熱點區域圖的邊緣是基于交通路網結構圖構造,如圖2所示的交通路網中,若節點i與節點j相連,同時根據聚類算法的結果,節點i屬于區域1,節點j屬于區域2,那么在熱點區域圖中,區域1和區域2相連,由此來構造熱點區域的連接圖。
在訓練過程中,分別對3個時間段的道路節點數據[Xh]、[Xd]、[Xw]和熱點區域數據[X_ch]、[X_cd]、[X_cw]進行訓練,[X_ch]、[X_cd]、[X_cw]的計算參照路網節點數據的計算方法。道路節點數據與熱點區域數據除了輸入數據不同外,主要區別在于道路節點數據中的時空塊輸出特征還與熱點區域數據進行了特征融合。
1.5 時空注意力模塊
不同道路之間的交通狀態往往相互關聯,且這種相互依賴具有顯著的影響。使用注意力機制,可以自適應地調整節點之間的關注程度,更好地捕捉它們之間的動態關聯。以過往臨近時間段的交通速度[Xh]為例,表示公式如式(5)和式(6)所示,
[Sh=WSh?σX(r-1)hW1W2W3X(r-1)hT+bSh,] (5)
式中:[WSh、bSh∈RN×N、W1∈RTr-1、W2∈RCr-1×Tr-1、]
[W3∈RCr-1]為可學習參數;[σ]為激活函數;[X(r-1)h=(X1, X2,…, XTr-1)∈RN×Cr-1×Tr-1]是第r個時空塊的輸入,[Cr-1]是第r層中輸入數據的通道數,[Tr-1]是第r層中時間維度的長度。
[S′hi, j=expShi, jj=1NexpShi, j.] (6)
根據該層的當前輸入動態計算注意矩陣S。S中的元素[Si, j]的值在語義上表示節點i和j的相關強度,然后使用[softmax]函數來保證節點的注意力權重和等于1。在進行圖卷積時,將利用鄰接矩陣A與空間注意矩陣[S '∈RN×N]動態調整節點之間的影響權重。
在時間維度上,交通狀況的演變具有一定的連續性。本文采用時間注意力機制來捕捉交通數據中的時間相關性,為不同的數據賦予適當的權重,以實現自適應性分析。以過往臨近時間[Xh]為例,公式如式(7)和式(8)所示,
[Eh=WEh?σ(X(r-1)h)TU1U2X(r-1)hU3T+bEh,] (7)
[E′hm, n=expEhm, nj=1Tr-1expEhm, n,] (8)
式中:[WEh、bEh∈RTr-1×Tr-1、U1∈RN×1、U2∈RCr-1×N、]
[U3∈RCr-1]是可學習的參數。時間相關矩陣E由不同的輸入決定。E中元素[Em, n]的值在語義上表示m、n時刻之間的依賴程度。最后,時間相關矩陣E通過[softmax]函數進行歸一化,并直接將歸一化的時間注意力矩陣應用于輸入,得到[Xr-1h=X1, X2,…, XTr-1=X1, X2,…, XTr-1E '∈RN×Cr-1×Tr-1],最后通過合并相關信息來動態調整輸入。
1.6 圖卷積模塊
GCN起源于圖譜理論,相對于傳統的卷積神經網絡,GCN在處理不規則的圖數據方面展現出獨特優勢,這種不規則的圖數據,通常用其對應的拉普拉斯矩陣表示。拉普拉斯矩陣定義為:[L=D-A],其中,L表示拉普拉斯矩陣,D是對角矩陣,對角線元素表示每個節點的度數,A是鄰接矩陣,表示節點之間的連接關系。與傳統的CNN在規則網格數據上進行卷積操作不同,GCN借助拉普拉斯矩陣,可以考慮節點之間的連接關系,并且通過卷積操作,能實現對節點的特征提取,從而有效處理不規則的圖結構。標準化的拉普拉斯矩陣定義為
[L=IN-D-12AD-12=UΛUT,] (9)
式中:[IN]是單位矩陣;[D∈RN×N]是對角矩陣,由節點度組成;[A∈RN×N]是鄰接矩陣;U是傅里葉基;[Λ]為矩陣L特征值組成的對角矩陣。圖卷積是一種卷積運算,通過使用傅里葉域中對角化的線性算子來代替經典卷積算子。數據[X]在圖上的卷積操作表示為
[gθ?GX=gθ(L)X=gθUΛUTX=Ugθ(Λ)UTX ,] (10)
式中:[gθ]為卷積核,參數[θ∈RN]是切比雪夫多項式的系數的向量;[?G]表示圖卷積操作。對相對復雜的圖進行拉普拉斯矩陣特征值的分解時,計算代價相當大,因此可以采用切比雪夫多項式近似的方法有效地解決這個問題[19],表達式如公式(11)所示,
[gθ?GX=gθ(L)X=k=0k-1θktk(L)X,] (11)
式中:[L=2λmaxL-IN],[λmax]為拉普拉斯矩陣的最大特征值。
切比雪夫多項式的遞歸定義式為
[tk(X)=2Xtk-1(X)-tk-2(X),] (12)
特別地,[t0(X)=1],[t1(X)=X].
利用切比雪夫多項式的近似展開解完成圖卷積運算,以圖中每個節點為中心提取周圍0到[(k-1)]個鄰接節點的信息。為了動態調整節點之間的相關性,對于切比雪夫多項式的每一項,將空間注意力矩陣[S'∈RN×N]與切比雪夫多項式[tk(L)]相結合,得到[tk(L)⊙S'],其中[⊙]是哈達瑪乘積。最終,將上述過程公式化如下所示,
[gθ?GX=gθ(L)X=k=0k-1θktk(L)⊙SX.] (13)
在圖卷積操作中捕獲每個節點在空間維度上的鄰接信息后,對于每個時間段t,可得[gθ?GXt],再將其進一步堆疊時間維度上的標準卷積層,提取相鄰時間段上的時間相關性。以過往臨近時間為例,過程用公式(14)表示為
[X(r)h=RELUΘ?σgθ?GX(r-1)h∈RCr×N×Tr] ,(14)
式中:[RELU]和[σ]為激活函數;[Θ]為參數模型;[?]表示標準卷積操作。
1.7 特征融合模塊
為準確預測未來時間段的交通狀況并避免在某些時間周期過度擬合的現象,通過關注3個不同時間段的交通數據來解決這個問題,并通過歷史數據學習這3種時間周期的影響權重,公式化過程為
[Y=Qh⊙Yh+Qd⊙Yd+Qw⊙Yw+by ,] (15)
式中:[Qh]、[Qd]、[Qw]和[by]是可學習參數,反映了3個時間維分量對預測目標的影響程度。同時,為了實現道路路網和熱點區域間的交通狀態的融合,定義一個變換矩陣[H∈RN×NR]為
[Hi, z=1,i∈z,0,其他, ] (16)
式中:i為路網節點;z為聚類后的熱點區域。如果道路節點i屬于區域z的特征便和道路節點i的特征連接起來。由于交通數據具有動態變化的特征,路段與區域之間的關系也是多變的,因此,定義一個動態轉移矩陣[H′∈RN×NR],計算方法如公式(17)所示:
[H′=σ(F)TU1U2FRU3T+bT?H .] (17)
即對于路段特征[F∈RN×T×F]和區域特征[FR∈RNR×T×F],可得融合特征[Fout∈RN×T×F],最后在輸出處增加一個[RELU]激活函數,并通過線性變換得出最終的輸出結果,如式(18)所示:
[Output=LinearRELU(Fout).] (18)
2 實驗與分析
2.1 數據集
為驗證所提模型的準確性,在實際實驗中分別選取了國內和國外2個公開數據集來評估模型的預測性能。每個數據集按6∶2∶2的比例設置訓練集、驗證集和測試集。
GAIA數據集:該數據集是在中國濟南收集,包含市中心的561個路段(節點),采樣率為每10 min一個樣本,樣本數為52 286個,數據集中包含路段的平均速度。
PeMSD4數據集:該數據集是舊金山灣區的交通數據,由29條道路上的3 848個測速儀器記錄而成,由于測速器太過密集,大部分節點數據都非常相似,影響實驗效果,因此將距離小于3.5英里(約為5.632 7 km)的測速器移除,篩選后有307個檢測器,每5 min收集一次交通數據,實驗過程中將其處理成每10 min一個樣本。
2.2 參數設置
本文實驗是在Linux操作系統中的PyCharm2021.3.3專業版進行的,其中Intel(R) Core(TM) i7-10870H CPU @ 2.20GHz,運行內存為32 GB,顯卡型號為NVIDIA RTX3060,程序運行在python3.9以及深度學習框架Pytorch2.0.1的環境下。在本實驗中對于3個時間周期長度,將其設置為:[Th=12、][Td=12、][Tw=12],預測窗口的大小[Tp=12],[batch_size]設置為32。同時分別對切比雪夫多項式在[k={1,2,3,4,5,6}]、卷積核大小[g={16,32,64,128,256}]、隱藏層維度[dim={16,32,64,128,256}]時分別進行了調參實驗(圖3)。如圖3所示,當k [=]3、g [=]64、dim[=]128時,模型訓練效果最佳。模型選擇[Adam]優化算法作為優化器,初始學習率設置為:γ =0.001。
采用多種評估指標來對本文方法進行評估,包括平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)。為了全面比較,與6種常見的交通速度預測方法進行對比,分別是歷史平均值(HA)、自回歸移動平均模型(ARIMA)、長短期記憶網絡(LSTM)、門控遞歸單元(GRU)、圖卷積循環網絡(GCRN)和門控時空圖卷積網絡(GatedSTGCN)。在2個不同的數據集上進行實驗,數據集涵蓋了多種交通場景,且在時間周期、預測窗口大小等方面具有一定的差異。通過對比實驗,評估本文方法在不同數據集上的表現性能。
2.3 基線對比實驗
表1和表2分別比較了層次時空圖卷積網絡模型(H-STGCN)和基線模型在智能運維領域通用公開數據集(GAIA)和交通流量PeMSD4數據集上30、60和120 min預測的性能,H-STGCN在2個數據集上都獲得了優異的結果,其中在GAIA數據集上30 min的預測過程中效果最好,在60和120 min的評價指標中所有模型都有所降低,這可能是因為隨著預測時間的變長,模型的誤差也在逐步變大,無法充分捕捉時空特征??傮w來說,GAIA數據集上的預測效果要優于PeMSD4,存在這種現象的原因可能有2個:1)因為PeMSD4的數據的路網節點經過了處理,節點在空間上的連續性要稍微弱一點,處理后路網節點的總數大約只有GAIA數據集的一半,因而對空間注意力提取空間特征有一定的影響;2)由于HA模型和ARIMA模型適合在線性且路網相對較簡單的環境下工作,因此效果并不理想。與其他深度學習模型相比,H-STGCN的預測精度比GCRN和GatedSTGCN更加精確,這說明本文對交通熱點區域交通速度的處理能更加充分地學習交通速度的時空規律??傮w來說,基于GCN的預測方法優于其他方法,這意味著H-STGCN更適合用于交通速度預測。
圖4(a)—(c)為各個模型在GAIA數據集上預測時間分別為30、60和120 min的MAPE值的柱狀圖,圖4(d)—(f)為各個模型在PeMSD4數據集上預測時間分別為30、60和120 min的MAPE值的柱狀圖。通過柱狀圖的分析,可以觀察到在GAIA數據集和PeMSD4數據集上,H-STGCN模型在所有模型中具有最小的MAPE,這表明H-STGCN模型在交通速度預測方面的性能和穩定性均優于其他6個基準模型。同時,可以看出統計學分析方法HA和ARIMA的整體效果明顯較差,這與本文的預期一致。此外,相對于LSTM模型,在短期預測方面,比GRU模型表現更好,但隨著預測時間的延長,預測未來60和120 min時,其性能反而不及LSTM模型。這表明盡管GRU模型通過減少門控結構來減少計算量并優化模型,但在進行長期預測時其效果受到一定影響。總體而言,H-STGCN模型展現出最佳的效果,這說明本文提出的層次時空注意力機制在對多個時間段的熱點區域和普通路網的交通速度進行融合時,能更加充分地捕獲交通速度的變化規律,對交通速度預測具有一定的優化效果。
2.4 預測性能實驗
模型預測值與真實值的可視化圖如圖5所示,在2個數據集的測試數據上各選取了連續2天的數據,繪制了預測后30 min交通速度的預測值與真實值,圖中黑色線表示交通數據的真實值,紅色線表示H-STGCN模型的預測值??梢钥闯?,在實際生活中,交通數據每時每刻都在上下波動,變化非常大,并且在上午9點和下午6點會出現一個速度的峰谷值,本文的模型能大致擬合實際交通狀態,在交通速度驟減的地方,預測效果存在一定的滯后,但很快也能擬合實際數據,這表明本文的模型很穩定,在交通速度預測方面存在一定的優勢。
為了準確評估本文模型在交通驟變場景下的性能,選擇了2個具有交通復雜性的路段進行真實值和預測值的可視化展示,如圖6所示,對于第一個路段,交通速度的真實值呈現出較大范圍的波動,而模型的預測值盡管能夠捕捉交通流的整體變化趨勢,卻未能完全擬合波動較大的區域??赡芤驗樵撀范蔚慕煌E變情況較為復雜,而且這種變化只是瞬間發生,導致模型在捕捉到這種復雜變化時面臨困難。對于第二個路段,真實值和預測值之間的趨勢相對一致,但仍存在一些波動。在某些時間步中,預測值能夠較好地匹配真實值,但在其他時間步中仍存在一定的誤差。這表明模型在捕捉該路段的交通驟變情況方面具備一定的能力。通過2個交通復雜路段的分析,表明H-STGCN在捕捉交通驟變情況方面具有一定的潛力。
3 結論
為了充分捕捉交通速度的時空相關性,提出了一種全新的層次時空圖卷積模型H-STGCN。該模型不僅能夠捕捉交通速度數據的周期性規律,還能挖掘熱點區域的交通速度特征。同時,通過引入時空注意力機制,能更加充分地挖掘交通速度數據的時空特征。通過在2個真實數據集上進行實驗,發現該模型能更好地適應各種交通場景。尤其是在預測周期較長的情況下,該模型相比其他基線模型具有更高的準確性。實際上,高速公路交通流量受到許多外部因素的影響,如天氣和社會事件,今后將重點考慮外部因素的影響,進一步提高預測精度。
參考文獻
[1] ZHU L,YU F R,WANG Y G,et al. Big data analytics in intelligent transportation systems:a survey[J]. IEEE Transactions on Intelligent Transportation Systems,2019,20(1):383-398.
[2] ZHANG J B,ZHENG Y,QI D K,et al. Predicting citywide crowd flows using deep spatio-temporal residual networks[J]. Artificial Intelligence,2018,259:147-166.
[3] 王東京,劉繼濤,俞東進. 電動自行車軌跡簡化與自適應地圖匹配算法[J].軟件學報,2023,34(8):3793-3820.
[4] 蔣銳,虞躍,徐友云,等. 基于CHAN的改進卡爾曼濾波室內定位算法[J].通信學報,2023,44(2):136-147.
[5] VAN HINSBERGEN C P I J,SCHREITER T,ZUURBIER F S,et al.Localized extended Kalman filter for scalable real-time traffic state estimation[J].IEEE Transactions on Intelligent Transportation Systems,2012,13(1):385-394.
[6] WILLIAMS B M,HOEL L A.Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process:theoretical basis and empirical results[J].Journal of Transportation Engineering,2003,129(6):664-672.
[7] 陳明強,傅嘉赟.基于無跡卡爾曼濾波的飛行航跡預測方法研究[J].計算機仿真,2021,38(6):27-30,36.
[8] ALGHAMDI T,ELGAZZAR K,BAYOUMI M,et al.Forecasting traffic congestion using ARIMA modeling[C]//2019 15th International Wireless Communications & Mobile Computing Conference (IWCMC).IEEE,2019:1227-1232.
[9] 秦勝君,李婷. 一種基于長短記憶模型的交通軌跡異常挖掘模型[J].廣西科技大學學報,2021,32(2):58-64.
[10] 鄒國建,賴子良,李曄. 基于時空注意力網絡的動態高速路網交通速度預測[J].計算機工程,2023,49(2):303-313.
[11] 徐冰冰,岑科廷,黃俊杰,等.圖卷積神經網絡綜述[J].計算機學報,2020,43(5):755-780.
[12] 黃偉堅,李春貴.基于時空注意力圖卷積神經網絡的交通速度預測[J].廣西科技大學學報,2022,33(1):54-62.
[13] CUI Z Y,KE R M,PU Z Y,et al.Deep bidirectional and unidirectional LSTM recurrent neural network for network-wide traffic speed prediction[EB/OL].2018:arXiv:1801.02143.http://arxiv.org/abs/1801.02143.
[14] AGARAP A F M. A neural network architecture combining gated recurrent unit(GRU)and support vector machine(SVM)for intrusion detection in network traffic data[C]//Proceedings of the 2018 10th International Conference on Machine Learning and Computing. 2018:26-30.
[15] ZHENG G,CHAI W K,KATOS V.A dynamic spatial-temporal deep learning framework for traffic speed prediction on large-scale road networks[J].Expert Systems with Applications,2022,195:116585.
[16] SEO Y,DEFFERRARD M,VANDERGHEYNST P,et al.Structured sequence modeling with graph convolutional recurrent networks[C]//International Conference on Neural Information Processing.2018:362-373.
[17] YU B,YIN H T,ZHU Z X.Spatio-temporal graph convolutional networks:a deep learning framework for traffic forecasting[EB/OL].2017:arXiv:1709.04875.http://arxiv.org/abs/1709.04875.
[18] WEI X Q,YANG F M,WU C Z. Deep residual networks of residual networks for image super-resolution[C]//LIDAR Imaging Detection and Target Recognition 2017. SPIE,2017,10605:921-926.
[19] SIMONOVSKY M,KOMODAKIS N. Dynamic edge-conditioned filters in convolutional neural networks on graphs[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017:29-38.
Traffic speed prediction based on hierarchical spatio-temporal
attention graph convolutional network
ZHOU Xiaoyan1 , CAO Wei2 , XU Chao2
(1. General Education Department, Fuzhou Polytechnic, Fuzhou 350108, China; 2. College of Computer and
Cyber Security, Fujian Normal University, Fuzhou 350117, China)
Abstract: In response to the problem that the traffic speed prediction method mainly considers the actual road network and neglects the effect of the hot spot areas of crowd activity, a hierarchical spatio-temporal graph convolutional network(H-STGCN) model is proposed. Firstly, a road network structure graph is structured by calculating the distances between road segment nodes. Then, a clustering graph of the hot spot areas is obtained by using clustering algorithms. Secondly, the spatio-temporal features of the traffic speed data are extracted by using graph convolutional layers and spatio-temporal attention mechanism layers. Finally, three temporal components of traffic speed data, namely, historical adjacent time periods, the same time period from the previous day, and the corresponding time period from the previous week, are introduced for training respectively, so as to uncover the patterns of traffic speed during the same time periods. The experimental results show that when the prediction time of the model is 30, 60 and 120 min, the mean absolute error is reduced by 6.9%, 13.6% and 14.6%, respectively, compared with the classical spatio-temporal graph convolution model, which realizes more accurate prediction and can better serve the intelligent traffic system.
Keywords: traffic speed prediction; graph convolution; attention mechanism; spatio-temporal features; intelligent traffic system
(責任編輯:羅小芬)
收稿日期:2023-09-02;修回日期:2023-11-08
基金項目:福建省科技廳對外合作項目(2020I0014)資助
第一作者:周曉燕,碩士,副教授,研究方向:應用數學、大數據分析與挖掘