摘要:交通流預測在智能交通系統的建設中起著關鍵性的作用,然而現有預測方法無法準確地挖掘其潛在的時空相關性,而且大多采用全連接網絡進行單步預測。為了進一步挖掘數據的時空特性以及提升長短期預測的精度,提出了一種門控循環圖卷積網絡(GR-GCN)模型。首先,利用頻域上的圖卷積結合門控循環單元(GRU)構建一個時空組件(STC)以同時捕獲節點的時空相關性,充分地提取數據的時空特征;然后,利用該時空組件構成編碼器單元,并將時間序列數據和路網結構數據輸入其中;最后,使用門控循環單元作為解碼器單元,并按照時間順序將兩者組成一個編碼器—解碼器(encoder-decoder)結構,依次解碼出每個時刻的預測結果。在加利福尼亞交通局(Caltrans)性能評估系統中高速公路數據集PeMSD4和PeMSD8進行了實驗。結果表明,所提模型GR-GCN在預測未來15 min、30 min、45 min和60 min的交通流量方面優于大多數現有基準模型,尤其是在長期預測方面。
關鍵詞:交通流量預測;圖卷積網絡;門控循環單元;編碼解碼結構
中圖分類號:TP183文獻標志碼:A
文章編號:1001-3695(2022)08-010-2301-05
doi:10.19734/j.issn.1001-3695.2022.01.0026
Traffic flow prediction based on gated recurrent graph convolutional network
Wang Ming1,Peng Jian1,Huang Feihu1,2
(1.College of Computer Science,Sichuan University,Chengdu 610065,China;2.Aostar Information Technologies Co.,Ltd.,Chengdu 610041,China)
Abstract:Traffic flow prediction plays a key role in the construction of intelligent transportation systems.However,existing prediction methods cannot mine the potential spatiotemporal correlation in the data accurately,and most of them use fully connected networks for single-step prediction.In order to further mine the spatial-temporal features of the data and improve the accuracy of long-term and short-term prediction tasks,this paper proposed a gated recurrent graph convolutional network(GR-GCN).Firstly,by using spectral graph convolution,it combined with gated recurrent unit(GRU) to construct spatial-temporal components(STC) to capture the spatial-temporal correlation of nodes in the network,fully extracted the spatial-temporal features of the data.Secondly,it used STC as an encodered unit and enter the time sequence data together with road network data into it.Finally,using gated recurrent unit as a decoder unit,and combined them into an encoder-decoder network structure(encoder-decoder) in chronological order,and decoded the prediction results at each moment in turn.
It carried out the experiments on the highway datasets PeMSD4 and PeMSD8 in the California Department of Transportation(Caltrans) performance evaluation system.The results show that model GR-GCN is better than most existing benchmark models in predicting the traffic flow in the future 15 min,30 min,45 min and 60 min,especially in long-term prediction.
Key words:traffic flow prediction;graph convolutional network;gated recurrent unit;encoder-decoder architecture
0引言
隨著中國城市化進程的加快,人們對出行的需求日益增大,導致交通擁堵問題日益嚴重,制約著中國的城市發展。目前亟需建立一套智能交通系統[1]來幫助人們合理規劃交通路線以及緩解交通擁堵。而智能交通系統的核心在于準確地預測未來的交通流狀況從而輔助系統中的任務。
目前,交通流預測模型主要可以分為三類:a)基于統計理論的預測方法,主要包含歷史平均分析預測法、自回歸差分滑動平均法[2](ARIMA)和卡爾曼濾波分析法[3];b)基于機器學習的方法,此類方法能夠建模交通流的非線性狀態,且可以通過自適應學習不斷調整參數至最優,以此獲得更加精確的計算結果,因此逐漸取代統計理論方法,目前用于預測方面的主流機器學習算法包含KNN[4](K-nearest neighbor)、支持向量機[5,6]等;c)基于深度學習的方法,也是目前研究的主要方向,深度學習不僅可以學習到數據的特征和相關性,還能在不進行人工特征工程的情況下,從簡單特征中挖掘到更為復雜的特征。通過疊加神經網絡結構,可以從淺層信息中提取特征,對解決現實生活中的復雜問題有著很大的優勢。目前,許多研究者已經將深度學習運用于交通流量預測領域,并有了顯著的成效。代表性的模型有Liu等人[7]提出的ConvLSTM模型,該模型結合了CNN與LSTM來捕獲數據的時空相關性。Li等人[8]提出的DCRNN模型利用擴散圖卷積對空間特征進行建模,并以基于GRU(gated recurrent unit)的編解碼結構對時間維度進行建模。文獻[9]提出的T-GCN模型以及文獻[10]提出的STGCN,均用譜圖卷積來捕獲節點間的空間依賴關系,并利用一維擴張卷積對時間特征進行建模。這些模型通過建模數據時空相關性來對交通流數據進行預測。但是,以上方法要么沒有有效建模數據的時空相關性,無法準確地捕獲數據的時空特征,要么就是使用單步預測去預測未來幾個時間步的數據,無法準確體現未來交通流數據的時序關系[11]。
交通流量作為一種典型的時空數據,在預測時既需要考慮道路網絡的空間依賴性,也需要考慮歷史數據以及未來數據的時間依賴性。單獨考慮時間或空間依賴,以及籠統地建模未來預測數據之間的關系會丟失對預測結果起作用的重要信息。為解決這一問題,本文提出了門控循環圖卷積網絡模型(gated recurrent graph convolutional network,GR-GCN),該模型利用頻譜域上的圖卷積捕獲節點間的空間依賴,并將帶有空間關系的節點輸入到門控循環單元中同時提取交通流數據的時空特征,然后通過編解碼結構對數據進行多步預測,準確地建模歷史數據間以及未來預測數據間的依賴關系。在真實交通流量預測數據集的實驗結果表明,所提模型效果優于基準模型。
1門控循環圖卷積網絡
1.1交通流預測任務
交通流預測任務是一個典型的時間序列預測任務,本文研究只涉及交通流數據,因此只用保留交通狀態數據中的一個屬性,即X∈Euclid Math TwoRApN×T×1。交通流預測問題根據給定歷史觀測數據X={xt-h+1,xt-h+2,…,xt}∈Euclid Math TwoRApN×H×1和對應時刻的路網結構G,其中H為歷史序列輸入的窗口大小,預測未來Tp時段所有節點的交通流數據Y={yt+1,yt+2,…,yt+Tp}∈Euclid Math TwoRApN×Tp,其中yt+Ti={y1t+Ti,y2t+Ti,…,yNt+Ti}∈Euclid Math TwoRApN表示在未來Ti時間段中整個交通網絡的流量狀態。簡而言之,交通預測問題的本質是學習一個函數F,根據歷史觀測數據和對應的路網結構G,預測未來時段Tp內所有節點的交通流數據Y,具體公式為
(yt+1,yt+2,…,yt+Tp)=F[(xt-h+1,xt-h+2,…,xt),G](1)
1.2圖卷積網絡
卷積神經網絡是以卷積操作為基礎的前饋神經網絡,可以高效地處理圖像、語音這類歐氏數據。但是實際生活中有很多數據都是非歐氏數據,這類數據并不能直接使用卷積網絡進行特征提取,因此提出了圖卷積網絡[12,13],其是一種將卷積操作擴展到圖結構的神經網絡,核心思想是中心節點對其鄰域節點進行信息聚合。表1展示了進行圖卷積操作涉及的一些符號定義。
其中,鄰接矩陣反映著圖中節點之間相鄰關系,度矩陣反映了與每個節點相連的邊數量。最能反映圖結構性質的是圖的拉普拉斯矩陣,該矩陣是圖研究領域中的核心研究對象,描述的是中心節點與鄰居節點信號的差異,可以反映節點鄰域的平滑性,具體定義為
L=D-A(2)
通常,正則化的拉普拉斯矩陣更為常用,定義為
Lsym=D-12LD-12=I-D-12AD-12(3)
GCN模型的原理是利用卷積本質上是頻域上的濾波這一特性,在頻域上進行操作[14]。將節點特征看成信號,通過傅里葉變換到頻域空間,最后通過傅里葉逆變換得到圖域卷積。每一層卷積僅處理一階鄰域信息,通過疊加若干卷積層可以實現多階鄰域的信息傳遞[15]。每一個卷積層的傳播規則如下:
H(l+1)=σ(LsymH(l)W(l))(4)
其中:σ(.)表示非線性激活函數。簡而言之,GCN的每一層通過鄰接矩陣和特征矩陣相乘得到每個頂點鄰居特征的匯總,然后再乘上一個參數矩陣,最后用激活函數得到聚合鄰居節點特征的矩陣。一個兩層的圖卷積網絡模型可以表示為
f(X,A)=σ( ReLU(XW0)W1)(5)
其中:X表示特征矩陣;A表示拓撲網絡的鄰接矩陣;表示使用拉普拉斯正則化后的鄰接矩陣;W0和W1分別為第一層與第二層的權重參數;σ(.)和ReLU(.)表示網絡所用的激活函數。
1.3門控循環單元
門控循環單元[16]網絡是基于循環神經網絡(recurrent neural network,RNN)的改進模型。相比于RNN,它能夠解決長期記憶和反向傳播中的梯度消失等問題。相比于長短期記憶網絡(long-short term memory,LSTM),使用GRU能夠與其達到相當的效果,并且相比之下更容易進行訓練,能夠很大程度上提高訓練效率。
GRU中的隱藏單元是一個特殊的細胞結構而不是傳統神經網絡的節點。在其內部有兩個門控,即一個重置門(reset gate)和一個更新門(update gate)。直觀上說,重置門決定了如何將新的輸入信息與前面的記憶相結合,更新門決定了前面記憶保存到當前時間步的量。GRU的細胞結構如圖1所示。
各個門控的計算公式為
z=σ(xtUz+st-1Wz),r=σ(xtUr+st-1Wr)
h=tanh(xtUh+(st-1⊙r)Wh),st=(1-z)⊙h+z⊙st-1(6)
其中:符號⊙表示兩個向量對應位置上的元素相乘;σ表示sigmoid激活函數;z代表更新門;r代表重置門;h代表當前記憶內容;st代表當前時間步的最終記憶。由于其具有循環結構,上一個細胞的最終記憶和當前時間步的輸入一起作為當前細胞的輸入。通過串聯這些單元結構,并將數據按照時間順序輸入到這些單元中,經過這些單元的運作和學習,即能捕捉到數據中潛在的時間相關性。
1.4編解碼結構
編碼器—解碼器模型(seq2seq)最初是用于機器翻譯領域的一種很成功的結構[17]。這種模型接受一個序列作為輸入,并將序列中的信息編碼為中間表示,最后使用解碼器解碼中間表示依次解碼為目標序列,由于使用解碼器來預測部分,預測結果一般不可知,往往需要將前一時刻的預測結果和編碼的隱藏表示一起作為下一時刻的輸入,如圖2所示。
這類結構具有很強的變通性,其編碼器和解碼器可以是不同類型的結構,在現有的研究中,編碼器可以為RNN、GRU、LSTM(long short term memory)、GCN(graph convolutional network)或者時空注意塊(spatial-temporal attention block)的任意組合,同時解碼器可以為RNN、GRU、LSTM或者多層感知機的任意組合[18,19]。只用滿足如下映射關系:
X=[X1,…,Xp]seq2seqY=[Y1,…,Yq](7)
其中:p與q分別為編碼器和解碼器的長度。這兩者可以不相等,因此可以將其應用于交通預測任務中,對數據進行多步預測。具體來說,編碼器將歷史序列編碼為一個隱藏中間表示C,然后將中間隱藏表示C輸入到解碼層使其解碼成為未來的交通狀態。
1.5門控循環圖卷積網絡模型
為了同時捕獲交通流數據的空間和時間的相關性,本文基于圖卷積網絡、門控融合單元以及編碼器解碼器提出了一個門控循環圖神經網絡模型,如圖3所示。
圖3的左半部分屬于編碼器,將歷史序列數據按照時間步依次輸入到編碼器的各個單元中,本文將此類單元稱之為時間圖卷積單元。單元運作過程如下:首先,單元中的圖卷積網絡被用來捕獲交通拓撲路網的結構并得到其空間特征;然后,將帶有空間信息的時間序列數據輸入到門控循環單元,信息在這些單元中動態變化來得到序列數據的時間特征;當整個歷史序列輸入完并處理完成后,最后一個單元的輸出即為中間表示C。編碼器的過程如下:
Hi=GRU[GC(xi),Hi-1],C=Ht,S0=Ht(8)
其中:Hi是與輸入xi相關聯的隱藏表示;H0是隨機初始化的非零矩陣。
圖3的右半部分屬于解碼器,解碼器則使用GRU單元對中間表示C進行解碼,解碼后得到隱藏表示。通過一個前饋神經網絡對未來某個時間步的數據進行預測。各個時間步的隱藏狀態及預測值y⌒j的具體計算公式為
Sj=GRU(C,y⌒j-1,Sj-1),y⌒j=SjW(9)
其中:Sj是與輸出y⌒j相關聯的隱藏表示,并且y⌒0是輸出序列的開始,屬于一個序列的初始信號,需要進行初始化,在模型中使用上一個時間步的流量特征對其進行初始化,便于解碼器的迭代。
對于時空建模單元(TGCN),其內部結構如圖4所示。
圖4中,st-1表示在t-1時刻的輸出,GC代表圖卷積處理過程,rt與zt分別代表在t時刻的重置門與更新門,st表示在t時刻的輸出,yt表示st經過全連接層變換的輸出。具體的計算過程如下:
zt=σ(Wz[f(A,xt),st-1]+bz)
rt=σ(Wr[f(A,xt),st-1]+br)
ht=tanh(Wh[f(A,xt),(st-1⊙rt)]+bh)
st=(1-zt)⊙ht+zt⊙st-1(10)
其中:f(A,xt)表示圖卷積的處理過程,計算公式如式(5)所示;W和b表示訓練過程中的權重系數與偏置。
解碼過程與編碼過程類似,由于在解碼過程中,輸入數據已經經過編碼器中的圖卷積進行了空間依賴性捕獲,則不需要再對其進行圖卷積操作了。所以,在解碼器部分,本文僅使用GRU對中間變量進行解碼,解碼方式如式(6)所示。
總的來說,時空圖卷積網絡模型能夠處理交通數據中復雜的空間依賴性和動態的時間依賴性。一方面,圖卷積網絡被用來捕獲交通城市網絡拓撲結構中節點之間的空間依賴關系。另一方面,門控循環單元被用來捕獲交通道路上信息的動態變化以得到節點自身的時間依賴性。最后使用編解碼器(seq2seq)結構完成對交通流的多步預測。通過以上模塊的有效結合,很好地建模了交通流的空間和時間方面的依賴性,并完成了預測任務。
2實驗結果與分析
2.1數據集
本文利用兩個真實的高速公路數據集PeMSD4和PeMSD8進行實驗。使用其中的車流量數據作為實驗數據集,使用采集頻率為30 s/次的原始數據匯總成時間間隔為5 min的數據樣本,即每個點一個小時包含12個交通數據樣本。
本文使用過去一個小時的流量數據(12個監測樣本)去預測未來15 min(3個樣本)、30 min(6個樣本)、45 min(9個樣本)和60 min(12個樣本)的流量數據,并按照7:1:2的比例將數據集劃分成為訓練集、驗證集和測試集,并且利用訓練集的均值和方差對劃分后的三個數據集進行歸一化處理,數據的詳細信息如表2所示。
2.2對比模型和評價指標
實驗通過兩個回歸任務常用的指標來評估模型的性能,分別為平均絕對誤差(mean absolute error,MAE)和均方根誤差(root mean squared error,RMSE),具體的計算公式為
MAE=1m∑mi=1|Yi-Y^i|(11)
RMSE=1m∑1m(Yi-Y^i)2(12)
本文選擇結合了MSE和MAE的Huber作為損失函數,通過調節超參數來確定MAE和MSE的作用范圍,能夠使得模型盡快收斂到全局最優解,具體的計算公式為
Lδ(Y,Y^)=12(Y-Y^)2if |Y-Y^|≤δ
δ|Y-Y^|-12δ2others(13)
為了驗證本文模型的有效性,設置了七種基準方法進行實驗對比。
a)HA(歷史平均模型)。該模型直接使用平均值作為預測結果,本文使用12個歷史時間片的平均值來預測未來若干個值。
b)ARIMA(自回歸差分滑動平均模型)[2]。該模型是應用較為廣泛的時間序列分析模型。
c)GCN(圖卷積網絡)[20]。將時間維度作為圖中節點的特征,最后使用全連接進行預測任務。
d)GRU(門控循環單元網絡)[16]。它是一種特殊的循環神經網絡模型,實驗中使用一層GRU和一層全連接的模型組合。
e)T-GCN(時間圖卷積網絡)[21]。T-GCN將圖卷積集成與循環神經網絡單元中,并用一層全連接的模型進行預測。
f)DCRNN(擴散圖卷積循環網絡)[8]。這是一個基于GNN和RNN的模型,它集成了GRU和雙向擴散卷積用于預測。
g)AGCRN(自適應圖卷積循環網絡)[22]。它采用自適應圖并將GRU與圖卷積與節點自適應參數學習相結合,使用全連接進行預測。
2.3實驗超參設置與分析
本文模型GR-GCN主要涉及的超參數包括學習率(lear-ning rate)、訓練輪數(epoch)、批大小(batch size)和隱藏層數量。本文設置學習率為0.001,batch大小設置為64、訓練輪數設置為200輪。
神經網絡隱藏單元的數量是本文模型重要的一個參數,不同隱藏單元的數量會很大程度地影響模型的預測精度。為了能夠選擇出最適合的值,本文設計了相關實驗。
在PeMSD4數據集上,隱藏單元數量分別設置為8、16、32、64與128,并且分析了預測誤差的變化。如圖5所示,橫坐標表示隱藏單元的數量,縱坐標表示預測誤差。
圖5反映了在PeMSD4與PeMSD8數據集下隨著隱藏單元數量的變化,平均絕對誤差MAE和均方誤差RMSE的大小。可以觀察到,隨著隱藏單元數量增大,誤差是先增大后減小的。當隱藏單元數量為64時,模型的預測誤差最小。主要是因為當隱藏單元逐漸增大到一定的值后,模型的復雜度以及計算復雜度會呈指數型增大,所以,本文在整個實驗過程中,將隱藏層數均設置為64。
2.4實驗及結果分析
表3展示了本文模型和基準模型在PeMSD4和PeMSD8數據集上預測15 min、30 min、45 min與60 min時交通流量預測的誤差表現。
從表3可以看出,就兩個評估指標而言,本文模型在兩個數據集上都接近最佳表現。本節將從三個方面來分析模型GR-GCN的優勢:
a)擁有低誤差優勢。可以發現,一些基于神經網絡并且充分考慮時間特征建模重要性的模型,包括GR-GCN、T-GCN以及GRU,普遍在預測精度方面會高于其他如HA、ARIMA這類基于統計理論的預測模型。以數據集PeMSD4上對于提前15 min的預測任務為例,GR-GCN和T-GCN的均方誤差比HA的均方誤差分別低了27.5%和14.1%,比ARIMA的均方誤差分別低了30.0%和17.1%。這是因為如HA、ARIMA這類模型無法處理時間序列這種復雜、非線性的數據。而GCN之所以具有很高的誤差,是由于GCN只考慮了空間特性而忽略了交通數據是一個典型的時間序列數據。除此之外,ARIMA作為一個比較成熟的時間序列預測模型,預測的準確性比HA模型更低的原因在于其難以處理長時以及非平穩的序列數據,并且在計算誤差時使用的是總體誤差的一個平均值,如果某個節點數據波動較大,則使得最終的預測效果變差。
b)模型的時空預測能力優勢。為了驗證模型時空預測方面的優勢,本文對比了GCN和GRU這種神經網絡模型。從圖6可以清晰地看到,基于時空特征的模型(GR-GCN)比基于單個特征(GCN、GRU)進行預測的效果要更好,以數據集PeMSD4上對于提前15 min的預測任務為例,GR-GCN的均方誤差相比GCN的均方誤差低了32.5%,比GRU的均方誤差低了11%,說明GR-GCN模型能夠很好地捕獲數據中的時間和空間相關性。
c)對長時預測能力優勢。為了更直觀地說明此方面的優勢,繪制了根據預測步長的變化來預測誤差變化的趨勢圖,如圖7、8所示。從圖中可以看出,隨著預測步數的增大,其他基準模型的均方誤差比本文模型GR-GCN增長速度更快。例如,在PeMSD4上預測單個時間步時,T-GCN與GRU的預測誤差與GR-GCN基本持平,但是在預測12個時間步時,差距明顯增大,GR-GCN比同樣為時空預測模型的T-GCN誤差小了11.1%。除此之外,相較于一些在短期預測上比較優秀的模型,如DCRNN和AGCRN,本文模型在短期預測方面(小于30 min)有所不足,均方誤差比AGCRN高了3%~5%。但是,在長期預測方面,本文模型GR-GCN得益于其編碼—解碼的預測結構,較這兩者模型表現略好,GR-GCN在預測60 min時比AGCRN的均方誤差小了3.1%。這證明了模型的編碼器—解碼器架構的加入,對數據的長期預測是有一定效果的。
為了能更好地理解GR-GCN模型的預測效果,在實驗結束環節,本文在PeMSD4上隨機選擇了兩個不同的路段,對這兩個路段提前15 min和提前60 min的交通流量預測情況進行可視化,對比預測值與真實值之間的差距,如圖9、10所示。其中灰色虛線代表真實的數據,綠色曲線代表提前15 min的預測結果,紅色曲線代表提前60 min的預測結果(見電子版)。
2.5模型消融實驗
此外,本文對模型GR-GCN進行了消融實驗(ablation experiment),操作方法類似于控制變量法,目的是為了證明模型當中的各個子模塊對于預測能力的提升能力。分別去除圖卷積模塊(our-GC)和解碼器模塊(our-De)對其進行分析。 在PeMSD4和PEMSD8數據集上觀察兩種變體模型和模型GR-GCN分別在15 min和60 min時平均絕對誤差(MAE)的情況,結果如圖11所示。
從圖11可以看出,在模型去除圖卷積網絡的情況下,無論是短期(15 min)預測任務還是長期(60 min)預測任務,預測誤差都有著明顯的增大。結果表明,同時考慮交通數據的時間和空間的特征比僅僅考慮時間維度的特征會更有利于預測。對于去除解碼器模塊,改用全連接進行單步預測的情況,在短期預測任務下誤差與本文模型沒有較大差距,但是對于長期預測任務差距明顯,這再次說明,使用能夠進行多步預測的解碼器是有利于長期預測的。
綜上所述,本文模型的各個模塊不僅對短期預測任務有較好的提升效果,還有利于降低在長期預測任務上的預測誤差。
3結束語
本文針對現有的交通流預測方法未能有效地結合時空特征以及大部分使用全連接層進行單步預測的問題,提出了基于編碼器解碼器結構的神經網絡模型。該模型在編碼器部分時空GCN提取相鄰節點交通流量的空間信息,再將帶有空間信息的節點通過GRU提取節點中的時序信息,得到一個包含時空特征的隱藏表示。最后通過解碼器依次解碼出每個時間步的預測信息,得出預測結果。最終在兩個真實路網數據集上的實驗結果表明,模型在MAE和RMSE兩個指標值下基本優于其他基線算法,可以有效地對交通流量進行預測。
參考文獻:
[1]徐紅兵,鄧惠俊.人工智能技術在城市智能交通系統中的應用[J].計算機產品與流通,2020(1):167.(Xu Hongbing,Deng Huijun.Application of artificial intelligence technology in urban intelligent transportation system[J].Computer Products and Circulation,2020(1):167.)
[2]Williams B M,Hoel L A.Modeling and forecasting vehicular traffic flow as a seasonal stochastic time series process[J].Journal of Transportation Engineering,2003,129(6):664-672.
[3]Okutani I,Stephanedes Y J.Dynamic prediction of traffic volume through Kalman filtering theory[J].Transportation Research Part B Methodological,1984,18(1):1-11.
[4]Lint H V,Hinsbergen C V.Short-term traffic and travel time prediction models[J].Artificial Intelligence Applications to Critical Transportation Issues,2012,22(1):22-41.
[5]Drucker H,Burges C J C,Kaufman L,et al.Support vector regression machines[J].Advances in Neural Information Processing Systems,1997,28(7):779-784.
[6]劉釗,杜威,閆冬梅,等.基于K近鄰算法和支持向量回歸組合的短時交通流預測[J].公路交通科技,2017,34(5):122-128,158.(Liu Zhao,Du Wei,Yan Dongmei,et al.Short-term traffic flow prediction based on combination of K-nearest neighbor algorithm and support vector regression[J].Journal of Highway and Transportation Research and Development,2017,34(5):122-128,158.)
[7]Liu Yipeng,Zheng Haifeng,Feng Xinxin,et al.Short-term traffic flow prediction with Conv LSTM[C]//Proc of the 9th International Confe-rence on Wireless Communications and Signal Processing.Piscataway,NJ:IEEE Press,2017:1-6.
[8]Li Yaguang,Yu R,Shahabi C,et al.Diffusion convolutional recurrent neural network:data-driven traffic forecasting[EB/OL].(2018-02-22).https://arxiv.org/abs/1707.01926.
[9]Bai Jiandong,Zhu Jiawei,Song Yujiao,et al.A3T-GCN:attention temporal graph convolutional network for traffic forecasting[J].International Journal of Geo-Information,2021,10(7):article No.485.
[10]Yu Bing,Yin Haiteng,Zhu Zhanxing.Spatio-temporal graph convolutional networks:a deep learning framework for traffic forecasting[C]//Proc of the 27th International Joint Conference on Artificial Intelligence.[S.l.]:International Joint Conferences on Artificial Intelligence Organization,2018:3634-3640.
[11]Ye Jiexia,Zhao Juanjuan,Ye Kejiang,et al.How to build a graph-based deep learning architecture in traffic domain:a survey[J].IEEE Trans on Intelligent Transportation Systems,2022,23(5):3904-3924.
[12]Niepert M,Ahmed M,Kutzkov K.Learning convolutional neural networks for graphs[C]//Proc of the 33rd International Conference on International Conference on Machine Learning.2016:2014-2023.
[13]Wu Zonghan,Pan Shirui,Chen Fengwen,et al.A comprehensive survey on graph neural networks[J].IEEE Trans on Neural Networks and Learning Systems,2020,32(1):4-24.
[14]Bruna J,Zaremba W,Szlam A,et al.Spectral networks and locally connected networks on graphs[EB/OL].(2014-05-21).https://arxiv.org/abs/1312.6203.
[15]Defferrard M,Bresson X,Vandergheynst P.Convolutional neural networks on graphs with fast localized spectral filtering[C]//Proc of the 30th International Conference on Neural Information Processing Systems.2016:3844-3852.
[16]Chung J,Gulcehre C,Cho K,et al.Empirical evaluation of gated recurrent neural networks on sequence modeling[EB/OL].(2014-12-11).https://arxiv.org/abs/1412.3555.
[17]Luong M T,Le Q V,Sutskever I,et al.Multi-task sequence to sequence learning[EB/OL].(2016-03-01).https://arxiv.org/abs/1511.06114.
[18]Lu Mingming,Zhang Kunfang,Liu Haiying,et al.Graph hierarchical con-volutional recurrent neural network(GHCRNN) for vehicle condition prediction[EB/OL].(2019-03-12).https://arxiv.org/abs/1903.06261.
[19]Chen Weiqi,Chen Ling,Xie Yu,et al.Multi-range attentive bicomponent graph convolutional network for traffic forecasting[J].Procee-dings of the AAAI Conference on Artificial Intelligence,2020,34(4):3529-3536.
[20]Kipf T N,Welling M.Semi-supervised classification with graph convolutional networks[EB/OL].(2017-02-22).https://arxiv.org/abs/ 1609.02907.
[21]Zhao Ling,Song Yujiao,Zhang Chao,et al.T-GCN:a temporal graph convolutional network for traffic prediction[J].IEEE Trans on Intelligent Transportation Systems,2020,21(9):3848-3858.
[22]Bai Lei,Yao Lina,Li Can,et al.Adaptive graph convolutional recurrent network for traffic forecasting[J].Advances in Neural Information Processing Systems,2020,33:17804-17815.
收稿日期:2022-01-23;修回日期:2022-03-08基金項目:四川省重點研發計劃資助項目(2020YFG0089,22ZDYF3599,2020YFG0304,2020YFG0308)
作者簡介:汪鳴(1997-),男,湖南長沙人,碩士研究生,主要研究方向為圖神經網絡、時間序列預測;彭艦(1970-),男(通信作者),四川成都人,教授,博導,博士,主要研究方向為深度學習、分布式計算(jianpeng@scu.edu.cn);黃飛虎(1990-),男,四川遂寧人,講師,博士,主要研究方向為時空大數據、深度學習.