摘要:交通流預測是智能交通系統中的重要組成部分,由于交通數據的復雜性,長期而又準確的交通流預測一直是時間序列預測中最具挑戰性的任務之一。近年來,研究人員將基于圖神經網絡的時空圖建模方法應用于交通流預測任務,并取得了良好的預測性能。然而,現有的圖建模方法僅通過預定義的鄰接結構反映道路網絡中的空間依賴關系,忽略了各節點之間的序列關聯關系對預測的重要性。針對這一局限性,提出了一種自適應門控圖神經網絡(Ada-GGNN),其核心為通過空間傳遞模塊同時捕獲道路網絡的空間結構及自適應的時序相關性,并通過門控機制學習節點上的時間序列特征。在兩個真實交通網絡數據集PeMSD7和Los-loop上的實驗結果證明了該模型具有更優越的性能。
關鍵詞:交通流預測;時空圖;自適應門控圖神經網絡;時序相關性
中圖分類號:TP391文獻標志碼:A
文章編號:1001-3695(2022)08-011-2306-05
doi:10.19734/j.issn.1001-3695.2022.01.0017
Traffic flow prediction based on adaptive gated graph neural network
Wang Yang,Zheng Jin,Liu Ying,Li Ping
(College of Computer Science,Southwest Petroleum University,Chengdu 610500,China)
Abstract:Traffic flow prediction is an important part of intelligent transportation system.Due to the complexity of traffic data,long-term and accurate traffic flow prediction has always been one of the most challenging tasks in time series forecasting.In recent years,researchers have applied spatial-temporal graph modeling methods based on graph neural networks to traffic flow prediction tasks which achieved good prediction performance.However,existing graph modeling methods only reflect the spatial dependence in road networks through predefined adjacency structures,ignoring the importance of time-series correlation between nodes for prediction.Aiming at this limitation,this paper proposed an adaptive gated graph neural network(Ada-GGNN),the core of which was to simultaneously capture the spatial structure of the road network and adaptive time series correlation through the spatial passing module,and learned time-series features on nodes through the gating mechanism.The experimental results on two real-world traffic network datasets PeMSD7 and Los-loop show that the model has better performance.
Key words:traffic flow prediction;spatial-temporal graph;adaptive gated graph neural network;time series correlation
0引言
智能交通系統是智慧城市發展不可或缺的組成部分,而準確實時的交通流預測作為智能交通系統的基礎和重要研究方向,它是減少交通事故、緩解交通擁堵和提高交通運輸效率的有效解決方案。在實際生活中,交通流通常由道路上的傳感器記錄,如流量、車速、道路占用率等。交通流預測旨在根據道路網絡中的歷史交通數據(如傳感器記錄)預測未來一段時間的交通數據。傳統的交通流預測模型主要是基于統計或機器學習的方法,如歷史平均模型(HA)[1]、自回歸整合移動平均模型(ARIMA)[2]、向量自回歸(VAR)[3]、K-最近鄰模型(KNN)[4]等,以上方法在實際應用中往往預測效果不佳,它們依賴于數據的平穩性假設。然而交通狀況是復雜的,受各種環境因素影響,表現出隨機性、周期性、趨勢性和時空性等特點。其次,這些方法需要經過復雜的特征工程進行建模,并且只考慮了序列的時間信息,而忽略了空間信息對于交通流預測的重要性。
近年來,深度學習因其強大的特征表達能力和非線性擬合能力被廣泛應用于交通流預測任務。Yu等人[5]使用深度的長短期記憶網絡(LSTM)來預測交通序列,實驗證明了基于神經網絡的方法相較于傳統方法具有更優異的結果,但是該方法仍沒有考慮交通路網的空間結構。Shi等人[6]設計了ConvLSTM模型用于降雨預測,它將卷積神經網絡(CNN)和循環神經網絡(RNN)進行結合,分別對空間和時間相關性進行建模。之后,Zhang等人[7]將交通路網轉換為規則的網格,然后采用CNN提取空間特征。雖然這些模型可以提取數據的時空特征,但交通道路本質上是不規則的,將交通數據視為規則的二維或三維網格數據會導致空間拓撲信息的丟失。
隨后,研究人員引入了圖神經網絡(GNN)來對時空網絡數據進行建模,并在交通流預測任務上取得了巨大進步。Li等人[8]提出了DCRNN模型,它將交通網絡建模為有向圖,采用雙向隨機游走捕獲道路之間的空間依賴性,并使用RNN捕獲時間相關性,該方法同時處理了時間和空間信息,具有更準確的預測結果。此后,研究人員對GNN與CNN或RNN結合起來的這種研究范式進行了深入挖掘,例如:文獻[9~11]都采用了GNN來獲取拓撲結構中的空間依賴性,采用一維卷積或RNN來獲取動態的時間依賴性。
盡管這些基于圖神經網絡的方法在交通流預測任務上已取得相對成功,但這些模型仍然存在缺陷。首先,這些方法僅采用預定義的圖鄰接結構捕獲節點間的空間依賴關系,卻忽略了各節點上時序之間的相關性。預定義的圖鄰接結構通常基于傳感器地理位置之間的距離或上下游關系構建鄰接矩陣,但這樣會導致兩個節點上時間序列相關卻無直接連邊的情況發生。如圖1所示,圖(a)表示交通路網中的節點分布,圖(b)中實線表示預定義的鄰接結構,虛線表示存在時序相關性的節點對。從圖中可以看出,僅利用預定義的鄰接關系無法全面反映節點之間的相互影響。其次,現有圖神經網絡建模交通流預測方法的另一個缺陷在于,這類方法往往分別探索時間和空間維度的特征,最后再進行融合,這種延遲融合策略會導致模型不能實時獲取全局信息,從而影響模型預測效果。
為解決上述問題,本文提出了一種端到端的時空數據預測模型,即Ada-GGNN。首先,該模型通過空間傳遞模塊捕獲交通路網的空間依賴性,并從中挖掘出節點間時序的關聯關系。然后通過GRU[12]學習交通數據動態的時間依賴性,并在每個時間步進行多次的時空融合,探索時間和空間的高階交互,獲得時空嵌入表示,最后將這些表示通過全連接層進行最后的嵌入,得到預測結果。本文通過一種可學習的方式來獲取時序間的自適應相關性矩陣,以捕獲節點間因預定義鄰接結構而丟失的關聯關系;采用循環聚合方法來實時融合時空嵌入表示,使得模型的時空嵌入表示更豐富。在兩個真實交通數據集上,Ada-GGNN的實驗結果證明了該方法的有效性,同時,所提方法具有很好的泛化性,很容易拓展到其他時空數據挖掘任務中。
1圖神經網絡
Gori等人[13]首次提出了圖神經網絡,并將其應用于圖結構數據。隨后,關于GNN的改進及其變體在各項任務中取得了極大的進步。Defferrard等人[14]采用一種快速局部卷積濾波器對GCN進行了改進,提出了ChebNet模型。Kipf等人[15]使用基于光譜卷積的一階近似來簡化ChebNet模型,并在半監督分類任務中達到了極好的分類效果。文獻[16]通過采樣每個節點固定數量的鄰居并進行聚合,從而提高了大圖的可擴展性。文獻[17]提出了GAT模型,它是一種強大的GCN變體,通過引入一種注意力機制來動態地確定每個鄰居節點對中心節點的重要性。然而,以上的GNN模型通常采用多層感知機更新節點的隱藏狀態,因此,在圖的長范圍信息傳播中存在限制。
為了解決上述問題,Li等人[18]提出了門控圖神經網絡(GGNN),這是一種基于GRU的經典空間域消息傳遞模型。由于GGNN在時空數據上的有效性,它已被應用于各種任務。Zhang等人[19]提出了TextING模型,該模型為每個文檔構建單獨的圖,然后使用GGNN來學習詞節點的嵌入,通過大量實驗,該方法已被證明優于最先進的文本分類方法。文獻[20]專注于一種新穎的金融事件預測任務,它使用GGNN基于事件圖來更新事件表示。文獻[21]改進了GGNN模型以更好地模擬節點交互并更好地從圖中推斷出兼容性。此外,GGNN還被應用于其他任務,如推薦[22]、圖像分類[23]、情景識別[24]等。對于時空數據預測問題,GGNN表現出了優秀的性能,受此啟發,本文采用GGNN框架和可學習的自適應節點相關性矩陣來共同應對長短期的交通預測問題。
2模型
2.1問題定義
在交通預測任務中通常將每個傳感器看做一個節點,傳感器之間的距離或上下游關系構成節點之間的連邊,則交通網絡可被定義為無向圖G=(V,E,A),其中V是節點集合,E是節點間邊的集合,A∈Euclid Math TwoRApN×N是圖G的鄰接矩陣。在時間步t時,N個節點的交通狀況表示為Xt∈Euclid Math TwoRApN×D,其中D表示特征維度。因此,交通預測問題可以看做是給定一個路網拓撲結構G和T個時間步的歷史交通信息,學習一個映射函數f,使得能夠預測接下來τ個時刻的交通信息,其定義為
[Xt+1,…,Xt+τ]=f([Xt-T+1,…,Xt-1,Xt],G)(1)
2.2模型總體架構
Ada-GGNN模型主要由每個時間步的兩階段時空融合模塊(ST fusion module)組成,每個時空融合模塊包含空間傳遞模塊(spatial passing module,SP module)和門控循環單元(GRU)兩個部分。如圖2所示,首先使用T個時間步的歷史數據作為輸入,在每個時間步中,利用空間傳遞模塊捕獲交通路網的固定拓撲結構和學習序列之間的自適應關聯關系。然后,將具有空間特征的時間序列輸入到門控循環單元,通過門控循環單元之間的信息傳遞獲取序列數據的動態變化,捕捉時間特征并進行時空數據融合。最后,通過一個全連接層得到τ個時間步的預測結果。
2.3空間傳遞模塊
考慮到交通路網的拓撲結構,空間傳遞模塊主要用來捕獲道路之間的空間依賴性關系。如圖3所示,空間傳遞模塊包含兩部分:a)通過預定義的鄰接矩陣獲取固定的空間關系;b)通過可學習的相關性矩陣獲取節點間的關聯關系。在該模塊中,采用圖卷積操作對節點間傳遞的信息進行提取。對于交通路網中顯式的空間關系,通常基于傳感器之間的位置距離構建其鄰接矩陣,表示為Aorg∈Euclid Math TwoRApN×N。令It,k∈Euclid Math TwoRApN×F表示輸入的交通數據,Wkorg∈Euclid Math TwoRApF×D表示模型參數矩陣,并采用ReLU激活函數,因此該圖卷積層定義為
Zt,korg=ReLU(AorgIt,kWkorg),k∈[1,2](2)
對于交通路網中節點上時間序列的關聯關系挖掘,令Aada∈Euclid Math TwoRApN×N表示可學習的節點間自適應相關性矩陣,并隨機初始化,通過模型的訓練自動捕獲和調整節點間關聯關系的大小。該圖卷積層定義為
Zt,kada=ReLU(AadaIt,kWkada),k∈[1,2](3)
值得注意的是,該模塊對交通路網中的拓撲關系進行了二階交互(k∈[1,2]),因此,當k為1時,It,k=1=Xt;k為2時,It,k=2=GRUt,k=1(圖1)。最后,將兩部分提取到的信息通過拼接的方式進行特征融合,如式(4)所示。
Zt,k=Zt,korg‖Zt,kada,k∈[1,2](4)
2.4時空融合模塊
空間傳遞模塊捕獲了每個時間步節點之間的空間特征和序列相關性,并提取了它們融合后的特征表達,但交通預測是一個時空預測任務,不僅僅要捕獲空間信息,還需要捕獲序列上的時間依賴性。因此,在時空融合模塊,通過GRU捕獲序列時間維度上的依賴性,并以循環聚合的方式在每個時間步進行實時的時空融合。如式(5)所示,GRU接收兩個輸入:一個是具有空間信息的當前時刻數據嵌入表示Zt,k,另一個是上一狀態表示Hpre。由于在每個時間步Ada-GGNN采取了二階的時空交互(圖1),所以在k階時的上一狀態表達有所不同,具體如式(6)所示。
Ht,k=GRU(Zt,k,Hpre)(5)
Hpre=Ht-1,k+1 k=1
Hpre=Ht,k-1k=2(6)
GRU通過門控機制來控制當前時刻輸入和上一狀態的寫入程度,更新門的值越大,重置門的值越小,則表示上一狀態的信息被寫入得越少。以這種方式,Ada-GGNN能夠捕獲交通數據長期的時間相關性,其詳細操作如下所示:
ut,k=σ(Wu[Zt,k,Hpre]+bu)(7)
rt,k=σ(Wr[Zt,k,Hpre]+br)(8)
t,k=tanh(W[Zt,k,rt,k*Hpre]+b)(9)
Ht,k=(1-ut,k)*Hpre+ut,k*t,k(10)
其中:ut,k和rt,k分別表示GRU中更新門和重置門大小;σ表示sigmoid激活函數;W和b是可學習參數。
2.5預測
經過T個時間步的時空融合后,Ada-GGNN采用全連接層得到最后的預測結果Y^,如式(12)所示。
Y^=WoutHt=T,k=2+bout(11)
其中:Wout和bout為全連接層參數。考慮到交通預測問題是一個回歸任務,所以采用平均絕對誤差(MAE)作為損失函數,其定義如式(13)所示。
3實驗
3.1數據集
為了評估所提模型的有效性,在兩個公開可用的真實交通數據集PeMSD7和Los-loop上進行了實驗。PeMSD7數據集是加利福尼亞州2012年5月和6月(僅工作日,共44天)的交通數據,由228個傳感器收集的交通速度組成。Los-loop數據集是洛杉磯高速公路上207個檢測器收集的2012年3月1日~7日的交通速度數據。在所有實驗中,將每間隔5 min匯總一次的交通速度作為交通特征,并選擇前80%的數據作為訓練集,剩下的20%作為測試集。其數據集的具體統計信息如表1所示。
3.2實驗設置
在實驗中,采用Python編程語言和PyTorch深度學習框架對模型進行實現,將前60 min的交通數據作為模型的輸入預測未來15、30、60 min的交通速度。訓練過程中,學習率設置為0.001,epoch設置為1 000,采用Adam優化器[25]。為防止模型過擬合,采用早停法(early stopping)進行訓練。所有實驗均在具有16 GB RAM的單個NVIDIA Tesla T4 GPU上進行。
本文模型與以下七種基線方法進行比較:
a)ARIMA。自回歸整合移動平均模型是一種經典的自回歸模型,它將自回歸、滑動平均以及差分法結合在一起對時間序列數據進行預測。
b)SVR[26]。支持向量回歸模型是SVM的重要應用分支,實驗中采用線性核函數進行交通預測任務。
c)ASTGCN[10]。該模型主要由三個獨立的組件組成,分別對小時、天、周的時間屬性進行建模,每個組件都包含了時空注意力機制和時空卷積兩個操作部分,并通過加權融合的方式產生最終的預測。
d)T-GCN[11]。該模型通過GCN學習交通路網的拓撲結構,GRU學習交通數據的動態變化,從而捕獲空間依賴性和時間依賴性。
e)A3T-GCN[27]。其在T-GCN的基礎上引入了注意力機制來調整不同時間點的重要性,并組裝全局時間信息來進行交通預測。
f)LSGCN[28]。該模型將GCN和圖注意力網絡集成到一個空間門控塊中,通過空間門控塊和門控線性單元[29](GLU)來捕獲數據的時空特征并得到預測結果。
g)GWN[30]。該模型通過一個可學習的方式來捕捉數據中隱藏的空間依賴,同時使用擴張一維卷積組件擴大感受野以此來處理長序列數據。
為了驗證Ada-GGNN的有效性,采用以下三個評價指標來測試各模型性能。
a)均方根誤差(RMSE)。
RMSE=1M∑Mi=1(i-yi)2(12)
b) 平均絕對誤差(MAE)。
MAE=1M∑Mi=1|i-yi|(13)
c) 平均絕對百分比誤差(MAPE)。
MAPE=1M∑Mi=1|i-yiyi|×100%(14)
其中:M表示樣本數量;yi表示第i個樣本的實際交通速度;i表示第i個樣本的模型預測值。
3.3實驗結果分析
表2顯示了Ada-GGNN和其他基線模型在兩個數據集上進行15、30和60 min交通預測的比較結果,從表2中可以得到以下觀察結果:
基于神經網絡的方法在兩個數據集上的所有評估指標比傳統的時間序列分析方法和機器學習方法(如ARIMA和SVR)具有更低的預測誤差。這些結果的原因是ARIMA和SVR模型的非線性建模能力有限。特別是ARIMA對數據的穩定性要求很高,但交通數據是復雜的,且影響因素較多,所以ARIMA呈現出最不理想的預測結果。相比之下,這些神經網絡模型不僅擅長對非線性數據進行建模,還引入了拓撲結構獲得交通路網的空間特征。因此,基于神經網絡的方法表現出了更好的性能。
Ada-GGNN在兩個數據集的長期和短期預測上實現了比其他基線模型更先進的預測性能。例如,對于Los-loop數據集上的15 min交通預測任務,Ada-GGNN在RMSE上比GWN提高了2.21%,比LSGCN提高了8.10%。類似的結果也出現在其他時間跨度預測任務和評估指標的比較中。這主要是Ada-GGNN模型的架構因素促進了這些改進。首先,Ada-GGNN是一次輸出多個時間步的預測結果,而LSGCN需要依靠先前的預測再生成下一時間步的預測,這樣會導致預測誤差的累積,所以在長期的預測結果上Ada-GGNN表現更優異。此外,Ada-GGNN采用可學習的方式挖掘了交通路網中節點序列之間的關聯關系,使得節點的嵌入表達更豐富,為模型引入了新的有用信息,有助于提高預測精度。最后,所提模型應用了循環聚合方法以實時融合方式學習時空嵌入,而不是單獨地提取和延遲融合范式,這有助于學習細粒度的動態時空關系。
3.3.1隱藏層單元數目的影響
通常隱藏層單元的數目是導致過擬合的直接原因,因此隱藏層單元數目的設置在模型調優過程中至關重要。本實驗從[16,32,64,96,128,160]中選擇隱藏單元數量,并分析不同隱藏單元數量對模型預測精度的影響。如圖4所示,橫軸表示隱藏單元的數量,縱軸表示不同的度量指標。從圖4中可以看出,隨著隱藏單元個數的增加,RMSE和MAE指標先降低再增加,且當隱藏層單元個數為96時,Los-loop和PeMSD7數據集的預測誤差最低。這主要是因為隱藏單元個數過大時,模型復雜度較大,容易發生過擬合。
3.3.2模型魯棒性驗證
在交通數據采集過程中,傳感器難免會為數據引入噪聲,因此,本實驗通過擾動分析實驗來測試Ada-GGNN的模型魯棒性。如圖5所示,在實驗中添加了兩種隨機噪聲,分別是高斯噪聲和泊松噪聲。高斯噪聲服從高斯分布N∈(μ=0,σ2),其中方差σ∈[0.2,0.4,0.6,0.8,1];泊松噪聲服從泊松分布P(λ),其中參數λ∈[1,2,4,8,16]。從圖中結果可以看出,Ada-GGNN無論在何種噪聲分布中,其評估指標的變化都很微小。因此,Ada-GGNN可以適應噪聲數據且具有很強的魯棒性。
3.3.3自適應相關性矩陣的驗證
為了驗證空間傳遞模塊中自適應相關性矩陣學習的有效性,設計了如下對比實驗。其中,No_Ada模型在Ada-GGNN的基礎上去除了自適應時序相關性學習操作,僅采用預定義鄰接矩陣來捕獲交通路網的空間依賴性。在兩個數據集上,15 min和60 min預測任務的實驗結果如表3所示。
從表3的實驗結果可以發現,在兩個數據集的不同任務中,所提Ada-GGNN模型的預測性能明顯優于No_Ada模型。這主要是因為Ada-GGNN模型不僅捕獲了道路網絡的空間關系,還學習到了各節點間的時序相關性,彌補了以往基于圖神經網絡的交通流預測方法僅含有單一空間關系的缺陷。
同時,為進一步解釋學習到的自適應相關性矩陣的作用,還進行了以下實驗,即通過Los-loop數據集上部分節點的地理位置可視化和學習到的節點序列間相關性矩陣的熱力圖進行進一步探索。圖6(a)是六個節點的地理位置圖,圖6(b)是經過歸一化處理后對應的六個節點序列之間的相關性矩陣熱力圖。首先,從圖6(b)可以明顯看到,2號節點所在列比其他列的高值點更多,這表明2號節點在預測時對圖中其他節點更具影響,且該節點與其他節點序列相關性較高。其次,在預定義的固定鄰接矩陣中,6號節點由于距離3、4號節點太遠,并不存在連接關系。然而從圖6(b)中能夠發現,6號節點對3、4號節點有較大影響且存在關聯關系。這表明Ada-GGNN能夠通過自適應相關性矩陣發現因距離原因在預定義鄰接矩陣中丟失的節點連接,并為模型引入新的有用信息,提高模型預測精度。
3.3.4模型計算花銷
表4展示了Ada-GGNN和其他基于神經網絡的基線模型在Los-loop數據集上關于計算時間花銷的比較。在訓練階段,Ada-GGNN比ASTGCN快1.07 s,比GWN快8.65 s,但是比T-GCN、A3T-GCN和LSGCN慢2~3 s,這主要是因為T-GCN僅使用一層圖卷積和一個GRU進行流量預測,而GWN卻具有復雜的模型結構,它在每個時空層都有殘差連接,計算量更大。在測試集上,LSGCN比其他模型花費了更多時間,這是因為LSGCN必須根據先前的預測來生成之后的預測結果,而其他模型都是一次生成多個時間步預測結果。因此考慮模型的預測精度和時間花銷,所提Ada-GGNN仍然具有很強的綜合表現。
4結束語
本文針對交通流預測問題提出了一種新的端到端的自適應門控圖神經網絡(Ada-GGNN)模型。該模型利用可學習的自適應矩陣從數據中獲取節點間的序列相關性,為模型引入了新的有用信息,并基于門控圖神經網絡來處理長期的預測問題。在兩個公共交通數據集上,Ada-GGNN取得了最優異的結果。考慮到實際的交通預測問題受到許多外部因素的影響,如天氣、溫度、社會事件等,因此在未來的工作中,將引入更多的額外因素作為特征,并探索在大圖上應用Ada-GGNN的可擴展方法。
參考文獻:
[1]劉靜,關偉.交通流預測方法綜述[J].公路交通科技,2004,21(3):82-85.(Liu Jing,Guan Wei.A summary of traffic flow forecasting methods[J].Journal of Highway and Transportation Research and Development,2004,21(3):82-85.)
[2]Williams B M,Hoel L A.Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process:theoretical basis and empirical results[J].Journal of Transportation Engineering,2003,129(6):664-672.
[3]Zivot E,Wang Jiahui.Vector autoregressive models for multivariate time series[M]//Modeling Financial Time Series with S-Plus.New York:Springer,2003:369-413.
[4]張曉利,賀國光,陸化普.基于K-鄰域非參數回歸短時交通流預測方法[J].系統工程學報,2009,24(2):178-183.(Zhang Xiaoli,He Guoguang,Lu Huapu.Short-term traffic flow forecasting based on K-nearest neighbors non-parametric regression[J].Journal of Systems Engineering,2009,24(2):178-183.)
[5]Yu R,Li Yaguang,Shahabi C,et al.Deep learning:a generic approach for extreme condition traffic forecasting[C]//Proc of SIAM International Conference on Data Mining.2017:777-785.
[6]Shi Xingjian,Chen Zhourong,Wang Hao,et al.Convolutional LSTM network:a machine learning approach for precipitation nowcasting[C]//Proc of the 28th International Conference on Neural Information Processing Systems.Cambridge,MA:MIT Press,2015:802-810.
[7]Zhang Junbo,Zheng Yu,Qi Dekang.Deep spatio-temporal residual networks for citywide crowd flows prediction[C]//Proc of the 31st AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2017:1655-1661.
[8]Li Yaguang,Yu R,Shahabi C,et al.Diffusion convolutional recurrent neural network:data-driven traffic forecasting[EB/OL].(2018-02-22).https://arxiv.org/abs/1707.01926.
[9]Yu Bing,Yin Haoteng,Zhu Zhanxing.Spatio-temporal graph convolutional networks:a deep learning framework for traffic forecasting[C]//Proc of the 27th International Joint Conference on Artificial Intelligence.2018:3634-3640.
[10]Guo Shengnan,Lin Youfang,Feng Ning,et al.Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]//Proc of the 33rd AAAI Conference on Artificial Intelligence.Palo Alto,CA:AAAI Press,2019:922-929.
[11]Zhao Ling,Song Yujiao,Zhang Chao,et al.T-GCN:a temporal graph convolutional network for traffic prediction[J].IEEE Trans on Intelligent Transportation Systems,2020,21(9):3848-3858.
[12]Cho K,Van Merrienboer B,Gulcehre C,et al.Learning phrase representations using RNN encoder-decoder for statistical machine translation[C]//Proc of EMNLP.2014:1724-1734.
[13]Gori M,Monfardini G,Scarselli F.A new model for learning in graph domains[C]//Proc of IEEE IJCNN.Piscataway,NJ:IEEE Press,2005:729-734.
[14]Defferrard M,Bresson X,Vandergheynst P.Convolutional neural networks on graphs with fast localized spectral filtering[C]//Proc of the 30th International Conference on Neural Information Processing Systems.Red Hook,NY:Curran Associates Inc.,2016:3837-3845.
[15]Kipf T N,Welling M.Semi-supervised classification with graph convolutional networks[EB/OL].(2017-02-22).https://arxiv.org/abs/ 1609.02907.
[16]Hamilton W L,Ying R,Leskovec J.Inductive representation learning on large graphs[C]//Proc of the 31st International Conference on Neural Information Processing Systems.Red Hook,NY:Curran Associates Inc.,2017:1025-1035.
[17]Velickovic P,Cucurull G,Casanova A,et al.Graph attention networks[EB/OL].(2017-10-30).https://arxiv.org/abs/1710.10903.
[18]Li Yujia,Tarlow D,Brockschmidt M,et al.Gated graph sequence neural networks[EB/OL].(2017-09-22).https://arxiv.org/abs/1511.05493.
[19]Zhang Yufeng,Yu Xueli,Cui Zeyu,et al.Every document owns its structure:inductive text classification via graph neural networks[C]//Proc of the 58th Annual Meeting of the Association for Computational Linguistics.2020:334-339.
[20]Yang Yiying,Wei Zhongyu,Chen Qin,et al.Using external knowledge for financial event prediction based on graph neural networks[C]//Proc of the 28th ACM International Conference on Information and Knowledge Management.New York,NY:ACM Press,2019:2161-2164.
[21]Cui Zeyu,Li Zekun,Wu Shu,et al.Dressing as a whole:outfit compa-tibility learning based on node-wise graph neural networks[C]//Proc of WWW Conference.New York:ACM Press,2019:307-317.
[22]Wu Shu,Tang Yuyuan,Zhu Yanqiao,et al.Session-based recommendation with graph neural networks[C]//Proc of the 33rd AAAI Conference on Artificial Intelligence.2019:346-353.
[23]Marino K,Salakhutdinov R,Gupta A.The more you know:using knowledge graphs for image classification[C]//Proc of IEEE CVPR.2017:20-28.
[24]Li Ruiyu,Tapaswi M,Liao Renjie,et al.Situation recognition with graph neural networks[C]//Proc of IEEE ICCV.Los Alamitos,CA:IEEE Computer Society,2017:4183-4192.
[25]Kingma D P,Ba J.Adam:a method for stochastic optimization[EB/OL].(2017-01-30).https://arxiv.org/abs/1412.6980.
[26]Smola A J,Schlkopf B.A tutorial on support vector regression[J].Statistics and Computing,2004,14(3):199-222.
[27]Bai Jiandong,Zhu Jiawei,Song Yujiao,et al.A3T-GCN:attention temporal graph convolutional network for traffic forecasting[J].ISPRS International Journal of Geo-Information,2021,10(7):485.
[28]Huang Rongzhou,Huang Chuyin,Liu Yubao,et al.LSGCN:long short-term traffic prediction with graph convolutional networks[C]//Proc of the 29th International Joint Conference on Artificial Intelligence.2020:2355-2361.
[29]Dauphin Y N,Fan A,Auli M,et al.Language modeling with gated convolutional networks[C]//Proc of the 34th International Confe-rence on Machine Learning.2017:933-941.
[30]Wu Zonghan,Pan Shirui,Long Guodong,et al.Graph WaveNet for deep spatial-temporal graph modeling[C]//Proc of the 28th International Joint Conference on Artificial Intelligence.2019:1907-1913.
收稿日期:2022-01-18;修回日期:2022-03-11基金項目:國家杰出青年科學基金資助項目(61625204);四川省科技計劃資助項目(2020YJ0125);西南石油大學科研創新能力提升計劃“啟航”項目(2019QHZ016)
作者簡介:王楊(1995-),男,重慶綦江人,碩士,主要研究方向為圖神經網絡;鄭津(1984-),男(通信作者),四川廣安人,講師,博士研究生,主要研究方向為深度學習、圖神經網絡(zhengjin@swpu.edu.cn);劉影(1980-),女,山東煙臺人,副教授,碩導,博士,主要研究方向為復雜網絡、網絡傳播動力學、數據挖掘;李平(1977-),女,四川成都人,教授,碩導,博士,主要研究方向為圖神經網絡、自然語言處理、復雜網絡.