葉寶林 戴本岙 張鳴劍 高慧敏 吳維敏



摘要:近年來,基于深度學習的交通流預測方法一直是交通流預測領域的研究熱點.與傳統卷積神經網絡不同,適合處理非歐幾里得數據的圖卷積網絡在空間特征建模方面表現出了強大的能力,而反映路網空間特征的拓撲圖、距離圖、流量相似圖等正是典型的非歐幾里得數據.因此,基于圖卷積網絡及其變體的交通流預測方法成為交通流預測領域的一個研究熱點,并取得了很多有吸引力的研究結果.本文對近年來基于圖卷積網絡的交通流預測模型進行了分類和總結.首先,從圖卷積網絡的基本定義出發,結合空域圖卷積和譜域圖卷積的定義詳述了圖卷積的基本原理.其次,根據預測模型的網絡結構特點,將基于圖卷積網絡的交通流預測模型分為“組合型”和“改進型”兩大類,并對其中最具代表性的模型結構進行了詳細分析和討論.此外,對交通流預測領域中常用于模型性能對比的典型數據集進行了綜述,并以其中一個真實數據集為例開展仿真測試,展示了4個基于圖卷積網絡交通流預測模型的預測性能.最后,基于當前的研究現狀和發展趨勢,對基于圖卷積網絡的交通流預測方法研究領域中未來的研究熱點和難點進行了開放性的討論和展望.
關鍵詞深度學習;交通擁堵;圖卷積網絡;交通流預測
中圖分類號TP181
文獻標志碼A
0引言
隨著我國城市化進程的不斷深入,交通擁堵問題日益凸顯.交通擁堵不僅會大幅增加日常的通勤時間,還會產生額外的能源消耗和碳排放.因此,如何緩解交通擁堵是很多大中城市亟待解決的問題.交通流預測可以根據實時監測的交通數據,預測未來一段時間內的交通狀態信息.預測得到的交通狀態信息可以為交通管理部門的交通管控、調度和決策提供依據[1-2],提高公共交通資源的利用效率.目前,交通流預測已被廣泛應用于城市路網交通流預測和交通態勢感知等,是提升路網通行效率的關鍵技術之一.
從本質上來說,交通流預測是一個典型的時間序列預測問題.與一般的時間序列預測任務不同的是,一個節點的交通流量會受到其附近節點流量的影響,因此,交通流預測時還需要考慮不同節點之間的空間關系.此外,交通流預測還面臨著傳播時延性、多步預測誤差累計、突發異常事件干擾等諸多挑戰.在早期的研究中,研究人員大多采用基于數理統計的方法構建交通流預測模型.譬如歷史平均值(HistoricalAverage,HA)[3-4]、自回歸移動平均模型(AutoregressiveIntegratedMovingAverageModel,ARIMA)[5-7]、向量自回歸模型(VectorAutoregressiveModel,VAR)[8]等.這些方法通常要求數據滿足某些假設,來使交通流預測模型發揮出較好的性能.但由于交通流量往往具有復雜多變的特點,這些預測模型在實際交通預測任務中的表現并不太理想.近年來,得益于人工智能技術的迅猛發展,基于機器學習的交通流預測方法的研究成為了一個熱門的研究方向.雖然與基于數理統計的方法相比,基于K-近鄰算法(K-NearestNeighbor,KNN)[9]和支持向量機(SupportVectorMachine,SVM)[10]等早期機器學習的方法可以建模更復雜的數據,但需要非常細致的特征工程,在處理大規模數據時表現不佳.得益于深度學習在語音識別和圖像處理等諸多領域取得的重要進展,越來越多的研究人員開始將深度學習方法應用于交通流預測任務中.卷積神經網絡(ConvolutionalNeuralNetwork,CNN)[11]、長短期記憶網絡(LongShort-TermMemory,LSTM)[12]及其變體門控循環單元(GatedRecurrentUnit,GRU)[12]是交通流預測領域中最常用、最具代表性的深度學習方法,這些方法將交通流預測的準確性提升到了一個全新的高度.值得注意的是,LSTM和GRU主要用于時間序列預測,不能有效捕捉路網拓撲的空間關聯關系.在完全失去空間特征信息的情況下,這些網絡對路網拓撲的表達能力將會受到嚴重限制.為了充分利用路網拓撲的空間關聯關系,CNN被引入交通流預測領域,并與LSTM和GRU等時間序列模型結合起來共同提取交通流數據中隱含的時空特征信息[13-14].
然而,CNN最初是用于處理圖像、視頻等具有規則網格結構的歐幾里得數據,它使用一個具有固定形狀的卷積核進行卷積.但對于不規則的“圖”來說,圖中相鄰節點間的關聯關系均是隨時間發生變化的,很難使用一個固定形狀的卷積核進行卷積.因此,傳統的卷積神經網絡無法有效地處理圖結構的數據.事實上,實際的道路網結構更接近于不規則的“圖(graph)”而非規則的“圖片(image)”,使用CNN來建模路網的空間關聯關系無法很好地貼合實際路網.在近幾年的研究中,圖卷積網絡(GraphConvolutionalNetwork,GCN)將傳統的卷積操作推廣到圖結構的數據中,解決了CNN無法處理非歐幾里得數據的問題.由于GCN能夠更好地建模復雜路網的空間結構,越來越多的研究人員開始關注基于圖卷積網絡GCN的交通流預測模型[15],并取得了一系列振奮人心的研究結果.因此,本文系統地梳理了近年來國內外有關基于圖卷積網絡的交通流預測模型,對該領域的研究現狀和未來發展趨勢進行了深入探討和展望.考慮到現有最新研究成果均是在最基礎的圖卷積網絡上拓展而來,本文將基于圖卷積網絡的交通流預測模型分為“組合型”和“改進型”兩大類,并重點分析和討論了其中一些典型模型和代表性方法的特色、優勢和局限性,以期為該領域后續進一步的研究提供一些可供借鑒和參考的思路.
本文其余章節的組織如下:第1節具體介紹了空域圖卷積和頻域圖卷積;第2節對基于圖卷積網絡GCN的交通流預測模型進行了分類和總結;第3節介紹了交通流預測領域常用的公開數據集;第4節結合具體的實例展示了基于圖卷積網絡GCN的交通流預測方法的預測性能;第5節,對基于圖卷積網絡GCN的交通流預測方法研究領域未來的研究方向進行了開放性的討論;第6節對全文進行了總結和展望.
1圖卷積網絡
傳統的卷積操作通常只適用于對規則歐幾里得空間數據進行卷積,而圖卷積將卷積操作推廣到了一般的圖結構中.在目前的研究中,圖卷積主要有兩種計算方法:空域圖卷積方法[16]和基于圖傅里葉變換的頻域圖卷積方法[17].前者將圖中的頂點按照某種規則重新排列成特定的網格形式,使其可以直接在空間域上進行卷積運算,即空域圖卷積.后者則是利用卷積定理將卷積轉換至譜域進行計算,即頻域圖卷積.
1.1空域圖卷積
空域圖卷積的通用框架主要有兩種:一種是消息傳遞神經網絡(MessagePassingNeuralNetwork,MPNN)[18],它的出發點是節點之間的信息聚合,其核心是聚合函數;另一種是混合卷積網絡(MixturemodelNetworks,MoNet)[19],它立足于圖的平移不變性,通過合適的映射函數將拓撲上每個節點的局部結構映射為相同大小的向量以便進一步學習共享卷積核.消息傳遞神經網絡(MPNN)對空域圖卷積聚合函數的一般架構進行了定義,利用聚合函數對各個節點的自身信息和周圍信息進行聚合和更新.空域卷積過程被分解為消息傳遞與狀態更新兩個過程,可分別用消息傳遞函數Mt()與更新函數Ut()來表示.消息傳遞過程中,圖中節點隱含狀態htx通過傳遞的消息mt+1x進行更新,具體更新公式如下:
式中:htx和hty分別表示節點x和節點y在第t步輸出的隱藏狀態;exy表示連接節點x和節點y的邊上的特征;N(x)表示節點x的鄰居節點構成的集合.雖然基于MPNN框架可以直接在空域進行卷積,但面對龐大的圖數據時,基于MPNN框架的空域卷積方法需要占用龐大的計算資源.另外,平移不變性的缺失還會給圖卷積網絡的定義帶來困難.
考慮圖上的任意節點x和它的鄰域節點y∈N(x),MoNet利用圖上定義的偽坐標系,將節點y映射為偽坐標系下的d維向量u(x,y),以便學習共享卷積核函數.MoNet[19]中定義了一個如式(3)所示的加權函數:
式中:Θ表示可學習的參數;wi()表示第i個權重函數;n表示總的權重函數個數.
利用構建的核函數可為圖中各個節點獲得相同維度的向量表示:
式中:N(x)表示節點x的鄰居節點構成的集合,f(y)表示y在函數f上的取值.基于式(4)計算的Di(x)f可得到在非歐幾里得域上的卷積空間推廣:
式中:g表示圖卷積核;*G表示圖卷積算子.
1.2頻域圖卷積
1.2.1圖信號的頻域處理
卷積定理是傅里葉變換的一個重要性質,它可以將時域上的卷積運算變換到頻域上的乘積運算,具體計算公式如下:
1.2.2切比雪夫多項式近似
在譜圖分析中,圖結構的數據一般用其相應的拉普拉斯矩陣表示.通過分析拉普拉斯矩陣及其特征值,可以得到對應圖結構的性質.圖的拉普拉斯矩陣被定義為L=D-A,其規范化形式是L=In-D-12AD-12∈RN×N,其中,A表示鄰接矩陣,In表示單位矩陣,D表示度矩陣,D∈RN×N為對角矩陣,Dii表示節點的度,Dii=∑jDij.拉普拉斯矩陣L可分解為L=U∧UT,其中,Λ=diag([λ0,…,λN-1])∈RN×N是一個對角矩陣,U是傅里葉基.以交通流量為例,假設圖上的信號為x∈Rt×N×N,由式(8)知信號的圖傅里葉變換為=UTx,其對應的傅里葉反變換是x=U.作為一種卷積運算,圖卷積利用在傅里葉域內對角化的線性算子來代替經典的卷積算子[20].在此基礎上,卷積核gθ對圖G上的信號x濾波表示為
2基于圖卷積的交通流預測模型
交通流數據本質上是包含了時空信息的時間序列數據.如何改進預測模型,使其能夠從交通流數據中更高效、更準確地提取時空特征,是交通流預測的重點研究內容.采用圖結構定義的道路交通網絡,其節點的特征信息可以視為圖上的信號[20].為了充分利用交通路網的空間拓撲特征信息,可以在每個時間步上采用圖卷積網絡來直接對路網空間特征信息進行處理,從而更好地利用路網交通流數據在空間維度上的特征相關性,來提升交通流預測模型的性能.近年來,在基于圖卷積網絡(GCN)交通流預測模型的基礎上,已經衍生出了許多基于圖卷積網絡改進的交通流預測模型.這些改進工作大致可以分成兩種:一種致力于構建更加有效的圖結構,以更好地表示不同節點之間的空間依賴關系;另一種則側重于研究如何更有效地將GCN與其他神經網絡相結合,以充分挖掘交通流數據中的時空關聯關系,提升交通流預測模型的性能.根據這兩種改進思路,本文將基于GCN的交通流預測模型分為“改進型”和“組合型”兩大類.其中:改進型可細分為動態圖卷積網絡、多圖卷積網絡、自適應圖卷積網絡3種;組合型可細分為時空圖卷積網絡、殘差網絡+圖卷積網絡、自編碼器+圖卷積網絡、注意力機制+圖卷積網絡、生成對抗網絡+圖卷積網絡、Transformer+圖卷積網絡、模式分解+圖卷積網絡7種.需要注意的是,不同的分類之間可能存在一定程度的交叉.下面將根據上述分類對具有代表性的模型的預測結果進行詳細闡述.
2.1改進型
相比于傳統的卷積神經網絡(CNN),圖卷積網絡(GCN)能夠更好地建模路網中不同節點之間的空間關聯關系,是近年來交通流預測領域中最常用的神經網絡之一.但圖卷積網絡中常用的預定義的靜態圖存在一些明顯的缺陷,導致其建模的空間關聯關系可能和實際情況存在一定偏差.首先,預定義的靜態圖假設不同節點之間的空間關聯關系是預先確定且不隨時間變化的,然而,實際路網中的空間關聯關系是隨時間變化的,靜態的圖結構難以反映這種時變的空間關聯關系.此外,預定義的靜態圖主要是基于不同節點之間的距離構建圖結構,并未考慮其他深層的空間關聯關系.這種單一的圖結構所承載的信息較少,難以準確地描述復雜路網中隱含的豐富拓撲結構信息.另外,由于設備故障等原因,真實數據集中經常存在部分數據缺失的問題.如果僅利用這些數據構建圖結構,可能會丟失部分空間信息.針對上述缺陷,研究人員主要從動態圖卷積網絡、多圖卷積網絡和自適應圖卷積網絡3個方向進行改進.
2.1.1動態圖卷積網絡
在早期基于圖卷積網絡的交通流預測方法中,描述路網中不同節點之間空間關聯關系的結構圖在訓練過程中始終保持不變.但事實上,實際路網中不同節點之間空間關系是隨時間變化的,靜態的空間結構圖不能很好地描述這種變化的空間拓撲結構.為了解決該問題,Diao等[23]提出一種基于動態時空圖卷積(DGCNN)模型.在DGCNN模型中,實時交通數據被分解為一個依賴長期時空交通關系的、穩定的全局節點嵌入,以及一個捕獲交通變化的局部節點嵌入.他們使用動態拉普拉斯矩陣估計器來感知交通流量的變化,并據此對路網空間關系的變化進行動態建模.Zheng等[24]提出了一個動態時空相鄰圖卷積網絡(DSTAGCN).DSTAGCN是利用基于模糊神經網絡的數據驅動模塊來學習交通圖的鄰接矩陣,可以更有效地挖掘交通數據之間潛在的和不確定的關聯關系.該模型也是第一個利用模糊神經網絡來學習圖卷積方法中鄰接矩陣的模型.
動態圖卷積是基于注意力機制實現的,然而傳統注意力機制計算的注意力得分可能存在較大誤差.因此,Hu等[25]提出一種基于多注意力機制時空圖卷積網絡(MASTGCN)的交通流預測模型,用以實現對時空特征的動態調整.此外,隨著Transformer在交通流預測領域的廣泛應用,基于傳統注意力機制的動態圖也面臨著巨大的挑戰.相比于傳統的注意力機制,Transformer中的自注意力機制計算的注意力得分更加準確.因此,一些研究者開始使用自注意力機制來代替傳統的注意力機制構建動態圖卷積網絡.例如,Ma等[26]提出一種基于多頭自注意力機制時空信息圖卷積網絡(MSASTIGCN)的交通流預測方法.在該方法中,將傳統的注意力機制替換為多頭自注意力機制,使模型能夠更準確地捕獲路網空間關系的動態變化,在一定程度上提高了模型的預測性能.
2.1.2多圖卷積網絡
在大多數基于單圖的圖卷積網絡中,相鄰節點之間的空間相關性是根據它們之間的距離定義的.但事實上,節點之間的距離并不能完全地代表它們之間的空間關聯關系.例如,距離較近的兩個節點之間可能并無直接的連接關系,距離較遠的兩個節點之間的流量也可能存在某種相似性.單一的圖結構難以充分地描述這些隱含的空間關聯關系.因此,一些研究人員使用多圖融合的思想,從不同的角度來更加全面地描述節點之間的空間關聯關系.例如,Lv等[27]提出一種基于時間多圖卷積網絡(T-MGCN)的交通流預測模型,并將研究重點放在建模更多可能的遙遠節點之間的語義相關性上.為了更加有效地建模全局空間關聯關系,Lv等[27]不僅構建了描述空間關聯關系的拓撲圖,也構建了交通模式圖和功能圖.另外,為了提升模型的預測性能,該文還設計了一個門控循環單元(GRU)捕獲時間相關性.為了提高GCN捕獲節點間空間關聯關系的能力,Yang等[28]設計了一種可分解圖卷積結構(FactorGCN).在GCN中,圖被廣泛用于表示實體之間的關聯關系.多數情況下,這種異構的關系是交織在一起的.可分解圖卷積結構FactorGCN則明確地解開了編碼在圖中的這種關系.該文先將一個原始的圖分解為多個子圖,每個子圖表示節點之間潛在的、分解的空間關聯關系.然后,在每個分解的潛在空間中分別聚合節點的特征以產生分離的特征,從而進一步提高下游預測任務的性能.Yin等[29]提出一種基于多時間-多圖神經網絡(MTMGNN)的地鐵客流預測模型.該模型采用了6種圖來表示不同模式下地鐵站不同站點間的空間連接.另外,針對復雜但有規律的地鐵客流波動特征,該文同時利用近期客流數據和長期客流數據,并從長期客流數據中挖掘與人們出行習慣密切相關的慣性特征.Lee等[30]從路網中節點間的距離、方向、位置關系3個維度分別構建空間關聯關系圖,并在此基礎上提出了一種基于多圖卷積網絡的交通流預測模型.仿真測試結果表明,該模型在解決復雜的城市路網長期交通流預測問題上具有一定優勢.針對網約車需求預測問題,Geng等[31]將不同區域間的非歐幾里得相關性編碼為多個圖,然后使用多圖卷積對這些相關性進行建模,并在此基礎上提出了一種基于時空多圖卷積網絡(ST-MGCN)的網約車需求預測模型.該模型可以更加充分地挖掘相鄰區域和非相鄰區域的空間相關性,提高了網約車需求預測的準確性.針對交通流預測問題,Khaled等[32]提出一種帶有多圖卷積網絡的生成對抗網絡(TFGAN)模型.該文從空間相似性、相關性、空間距離3個不同的視角創建鄰接矩陣描述路網的空間關聯關系,并利用多個GCN、GRU、自注意力機制來學習路網中節點歷史流量序列的局部相關性.
2.1.3自適應圖卷積網絡
現有的GCN一般利用拓撲關系,或是各種相似度量來定義物理或虛擬圖,并以此來衡量不同節點之間的空間相關性.這種圖一般由相關領域的專家基于一些先驗知識構建,圖中的節點之間有著固定的邊緣連接,無法很好地貼合實際情況.因此,一些研究人員嘗試利用數據驅動學習圖結構的方式來實現圖的自動更新.例如,Wu等[33]提出的GraphWaveNet,通過構造一個自適應鄰接矩陣,保留了隱藏的空間依賴性.同時能夠從數據中發掘不可見的圖結構,而無需任何先驗知識的指導.WaveNet的卷積層可表示為
Z=∑Kk=0PkfXWk1+PkbXWk2+kaptXWk3.(17)
式中:kapt為自適應鄰接矩陣;Pkf,Pkb分別為正向和反向轉換矩陣.
Bai等[34]設計了一個DAGG模塊,可以從數據中自適應地推斷隱藏的空間依賴關系.DAGG模塊首先為所有節點隨機初始化一個可學習的節點嵌入EA∈RN×demb,其中,每一行EA表示單個節點的嵌入,demb表示節點嵌入的維數.然后,類似于求節點相似度來定義圖,通過將EA和ETA相乘來推斷每對節點之間的空間依賴性.結果表明,使用自適應圖的模型比依賴單一靜態圖結構的模型具有更加優秀的性能.然而,一般的自適應圖僅能在訓練階段發揮作用,無法在測試階段利用測試數據自適應地更新圖結構.由于交通數據經常受到時間序列中的異常變化的影響,上述缺點可能會導致某些情況下預測的性能明顯下降.為了解決上述問題,Shin等[35]提出一種漸進式圖卷積模型(PGCN).該模型通過學習圖節點之間的趨勢相似性,實現了構造漸進式鄰接矩陣對路網拓撲進行漸進式學習.為了捕獲動態空間相關性,Wang等[36]提出一種時變圖卷積模型(TVGCN).他們設計了一個時變空間卷積模塊,可以在不需要任何先驗知識的情況下對復雜的路網拓撲結構進行提?。甌VGCN中構建了靜態、動態兩種自適應圖.一個圖以數據驅動的方式學習來捕獲交通節點之間的靜態空間相關性,而另一個圖用于自適應地建模不同時間的動態空間相關性.在圖卷積網絡(GCN)的框架下,他們將這兩個圖分層組合在一起同時捕獲交通圖的靜態和動態空間相關性.谷振宇等[37]提出的STG-CRNN在預定義的距離圖、交通模式圖的基礎上結合自適應圖構建與現實路網更加貼合的圖結構,提升模型對空間相關的建模能力.
2.2組合型
交通流數據中包含了豐富的時間和空間信息,如何更有效地提取、利用這些時空信息是提高交通流預測精度的關鍵所在.在主流的深度學習方法中,由于GCN對非歐幾里得數據有較強的建模的能力,因此,常被用于捕獲路網中不同節點之間的空間相關性.然而,GCN對時間序列數據不敏感,難以捕獲某個節點的流量隨時間的變化關系.因此,GCN常會與CNN、循環神經網絡(RNN)、Transformer等結合使用,以共同捕獲時空相關性.此外,一些研究人員還將GCN與注意力機制(AttentionMechanism)、生成對抗網絡(GAN)等結合以提高其捕獲空間相關性的能力.總的來說,有關組合型GCN的研究主要從時空圖卷積網絡、殘差網絡+圖卷積網絡、自編碼器+圖卷積網絡、注意力機制+圖卷積網絡、生成對抗網絡+圖卷積網絡、Transformer+圖卷積網絡、模式分解+圖卷積網絡7個方向展開.需要注意的是,2.1節中對圖結構的改進同樣可以應用至本小節的模型中,對于此類改進,本文將不再展開分析.
2.2.1時空圖卷積網絡
如圖1所示,由于交通數據存在明顯的時序特征,許多時序預測模型和圖卷積相結合被應用于交通預測問題.時空圖卷積網絡主要可分為兩類:基于RNN的時空圖卷積網絡和基于CNN的時空圖卷積網絡.
1)基于RNN的時空圖卷積網絡
RNN是一個經典的時序預測模型,曾被廣泛地應用于各類時序預測任務.但RNN在計算過程中存在大量的連乘操作,這會導致嚴重的梯度消失和梯度爆炸問題.不同于RNN,LSTM緩解了梯度消失和梯度爆炸問題.另外,LSTM中的門控機制可以有選擇性地將關鍵信息保存至記憶細胞中,大幅提高了建模長期時間依賴性的能力.因此,LSTM常與GCN共同組成時空圖卷積網絡.例如,為了建模路網中交通流的時空相關性,Cui等[38]提出一種基于TGC(TrafficGraphConvolution)和LSTM的路網交通流預測模型.該模型的建模過程可描述為Ali等[39]提出一種用于城市人流預測的動態深度時空神經網絡(GCN-DHSTNet)模型.該模型采用LSTM分別提取每小時的流量特征、每天的流量特征和每周的流量特征,利用GCN提取空間關聯關系來完成預測任務.為了建模交通流數據中的正向和反向時間特征信息,張陽等[40]提出一種基于GCN-BiLSTM的短時交通流預測模型,其中,Bi-LSTM網絡可以同時從正向和反向提取交通流量數據中的時間特征信息,GCN網絡則用于挖掘交通流量數據中的空間特征信息.Zhang等[41]在LSTM中引入殘差連接并與圖卷積組合,提出一種基于殘差圖卷積長短時記憶網絡(RGC-LSTM)的短時流量預測模型.
GRU是RNN的另一種變體.與LSTM相比,GRU將3個控制門減少至2個,在保持預測精度基本相同的前提下,降低了模型的計算復雜度.因此,很多研究人員用GRU代替LSTM提取序列數據中的時間特征.例如,Zhao等[42]設計了一種基于時間圖卷積網絡(TemporalGraphConvolutionalNetwork,T-GCN)的交通流預測方法,該方法采用GRU與GCN聯合提取時空特征.Chen等[43]在其提出的時空圖神經網絡(SpatialTemporalGraphNeuralNetwork,STGNN)中設計了一種具有位置級注意機制的圖神經網絡層,以有效地聚集來自相鄰道路的空間關聯信息.另外,該模型使用GRU和Transformer分別捕獲局部和全局時間依賴性.Zhao等[44]提出一種基于GCN和雙向門控遞歸單元(BiGRU)的交通流預測模型實現多步交通流預測.BiGRU包含一個正向傳播GRU和一個反向傳播GRU,可以對交通時間序列數據同時進行前向和后向建模,挖掘數據中隱藏的上下文信息,并捕獲交通時間序列的長期時間相關性.
2)基于CNN的時空圖卷積網絡
RNN及其變體雖然能有效地捕獲時間序列中的時間特征,但由于在RNN中下一時刻的輸出完全依賴于上一時刻的輸入,導致難以進行并行化訓練.為了能夠進行并行化訓練,通常采用CNN來提取時間特征.譬如,陳柘等[45]構建了一種基于時間卷積神經網絡(TemporalConvolutionalNetwork,TCN)和GCN的交通流預測模型,共同提取時空特征用于出租車需求預測.Yu等[46]提出一種新的時空圖卷積網絡(STGCN),由于同時包含有圖卷積和門控時間卷積,STGCN模型可以在提取空間特征的同時,有效地捕獲時間特征.由于STGCN模型完全由CNN組成,因此其訓練速度明顯優于基于RNN的時空圖卷積模型.另外,為了捕獲路網中動態變化的空間關聯性,Diao等[23]使用動態拉普拉斯矩陣估計器對原有的時空圖卷積網絡STGCN模型進行了改進,提出一種動態圖卷積神經網絡(DGCNN)模型.如圖2所示,在改進的DGCNN模型中,拉普拉斯矩陣可以有效感知空間關聯性的動態變化.為了更精準地捕獲數據中的時空依賴關系,Wu等[33]將圖卷積與擴展因果卷積相結合,提出一種新的圖形神經網絡體系結構GWN(GraphWaveNet).圖神經網絡模型GWN具有一個堆疊的擴展1D卷積組件,其感受野隨著層數的增加呈指數增長,因此能夠處理長時間序列.該模型中的擴張因果卷積結構如圖3所示.
2.2.2殘差網絡+圖卷積網絡
在深度神經網絡中,網絡的性能并非始終與網絡深度呈正相關關系.換句話說,如果只是簡單地增加網絡的深度,當網絡深度超過某個閾值后,預測模型在訓練集和測試集上的性能均有一定下降.這明顯不同于過擬合時預測模型在訓練集上性能有所提升,但在測試集上的性能下降.直到2016年,He等[47]在圖像識別領域提出了殘差網絡以解決上述問題.殘差網絡可以使上一個殘差塊的信息傳遞到下一個殘差塊,提高信息的傳遞效率,并且避免了隨著網絡深度的增加出現的梯度消失問題和退化問題.Zhang等[41]將殘差引入LSTM提出殘差圖卷積長短時記憶(RGC-LSTM)模型用于交通預測.該模型具有參數少、計算量小、收斂速度快的優勢.Zhao等[44]則在圖卷積層中加入殘差網絡(ResGCN),以解決深度卷積網絡的退化問題,其結構示意如圖4所示,在ResGCN中還使用雙向門控遞歸單元(BiGRU)對交通時間序列數據進行前向和后向建模.
2.2.3自編碼器+圖卷積網絡
由于自編碼器在預測任務上具有更加穩定的表現且泛化效果好[48],因此,研究人員開始將自編碼器與圖卷積網絡結合起來解決交通流預測問題.譬如,Zhu等[49]提出一種帶有注意力機制的多圖卷積Seq2Seq模型(AMGC-Seq2Seq)用于共享汽車流量預測.在AMGC-Seq2Seq模型中的編碼器部分,他們利用LSTM網絡提取時間特征,再用多圖卷積網絡(M-GCN)提取空間關聯關系.然后,再使用一個LSTM網絡對提取的時空特征進行融合,以實現對空間和時間關系的同時編碼.在解碼器中,一個單獨的LSTM被用于解碼由編碼器傳遞來的上下文向量,以獲得多步預測輸出.其結構示意如圖5所示.另外,為了建模交通流中的時間關聯關系和空間關聯關系,Li等[50]將交通流量建模為在有向圖上進行的擴散過程,提出一種基于擴散卷積循環神經網絡(DCRNN)的交通流預測方法.DCRNN在利用擴張卷積和GRU提取時空依賴的同時,加入自編碼器結構來提升模型性能.在模型的訓練階段,歷史交通序列被輸入到編碼器中,并得到隱藏狀態.解碼器利用隱藏狀態和真實觀測值生成預測結果.在測試階段,首先使用訓練階段獲得的最終狀態初始化解碼器.與訓練階段不同的是,解碼器的輸入由真實的觀測值替換為預測值來實現多步預測.另外,為了解決訓練和測試兩個階段中數據分布之間存在差異性的問題,DCRNN模型利用計劃采樣的方法對輸入數據進行采樣處理.Guo等[51]提出一種用于速度預測的嵌入式圖卷積長短時記憶網絡(EGC-LSTM),將GCN和LSTM進行融合提取時空特征,并引入注意機制計算特征權重來提高模型在時間維度上的可解釋性.為了進一步提高預測準確性,他們在模型中引入了自編碼器結構,并將輔助特征進行one-hot編碼后輸入到解碼器部分.特征權重可以反映特征的重要性,間接實現了特征選擇;將特征權重傳遞到GCN-LSTM中,提高了模型的預測性能.
2.2.4注意力機制+圖卷積網絡
注意力機制最初被用于解決自然語言處理領域的相關問題[52],隨后被推廣到許多其他的相關任務中.在交通流預測模型中,注意力機制也常與各類神經網絡配合使用.例如,葛宇然等[53]提出一種基于時空域聯合學習的動態分層網絡(JST-DHNet)模型,并采用注意力機制將通過兩種不同的時空學習模塊學到的整體時空特征和局部時空特征進行了融合.Zhu等[49]在其提出的帶有注意力機制的多圖卷積Seq2Seq(AMGC-Seq2Seq)模型中,利用注意力機制對時空圖卷積網絡輸出的隱藏向量計算注意力分數,并將注意力用于解碼器以捕獲歷史信息中的重點內容.Liu等[54]在其提出的基于多頭注意力機制的時空圖卷積網絡中,將自注意力定義為
2.2.5生成對抗網絡+圖卷積網絡
受博弈論中的零和博弈啟發,Goodfellow等[57]將生成問題視為生成器和判別器這兩個網絡的對抗和博弈,并提出一種生成對抗網絡(GenerativeAdversarialNetwork,GAN).生成對抗網絡(GAN)由一個生成器和一個判別器組成,生成器通過在潛在空間中隨機采樣生成網絡輸入,并通過不斷訓練使生成器的輸出逼近訓練集中的真實樣本.判別器的輸入包括真實樣本和生成器的輸出,其目的是將生成器的輸出從真實樣本中區分出來.生成對抗網絡擅長無監督學習,且在多種生成模型中能夠生成最逼真的結果,是交通流預測研究常用的神經網絡之一.例如,代亮等[58]提出一種基于梯度懲罰的Wasserstein生成對抗網絡(WGAN-GP)模型用于路網交通流預測.該模型通過構建時間判別器和空間判別器分別從時間和空間兩個特征維度對生成數據進行判別,從而引導生成器生成接近真實數據分布的預測數據.Jin等[59]提出一種用于短時交通速度預測的PL-WGAN模型,其特點是采用一種如圖6所示的平行學習框架,構建了一個融合時空注意力機制、GCN和GRU的混合模型捕獲交叉口和路網的時空特征信息.該方法將Wasserstein生成對抗網(WGAN)應用于數據驅動交通建模,并通過在杭州的一個大規模區域網絡中的實測驗證了其有效性和可擴展性.為了精確預測城市軌道交通網絡的短期客流,Zhang等[60]提出一種基于深度學習的時空圖生成對抗網絡(STG-GAN)預測模型.該模型構建了一個由門控時間卷積網絡(TCN)和圖卷積網絡(GCN)構成的生成網絡,以捕獲交通路網結構的時空依賴性并生成預測數據.同時,也構建了一個包含空間判別器和時間判別器的判別網絡,以增強預測模型建模空間和時間約束的能力.
2.2.6Transformer+圖卷積網絡
2017年,Google的機器翻譯團隊提出一種與循環神經網絡(RNN)完全不同的Transformer模型,用于自然語言處理(NLP)任務.由于具有很強的建模上下文信息的能力,Transformer模型在NLP任務中得到了廣泛的應用,并逐步擴展至其他時序預測相關的任務之中.Transformer模型的核心是多頭注意力機制.在交通流領域中,傳統的注意力機制主要用來計算不同特征間的權重,對路網的空間結構圖(如拓撲圖、距離圖)進行動態調整來實現動態圖卷積,以及對輸入流量數據進行動態加權來得到研究中更為廣泛的門控機制.而多頭注意力機制可以使用多組注意力同時學習得到不同特征的最優注意力權重.相較于傳統的RNN,Transformer模型通過考慮不同歷史時間步長的不同尺度的依賴關系,提升了模型對遠距離時間特征建模的能力.例如,Xu等[61]通過聯合利用動態的有向空間依賴關系和長程時間依賴關系,提出一種新的時空Transformer(STTN)模型來提高長期交通流量預測的準確性.他們設計了一個包含空間Transformer和時間Transformer的時空模塊.其中,空間Transformer利用空間多頭注意力機制建模不同模式(連通性、相似性等)的動態空間依賴性,時間Transformer則被用于建模多個時間步長下的長程時間依賴性.仿真實驗結果表明,與現有其他模型相比,STTN模型在處理長程時空依賴關系時更高效且可擴展.隨著研究的深入,研究人員發現Transformer模型對近距離時間相關性不夠敏感.因此,為綜合利用RNN擅長建模近距離時間相關性和Transformer模型擅長建模長程時間相關性的優勢,許多研究人員將RNN與Transformer模型或是將TCN與Transformer模型進行融合,以同時捕獲數據中的近距離和遠距離時間相關性.例如,Wang等[62]提出一種新的具有位置級注意機制(position-wiseattentionmechanism)的圖神經網絡,能動態地聚合來自相鄰道路的歷史交通流信息.為了更好地提取時間特征,他們同時使用RNN和Transformer模型來捕獲局部和全局的時間相關性.為了進一步提高Transformer模型在處理交通流預測任務時的有效性,一些研究者對Transformer的結構進行了改進.譬如,針對Transformer模型適合處理的數據與典型時間序列數據之間存在較大差異、Seq2Seq和Transformer模型的結構易導致累計誤差、Transformer模型不能兼容鄰接矩陣等問題,Yan等[63]提出一種TrafficTransformer模型,他們設計了一種特殊的編碼和特征嵌入來解決Transformer與交通流數據結構不兼容的問題,并將Transformer模型的原始編碼器和解碼器結構改進為全局編碼器和全局-局部解碼器兩個組成部分,將多個全局編碼器和全局-局部解碼器塊堆疊起來,形成一個具有層次特征的深度預測網絡.針對交通流預測問題,Guo等[64]提出一種基于時空注意力機制的圖神經網絡(ASTGNN)模型.為了緩解Transformer模型中自注意力機制對局部時間特征不敏感的問題,該文設計了一種基于CNN實現的自注意力模塊提升局部時間特征感知能力,并構建了一個帶有自注意力的動態圖卷積模塊捕獲動態空間相關性.劉起東等[65]在其基于時間感知Transformer的交通流預測方法中提出一種可以根據不同時間特征確定不同的注意力計算機制,從而更加精準地捕獲不同時刻下流量的時空相關性.在基于Transformer的預測模型中,大多需要將多個相同的模塊進行堆疊,以捕獲深層次的特征.這個特性使得基于Transformer的預測模型往往具有網絡參數多、網絡收斂速度慢的缺點.針對該問題,Bachlechner等[66]提出一種Rezero-Transformer模型.該文對Transformer的歸一化和殘差連接部分進行了改進,改進前和改進后分別由式(32)和式(33)表示:
2.2.7模式分解+圖卷積網絡
經驗模態分解(EmpiricalModeDecomposition,EMD)是Huang等[67]提出的一種信號處理方法,它可以自適應地將原始時間序列分解為幾種不同的內在模態函數(IMFs)和殘差.得到的IMFs和殘差序列具有特定的物理意義,代表原始時間序列的不同時間尺度特征.為了降低預測數據的維度以便更好地對時空相關性進行建模,主成分分析(PrincipalComponentAnalysis,PCA)方法通過對數據進行歸一化等操作將m維原始數據降為k維,然后對歸一化得到的數據計算協方差矩陣、特征值和特征向量,將特征值降序排列,并選擇最大的k個特征值及其對應的特征向量.最后,使用這些特征向量構造新的特征空間,并在新的特征空間上完成流量預測.借鑒EMD和PCA等方法通過對時間序列進行分解得到不同時間尺度特征的思路,Chen等[68]提出一種基于EMD的多元時間圖卷積神經網絡預測模型.該文先采用EMD方法對原始時間序列進行分解,將得到不同尺度下的時間特征作為節點的初始特征生成圖模型.然后使用多頭注意機制來學習節點之間的隱藏依賴關系,并使用GCN網絡提取節點空間特征.最后使用一個TCN網絡為節點嵌入建立時間關系,以執行多變量時間序列預測.Li等[69]設計了一個基于主成分分析(PCA)、圖卷積網絡(GCN)和長短期記憶網絡(LSTM)的主時空圖卷積網絡(PST-GCN)模型.具體來說,PCA首先對原始輸入數據進行降維,然后構建GCN網絡學習城市路網的拓撲結構,以獲得路網中不同路段和節點間的空間相關性.另外,他們在PST-GCN模型中構建了一個LSTM網絡用來捕獲路網中的時間相關性.
3公開數據集
自行采集寬范圍跨時空交通數據集的難度大、成本高.本節具體介紹了5個交通流預測領域常用于模型性能對比分析的公開數據集.
3.1PeMS
PeMS是一個大型的交通數據庫(http://pems.dot.ca.gov),數據由美國加州運輸公司及其合作機構提供.該數據集主要包含加州高速公路上各類車流量相關數據.這些數據可以讓決策者對高速公路通行效率進行統一、全面地評估,基于對高速公路網絡當前狀態的了解做出運營決策,分析擁堵瓶頸以確定潛在的補救措施,并做出更好的整體決策.該數據集由超過44681個檢測器每30s報告一次數據,30s的數據完成編譯后,就會被聚合成5min的增量.該數據集包含有眾多交通效率評價指標,如流量、速度、延遲、車輛行駛里程(VMT)、車輛行駛小時(VHT)、行駛時間和年平均日交通流量(AADT).值得注意的是,PeMS有多個衍生子數據集,譬如PeMS-03、PeMS-BAY等.
3.2METR-LA
METR-LA數據集記錄了美國洛杉磯高速公路上207個監測點的位置信息(包括檢測器間的距離和拓撲關系),以及各監測點在2012年3月1日—6月30日共計4個月時間內記錄的34272條交通速度數據,且數據的采集時間間隔為5min.該數據集可通過其官網(https://www.metro.net)下載.
3.3滴滴蓋亞開發數據集
滴滴蓋亞開發數據集(https://gaia.didichuxing.com/)數據來自于滴滴“蓋亞數據開放計劃”,統計了網約車在成都、西安、海口等城市行駛中的所有傳感器數據.該數據集包括的數據有:車輛平均速度、OD信息、軌跡信息、駕駛場景、POI檢索數據等.
3.4Urban數據集
Urban數據集(http://topis.seoul.go.kr/)記錄了韓國首爾江南區(Urban1)和麻浦區(Urban2)兩個區域的真實車流數據.Urban1和Urban2是首爾交通流量最大的兩個地區,且均具有高度復雜的城市交通網絡.數據集的采樣周期為2018年4月1日至2018年4月30日.數據集主要是基于GPS采集的7萬多輛出租車的軌跡數據,采樣時間間隔為5min.采集的交通流數據經過數據預處理得到的是各鏈路的平均速度.
3.5NYCTaxi
NYCTaxi數據集包括了2009—2020年紐約黃色和綠色出租車行程記錄數據,主要記錄了接送日期/時間、接送地點、行程距離、分項票價、費率類型、付款類型和司機報告的乘客數量等信息.該數據集是一個學術界常用的出租車數據集.下載網址:https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page.
4仿真案例
應用基于圖卷積的短時交通流量預測模型解決交通流預測問題的主要步驟包括:數據預處理、模型訓練及驗證、模型測試等.本節簡述了上述4個步驟的常用方法或具體過程,并以基于LSTM網絡的交通流預測方法和DCRNN網絡的交通流預測方法為參考基準,通過仿真對比分析展示了4種基于圖卷積神經網絡的交通流預測方法在Urban1和Urban2兩個真實交通流數據集上的預測誤差.值得注意的是,參與對比的基于MGCN的交通流預測方法是筆者設計的.
4.1數據預處理
深度學習模型是通過數據進行驅動的,數據集的好壞直接影響著模型的預測性能.從路網采集的原始數據中通常存在數據缺失和異常等問題,數據的缺失或異常將直接影響模型的預測精度.因此,在進行模型訓練前,往往需要對所采集的原始數據進行預處理,以提高數據的完整性和真實性.對于缺失的數據往往使用數據補全的方法進行處理,對于異常數據則常用數據剔除或高峰去噪等方法進行處理.一般路網采集的原始數據的分布較為分散,并不滿足正態分布.因此,需對數據進行標準化和歸一化處理,方便模型對數據進行高效學習.在對數據進行標準化和歸一化后,將不同的數據集按6∶2∶2或按7∶1∶2的比例劃分為訓練集、驗證集和測試集.
4.2模型訓練、驗證及測試
首先,利用訓練集來優化模型參數.更具體地說,將訓練集輸入到構建的預測模型中,利用模型輸出與真實值之間的誤差定義模型損失,并通過梯度下降法對模型參數進行優化.驗證集則主要用于對已經訓練好的模型進行評價,篩選出在驗證集上泛化性更好的模型參數.在交通流量預測研究領域,評價模型泛化能力的常用指標包括:平均絕對誤差(MeanAbsoluteError,MAE)、平均絕對百分比誤差(MeanAbsolutePercentageError,MAPE)和均方根誤差(RootMeanSquaredError,RMSE).在驗證集上,利用上述3個評價指標篩選出泛化性最佳的模型參數,并在測試集上進行預測.
4.3結果分析與討論
表1和表2分別展示了基于LSTM、DCRNN,以及4種圖卷積神經網絡的交通流預測方法在Urban1和Urban2兩個真實交通流數據集上的應用,預測步長分別為15、30和60min時的預測誤差.不難發現,與兩種基準方法相比,采用圖卷積網絡建模交通流量中空間關聯關系的方法具有更低的平均預測誤差.另外,圖7—8進一步展示了預測步長為5min時,不同預測方法分別在1、2、3、6、9、12不同預測時長下的預測誤差.可以看出,在數據集Urban1和Urban2上,參與對比分析的交通流預測方法均能較好地擬合真實的交通流量.基于LSTM的交通流預測方法,僅將交通流數據當作簡單的時間序列進行處理,忽略了路網中不同節點間的復雜空間相關性.由于不同節點間的空間相關性對于長期預測是至關重要的,因此,雖然在預測步長較小時LSTM與其他預測方法之間的預測性能差距較小,但隨著預測步長的增加,它們之間的差距逐步擴大.在上述幾種基于時空圖卷積建模的典型交通流預測方法中,從整體預測性能指標上看,基于STGCN的方法稍遜于基于GraphWaveNet的方法.這可能是由于STGCN方法采用預定義方式對空間相關性進行描述,但在其預定義的圖結構中包含了一些不合理的空間信息描述,導致所定義的圖未能較好地契合道路實際空間結構.GraphWaveNet采用以數據驅動學習的方式來學習與真實路網更加契合的圖結構,解決了預定義圖存在的局限性.值得注意的是,基于多圖卷積網絡MGCN的交通流預測方法,也采用預定義的圖結構且可能會引入一些不合理的空間相關性描述,但由于使用了多個圖卷積網絡GCN從不同的維度提取路網交通流中的空間特征,并將所提取的多個空間特征進行了融合,這在一定程度上緩解了預定義的圖結構中可能存在不合理描述的問題.因此,從3個預測誤差評價指標上看,基于多圖卷積網絡MGCN整體上也優于基于時空圖卷積網絡STGCN.由于路網的時空特征是復雜多變的,采用預定義或者數據驅動學習方式生成的靜態圖結構難以對路網中不同節點間的空間相關性進行有效建模.譬如,靜態圖無法有效刻畫路網中隨時間實時動態變化的空間特征.因此,基于靜態圖的交通流預測模型存在一定的局限性.為了解決該問題,基于多頭注意力機制的時空Transformer(STTN)模型利用時間多頭注意力和空間多頭注意力對路網的動態時空相關性進行建模.因此,在6種基于典型深度神經網絡的交通流預測方法中,基于STTN模型的交通流預測方法具有最優越的預測性能.
5未來發展方向
近年來,基于圖卷積網絡的交通流預測方法成為了交通流預測領域中最熱門的研究方向之一.雖然圖卷積網絡廣泛應用于交通流預測領域并取得了一些有吸引力的研究結果,但基于圖卷積網絡的交通流預測方法研究中還存在一些開放性的問題有待進一步解決.因此,本節對圖卷積網絡及其在交通流領域未來的研究和發展方向進行了開放性的討論,以期為該領域的研究人員提供一些可供參考和借鑒的研究視角.
5.1提取圖中更深層次的隱含信息
在一些基于圖卷積網絡GCN的交通流預測模型中,研究人員僅利用了不同節點之間的距離關系來構建鄰接矩陣.顯然,這種構建鄰接矩陣的方式不能夠充分挖掘交通圖中隱含的信息.與僅使用拓撲圖、距離圖的圖卷積網絡相比,多圖和超圖都是更加有效的新型圖卷積結構,可以對交通圖中更深層次的隱含信息進行更加精細化的建模.例如,Lv等[27]在他們提出的基于時間多圖卷積網絡T-MGCN的交通流預測模型中分析了道路之間存在的兩種語義相關性(即歷史交通模式相關性和局部區域功能相似性),并使用多個圖對異構的空間和語義相關性進行編碼,然后,使用一個多圖卷積網絡來建模和融合不同圖所提取的空間特征信息并用于交通流預測.該研究結果表明,傳統的圖表示存在一定的局限性,無法表示多重關聯,而超圖的引入則有利于表示和學習拓撲結構中的更深層次的相互關聯關系.考慮到路網中連接節點的邊,以及節點之間存在著復雜的相關性且相互作用,Chen等[43]提出了一種基于多范圍注意力雙分量圖卷積網絡的交通流預測方法.該方法構建了一個節點圖和一個邊緣圖分別挖掘節點與節點之間的空間關聯關系,以及邊與邊之間的空間關聯關系,然后,使用一個帶有多范圍注意力機制的雙分量圖卷積網絡顯式地建模節點和邊的相互作用.這些研究都表明了交通圖中具有很多深層的隱含信息,如何更有效地利用這些信息是提高基于圖卷積網絡GCN交通流預測方法預測性能的關鍵所在.
5.2多源數據融合
事實上,城市中不同的交通工具是同時運行的,它們在共同的時空場景下相互影響、相互補充,動態地構成了完整的交通系統.因此,來自不同交通工具的流量數據表面上是異構的,但內部具有隱含的相關性.此外,天氣、交通事故,以及很多外部因素也會對交通模式產生顯著影響.通過融合多源數據并進行協同分析,可以找到這些數據與交通流量之間的相關性,并借此來提高模型的預測性能.例如,Chen等[71]利用多源城市數據(如POI、路網、事件、天氣等)構建多源屬性圖,同時考慮靜態因素和動態因素(如空間距離、語義距離、道路特征、道路狀況和全球背景)來預測短時交通流.由于典型的單數據驅動模型并不普遍適用于異構流量數據,Wang等[72]提出一種用于多源流量預測問題的多任務超圖卷積網絡(MT-HGCN).該框架由一個主任務和一個相關任務組成,且兩個任務都基于超圖卷積網絡(HGCN)提取空間關聯關系.然后,構建特征融合模塊拼接任務,該模塊可以對相關性進行建模并共享潛在特征,以提高主任務的性能.Zhang等[73]在進行多區域上的客運需求短期預測時,提出一種基于端到端多任務學習時間卷積神經網絡(MTL-TCNN)的交通流預測方法.該方法設計了一個ST-DTW算法來量化兩個預測任務之間的時空相關性,提高了出租車需求預測的精度.因此,發掘更多可靠的數據來源,并建立這些數據與交通流量數據之間的相關性,也是提高模型預測性能的主要方法之一.
5.3小樣本預測
在處理大規模數據時,深度學習方法可以展現出非常優秀的性能,但在實際應用時,可能會存在數據采集不足、不同城市的數據質量參差不齊等問題.另外,交通預測的輔助特征如天氣、異常狀況等采集的頻率遠低于交通數據的采集頻率,這可能會使我們無法獲得足夠的訓練數據.而在訓練數據較少時,基于深度學習方法的預測模型往往會產生明顯的性能下降,模型的泛化能力也難以滿足要求.因此,針對小樣本學習進行優化,是提高預測模型實際性能的重要途徑.彭云聰等[74]將小樣本學習分為表征學習、數據擴充、學習策略3種,為小樣本交通流預測提供了多種解決思路.通過表征學習,可以將缺失或者稀疏的交通數據變換到特征域學習.由于特征域具有更低的特征維度以及相關的語義信息,大大降低了預測模型的學習難度.遷移學習也是實現小樣本學習的重要方法之一,其基本思想是相似或者相近的任務之間具有共通性,其本質是基于源域數據和目標域數據之間共同的特征、關系以及模型參數共享等方式進行遷移學習,并將模型用于目標類數據分類.就交通流預測而言,遷移學習旨在將數據豐富的城市或者區域遷移到數據稀疏的城市或者區域.例如,Wang等[75]通過對有歷史數據的交叉口進行遷移學習完成對沒有歷史數據的交叉口的交通流量預測.但遺憾的是,目前的遷移學習模型均存在泛化能力不足的問題.因此,通過加強模型的小樣本學習能力來提高預測模型的實際性能,也是未來重要的研究方向之一.
5.4異常狀況交通流預測
在目前有關交通流預測的研究中,大多是針對日常情形下的交通流量建立預測模型,這些研究大多致力于通過更有效地提取時空特征來優化模型,對其他影響因素考慮得相對較少.但事實上,極端天氣、交通事故等異常情況往往會對交通模式產生重大的影響.當路網中出現此類異常情況時,通用的流量預測模型將難以提供準確的預測結果.目前,已經有研究人員致力于解決此類問題.例如,為了分析交通事故等異常事件對路網交通狀況的影響,Liu等[54]采用位置編碼的方式來檢測復雜交通情況下異常事件的發生,以探索異常事件對區域交通擁堵的影響.An等[76]提出一種基于模糊卷積神經網絡(F-CNN)的交通流預測方法.該方法采用模糊方法來表示交通事故特征,先利用模糊推理機制從真實的交通流數據中生成交通事故信息并融入交通流特征信息中,再利用CNN提取數據中的特征信息,處理數據中的不確定性問題.但到目前為止,此類模型的泛化能力仍然相對較弱,其性能仍有很大的提升空間.因此,異常狀況下的交通預測也是有待進一步開展深入研究的方向之一.
5.5時空同步建模
在大多數交通流預測模型中,時間與空間特征都是分別由不同的神經網絡模塊提取,再將不同神經網絡模塊的輸出進行融合,以達到同時提取時間和空間特征的目的.然而,堆疊過多的神經網絡可能會導致網絡結構復雜、模型參數過多等問題,并降低了模型的可解釋性.對時空特征進行同步建模,在提升模型預測準確度的同時,還可以簡化網絡結構、提升計算效率、增強模型可解釋性.有關時空同步建模的相關研究目前還相對較少.例如,Song等[77]在其提出的時空同步圖卷積網絡(STSGCN)中,設計了一種時空同步建模機制,使得該網絡能夠同步捕獲復雜的時間和空間相關性.Li等[78]在其提出的時空圖融合卷積神經網絡STFGNN模型中,將空間圖ASG、時間圖ATG、時間連接圖ATC組合為一個融合圖ASTFG.融合圖ASTFG同時包含相鄰時間步長的異質時空相關性.同時,該文還設計了一種新的時空融合圖模塊來同步捕獲時空依賴性用于交通流預測.結果表明,時空同步建模使得預測模型的性能獲得了進一步提高.因此,時空同步建模也可以作為未來的研究內容之一.
5.6長時交通流預測
長時交通流預測是指預測周期為半小時至數小時、一天,甚至更長的交通流預測.與短時交通流預測相比,長時交通流預測可以幫助管理者更好地做出決策、采取措施、統籌安排,對提高路網交通管理和服務水平有著重要的作用.在長時交通流預測領域,Peng等[79]提出一種基于強化學習動態圖卷積網絡的長時交通流量預測模型.他們利用路網的歷史流量數據,設計了交通流量傳輸圖和交通流量概率圖來表示不同節點之間的流量轉移關系.針對實際應用中可能存在的數據缺陷,他們還將動態圖生成模塊應用于交通流量的長時預測任務來減少交通流量的預測誤差.然而,相比于短時交通流預測,長時交通流預測往往需要處理更復雜的時空依賴關系,且面臨著更多不確定性因素的干擾.另外,多步預測模型在進行長時預測時,會出現嚴重的誤差累積問題,導致預測準確性隨著預測時長的增加而快速下降.因此,如何繼續在現有研究工作基礎上提高長時交通流預測模型的準確性,是未來的重要研究內容之一.
5.7大規模圖網絡
隨著城市化進程的不斷深入,城市道路交通網絡的規模愈發龐大.由于卷積是基于鄰居節點進行的,對于某個節點進行卷積操作時用到的鄰域節點的個數也會隨著路網規模的增加呈指數級增長.因此,在建模大規模圖網絡時,目前的圖卷積網絡模型也面臨著嚴峻的挑戰.針對該問題,Hamilton等[80]在其提出的一個節點特征信息通用歸納框架GraphSAGE模型中使用分批量的訓練方法,結合鄰居節點采樣的方法,將每次計算所需的節點數目控制在一定范圍之內.雖然GraphSAGE不能解決圖卷積網絡GCN難以有效解決大規模路網交通流預測的問題,但也為圖卷積網絡GCN在大規模數據集上應用提供了一種可參考的思路.因此,如何設計更加高效的模型結構以提高在大規模路網上利用圖卷積建模復雜空間相互關聯關系的效率,是未來交通流預測領域值得研究的方向之一.
6總結
交通流預測不僅是保障智能交通系統高效運行的基礎,也是提高路網利用率、緩解交通擁堵的重要方法.而圖卷積網絡則是目前交通流預測模型中使用最廣泛的神經網絡之一.本文對近幾年基于圖卷積網絡的交通流預測模型進行了全面的回顧與總結.簡要回顧了交通流預測的發展歷史,介紹了圖卷積網絡誕生的背景、優勢及基本原理.另外,收集了近年來交通流預測領域中基于圖卷積網絡的熱點模型,包括時空圖卷積網絡和圖卷積Transformer等,并對其進行了分類和詳細討論.這些模型在交通流預測方面取得了一系列有價值的研究結果,為提升路網通行效率、解決交通擁堵問題提供了一些新的思路和方法.此外,還收集了交通流領域常用的一些公開數據集,并以其中一個真實數據集為例驗證了基于圖卷積網絡交通流預測模型的有效性以及相比于基準模型的優勢.最后,本文對基于圖卷積網絡的交通流預測方法未來可能的研究方向和挑戰進行了開放式的討論.圖卷積網絡在交通流預測中的應用前景廣闊,但仍存在一些挑戰和難點,如模型的可解釋性和對大規模數據的處理能力等.未來的研究可以聚焦于這些問題,進一步探索更加高效和精確的交通流預測方法.
參考文獻
References
[1]
WangYB,YuXH,ZhangSY,etal.Freewaytrafficcontrolinpresenceofcapacitydrop[J].IEEETransactionsonIntelligentTransportationSystems,2021,22(3):1497-1516
[2]陸化普,孫智源,屈聞聰.大數據及其在城市智能交通系統中的應用綜述[J].交通運輸系統工程與信息,2015,15(5):45-52
LUHuapu,SUNZhiyuan,QUWencong.Bigdataanditsapplicationsinurbanintelligenttransportationsystem[J].JournalofTransportationSystemsEngineeringandInformationTechnology,2015,15(5):45-52
[3]PanB,DemiryurekU,ShahabiC.Utilizingreal-worldtransportationdataforaccuratetrafficprediction[C]//2012IEEE12thInternationalConferenceonDataMining.December10-13,2012,Brussels,Belgium.IEEE,2013:595-604
[4]SunYJ,ZhangGH,YinHH.Passengerflowpredictionofsubwaytransferstationsbasedonnonparametricregressionmodel[J].DiscreteDynamicsinNatureandSociety,2014,2014:1-8
[5]WilliamsBM,DurvasulaPK,BrownDE.Urbanfreewaytrafficflowprediction:applicationofseasonalautoregressiveintegratedmovingaverageandexponentialsmoothingmodels[J].TransportationResearchRecord:JournaloftheTransportationResearchBoard,1998,1644:132-141
[6]LeeS,FambroDB.Applicationofsubsetautoregressiveintegratedmovingaveragemodelforshort-termfreewaytrafficvolumeforecasting[J].TransportationResearchRecord:JournaloftheTransportationResearchBoard,1999,1678:179-188
[7]WilliamsBM.Multivariatevehiculartrafficflowprediction:evaluationofARIMAXmodeling[J].TransportationResearchRecord:JournaloftheTransportationResearchBoard,2001,1776:194-200
[8]ZivotE,WangJ.Vectorautoregressivemodelsformultivariatetimeseries[M]//ZivotE,WangJH.ModelingFinancialTimeSerieswithS-PLUS.2nded.NewYork,NY:SpringerNewYork,2007:385-429
[9]VanLintJWC,VanHinsbergenC.Short-termtrafficandtraveltimepredictionmodels[J].ArtificialIntelligenceApplicationstoCriticalTransportationIssues,2012,22(1):22-41
[10]JeongYS,ByonYJ,Castro-NetoMM,etal.Supervisedweighting-onlinelearningalgorithmforshort-termtrafficflowprediction[J].IEEETransactionsonIntelligentTransportationSystems,2013,14(4):1700-1707
[11]MaXL,DaiZA,HeZB,etal.Learningtrafficasimages:adeepconvolutionalneuralnetworkforlarge-scaletransportationnetworkspeedprediction[J].Sensors,2017,17(4):818
[12]FuR,ZhangZ,LiL.UsingLSTMandGRUneuralnetworkmethodsfortrafficflowprediction[C]//201631stYouthAcademicAnnualConferenceofChineseAssociationofAutomation(YAC).November11-13,2016,Wuhan,China.IEEE,2017:324-328
[13]YaoHX,WuF,KeJT,etal.Deepmulti-viewspatial-temporalnetworkfortaxidemandprediction[J].ProceedingsoftheAAAIConferenceonArtificialIntelligence,2018,32(1):2588-2595
[14]LiuYP,ZhengHF,FengXX,etal.Short-termtrafficflowpredictionwithConv-LSTM[C]//20179thInternationalConferenceonWirelessCommunicationsandSignalProcessing(WCSP).October11-13,2017,Nanjing,China.IEEE,2017:1-6
[15]NagyAM,SimonV.Surveyontrafficpredictioninsmartcities[J].PervasiveandMobileComputing,2018,50:148-163
[16]NiepertM,AhmedM,KutzkovK.Learningconvolutionalneuralnetworksforgraphs[C]//InternationalConferenceonMachineLearning.PMLR,2016:2014-2023
[17]BrunaJ,ZarembaW,SzlamA,etal.Spectralnetworksandlocallyconnectednetworksongraphs[J].arXive-print,2014,arXiv:1312.6203
[18]GilmerJ,SchoenholzSS,RileyPF,etal.Neuralmessagepassingforquantumchemistry[C]//Proceedingsofthe34thInternationalConferenceonMachineLearning.August6-11,2017,Sydney,NSW,Australia.NewYork:ACM,2017:1263-1272
[19]MontiF,BoscainiD,MasciJ,etal.GeometricdeeplearningongraphsandmanifoldsusingmixturemodelCNNs[C]//2017IEEEConferenceonComputerVisionandPatternRecognition(CVPR).July21-26,2017,Honolulu,HI,USA.IEEE,2017:5425-5434
[20]HenaffM,BrunaJ,LeCunY.Deepconvolutionalnetworksongraph-structureddata[J].arXive-print,2015,arXiv:1506.05163
[21]KipfTN,WellingM.Semi-supervisedclassificationwithgraphconvolutionalnetworks[J].arXive-print,2016,arXiv:1609.02907
[22]LiuQH,ZhangR,WangYJ,etal.DailypredictionoftheArcticseaiceconcentrationusingreanalysisdatabasedonaconvolutionalLSTMnetwork[J].JournalofMarineScienceandEngineering,2021,9(3):330
[23]DiaoZL,WangX,ZhangDF,etal.Dynamicspatial-temporalgraphconvolutionalneuralnetworksfortrafficforecasting[J].ProceedingsoftheAAAIConferenceonArtificialIntelligence,2019,33(1):890-897
[24]ZhengQ,ZhangYY.DSTAGCN:dynamicspatial-temporaladjacentgraphconvolutionalnetworkfortrafficforecasting[J].IEEETransactionsonBigData,2023,9(1):241-253
[25]HuJ,ChenLY.Multi-attentionbasedspatial-temporalgraphconvolutionnetworksfortrafficflowforecasting[C]//2021InternationalJointConferenceonNeuralNetworks(IJCNN).July18-22,2021,Shenzhen,China.IEEE,2021:1-7
[26]MaYT,LanSY,WangWW,etal.Modelingofspatial-temporaldependencyintrafficflowdatafortrafficforecasting[J].SSRNElectronicJournal,2022.DOI:10.2139/ssrn.4142192
[27]LvMQ,HongZX,ChenL,etal.Temporalmulti-graphconvolutionalnetworkfortrafficflowprediction[J].IEEETransactionsonIntelligentTransportationSystems,2021,22(6):3337-3348
[28]YangYD,FengZL,SongML,etal.Factorizablegraphconvolutionalnetworks[C]//Proceedingsofthe34thInternationalConferenceonNeuralInformationProcessingSystems.December6-12,2020,Vancouver,BC,Canada.NewYork:ACM,2020:20286-20296
[29]YinD,JiangRH,DengJW,etal.MTMGNN:multi-timemulti-graphneuralnetworkformetropassengerflowprediction[J].GeoInformatica,2023,27(1):77-105
[30]LeeK,RheeW.DDP-GCN:multi-graphconvolutionalnetworkforspatiotemporaltrafficforecasting[J].TransportationResearchPartC:EmergingTechnologies,2022,134:103466
[31]GengX,LiYG,WangLY,etal.Spatiotemporalmulti-graphconvolutionnetworkforride-hailingdemandforecasting[J].ProceedingsoftheAAAIConferenceonArtificialIntelligence,2019,33(1):3656-3663
[32]KhaledA,ElsirAMT,ShenYM.TFGAN:trafficforecastingusinggenerativeadversarialnetworkwithmulti-graphconvolutionalnetwork[J].Knowledge-BasedSystems,2022,249:108990
[33]WuZH,PanSR,LongGD,etal.GraphWaveNetfordeepspatial-temporalgraphmodeling[J].arXive-print,2019,arXiv:1906.00121
[34]BaiL,YaoLN,LiC,etal.Adaptivegraphconvolutionalrecurrentnetworkfortrafficforecasting[J].AdvancesinNeuralInformationProcessingSystems,2020,33:17804-17815
[35]ShinY,YoonY.PGCN:progressivegraphconvolutionalnetworksforspatial-temporaltrafficforecasting[J].arXive-print,2022,arXiv:2202.08982
[36]WangYH,FangS,ZhangCX,etal.TVGCN:time-variantgraphconvolutionalnetworkfortrafficforecasting[J].Neurocomputing,2022,471:118-129
[37]谷振宇,陳聰,鄭家佳,等.考慮時空相似性的動態圖卷積神經網絡交通流預測[J].控制與決策,2023,38(12):3399-3408
GUZhenyu,CHENCong,ZHENGJiajia,etal.TrafficflowpredictionbasedonSTG-CRNN[J].ControlandDecision,2023,38(12):3399-3408
[38]CuiZY,HenricksonK,KeRM,etal.Trafficgraphconvolutionalrecurrentneuralnetwork:adeeplearningframeworkfornetwork-scaletrafficlearningandforecasting[J].IEEETransactionsonIntelligentTransportationSystems,2020,21(11):4883-4894
[39]AliA,ZhuYM,ZakaryaM.Exploitingdynamicspatio-temporalgraphconvolutionalneuralnetworksforcitywidetrafficflowsprediction[J].NeuralNetworks,2022,145:233-247
[40]張陽,胡月,陳德旺,等.基于GCN-BiLSTM的短時交通流預測模型[J].武漢理工大學學報(交通科學與工程版),2023,47(5):802-806
ZHANGYang,HUYue,CHENDewang,etal.Short-termtrafficflowpredictionmodelbasedonGCN-BiLSTM[J].JournalofWuhanUniversityofTechnology(TransportationScience&Engineering),2023,47(5):802-806
[41]ZhangY,ChengT,RenYB,etal.Anovelresidualgraphconvolutiondeeplearningmodelforshort-termnetwork-basedtrafficforecasting[J].InternationalJournalofGeographicalInformationScience,2020,34(5):969-995
[42]ZhaoL,SongYJ,ZhangC,etal.T-GCN:atemporalgraphconvolutionalnetworkfortrafficprediction[J].IEEETransactionsonIntelligentTransportationSystems,2020,21(9):3848-3858
[43]ChenWQ,ChenL,XieY,etal.Multi-rangeattentivebicomponentgraphconvolutionalnetworkfortrafficforecasting[J].ProceedingsoftheAAAIConferenceonArtificialIntelligence,2020,34(4):3529-3536
[44]ZhaoW,ZhangSQ,ZhouB,etal.Multi-spatio-temporalfusiongraphrecurrentnetworkfortrafficforecasting[J].arXive-print,2022,arXiv:2205.01480
[45]陳柘,劉嘉華,趙斌,等.基于GCN和TCN的多因素城市路網出租車需求預測[J].控制與決策,2023,38(4):1031-1038
CHENZhe,LIUJiahua,ZHAOBin,etal.Multi-factortaxidemandforecastingforurbanroadnetworkbasedonGCNandTCN[J].ControlandDecision,2023,38(4):1031-1038
[46]YuB,YinHT,ZhuZX.Spatio-temporalgraphconvolutionalnetworks:adeeplearningframeworkfortrafficforecasting[J].arXive-print,2017,arXiv:1709.04875
[47]HeKM,ZhangXY,RenSQ,etal.Deepresiduallearningforimagerecognition[C]//2016IEEEConferenceonComputerVisionandPatternRecognition(CVPR).June27-30,2016,LasVegas,NV,USA.IEEE,2016:770-778
[48]DaiAM,LeQV.Semi-supervisedsequencelearning[J].AdvancesinNeuralInformationProcessingSystems,2015:3079-3087
[49]ZhuH,LuoY,LiuQ,etal.Multistepflowpredictiononcar-sharingsystems:amulti-graphconvolutionalneuralnetworkwithattentionmechanism[J].InternationalJournalofSoftwareEngineeringandKnowledgeEngineering,2019,29(11/12):1727-1740
[50]LiYG,YuR,ShahabiC,etal.Diffusionconvolutionalrecurrentneuralnetwork:data-driventrafficforecasting[J].arXive-print,2017,arXiv:1707.01926
[51]GuoJL,SongCY,ZhangH,etal.Multi-steptrafficspeedpredictionmodelwithauxiliaryfeaturesonurbanroadnetworksanditsunderstanding[J].IETIntelligentTransportSystems,2020,14(14):1997-2009
[52]KipfTN,WellingM.Variationalgraphauto-encoders[J].arXive-print,2016,arXiv:1611.07308
[53]葛宇然,付強.基于時空聯合學習的城市交通流短時預測模型[J].計算機工程,2023,49(1):270-278
GEYuran,FUQiang.Short-timepredictionmodelforurbantrafficflowbasedonjointspatio-temporallearning[J].ComputerEngineering,2023,49(1):270-278
[54]LiuZC,ZhangR,WangC,etal.Spatial-temporalconv-sequencelearningwithaccidentencodingfortrafficflowprediction[J].IEEETransactionsonNetworkScienceandEngineering,2022,9(3):1765-1775
[55]HuangXH,YeYM,YangXF,etal.Multistepcoupledgraphconvolutionwithtemporal-attentionfortrafficflowprediction[J].IEEEAccess,2022,10:48179-48192
[56]GuoSN,LinYF,FengN,etal.Attentionbasedspatial-temporalgraphconvolutionalnetworksfortrafficflowforecasting[J].ProceedingsoftheAAAIConferenceonArtificialIntelligence,2019,33(1):922-929
[57]GoodfellowI,Pouget-AbadieJ,MirzaM,etal.Generativeadversarialnetworks[J].CommunicationsoftheACM,2020,63(11):139-144
[58]代亮,梅洋,錢超,等.基于生成對抗網絡的大規模路網交通流預測算法[J].控制與決策,2021,36(12):2937-2945
DAILiang,MEIYang,QIANChao,etal.Trafficflowforecastingalgorithmforlarge-scaleroadnetworkbasedonGAN[J].ControlandDecision,2021,36(12):2937-2945
[59]JinJC,RongDD,ZhangT,etal.AGAN-basedshort-termlinktrafficpredictionapproachforurbanroadnetworksunderaparallellearningframework[J].IEEETransactionsonIntelligentTransportationSystems,2022,23(9):16185-16196
[60]ZhangJL,LiHA,ZhangSX,etal.Aspatiotemporalgraphgenerativeadversarialnetworksforshort-termpassengerflowpredictioninurbanrailtransitsystems[J].InternationalJournalofGeneralSystems,2023,52(6):694-721
[61]XuMX,DaiWR,LiuCM,etal.Spatial-temporaltransformernetworksfortrafficflowforecasting[J].arXive-print,2020,arXiv:2001.02908
[62]WangXY,MaY,WangYQ,etal.Trafficflowpredictionviaspatialtemporalgraphneuralnetwork[C]//ProceedingsoftheWebConference2020.April20-24,2020,Taipei,China.NewYork:ACM,2020:1082-1092
[63]YanHY,MaXL,PuZY.Learningdynamicandhierarchicaltrafficspatiotemporalfeatureswithtransformer[J].IEEETransactionsonIntelligentTransportationSystems,2022,23(11):22386-22399
[64]GuoSN,LinYF,WanHY,etal.Learningdynamicsandheterogeneityofspatial-temporalgraphdatafortrafficforecasting[J].IEEETransactionsonKnowledgeandDataEngineering,2022,34(11):5415-5428
[65]劉起東,劉超越,邱紫鑫,等.基于時間感知Transformer的交通流預測方法[J].計算機科學,2023,50(11):88-96
LIUQidong,LIUChaoyue,QIUZixin,etal.Time-awaretransformerfortrafficflowforecasting[J].ComputerScience,2023,50(11):88-96
[66]BachlechnerT,MajumderBP,MaoH,etal.ReZeroisallyouneed:fastconvergenceatlargedepth[C]//UncertaintyinArtificialIntelligence.PMLR,2021:1352-1361
[67]HuangNE,ShenZ,LongSR,etal.TheempiricalmodedecompositionandtheHilbertspectrumfornonlinearandnon-stationarytimeseriesanalysis[J].ProceedingsoftheRoyalSocietyofLondonSeriesA:Mathematical,PhysicalandEngineeringSciences,1998,454(1971):903-995
[68]ChenYW,DingFQ,ZhaiLB.Multi-scaletemporalfeaturesextractionbasedgraphconvolutionalnetworkwithattentionformultivariatetimeseriesprediction[J].ExpertSystemswithApplications,2022,200:117011
[69]LiN,JiaSC,LiQ.Trafficmessagechannelpredictionbasedongraphconvolutionalnetwork[J].IEEEAccess,2021,9:135423-135431
[70]ZhaoZ,ChenWH,WuXM,etal.LSTMnetwork:adeeplearningapproachforshort-termtrafficforecast[J].IETIntelligentTransportSystems,2017,11(2):68-75
[71]ChenL,ShaoW,LvMQ,etal.AARGNN:anattentiveattributedrecurrentgraphneuralnetworkfortrafficflowpredictionconsideringmultipledynamicfactors[J].IEEETransactionsonIntelligentTransportationSystems,2022,23(10):17201-17211
[72]WangJC,ZhangY,WangLX,etal.Multitaskhypergraphconvolutionalnetworks:aheterogeneoustrafficpredictionframework[J].IEEETransactionsonIntelligentTransportationSystems,2022,23(10):18557-18567
[73]ZhangKP,LiuZJ,ZhengL.Short-termpredictionofpassengerdemandinmulti-zonelevel:temporalconvolutionalneuralnetworkwithmulti-tasklearning[J].IEEETransactionsonIntelligentTransportationSystems,2020,21(4):1480-1490
[74]彭云聰,秦小林,張力戈,等.面向圖像分類的小樣本學習算法綜述[J].計算機科學,2022,49(5):1-9
PENGYuncong,QINXiaolin,ZHANGLige,etal.Surveyonfew-shotlearningalgorithmsforimageclassification[J].ComputerScience,2022,49(5):1-9
[75]WangHQ,ZhangRQ,ChengX,etal.Hierarchicaltrafficflowpredictionbasedonspatial-temporalgraphconvolutionalnetwork[J].IEEETransactionsonIntelligentTransportationSystems,2022,23(9):16137-16147
[76]AnJY,FuL,HuM,etal.Anovelfuzzy-basedconvolutionalneuralnetworkmethodtotrafficflowpredictionwithuncertaintrafficaccidentinformation[J].IEEEAccess,2019,7:20708-20722
[77]SongC,LinYF,GuoSN,etal.Spatial-temporalsynchronousgraphconvolutionalnetworks:anewframeworkforspatial-temporalnetworkdataforecasting[J].ProceedingsoftheAAAIConferenceonArtificialIntelligence,2020,34(1):914-921
[78]LiMZ,ZhuZX.Spatial-temporalfusiongraphneuralnetworksfortrafficflowforecasting[J].ProceedingsoftheAAAIConferenceonArtificialIntelligence,2021,35(5):4189-4196
[79]PengH,DuBW,LiuMS,etal.Dynamicgraphconvolutionalnetworkforlong-termtrafficflowpredictionwithreinforcementlearning[J].InformationSciences,2021,578:401-416
[80]HamiltonWL,YingR,LeskovecJ.Inductiverepresentationlearningonlargegraphs[C]//Proceedingsofthe31stInternationalConferenceonNeuralInformationProcessingSystems.December4-9,2017,LongBeach,California,USA.NewYork:ACM,2017:1025-1035
Asurveyoftrafficflowpredictionbasedongraphconvolutionalnetworks
YEBaolin1,2DAIBenao1,2ZHANGMingjian1,2GAOHuimin2WUWeimin3
1SchoolofInformationScienceandEngineering,ZhejiangSci-TechUniversity,Hangzhou310018,China
2CollegeofInformationScienceandEngineering,JiaxingUniversity,Jiaxing314001,China
3InstituteofCyber-SystemsandControl,ZhejiangUniversity,Hangzhou310027,China
AbstractInrecentyears,deeplearninghasbeenahotresearchtopicintrafficflowprediction.Graphconvolutionalnetworksoutperformtraditionalconvolutionalneuralnetworksinspatialfeaturemodeling,inviewoftheirpowerfulcapabilitiesinprocessingnon-Euclideandatasuchastopologicalmap,distancemapandflowsimilaritymap.Therefore,graphconvolutionalnetworkanditsvariantshavebecomearesearchhotspotintrafficflowprediction,andmanyattractiveresearchresultshavebeenobtained.Thisarticleclassifiesandsummarizestrafficflowpredictionmodelsbasedongraphconvolutionalnetworksinrecentyears.First,thegraphconvolutioniselaboratedbycombiningthedefinitionsofspatialconvolutionandspectralconvolution.Second,inviewofthenetworkstructureofthepredictionmodel,thegraphconvolutionalnetworkbasedtrafficflowpredictionmodelsaredividedintotwomajorcategoriesofcombinedtypeandimprovedtype,eachofwhichareanalyzedanddiscussedindetailwithrepresentativemodelstructures.Inaddition,typicaldatasetscommonlyusedintrafficflowpredictionformodelperformancecomparisonarereviewed,andasimulationtestisconductedusingonerealdatasettodemonstratethepredictionperformanceoffourtrafficflowpredictionmodelsbasedongraphconvolutionalnetworks.Finally,thefutureresearchhotspotsandchallengesintrafficflowpredictionbasedongraphconvolutionalnetworksareprospected.
Keywordsdeeplearning;trafficcongestion;graphconvolutionalnetwork;trafficflowprediction