



































摘 要:目前,基于深度學習的交通流量預測方法存在不足。首先,基于圖卷積網絡的預測模型使用簡化的路網拓撲,忽視了實際交通組織信息,影響預測準確性。其次,基于聚類的預測模型未考慮交通流的區域和時間相似性,未能有效利用時空模式,導致聚類結果對預測提升有限。此外,過大的訓練樣本增加了訓練和預測時間,影響實時性。為了解決上述問題,提出了基于深度聚類的城市卡口短時流量預測模型(deep temporal clustering traffic flow prediction,DTCTFP)。首先,構建包含實際交通組織信息的路網拓撲,利用圖卷積網絡挖掘卡口間的時空特性;其次,引入改進的動態時間規整和最短路徑分析方法,將相似的交通流對象歸類到同一簇,使模型充分利用流量、時間、位置等特征信息,提升預測精度;最后利用基于簇的循環神經網絡進行預測,提高模型的實時性和計算效率。基于重慶大渡口交通數據進行了實驗驗證,結果顯示,相較于最新基準模型,在MAE、RMSE、MAPE指標上,平均降低了15.02%、10.72%、10.98%,并通過消融實驗證實了所提出的聚類方法能夠提升14.5%的預測準確性。
關鍵詞: 深度聚類; 交通流量預測; 循環神經網絡; 動態時間規整; 交通卡口
中圖分類號: TP391 文獻標志碼: A 文章編號: 1001-3695(2025)02-007-0371-10
doi: 10.19734/j.issn.1001-3695.2024.07.0284
Short-term traffic flow prediction of city intersection
based on deep temporal clustering
Guo Jian1, Zheng Jiaoling1’, Qiao Shaojie1, Deng Hongyao2, Sun Jigang2, Li Xinjia2
(1. School of Software Engineering, Chengdu University of Information Technology, Chengdu 610225, China; 2. Sichuan Efang Intelligence Technology Co., Ltd., Chengdu 610000, China)
Abstract:Currently, deep learning-based traffic flow prediction methods have deficiencies. Firstly, the prediction model based on graph convolutional network uses a simplified road network topology, ignores the actual traffic organization information, and affects the prediction accuracy. Secondly, the clustering-based prediction model does not consider the regional and temporal similarity of traffic flow and fails to effectively utilize spatio-temporal patterns, resulting in limited enhancement of prediction by clustering results. In addition, overly large training samples increases the training and prediction time, affecting real-time performance. In order to solve the above problems, this paper proposed a deep temporal clustering traffic flow prediction (DTCTFP) model based on deep temporal clustering for short-term traffic flow prediction at urban chokepoints. Firstly, the method constructed the road network topology containing actual traffic organization information and used a graph convolutional network to mine the spatio-temporal characteristics between chokepoints. Secondly, it introduced improved dynamic temporal regularization and shortest path analysis methods to classify similar traffic flow objects into the same cluster, allowing the model to make full use of feature information such as flow rate, time, and location to improve prediction accuracy. Finally, it used a cluster-based recurrent neural network for prediction to enhance the real-time and computational efficiency of the model. Using Chongqing Dadukou traffic data, experiments show that the model reduces MAE, RMSE, and MAPE by 15.02%, 10.72%, and 10.98% on average compared to the latest benchmark. The ablation test also confirms a 14.5% improvement in prediction accuracy with the proposed clustering method.
Key words:deep clustering; traffic flow prediction; recurrent neural network; dynamic time warping; traffic intersection
0 引言
十字路口交通信號控制是調節交通流量、緩解交通擁堵的一種低成本手段。隨著數據采集技術的成熟,數據驅動的交通流量預測方法因其能夠識別隱藏在歷史數據中的交通流特征而日益成為主流交通量預測方法。
從時間關系的角度來看,交通流量數據由一組時間序列組成。雖然每個位置的交通狀況不斷變化,但每個時間片的交通狀態與其最近的過去狀態密切相關。為捕捉這種時間關系,研究者們采用了參數或非參數方法。Lyu等人[1]將自編碼器(autoencoder,AE)應用于高速公路交通流預測。結果證實,該方法從交通數據中識別出了潛在的交通流特征,如非線性時空相關性。Pang等人[2]應用循環神經網絡(recurrent neural network,RNN)提取時間維度的特征,用于公交出行時間和到達時間預測。結果表明,RNN的優勢在于學習與時間序列相關的任務。然而,RNN存在梯度消失問題,為了解決這一問題,提出了長短期記憶網絡(long short-term memory,LSTM)[3]。Abduljabbar等人[4]應用LSTM預測單條道路的交通速度和流量。研究結果表明,LSTM及其變體有效地捕獲了交通數據的短期變化。
從空間關系的角度來看,交通路網拓撲結構的不規則性使得人工構建網絡級規則輸入變得非常困難。為了滿足這一要求,引入圖神經網絡(graph neural network,GNN)[5]從基于圖的數據中預測交通流量和速度[6~8]。對于基于圖的數據,每個檢測器的位置都被視為一個節點,并捕獲相鄰節點之間的空間關系。圖卷積網絡(graph convolutional network,GCN)[9]可以使用譜圖理論將卷積操作擴展到非歐幾里德域。然而,如果增加更多的GCN層,數據將會過度擬合。而且,GCN中每個節點的鄰居數量是固定的,不能反映實際的流量情況,提取網絡中所有探測器的交通流量變化仍然很困難。道路網絡的出行行為是復雜的、動態的,用一張圖很難捕捉到所有檢測器的所有特征。使用所有檢測器作為節點將導致一個非常大的圖。而且,學習如此龐大的圖也非常具有挑戰性,很容易過擬合。
除了從流量數據中提取時空相關性以進行準確預測外,研究人員還將重點放在了網絡級交通流量預測上。許多研究都集中在高速公路數據上,如Caltrans Performance Measurement System (PeMS)[10]提供的由加州運輸公司在加州高速公路上實時采集的高速公路流量數據集。但由于交通信號控制而更加復雜的城市交通流量卻很少得到研究。Vlahogianni等人[11]報道,人口密集的城市道路網絡中的相互作用使得網絡級預測具有挑戰性。
目前大部分短時交通量預測方法局限于高速公路和城市主干道。然而,將這些方法推廣到涉及不同功能的多個路段、異構道路網絡中是具有挑戰性的。
如圖1(a)所示,在重慶市大渡口某區域存在四個卡口,它們展示了交通流數據具有時間和空間屬性的特點。在早高峰時段(7:00~9:00),這四個卡口的流量變化趨勢如圖1(b)所示,并通過深度學習模型提取了特征,時間粒度為5 min,時間跨度為一周。觀察發現,卡口1和3的流量變化更為相似,而卡口2和4的流量變化更為相似。圖中黑色虛線部分為周一早高峰的變化情況(見電子版),在這24個時間點中,可以觀察到四個不同的卡口在早高峰期間表現出不同的特征。其中卡口1和3呈現出相似的波動變化,具有明顯的周期性。與此不同,卡口2和4在早高峰期間車流量始終保持在較高位置,變化幅度大。這種現象可能有以下原因:卡口1和3位于立交橋的出口,而卡口2靠近醫院,卡口4則在學校附近。在早高峰時段,主要的車流是由南向北流動的。醫院和學校周圍的交通情況通常更為復雜,流量波動也更加顯著。
針對上述問題,本文提出了基于深度聚類的交通流時間序列預測框架DTCTFP,下文將具體進行介紹。
1 問題定義
定義1 交通流序列。給定一個大規模路網Φ由Nsection(后續簡寫為Nsect)個卡口組成,Φ={x(i)}Nsect,卡口x(i)包含的路段集合為Li,其中x(i)=[x(i)1,x(i)2,…,x(i)Nhist]表示第i個卡口上的歷史交通流序列。
原始問題:流量預測。交通流量預測的目標是構建歷史流量值xNhist與未來流量值xNpred之間的映射函數f(·):
x(i)n+Npred=f(x(i)n-Nhist+1,x(i)n-Nhist+2,…,x(i)n)(1)
在交通流量預測中,傳統的方法通常是直接構建歷史流量值與未來流量值之間的映射函數,如式(1)。這種方法雖然可以在一定程度上捕捉交通流量的變化趨勢,但在處理大規模路網時可能存在一些局限性,直接對整個路網的所有卡口應用單一模型,可能難以有效捕捉各個區域內流量模式的差異,尤其是在路網規模龐大、卡口眾多的情況下。為了更精準地預測各個區域的流量,本文提出了一種基于聚類的流量預測方法。
本文要解決的問題(基于聚類的流量預測):將大規模路網Φ劃分為k簇{C(1),C(2),…,C(k)}的過程稱為交通流序列聚類,C(k)表示第k簇,其中0lt;klt;lt;Nsect,x(i,k)表示第i個卡口聚集到第k簇C(k)中,x(k)trend表示每簇聚類中心。這種方法是基于某一相似性度量將特征相似的交通流序列分在同一簇。而在每個簇中,為所有卡口訓練一個基于簇模型的預測模型,C(k)dynamic={x(i,k)Nhist}為由滑動窗口生成的每簇動態的訓練樣本,C(k)pred={x(i,k)Npred}為每簇預測的流量值:
C(k)pred=f(k)(C(k)dynamic)(2)
當前問題面臨的挑戰及解決方案:
現有基于聚類的交通流量預測模型通常以時間序列聚類為主,側重于通過時序相似性來挖掘交通流量的變化規律。這類方法假設相似的時間序列模式意味著相似的交通流狀況,因此常忽略交通流在時間和空間上的復雜特性。然而,交通流不僅在時間上表現出高峰期的錯位、波動等非線性特征,還在空間上受到交通組織措施的顯著影響。僅僅依賴時間序列的聚類分析,往往難以捕捉這些關鍵因素。因此,必須結合時間和空間兩個角度對交通流量進行更深入地分析。
在時間維度上,交通流量表現出復雜的非線性特征,不同位置的高峰時段可能存在顯著的時間錯位;而在空間維度上,交通流量不僅僅受物理距離的影響,交通管制和組織措施對交通流量的分布和流動同樣起著至關重要的作用。這兩者都對現有基于時間序列聚類和圖卷積網絡的方法提出了挑戰。時間維度主要面臨挑戰1,而空間維度則主要體現為挑戰2。
a)挑戰1:現有基于聚類的交通流量預測模型中,時序聚類算法未能充分挖掘交通流的非線性特征。在圖1中,可以看到卡口2的早高峰時間明顯早于卡口4的早高峰時間,這表明交通流量在不同地點的時序差異。這種時間上的錯位不僅反映了交通流受時間和空間兩個維度的復雜影響,還會導致傳統的相似性度量方法如動態時間規整(dynamic time warping,DTW)[12]在對齊和捕捉這種時序延遲時出現問題。由于卡口2和4兩個交通流序列在趨勢形狀上基本一致但出現了平移、壓縮和拉伸現象,DTW錯誤地將交通流數據的不同部分進行匹配,導致病態對齊現象。這種錯誤的對齊會使得DTW算法無法準確反映實際的交通流時空特征,從而限制了基于DTW的聚類結果在預測中的有效性。
針對挑戰1,在圖2(a)交通流聚類模塊中,改進后的梯度約束動態時間規整算法在原有基礎上進行了重要優化,不僅對早高峰期間交通流對齊路徑的斜率變化進行了限制,還增強了對交通流序列中噪聲和突發事件的應對能力。具體而言,該算法通過對齊路徑的斜率進行梯度約束,避免了在交通流延遲現象下出現的病態對齊問題。這種改進使得算法在處理實際交通數據時更為魯棒,特別是在早高峰等關鍵時段,能夠更準確地匹配具有復雜時空特征的流量模式。
b)挑戰2:如圖1所示,卡口2實施了“禁止左轉”的交通管制措施,導致卡口1和2雖然在物理距離上很近,但早高峰的流量變化情況卻完全不同。這表明,交通組織信息(如“禁止左轉”)對交通流量的影響非常顯著,并直接影響交通流的分布和變化。然而,現有的基于圖卷積網絡的交通流量預測模型通常通過交通網絡的物理結構來構建節點關系,例如基于節點之間的地理距離。這些模型假設物理上相鄰或距離較近的交通節點之間存在較強的交通流依賴性,因此更有可能受到相似的交通流量變化影響。然而,這種基于物理結構的方式雖然能夠捕捉一定程度上的交通關聯性,但與實際的交通流量動態變化并不完全貼切。交通流量不僅受到地理距離的影響,還受到諸如交通組織措施的顯著影響。這些措施能夠顯著改變流量的分布與流動方向,導致物理距離較近的節點在流量表現上可能截然不同。
針對挑戰2,在圖2(b)路網特征提取模塊中提出了一種改進的路網建模方法,以路段而非單個卡口作為節點,構建更具代表性的路網拓撲結構。在這一拓撲結構中,實際的交通組織信息,如“禁止左轉”等交通管制措施,被充分考慮并納入模型。這種方法不僅反映了交通網絡的物理連接,還捕捉了更復雜的交通規則和管制信息的影響。在早高峰期間,某些路段的流量可能會受到前方路段的交通管制措施的影響,導致非線性的流量變化。GCN通過整合這些復雜的關系,能夠更精準地捕捉不同路段之間的流量變化規律,從而提高交通流量預測的準確性。早高峰時段,交通流量變化頻繁且復雜,傳統模型可能難以準確預測此時的流量動態。而改進后的模型通過綜合考慮物理結構和交通組織信息,使得預測結果更貼近實際情況。
c)挑戰3:在交通流量預測中,實時性是一個至關重要的因素。準確的流量預測需要模型能夠在短時間內處理大量數據并生成結果。然而,當訓練樣本規模過大時,模型的訓練和預測時間可能顯著延長,這直接影響到預測結果的實時性。交通流量數據通常是連續的,并且隨著時間推移不斷積累,這導致模型在面對龐大數據集時,計算負擔和資源消耗大幅增加。如果訓練時間過長,模型的響應速度會下降,無法滿足實際交通管理和調度的實時需求。
針對挑戰3,提出了基于模型共享的理念,如圖2(c)模型共享模塊,該模塊旨在提高交通流預測的實時性。這種方法通過對交通流模式進行聚類,將具有相似交通特征的卡口分為同一簇,然后為每個簇構建一個共享的預測模型。與傳統的獨立模型相比,這種基于簇的模型構建方式顯著減少了需要訓練的模型數量,從而有效降低了訓練時間和計算資源的消耗。模型共享策略使得實時預測能力得到顯著提升,能夠及時響應交通流量的動態變化,為交通管理提供更具時效性的支持。
2 模型框架
模型框架的體系結構如圖2所示,其主要功能包括深度聚類和流量預測。該模型由交通流聚類、路網特征提取以及模型共享三個關鍵部分組成。圖2(a)交通流聚類模塊主要功能是將具有時間相似性和空間相關性的交通流對象聚合成一簇,以便更好地理解和分析交通流的模式和行為。模塊通過輸入卡口的歷史流量數據,能夠輸出k簇交通流,以及相應的k種流量模式。圖2(b)路網特征提取模塊的主要功能是從構建的實際交通組織信息的路網中提取特征。它將同一卡口的多個路段特征進行聚合,并將卡口級別的特征按簇分離,每個簇的數據包含空間信息的時序數據。模塊通過輸入k簇交通流、具有交通組織信息的路網拓撲,能夠輸出k簇卡口級別的特征。圖2(c)模型共享模塊通過基于簇的模型,構建了基于循環神經網絡的交通流預測系統,同時融合了對應的流量模式。模塊通過將k種流量模式和k簇卡口級別的特征融合后作為輸入,輸出每個卡口的預測數據。
2.1 深度聚類
2.1.1 時間序列的時間相關性分析
交通流時間特征處理的目標是從時間序列數據中提取有效的低維度表征,同時衡量這些表征之間的相似性。為了實現這一目標,本文采用深度自編碼器提取時間序列特征,并運用改進的動態時間規整方法確定它們之間的相似度。
1)時間特征提取
通過對交通流時間序列數據進行特征提取,可以自動學習并保留數據中的短期波動特征、長期趨勢特征、周期性特征以及異常特征。這些特征反映了交通流量隨時間的變化模式,包括高峰時段的突增流量、隨時間推移的增長或減少、每周的周期性變化,以及由于事故或天氣變化引起的異常流量。
時序聚類中,有效的潛在特征對于處理動態和不確定的交通流至關重要。與靜態數據不同,交通流數據需要考慮時間上的變化。一種常見的方法是使用滑動窗口來處理這種動態性,通過選擇適當大小的時間窗口,可以獲得近期歷史車流數據,從而反映當前交通流的狀態。
在得到最新的車流時序數據后,采用深度自編碼器(deep autoencoder)[13]來提取特征是一種有效的方法,提取過程如圖3所示。這個自編碼器的設計包括三個關鍵層次。首先,第一層采用了1D卷積神經網絡(convolutional neural network,CNN)[14]。其主要作用是通過卷積操作降低時間序列數據的維度,同時捕捉時間序列中的非線性特征。通過這一層的處理,可以將原始數據轉換為更具有代表性的特征表示。其次,第二層采用最大池化(max pooling)操作。最大池化的主要目的是進一步降低卷積結果的維度,從而減少模型的計算復雜度和參數數量。通過保留每個卷積核輸出中的最大值,最大池化能夠提取出最顯著的特征信息,使得后續處理更加高效。最后,第三層采用雙向長短期記憶網絡(bi-directional long short-term memory recurrent neural network,Bi-LSTM)[15]。Bi-LSTM具有記憶能力,能夠有效地捕捉時間序列數據中的長期依賴關系,并且通過雙向結構,可以同時提取出時間序列數據前向和反向兩個時間維度的特征信息。這種設計使得模型能夠更全面地理解時間序列數據中的時序特征。
在解碼器中,首先通過上采樣層對數據進行初步重構,然后通過反卷積層對數據進行進一步重構,以得到解碼器的重構數據。
損失函數采用均方誤差(mean squared error,MSE),用于衡量解碼器的重構輸出數據與輸入編碼器的原始數據之間的差異。原始的車流時序數據為x(i)=[x(i)1,x(i)2,…,x(i)n],模型的編碼器輸出為y(i)=[y(i)1,y(i)2,…,y(i)m],其中mlt;lt;n,解碼器輸出為(i)=[(i)1,(i)2,…,(i)n],自編碼器的損失函數為
Lrecon=1N∑Nj=1((i)j-x(i)j)2(3)
基于交通流時間序列潛在特征提取如算法1所示。
算法1 交通流數據潛在特征提取算法
輸入:歷史交通流時間序列數據x(i)Nhist。
輸出:交通流的潛在特征y(i)。
a) 通過滑動窗口從歷史數據x(i)Nhist中獲取近期歷史車流數據x(i)
b) for i=1 to N do
c)
將時間序列數據x(i)輸入到encoder中得到特征向量y(i)
d)
將特征向量y(i)輸入到decoder中得到重構數據(i)
e)
計算重構損失Lrecon
f)
基于SGDM方法,反向傳播更新網絡模型
g) end for
h) return 潛在特征y(i)
2) GCDTW距離計算
動態時間規整(dynamic time warping,DTW)作為廣泛采用的彈性相似性度量之一,旨在通過更精準地對齊扭曲時間軸來彌補歐氏距離等傳統距離度量方法的不足。然而,傳統的DTW方法在時間序列之間的局部相似性或相關性不夠清晰時會出現病態對齊的問題,這一問題并沒有得到很好的解決。在這種情況下,本文提出梯度約束DTW(gradient-constrained dynamic time warping,GCDTW)作為一種新的變體方法,引入了梯度約束,限制了對齊路徑的斜率變化,有效地解決了病態對齊問題。
給定任意兩個卡口的時間序列x(1)=[x(1)1,x(1)2,…,x(1)n]、x(2)=[x(2)1,x(2)2,…,x(2)n],它們所對應的低緯度特征分別為y(1)=[y(1)1,y(1)2,…,y(1)m]、y(2)=[y(2)1,y(2)2,…,y(2)m],其中mlt;lt;n。為了計算兩個卡口時間序列所對應的特征之間的距離,構建并初始化距離矩陣,從距離矩陣的左上角開始,使用一種距離度量方法(如歐氏距離),計算到達每個單元格的最小累積距離,通過回溯從終點到起點的路徑,選擇累積距離最小的路徑。圖4(b)為GCDTW計算的原理圖,紅色部分為DTW對齊路徑(見電子版)。為了限制對齊路徑的斜率變化,引入梯度約束函數
g(i, j)=|(i-iprev)-(j-jprev)|(4)
其中:(iprev, jprev)是前一個對齊點的坐標。GCDTW距離可表示為
D(y(1)i,y(2)j)=d(y(1)i,y(2)j)+
minD(y(1)i-1,y(2)j)+a·g(i-1, j),
D(y(1)i,y(2)j-1)+a·g(i, j-1),
D(y(1)i-1,y(2)j-1)+a·g(i-1, j-1)(5)
其中:a是梯度約束的權重參數;累積距離D(y(1)i,y(2)j)為當前格點距離d(y(1)i,y(2)j),也就是點y(1)i和y(2)j的歐氏距離與可以到達該點的最小鄰近元素的累積距離之和。
圖4(a)展示了兩個卡口在某天早高峰時段的流量變化情況,并通過GCDTW計算兩條序列之間的相似度。相比之下,歐氏距離只是簡單地考慮了數據點之間的距離,而忽略了時間上的結構,這可能導致其無法準確捕捉到兩個時間序列在趨勢形狀上基本一致但出現了平移、壓縮和拉伸現象的相似度。由于城市路網的復雜性,卡口之間的交通流受時間和空間兩個維度的影響,出現延遲的現象時有發生,在圖4(a)中,可以觀察到兩個卡口的時間序列在7:05~7:30出現了平移現象,而在7:45~8:00出現了拉伸現象。
時間序列數據的降維處理雖然能夠提取出關鍵特征,但這些特征序列往往依舊保留著非線性的時間扭曲特性。此外,由于傳感器故障、數據采集誤差或偶發的交通事件,某些特征值可能會異常飆升,形成異常高峰。在這種情況下,傳統的歐氏距離度量方法會受到較大影響,因為它無法區分正常波動與異常峰值。
與此相對,GCDTW算法通過選擇性地繞過這些異常點,能夠更有效地適應數據中的噪聲和突發事件。GCDTW算法的核心優勢在于其動態路徑選擇機制,它允許算法在比較兩個時間序列時,靈活地調整時間軸,從而最小化噪聲和突發事件的負面影響。這種獨特的動態調整能力使得GCDTW算法在處理含有噪聲和異常值的時間序列數據時,展現出更高的魯棒性和適應性。因此,本文采用GCDTW計算相似度,以更好地反映交通流時間序列之間的真實相似程度。
2.1.2 時間序列的空間關聯性分析
本文的目標是通過給定的路段卡口信息、路段長度和卡口“禁左”信息來提取卡口空間特征。為了實現這一目標,本文將路段作為節點對路網進行建模,并運用迪杰斯特拉算法計算真實場景下卡口間的最短路徑。
1)路網建模
建立以路段為節點的路網拓撲結構如圖5(c)所示,將其描述為一個帶有權重的有向圖結構G=(V,E,W),其中V為節點集,每個節點代表一個路段;E為圖的邊集,每個邊表示節點之間的連接關系;W為邊的權重即距離。特別是對于卡口2,由于其東西方向實施了“禁止左轉”的交通管制措施,在有向圖中對1號節點和7號節點相連的邊賦予了一個非常大但有限的權重值(圖5(c)中的虛線部分)。這樣可以保留邊的物理存在,同時確保在正常的交通分析中這些邊不會被考慮。如果交通管制措施取消,該權重可以自動或手動調整到新的水平。通過這種方式,有向圖G不僅能夠反映路網的物理結構,還包含了交通規則,為時間序列的空間關聯性分析提供了更加全面的視角。
2)Dijkstra最短路徑計算
迪杰斯特拉(Dijkstra)[16]是一種經典的最短路徑算法,用于計算一個節點到其他節點的最短路徑。其主要特點是以起始點為中心,逐層向外擴展(類似廣度優先遍歷),直到擴展到終點為止。本文利用路段長度作為邊的權重,以在計算最短路徑時考慮道路的實際距離。如圖6所示,由于卡口2實施了“禁止左轉”的交通管制措施,導致卡口1和4之間的實際通行路徑存在差異:從卡口4到1的最短路徑為837 m,而從卡口1到4的最短路徑則為513 m。
2.1.3 特征矩陣加權融合
特征矩陣D1、D2分別為歸一化后的時序特征矩陣和卡口最短路徑矩陣的描述。設特征矩陣D1、D2對應的權重分別為w1和w2,目標是最大化輪廓系數S,最小化聚類的損失函數Lsc:
Lsc=-S(6)
該損失函數基于聚類質量指標輪廓系數的效果來評估,使用梯度下降法更新權重,更新規則如下所示。
w(t+1)1=w(t)1-a?Lsc?w1
w(t+1)2=w(t)2-a?Lsc?w2(7)
其中:a是學習率;t表示迭代次數。偏導數可以反映出微調權重w1和w2時,損失函數Lsc的變化情況。期望最小化損失函數,即期望損失函數對權重的變化率為負數。如果增加w1或w2會使損失函數減少,那么就應該增加它們的值,反之亦然。加權融合后得到特征矩陣D′:
D′=w1·D1+w2·D2(8)
2.1.4 K-means++聚類
在交通流時間序列聚類中,K-means++[17]展現了獨特的優勢。相比其他聚類算法,K-means++在處理大規模交通流數據時具有更高的計算效率,尤其是在初始中心選擇方面,其改進的機制可以更好地捕捉交通流模式,減少隨機初始化帶來的誤差。層次聚類雖然能夠捕捉交通流的層次結構,但計算復雜度較高且難以擴展至大規模數據。相比之下,K-means++能夠在保持聚類質量的同時,處理大量交通流時間序列數據。此外,盡管DBSCAN[18]能識別不同形狀的流量模式,并處理噪聲數據,但其參數調整較為復雜,而K-means++則提供了更為直觀和穩定的結果。在與高斯混合模型的比較中,盡管GMM[19]在處理不同流量形態時表現良好,但其計算復雜度較高,K-means++則在識別和分析交通流中的相似模式時更加高效和適用。因此,在交通流時間序列聚類中,K-means++是一種平衡效率和效果的理想選擇。
K-means++是傳統K-means聚類算法的改進版本,其主要改進之處在于初始化聚類中心的方式,將距離的平方作為概率分布選擇下一個聚類中心,從而提高了聚類結果的質量并加速收斂速度。這個概率分布定義如下:
P(x(i))=D(x(i),C)2∑nj=1D(x(j),C)2(9)
其中:C為聚類中心集合;D(x(i),C)表示時間序列x(i)到聚類中心的最短距離;∑nj=1D(x(j),C)2是所有時間序列到最近聚類中心的距離平方和的總和。
在時序特征距離矩陣和卡口最短路徑距離矩陣進行加權融合后,K-means++聚類算法步驟描述如下:
算法2 K-means++聚類算法
輸入:由滑動窗口生成的訓練樣本x(i)、加權融合后的距離矩陣D′。
輸出:聚類標簽,每簇質心。
a) 初始化聚類中心
b) 隨機選擇一個時間序列x(i)作為第一個聚類中心
c) while 聚類中心lt;k do
d)
根據D′計算每個時間序列到最近的聚類中心C的距離
e)
根據式(8)計算概率分布P(x(i))選擇新的聚類中心
f) end while
g) 初始化聚類標簽
h) while 不收斂 do
i)
for 每個時間序列 do
j) 分配每個時間序列到最近的聚類中心
k) end for
l)
for 每個聚類中心 do
m) 重新計算每個聚類中心
n) end for
o) end while
p) return聚類標簽,每簇質心x(k)trend
2.2 流量預測
為了同時捕捉交通流時間序列的時空依賴性,本文設計了一種如圖7所示的流量預測模型結構。該模型首先通過圖卷積網絡提取每個路段的特征。隨后,根據卡口-路段的映射關系,將屬于同一卡口的多個路段的特征進行聚合。接著,依據聚類結果將特征分離。最后,將包含空間信息的時序數據與每簇質心融合,一并輸入到雙向門控循環單元中進行處理,從而得到最終的預測結果。
2.2.1 路網特征提取
本文使用圖卷積網絡提取整個路網的全局空間特征:
Hglobal=GCN(G,X)(10)
其中:G表示有向圖結構;X表示特征矩陣。
根據卡口-路段的映射關系,將屬于同一個卡口的多個路段的特征進行聚合。卡口集合為Φ={x(i)}Nsect,每個卡口x(i)包含的路段集合為Li:
HLi=aggregate (Hglobal[Li])(11)
其中:Hglobal[Li]表示從全局特征Hglobal中提取的屬于卡口x(i)的路段特征,aggregate 表示聚合操作。
最后,將卡口級別的特征按簇分離,每簇數據為包含空間信息的時序數據。
2.2.2 特征融合
為了有效地將不同的交通流量模式納入流量預測模型,本文采取了一種新的方法:將每個流量模式簇的質心作為特征x(k)trend,并將其融合到相應的流量預測模型中,與包含空間信息的時序數據進行ADD加法操作,以生成更加豐富和高維的特征表示。
這一方法的核心思想是利用每個交通模式簇的質心x(k)trend來代表該簇的整體特征,進而提高了流量預測模型的準確性和泛化能力。
2.2.3 模型共享
在對卡口進行聚類后,每個簇都由具有相似特征的卡口組成。為了學習它們的共同特征并加快預測速度,可以應用模型共享的思想。具體而言,使用雙向門控循環單元(bidirectional gated recurrent unit,BiGRU)模型來分析每個簇的歷史數據。BiGRU模型相比傳統的RNN更有效,因為它引入了雙向性,能夠同時從過去和未來的上下文中學習信息。該模型由兩個門控循環單元(gated recurrent unit,GRU)[20]層組成,一個按正向順序處理輸入序列,另一個按逆向順序處理輸入序列。GRU單元通過更新門、重置門和隱藏狀態協同工作,捕獲序列中的依賴關系。
模型共享意味著每個簇使用相同的BiGRU模型,將同簇的卡口數據輸入到相應的模型中進行預測。這樣做的好處是,減少了輸入數據的維度,并且每個模型只需要處理特定簇的數據,從而大大加快了預測速度。通過聚類降低了輸入數據的維度,并應用模型共享的思想,既能加快BiGRU模型的預測速度,又能學習到同簇卡口的共同特征。深度聚類和流量預測整體算法如算法3所示。
算法3 DTCTFP算法
輸入:所有卡口連續5周歷史交通流時間序列數據x(i)Nhist。
輸出:所有卡口未來流量值x(i)Npred。
a) 執行算法1獲得交通流低維度表示y(i)
b) 執行GCDTW算法計算序列間的距離得到時序特征矩陣D1
c) 執行Dijkstra算法構建卡口最短路徑矩陣D2
d) 根據式(7)進行矩陣加權融合得到D′
e) 執行算法2得到聚類標簽,每簇質心x(k)trend
f) for 聚類標簽=1 to k do
g)
根據聚類標簽劃分每簇數據
h) end for
i) for i=1 to N do
j)
每簇模型訓練,預測
k)
計算損失
l)
基于Adam方法,反向傳播更新網絡模型
m) end for
n) return x(i)Npred
3 實驗
3.1 實驗目的
本章圍繞以下問題進行實驗驗證:
a)RQ1:針對挑戰1,3.3節的實驗通過結合交通流數據和包含實際交通組織信息的路網拓撲結構,利用深度聚類方法,區分出具有不同時空相關性的交通模式。驗證了該方法能夠有效識別不同交通模式,并揭示了在不同時空條件下的交通流量變化規律。
b)RQ2:針對挑戰2,為了驗證包含實際交通組織信息的路網拓撲對預測的影響,3.4節的實驗對比了兩種統計模型、兩種僅考慮時間依賴關系的模型,以及四種使用簡化路網拓撲來捕捉時空依賴關系的模型,驗證了包含實際路網的方法具有最優的預測效果。
c)RQ3:針對挑戰3,為了滿足交通預測的實時性需求,3.4.2節的實驗比較了所有模型在每輪運行中的耗時情況。驗證了不同模型在處理交通流數據時的效率差異,最終確定最佳模型為DTCTFP。
d)RQ4:為了測試各個模塊的有效性,3.5節的實驗設計了多種變體進行消融實驗。驗證了各個模塊在整個系統中的貢獻,特別是聚類結果對預測準確性的顯著提升。
3.2 實驗設計
1)交通流時間序列的獲取和設計
本文使用的交通數據集來自重慶市大渡口區,其路網拓撲和SUMO路網如圖8所示。該區域由203個交通卡口組成,卡口檢測器記錄2023年7月3日~2023年12月31日每天7:00~9:00的交通數據,原始數據如表1所示,其中包含檢測器ID、車輛車牌號(已脫敏)、車輛通過時間。通過對卡口原始數據進行預處理和結構化,轉換成卡口流量數據,具體操作如表2所示。處理后的流量數據包含檢測器ID、通過時間、交通流量三種屬性(表3)。最后通過檢測器-卡口對照表進行匹配。
2)SUMO路網的獲取和設計
重慶市大渡口區SUMO路網如圖8所示,利用路網對應的.xml文件,獲取卡口之間的空間關系,以便后續構建有向圖和距離矩陣。
3)實驗參數設計
歷史數據的完整程度對流量預測的準確性至關重要。卡口根據交通狀況聚類成簇,因此缺失的數據會嚴重影響聚類結果。為了在實驗中綜合考慮復雜性和數據完整性,選擇了缺失率低于10%的卡口進行實驗,共計58個卡口符合條件。
在深度聚類模塊中,考慮到交通流的動態性和不確定性,本文滑動窗口的大小設置為1 008,即連續6周每天7:00~9:00時間粒度為5 min的流量數據,將時間步設置為1周。CNN層的卷積核數量為50,每個卷積核大小為10;BiLSTM層的濾波器數量為50;deconvolution層的卷積核大小為10。自編碼器采用SGDM優化器,momentum參數設置為0.9;學習率為0.01;batch_size大小為256;K-means++聚類方法由Python 3.9.18中的Scikit-learn包實現;訓練模型直到聚類變化小于0.1%或訓練輪數超過50輪為止。
在流量預測模塊中,數據集為連續26周粒度為5 min的流量數據,將數據集按照6∶2∶2的比例分為訓練集、驗證集、測試集,采用min-max歸一化將歷史交通流量的值縮放到[-1,1],以提高搜索最優解的梯度下降速度。在測試階段將輸入數據歸一化,然后將輸出重新縮放到原始比例。batch_size大小為256;選擇LeakyReLU作為非線性激活函數;優化器是Adam算法;學習率設置為0.001。實驗在PyTorch平臺上進行,使用Intel? Xeon? Gold 5120, 2.20 GHz CPU, 128 GB RAM和GeForce RTX 3090 24 GB GPU。
4)評價指標設計
為驗證聚類的有效性,本文采用輪廓系數(silhouette coefficient,SC)[21]作為評價指標,對于每個樣本i,具體的計算公式為
S(i)=b(i)-a(i)max{a(i),b(i)}(12)
其中:a(i)代表樣本i與其所屬簇內其他樣本的平均距離;b(i)代表樣本i與最近的一個簇中所有樣本的平均距離。
為驗證提出預測模型的有效性,本文采用平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error, RMSE)和平均絕對百分比誤差(mean absolute percentage error, MAPE)作為評價指標, 具體的計算公式如下:
MAE(yi,i)=1N∑Ni=1|yi-i|(13)
RMSE(yi,i)=1N∑Ni=1(yi-i)2(14)
MAPE(yi,i)=1N∑Ni=1|yi-i|yi(15)
其中:N為樣本的數量;yi為真實值;i為預測值。
3.3 卡口聚類(RQ1)
首先,利用GCDTW算法計算了六周時間序列數據的對齊差異,作為相似性的衡量。接著,采用Dijkstra算法計算了已篩選卡口之間的最短路徑,并對得到的兩個特征矩陣進行了歸一化處理。本文繪制了熱力圖,以直觀展示距離值的分布情況,在熱力圖中,距離值較小的區域呈現藍色,而距離值較大的區域呈現紅色(見電子版)。圖9顯示了58個卡口交通流對象的特征,熱力圖層次分明,揭示了交通流對象的一些特征之間的相關性,同時也顯示了其他特征之間顯著的差異。而圖10則顯示了卡口之間的最短路徑,結果顯示,這些卡口之間的距離大多臨近,一部分卡口之間的距離較遠或者受到交通管制措施的影響。為確保時間相關性和空間相關性兩個維度的信息都得到充分考慮,本文將對兩個矩陣的初始權重均設置為0.5,并進行加權平均融合,減輕單個特征矩陣可能帶來的誤差和噪聲,如圖11是融合后的矩陣。結果顯示,通過特征矩陣融合,潛在特征被增強,而異常值則被平滑處理。通過加強潛在特征,模型能夠更好地捕捉數據中的細微變化,從而提高了對于復雜模式交通模式的識別能力。同時,對于異常值的平滑處理則有助于減少模型在噪聲或異常數據點上的過度擬合,使模型更加穩健和可靠。
其次,使用K-means++算法結合加權融合后的距離矩陣,對58個卡口進行聚類分析。通過輪廓系數法,計算聚類數為2~10的輪廓系數,觀察到數值從聚類數為2時的0.63上升至聚類數為3時的0.77,然后持續下降,如圖12所示。
基于這一觀察,確定了最佳的聚類數為3,并繪制出每個簇的時間序列,使用黑色虛線來標示每個類的質心,如圖13所示。
根據圖13的聚類結果,對聚類進行可視化呈現(圖14),結合對路網結構的分析,可以得出以下結論:
cluster 1:如圖13(a)所示,早高峰時段流量波動顯著,容易出現高峰值。該類卡口位于車流量大且容易發生擁堵的區域,通常是住宅區、學校和醫院等人口密集的區域。
案例1:卡口24212位于雙城路與雙山路的交叉口。雙城路為南北方向雙向2車道,雙山路為東西方向雙向4車道。附近有3所學校和密集的住宅區,早高峰時段車流量大且人員復雜,容易擁堵。
cluster 2:如圖13(b)所示,早高峰時段流量大但波動較小,流量變化較為平穩。該類卡口的車流量大但變化規律性較強,通常位于交通干道和公交線路多的區域。
案例2:卡口31874位于春暉路與翠華路的交叉口。春暉路為南北方向雙向6車道,翠華路為東西方向雙向2車道。附近有多條公交線路,且靠近青峰隧道,車流多數為東西方向,流量較為規律。
cluster 3:如圖13(c)所示,流量變化受到一定程度的波動影響,但總體相對穩定。該類卡口車流方向單一,流量波動有限。
案例3:卡口25836位于翠園路與湖榕路交叉口,這是一個丁字形路口。翠園路為東西方向雙向4車道,湖榕路為雙向4車道但只有南段通車。盡管位于立交橋附近,但車流方向簡單,波動有限。
真實卡口如圖15所示。
3.4 短時交通流量預測網絡(RQ2、RQ3)
3.4.1 基準模型
為了驗證DTCTFP的有效性,本文將與以下交通流量預測方法進行比較,其中,前四種為基準模型,后四種為近年來學者根據交通流量預測需求改進的圖卷積神經網絡模型。
a)ARIMA[22]:自回歸綜合移動平均模型,利用歷史數據中的均值和趨勢來預測未來時間片的交通流量值。
b)SVR[23]:支持向量回歸模型,可以處理非線性關系,并在高維空間中構建線性或非線性回歸模型。
c)GRU[24]:門控循環單元,是一種類似于LSTM的變體,與LSTM相比,GRU具有更簡單的結構,但通常能夠取得與LSTM相當甚至更好的效果。
d)Transformer[25]:以自注意力機制為基礎,能夠有效地建模序列數據中的長距離依賴關系。
e)DCRNN[26]:擴散卷積遞歸神經網絡,通過圖卷積捕捉交通網絡中的空間依賴關系,利用遞歸神經網絡處理時間依賴關系,該模型在同時涉及空間和時間關聯的交通流量預測中表現出色。
f)STGCN[8]:時空圖卷積網絡,將GCN與時間卷積網絡結合起來,同時建模交通數據中的空間和時間依賴關系。這種雙重建模方法使得STGCN能夠更準確地預測交通流量,充分考慮了空間和時間的動態變化。
g)ASTGCN[27]:基于注意力的時空圖卷積網絡,在STGCN的基礎上引入了注意力機制。通過自適應地分配不同節點和時間步的權重,ASTGCN能夠更精準地捕捉重要的空間和時間特征,提升預測性能。
h)ASTGNN[28]:基于注意力的時空圖神經網絡,是一種綜合了注意力機制和圖神經網絡的模型,通過動態調整不同時間步和空間節點的權重,實現對時空數據的高效建模和預測。
3.4.2 實驗結果與分析
本文在重慶市大渡口數據集上驗證了DTCTFP模型。表4顯示了本文模型與基線方法在真實數據集上對未來30 min、1 h和2 h的平均預測結果,圖16顯示了預測未來30 min時滑動窗口大小(默認為6周)對于預測結果的影響。結果表明,DTCTFP模型在所有實驗中均勝過了基線模型。針對未來30 min交通流量的預測,該模型在MAE、RMSE和MAPE三個指標上相較ASTGNN模型,分別提升了12.09%、11.98%和8.14%;對于未來1 h和2 h的交通流量預測,相比ASTGNN模型,性能提升分別達到了12.2%、9.81%、14.85%和14.82%、7.15%、6.3%。
表4的結果表明,傳統統計模型ARIMA、SVR可能難以捕捉交通流中復雜的非線性關系。相比之下,基于深度學習的方法在長期預測方面通常表現更優。這是因為隨著預測視野的增加,時間依賴性變得越來越非線性,而深度學習模型能夠更好地處理這種非線性關系。基于RNN變體的GRU以及利用encoder-decoder結構的Transformer模型則具有不同的優勢。前者適合處理交通流中的長期依賴關系,而后者能夠并行處理整個序列,從而在效率上有很大提升。以上四種模型僅僅考慮了交通流的時間依賴關系,而忽略了城市卡口之間的空間關系以及全局信息。在引入GCN以捕捉時間序列的空間依賴性后,預測性能相較于傳統的時間序列預測模型有了進一步提升。然而,DCRNN、STGCN、ASTGCN 和ASTGNN這些模型在捕捉時間序列的空間關聯性時,都依賴于簡化的路網拓撲。對于充滿交通標志和交通管制措施的城市路網來說,這種圖結構往往無法充分反映真實的路網情況。
在對比DTCTFP與其他模型預測未來2 h每輪耗時以及總耗時表現時,DTCTFP在復雜性與時間效率之間找到了理想的平衡點。與非圖結構的深度學習模型(如Transformer)相比,DTCTFP提供了更優的預測性能,同時在耗時方面也優于更復雜的時空圖卷積模型(如ASTGCN和ASTGNN)。由于DTCTFP能夠顯著減少計算時間,它在實際應用中更具可操作性,尤其是在實時性要求較高的交通流量預測中。無論是處理大規模數據集,還是應對頻繁的模型更新需求,DTCTFP都展現了出色的適應性。這種優勢使其成為應對突發交通狀況或進行動態調度預測的理想工具。
本文介紹的DTCTFP模型利用具有交通組織信息的真實路網,通過挖掘卡口間的時空相關性,提出模型共享的策略,針對各種交通模式建立了預測模型,在訓練時間和預測精度方面都取得了良好的效果。
圖16中顯示了滑動窗口大小對于預測精度的影響。結果表明,隨著滑動窗口尺寸從4周增加到8周,模型對于卡口交通流時間依賴關系的捕捉能力逐漸增強。增大的滑動窗口使模型更容易發現交通流潛在的趨勢和周期性。然而,隨著滑動窗口進一步增大,模型開始過度關注較遠的歷史數據,而忽略了更近期的信息。這種情況導致模型的響應速度變慢,因為窗口覆蓋的歷史數據較長。當數據發生突變或者趨勢發生變化時,模型需要更長的時間來反應并進行適應,從而導致預測結果的延遲。因此,在選擇滑動窗口大小時,需要權衡預測性能和模型響應速度之間的關系,以獲得更準確和穩定的預測結果。
3.4.3 預測結果與可視化
為了更生動地展示模型的預測性能,本文從深度聚類得到的三簇中分別選取一個卡口,并通過可視化展示了未來2 h交通流量的預測結果(圖17)。結果顯示,DTCTFP在各個卡口中展現了出色的預測性能,驗證了本文通過深度聚類挖掘城市卡口的時空相關性,結合模型共享策略進行未來交通流量預測方法,可實現對復雜城市卡口的實時流量預測。
3.5 消融實驗(RQ4)
為了更深入地驗證DTCTFP模型中各個組成模塊的有效性,本文在重慶市大渡口區的數據集上進行了消融實驗,結果如表5所示。
從消融實驗結果可以看出,逐步引入模型中的各個模塊確實對預測性能有著積極的影響。首先,與傳統的單向GRU相比,使用BiGRU能夠在MAE和RMSE指標上實現一定程度的降低,這表明雙向信息的引入有助于提高模型的預測準確性。引入GCN后,預測性能進一步提升,表明GCN對于提高模型的泛化能力和對交通流時間依賴、卡口空間信息的捕獲具有重要作用。而加入深度聚類DTC后,指標再次有所下降,這進一步驗證了深度聚類在模型性能提升中的重要性,它使得模型能夠準確識別和利用交通流的時空模式,聚類顯著提升了預測的準確性。實驗對不使用滑動窗口的DTCTFP進行測試,結果顯示它的性能略低于使用滑動窗口的版本,這表明滑動窗口的引入對于提高模型的預測性能也是必要的,它能動態地捕捉交通流數據的變化,同時控制歷史數據的數量。最終,采用了DTCTFP模型后,預測性能得到了最大程度的提升,MAE、RMSE、MAPE指標均有顯著降低,表明動態時空特征融合在模型中的應用具有顯著的優勢,有效提高了模型的預測準確性。因此,通過這些實驗結果,可以驗證DTCTFP模型中各個模塊的有效性,以及它們相互融合后對模型性能的綜合提升。
4 結束語
城市卡口的多樣性和異質性使得短時交通流量預測成為一個具有挑戰性和重要意義的問題,本文提出了一種用于大規模城市卡口短時交通流量預測的深度學習模型DTCTFP。該模型的關鍵在于深度時序聚類和流量預測的結合,以及模型共享策略。在重慶市大渡口區的真實卡口數據上對所提出的模型進行了評估,DTCTFP優于現有方法。在未來工作中,將進一步探索卡口在路網中的局部特征以及它們與全局相關性之間的依賴關系,實現多視角下的城市卡口交通流量預測。
參考文獻:
[1]Lyu Yisheng, Duan Yanjie, Kang Wenwen, et al. Traffic flow prediction with big data: a deep learning approach [J]. IEEE Trans on Intelligent Transportation Systems, 2015, 16(2): 865-873.
[2]Pang Junbiao, Huang Jing, Du Yong, et al. Learning to predict bus arrival time from heterogeneous measurements via recurrent neural network [J]. IEEE Trans on Intelligent Transportation Systems, 2019, 20(9): 3283-3293.
[3]杭菲璐, 郭威, 陳何雄, 等. 基于iForest和LOF的流量異常檢測 [J]. 計算機應用研究, 2022, 39(10): 3119-3123. (Hang Feilu, Guo Wei, Chen Hexiong, et al. Network traffic anomaly detection based on iForest and LOF [J]. Application Research of Compu-ters, 2022,39(10): 3119-3123.)
[4]Abduljabbar R L, Dia H, Tsai T W. Unidirectional and bidirectional LSTM models for short-term traffic prediction [J]. Journal of Advanced Transportation, 2021, 2021: 1-16.
[5]Lesouple J, Baudoin C, Spigai M, et al. Generalized isolation forest for anomaly detection [J]. Pattern Recognition Letters, 2021, 149: 109-119.
[6]Diao Zulong, Wang Xin, Zhang Dafang, et al. Dynamic spatial-temporal graph convolutional neural networks for traffic forecasting [C]//Proc of AAAI Conference on Artificial Intelligence. 2019: 890-897.
[7]Fang Shen, Zhang Qi, Meng Gaofeng, et al. GSTNet-Global spatial-temporal network for traffic flow prediction [C]//Proc of International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann, 2019: 2286-2293.
[8]Yu Bing, Yin Haoteng, Zhu Zhanxing. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting [C]//Proc of International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann, 2018: 3634-3640.
[9]Defferrard M, Bresson X, Vandergheynst P. Convolutional neural networks on graphs with fast localized spectral filtering [C] //Proc of the 30th International Conference on Neural Information Processing Systems. Cambridge, CA: MIT Press, 2016: 3844-3852.
[10]Sun T Y. Research on urban traffic flow forecasting based on vector autoregression [M]. Beijing: Beijing Jiaotong University, 2022.
[11]Vlahogianni E I, Karlaftis M J, Golias J. Short-term traffic forecasting: where we are and where we’re going [J]. Transportation Research Part C: Emerging Technologies, 2014, 43: 3-19.
[12]Berndt D J, Clifford J. Using dynamic time warping to find patterns in time series [C]// Proc of the 3rd International Conference on Know-ledge Discovery and Data Mining. San Francisco: Morgan Kaufmann, 1994: 359-370.
[13]Kim J Y, Cho S B. Explainable prediction of electric energy demand using a deep autoencoder with interpretable latent space [J]. Expert Systems with Applications, 2021, 186: 115842.
[14]Mo Jiqian, Gong Zhiguo, Chen Junyang. Attentive differential convolutional neural networks for crowd flow prediction [J]. Knowledge-based systems, 2022, 258: 110006.
[15]Ma Changxi, Dai Guowen, Zhou Jibiao. Short-term traffic flow prediction for urban road sections based on time series analysis and LSTM_BILSTM method [J]. IEEE Trans on Intelligent Transportation Systems, 2022, 23(6): 5615-5624.
[16]Johnson D B. A note on Dijkstra’s shortest path algorithm [J]. Journal of the ACM, 1973, 20(3): 385-388.
[17]Arthur D, Vassilvitskii S. K-means++: the advantages of careful seeding [C]//Proc of ACM-SIAM Symposium on Discrete Algorithms. New York: ACM Press, 2007: 1027-1035.
[18]Schubert E, Sander J, Ester M, et al. DBSCAN revisited, revisited: why and how you should (still) use DBSCAN [J]. ACM Trans on Database Systems, 2017, 42(3): article No. 19.
[19]Chen Wenlong, Wang Xiaoling, Cai Zhijian, et al. DP-GMM clustering-based ensemble learning prediction methodology for dam deformation considering spatiotemporal differentiation [J]. Know-ledge-based systems, 2021, 222: 106964.
[20]Fu Rui, Zhang Zuo, Li Li. Using LSTM and GRU neural network methods for traffic flow prediction [C]//Proc of Youth Academic Annual Conference of Chinese Association of Automation. 2016: 324-328.
[21]Hidayati R, Zubair A, Pratama A H, et al. Analisis Silhouette coefficient pada 6 perhitungan Jarak K-means clustering [J]. IEEE Trans on Computers, 2021, 20(2): 186-197.
[22]Tedjopurnomo D A, Bao Zhifeng, Zheng Baihua, et al. A survey on modern deep neural network for traffic prediction: trends, methods and challenges [J]. IEEE Trans on Knowledge and Data Engineering, 2022, 34(4): 1544-1561.
[23]Xu Haibo, Jiang Chengshun. Deep belief network-based support vector regression method for traffic flow forecasting [J]. Neural Computing and Applications, 2019, 32(7): 2027-2036.
[24]Gao Shuai, Huang Yuefei, Zhang Shuo, et al. Short-term runoff prediction with GRU and LSTM networks without requiring time step optimization during sample generation [J]. Journal of Hydrology, 2020, 589:125188.
[25]周楚昊, 林培群. 基于多通道Transformer的交通量預測方法 [J]. 計算機應用研究, 2023, 40(2): 435-439. (Zhou Chuhao, Lin Peiqun. Traffic flow prediction method based on multi-channel Transformer [J]. Application Research of Computers, 2023,40(2): 435-439.)
[26]Li Yaguang, Yu R, Shahabi C, et al. Diffusion convolutional recurrent neural network: data-driven traffic forecasting [EB/OL]. (2018-02-22). https://arxiv.org/abs/1707.01926.
[27]Guo Shengnan, Lin Youfang, Feng Ning, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting [C]//Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 922-929.
[28]Guo Shengnan, Lin Youfang, Wan Huaiyu, et al. Learning dynamics and heterogeneity of spatial-temporal graph data for traffic forecasting [J]. IEEE Trans on Knowledge and Data Engineering, 2022, 34(11): 5415-5428.