基于圖結構的城市道路短時交通流量時空預測模型

2021-08-12 08:20:50王海起，李留珂，陳海波

地理與地理信息科學 2021年4期

王海起，李留珂，陳海波

(中國石油大學(華東)海洋與空間信息學院，山東青島266580)

0 引言

精準、實時的城市交通流量預測是城市交通控制和引導的決策基礎。交通流量預測可分為短時預測(小于30 min)和長時預測(大于30 min),由于交通流量變化迅速，15 min內的短時交通流量預測更能滿足現實生活需求。出租車作為城市出行中較為重要的交通工具之一，其裝備的車載GPS可收集不同時間的精確位置信息，同時，出租車交通數據具有數據量大、時空分布廣等特點，可間接反映城市道路的交通狀態，因此，該數據可用于城市交通流量預測研究[1]。

傳統的交通流量預測多采用基于統計學理論的線性模型，如差分自回歸移動平均(Autoregressive Integrated Moving Average，ARIMA)模型及其變體模型[2-5]、線性回歸模型[6]及卡爾曼濾波[7]等，該類方法抗干擾性差，對于復雜非線性的交通數據預測精度較低；不少學者基于支持向量機(SVM)[8,9]、小波分析[10,11]、分形理論[12]等非線性模型，針對交通流量預測問題開發出許多變體模型，可適用于短時交通流量預測。近年來，深度學習在文本處理、語音識別等領域展現出優秀的特征學習能力，因此，逐漸嘗試使用該類方法提取交通流量數據的時空特性并進行交通流量預測。例如：Zhang等[13]提出DeepST模型，利用多層卷積學習交通流量的空間依賴；Wu等[14]使用CNN捕捉交通流量數據空間特征，使用LSTM捕捉短期變異性和周期性；Lai等[15]提出LSTNet模型，根據周期長度對輸入數據維度進行整理，解決傳統RNN在較長周期中信息難以傳遞的問題；Yu等[16]結合道路拓撲信息，采用圖卷積和一維卷積相結合的方式預測交通流量。以上深度學習模型采用不同模塊分別捕捉交通流量數據的時間特性和空間特性，相對于傳統交通流量預測模型預測精度有一定提升，然而，現有深度學習模型未考慮城市交通流量數據在時間上的周期性、鄰近性和趨勢性。因此，本文提出一種基于注意力機制的GC-GRU時空預測模型，采用網絡距離構建城市路網結構，按照周期劃分歷史輸入，并利用圖卷積(Graph Convolution，GC)和門控循環神經網絡分別捕捉空間依賴性和時間依賴性，結合注意力機制對城市道路交通流量進行預測。該模型與ARIMA、SVM、GRU、GCN等常規預測模型相比，考慮了交通流量數據的時空特征信息，與DeepST、STGCN等模型相比，考慮了時間周期性和趨勢性。

1 STGCGRU模型

1.1 總體架構

依據交通流量的時空特性，本文構建了時空圖卷積門控循環網絡預測模型(Spatial-Temporal Graph Convolution Gate Recurrent Unit Network，STGCGRU)進行城市道路交通流量短時預測。模型整體采用Encoder-Decoder架構[17](圖1)，由多層圖卷積(GC)和門控循環單元(Gate Recurrent Unit，GRU)組合作為GC-GRU基本單元構成單層循環網絡，以捕捉交通流量數據的時空特征，并添加注意力機制，動態調整Encoder過程中輸入的歷史時段中不同單位時間步長(以下簡稱“時間步”)的權重，以適應交通流量數據的趨勢變動性。其中，Encoder部分將多個歷史時間步的交通流量數據x1,x2,…，xt輸入模型進行編碼，并匯總成代表歷史輸入序列的特征向量ht；Decoder部分對該特征向量進行解碼，根據上一時間步隱藏狀態及預測結果逐步輸出未來時間步的預測結果ht+1,ht+2,…，ht+p；注意力機制部分根據待預測時間步分配各歷史時間步權重，然后加權計算上下文信息并與Decoder預測結果融合作為最終預測結果。

圖1 STGCGRU模型總體架構Fig.1 Framework of STGCGRU model

1.2 問題定義

本文將城市路網中的路段抽象為節點V={vi|i=1,2,3,…,n}，路段間的連接關系定義為邊E={(vi,vj)|vi∈V,vj∈V}，則城市路網形成無向圖G=(V,E,A)，其中A為道路拓撲圖結構的鄰接矩陣。結合圖結構的交通流量預測問題可看作依據歷史時段的路段交通流量及道路拓撲圖預測未來某時段的交通流量，即存在學習映射函數f，使得：

[xt+1,xt+2,…，xt+p]=f(x1,x2,…,xt,G)

(1)

式中：x1,x2,…，xt為不同歷史時間步所有路段節點的交通流量數據；xt+1,xt+2,…，xt+p為所預測的未來p個時間步所有路段節點的交通流量。

1.2.1 道路圖鄰接矩陣構建對于城市交通而言，節點間距離越近，其空間相關性越強，因此，本文采用反距離加權方式構建鄰接矩陣A(式(2))，兩節點間的距離可通過歐氏距離、網絡距離、交叉口距離3種方式計算。其中，歐氏距離dist(vi,vj)用于衡量vi與vj兩節點間的絕對距離(式(3));網絡距離是指出租車在實際行駛過程中起點到終點的最短行駛距離，本文中的網絡距離由百度最短路徑API求得(圖2);交叉口距離為起點到終點經過的最少交叉口數量,如圖3所示，兩個路段間的交叉口距離為3。

圖2 網絡距離示意Fig.2 Schematic diagram of network distance

圖3 交叉口距離示意Fig.3 Schematic diagram of intersection distance

(2)

(3)

式中：(xi,yi)、(xj,yj)分別為節點vi、vj的坐標。

1.2.2 歷史輸入時段劃分考慮城市交通流量數據的時間鄰近性、日周期性、周周期性等特點，將輸入歷史時段{x1，x2,…，xt}劃分為鄰近片段、日周期片段、周周期片段3部分，每部分長度均為l=t/3。如圖4所示，設單位聚合時段為5 min，預測時段為2020年5月20日9:00-9:10的交通流量(即p=2)；輸入歷史時段每部分片段長度為20 min(即l=4)，則鄰近片段為與預測時段相鄰的長度為l的時段{xt-l，xt-l+1,…，xt}，即2020年5月20日8:40-9:00；日周期片段為一天前同時段及前后時段，長度同為l，記為{xt-2l-1,xt-2l,…，xt-l-1}，即2020年5月19日8:55-9:15；周周期片段為一周前同時段及前后時段，長度同為l，記為{x1,x2,…，xt-2l-2}，即2020年5月13日8:55-9:15。

圖4 歷史輸入時段劃分Fig.4 Division of historical input periods

1.3 GC-GRU單元

圖5 多層圖卷積過程示意Fig.5 Schematic diagram of multi-layer graph convolution process

圖6 GC-GRU單元內部結構Fig.6 Internal structure of GC-GRU unit

(4)

(5)

(6)

(7)

(8)

式中：⊙表示元素相乘；Wz、bz、Wr、br、Wh、bh為可學習的權重矩陣，模型可自動調整當前時刻信息和歷史信息的保留比例，保證提取的特征向量ht既包含足夠的當前時刻信息，又包含歷史信息中的變化趨勢。

1.4 注意力機制

注意力機制最早被用于調節權重大小，使模型在關鍵位置有較高關注力。本文模型中注意力模塊[20]可使模型在訓練過程中動態調整不同時間步的權重大小，以捕捉交通流量的趨勢變動性，具體實現過程為：針對Decoder部分預測的每個時間步ht+Δt，計算Encoder部分所有歷史時間步的權重，加權求和得到綜合信息cΔt(式(9)-式(11))，再將其與經過GC-GRU單元后的隱藏狀態ht+Δt融合作為輸出，得到xt+Δt(式(12))。

(9)

(10)

(11)

xt+Δt=tanh(Wc[cΔt,ht+Δt])

(12)

圖7 注意力機制詳細框架Fig.7 Detailed framework of the attention mechanism

2 實驗設置

2.1 實驗數據概況

實驗數據為北京市五環內2015年5-6月共47天33 234輛出租車產生的GPS軌跡點數據，選擇前35天作為訓練數據，后12天為測試數據。剔除冗余數據和漂移數據；對于定位偏差數據，采用基于隱形馬爾可夫模型的地圖匹配算法[21]，將實際GPS軌跡點映射到實際路網中。

以道路交叉口分割的方式，將路段抽象為節點(圖8)，共抽取北京市五環內639個路段，平均長度為1 772 m。以路段中點表示路段位置，以5 min為單位聚合出租車軌跡點數量作為該點的交通流量數據。由北京市工作日/周末不同峰期交通流量分布情況(圖9，彩圖見封2)可知，交通流量多集中在三環內的中關村、三里屯、北京東站附近，出租車多在80輛以上，三環以外路段多在20輛以下。工作日相對周末、早(午)高峰相對晚高峰交通流量整體偏大，具體表現在：工作日早高峰居民出行多為上下班，交通流量較大并集中在北京城區西北部的中關村、西直門、北京西站附近，晚高峰居民出行多為休閑社交活動，交通流量集中在北京城區東部的工體、CBD、勁松橋附近；周末早高峰居民出行較少，交通流量明顯偏低，午(晚)高峰交通流量集中在住宅區及休閑娛樂場所較多的工體、CBD、勁松橋等位置附近。

圖8 路網抽象為節點Fig.8 Road sections abstracted as nodes in road network

圖9 北京市出租車5 min路段聚合交通流量概況Fig.9 General situation of the aggregate taxi traffic flow in Beijing within 5 minutes

以8:00-8:15時段為基礎，與其他7個時段交通流量進行Pearson相關分析(圖10a),可以看出，8:00-8:15時段與8:15-8:30時段交通流量相關性最高，且相關系數隨時間推移逐漸減小，說明交通流量具有時間鄰近性；由圖10b可知，交通流量呈現日周期性和周周期性；由圖10c可知，單日交通流量存在早、午、晚3個高峰，且每日3個高峰的時間和峰值并不完全一致，交通流量數據具有趨勢變動性；全局Moran′sI指標可以度量城市路網交通流量的空間自相關性[22]，由不同行駛距離下工作日早高峰時段交通流量的全局Moran′sI指標(圖10d)可知，Moran′sI均大于0且逐漸降低，說明交通流量在空間上存在顯著的正相關且相關性隨行駛距離增長而減弱。

2.2 評價指標及實驗參數設置

實驗采用的評價指標有均方根誤差(RMSE)、平均絕對誤差(MAE)、決定系數(R2)，RMSE和MAE越小、R2越大，預測效果越好。公式如下：

(13)

(14)

(15)

STGCGRU模型超參數主要包括圖卷積層數、隱層單元數目、輸入歷史序列長度、圖構建方式、學習率及批次大小。實驗設置學習率α=0.001，批次大小batchsize=64，隨機選取數據集的80%作為訓練集，剩余20%作為驗證集，模型訓練均采用Adam算法進行優化并在模型訓練時采用早停策略。1)由圖10d可看出，交通流量的空間自相關性在2～4 km處下降較快，結合路段平均長度可認為，交通流量與其2階以內鄰居路段的相關性較強，因此采用2層圖卷積捕獲交通流量的空間特性。2)日常出行往往優先考慮行駛距離最短的路線，與網路距離計算方式相符，基于網絡距離構建的鄰接矩陣更適合城市交通拓撲圖構建與交通流量預測，因此模型最終選擇網絡距離作為圖構建方式。3)隱層單元數目關系著模型計算過程中傳遞的信息量，是模型的重要參數之一。由不同隱層單元數目下模型測試誤差(圖11a)可知，模型RMSE和MAE在隱層單元數目為16時最低，因此選擇隱層單元數目為16作為后續實驗參數。4)輸入的歷史序列越長，其承載的信息量越多，但過長的歷史序列距預測序列較遠，相關性較低，反而會影響模型精度。本文將組成輸入的片段時間長度分別設置為15 min、25 min、35 min、45 min、55 min，即總輸入歷史序列長度T分別為9、15、21、27、33，分別計算模型RMSE和MAE(圖11b)，可以看出，在片段時間長度為35 min，即輸入歷史序列長度為21時，RMSE和MAE均達最低，故最終選擇輸入歷史序列長度為21。

圖10 北京市出租車交通流量時間特性分析Fig.10 Analysis of time characteristics of taxi traffic flow in Beijing

圖11 模型參數選擇Fig.11 Parameter selection for the model

3 結果分析

3.1 模型對比分析

為驗證本文模型的可靠性，選取以下5種交通流量預測模型進行對比分析： 1)差分自回歸移動平均(ARIMA)模型，是一種經典的時間序列預測模型；實驗中采用ARIMA(1,1,1)模型，即差分次數、自回歸項和移動平均項均為1。2)支持向量機(SVM)模型，利用核函數實現輸入數據到高維特征空間的映射，分析輸入輸出間的非線性關系；實驗中采用的核函數為高斯核函數，懲罰系數設置為0.1，γ為0.01。3) GRU模型，實驗中設置隱藏層數為2，每層的隱藏單元數目均為16。4)GCN模型，實驗中設置圖卷積層數為2，每層的神經元數目均為16。5)深度時空殘差神經網絡DeepST，對時刻、天、周3段數據分段采樣，分別采用多層殘差神經網絡并利用全連接融合，相對于原始DeepST模型[13]，無額外因素模塊。ARIMA、SVM、GRU、GCN 4個基準模型均采用與預測目標時間鄰近的前35 min(即前7個時間步)的歷史交通流量作為輸入，為保證模型輸入一致及對比公平性，實驗采用不包含周期片段輸入的STGCGRU模型(輸入同為前7個時間步)與基準模型進行對比，采用帶有周期性的STGCGRU模型與同樣包含周期性的現有DeepST模型進行對比。

由不同模型的RMSE、MAE、R2(表1)可以看出：1)在相同輸入時間長度下，未加周期片段的STGCGRU模型相對傳統的交通流量預測模型(ARIMA、SVM)而言，RMSE分別減少了69.69%和52.92%，MAE分別減少了70.23%和43.93%，R2分別提高了56.14%和41.27%，說明STGCGRU模型能更好地映射交通流量數據中的非線性關系，捕捉交通流量數據的趨勢變動性，預測精度較高。未加周期片段的STGCGRU模型的RMSE比GRU和GCN分別減少了6.88%和6.67%，MAE分別減少6.89%和7.34%，R2均提升了5.95%，說明STGCGRU模型可較好捕捉時空特性。2)DeepST模型預測誤差低于基準模型，而STGCGRU模型的3種評價指標仍優于DeepST模型，說明采用多層圖卷積比多層卷積能更好捕捉道路的空間特征。3)對比保留周期片段和不保留周期片段的STGCGRU模型預測結果可以看出，將日周期和周周期片段加入模型輸入序列，對模型預測精度有提升效果，故考慮周期性對交通流量預測至關重要。

表1 不同模型對北京市出租車交通流量時間特性的預測精度Table 1 Prediction accuracy of time characteristics of taxi traffic flow using different models in Beijing

由STGCGRU模型在不同預測時長下的預測結果(表2)可知，隨著預測時長增加，RMSE和MAE均呈上升趨勢，R2呈下降趨勢?？赡苁怯捎谠贒ecoder部分上一步輸出參與到下一步預測的計算造成誤差累積，從而導致模型誤差隨預測時長增加而增大，說明STGCGRU模型較適合短時交通流量預測。

表2 不同預測時長下STGCGRU模型交通流量預測精度Table 2 Prediction accuracy of traffic flow using STGCGRU model under different prediction duration

3.2 不同交通情況下預測結果分析

人們在日常出行中更在意高峰期的交通擁堵狀況，因此本文利用STGCGRU模型對工作日和周末高峰時段的真實數據進行測試，其中早高峰為8:00-11:00，午高峰為13:00-16:00，晚高峰為19:00-22:00。由于真實數據缺失天數較多，很難滿足周周期、日周期所對應日期數據的真實性，因此實驗中采用未加周期片段的STGCGRU模型，訓練及測試數據均為有缺失時段的真實數據。同時，添加全時段預測結果作為基準對比，輸入時間序列長度為35 min，預測時長為5 min，預測結果如表3所示。整體而言，全時段由于包含車流量基本為0的凌晨時段，預測結果較好。工作日相對周末交通流量基數大，因此工作日預測結果的RMSE和MAE相對周末高，而反觀R2，工作日相對周末高，主要是由于工作日交通流量規律性較強。對比早高峰、午高峰、晚高峰3個時段，晚高峰模型預測結果在工作日和周末均較好，震蕩較為明顯的午高峰預測結果較差。

表3 STGCGRU模型在高峰時段預測結果對比Table 3 Comparison of prediction results of STGCGRU model during peak hours

易堵路段同樣是交通流量預測的關注重點。對車流量較大的中關村在工作日和周末的交通流量進行預測，并與真實值進行對比(圖12)。中關村作為教育、科技聚集地，在工作日上下班時段交通流量大，晚高峰較為明顯，在周末各時段交通流量較為平均。從圖12可以看出，STGCGRU模型可較好地擬合交通流量的趨勢，對于交通流量變化平穩時段預測結果較精準，對于交通流量突增或突減情況，預測值與真實值存在一定的偏差。

圖12 易堵路段預測值和真實值對比Fig.12 Comparison of predicted values and actual values in easily blocked road section

4 結論

本文提出一種基于注意力機制的交通流量時空預測模型——STGCGRU模型，該模型采用Encoder-Decoder結構，結合圖卷積和門控循環單元捕捉交通流量的時空特性，利用注意力機制調節趨勢變動性和周期性對預測的影響?；诒本┦谐鲎廛嚱煌髁繑祿?，與ARIMA、SVM、GCN、GRU基準模型及DeepST模型對比后發現，STGCGRU模型可以捕捉交通流量數據中的時空特征，預測精度更高；將STGCGRU模型應用于不同時長的交通流量預測，發現該模型更適合城市交通流量短時預測；結合不同交通情況分析發現，工作日相對周末模型擬合效果更好，早晚高峰相對午高峰預測結果更好。STGCGRU模型對于交通流量趨勢捕捉較為敏感，有助于揭示短時段內交通狀況，為城市智能交通決策提供參考。但該模型不能立刻捕捉交通流量突變情況,未來將添加天氣、交通事件等導致交通流量突變的其他因素，以提高模型對交通流量突變情況的預測精度。