馮思蕓,施振佺,2,曹 陽,2
(1.南通大學 信息科學技術學院,江蘇 南通 226019;2.南通大學 交通與土木工程學院,江蘇 南通 226019)
隨著我國城市化建設加快,車輛保有率逐步上升,城市交通擁堵問題日益嚴峻,同時導致空氣污染加劇。智能交通系統(Intelligent Transportation System,ITS)將先進的科學技術有效地綜合應用于交通運輸中,有利于加強車輛、道路和出行者的聯系,提高交通資源分配和調度的合理性[1]。
交通參數預測是ITS 的重要組成部分,現有研究主要集中于如何根據歷史和實時數據預測交通流下一時刻狀態,如流量、速度、密度等。城市路網交通速度預測可以為出行者提供實時的交通信息,對提升道路通行能力具有重要意義。通常,有效的城市路網交通速度預測重在捕捉交通系統內部的時空變化特征。神經網絡因其優異的性能被廣泛地應用于求解交通參數預測問題中[2]。當前常用的神經網絡主要包括卷積神經網絡[3](Convolutional Neural Network,CNN)、循環神經網絡[4](Recurrent Neural Network,RNN)、圖卷積網絡[5](Graph Convolutional Network,GCN)等。然而,交通狀態具有非常復雜的非線性、隨機性等特征[6],單一的神經網絡模型并不能獲得較好的預測性能,因此,當前的研究方向已逐步向混合神經網絡模型發展[7]。文獻[8]提出的注意力圖卷積序列模型,利用GCN 和注意力機制分別對空間依賴性和時間依賴性進行建模。文獻[9]結合長短時記憶網絡和注意力機制構建混合模型框架。文獻[10]利用卷積門控循環單元(Gated Recurrent Unit,GRU)進行空間特征提取,結合雙向GRU對時間依賴性進行分析,從而有效地對交通流量進行預測。文獻[11]堆疊CNN 和長短時記憶網絡挖掘交通數據的時空特性,取得了良好的預測效果。此外,大量研究表明,混合神經網絡模型能夠更充分地挖掘時空特征,預測性能更好[12-13]。
圖卷積網絡是圖神經網絡的一個重要分支[14],目前已較好地應用于路網交通預測中[15]。文獻[16-17]將路網拓撲結構表示為0-1 鄰接矩陣,利用GCN 對城市路網空間相關性進行分析,再結合長短時記憶網絡等分析交通流的時間相關性。然而,上述方法對于空間特征的挖掘并不充分,傳統的圖卷積傳播規則依賴于路網的實際拓撲結構,并未考慮到相鄰路段間不同的空間影響程度。針對這一缺陷,已有多種解決方法。文獻[18]利用相關性分析方法,根據路段的連通性構建鄰接矩陣。文獻[19]利用softmax 函數重構0-1 矩陣,對每個非0 元素賦予變量值,通過迭代訓練得到最優鄰接矩陣。這些方法都從一定程度上加強了模型對一階相鄰路段間空間關聯程度的挖掘,但是時空特征不受道路連通性的限制,非一階相鄰道路的交通流之間也存在相互影響性[20]。在部分非一階相鄰路段關聯度大于部分一階相鄰路段關聯度的情況下,如果仍輸入原始的鄰接矩陣,會遺失一些相對重要的路段空間信息,無法得到較好的預測結果。
為更好地挖掘城市路網的交通特性,本文提出一種基于全局時空特性的速度預測模型G-GCGRU。利用全局圖卷積網絡進行空間特征分析,構造路網有向帶權的內部空間關系,解決非一階高度關聯路段信息缺失的問題,充分挖掘交通流的空間特征。同時,通過GRU 分析數據的時間依賴性以挖掘其時間特征。在此基礎上,選用深圳市羅湖區城市路網車輛速度數據對模型進行驗證。
為充分挖掘交通流的時空特征,建立時空矩陣作為模型的輸入。利用待研究路網中交通流參數的全量特征數據構造時空矩陣,矩陣中的每一列表示為路網中的一個路段,行表示為每個路段一個時間片的特征值,以此構成路網的時空矩陣,其結構如下:

其中:R={1,2,…,r}為路段集合;T={1,2,…,t}為時間片集合為包含r條路段且時間步長為t的時空矩陣。表1 列出了本文相關的符號定義。

表1 符號定義Table 1 Symbols definition
對交通流的空間特征和時間特征分別進行分析,構建預測模型。模型結構主要包含三部分,如圖1 所示。第一部分為全局圖卷積網絡模塊,利用全量特征數據進行相關性分析,計算關聯度矩陣,將關聯度矩陣和指定時間步長的時空矩陣輸入圖卷積網絡中,提取交通流數據全局空間特征;第二部分為門控循環單元模塊,將第一部分的輸出值輸入GRU 網絡中,進一步分析數據的時間特性;第三部分為預測模塊,利用GRU網絡最后時刻的輸出,通過Dense 層控制需要預測的時間步長并計算得到模型最后的預測結果,以此建立G-GCGRU 的網絡結構。

圖1 G-GCGRU 網絡結構Fig.1 Network structure of G-GCGRU
城市路網的結構特征類似于圖的拓撲結構。GCN是當前處理圖結構等非歐式數據比較流行的神經網絡。將路網拓撲結構表示為無向圖G=(V,Ε),其中,V為節點集合表示路段,Ε為邊集合,表示路段間的相鄰情況。GCN 的計算規則為:

GCN 通過鄰接矩陣對實際路網的空間結構進行顯式表征,利用進行特征卷積,將相鄰路段節點特征進行融合,以此獲取新的路段特征表示。然而,考慮到道路本身的地理條件和道路周邊基礎設施的影響,部分相鄰路段間的空間影響性會弱于非相鄰路段間的空間影響性。鄰接矩陣雖然能夠表達出直觀的路段鄰接性,但是并不能表達出路網內部空間影響性。針對這一缺陷,對路段內部的空間結構進行隱式表征。對于任一路段,利用皮爾遜相關系數方法[21]計算其與路網中其余路段間的關聯性,篩選關聯度較高的若干條路段數k,組成關聯度矩陣C。在此基礎上,利用GCN 的卷積思想,通過C聚合關聯度高的路段空間信息作為道路節點的新特征。
對于任意2 條路段Xi、Xj,設相應的特征值數據為則關聯度矩陣計算方法為:

關聯度矩陣描述的路段節點關系為一張有向帶權圖,節點之間的連接表示影響權重,方向代表影響關系。通過關聯度矩陣聚合與節點自身關聯度高的路段信息,進一步提高模型對空間特征的挖掘。因此,全局圖卷積網絡的規則更新為:

將C以及包含r條路段和p個時間片的時空矩陣輸入兩層圖卷積網絡中進行空間特征分析,網絡傳播規則如圖2 所示,計算規則如下:


圖2 全局圖卷積網絡傳播規則Fig.2 Communication rule of G-GCN
GRU 能夠有效避免RNN 梯度消失和爆炸的問題,是處理時間序列預測問題的主流神經網絡之一[22]。GRU網絡包含三部分,即輸入層、隱藏層和輸出層,其核心算法在于隱藏層單元塊中的計算過程,如圖3 所示。

圖3 門控循環單元模塊Fig.3 Gated recurrent unit module
針對某一時間片,GRU 首先拼接上一時刻隱藏層的輸出ht-1和當前時刻的輸入Xt,通過sigmoid 函數將數據變換到[0,1]中,充當重置門控信號rt和更新門控信號zt;然后利用門控信號分別對ht-1和Xt進行選擇性的遺忘和保存,從而實現在保存上一時刻交通信息的同時結合當前時刻的交通狀態,達到捕獲時間依賴性的效果。

獲取GRU 網絡最后時刻的輸出,輸入Dense 網絡中,控制輸出的時間步長得到最后的預測結果:

G-GCGRU 模型的主要求解步驟如下:
步驟1對有效交通數據進行歸一化,將數值限定在[0,1]之間,將數據集按照8∶2 的比例拆分為訓練集和測試集。
步驟2設定模型結構及超參數,包括GRU 隱藏層神經元數量、模型輸入時間步長、輸出步長、批數據大小、學習率、迭代次數、損失函數、優化方法等。
步驟3選擇合適的關聯路段數量k,構造關聯度矩陣,輸入G-GCGRU 模型中獲取預測結果。對預測值與真實值進行對比,使用Adam 優化器進行訓練,滿足迭代次數后訓練結束。
步驟4利用訓練后的模型對測試集進行預測。
實驗設置具體如下:
1)數據集。本文利用深圳市羅湖區2015 年1 月1 日—2015 年1 月31 日的路網數據進行分析。該數據集包含156 條路段,以15 min 聚合,共計2 976 條車速數據。
2)參數設置。設置單個路段的關聯路段數量k,構造關聯度矩陣輸入模型。實驗基于TensorFlow 框架進行實現,主要參數設置如下:GRU 維數為64;學習率為0.001;批大小為32;訓練次數為3 000。
3)評估指標。以均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)和測定系數(Coefficient of Determination,R2)作為模型性能評價標準,定義分別如下:

2.2.1 關聯路段數量k的分析
G-GCGRU 模型考慮全局路網中路段的空間關聯性。利用路網路段車輛速度分析路段間的關聯性,得到各路段間的相關性值,如圖4 所示。圖4(a)為路網中相鄰路段間的關聯情況,圖4(b)為根據關聯路段數量k計算出的高關聯路段情況,顏色越深,關聯度越高。可以看出,圖4(a)中的節點關聯性明顯弱于圖4(b),說明真實的拓撲結構對路網空間關聯關系的表達并不充分。關聯度矩陣通過重新構建路段間的相關性,深度分析高關聯的路段并拋棄關聯度低的路段信息,能夠進一步提高模型捕獲空間特征的能力。

圖4 道路關聯度矩陣對比Fig.4 Road correlation matrix comparison
關聯路段數量k是影響模型預測性能的一個重要因素。k與RMSE、MAE值的關系如圖5所示。從整體上看,隨著k值的增大,模型誤差呈下降趨勢,說明多路段空間信息的聚合有利于提高模型對空間特征的挖掘能力。當k值為6時,模型誤差達到最低,隨后,k值增大,模型誤差緩慢增長,這表明6為最佳關聯路段數量,并且過多的k會引入額外的數據信息,影響模型的預測能力。

圖5 關聯路段數量分析Fig.5 Analysis of correlation road number
2.2.2 對比實驗
為驗證所提模型的有效性和優越性,選取GCN、GRU 及GCN-GRU 混合模型進行對比,結果如表2 所示。可以看出,在4 種預測模型中,本文提出的G-GCGRU 模型性能最優。

表2 模型性能對比Table 2 Model performance comparison
圖6 為不同模型對路網中編號為102129 路段一天數據的擬合曲線圖,可以看出,本文提出的模型擬合效果相對較好。與GRU 網絡相比,GCN 網絡的預測效果明顯不佳,說明時間特征是交通流較為關鍵的特征。與GRU、GCN 相比,GCN-GRU 模型預測精度有一定提升,表明混合網絡模型同時兼顧了數據的時間和空間特征,進行了較為全面的特征挖掘。而與G-GCGRU 相比,GCN-GRU 模型性能略有下降,說明關聯度矩陣對空間特征的卷積效果優于鄰接矩陣,能夠有效提高模型預測精度。

圖6 4 種模型的預測結果對比Fig.6 Prediction results comparison of four models
2.2.3 多步預測能力
為驗證本文模型的多步預測能力,調整模型輸出的時間步長及各參數進行驗證,結果如圖7 所示。可以看出,隨著預測時間步長的增大,模型性能稍有下降。但是各時間步預測結果波動不大,表明本文模型性能對輸出步長的改變相對并不敏感,能夠有效預測未來長時間段的交通狀態。

圖7 多步預測結果Fig.7 Multi-step prediction result
本文提出一種基于全局時空特性的城市路網交通速度預測模型G-GCGRU,利用皮爾遜相關系數分析挖掘交通流內部的空間關聯性,通過圖卷積網絡卷積(GCN)提取交通流空間特征,再結合門控循環單元(GRU)分析交通流時間特征。利用真實的路網數據進行測試,實驗結果表明,與GCN、GRU 及GCN-GRU 混合模型相比,G-GCGRU 模型性能表現最好。在本文研究中,關聯度矩陣通過相關性分析計算得到,后續將考慮利用參數法優化該矩陣,進一步提高模型性能。