陳 孟,干 可,李 凱,陳 非,范 庸
(四川省公路出行智能服務工程試驗室,四川 成都 610000)
作為現代智能交通系統(tǒng)研究中的核心問題,交通流預測旨在一定的時空范圍內對車流量或者車速進行估計[1]。一種可靠的、準確的以及持久的交通流預測模型應具備以下3個功能:(1)旅客出行信息智能查詢系統(tǒng);(2)智能交通管制系統(tǒng);(3)對以上兩個系統(tǒng)的性能能給出科學的評估和未來的優(yōu)化建議[1-2]。現有交通流預測模型可以大致分為時間序列預測法[3-5]、概率圖模型[6-7]以及非參數策略[8-10]3類。其中前兩類方法存在以下問題:(1)在缺少了具體的場景和人工評估背景下所構建的模型并不具有具體的場景針對性,而更多的是在一般場景下的概括描述;(2)相比于非參數策略,前兩種策略無法捕捉交通時序中的非線性場景[11-14]。然而就非參數策略而言,以人工神經網絡為代表,目前大多數人工神經網絡的構建只有一個單隱藏層,原因在于多隱藏層的應用并不一定能夠在相應的場景下成功地構建模型,在這一點上時間序列預測法中的線性構建策略比人工神經網絡表現地更好[15-17]。因此針對人工神經網絡的缺陷,研究人員主要通過混合神經網絡和控制神經網絡構建中的過擬合場景兩個方面來解決。混合神經網絡整合了不同的統(tǒng)計學方法和計算方法,其中最具代表性的是和時序預測策略的整合,Takagi-Sugeno模糊深度模型整合了模糊邏輯和前饋神經網絡構建短期交通流模型[18-19],Stathopoulos等[20]在此基礎上引入卡爾曼濾波對模型進行優(yōu)化,Srinivasan等[21]則運用模糊過濾參數對數據進行聚類操作來作為前饋神經網絡的輸入參數,Tan等[22]利用傳統(tǒng)的滑動平均和自回歸滑動平均模型來作為神經網絡的輸入。盡管混合神經網絡整合了不同的計算策略,但是同時需要高性能和高存儲的計算設備作為支撐,另外硬件條件往往限制了混合神經網絡策略真正的計算能力[23-25]。對于抑制過擬合策略而言,可以通過加噪的方式提高數據樣本的質量,但這一方法同樣需要大量的計算時間和算法處理,另一種常用的方式則是運用交叉驗證,即把數據集劃分為擬合數據集和驗證數據集[26-27],前者用于神經網絡學習而后者用于估計合法性誤差,當錯誤率低于設定的閾值時訓練終止。然而Liu等[28]證明即便是合理的交叉驗證也未必能夠避免過擬合現象,驗證數據集往往并不具備足夠的數據代表性來提供沒有傾向的數據評估能力。
因此在本次研究中針對現有交通流預測方法的不足,提出了一種基于實時多模態(tài)時空數據的深度圖神經網絡策略來構建交通流的預測模型。首先采用時間圖卷積網絡模型對交通流數據的輸入向量先后進行數據預處理和特征學習,并對輸出結果用卡爾曼濾波進行矯正,從中挖掘交通流數據中的本質性規(guī)律,最后通過對該模型進行抽樣以獲取高層次的特征向量來預測交通流的狀態(tài)。試驗結果表明,該模型對交通流流量預測具有較好精度,是一種有效的交通流預測方法。
傳統(tǒng)的卷積神經網絡(Convolutional Neural Networks, CNN)無法勝任由圖策略構建城市道路的能力,因為城市道路圖并不是二維空間網格,傳統(tǒng)的CNN無法表現道路網絡復雜的拓撲結構以及捕捉空間內部各個參數的依賴關系。因此針對傳統(tǒng)CNN在表達城市道路交通流上的不足,中南大學的李海峰團隊于2019年提出了時間圖卷積網絡(Temporal Graph Convolutional Network, T-GCN)模型[29],該模型同時集成了圖卷積網絡(Graph Convolutional Network, GCN)和門控遞歸單元(Gated Recurrent Unit, GRU),其中圖卷積網絡通過學習復雜的拓撲結構來捕獲交通流圖節(jié)點間的空間依賴關系,而門控遞歸單元通過學習交通數據的動態(tài)變化來捕獲時間依賴關系。
在描述空間依賴關系中,GCN模型的構建通過鄰接矩陣和特征矩陣在傅里葉域中構造了一個濾波器,該濾波器應用于圖的各個節(jié)點上,通過它的一階鄰域捕獲節(jié)點之間的空間特征,然后通過疊加多個卷積層來構建GCN模型:
(1)

在這里采用兩層GCN模型捕獲空間依賴關系,如下所示:
(2)
式中,x為特征矩陣,A為鄰接矩陣;w0和w1分別為第1層和第2層的單層GCN空間權重矩陣模型;Relu為線性整流函數。
而在時間依賴關系的描述中,由于長短期記憶網絡(Long Short-term Memory, LSTM)對于數據要求較為漫長的訓練時間,因此選用結構相對簡單,整體訓練速度相對較快的GRU模型從交通數據中獲取時間相關性。因此對于整個T-GCN模型而言,GCN部分的某一時刻的輸出進入特定的GRU模型中作為數據輸入,經過GRU部分的更新門(Update Gate)和重置門(Reset Gate)的數據處理最終產生輸出結果。
由于實際場景交通流的時空演化具有非線性和不穩(wěn)定的特質,且不同的深度置信網絡所構建的混合模型內部的算法之間,并不能在復雜的場景條件和多參數的引用下實現很好的兼容和互補,因此本研究基于T-GCN模型,在T-GCN輸出的結果輸出過程中引入卡爾曼濾波對原有的模型進行改進,得到TK-GCN模型(Temporal Graph Convolutional Network with Kalman Filtering),旨在模擬降低因多參數的引入而產生的偏差[30]。
對于一個給定的路段Road,本研究定義其特征矩陣x,該矩陣由該路段的矩陣節(jié)點數n以及該節(jié)點屬性特征p所構成,即歷史時間序列的長度值,xt即表示在t時刻下該路段的觀測圖輸入信號;而對于鄰接矩陣A而言,其反映的是道路之間的交通流聯(lián)系參數,因為Relu函數的歸一化處理,其計算結果范圍在0到1之間,0表示兩條道路之間沒有任何聯(lián)系,而1表示兩條道路有聯(lián)系。鄰接矩陣A,即為不同道路節(jié)點數n所構成。
因此整個交通流預測算法具體的流程如下所示:
(1) 獲取某時刻下交通流狀態(tài)的特征數據,根據函數構建特征數據集,原始數據集輸入信號即可表示為{x(ti),i=1,2,…,n}。
(2)將該歷史時間序列數據作為輸入,利用圖卷積網絡捕獲城市路網拓撲結構,獲得空間特征。
(3)將輸出得到的具有空間特征的時間序列輸入門控遞歸單元模型,通過單元間的信息傳遞獲得動態(tài)變化,捕捉時間特征。
(4)以全連接層的方式得到T-GCN輸出預測結果{h′(ti),i=1,2,…,n};得到的輸出數據集經過卡爾曼濾波處理得到最終的輸出預測結果。整個過程如圖1所示。在T-GCN模塊當中,ht為t時刻傳遞出的隱藏值,GC為圖卷積模塊(Graph Convolution),Ut和rt分別為t時刻的更新門(Update Gate)和重置門(Reset Gate)。而在卡爾曼模塊當中,ht和Yt-1對應的卡爾曼處理步驟定義為預測步驟(Prediction Step),Ct為將數據放縮到[-1, 1]范圍內的tanh激活函數。

圖1 TK-GCN模型流程圖
rt=σ(Wrt)[ht-1,xt],
(3)
Ut=σ(WUt)[ht-1,xt],
(4)
ct=tanh(WCt[ht-1⊙rt,xt]),
(5)
ht=Ut⊙ht-1+(1-Ut)⊙Ct,
(6)
式中,Wrt,WUt,WCt分別為更新門、計算重制門及代入激活函數tanh計算時所對應需要訓練的矩陣。W為圖卷積網絡中需要訓練的權重矩陣,每一層GRU的輸入都考慮了上一層GRU的輸出,從而捕獲了路網交通流的時序關系。
在卡爾曼的濾波處理過程中,經過T-GCN輸出得到的交通流初始隱藏輸入信號序列{h′(ti),i=1,2,…,n}可以轉換成h′(t+1),而預測值在t時刻的交通流流量與該時刻前后的交通流流量相關,因此可得:
h′(t)=?0V(t-1)+?1V(t)+?2V(t+1)+δ0(t),
(7)
式中,?0,?1以及?2分別為t前后即t-1,t以及t+1的矩陣參數;V為該時刻的交通流量;δ0為人工引入的參數噪音,這里定義為協(xié)方差矩陣。而t前后的交通流量V( )做以下變換:
O(t)=[V(t-1),V(t),V(t+1)],
(8)
S(t)=(?0, ?1, ?2)T。
(9)
而根據卡爾曼濾波,因此式(8)、(9)可以整合成:
S(t)=φ(t)S(t-1)+n(t-1),
(10)
式中,S(t)為t時刻的狀態(tài)向量;φ(t)為t時刻對應的狀態(tài)轉移矩陣,n(t)為t時刻人工設計的噪音處理函數。
因此經過卡爾曼濾波處理的交通流量預測公式如下所示,其中β(t)即為觀測矩陣:
h′(t)=β(t)S(t)+δ0(t)。
(11)
由于T-GCN模塊引入了卡爾曼濾波修正,因此式(3)~(6)中的隱藏輸入信號ht-1修正為h′(t-1)。
該研究的試驗數據、模型的仿真和驗證工作基于川高系統(tǒng)視頻智能分析平臺(川高·智慧眼V2.0)實時記錄了2019年5月1號—10月30日成都繞城高速公路繞東路段,選擇繞東高速公路路段為主干道連接成都主城區(qū)共172條主要道路作為研究區(qū)域。試驗數據主要包括兩個部分:一是一個172×172的鄰接矩陣,描述了道路之間的空間關系,每行表示1條道路,矩陣中的值表示道路之間的連接性。二是特征矩陣,描述了每條道路上的速度隨時間的變化,每行代表1條路,每列是不同時段道路上的交通速度。實時速度每間隔5 min采集1次,整個數據采集空間當中共包含397個采樣點。由于交通流數據具有一定的規(guī)律性,且雙休日和工作日分別呈現出不同的數據特性,為了充分利用數據之間的規(guī)律性,文中針對高速公路交通流預測的訓練數據將排除雙休日以及國家法定節(jié)假日的數據,并用實際數據進行驗證工作。該數據由一個鄰接矩陣和一個特征矩陣構成,通過智慧眼平臺的攝像頭位點之間的距離計算鄰接矩陣。試驗中,輸入數據統(tǒng)一通過激活函數歸一化進區(qū)間[0,1]。另外,80%的數據作為訓練集,剩下的20%作為測試集,以此作為模型的輸入。基于以上數據,本研究預測未來10,20,30,40,50 min和60 min的交通速度。而為驗證優(yōu)化后的算法能夠提高長時預測(30~60 min)的能力,同時不丟失短時預測(5~15 min)的水平。然而在實際高速公路路況當中,相比起城市道路的時刻都有相對穩(wěn)定的車流量規(guī)律,高速公路連接城市部分的道路往往在全天呈現較大的規(guī)律性起伏,因此長時預測往往比短時預測更為滿足生產需要,短時預測對于高速公路而言并不具有一定的參考意義。
本研究模型基于TK-GCN,模型訓練過程中涉及的超參數包括:學習率、訓練集容量以及隱藏層數。研究中,本研究將學習率設置為0.001,選擇32個訓練集,訓練迭代次數為6 000從第20個epoch開始,每隔10個epoch學習率衰減為原來的1/10。在深度學習的架構中,不同的隱藏層數值的大小對預測精度有較大的影響,隱藏層層數需要大量的測試來選定。因此為了選擇最優(yōu)的隱藏層數值,針對不同的隱藏層數進行了嘗試,通過比較預測結果來選擇最優(yōu)值。在反復驗證的過程中發(fā)現,當隱藏層數的取值大于60時,均方誤差的值不再發(fā)生顯著的變化,所以將隱藏層數的上限值設置為60,最后輸出層的節(jié)點數為{5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60},設計隱藏層數的值為40。整個模型通過自適應矩估計(Adaptive Moment Estimation, ADAM)優(yōu)化器對模型進行訓練。
為了能夠更好地分析和評價預測結果,本研究采用了絕對平均誤差(Mean Absolute Error, MAE),相對平均誤差(Mean Relative Error, MRE)以及決定系數(Coefficient of Determination,R2),3個指標定義如下所示:
絕對平均誤差(MAE)
(12)
相對平均誤差(MRE)
(13)
決定系數(R2)
(14)
式中,YP為交通流量的預測值;YR為交通流量的真實觀測值;YA為統(tǒng)計區(qū)間內的平均值。MAE和MRE的值越小,代表預測值誤差越小;R2計算相關系數,數值越大,預測結果越接近真實水平。本研究所提出的改進后TK-GCN模型與T-GCN模型、CRBM-DBN(Conditional Restricted Boltzmann Machine-deep Belief Nets)模型、LGCN-NGCN模型(Large-scale Learnable and Neighborhood-averaging Graph Convolutional Networks)以及FL-GCN-CNN模型(Functional linkable Graph Convolutional Networks with Convolutional Neural Networks)進行比較,由表1可知,針對每種算法使用相同的數據集進行驗證后發(fā)現,本研究提出的預測模型的誤差性能明顯優(yōu)于同樣基于深度置信網絡的T-GCN、CRBM-DBN、LGCN-NGCN以及FL-GCN-CNN這些混合模型,表明了改進后的深度學習策略在交通流預測中的有效性。

表1 性能指標對比
由于其他基于深度置信網絡的模型當中,FL-GCN-CNN相比之下預測精度較高,因此就真實交通流量的預測效果方面,僅僅就TK-GCN模型以及FL-GCN-CNN模型與實際交通流速度作比較。這里以2019年5月13日—2019年5月17日60 min交通流車速跟蹤為例,對實際交通流量的預測由圖2可知,由于高速公路24 h的時段內始終都會有一定的車流量水平,兩個模型對車流量的預測總體上與實際的交通流車速變化趨勢相比相差不大,但是TK-GCN算法在波峰和波谷的預測表現,也就是上下高峰期時段交通流車速的預測,以及對交通流車速上升下降趨勢預測表現,其所計算出的預測結果更吻合真實的交通流數據變化。

圖2 兩種模型的交通流車速預測數據與真實交通流車速觀測數據的對比
本研究基于改進后的時間圖卷積網絡模型(TK-GCN)應用于短時交通流預測。文中所介紹的方法利用圖卷積網絡(GCN)捕獲路網拓撲結構,并對路網的空間依賴性進行建模;同時利用門控遞歸單元(GRU)捕獲道路交通數據的動態(tài)變化,并對其時間依賴性進行建模,隨后對預測數據進行卡爾曼濾波處理,從而挖掘交通流數據的本質特征;最后利用該模型對未來的交通流流量進行預測。試驗結果表明,文中所構建的交通流流量預測模型與傳統(tǒng)交通流預測模型相比,其預測數據值和實際測量的真實數據值偏差更小且更能吻合實際的交通流水平,證明該模型在交通流預測方面具有較高的預測精度。