路佳玲 魏志成 田 多
(河北師范大學(xué)計(jì)算機(jī)與網(wǎng)絡(luò)空間安全學(xué)院1) 石家莊 050024) (河北師范大學(xué)河北省網(wǎng)絡(luò)與信息安全重點(diǎn)實(shí)驗(yàn)室2) 石家莊 050024)
近年來(lái),國(guó)內(nèi)智能交通系統(tǒng)(intelligent transportation system, ITS)發(fā)展迅速,交通預(yù)測(cè)作為ITS的重要內(nèi)容,正在受到學(xué)者們的廣泛關(guān)注.準(zhǔn)確的交通流量預(yù)測(cè)可以提高城市居民出行效率,加強(qiáng)城市交通管理水平.
交通流量的預(yù)測(cè)方法主要分為模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)兩大類.模型驅(qū)動(dòng)方法由于模型固定,預(yù)測(cè)結(jié)果通常會(huì)不盡人意,因此人們已將預(yù)測(cè)的重點(diǎn)轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)方法[1-2].數(shù)據(jù)驅(qū)動(dòng)方法包括統(tǒng)計(jì)分析模型和機(jī)器學(xué)習(xí)模型兩大類.歷史平均模型(historical average, HA)和自回歸綜合移動(dòng)平均模型[3](autoregressive integrated moving average, ARIMA)是統(tǒng)計(jì)分析模型的經(jīng)典方法,算法簡(jiǎn)單,易于實(shí)現(xiàn).然而這種模型會(huì)受到時(shí)間序列平穩(wěn)性假設(shè)的限制,因此無(wú)法有效的預(yù)測(cè)具有高度非線性和復(fù)雜性特征的交通數(shù)據(jù).常用的機(jī)器學(xué)習(xí)方法包括K近鄰、隨機(jī)森林、支持向量回歸(support vector regression, SVR)等,與統(tǒng)計(jì)分析模型相比,機(jī)器學(xué)習(xí)模型通常可以達(dá)到較好的預(yù)測(cè)效果.
機(jī)器學(xué)習(xí)模型通常架構(gòu)淺易,在處理大規(guī)模、高復(fù)雜度的數(shù)據(jù)時(shí),會(huì)顯得稍有不足.面對(duì)高度非線性和復(fù)雜性的交通數(shù)據(jù),深度學(xué)習(xí)方法展現(xiàn)出巨大的優(yōu)勢(shì).Ma等[4]采用長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory, LSTM)進(jìn)行交通速度預(yù)測(cè).Zhang等[5]結(jié)合天氣條件數(shù)據(jù),采用門控循環(huán)單元(gate recurrent unit, GRU)預(yù)測(cè)城市交通流.Vijayalakshmi等[6]基于注意力機(jī)制,使用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)和LSTM進(jìn)行交通流預(yù)測(cè).
交通數(shù)據(jù)包含了空間信息,具有非歐幾里得的拓?fù)浣Y(jié)構(gòu)[7].然而傳統(tǒng)的深度學(xué)習(xí)方法無(wú)法很好的處理非歐幾里得數(shù)據(jù).近年來(lái),圖卷積神經(jīng)網(wǎng)絡(luò)[8-9](graph convolutional network, GCN)越來(lái)越多的被用于交通預(yù)測(cè)任務(wù)中.GCN將一組節(jié)點(diǎn)及節(jié)點(diǎn)間關(guān)系構(gòu)成的圖作為輸入,從而提取出節(jié)點(diǎn)間的空間關(guān)聯(lián)性.Yu等[10]提出了時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(spatio-temporal graph convolutional network, STGCN)預(yù)測(cè)交通速度.Guo等[11]使用注意力機(jī)制并結(jié)合GCN和標(biāo)準(zhǔn)二維卷積預(yù)測(cè)交通流.Zhao等[12]結(jié)合GCN和GRU進(jìn)行交通預(yù)測(cè).
現(xiàn)有的基于GCN的交通流預(yù)測(cè)模型通常將研究重點(diǎn)放在網(wǎng)絡(luò)層的結(jié)構(gòu)上,而忽略了鄰接矩陣的構(gòu)建.在圖卷積網(wǎng)絡(luò)中,鄰接矩陣的質(zhì)量對(duì)網(wǎng)絡(luò)性能的好壞有很大的影響.文中提出一種預(yù)測(cè)城市交通流的多因子圖構(gòu)建時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(multi-factor graph construction spatio-temporal graph convolutional network, MFGC-STGCN),從節(jié)點(diǎn)間交互交通流數(shù)量、交互時(shí)間代價(jià)、流出交通流相似度三個(gè)角度出發(fā),構(gòu)造更精確的鄰接矩陣.并用實(shí)例驗(yàn)證了模型的預(yù)測(cè)性能.
將交通網(wǎng)絡(luò)定義為無(wú)向圖G=(V,E,A),其中V為節(jié)點(diǎn)集;E為邊集;A∈RN×N為圖G的加權(quán)鄰接矩陣.文中將研究區(qū)域柵格化為N個(gè)地塊,對(duì)應(yīng)于V中的N個(gè)節(jié)點(diǎn).每個(gè)節(jié)點(diǎn)記錄了地塊的交通流量.
針對(duì)城市的復(fù)雜交通流,文中提出了MFGC-STGCN模型進(jìn)行交通流預(yù)測(cè)任務(wù).此模型從時(shí)間和空間兩個(gè)維度提取交通流的時(shí)空特征,從而提高預(yù)測(cè)精度.MFGC-STGCN模型結(jié)構(gòu)見(jiàn)圖1.模型由兩個(gè)模塊組成,一個(gè)是構(gòu)建加權(quán)鄰接矩陣的模塊,一個(gè)是圖卷積網(wǎng)絡(luò)模塊.利用交通數(shù)據(jù)計(jì)算節(jié)點(diǎn)之間的關(guān)聯(lián),得到圖的加權(quán)鄰接矩陣A,并將其作為空間卷積層的輸入.空間卷積層基于GCN提取空間特征,時(shí)間卷積層基于門控線性單元(gated linear units, GLU)提取時(shí)間特征.其間還通過(guò)一維卷積層再次提取時(shí)間特征,在時(shí)間軸上進(jìn)行降維.
圖1 MFGC-STGCN結(jié)構(gòu)框架
(1)
w2×Pearson(Oi,Oj)
(2)
(3)
設(shè)w1=w2=0.5.
(4)
時(shí)間卷積層使用GLU提取城市交通流的時(shí)間動(dòng)態(tài)特征.模型共有兩個(gè)時(shí)間卷積層,以第一個(gè)為例,結(jié)構(gòu)見(jiàn)圖2.Xl∈RN×H×Cin為第一個(gè)時(shí)間卷積層的輸入;Cin為輸入通道數(shù),第一個(gè)時(shí)間卷積層的Cin=1.Xl+1∈RN×(H-Kt1+1)×Cout為第一個(gè)時(shí)間卷積層的輸出,也是空間卷積層的輸入;Cout為輸出通道數(shù).對(duì)Xl進(jìn)行一維卷積,卷積核Γ∈RKt1×Cin×2Cout,得到輸出Xl′∈RN×(H-Kt1+1)×2Cout.將Xl′分為相同大小的兩部分,一部分使用殘差連接,另一部分使用sigmoid函數(shù)進(jìn)行激活.然后計(jì)算兩部分輸出的Hadamard乘積,從而得到第一個(gè)時(shí)間卷積層最終的輸出Xl+1.
圖2 時(shí)間卷積層結(jié)構(gòu)
第二個(gè)時(shí)間卷積層的輸入為Xl+3∈RN×(H-Kt1-Kc+2)×Cin,輸出為Xl+4∈RN×(H-Kt1-Kc-Kt2+3)×Cout.Kc為一維卷積層的卷積核寬度,Kt2為第二個(gè)時(shí)間卷積層的卷積核寬度,H-Kt1-Kc-Kt2+3=1.
gθ*Gx=UgθUTx
(5)
式中:卷積核gθ=diag(θ),參數(shù)θ∈RN;*G為圖卷積操作;UTx為信號(hào)x的圖傅里葉變換.
當(dāng)圖規(guī)模較大時(shí),對(duì)L進(jìn)行特征分解的計(jì)算量大,因此引入切比雪夫多項(xiàng)式.
(6)
空間卷積層在第一個(gè)時(shí)間卷積層之后,首先將第一個(gè)時(shí)間卷積層的輸出Xl+1和鄰接矩陣A輸入至空間卷積層.空間卷積層的輸入為Xl+1∈RN×(H-Kt1+1)×Cin,其中Cin為空間卷積層的輸入通道數(shù),也等于第一個(gè)時(shí)間卷積層的輸出通道數(shù).空間卷積層同樣采用了殘差連接.將輸入Xl+1經(jīng)過(guò)切比雪夫圖卷積得到的結(jié)果與輸入Xl+1相加,然后經(jīng)過(guò)ReLU激活函數(shù),得到輸出Xl+2∈RN×(H-Kt1+1)×Cout.
一維卷積層在空間卷積層之后.它再次提取時(shí)間特征,對(duì)數(shù)據(jù)在時(shí)間軸上進(jìn)行降維.一維卷積層的輸入經(jīng)過(guò)卷積核寬度為Kc的卷積操作,時(shí)間步由H-Kt1+1變?yōu)镠-Kt1-Kc+2.最后使用Dropout正則化防止過(guò)擬合.Dropout正則化是深度學(xué)習(xí)領(lǐng)域最受歡迎的正則化技術(shù),它會(huì)在迭代過(guò)程中以一定的概率隨機(jī)選擇神經(jīng)元使其失活,從而降低神經(jīng)元之間的依賴性.
使用2018年3月石家莊二環(huán)范圍的網(wǎng)約車OD數(shù)據(jù)作為數(shù)據(jù)集.在對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理后,每一條記錄包括上車位置和下車位置(經(jīng)度和緯度)、上車時(shí)間和下車時(shí)間6個(gè)字段.將研究區(qū)域柵格化為340個(gè)地塊,以15 min為時(shí)間間隔,地塊流量定義為地塊內(nèi)上車量與下車量之和.選取歷史數(shù)據(jù)的前70%作為訓(xùn)練集,其余為驗(yàn)證集和測(cè)試集.此外,對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了z-score歸一化.
MFGC-STGCN模型除第一層的輸入通道數(shù)和最后一層的輸出通道數(shù)為1,其余通道數(shù)均設(shè)置為64.σ設(shè)置為0.3,H設(shè)置為12,K、Kt1、Kc均設(shè)置為3,Kt2設(shè)置為8.模型訓(xùn)練的批次大小為32,優(yōu)化器為AdamW.學(xué)習(xí)率初始值為0.001,并隨著訓(xùn)練過(guò)程不斷衰減.
使用平均絕對(duì)誤差(mean absolute error, MAE)和均方根誤差(root mean square error, RMSE)評(píng)價(jià)模型性能.兩個(gè)指標(biāo)為
(7)
(8)
將文中的模型MFGC-STGCN與HA、FNN、LSTM、GRU、STGCN等模型進(jìn)行對(duì)比,見(jiàn)表1.由表1可知:MFGC-STGCN在所有模型中表現(xiàn)出最佳的預(yù)測(cè)效果.傳統(tǒng)的統(tǒng)計(jì)分析模型HA由于無(wú)法分析復(fù)雜的交通數(shù)據(jù),預(yù)測(cè)效果最差.基于深度學(xué)習(xí)方法的模型預(yù)測(cè)結(jié)果均優(yōu)于HA.結(jié)合了GCN的STGCN和MFGC-STGCN優(yōu)于深度學(xué)習(xí)模型.其中MFGC-STGCN的MAE較STGCN降低了0.223,RMSE降低了0.309.
表1 不同模型預(yù)測(cè)性能對(duì)比
選取五個(gè)流量較大的地塊,對(duì)它們不同時(shí)間段平均流量的預(yù)測(cè)結(jié)果進(jìn)行可視化,見(jiàn)圖3.由圖3可知:MFGC-STGCN和STGCN模型的擬合程度較好.其中,文中算法MFGC-STGCN的擬合效果最好,預(yù)測(cè)值和真實(shí)值誤差最小.LSTM、GRU、FNN的擬合效果相對(duì)較差.特別是FNN,在流量較低的時(shí)間段,預(yù)測(cè)值普遍比真實(shí)值偏高,在流量較高的時(shí)間段,預(yù)測(cè)值普遍比真實(shí)值偏低.
圖3 不同模型預(yù)測(cè)效果可視化
圖4為MFGC-STGCN和STGCN模型的預(yù)測(cè)誤差.預(yù)測(cè)誤差指在對(duì)應(yīng)時(shí)間點(diǎn)所有地塊預(yù)測(cè)值與真實(shí)值的絕對(duì)誤差之和,文中對(duì)縱軸進(jìn)行了歸一化.由圖4可知:在絕大部分時(shí)間點(diǎn)中,MFGC-STGCN的誤差明顯小于STGCN.圖5為隨著訓(xùn)練輪次增加,測(cè)試集MAE的變化曲線.MFGC-STGCN和STGCN的MAE初始值接近,但相比之下MFGC-STGCN的收斂速度更快.在40~100輪次,MFGC-STGCN的MAE下降迅速.所有試驗(yàn)在Windows操作系統(tǒng)(Intel(R) Core(TM) i5-6500 CPU @ 3.20 GHz)上運(yùn)行.與STGCN相比MFGC-STGCN訓(xùn)練速度更快,MFGC-STGCN訓(xùn)練1個(gè)epoch大約需要51 s,STGCN訓(xùn)練1個(gè)epoch大約需要95 s.
圖4 不同模型的預(yù)測(cè)誤差可視化
圖5 測(cè)試集MAE隨訓(xùn)練輪次的變化
文中提出的MFGC-STGCN模型可以有效的挖掘交通數(shù)據(jù)的時(shí)空信息,MFGC-STGCN模型從時(shí)間和空間兩個(gè)維度提取交通流的特征,預(yù)測(cè)效果明顯優(yōu)于僅提取時(shí)間特征的經(jīng)典模型.同時(shí),MFGC-STGCN模型與同樣提取交通流時(shí)空特征的STGCN模型相比,使用的參數(shù)數(shù)量更少,訓(xùn)練速度更快,預(yù)測(cè)準(zhǔn)確率更高.但在現(xiàn)實(shí)生活中,天氣情況、社會(huì)事件等外部因素對(duì)交通流量具有一定的影響.后續(xù)研究將MFGC-STGCN模型融合一些外部因素,進(jìn)一步提高預(yù)測(cè)精度.