榮 斌,武志昊,劉曉輝,趙苡積,林友芳,景一真
(1.北京交通大學(xué) a.計(jì)算機(jī)與信息技術(shù)學(xué)院; b.交通數(shù)據(jù)分析與挖掘北京市重點(diǎn)實(shí)驗(yàn)室,北京 100044;2.中國民用航空局民航旅客服務(wù)智能化應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100105)
隨著智能交通系統(tǒng)的快速發(fā)展,交通流量預(yù)測問題受到人們和科研機(jī)構(gòu)的廣泛關(guān)注,交通流量的準(zhǔn)確預(yù)測能為智能交通系統(tǒng)提供信息支撐與決策支持。由于生活中存在多種交通站點(diǎn),如城市地鐵站、高速公路收費(fèi)站和民航機(jī)場,因此站點(diǎn)擁堵狀況與整個交通網(wǎng)絡(luò)正常運(yùn)轉(zhuǎn)關(guān)系密切,如果能對站點(diǎn)的出入流量進(jìn)行有效預(yù)測,則有利于提高交通網(wǎng)絡(luò)的運(yùn)行效率,減少安全隱患,便于旅客合理安排出行,對智能交通系統(tǒng)的發(fā)展具有重大意義。
近年來,大量學(xué)者針對交通流量預(yù)測問題進(jìn)行相關(guān)研究,根據(jù)研究方法可將其分為三大類,分別為經(jīng)典時間序列預(yù)測方法、傳統(tǒng)機(jī)器學(xué)習(xí)方法以及深度學(xué)習(xí)方法。早期流量預(yù)測模型以經(jīng)典序列預(yù)測方法為主,如歷史均值法、向量自回歸模型、自回歸積分滑動平均模型(Autoregressive Integrated Moving Average Model,ARIMA)[1]及其變體模型。之后,學(xué)者使用傳統(tǒng)機(jī)器學(xué)習(xí)方法來預(yù)測交通流量,主要通過構(gòu)建集成模型,如文獻(xiàn)[2]將經(jīng)驗(yàn)?zāi)J椒纸馀cBP神經(jīng)網(wǎng)絡(luò)相結(jié)合,文獻(xiàn)[3]提出小波支持向量機(jī)(Wavelet-SVM),這2種模型均用于地鐵站人流量預(yù)測;文獻(xiàn)[4]將GBDT模型用于收費(fèi)站的短時交通流量預(yù)測。隨著深度學(xué)習(xí)在計(jì)算機(jī)視覺、語音文本處理等任務(wù)中不斷取得突破[5],開始有學(xué)者將深度學(xué)習(xí)技術(shù)應(yīng)用于交通流量預(yù)測任務(wù)。文獻(xiàn)[6-7]將RNN類時序預(yù)測模型及其變體模型用于交通流量預(yù)測。文獻(xiàn)[8]將RNN類模型與傳統(tǒng)機(jī)器學(xué)習(xí)方法相結(jié)合進(jìn)行流量預(yù)測。文獻(xiàn)[9]將城市區(qū)域劃分成等大小的網(wǎng)格,設(shè)計(jì)基于殘差單元的ST-ResNet模型用于預(yù)測各區(qū)域的人流量。文獻(xiàn)[10]在此基礎(chǔ)上引入LSTM單元對模型進(jìn)行改進(jìn),但此類模型只適用于網(wǎng)格狀數(shù)據(jù)。
為解決傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)在圖數(shù)據(jù)上的局限性,圖卷積技術(shù)應(yīng)運(yùn)而生。文獻(xiàn)[11]使用圖卷積與門控卷積捕捉高速公路上各路段車速的時空依賴性。文獻(xiàn)[12]認(rèn)為捕獲空間特征的圖結(jié)構(gòu)是隨著實(shí)際路況動態(tài)變化的,從而基于動態(tài)圖卷積思想對文獻(xiàn)[11]方法進(jìn)行改進(jìn)。文獻(xiàn)[13]通過建模待預(yù)測流量與近期流量、日周期流量以及周周期流量之間的關(guān)系,并采用時空注意力機(jī)制捕獲結(jié)點(diǎn)交通流量之間的時空相關(guān)性。文獻(xiàn)[14]利用多圖卷積網(wǎng)絡(luò)預(yù)測共享單車的租賃流量。還有學(xué)者將圖卷積應(yīng)用于其他時空數(shù)據(jù)挖掘任務(wù),如文獻(xiàn)[15]結(jié)合城市設(shè)施與信息點(diǎn)(Point of Information,POI)將城市區(qū)域作為結(jié)點(diǎn)構(gòu)建多張圖,提出STMGCN模型預(yù)測短期內(nèi)各區(qū)域的出租車需求量。
交通站點(diǎn)流量受地理位置、時間、交通狀況等多種因素影響,具有復(fù)雜的非線性。對于不同站點(diǎn),低階相鄰站點(diǎn)之間與高階相鄰站點(diǎn)之間的交通狀況均會互相影響;對于相同站點(diǎn),歷史交通狀況與未來交通狀況密切相關(guān),因此準(zhǔn)確地預(yù)測站點(diǎn)出入流量需要充分考慮站點(diǎn)之間的時空相關(guān)性,而現(xiàn)有模型在解決該問題時均存在一些不足:如經(jīng)典序列預(yù)測方法主要通過從交通流量序列中挖掘出時間維度上的規(guī)律進(jìn)行預(yù)測,一般要求時間序列具有一定的周期性或規(guī)律性,因此預(yù)測效果不理想;常用的傳統(tǒng)機(jī)器學(xué)習(xí)方法[2-3]與RNN類時序預(yù)測模型[6-7]僅考慮了序列的時間維特征,未考慮流量序列之間的空間相關(guān)性;STGCN[11]在捕獲空間特征之前,未考慮其他歷史周期片段與預(yù)測時段的相關(guān)性,并在模型中對時間維進(jìn)行逐步降維,導(dǎo)致時空特征表示不充分;ASTGCN[13]只考慮了結(jié)點(diǎn)間的低階相鄰關(guān)系,難以直接捕獲高階相鄰結(jié)點(diǎn)之間的空間關(guān)系,且忽略了不同歷史周期片段之間的相關(guān)性;STMGCN[15]難以充分捕獲不同時間區(qū)間結(jié)點(diǎn)之間的時空關(guān)系,對于長期預(yù)測,結(jié)點(diǎn)的時空特征學(xué)習(xí)能力不足。
本文從空間維度與時間維度兩個角度出發(fā),提出一種基于上下文門控的時空多圖卷積網(wǎng)絡(luò)(Contextual Gated Spatio-Temporal Multi-Graph Convolutional Network,CG-STMGCN)模型,其能夠基于站點(diǎn)間的相鄰關(guān)系與流通流量關(guān)系捕獲站點(diǎn)流量之間的時空相關(guān)性。




定義5(連續(xù)出入網(wǎng)絡(luò)記錄組) 二元組Tio(Tk,Tk+1)表示某個體連續(xù)進(jìn)出一次網(wǎng)絡(luò)產(chǎn)生的記錄組,其中,Tk.κ=in,Tk+1.κ=out,Tk.p=Tk+1.p,Tk.τ 定義6(站點(diǎn)出入流量)t=[tstart,tend)表示某個時間區(qū)間,Δt=tstart-tend表示區(qū)間長度,則在時間區(qū)間t內(nèi),站點(diǎn)v上產(chǎn)生的進(jìn)出流量分別為: (1) (2) (3) 目前,實(shí)現(xiàn)圖卷積的主要方法為:1)將結(jié)點(diǎn)重新組合排列成網(wǎng)格形狀,再使用傳統(tǒng)卷積進(jìn)行處理[16],屬于空間類方法;2)譜圖卷積,即在譜域?qū)D信號進(jìn)行卷積操作[17]。本文使用譜圖卷積實(shí)現(xiàn)圖卷積。 (4) (5) 本文提出的CG-STMGCN模型架構(gòu)如圖1所示。首先,根據(jù)站點(diǎn)之間的不同關(guān)系構(gòu)造鄰居圖與流通流量圖。然后,分別在鄰居圖與流通流量圖上構(gòu)建時空卷積組件,兩個組件架構(gòu)相同,均由多個基于上下文門控的時空卷積模塊串行組成。之后,通過全連接層將最后一個時空卷積模塊的輸出映射為待預(yù)測時段的流量值,最終使用哈達(dá)瑪乘積將兩張鄰居圖上的預(yù)測結(jié)果進(jìn)行融合作為最終的預(yù)測結(jié)果。為優(yōu)化學(xué)習(xí)效率,本文在每個基于上下文門控的時空模塊中使用殘差學(xué)習(xí)框架。 圖1 CG-STMGCN模型架構(gòu) (6) 其中,Th=Tr+Td+Tw。模型輸入拼接示意圖如圖2所示。 圖2 模型輸入拼接示意圖 在現(xiàn)實(shí)生活中,當(dāng)某個交通站點(diǎn)的出入口出現(xiàn)擁堵時,人們可能會選擇該交通站點(diǎn)附近的站點(diǎn)出行,因此相鄰站點(diǎn)的流量之間存在相關(guān)性。在整個交通網(wǎng)絡(luò)中,各結(jié)點(diǎn)流出流量的源頭來自其他若干個站點(diǎn)的流入流量,因此有流通流量的站點(diǎn)之間存在流量依賴性。為分別捕獲相鄰站點(diǎn)之間的鄰近相關(guān)性與流量依賴性,本文分別構(gòu)造鄰居圖與流通流量圖。 2.1.1 鄰居圖 (7) 2.1.2 流通流量圖 (8) (9) (10) (11) (12) (13) (14) 其中,avg(Ftf)表示在時間區(qū)間tf內(nèi)站點(diǎn)之間的平均流通流量,式(13)為歸一化操作,AF,ij∈[0,1]。 本文在每張圖上構(gòu)建多個基于上下文門控的時空卷積模塊用于捕獲站點(diǎn)流量的時空特征。由于模型輸入中包含待預(yù)測時段不同周期的時間區(qū)間觀測值,因此本文首先使用上下文門控單元建模各個時間區(qū)間對待預(yù)測時段的重要程度,然后使用圖卷積單元分別捕獲站點(diǎn)流量之間的相關(guān)性與依賴性,此時各結(jié)點(diǎn)的特征中已經(jīng)包含對應(yīng)圖上相鄰結(jié)點(diǎn)的信息,最后使用時間維的卷積單元在時間維度進(jìn)行卷積,從而有效捕獲站點(diǎn)流量的時空特征。 2.2.1 上下文門控單元 本文使用若干個歷史區(qū)間觀測值預(yù)測未來若干個時間區(qū)間的流量值,直觀上不同時間區(qū)間的觀測值對待預(yù)測時段的影響程度不同。受通道注意力機(jī)制[19-20]與STMGCN模型[15]的啟發(fā),首先,本文使用上下文門控單元來建模歷史觀測值中各時間區(qū)間觀測值對待預(yù)測時段的重要程度。 (15) t=1,2,…,Ti (16) s=σ(W2δ(W1z)) (17) 其中,W1與W2是參數(shù)矩陣,σ表示激活函數(shù)ReLU,δ表示激活函數(shù)sigmoid。 2.2.2 圖卷積單元 2.2.3 時間維卷積單元 經(jīng)過上下文門控單元與圖卷積單元后,每個結(jié)點(diǎn)的特征信息中已經(jīng)包含對應(yīng)圖上相鄰結(jié)點(diǎn)的特征信息,因此使用時間維卷積單元不僅能提取各結(jié)點(diǎn)在時間維度上的特征信息,而且能融合其他關(guān)聯(lián)結(jié)點(diǎn)的特征信息,并且由于模型將待預(yù)測時段的近期片段、日周期片段、周周期片段按照時間順序進(jìn)行拼接,時間維卷積單元能夠獲取到不同周期片段之間的相關(guān)性。因此,時間維卷積單元能有效獲取站點(diǎn)流量的時空特征。一個結(jié)點(diǎn)的時間維卷積示意圖如圖3所示。 圖3 時間維卷積示意圖 (18) (19) 其中,⊙表示哈達(dá)瑪乘積,WN與WF為待學(xué)習(xí)的參數(shù)張量。 本文在兩個交通站點(diǎn)出入流量數(shù)據(jù)集上對模型進(jìn)行實(shí)驗(yàn)。第一個數(shù)據(jù)集是杭州市地鐵網(wǎng)絡(luò)80個地鐵站在2019年1月1日至2019年1月26日的出入人流量數(shù)據(jù),使用前一周的數(shù)據(jù)構(gòu)造流通流量圖,將2019年1月1日至2019年1月20日的數(shù)據(jù)作為訓(xùn)練集,2019年1月21日至2019年1月23日的數(shù)據(jù)作為驗(yàn)證集,2019年1月24日至2019年1月26日的數(shù)據(jù)作為測試集。第二個交通站點(diǎn)數(shù)據(jù)是某地區(qū)高速公路網(wǎng)絡(luò)426個收費(fèi)站在2018年6月30日至2018年8月27日的出入車流量數(shù)據(jù)。本文使用前一周的數(shù)據(jù)構(gòu)造流通流量圖,將2018年6月30日至2018年8月15日的數(shù)據(jù)作為驗(yàn)證集,2018年8月16日至2018年8月21日的數(shù)據(jù)作為驗(yàn)證集,2018年8月22日至2018年8月27日的數(shù)據(jù)作為測試集。 本文將CG-STMGCN模型與8種預(yù)測方法的實(shí)驗(yàn)結(jié)果進(jìn)行比較,具體為:1)歷史相鄰均值法(HA);2)歷史周期均值法(PreHA),即將待預(yù)測時段的前n天相同時間段的均值作為預(yù)測值;3)ARIMA模型;4)長短期記憶網(wǎng)絡(luò)(LSTM)模型;5)門控循環(huán)單元網(wǎng)絡(luò)(GRU)模型;6)STGCN模型[11];7)STMGCN模型[15];8)ASTGCN模型[13]。 本文采用均方根誤差(Root Mean Square Error,RMSE)與平均絕對誤差(Mean Absolute Error,MAE)作為實(shí)驗(yàn)結(jié)果的評價指標(biāo),計(jì)算方法如式(20)、式(21)所示: (20) (21) 其中,xi表示實(shí)際值,x′i表示預(yù)測值,n表示預(yù)測值的個數(shù)。 在計(jì)算站點(diǎn)出入流量時,對地鐵站數(shù)據(jù)集的時間區(qū)間長度取5 min,高速公路收費(fèi)站數(shù)據(jù)集的時間區(qū)間長度取10 min。本文使用MXNet實(shí)現(xiàn)CG-STMGCN模型,在上下文門控單元中圖卷積對應(yīng)的K′取2,對圖卷積層中對應(yīng)的K取1、2、3,最佳實(shí)驗(yàn)結(jié)果對應(yīng)K=2,圖卷積層中的卷積核個數(shù)取64,時間維的二維卷積核大小取3。在訓(xùn)練過程中,初始學(xué)習(xí)率取1e-3,訓(xùn)練輪次為100,使用驗(yàn)證集早停策略避免過擬合,批次大小取32,優(yōu)化器選擇Adam。本文分別選取待預(yù)測時段的3個近期片段、1個日周期片段以及1個周周期片段在時間維度上按照時間先后順序進(jìn)行拼接并將其作為模型輸入,預(yù)測步長取12,實(shí)驗(yàn)結(jié)果如表1所示。 表1 交通站點(diǎn)流量預(yù)測實(shí)驗(yàn)結(jié)果 Table 1 Experimental results of flow prediction for traffic stations 方法與模型地鐵站數(shù)據(jù)集高速公路收費(fèi)站數(shù)據(jù)集RMSEMAERMSEMAEHA方法44.5221.0019.8810.29PreHA方法38.6617.6415.577.90ARIMA模型45.4219.0918.378.85LSTM模型32.8418.3418.358.72GRU模型30.5716.5316.347.09STGCN模型25.1012.6112.046.27STMGCN模型22.0611.3910.395.56ASTGCN模型20.8010.8110.135.37CG-STMGCN模型19.3010.049.365.15 由表1可知,本文CG-STMGCN模型在RMSE與MAE這兩種評價指標(biāo)上較其他方法均取得了最優(yōu)效果,深度學(xué)習(xí)類方法較傳統(tǒng)時間序列預(yù)測方法普遍能夠取得更好的預(yù)測效果,考慮時空相關(guān)性的深度學(xué)習(xí)模型比僅考慮時間維度相關(guān)性的深度學(xué)習(xí)模型能取得更好的預(yù)測效果。 另外,本文針對不同的預(yù)測步長,分別使用以上方法進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖4、圖5所示。可以看出,當(dāng)預(yù)測步長較短時,CG-STMGCN模型能取得良好的預(yù)測效果,雖然STMGCN模型在短期預(yù)測時也能取得不錯的預(yù)測效果,但是隨著預(yù)測步長的增加,預(yù)測難度越來越大,STMGCN模型與其他方法的預(yù)測誤差開始呈現(xiàn)上升趨勢,但是CG-STMGCN模型的預(yù)測誤差較其他方法上升更加緩慢,且仍能取得最好的預(yù)測準(zhǔn)確性,證明了CG-STMGCN模型的有效性與穩(wěn)定性。 圖4 交通站點(diǎn)流量預(yù)測方法在地鐵站數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果 Fig.4 Experimental results of flow prediction methods for traffic stations on subway stations dataset 圖5 交通站點(diǎn)流量預(yù)測方法在高速公路收費(fèi)站數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果 本文將已有的單圖時空卷積模型進(jìn)行擴(kuò)展,分別在鄰居圖與流通流量圖上構(gòu)建單圖時空卷積模型,使用哈達(dá)瑪乘積將兩張圖上的輸出結(jié)果進(jìn)行融合,將ASTGCN擴(kuò)展為ASTGCN-MG,STGCN擴(kuò)展為STGCN-MG,并在地鐵站數(shù)據(jù)集上分別取預(yù)測步長為3、6、9、12進(jìn)行實(shí)驗(yàn),結(jié)果如表2所示。由實(shí)驗(yàn)結(jié)果可知,ASTGCN-MG模型的預(yù)測效果優(yōu)于ASTGCN模型,STGCN-MG模型模型的預(yù)測準(zhǔn)確性優(yōu)于STGCN模型,證明了多圖的有效性。由于CG-STMGCN模型結(jié)合站點(diǎn)上下文注意力機(jī)制對多周期時間區(qū)間的重要程度進(jìn)行建模,然后進(jìn)行圖卷積與時間維卷積,能夠充分捕獲站點(diǎn)流量的時空特征,因此取得了最好的預(yù)測效果。 表2 基于時空多圖卷積網(wǎng)絡(luò)模型的交通站點(diǎn)流量預(yù)測實(shí)驗(yàn)結(jié)果 Table 2 Experimental results of flow prediction for traffic stations based on spatio-temporal multi-graph convolutional network model 模型預(yù)測步長為3預(yù)測步長為6預(yù)測步長為9預(yù)測步長為12RMSEMAERMSEMAERMSEMAERMSEMAESTGCN模型20.1910.4821.8411.2023.4311.8925.1012.61STGCN-MG模型19.8310.2721.1010.8022.0811.2623.0011.71ASTGCN模型19.6310.2820.0510.3820.6710.6720.8010.81ASTGCN-MG模型19.3310.0619.9410.2520.1210.5520.3810.63CG-STMGCN模型18.349.6119.319.9919.5210.2419.3010.04 本文針對交通站點(diǎn)流量預(yù)測問題提出一種基于上下文門控的時空多圖卷積網(wǎng)絡(luò)(CG-STMGCN)模型。根據(jù)站點(diǎn)流量間存在的兩種空間關(guān)系,分別構(gòu)造鄰居圖與流通流量圖用于表示站點(diǎn)流量之間的相關(guān)性與依賴性,使用上下文門控單元、圖卷積單元與時間維的標(biāo)準(zhǔn)卷積單元捕獲交通站點(diǎn)流量的時空特征,解決了現(xiàn)有交通站點(diǎn)流量預(yù)測方法時空特征捕獲不足的問題,并在兩種真實(shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果證明了該模型具有良好的預(yù)測效果。后續(xù)將通過增加卷積動態(tài)圖來優(yōu)化CG-STMGCN模型架構(gòu),進(jìn)一步提升預(yù)測能力并擴(kuò)大其應(yīng)用范圍。

1.2 圖卷積




2 模型架構(gòu)




2.1 多圖構(gòu)造



2.2 基于上下文門控的時空卷積模塊







2.3 時空多圖卷積融合

3 實(shí)驗(yàn)結(jié)果與分析
3.1 數(shù)據(jù)集
3.2 對比方法與評價指標(biāo)
3.3 實(shí)驗(yàn)參數(shù)與結(jié)果分析




4 結(jié)束語