孫秀芳,李建波,呂志強,董傳浩
(青島大學計算機科學技術學院,山東青島 266071)
隨著我國經濟的快速發展和現代化進程的加快,交通需求不斷增大,交通負荷愈發嚴重,從而導致交通擁堵、安全事故以及交通資源分配不足等問題不斷加劇。交通擁堵不僅造成環境污染,還增加了能源消耗,給城市的可持續發展和居民的生活帶來較大的負面影響。隨著對交通問題研究的深入,交通對策的設計必須逐步從以設施供給為主的硬對策轉向設施供給與需求管理相結合的軟硬協同方法。為此,智能交通系統(Intelligent Traffic System,ITS)[1-3]應運而生。ITS 能通過檢測當前交通狀況以預測未來一段時間的交通情況,從而規劃交通出行方式,為交通路徑的選擇給出參考策略,最終實現智能出行。ITS 能夠有效改善和緩解交通問題,并為城市規劃建設提供參考。交通預測是交通管理和控制部門采取交通誘導措施的主要依據,因此,交通預測模型的研究成為近年來數據挖掘領域的重點[4]。
根據預測目標的不同,交通預測可以分為車流量預測、車輛速度預測、車道占用率預測等。由于交通數據受到天氣狀況、突發狀況等多種因素的影響,因此交通數據是高度非線性的。車道占用率和車輛交通流在一定條件下可以互相表示、互相替代。交通預測經過長時間的發展,目前已取得豐碩的研究成果,當前主流交通預測是采用典型的統計學方法和深度學習方法[5]。基于統計學的線性理論模型有歷史平均方法(HA)[6-7]、時間序列方法、卡爾曼濾波方法[8-9]等。自回歸移動平均模型(ARIMA)[10-12]以及該模型的變形均基于傳統統計學方法進行時序預測,此類模型是線性模型,線性模型結構簡單,計算比較方便,但是對于具有很強隨機性和不確定性的非線性交通數據而言,該類模型需要時序平穩分布,受時序波動的影響較大,抗干擾能力低,因此,預測結果不夠精準。
為了捕捉交通數據的非線性,研究人員又提出基于小波的理論模型[13]、混沌理論模型、非參數回歸模型[14]等非線性預測模型。非線性預測模型主要以非線性系統理論為基礎,利用混沌理論、分型概念等方法建立預測模型,理論上而言,混沌理論對于交通這種非線性數據具有很好的適應能力,但是,在實際中即使能充分地適應交通數據的非線性,這類方法仍存在不足,它們具有非常龐大的滿足“臨近”匹配和“臨近”查找的復雜性。隨著深度學習的發展,越來越多的研究人員采用深度學習方法進行交通預測,如K 近鄰(KNN)[15]、支持向量機(SVM)[16]、神經網絡等,它們取得了更高的精確度,從而可以對更復雜的數據進行建模。
文獻[17]提出基于深度信念網絡(DBN)的快速學習算法,該算法通過非監督的貪婪預訓練方法來獲取模型的權重參數,通過多層的表征學習得到更能涵蓋數據特征的表征,并且逐層訓練的方式降低了深度神經網絡的訓練難度。但是該算法很難在全連接的方式下提取時間和空間特征,并且由于對空間屬性的嚴格限制,該算法的表示能力受限嚴重。
為表現交通流受空間特征影響的特性,研究人員將卷積神經網絡引入到交通預測模型中,以捕獲交通流中的空間特征。一些學者使用卷積神經網絡來捕獲網絡中的臨近信息,并且在時間軸上部署神經網絡結構。文獻[18]提出卷積LSTM,其為帶有嵌入卷積層的全連接LSTM 的擴展,雖然卷積LSTM 能夠提取時間和空間特征,但是其采用了常規的卷積,只能應用于常規的網狀結構,而不能對有圖結構特性的路網進行處理,此外,基于循環網絡的模型計算量大,在計算過程中容易使得誤差增大從而難以訓練。文獻[19]提出融合時間和空間特征的STGCN 模型,該模型利用圖卷積捕獲交通流的時間和空間特征,但是沒有考慮其他因素對交通流的影響。
上述研究通常側重于對流量和速度這2 個交通指標進行預測,雖然是對車流量進行預測,但往往忽略了當前車道占用率。不同的道路對車輛的承載數不同,即使同一時段有相同數量的車輛,但是不同的道路所出現的路況將不同,車道數少的道路可能會出現擁堵的情況,因此,對車道占用率進行研究非常有必要。準確預測車道占用率不僅能夠分析當前道路未來一段時間是否擁堵,還能為城市道路建設提供參考。
因為車道占用率數據獲取難度較高,所以利用車道占用率對車流量進行預測的相關研究尚處于起步階段[20-21]。文獻[22]研究防撞系統中交通參與者的車道占用率,文獻[23]將膠囊網絡和卷積神經網絡相結合,提出一種混合的車道占用率預測模型2LayersCapsNet,文獻[24]提出擴散卷積遞歸神經網絡(DCRNN)模型以對速度進行預測,文獻[25]提出圖多注意網絡模型(GMAN)以預測車流量。但是,以上方法僅考慮時空相關性,沒有考慮其他因素對車道占用率的影響。針對該問題,本文提出一種多組件融合的車道占用率預測模型MCFDGCN,該模型不僅考慮時間和空間特征對車道占用率的影響,還引入車流量和車輛速度這2 個隱式因素,在融合多種特征后對車道占用率進行預測。
車道占用率預測實質上是融合多種影響因素的時序預測問題,將車道占用率作為預測指標,利用歷史時間的車道占用率預測未來一段時間的車道占用率。如圖1 所示,車道占用率問題就是用N個節點前h個時間段的交通信息(包括車輛數量、車輛速度、各個節點的時空信息、車道占用率等信息),以預測未來p+1 個時間段的車道占用率狀況。具體到特定的點,就是使用車道占用率的時間序列Oh=[ot-h,ot-h+1,ot-h+2,…,ot-1]預測未來時間序列O′h=[ot,ot+1,ot+2,…,ot+p]。

圖1 時序預測示意圖Fig.1 Schematic diagram of time series prediction
車道占用率是指車道的使用占比,具體表現為某個特定區域的特定時間內,車輛真實使用的道路量與該區域中道路總量的比值。車道占用率是衡量道路資源是否被充分利用的重要衡量指標,其主要有2 種表現形式:空間占用率和時間占用率。空間占用率計算是通過空間測量法而得出,即車道當前單位面積中所有車輛所占面積總和的比重。由于車輛行駛需要有安全距離且面積計算具有復雜性,為了方便數據的采集和計算處理,通常采用某個時間段內通過一段車道上車輛長度的總和與該段車道的總長度之比作為空間占用率。車輛車道空間占用率OS計算公式如下:

其中:RL是車道總長度;RLi是當前時間戳在這段車道上第i輛車的車輛長度。
車輛車道時間占用率OT是通過時間測量法計算而得出,表示為車道上的監測站在特定時間間隔內所觀測的車輛通行占用時間的比重:

其中:TL是設定的時間段;TLi是第i輛車通過監測站時所花費的時間,車輛所花費的時間總和與總時間的比例即為車道的時間占用率。
車道占用率是根據不同標準定義的,但是時間和空間2 種定義標準下的占用率都能反映當前時間車道的占用率情況。下文所提及的車道占用率均指車道的時間占用率。
交通狀況受到時間方面的影響主要體現在歷史時間上,歷史時間的交通狀況會對后續時間的交通狀況產生重要影響。由于交通流的連貫性,交通狀況也會受到周邊情況的影響,道路的交通狀況不僅與當前路口相關,還和與之相連的道路的交通狀況密切相關。如圖2 所示,將同一時間段節點的交通信息表現在一張平面圖中,節點之間的線段表示其連通性,從圖中的道路擁堵情況以及變化情況可以看出,交通狀況不僅受時間還受空間因素的影響,因此,交通信息的時空相關性對交通狀況的影響是明確的。

圖2 交通時空特性示意圖Fig.2 Schematic diagram of traffic spatio-temporal characteristic
從圖3 可以看出,道路上的每個監測站不是獨立存在的,監測站采集到的交通數據節點也不是獨立的,節點之間兩兩相互連接構成網狀結構,即路網。將節點信息以圖的形式定義在路網中,能方便模型利用圖卷積提取特征。節點的合集J可以被呈現在無向圖中,無向圖定義為G=(J,E,W),節點j1就可以定義為圖G中權重為W1i的一個信號,J表示頂點的有限集,頂點的個數就是本文選取的監測站個數,E表示頂點之間相互連通的邊εi的集合,W表示權重的鄰接矩陣。

圖3 路網結構Fig.3 Road network structure
路網上的節點相互連接,本文將路網上的包含交通信息的節點在無向圖上進行建模,由于傳統網格上的標準卷積不能應用于廣義圖,因此本文采用圖卷積的方法對廣義圖上的交通信息特征進行提取。文獻[26]提出的圖卷積普遍應用于計算機視覺領域,在對圖數據進行處理時表現卓越。單個節點的數據不能代表該節點全部的交通信息,如果只考慮單個節點而不考慮節點之間的連接關系,容易造成特征偏差,因此,考慮鄰居節點的信息比考慮單個節點信息所得到的單一特征更完整,圖卷積是一個較好的解決方案。本文將節點定義到圖中,充分地將節點之間相互連接的特征保留,進而提取鄰近節點的相關信息。
車道占用率與通行車輛速度、當前道路的車流量有著密不可分的關系,三者互相影響。
車道占用率和車輛速度的關系如圖4 所示。車輛速度快可以提高道路占用率,但過高的車道占用率會使得車道接近飽和,從而影響車輛的速度,使車輛通行變慢,車速降低。由圖4 可以看出,18%的車道占用率為一個分界點,在車道占用率小于18%時,車輛的速度越高,通過規定路段的時間越短,則車道占用率越低;當車道占用率超過18%時,兩者開始相互限制,即較高的車道占用率造成交通擁堵從而使通行的車輛速度降低,行駛過慢的車輛在車道占用時間較長,從而提高了車道占用率。在車輛通行時,多種突發因素會干擾車流,導致車輛速度降低以及車道占用率發生變化。

圖4 車道占用率與車輛速度的關系Fig.4 Relationship between lane occupancy and vehicle speed
車道占用率在一定程度上可以和車流量進行相互替代,單位時間內通過的車輛越多,車流量越大,車道占用率就越高,然而這種變化關系并不是線性的,較高的車道占用率使道路變得擁擠,從而使得單位時間內通行的車輛數下降。從圖5 可以看出,車道占用率與車流量的整體趨勢相同,即車流量增大,車道占用率也會隨之提高,但是一旦車道占用率超過25%,車道占用率提高車流量卻呈現下降趨勢,說明在車道占用率超過25%閾值時,當前道路開始擁堵,車輛在當前車道停留的時間較長,車道占用率提高,從而使得單位時間內通過當前車道的車輛數量降低。

圖5 車道占用率與車流量的關系Fig.5 Relationship between lane occupancy and traffic flow
如圖6 所示,本文車道占用率預測模型主要分為3 個部分,即2 個多組件融合(Multi-Component Fusion,MCF)模塊和末尾的輸出部分。MCF 模塊由時空塊、車流量、車輛速度以及記錄權重的鄰接矩陣組成,這一部分將在下文中詳細描述。在該模型中,輸入序列Oh=[ot-h,ot-h+1,ot-h+2,???,ot-1],經過特征提取得到輸出序列O′h=[ot,ot+1,ot+2,???,ot+p],即未來t~t+p時間段內當前道路的車道占用率,具體計算公式如下:


圖6 車道占用率預測模型架構Fig.6 Lane occupancy prediction model architecture
圖7 所示為MCF 模塊架構,其主要由2 個時間卷積塊(Temporal_conv)和1 個空間卷積塊(Spatial_conv)相間組合構成。將歷史時間的車道占用率序列作為輸入,經過時間卷積塊提取數據的底層時序特征,然后經過提取空間特征的卷積,在該過程中加入經過處理得到的權重鄰接矩陣,隨后加入車流量和車輛速度的影響,對以上提取到的特征進行融合,接著再經過提取時序特征的時間卷積塊進行卷積,得到最終輸出。在空間卷積塊中,為將結構化數據進行泛化,將譜框架引入模型中,在譜域中應用圖卷積,利用切比雪夫趨近將時間復雜度降至線性;時間卷積塊中利用空洞卷積能更廣泛地捕捉節點附近鄰近節點的特征。MCF 模塊能夠同時融合時間和空間特征,從而處理映射到路網圖結構上的時間序列。

圖7 MCF 模塊結構Fig.7 MCF module structure
MCF 模塊的求解步驟具體如下:
輸入包含歷史時間車道占用率的交通信息Oh=[ot-h,ot-h+1,ot-h+2,???,ot-1]
輸出預測的未來時間段內車道占用率情況O′h=[ot,ot+1,ot+2,???,ot+p]
步驟1在時間卷積塊中,通過空洞卷積對輸入數據進行時間特征提取,后面緊接門控線性單元進行激活。
步驟2時間卷積塊主要由圖卷積構成,計算路網中每一個監測點之間的歐幾里得距離,得到路網的鄰接矩陣W,利用時間卷積塊抽取空間特征。
步驟3加入車流量和車輛速度的序列Fh=[ft-h,ft-h+1,ft-h+2,???,ft-1]和Vh=[vt-h,vt-h+1,vt-h+2,???,vt-1],對已經提取的特征進行初步融合。
步驟4對序列矩陣進行第2 次卷積操作,提取時間特征,輸出。
從圖7 可以看出,在模型預測的過程中加入了車輛速 度Vh=[vt-h,vt-h+1,vt-h+2,???,vt-1]和車流 量Fh=[ft-h,ft-h+1,ft-h+2,???,ft-1]的影響。其中,車輛速度和車流量都是作為一維卷積添加進所預測的矩陣,可表示為:

其中:T0b是時間層;Kb為譜圖卷積核;Vb是車輛速度序列;Fb是車流量序列;ReLU 為激活函數。經過上述模塊的處理,不僅能同時融合時間和空間特征,還能將車流量和車輛速度2 個隱式因素的影響加入模型中,從而處理圖結構上的時間序列。
在通常情況下,選擇用RNN 模型對時間序列特征進行提取,但是RNN 用于交通預測時迭代比較耗時,模型復雜度較高,對于時間序列的動態變化捕捉較慢,從而導致模型時間復雜度上升。交通數據非常依賴時序變化,具有高度的非線性,因此,需要選擇能夠快速捕捉時間序列動態變化的模型,提高特征的提取能力。本文引入空洞卷積,其比普通卷積具有更大的感受野,可以提取節點周圍更多節點的特征,從而捕獲交通信息在時間序列上的動態變化特征。
本文預測模型在空洞卷積之后添加門控線性單元,可以將輸入時序卷積的序列看作有Ci個通道數且長度為Q的序列卷積核被映射進S得到的輸出為其中,M和N是通道數的一半,因此,卷積操作可以定義為:

其中:?表示哈達瑪積;σ是sigmoid 門,控制當前卷積的狀態。如果時序卷積堆疊,也可以在每個節點上使用這樣的卷積核,進而實現時序卷積的泛化。
關于交通信息空間屬性的研究,大多將空間信息劃分成塊或網狀結構,雖然這樣可以捕捉交通信息的空間屬性,但是過分側重交通網絡中的連通性,從而使得提取到的空間特征存在局限性。在空間特征提取部分,本文模型將交通信息映射到路網中,將交通信息轉化為圖信息,然后利用圖卷積對路網進行操作,從而在輸入的空間信息中提取有意義的空間特征,用于模型融合和預測。式(4)可被拓展為:

本文實驗數據集是加利福尼亞運輸部公開的PeMS(Caltrans Performance Measurement System)第7 區(下面簡稱PeMS7(O))從2019 年1 月1 日—2 月19 日共50 天238 個監測站所觀測的數據,以及PeMS 中四車道道路(下面簡稱PeMS7(4))從2019 年6 月1 日—7 月20 日共50 天內監測站觀測到的數據。每一條數據信息包括本文模型需要的時間屬性、空間信息、單位時間內的車流量、車輛平均速度、車道占用率。監測站采樣的時間間隔為30 s,收集的數據是5 min 內采集的數據聚合而得的交通信息。選取40 天數據作為訓練集,5 天數據作為評估數據,5 天數據作為測試集。
在數據輸入模型之前先對數據進行預處理。數據中時間間隔是5 min,因此,每天24 h 就會產生288 個數據點。將這些數據進行清洗,使用線性插值法補全數據,再通過數據中記載的信息將這些數據點映射到有向圖中。其中,模型中用到的記載權重的鄰接矩陣計算如下:

其中,Wab是路網中邊的權重;α和β是控制鄰接矩陣分布和稀疏性的值,為方便計算,將α和β這2 個值分別設置為10 和0.5。
本文在真實數據集PeMS7(O)和PeMS7(4)上進行實驗,根據前面12 個時間段(每個時間段為5 min)的數據預測未來9 個時間段(45 min)的車道占用率情況。設置本文MCFDGCN 模型的時間卷積核和空間卷積核大小均為3,學習率為le-3,采用RMSProp 優化器。為了顯示MCFDGCN 模型的正確性和優越性,將其與歷史平均值(HA)模型、自回歸移動平均(ARIMA)模型、長短期記憶網絡(LSTM)、MCF(ST)(Multi Component Fusion(ST))、擴散卷積遞歸神經網絡(DCRNN)、圖多注意網絡(GMAN)模型進行對比。對比模型具體如下:
1)HA 為基于歷史交通數據和當前時間戳數據進行預測的模型。
2)ARIMA 將非平穩時間序列轉化為平穩時間序列以進行預測。
3)LSTM 是一種解決長序列訓練過程中梯度消失和梯度爆炸問題的特殊RNN。
4)MCF(ST)僅融合時間和空間特征,沒有加入車輛速度和車流量2 個組件的影響。
5)DCRNN 捕獲時間和空間相關性以進行預測。
6)GMAN 利用注意力機制進行預測。
本文采用平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)、平均絕對百分誤差(Mean Absolute Percentage Errors,MAPE)作為評價指標。MAE 是絕對誤差的平均值,能反映預測值誤差的實際情況;RMSE 是預測值與真實值偏差的平方和與預測次數比值的平方根,其衡量預測值與真實值之間的偏差;MAPE 以百分比的形式反映模型預測的準確程度,其數值越小則預測精度越高。3 種指標的計算公式分別如下:

其中:xi為真實值,為預測值。表1 和表2 所示分別為數據集PeMS7(O)和PeMS7(4)上7 種預測模型在15 min、30 min、45 min 時的指標結果。從中可以得出,在這3 個時間節點,傳統的線性模型HA 預測結果最差,誤差最高,LSTM 模型優于ARIMA 模型,MCF(ST)與本文MCFDGCN 模型相對對比模型準確率具有較大提升,DCRNN 和GMAN 進一步縮小了預測誤差,本文MCFDGCN 模型誤差值最小。

表1 PeMS7(O)數據集上各模型性能對比結果Table 1 Performance comparison results of various models on PeMS7(O)dataset

表2 PeMS7(4)數據集上各模型性能對比結果Table 2 Performance comparison results of various models on PeMS7(4)dataset
圖8~圖10 所示為數據集PeMS7(O)上預測步長為5 min 的模型的預測結果(彩色效果見《計算機工程》官網HTML 版,下同),該結果能夠更加直觀地反映模型預測誤差的變化規律。
從圖8~圖10 可以看出:MCFDGCN 模型誤差最低,不僅初始預測誤差最低,并且隨著時間的增加,其與傳統線性模型誤差的差距增大;車道占用率的預測確實受到車流量和車輛速度的影響,加入這2 個隱式影響因素,能有效減小預測誤差,提高模型的預測精度。

圖8 7 種模型的MAE 值對比結果Fig.8 Comparison results of MAE values of seven models

圖9 7 種模型的MAPE 值對比結果Fig.9 Comparison results of MAPE values of seven models

圖10 7 種模型的RMSE 值對比結果Fig.10 Comparison results of RMSE values of seven models
將本文模型對車道占用率的預測值和真實觀測數據進行對比,結果如圖11 所示。從圖11 可以看出,本文模型預測值的變化趨勢與真實觀測值變化趨勢基本一致。由于道路上會發生各種突發狀況,車道占用率會瞬時升高,但隨著時序變化或其他因素的影響,車道占用率又會瞬時回落,因此,模型預測結果存在誤差屬于正常現象。MCFDGCN 模型能在預測車道占用率變化趨勢的同時實現比現有多數方法更精準的預測。

圖11 PeMS7(O)數據集上預測值與真實值對比結果Fig.11 Comparison results of predicted values and real values on PeMS7(O)dataset
本文提出基于多組件融合與空洞圖卷積的車道占用率預測模型MCFDGCN,該模型不僅考慮時空特征對車道占用率的影響,還加入車流量和車輛速度這2 個隱式因素,利用歷史時間的車道占用率對未來短時間的車道占用率進行預測。實驗結果表明,MCFDGCN 模型預測誤差較小,與GMAN、ARIMA 等模型相比,其誤差增長速度緩慢,預測精確度明顯提升。MCFDGCN 模型也適用于其他交通道路的車道占用率預測,例如將車道占用率作為隱式因素引入到車流量或車輛速度的預測模型中。下一步將融合其他卷積、組件或注意力機制來簡化參數,以在更長時間跨度內提高預測精度,擴大MCFDGCN 模型的適用范圍。