李松江 祝紹凇 楊華民 王 鵬
(長春理工大學計算機科學技術學院 吉林 長春 130022)
高速路網短時交通量預測已經成為高速公路運營部門在管理過程中研究的核心問題之一。精確的交通狀況預測在減少道路交通擁堵、調整人們出行規劃,以及提高交通管理維護效率等方面發揮著重要作用。近年來,國內外學者在該領域進行了大量研究,已取得了許多研究成果。目前廣泛應用的有歷史平均模型、卡爾曼濾波模型[1-2]、神經網絡模型[3-4]、支持向量機[5-6]和組合預測模型[7-8]等。但多數模型只利用了目標路段過去時刻的交通量數據,未能充分利用路網內其他相關路段的交通流信息,在一定程度上影響了預測效果。
實際上,由于高速路網的物理特性,區域中通過某路段的交通流與通過其上游n(n≥1)階鄰接路段的交通流在時空上顯然是存在關聯關系的,在進行高速路網交通量預測時,應充分利用路網的這一特性[9]。國內外學者針對這一特性進行了相應的研究,并取得了一些研究成果。熊亭等[10]對布設在美國華盛頓州I-5高速公路北向車道上的3個線圈檢測器數據進行周期性分析,將目標路段上下游的車流量及車速作為空間特征向量,利用SARIMA-RF組合預測模型進行目標路段的交通量預測;李巧茹等[11]將時間與空間序列流量觀測值作為支持向量機的訓練樣本,通過路網路段歷史時刻的空間序列得到空間序列的預測值,使用空間序列預測值對交通流時間序列預測結果進行修正,動態調整其對未來預測的影響。上述文獻都取得了較好的預測效果,但預測模型仍僅限于利用單點附近的交通流信息,未能拓展至區域網絡。
針對上述問題,本文提取能體現高速路網拓撲關系的空間權重以及描述路網時空狀態的時間權重,利用高斯加權歐氏距離剔除了路網區域內的非時空相關路段,通過多任務循環神經網絡對目標路段的交通量進行協同預測。實驗結果表明,將時空相關路段的交通量預測作為目標預測任務的額外任務,對于目標路段交通預測準確度具有提升作用。
本文研究的高速路網短時交通量預測模型,需要充分考慮路網內的其他路段與歷史時段的交通量對目標路段的影響。選取吉林省某區域的部分路網作為研究對象,交通流示意圖如圖1所示。圖中的每個圓圈節點表示一個道路交叉點,箭頭表示交通流的方向,交通流從上游鏈路到達對應的道路鏈路[12]。通過整理該區域自2018年5月7日到6月3日總計28天的路網收費數據,最終以5 min的時間間隔確定了路網內34條路段的交通量數據與平均車速數據。如圖2所示,將高速公路CB中長度為18.46 km的路段“0”記為目標路段。

圖1 路網交通流示意圖

圖2 目標高速公路示意圖
在高速路網中,路段交通流受多種因素的影響。由于區域路網內路段分布廣泛、連接情況多樣,導致路網空間狀態主要受兩個明顯的空間因素影響:路段間距與路段連通度。
定義1設d為路網中的路段與目標路段之間的物理距離,本文通過計算路段的中點之間的距離進行統計。
定義2設g為路網中各路段的連通度等級,第一級(g=1)為與目標路段處于同一高速公路的路段;第二級(g=2)包括與目標路段所在高速公路存在交叉點公路上的路段;第三級(g=3)對應于第二級存在交叉點公路上的路段。其余的等級(g=4,5,6,…)也有類似的描述[13]。

圖3 高速路段連通等級示意圖
除了固有的靜態影響因素外,路網內各路段間的相關系數也可以作為描述交通流之間影響程度的動態標準。
定義3設r為目標路段與路網其他路段交通量時間序列的相關系數,其計算式表示為:
(1)
式中:x和y分別表示兩個路段的交通量時間序列;m為時間序列的長度。
定義4設c為確定目標路段與其他相鄰路段之間的空間相關性的準則(即等效距離),其計算式表示為:
(2)
式中:g為路網層次結構中各路段的連通度等級;d為路網中的路段與目標路段之間的物理距離;r為目標路段與路網其他路段交通量時間序列的相關系數。等效距離與路段間距和路段連通度呈正相關,與路段間的相關系數呈負相關。
定義5將描述路網交通狀態的二維時序矩陣設為V(m,n),表示為:
(3)
式中:m為時間序列的長度;n為路網中路段序列的個數(包括預測路段);狀態矩陣的元素表示在一定的時間步長內各路段交通流的平均速度。V(m,n)利用m個時間步長和n-1個鄰近路段的數據來確定整個路網的交通狀態。
本文通過構建多任務循環神經網絡模型對目標路段未來時刻的交通量進行協同預測。多任務學習中將目標路段未來時刻的交通量預測作為預測模型中的主要任務,同時認為預測其相關路段的交通量與主要任務有一定的關系,故選擇它們作為額外任務。額外任務與主要任務具有共同的歸納偏置,可以提高主要任務的預測精度。依據圖4所示的基于時空相關性的交通量預測流程構建出對應的預測模型,模型主要分為兩個部分:① 利用時空相關性確定連通路網中的相關路段;② 通過多任務循環神經網絡對目標路段的未來交通量狀態進行預測。

圖4 基于時空相關性的交通量預測流程
眾所周知,物理距離代表了路網的固有空間特性,但這一概念并沒有反映路段之間的動態空間屬性,即交通流特性。本文將實際路網中采集的靜態物理數據與由路段時間序列計算的相關系數相結合,得到同時具有物理與數據屬性的復合變量,稱為路段間的等效距離。等效距離的計算步驟如下:
(1) 根據劃定的路網區域,確定區域中目標路段與其他連通路段的連通度g與路段間距d。
(2) 根據當前時刻路網時空狀態的時間步長,計算目標路段與其他路段交通量時間序列的相關系數r。
(3) 通過式(2)計算路段間的等效距離。
本文通過探究區域各路段與目標路段交通量狀態變化的相似度確定路網中的時空相關路段。在獲得各路段具有空間特性的等效距離后,利用由平均速度組成的時空狀態矩陣識別路網的交通狀態。由于時空變量的不同度量標準之間存在差異,故通過高斯加權函數將等效距離附加到每條路段對應的時空狀態向量上,以時間維與空間維相結合的方式確定目標路段與其他路段之間的時空相關性。然后將現在時刻與歷史時刻時空狀態向量的歐氏距離作為判斷每條路段狀態變化程度的標準,進而得到路網區域中目標路段的時空相關路段。確定時空相關路段的步驟如下:
(1) 利用高斯加權函數確定路段的空間權重。將空間加權矩陣定義為W,其元素分別定義為wi,則W表示為:
(4)
式中:ci為編號i的路段與目標路段間的等效距離;根據實測數據計算出空間加權參數中方差a的值。
(2) 利用高斯加權函數確定路段的時間權重。將時間加權矩陣定義為Q,其元素分別定義為qj,則Q表示為:
(5)
式中:tm為當前時刻的時間步長;tj為tm前m-j時刻的時間步長,與m-j時刻計算平均速度的時間步長相對應;根據實測數據計算出時間加權參數中方差b的值。
(3) 確定路網區域的交通狀態。將式(4)與式(5)得到的空間權重與時間權重通過矩陣乘法的形式附加到路網時空狀態矩陣上,得到具有時空屬性的路網狀態矩陣X,加權公式表示為:
X=Q·V·W
(6)
式中:Q為時間加權矩陣;V為路網狀態矩陣;W為空間加權矩陣。
(4) 計算路段交通狀態變化程度。設X與Xl分別為當前時刻與第l個歷史狀態下的路網時空狀態矩陣,Xi為第i條路段的時空狀態列向量,將第i條路段在兩個時刻下時空狀態列向量的歐氏距離作為判斷該路段交通狀態變化程度的標準,記為Si,表示為:
(7)
在傳統的神經網絡中,相鄰的隱層間完全連接,但是同一層內的節點間沒有連接,而交通量的時序數據在描述交通流變化時前后存在明顯的交互。循環神經網絡(Recurrent Neural Network)擁有一種特殊的神經網絡結構,其隱層節點之間是相互連接的,可以對前一時刻的信息進行記憶并應用于當前輸出的計算中,因此能夠處理連續和相關的任務。RNN的典型網絡結構如圖5所示。

圖5 循環神經網絡結構
圖5中RNN的數學模型可以表示為:
Ot=g(V·St)
St=f(U·Xt+W·St-1)
(8)
式中:Xt是輸入向量;U是輸入層到隱藏層的權重矩陣;V表示隱藏層到輸出層的權重矩陣;W表示用于隱藏層自身遞歸的權重;Ot為預期的輸出向量;g和f表示激活函數Sigmoid。
交通系統作為一個高度相關的網絡,為使用來自網絡相關部分的共享知識,應從網絡的角度進行交通量預測。使用歐氏距離計算每條路段當前狀態與歷史狀態之間的交通參數距離,識別出區域路網內與目標路段交通狀態變化相似的時空相關路段。本文利用多任務學習的歸納轉移機理,選取與預測目標路段未來時刻交通量相似的多個訓練目標,根據目標間特定的相關信息來提升學習系統的泛化能力。將路網內時空相關路段的交通量預測作為多任務學習的額外任務,通過將多任務學習與循環神經網絡進行結合,構建如圖6所示的網絡預測結構,對目標路段進行短時交通量預測。其中共享隱層可以提取路段之間共享的空間信息,使每一項預測任務作為其他任務的輔助,充分利用了路網的空間信息。而特定任務層可以拆分每一個任務,對其中的與其他任務不同的特定信息進行學習。

圖6 多任務循環神經網絡預測

(9)
本文通過使用多任務循環神經網絡模型對目標路段的下一個時刻的交通量進行預測。多任務學習共同訓練模型并共享隱藏層的權重,相較于單任務學習只需要訓練一個模型,該模型將具有相似權重分布的任務組合在一起,可以根據任務之間的共同特性與每個任務的獨有特性提高預測性能,故該模型比單一路段的交通量預測模型具有較高的預測精度。
本文針對高速路網短時交通量預測問題進行了研究,提出基于時空相關性的多任務循環神經網絡協同預測模型。實驗主要包括兩個部分:(1) 分別計算出當前時刻與歷史時刻所有路段的交通狀態向量,從而確定路網區域內的時空相關路段;(2) 將相關路段的交通量預測作為多任務學習的額外任務,通過構建神經網絡完成對目標路段交通量的協同預測。
為驗證該預測模型的適用性及準確性,本文選用吉林省的部分高速路網作為研究對象,并選取自2018年5月7日至5月27日共3周的交通量時間序列數據作為模型的訓練集,用于模型的構造與訓練;選取5月28日至6月3日1周數據作為測試集,用于對模型進行驗證。
本文選取的性能指標參數為:均方根誤差(RMSE)與絕對百分誤差(MAPE)定義如下:
(10)
(11)

實驗的前半部分為計算路網區域內所有路段交通狀態變化的歐氏距離。利用不同數量的路段經過足夠次數的訓練后,損失函數呈現出一定的變化趨勢,如圖7所示。最終將相關路段交通狀態變化的閾值確定為66,并得到14條與目標路段具有相似時空特性的路段,各路段參數如表1所示。然后利用這些相關路段的交通量時間序列作為多任務循環神經網絡的輸入,通過共享隱藏層參數實現對目標路段的未來時刻交通量進行協同預測。

圖7 損失函數的變化趨勢

表1 目標路段的時空相關路段
利用TensorFlow構建出多任務循環神經網絡交通量預測模型。構建包含三個共享隱層結構的神經網絡模型,其中隱層包含神經元數目分別為100、200、300,特定任務層神經元數目為300。將Sigmoid函數作為輸入層和隱藏層之間的特定激活函數,權值初始化函數為orthogonal。將相關路段的時間序列矩陣歸一化后作為多任務循環神經網絡的輸入層數據。通過觀察網絡訓練誤差的變化,選取1 000次迭代作為最大的訓練次數,學習率為0.025,批大小設置為64。
本文通過兩部分驗證基于時空相關性的多任務循環神經網絡交通量模型的預測性能,一是將該模型分別與引言部分的兩種模型和傳統的時間、空間模型進行比較,各模型的性能指標對比如表2所示;二是將由時空相關路段訓練的模型與由路網內所有路段訓練的交通量模型進行對比。

表2 性能指標對比
基于時間序列或空間序列的單變量預測模型在三個時段中的預測結果與實際交通量相比有較大的差距,而SARIMA-RF與SVM模型的預測誤差在每個時段都多于MTL-RNN模型0.02左右,因此基于時空相關性的交通量預測模型在三個時段的性能指標中的表現最佳,該模型在復雜路網的交通量預測方面有較高的精確度。將上述三種模型的預測結果分別與實際交通量作比較,圖8為五種模型在2018年6月4日內的三個時段的目標路段交通量預測值和真實值的對比結果。

(a) 時段一對比情況
基于時空相關性的交通量預測模型的誤差明顯小于基于時間序列和空間序列的交通量預測模型,而且與SARIMA-RF和SVM兩種模型相比,該模型在任何時段中都具有良好表現,更加接近實際的交通量變化曲線。由此可推測出,通過路網中各路段的過去時刻的交通量實現對目標路段未來時刻交通量的預測,可以充分利用路網的時間特性與空間特性,在一定程度上可以明顯提高交通量預測的準確度。
最后,為驗證不相關任務可能會對模型訓練產生的負遷移現象,選取路網中的時空相關路段與由所有路段訓練的交通量預測模型進行準確度對比。如圖9所示,由路網中相關路段訓練的交通量預測模型的預測準確度最終維持在92%左右,而由所有路段訓練的模型的準確度在88%左右,故只有將相關的任務集成到一個組中,才能夠更好地提高整體性能,無關任務的共享信息可能會降低模型的性能。

圖9 不同等級路網的預測準確度對比
本文針對高速路網短時交通量預測,提出一種基于時空相關性的多任務循環神經網絡預測模型。其中針對傳統的交通量預測中忽視路網鄰近路段數據的問題,提出一種計算路網中路段時空相關性的方法。通過量化路網物理結構中的路段距離、連通度與路段間的相關系數得到每條路段對應的空間權重,比較各路段不同時刻的交通時空狀態向量,得到目標路段的時空相關路段。然后將相關路段的交通量預測作為相關任務與目標路段放到一組聯合訓練,通過共享隱藏層提高神經網絡預測性能。實測交通量數據驗證的結果表明,本文提出的預測模型預測值和真實值吻合效果較好,是一種有效的交通量預測方法。