北京工商大學 秦 瑤 李 勇 王世民
在交通擁堵預測問題中,需要對交通傳統感器提供的動態交通數據進行實時處理,為交通控制、 交通指揮、突發交通事件管理、交通信息服務等子系統提供必要的交通信息。目前國內外對于交通擁堵預測的諸多研究成果中也主要集中在該學科領域,路段的交通流是指單位時間通過路段某一截面的車輛數,針對交通擁堵進行研究的學者有60%以上都提出并建立了各種交通流預測模型,主要包括ARIMA 模型預測、模糊網絡模型、卡爾曼濾波理論、神經網絡、貝葉斯組合模型、支持向量機、深度學習模型等。作為應用比較成功的神經網絡模型,RNN不同于傳統的神經網絡模型。在傳統的神經網絡模型中,是從輸入層到隱含層再到輸出層,層與層之間是全連接的,每層之間的節點是無連接的。但是這種普通的神經網絡無法與之前的序列狀態產生關聯,這對于很多問題是無法應用解決的。循環神經網絡其原理為,網絡會對前面的信息進行記憶并應用于當前輸出的計算中,即當前神經元存儲著神經元這一時刻的輸入和前一時刻的輸出之間的關系,也就是說隱藏層之間的節點不再無連接,并且隱藏層的輸入不僅包括輸入層的輸出還包括上一時刻隱藏層的輸出。用來處理序列數據,更易達到時序建模的目的,在準確率和泛化推廣方面表現更高的性能。但是在實際中,為了降低復雜性,模型中當前狀態往往只與前面幾個狀態相關,對較遠時間點無法感知,在應用于城市交通中較大型網絡時準確率會有下降,本文將改進RNN神經網絡算法,通過計算獲取可表征數據深層特征的隱層參數、表征序列區間與閾值,充分利用RNN網絡優點,構建一個對城市交通擁堵更有效地模型。
實驗使用某段時間內某區58個交通信號燈之間交通路段車流量數據進行研究。該交通流數據統計間隔為30s,記錄了從早上六點到晚上八點的數據。

圖1 實驗交通網絡
循環神經網絡(Recurrent Neural Network, RNN)是一類在網絡中出現環為特點的網絡模型,并且能夠存儲著神經元這一時刻的輸入和前一時刻的輸出之間的關系,主要用來處理序列數據。前向靜態神經網絡雖然對非線性函數具有良好的逼近能力,但是卻不具備動態性,因為它的輸入和輸出維數都是固定的,不可任意改變,因此就引入了循環神經網絡RNN。RNN相較于前向靜態網絡不同的就是信號從一個神經元到另外一個神經元之后,并不會馬上消失,而是繼續存活。RNN這種網絡結構將上一時刻的輸出作為當前時刻的輸入,從而記憶歷史的信息,達到時序建模的目的。
RNN中,神經元的輸出可以在下一個時間戳直接作用到自身,即第i層神經元在t時刻的輸入,除了(i-1)層神經元在t時刻的輸出外,還包括其自身在(t-1)時刻的輸出。

圖2 RNN模型
(t+1)時刻網絡的最終結果O(t+1)是該時刻輸入和所有歷史共同作用的結果,達到對時間序列建模的目的。RNN可以看成一個在時間上傳遞的神經網絡,它的深度是時間的長度。


圖3 RNN在時間上展開
在發生交通擁堵路段,其參數值交通流量也會發生數值特征的突然變化,即在時間序列中,在某個時刻樣本的分布或者數字特征起了突然的而變化,這個時刻就叫變點。因此對交通擁堵的判斷可以轉換為交通流變點的判斷。
根據均值變點的離散模型來判斷變點值:

式中:

交通擁堵是一個隨機事件,傳統研究把流量達到可通行最大值看作是擁堵,而很多研究表明流量還未達到可通行最大值之前就已經發生了擁堵,現在更多的是認為交通擁堵發生在某個流量范圍,所以根據區間估計方法估計擁堵流量范圍。

交通擁堵通常并非發生在某一時刻,而會在一個時段內持續發生,所以我們對擁堵的預測也需要對流量序列是否持續屬于表征序列進行判斷。
預測擁堵持續時間基本思路是:從到達擁堵點進入擁堵時刻起,到再次由擁堵轉變為暢通時為止,這個過程所經歷的時間為擁堵的持續時間。所以需要確定到達擁堵點時間和擁堵結束時間。
擁堵終止時刻:路段交通狀態由擁堵轉變為暢通時刻,考慮交通流的穩定性,當交通流狀態判定為順暢且持續一個連續時間序列區間以上,認為擁堵終止。
算法如下:(設預測第k個時間序列車輛將達到擁堵點,t表示持續擁堵時間,Δt表示時間序列區間)。

圖4 擁堵持續時間預測算法
數據預處理。使用zero-center 方法進行歸一化處理。

反歸一化使用:

隱層數h=100,學習梯度下降優化方法θ=0.5,偏向量最初設置為0,每個模型的訓練次數設計為200次,以保證成功收斂。對U、V、W參數初始化。防止收斂速度減慢影響收斂成果。采用正態分布初始化:

前200組實驗樣本作為訓練集,后10組實驗樣本作為測試集,并對新一周路段交通流進行預測,作為實驗集。
使用預測結果與真實值之間的均方誤差函數mse判斷預測誤差。

經過改進后的RNN模型訓練,所有路段全天時段交通擁堵預測結果如圖5,紅色部分則為擁堵路段。

圖5 實驗結果展示
利用訓練精度和測試精度對模型準確率進行計算。用表示第條路段時刻的真實擁堵狀態,道路上的交通狀態被分類為二進制狀態,其中1表示擁堵和0表示不擁堵。則準確率計算公式為:

經計算,訓練集準確率為92.2%,測試集準確率為88%。
為直觀展示模型訓練效果,再采用RNN神經網絡方法進行實驗,分別對同一測試路段車流量預測值與真實值進行對比。

圖6 改進后RNN神經網絡測試路段車流量預測

圖7 RNN神經網絡測試路段車流量預測
改進后RNN神經網絡對車流量預測的均方誤差為0.57,而一般RNN神經網絡的預測結果均方誤差為2.25,可見改進后的RNN神經網絡對基于車流量的交通擁堵預測性能更優。
分析原因,在大規模城市交通網絡中,隨著時間間隔變長,模型訓練數據序列呈幾何增長,RNN在訓練過程中會因為梯度遞減漸漸喪失學習較遠信息的能力,后面時間的節點對于前面時間的節點感知力下降。而改進后的RNN網絡更能準確獲得表征擁堵序列,參數選取以及數據聚合度更適用于預測模型,訓練準確性變高,特異性、靈敏性更好。
改進后的RNN網絡即保持了RNN網絡原有的自學習、自適應、良好的處理數據序列能力等性能,又改進了其在大型城市交通網絡中對大量數據較遠時間點無法感知的缺陷。經仿真實驗,將改進后的交通擁堵預測模型與一般RNN網絡相比,模型具有較好的增量學習特性,其對測試集交通擁堵的預測精度約為88%。結果表明,該模型預測精度更高,可以為交通擁堵預測以及交通出行、交通控制提供更加準確的預測信息。