金濤斌,盧 宇,徐 巖
(1. 廣州大灣區軌道交通產業投資集團有限公司,廣東廣州 510405;2. 天津大學電氣自動化與信息工程學院,天津 300072)
隨著我國城市化進程的不斷加速,交通流量和交通信息量均急劇增加,而當前城市軌道交通運營管理系統功能相對單一,沒有充分利用日常運營中長期自然積累的海量數據,缺乏對城市軌道交通運行的長周期自動監控和預測。近年來,國家各相關部門紛紛出臺政策,支持智能、高效的城市軌道交通運營管理新技術、新產品、新模式的開發和應用。同時,隨著科技的不斷發展,計算機運算成本顯著降低,基于深度學習的時間序列預測方法已被廣泛應用于各個領域。充分利用交通網絡的多維度、海量數據,用人工智能的方法來完成交通流量預測工作,可以更加精準地追蹤、評價和預測交通流量的動態性變化,對于交通樞紐壓力的估計、資源配置、人力調配都具有十分重要的作用。本文研究高性能深度學習交通流量預測算法,自動捕捉輸入數據的時間相關性和依賴性,根據當前狀態和歷史數據對大規模交通網絡中各個樞紐的交通流量進行預測,實現交通樞紐客流量的智能化、高效率、高準確率預測,助力提升城市軌道交通運營管理水平。由于本文算法可應用于各種類型交通(包括:城市軌道交通、公路交通等),故后文統一論述為“交通流量預測”“交通網絡”“交通樞紐”。
交通網絡所具有的拓撲特點和極具時效性的時域特征導致在網絡中各個交通樞紐之間的相互關聯具有很強的動態變化性。從時間特點而言,交通流量具有極強的周期性和非線性時域變化的特點,時間相關性也更復雜。在一周的同一天或同一天的同一時段,同一地點的交通流量通常相似,而前一時段的交通流量也會對后續時段產生很大影響。這使得交通流量預測長期以來一直是一項具有挑戰性的任務[1]。
近年來,人們對高性能智能交通流量預測系統的開發越來越感興趣。交通流量預測的早期研究通常使用傳統的理論統計方法,如歷史平均值方法(HA)[2],自回歸綜合移動平均方法(ARIMA)[3]和向量自回歸方法(VAR)[4]。其中,ARIMA是應用最廣泛的時間序列模型,為了提高模型的預測精度,引入了不同的變量加以改進,如周期ARIMA[5]等。Van Hinsbergen等人通過最小化最優解的方差,使用卡爾曼濾波器完成交通預測任務[6]。雖然傳統的統計方法相對簡單且便于計算,但它們均需滿足基于時間序列的平穩性假設[7],而真實交通流量數據通常并不能嚴格滿足平穩性要求。
隨著深度學習在語音識別和圖像處理等領域的逐漸成熟,越來越多的研究人員將深度學習應用于時空數據預測[8]。卷積神經網絡(CNN)已被廣泛用于捕捉歐幾里得空間中的時空相關性[9]。Huang等人提出擴散卷積遞歸神經網絡(DCRNN)模型,將圖卷積集成到編碼器-解碼器結構的門控循環單元中[10]。于德新等人將門控循環單元(GRU)與遞歸神經網絡(RNN)結合,對交叉路口的交通流量進行預測[11]。鳳少偉等人將K均值方法與GRU結合進行交通流量預測,也取得較好效果[12]。Zhao等人將長短時記憶網絡(LSTM)和全連接網絡(FCN)集成,提出LSTM-FC網絡來提取時間序列數據的相關性[13]。Fang等人將卡爾曼濾波和LSTM結合用于短期交通流量預測[14]。
綜上所述,雖然這些方法基本實現了對時序數據的建模和分析,在交通流量預測方面取得了驚人的進展,但捕獲長期時間依賴性的能力有限,所得的預測結果仍然有較大的提高空間。
Cho等人在LSTM的基礎上提出了結構更加緊湊的GRU,其結構如圖1所示[15]。

圖1 GRU結構示意圖
GRU將LSTM中的輸入門(input gate)和遺忘門(forgetting gate)整合成為更新門(update gate),用來控制過去時刻記憶信息參與當前時刻信息計算的數據量,以及前一時間步的信息和當前時間步的信息將被繼續傳遞到未來時間步的數據量,其計算公式如下:

式(1)中,zt為t時間步GRU單元的更新門輸出;σ為非線性激活函數,其輸出為(0,1)之間的數值,可以直接作為門控信號;Wz和Uz為更新門中可訓練的模型參數;Xt為t時間步的輸入;Ht-1為前一時刻即t-1時間步的隱藏層狀態。
GRU的另一個門為重置門(reset gate),其計算方法與更新門類似:

式(2)中,rt為t時間步GRU單元的重置門輸出;Wr和Ur為重置門中可訓練的模型參數。
得到2個門控信號后,首先根據當前時刻輸入、前一時刻隱藏層狀態 以及重置門控信號 ,計算得到:

最終得到當前t時刻的隱藏層狀態Ht:

深度神經網絡在訓練過程中容易過度擬合,最終會損害預測精度。為了解決這一潛在風險,文獻[16]提出在深度神經網絡的某些層次之間增加額外的連接結構,如圖2所示。加入殘差連接后,其映射函數H(x)的計算公式如下:

圖2 殘差連接示意圖

式(5)中,x為當前殘差模塊的輸入特征;(·)為2 ~3層卷積、激活等操作。殘差連接既沒有增加額外的參數,也沒有增加計算復雜度,但有助于網絡模型學習到更多的信息,以進一步提高模型的準確性。
與LSTM類似,GRU被用于解決反向傳播中的長時間建模和梯度消失等問題,它比LSTM具有更簡單的結構和更少的參數。但是,GRU仍然基于輸入數據的順序進行迭代處理,當建模長時間序列時,預測效果會衰減。
殘差連接用于解決深度神經網絡在訓練過程中出現的過擬合問題。在GRU中添加殘差結構可以在一定程度上緩解長時間建模的衰減效應。傳統殘差結構一般是在遞歸循環單元的輸入和輸出之間添加連接。本文算法選擇在迭代之間添加線性連接以構建殘差增強門控遞歸單元(R-GRU),并將I個單元(對應于I個歷史時間步長)級聯起來,以形成殘差增強門控遞歸層,其結構如圖3所示。R-GRU結構可使信息能夠從一個單元直接傳播到另一個單元,這有助于網絡學習更多信息并進一步提高模型的準確性。

圖3 R-GRU結構示意圖
添加殘差連接后,R-GRU的前饋傳播遞歸地進行為:


式(6)~(10)中,為R-GRU單元在時間步t的輸出;αx和αh為超參數;Wh和Wox為可訓練的模型參數。
為測試本文算法的性能,對4個公開的公路交通數據集PeMS03、PeMS04、PeMS07和PeMS08進行了實驗[17],數據集的統計信息如表1所示。

表1 實驗所用數據集信息
所有實驗均在1臺配有3.6 GHz的Intel(R)Core i7-9700k處理器、1塊GeForce GTX 3080Ti GPU的電腦上完成。深度學習網絡模型基于Pytorch框架實現。實驗采用了3種評估指標:平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)。上述指標的計算公式為:

式(11)~式(13)中,ytrue(m)為第m個樣本的真實值;ypred(m)為第m個樣本的預測值,M為樣本數量。
實驗中使用數據集中前1 h的歷史數據預測未來1 h的交通狀況。本文算法與其他算法的預測性能比較如表2所示。可以看出,由于交通流預測不是一個簡單的時間序列線性分析問題,而是一個復雜的時空預測問題,所以傳統的統計模型(HA[2]、ARIMA[3]和VAR[4])表現不佳。與基于深度學習的方法(LSTM-FC[13]和DCRNN[10])相比,本文所提出的模型表現出具有競爭力的性能,所有指標均優于上述算法。實驗中使用的4個數據集在節點數和時間跨度上有很大差異,本文算法在所有這些數據集上都保持了較高的預測精度,這意味著本文算法能夠勝任不同交通網絡的預測任務。

表2 本文算法與其他算法的預測性能比較
為更加直觀的觀察算法預測性能,在PeMS04中隨機選擇2個節點(節點1和節點99),將流量真實值與本文算法預測值進行可視化展示,如圖4所示。可以看到,真實值曲線非常不規則,在某些時間點上波動很大,同時,不同節點的交通流變化模式也非常不同。而本文模型能夠準確地捕捉并擬合不同節點中交通流量劇烈變化時的不同規律,尤其是在顯著變化的峰值或波谷時對流量變化較敏感,預測結果接近實際值。

圖4 PeMS04中節點1和節點99的真實值與預測值比較
本文針對大規模交通網絡的流量預測問題,改進了門控循環網絡結構,通過增加殘差連接,提出基于殘差增強門控循環網絡的交通流量預測算法來預測未來時間步長的交通狀況。在4個公開交通數據集上的實驗表明,本文算法在預測精度方面具有顯著競爭力,能夠同時捕捉不同節點的流量變化規律,即使在流量變化非常不規則且變化較大的時間步,仍然能夠給出較準確的預測結果。
高性能交通流量預測算法能夠及時有效地獲取未來某段時間內的交通信息,及時做出合理的人員安排和引流部署,節約處理交通擁堵問題的經濟開支,可緩解很多交通預測領域的現實問題,具有較高的研究價值和應用價值。未來我們的研究將側重于同時考慮交通網絡的時間-空間變化特征,同時將影響交通流量的天氣、節假日信息和交通事故等因素納入模型,以進一步提高預測精度。