朱凱利 朱海龍 劉靖宇 石曄瓊 王歡



摘要:交通預測在智能交通中有著重要的意義和應用,本文提出一種用于交通預測的圖卷積神經網絡,使用圖卷積對城市道路網絡進行建模,利用GCN捕獲圖的拓撲結構,處理時空交通預測任務。將該方法應用到真實的數據集中,通過對車流量的預測和車速的預測實驗表明,該方法優于目前其它預測方法。
關鍵詞:圖卷積;GCN;拓撲結構;車流量
0引言
城市交通擁堵現象日益嚴重,不僅浪費了出行時間,加劇了城市環境污染,更使得城市交通事故頻發,影響交通運行,長此以往,造成惡性循環。因此,實現對城市路網交通流的有效預測,能夠有效預判城市交通現狀,進而合理進行調度,解決城市交通堵塞問題?,F有的解決城市交通流預測問題的方法主要有兩種:
(1)基于傳統的統計學預測模型。該方法主要通過車流量、速度、密度之間的關系進行建模,將交通流數據進行回歸以及優化參數。實現交通數據的擬合預測,主要包括歷史均值法、自回歸滑動平均法等。但是由于交通場景的復雜性,該預測模型較難得到準確地預測結果。Kumer等人采用ARIMA模型,將預測的車流量用數學模型的形式表現出來,但這一方法只適用于線性數據。而交通流數據是非線性的復雜的:Kumar提出了基于Kalman濾波技術的交通流預測模型,克服了SARIMA模型依賴于大量數據進行開發的缺陷。
(2)基于數據驅動的預測模型。該模型通過數據的規律來推測其變化趨勢。以此來進行交通流預測。這種方法不需要考慮交通場景的動態特性,只需要根據歷史的交通流數據作為預測值,但該方法預測準確性較低,不能很好地適應時間特征。Zhang等人設計了基于殘差卷積單元的ST-ResNet來對城市人流量進行預測,這種方法雖然提取了流量數據的時空特征,但將輸入限制為標準的2維或3維網格數據,因而不能用于圖結構的高速路網上的交通預測問題。Seo等人提出了圖卷積循環網絡(GCRN),但在特定設置下很難確定循環網絡和圖卷積的最佳組合。Yu等人提出了一個帶有門控機制的圖卷積網絡,并應用于交通量預測問題。Li等人在人體動作識別任務中引入圖卷積,提出多種劃分策略將節點的鄰域劃分為不同子集,通過控制子集的個數,保證不同節點可以共享卷積核權重。譜圖方法通過圖拉普拉斯矩陣將網格數據上的卷積操作推廣到圖結構數據上。但這些模型都沒有考慮交通數據在時間維度上的周期性和趨勢性等多種固有特性。
綜合以上分析可知,交通流流量預測還存在一些不足。為此,本文提出一種新的預測模型——圖卷積神經網絡(Graph Convolutional Network,GCN),GCN能夠直接利用圖結構信息提取局部特征,處理任意連接的不規則數據來完成交通預測任務,因為數據可以用交通路網的圖結構(Graph)來描述。
1 圖卷積神經網絡預測模型
1.1 圖卷積神經網絡描述
圖卷積神經網絡是一種對圖數據進行深度學習的方法,研究的對象是圖數據,研究的模型是卷積神經網絡。其是一種數據格式,可以用于表示社交網絡、通信網絡、蛋白分子網絡等。圖中的節點表示網絡中的個體,連邊表示個體之間的連接關系。許多機器學習任務,例如社團發現、鏈路預測等都需要用到圖結構數據。因此圖卷積神經網絡的出現為這些問題解決提供了新的思路。
1.2 圖卷積神經網絡預測模型
交通網絡的本質是一個圖結構,并且每個節點都可以看作是圖上的信號。因此,為了充分利用交通網絡的拓撲特性,本文使用譜圖方法將卷積操作推廣到圖結構數據,將數據視為圖上的信號,然后直接在圖上對圖信號進行處理,來捕獲空間中有意義的模式和特征,譜圖方法將圖轉化為代數形式,分析圖的拓撲屬性。
在譜圖分析中,圖由對應的拉普拉斯矩陣表示,圖的拉普拉斯矩陣表示為:
2 實驗結果與分析
為了驗證本文模型的性能,本文在兩個真實的數據集上進行實驗,將路網交通速度作為模型的輸入參數,通過對比實驗以及對實驗結果進行分析,驗證該模型的可行性。
2.1 數據集介紹
評估T-GCN模型在實際數據集(SZ-taxidataset)上的預測性能后,說明數據集與交通速度有關。在不損失概括性的前提下,實驗部分使用了交通速度作為交通信息。
數據集SZ-taxi為2015年1月1日至1月31日深圳出租車軌跡。選擇羅湖區156條主要道路作為研究區域,實驗數據主要包括兩部分:一個是一個156*156的鄰接矩陣,描述了道路之間的空間關系,每一行表示一條道路,矩陣中的值表示道路之間的連接性:另一個是特征矩陣,描述了每條道路上的速度隨時間的變化,每一行代表一條路,每一列是不同時段道路上的交通速度。每15min計算一次每條路上的車速。
2.2 實驗參數設置
本文基于Tensorflow框架實現GCN模型,主要設計的參數有:批量大小、隱藏層數和訓練周期。其中隱藏層數的不同對預測結果的準確性有很大的影響,通過實驗不斷調整隱藏層數來選取最優值,當批量大小為64、訓練周期為1000、隱藏層數為32時為最佳組合。
2.3 基準方法
本文將GCN模型在S-taxi數據集上進行訓練,并與以下基準方法進行了比較:
ARIMA:自回歸平均滑動法。將觀測到的時間序列擬合為參數模型,預測未來的交通數據。
HA:歷史均值法。將歷史的交通信息作為輸入預測未來的交通數據。
LSTM:長短時記憶網絡。由遺忘門、輸入門、輸出門組成的一種特殊的RNN模型。
本文采用平均絕對誤差(MAE)、均方誤差(RMSE)和準確性(ACC)3個評價指標來驗證模型(RMSE、MAE都是進行測量預測誤差的,數值越大表示預測效果越差,數值越小表示預測效果越好:準確性表示預測準確精度)。具體的計算公式為:
2.4 實驗結果及分析
將GCN模型在S-taxi數據集上進行訓練,并與3個基準方法進行了比較。本文選用總數據集的80%作為訓練數據集的輸入,20%作為測試數據集的輸入。
交通預測對比試驗數據見表1.從表中可以看出,傳統的預測模型由于自身建模能力的不足,導致預測效果和真實的數據有很大的差別。GCN的RMSE、MAE比ARIMA數值低,ACC提高了47.84%;GCN的RMSE、MAE比HA數值低,ACC提高了22.59%;GCN的RMSE、MAE比LSTM數值低,ACC提高了12.07%。
一天中的交通預測結果與真實值的比較,如圖3所示。從圖中可以看出,該模型在一天當中的預測結果與數據真實值較為接近。說明GCN模型可以通過訓練獲得最佳的預測性能。
3 結束語
本文提出一種新的圖卷積神經網絡模型。在真實的數據集上對路網交通速度進行預測,該模型采用拓撲圖結構的形式作為模型的輸入,解決了傳統卷積神經網絡不能輸入非規則數據的問題。實驗結果表明,本文提出的模型預測準確度相對優于現有的預測模型,具有較高的魯棒性。未來將優化圖卷積模型,進一步提高模型的預測準確性。