




摘要 文章針對城市公交OD客流預測問題,提出了一種融合圖注意力網絡和多源數據的時空客流預測模型。首先,通過構建時空圖注意力網絡模型STGAT(Spatio-Temporal Graph Attention Network),引入圖注意力機制自適應學習站點間的影響權重;然后,引入站點POI等空間特征增強模型的解釋性;最后,通過案例分析表明,所提出的STGAT模型在客流預測的精度和穩定性方面均優于其他主流方法。
關鍵詞 公交客流預測;圖注意力網絡;時空依賴;POI
中圖分類號 U121 文獻標識碼 A 文章編號 2096-8949(2024)24-0046-03
0 引言
近年來,城市規模不斷擴大,人口數量持續增長,由此帶來的交通擁堵、環境污染等問題日益嚴重,已成為制約城市可持續發展的關鍵因素,因此準確預測公交客流需求,特別是OD(Original Destination)客流分布,是制定公交合理調度方案的前提。
Yang[1]等人利用LSTM神經網絡模型處理時間序列的優勢,提出了ELF-LSTM遞歸神經網絡模型對短時OD客流進行預測,該模型克服了因時間滯后導致的長時間依賴性學習不足的局限性;侯曉云[2]等人將MLR、KNN、XGBoost和LSTM進行集成,通過預測結果對比發現集成模型的預測效果優于子模型;Yang[3]等人提出了一種基于時間的城市軌道交通客流分層網絡模型,該模型在深度優化框架下,能夠有效地獲得相對準確的客流估計結果。
該文提出一種融合圖注意力網絡和多源數據的時空客流預測模型,通過對北京公交1路車IC刷卡數據和站點POI數據的分析,揭示客流在時空維度上的分布特征;通過構建時空圖注意力網絡模型,引入圖注意力機制自適應學習站點影響權重,結合門控循環單元捕捉客流時序依賴,并引入POI等空間特征增強解釋性,最后通過案例驗證所提模型在預測精度和穩定性方面的優異
性能。
1 相關理論與數據準備
1.1 公交IC刷卡數據
該文采集了北京公交1路車IC刷卡數據及各站點附近的POI情況,然后利用公交線路和站點基礎信息匹配其站點名和站點編號,從而得到模型和算法可用的OD矩陣數據,最后基于線路站點基礎信息中匹配的站點名和站點編號,根據運營時間每小時將矩陣數據生成一個矩陣,一天運營時間為5:00—24:00,所以一天共有19個矩陣。
使用Arc GIS的緩沖區分析工具,建立北京公交1路車各站點500 m范圍內的緩沖區,通過對七種不同類型的POI數據進行KMO和巴特利特檢驗,逐步剔除關聯不大的POI類型,最終確定五種與客流相關性較大的POI,分別是醫療保健、體育休閑服務、科教文化、購物、商務住宅,其中KMO檢驗值為0.86(gt;0.6)、Bartlett球形檢驗概率值為0.000(lt;0.01),可以判斷相關系數矩陣不是單位矩陣,原始變量存在相關關系,可以對客流的吸引力進行解釋。
1.2 POI權重分析
POI,全稱為“Point of Interest”,可以泛指所有能夠抽象為點的地理實體,該文采用相關系數法,即以POI核密度與客流量之間的相關系數為權重[4],通過GIS進行疊加分析,確定各類POI數據的權重,在各類POI數據分級評分的基礎上對各類POI數據的分析結果進行加權疊加,最終得到這五種類型的POI權重如表1所示:
將POI權重分析的結果與前文的客流時空分布特征分析結果進行結合,發現不同站點的客流不均勻性與周邊POI的豐富性和類型密切相關。
2 基于時空圖注意力網絡的OD客流預測
STGAT通過引入圖注意力機制刻畫各站點之間的空間依賴,并使用門控循環單元捕捉客流在不同時間尺度上的演變規律。
(1)模型輸入與圖構建。該文將道路網絡定義為一張有向帶權圖G=(V, E, A),其中,V=v1,v1,…,vN,表示N個公交站點的集合;E表示站點間的連接關系;為鄰接矩陣,表示站點間的距離;在每個時間步t,輸入表示N個站點的P維特征,包括各站點的進出站客流量、POI密度及相應權重。
(2)時空卷積層。圖注意力模塊負責對站點間的空間依賴進行建模,其計算過程可以表示如下:
(1)
式中,——第l層空間卷積后站點的特征向量;——可學習的權重矩陣;——站點對站點的注意力權重;Ni——站點的鄰居集合。
在對站點信息進行空間聚合后,通過門控循環單元進一步對時序信息進行建模,而對于STGAT的GRU門控機制,則通過更新門zt和重置門rt控制其隱藏狀態的信息流:
(2)
(3)
(4)
(5)
式中,xt——t時刻的輸入;——上一時刻的隱藏狀態。
對于預測未來個時間步的客流分布,則STGAT的輸出可以表示如下:
(6)
式中,Th——歷史時間步數。
(3)模型訓練與優化。模型以端到端的方式進行訓練,以各站點歷史客流數據為輸入,以未來Tp個時間步的OD矩陣為監督信號。其中,Xt分別為時間步t的真實OD矩陣,Tp為預測時間步數。
3 案例分析
STGAT模型的實例驗證選取2019年北京市公交1路車上行方向的OD客流量數據,對數據集進行劃分,將1—11月數據作為訓練集、12月前三周數據作為測試集、12月第四周數據作為預測集,分別采用CNN、RNN、LSTM、GCN這四種預測模型對OD客流進行預測對比分析,見圖1所示。
STGAT模型的驗證選取2019年北京公交1路車下行方向的OD客流量數據,經過上述對數據的處理可以得知,同樣采用CNN、RNN、LSTM、GCN這四種預測模型對OD客流進行預測對比分析,見圖2所示:
圖1和圖2分別展示了各模型在北京公交1路車上、下行方向OD客流預測中的性能對比。從圖中可以看出,STGAT模型的預測結果最接近真實值,對客流量的變化趨勢和峰值捕捉得最為準確。其次是GCN和LSTM模型,它們雖然在一些時段的預測值與真實值有所偏離,但總體上仍然能夠較好地擬合客流量的變化趨勢。
各模型評價指標對比如表2所示:
由表2中的評價指標比較表明,在北京公交1路上、下行方向的OD客流預測中:STGAT模型在該數據集上的預測性能最優,這表明STGAT模型能夠很好地捕捉數據的內在模式和趨勢。
4 結語
時空客流預測模型STGAT通過構建時空圖注意力網絡,引入圖注意力機制自適應學習站點之間的影響權重,捕捉客流在時空維度上的演變規律,同時結合站點POI等空間特征,增強了模型的解釋性。
參考文獻
[1]Yang D,Chen K,Yang M,et al.Urban rail transit passenger flow forecast based on LSTM with enhanced long-term features[J].Intelligent Transport Systems,IET, 2019,13(10): 1475-1482.
[2]侯曉云,邵麗萍,李靜,等.基于深度學習的城市軌道交通短時客流起訖點預測[J].城市軌道交通研究, 2020(1):55-58+115.
[3]Yang Y,Liu J,Shang P,et al.Dynamic Origin-Destination Matrix Estimation Based on Urban Rail Transit AFC Data: Deep Optimization Framework with Forward Passing and Backpropagation Techniques[J].Journal of Advanced Transportation, 2020:1-16.
[4]何惠雨,付曉,呂啟航.突發事件影響下的城市居民出行活動時空模式研究[J].時空信息學報, 2024(2):259-268.