楊晨曦,莊旭菲,陳俊楠,李 衡
內蒙古工業大學信息工程學院,呼和浩特 010080
優先發展城市公交系統,提高其服務質量和吸引力,可以減少私人車輛的使用,從而達到緩解交通擁堵、提高城市公共服務水平、節約資源和保護環境的目的。時間可靠性是衡量公交系統服務質量的決定性因素之一,主要體現為對公交行駛軌跡的準確預測,即對公交線路上的重要位置點(站點或道路交叉口)進行準確的公交到達時間(bus arrival time,BAT)預測。由于公交旅行時間(bus travel time,BTT)計算為公交車從某一軌跡點行駛到目標軌跡點的總時間[1],故可以將公交行駛軌跡預測、BTT預測和BAT預測視為同一問題的不同描述。準確預測BAT的重點在于合理選擇影響因素,收集有效的觀測數據并進行數據預處理,最終研究合適的預測模型。如圖1簡述了BAT預測問題的研究方法。

圖1 BAT預測問題的研究方法Fig.1 Research method for BAT prediction problem
近年來,眾多學者在BAT 預測領域進行了大量研究,利用交通數據設計了一系列算法和模型。同時,也有一些學者對這些方法進行了總結。柏夢婷等人[2]主要對高速公路上的行程時間預測方法進行了總結分析,對城區內的公交行程時間預測方法分析較少。Abdi 等人[3]對不同場景下,包括公交車在內的各種類型車輛的出行時間預測方法進行了總結,但對基于深度學習的BAT 預測方法分析不足。Singh 等人[4]總結了使用機器學習算法和基于深度學習模型的BAT預測方法,但對基于深度學習的組合模型討論較少,也缺少對圖神經網絡在BAT預測領域的分析。隨著深度學習領域的發展,越來越多的學者應用并改進了相關的模型算法進行BAT預測,并且嘗試將不同的模型組合進一步提高預測精度,其中將空間特征提取模型和時間特征提取模型進行進行組合,引起了廣泛關注。
本文回顧了近年來BAT預測領域的相關研究文獻,討論了相關研究所涉及的影響因素和數據集,分析了這些研究所使用的模型方法并總結為歷史平均模型、參數模型和非參數模型三大類。參數模型包括回歸模型和時間序列模型,非參數模型以基于人工智能的模型為主,包括使用機器學習算法和基于深度學習的模型。本文重點闡述了基于深度學習的BAT預測方法,對比了各類方法的優勢和局限性。最后,列舉了BAT預測模型的評價指標,總結了當前BAT預測領域中所面臨的挑戰、存在的問題和未來的研究方向。
高質量的公交運行數據集對于建立BAT 預測模型和獲得更為準確的預測結果有著重要意義。BAT 預測模型的構建依賴于公交歷史運行數據,將一些可以收集并且對公交運行有著一定影響的因素構建為輔助數據集,與公交歷史運行數據相結合輸入模型會提高預測精度。使用各種數據預處理方法可以提升數據集的質量,進一步改善模型的性能。
(1)基于GPS的公交車運行數據
通過部署GPS定位系統等數據收集設備,可以收集公交車的GPS軌跡數據、車輛自動定位(automatic vehicle location,AVL)數據和乘客自動計數(automatic passenger counting,APC)數據。GPS軌跡數據針對公交在線路上的運行狀況,以一定的采樣頻率記錄公交車在行駛過程中的經緯度坐標、時間戳、速度和方向角等實時信息。AVL 和APC 系統則重點收集公交車在站點處的信息,如公交車到站和離站時間、下車乘客人數等。
(2)其他類型數據集
有一些研究使用交通監控攝像頭記錄的數據[5-6]、射頻識別(radio frequency identification,RFID)數據[7],以及通過乘客手機應用程序收集的數據[8]等其他類型的數據。交通監控攝像數據由部署在公交線路途經站點和交叉口等重要位置點的交通攝像頭采集獲得,利用目標檢測技術識別公交車及其車牌,結合攝像頭的經緯度位置信息和數據記錄時間戳,可以得到公交車在不同數據采集點間路段的旅行時間,為預測公交到達線路上數據采集點的時間提供數據支撐。RFID數據可以通過公交車上的RFID電子標簽和路側的RFID讀卡器,準確獲取公交車的運行軌跡。有的研究[8]開發了面向乘客的手機應用程序,收集乘客提供的出行信息,調用手機的GPS并以一定的采樣頻率獲取公交車的實時位置和速度等數據,這可以視為車載定位設備。
輸入BAT 預測模型的影響因素可以分為靜態因素和動態因素兩類,或者根據其在現實中的影響對象分為公交車運行因素、城市道路交通因素和增強因素。表1對BAT預測模型的影響因素進行了詳細的梳理。有的研究還提到了司機駕駛特征[9],將其分為正常、粗魯和緩慢三種類型[3]。粗魯的司機往往反應迅速,在同一個區域,一個粗魯的司機會比一個正常或緩慢的司機更早到達目的地。

表1 公交行駛軌跡預測模型的影響因素Table 1 Influencing factors of bus travel trajectory prediction models
影響因素通常需要進行處理后才能輸入模型。對于線路長度、站點和交叉口數量以及溫濕度等有具體取值的連續變量,可以直接輸入模型或使用Z分數進行標準化。而對于天氣狀況、工作日與節假日以及一天中的時段等分類變量,通常使用以下幾種方法:對于天氣狀況等存在有序關系的因素,使用標簽編碼將類別映射到整數;使用One-Hot編碼將分類變量轉化為二進制向量,但處理如時段等存在多個類別的分類變量時,會導致數據維度增加,浪費存儲和計算資源;使用Embedding方法將類別映射到連續向量空間,在降低數據維度的同時將具有相似語義的分類值嵌入到相近位置。
數據清洗方法可糾正原始數據集中存在的缺失、異常和重復等數據不一致現象,并根據預測模型的輸入要求,可進一步執行聚類操作對數據集進行劃分。
插值法和歷史平均法分別基于近期和過去同時期的公交運行狀況補充缺失數據,平滑方法可以去除原始數據集中的噪聲和存在異常的數據點。主成分分析(principle component analysis,PCA)可以去除高度相關的重疊信息并降低輸入特征的維度,以提高數據有效性[10]。謝智穎等人[11]提出了基于時空相關性的公交大數據清洗方法,并通過實驗證明了對公交數據進行清洗可以提高模型預測精度。
Zhang 等人[12]依據公交運行時間,采用K-means 算法將所有樣本數據劃分到分別表示低峰、平峰、小高峰和高峰的四個簇中。Khetarpaul等人[13]應用模糊可能性C-means(fuzzy possibilistic C-means clustering,FPCM)算法將公交行程分為準點、晚點和提前到站三種情況,其中FPCM 算法使每個數據點與每個聚類有特定的隸屬度級別,同時可以識別數據集中的異常值與噪聲點。He 等人[14]和Alkilane 等人[15]均通過非負矩陣分解(nonnegative matrix factorization,NMF)算法識別公交車在不同路段上的相似出行時間范式,并以此為依據將出行時間范式相同的路段劃分到一個簇中。
通過分析不同路段上的相似交通模式,將公交線路中的路段進行聚類,反映了公交出行時間的變化趨勢,對于提高預測精度有著積極的影響。
公交軌跡由公交車的時間和空間信息構成,公交行駛軌跡預測問題可以視為確定公交線路上的某一具體位置,預測對應的BAT。近年來,學者們在BAT 預測領域提出了一系列的預測模型和算法,這些方法的分類如圖2所示。在非參數模型中,由于深度學習技術的不斷發展以及基于深度學習的相關模型在時間序列預測研究中展現出來的優越性能,基于深度學習的模型成為如今BAT預測領域中最受學者們歡迎的方法之一,并且從應用單一模型逐步轉變為研究能夠捕獲城市道路空間相關性和公交運行時間相關性的組合模型。

圖2 預測模型分類Fig.2 Prediction models classification
歷史平均模型假設預測時間段的交通狀況與過去同時期基本一致[16],依托于大量歷史數據取平均值對公交到達時間進行預測。根據使用的歷史數據類型,可分為平均出行時間法和平均速度法。
Chung等人[17]基于歷史行程時間和當前的運行條件計算公交車的到達時間。與實時數據相結合可以提高預測精度,Gong 等人[18]將公交車的歷史運行數據與實時運行數據進行加權處理并利用實時信息對預測結果進行對比反饋,提高了到站時間的預測精度。
歷史平均模型不能反映間歇性外部影響(如交通事故和交通擁堵)引起的交通時間變化,而城市交通網絡有著實時交通狀況復雜的特點,從而導致該類模型的魯棒性較差。在近年來的研究中,該類方法通常作為基線模型以將預測結果與其他方法進行比較。
參數模型可以通過結構化表達式和一組參數來表示,通常假設數據服從某種分布。該模型需要定義輸入變量和目標變量(輸出)之間的關系,并仔細確定參數,參數通常由實驗測量或理論計算得到,其維度空間是有限的。參數模型主要分為回歸模型和時間序列模型。
2.2.1 回歸模型
線性回歸模型是最具有代表性的一類參數模型,它基于自變量和因變量之間的線性關系,其中交通狀況和外部因素被合并為自變量[19]。
Qi 等人[20]將站間距離、站間出行時間、站間交叉口數、交叉口交通量和交通信號配時方案這五個因素作為輸入變量,提出了基于回歸分析的公交站間出行時間預測模型。Zhang等人[21]應用了基于交通流理論的非線性回歸模型,提出了一種在上游信號交叉口和周邊交通流共同影響下的公交到站時間預測模型。然而,回歸模型對公交出行時間的預測結果因自變量組合的不同而有所差異,尤其是在交通狀況復雜且通常伴隨嚴重擁堵的城市道路中,模型的輸入變量具有高度的不確定性并遵循復雜的關系,這會導致模型的預測精度較低。
2.2.2 時間序列模型
時間序列模型包括卡爾曼濾波(Kalman filtering,KF)模型、自回歸綜合移動平均(autoregressive integrated moving average,ARIMA)模型和粒子濾波模型(particle filter,PF)。
Reinhoudt等人[22]首次將KF算法引入公交到站預測研究中。Vanajakshi等人[23]將線路等長劃分,使用KF模型預測公交出行時間。Wang 等人[24]在KF 算法中加入遺忘因子,降低了交通信息對預測模型的影響,并提高了多步預測的精度。由于KF 模型通常使用線性濾波器,因此很難捕捉和預測城市公交系統中復雜的非線性動態特征,為了克服這一點,可以推廣到擴展卡爾曼濾波模型[25],但當多個路段同時產生結果時,計算成本則會迅速增加[26]。
ARIMA 模型是一種基于時間序列的統計模型,早期研究使用單變量ARIMA模型預測行程時間[27]。季節ARIMA 模型加入了季節性因素,根據季節差異進行了修改[28]。Xiang等人[29]結合遺傳算法(genetic algorithm,GA)構造GA-ARIMA 模型預測公交到站時間,其結果優于傳統的時間序列模型。然而ARIMA模型是基于線性時間序列關系的假設構建的,無法捕獲非線性關系,同時還要求輸入序列數據是穩定的。
粒子濾波更適用于處理非線性和非高斯系統。任遠等人[30]基于粒子濾波預測公交到站時間并與KF算法進行對比,結果表明PF算法有著更高的預測精度、更好的適用性與穩定性。Dhivyabharathi 等人[31]將路段進行等長度劃分后應用粒子濾波算法,并使用KNN 算法獲取輸入,以預測高度可變交通情況下的公交車出行時間。然而粒子濾波算法在高維狀態空間中的計算復雜性較高,隨著迭代次數的增加,有可能出現粒子退化現象。
非參數模型不假設特定的數據分布,其結構或相應的數學函數不是預先確立的。非參數模型是由收集的數據而不是預先確定的分布決定的,因此與其他方法相比,非參數模型需要更多的數據。非參數模型包括支持向量機、人工神經網絡等淺層機器學習模型和基于深度學習的模型。
支持向量機(support vector machine,SVM)可以較好地解釋影響因素和公交行程時間之間的非線性關系,是公交行程時間研究領域常用的模型之一。Yu 等人[32]以大連市的一條公交線路為例進行實驗,證明了超參選擇合適情況下,SVM 模型可以較為準確地預測公交到站時間。構造改進的SVM 模型或與其他模型組合,可以獲得更好的預測結果。Yu 等人[33]將遺忘因子加入SVM模型來預測公交出行時間,提高了SVM的預測準確度。柏叢和彭仲仁[34]建立了基于SVM-KF 的動態模型預測公交行程時間,其中SVM 使用歷史數據進行靜態預測,KF 依據最新的數據對靜態預測結果進行調整。Hashi等人[35]在SVM-KF模型的基礎上使用遺傳算法優化SVM 參數,進一步提高了模型的準確度。由于SVM 過于依賴核方法,在大規模問題中擴展性差。當面對高維、大規模數據時,會導致模型的計算量增大和預測結果的精度降低。隨著公交歷史數據和其他交通信息的海量積累,基于SVM 的模型已不適用于公交出行時間預測。
人工神經網絡(artificial neural network,ANN)可以捕捉交通問題中存在的非線性和隨機情況。BP神經網絡(back propagation neural network,BPNN)是一種特定類型的ANN,在訓練過程中使用反向傳播算法來更新權重。Chen等人[36]利用APC數據研究了基于ANN的公交到站時間預測模型,并考慮了天氣因素的影響。Hua等人[37]基于前一站點的多線路公交到站時間數據,使用ANN 預測公交車到達目標站點的時間。Zhang 等人[12]將公交運行數據按照時段劃分為多個聚類,對每個聚類建立一個BPNN模型進行預測。Kee等人[38]將公交到站時間預測問題轉換為一個多標簽分類問題,并考慮了日期和高峰時段等影響因素,實驗結果表明,ANN優于決策樹、隨機森林和樸素貝葉斯等算法。雖然ANN能夠使用簡單的體系結構對復雜和非線性行為進行建模。然而,對于日益復雜的城市交通場景,這些模型可能不足以提供高精度的預測結果。隨著深度學習的高速發展,ANN在BAT領域的應用顯著減少,在大多數情況下作為基線模型。
歷史平均模型、參數模型和淺層機器學習模型等一系列基于非深度學習模型的BAT預測方法對比分析,如表2所示。總體來說,SVM和人工神經網絡這類基于淺層機器學習的模型在BAT預測中,在處理復雜的非線性關系、預測任務涉及大規模數據集和特征抽取時,一般要優于歷史平均模型、回歸模型和時間序列模型。

表2 基于非深度學習模型的BAT預測方法總結Table 2 Summary of BAT prediction methods based on non-deep learning models
深度學習是機器學習的重要分支,是近年來的研究熱點,將深度學習應用在BAT預測領域,提出并使用了基于卷積神經網絡(convolutional neural network,CNN)的方法、基于循環神經網絡(recurrent neural network,RNN)及其變體的方法和基于組合模型提取時空特征的方法。
CNN已經在計算機視覺領域取得了重大突破和進展。在BAT 預測領域,已有一些學者探索了基于CNN的方法。
Panovski 等人[39]創建了交通密度矩陣(由若干模擬交通信息組成,每個模擬交通信息是由時間和站點數量構成的二維矩陣),將模擬交通信息視為灰度圖,在時間和站點維度上執行卷積操作,基于CNN 構建了用于預測線路上所有站點到達時間的運營商數據模型。但是該模型的輸入并沒有考慮外部因素,也忽略了模擬交通信息中存在的全局時序模式。
Nithishwer 等人[40]將公交線路分段處理,將路段過去三小時的歷史行程時間數據以張量形式輸入所構建的CNN 模型中,來獲取這些路段在未來一小時內行程時間的預測結果。同時,從數據集中提取了時段、日期和空間模式具有高度相關的路段等額外信息輸入模型,以進一步提高模型的預測精度。由于忽略了線路上如交叉口等重要位置的影響以及每日的高峰時間段,導致模型預測交通峰值時間內對包含主干道路交叉口的路段行程時間有著較高的誤差。
Paliwal 和Biyani[41]應用Mask-CNN 模型對公交車的站間行程時間進行預測。模型的輸入是由公交站間行程時間構成的二維矩陣,行和列分別表示公交車的運行次數和線路站點數。他們所使用的Mask-CNN 架構是一個七層的全卷積網絡,可在整個層中保持其輸入的空間分辨率,并在每個位置輸出條件分布,通過使用掩碼卷積保證預測的因果關系(即當前路段的行程時間依賴于前序路段的行程時間)。最終,該模型的輸出以離散值的形式模擬了任意兩個站點之間的出行時間。Mask-CNN的結構相對來說更為復雜,并且只考慮了公交車的歷史運行數據,忽略了一系列外部影響因素對公交行程時間的影響。
由于傳統CNN在捕捉時序信息和處理變長序列方面存在局限性,時間卷積網絡(temporal convolutional network,TCN)是CNN在處理時間序列數據上的一種改進模型,通過引入因果卷積和膨脹卷積,可以捕捉長期依賴關系并保持序列的因果性質。徐丸絮[42]結合TCN和時間注意力機制(temporal pattern attention mechanism,TPA),對公交車的行程時間進行預測。TCN通過對歷史數據進行因果卷積計算后,傳遞給TPA的時間模式捕捉層,通過卷積操作提取時間模式信息,最終,通過注意力系數計算層獲得權重系數并求得最終輸出。但是因果卷積只能捕捉歷史時刻的時間相關性,忽略了公交運行過程中存在的反向規律性。
在BAT 預測領域,基于CNN 的模型已經取得了一定的成果,但由于時間序列數據的特殊性質和CNN 的結構特點,其在處理時間數據方面還存在一些挑戰。學者們探索了許多解決方案,包括設計針對時間序列數據的TCN,利用CNN 有著提取空間特征的特點和循環神經網絡等模型融合,充分利用它們在空間和時間特征捕捉方面的優勢,從而提升模型的性能。
RNN 與其他類型的神經網絡相比,提供了一種處理時間序列數據和學習長期依賴關系的有效方法,是一種專門設計用于處理具有時序關聯數據的模型。BAT預測問題作為時間序列預測問題的一類,RNN 及其變體也得到了廣泛的應用。Raut 和Goyal[43]使用RNN 預測公交車的到站時間,將目標線路上的天氣情況作為外部影響因素考慮在內。他們依據當地的實際氣候將一年分為夏季、雨季和冬季,通過數據挖掘獲取每類季節的天氣變化量,并利用歷史數據作為訓練數據來對不同天氣條件下的公交到站時間進行預測。Pang 等人[44]利用多個途經站點所構成時間步長之間的長期依賴關系,通過RNN預測公交到站時間,并使用One-Hot編碼將公交歷史運行數據和城市道路基礎信息等異構數據融合到同一的向量空間以輸入模型進行預測。雖然傳統RNN 結構對于短期記憶具有較好的捕捉能力,但在處理長序列時,較早時間步的信息可能會逐漸被遺忘,這可能導致模型難以捕捉長時間跨度內的模式,從而影響模型的預測能力。
長短期記憶神經網絡(long short-term memory,LSTM)是一種特殊形式的RNN,能夠捕捉時間序列問題的非線性行為并學習長期依賴信息,是為了解決傳統RNN 在訓練過程中的梯度消失和梯度爆炸而開發的,因此越來越多的學者應用LSTM預測BAT。
LSTM是一種具有門控機制的循環神經網絡,輸入門控制輸入信息的更新,遺忘門決定細胞狀態中哪些信息要被遺忘,輸出門控制輸出細胞狀態的選擇。通過這種機制,LSTM能夠有效地處理長期依賴和記憶問題。
葉之放[45]將影響公交車運行的動、靜態因素與歷史GPS數據融合,建立了基于多源公交數據的LSTM模型對公交到站時間進行預測,其預測結果優于KNN、SVR和BP 神經網絡。Agafonov 和Yumaganov[46]使用LSTM模型預測單條線路中公交車到達每個剩余站點的時間,并將公交車的實時數據和統計信息等一系列能描述交通流的異構信息作為模型的預測影響因素,實驗結果表明了LSTM模型有著更高的預測精度,且計算時間也能滿足實時狀態下的公交到站時間預測。學者們結合外部影響因素和公交歷史數據,應用LSTM 模型在解決BAT預測問題中取得了較好的結果,但應用各種改進方法還能進一步提高模型的性能和預測結果準確度。表3對一些基于LSTM 模型的改進公交出行時間預測方法進行了分析和總結[26,47-55]。

表3 基于改進LSTM的BAT預測方法Table 3 BAT prediction methods based on improved LSTM
對表3 中的預測方法進行對比分析,將基于LSTM模型的BAT預測方法的改進方向分為以下幾類。
(1)將線路視為路段的集合,按照路段的類型劃分為若干子集,為每類路段構建模型并行預測最終將各個結果聚合。Han等人[47]將單條線路的行程簡單劃分為站間行駛時間和站點停留時間,并沒有考慮不同路段的交通模式。而He等人[14]則拓展到出現同站換乘行為多線路公交出行,并且依照不同的交通模式對不同路段進行分類,為每一類路段構建一個LSTM 模型,最終相加計算總行程時間。總體來說,利用不同公交運行路段上的相似交通模式雖然可以提高模型的預測精度,但僅使用LSTM 模型無法捕捉不同路段之間可能存在的空間關系,同時將路段按照交通模式進行分類組合會改變公交線路中的路段順序,破壞公交線路的空間連通性,忽略了空間上相鄰路段的交通模式在時間上存在的依賴關系。
(2)將其他類型的模型算法,如變分模態分解(variational mode decomposition,VMD)算法、粒子濾波和卡爾曼濾波算法、優化算法等與LSTM 相結合,可以進一步提升模型的性能和預測結果的準確度。Zhou 等人[48]構造了VMD-LSTM模型,Bharathi等人[56]則進一步考慮了預測中的不確定性,將基于分位數回歸的損失函數與LSTM 模型結合,使用速度和交通流時間序列數據,預測車輛出行時間的預測區間。不同于文獻[49]將多個LSTM 的預測結果作為粒子濾波算法的輸入,Liu等人[57]使用卡爾曼濾波算法消除原始數據集中的噪聲后輸入LSTM。Jiang 等人[58]和張兵等人[50]分別使用遺傳算法和改進的海鷗算法對模型的超參數進行尋優,有效降低了出現局部最優和過擬合現象的概率。
結合VMD算法雖然可以捕獲公交速度序列中的時間模式和空間模式,速度序列是由每個路段的平均公交速度組合的,只能粗略反映不同路段間的交通波動,且VMD-LSTM 模型的計算復雜度相對較高。將KF 算法與LSTM結合僅在數據集處理方面進行了改進,并沒有提升模型捕獲時間相關性的能力。LSTM 串聯粒子濾波算法雖然避免陷入局部最優解,但沒有對LSTM本身進行改進,同時構建多個LSTM 模型會增加計算成本。同理,優化算法也僅僅對參數進行尋優,沒有改進模型的結構。
(3)對LSTM 模型的結構進行改進,改進的模型包括增加注意力機制的LSTM、結構簡化的門控循環單元(gate recurrent unit,GRU)、能捕捉序列中反向依賴的雙向LSTM(bidirectional LSTM,BiLSTM),以及結合了CNN 提取空間特征能力,可以提取輸入數據時空相關性的卷積LSTM(ConvLSTM)。
Chawuthai 等人[59]將自注意力層置于LSTM 之前計算輸入數據的權重,而姚江濤等人[51]則分別使用普通注意力機制和自注意力機制計算不同特征對公交行程時間的影響程度以及不同時刻BiLSTM 輸出隱狀態的權重。將LSTM 模型作為編碼器和解碼器的基礎結構并引入雙階段注意力機制,構造了基于雙階段注意力機制的循環神經網絡(dual-stage attention-based recurrent neural network,DA-RNN)。Leong等人[60]和Zhou等人[52]使用DA-RNN模型預測公交車到站時間,賀光焰[53]構造了融合宏觀因素的DA-RNN 模型(macro factors integrated DA-RNN,MDARNN)對涉及換乘的多線路公交出行時間進行預測。基于注意力機制的改進使得模型關注與預測結果高度相關的特征,進一步提高模型捕獲長期依賴的能力,但忽略了公交運行的空間特征。
Xie等人[61]考慮了影響公交運行的靜態與動態因素,分別基于LSTM、GRU、BiLSTM 和ConvLSTM 等模型預測公交到站時間,對比實驗結果表明ConvLSTM模型的預測精度最高。Wu等人[54]通過實驗證明了ConvLSTM結合自注意力機制可以進一步提高預測精度。賴永炫等人[55]使用ConvLSTM 分別捕捉站點停留和站間行駛時間的時空相關性,預測出停留時間和行駛時間參數,結合天氣等外部特征輸入LSTM 中預測公交車在線路上的運行總時間。然而ConvLSTM 模型只能關注公交線路中鄰接站點或路段的局部空間特征,無法提取整條線路中不同地理位置間的全局空間特征,而這些全局特征信息對預測結果有著重要影響。
在BAT預測問題中,基于循環神經網絡和其改進的模型方法已經取得了不錯的成果,但這些方法通常只關注公交歷史行程的時間維度,而忽略了空間維度上的特征。雖然ConvLSTM 模型通過引入卷積操作擁有了提取空間特征的能力,但通常只能提取線路空間中的局部特征,同時也無法考慮具有共同路段的其他線路的影響。隨著相關研究從預測單條線路的公交到站時間拓展到預測出現換乘行為的多線路公交出行時間,空間模式也由單條線路擴展到多條線路構成的公交網絡,提取不同線路和站點間的空間相關性對于準確預測公交行程時間非常重要。針對上述問題,學者們將能夠提取空間特征的模型和能夠提取時間特征的模型結合,利用城市公交網絡中存在的時空相關性,對公交車的行程時間進行預測。表4 列舉了一些使用可提取時空特征組合模型的BAT預測方法[15,62-67]。

表4 基于可提取時空特征組合模型的BAT預測方法Table 4 BAT prediction methods based on extractable spatio-temporal feature combination model
對表4 中所列舉的基于可提取時空特征組合模型的BAT預測方法進行分析對比,可以發現在這些組合模型中,時間特征通常由循環神經網絡或其變體模型進行提取,而空間特征通常由基于CNN 的模型或基于圖神經網絡(graph neural network,GNN)的模型進行提取。對于單條路線來說,整個道路中的重要地理位置(如站點、交叉口和路段等)間的空間關系較為簡單,通常應用CNN進行空間特征的提取。而考慮到由多條線路組成的公交網絡,不同線路與站點間的空間關系復雜,通常使用GNN相關模型進行空間特征提取。
Wang等人[68]首先提出了一個用于預測車輛出行時間的深度學習框架(deep learning framework for travel time estimation,DeepTTE),該框架通過使用1D-CNN構造地理卷積捕獲車輛GPS軌跡序列之間的空間特征,使用LSTM模型提取時間相關性來預測行程時間,并將外部影響因素使用Embedding 方法轉換為低維向量后輸入模型。Zhang 等人[69]和Lee 等人[64]只收集站點處的公交運行信息構造公交軌跡序列,基于DeepTTE 模型預測公交車的行程時間。其中Zhang等[69]人分別預測站間出行時間和站點停留時間,而Lee 等人[64]在構造公交歷史軌跡序列時將二者結合,減少了模型計算量和訓練時間,模型結構如圖3 所示。付麗萍[65]結合線路上公交車和其他社會車輛的軌跡數據,使用由兩個卷積層、兩個池化層和一個上采樣層構成的CNN 提取空間特征,并使用GRU 提取時間特征,有效減少了計算量和訓練成本。

圖3 用于預測公交出行時間的深度學習框架Fig.3 Deep learning framework for bus travel time estimation
對于由GPS點組成的軌跡序列,可依據坐標將軌跡序列直接映射到二維網格中,使用2D-CNN提取空間特征。若網格設置過大會導致多個坐標點映射重合,在執行卷積操作時有可能會忽略重要的空間特征。而網格設置過小會導致整個空間信息稀疏,難以提取所需的空間特征。只收集公交在站點處的軌跡數據構造軌跡序列,將每個站點映射到一個網格,使用1D-CNN 構造地理卷積提取公交站點序列的空間特征,可以有效避免上述兩種情況。然而這種方法忽略了站點之間的路徑特征,同時僅適用于提取單條公交線路中的空間特征。由于網格順序反映了線路站點順序,若擴展到公交網絡考慮其他線路公交車在重疊路徑上的影響時,難以對站點進行建模。由于公交網絡的拓撲結構相對清晰,由站點、線路和路段等元素構成且它們之間的連接關系明確,可用圖結構對城市公交網絡進行建模。GNN 是一種用于處理圖結構數據的深度學習模型,由于城市公交網絡可以用圖結構表示,故GNN 也可以用來捕獲空間特征[70]。GNN 相關模型已經在道路交通流預測領域中取得了進展,在BAT預測問題的研究中,越來越多的學者開始將目光投向GNN相關的網絡模型。
Ma 等人[66]針對單條線路,利用公交GPS 軌跡數據提取站點和交叉口并通過一種節點提取算法將站點之間的路段提取為公交網絡圖的節點,通過構造多重加權鄰接矩陣來表示不同節點之間距離、路徑長度的相似性和交通狀況。而Liu等人[67]則額外考慮了與目標線路有著重疊路段的其他線路,將站點作為圖的節點,并通過設置距離閾值判斷兩個節點之間是否構成邊。圖卷積網絡(graph convolutional network,GCN)是GNN 的一種改進形式,它引入了傳統CNN中的卷積操作,可以更好地捕捉節點間的局部特征和全局結構。馬禹婷[71]提出了GCN-LSTM 模型預測公交站間行程時間,通過GCN 獲取道路網絡的空間結構特征,將帶有空間特征的向量輸入LSTM 模型提取時間特征并做出預測。與GCN 和LSTM 模型進行實驗對比,GCN-LSTM 模型的預測結果更為精確。
目前,使用基于深度學習的模型已成為BAT預測領域的主流方法。CNN模型利用卷積操作可以有效地捕獲公交歷史軌跡序列中的局部模式和短期相關性,但其固定長度輸入限制和對長期依賴性的建模能力相對較弱,限制了CNN 在長期BAT 預測中的應用。雖然通過引入因果卷積等構造TCN 模型緩解了上述問題,但在BAT 預測和其他類型的時間序列預測研究中,RNN 與LSTM 等專門設計用于處理時間序列問題的循環神經網絡是更好的選擇。LSTM 模型相較于CNN 模型更擅長捕捉和處理長序列中的長期依賴關系,被越來越多的學者應用于BAT預測中。為了進一步提升預測精度,學者們將LSTM模型與其他模型算法相結合,并嘗試對模型的結構進行改進,如添加注意力機制、調整模型結構和進行多組件融合等。
隨著BAT預測領域相關研究的不斷深入,影響公交運行更深層次的特征被不斷探索,其中空間特征逐漸受到學者們的重視。通過將站點位置、站間距離和線路結構等空間特征納入公交歷史數據中,可將公交歷史軌跡序列從較為簡單的時間序列數據視為更復雜的時空序列數據。考慮到公交歷史軌跡所展現的時空特性以及CNN具有捕獲空間特征的能力,將CNN與RNN網絡相結合,對處理公交時空序列來說,相較于使用僅提取時間特征的模型有著更好的效果。面對更為復雜的公交時空數據,將提取空間特征的模型與提取時間特征的模型相結合,并嘗試對組合模型的網絡結構進行改進和優化,在盡可能提高模型預測精度的同時降低計算成本,已成為當前BAT預測領域的主要研究方向。隨著GNN的發展和它們在交通流預測等領域的應用,為BAT預測任務中的空間特征提取提供了新的研究思路,使得從預測單條公交線路拓展到預測具有部分重疊路段和站點的多線路公交網絡成為可能。
本文分析總結了基于深度學習的BAT 預測模型的優勢、局限性和改進方向,如表5所示。

表5 基于深度學習的BAT預測模型總結Table 5 Summary of BAT prediction models based on deep learning
為了對比不同類型BAT預測模型的預測精度,需要引入一些標準的性能衡量指標對模型進行評估,因為模型的預測結果會受到各種因素的影響,例如模型本身、數據集和外部影響因素等。BAT 預測相關的研究中經常使用以下三種性能指標對模型的預測準確度進行評估:平均絕對誤差(mean absolute error,MAE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)和均方根誤差(root mean square error,RMSE)。在表6中對上述三種評價指標進行了總結,并給出了它們的計算公式,在計算公式中,yt是真實值,y′t是模型得出的預測值。

表6 BAT預測模型的評價指標Table 6 Evaluation indicators of BAT prediction models
公交行駛軌跡預測研究面臨的挑戰和未來的研究方向總結如下:
(1)構造多源多模態數據集,確保數據質量和可用性。受GPS定位系統穩定性和采樣頻率的影響,公交歷史軌跡數據可能會出現缺失或偏移。可將GPS 定位系統與RFID、超寬帶(ultra wide band,UWB)等定位傳感器相結合構造多源定位數據集,同時考慮結合交通攝像頭數據進行多模態數據融合,以確保公交歷史軌跡數據在時間和空間維度保持連續和完整。
(2)探索公交運行的規律性和地域性因素。多數研究分析了公交的每日運行規律和每周運行規律,但忽略了線路覆蓋的區域性。可依據周邊建筑的社會功能對站點和路段進行區域劃分,研究公交在不同區域的運行規律。同時,可結合公交的日運行和周運行規律賦予區域相應的權重,精細公交運行的時空相關性分析。
(3)將公交行駛軌跡預測與城市交通管理結合。公交信號優先控制系統通常基于交通理論計算公交車到達交叉口的時間,并對交通信號配時進行調整。可使用基于深度學習的模型預測公交到達和通過交叉口的時間,為公交信號優先控制提供更精確的決策依據,但這對預測模型的精度和實時性要求更高。
(4)深入研究公交運行的時空模式,挖掘公交網絡的空間特征。隨著學者們開始考慮相鄰公交線路對目標線路運行的影響,道路空間也從單條線路轉換為多條線路構成的網絡。可將公交網絡建模為圖結構從而考慮不同線路、子路徑和站點間的相互影響。應用GNN相關模型提取公交網絡的空間特征并不斷優化模型結構以獲取更高精度的預測結果,將會是未來的研究重點。
(5)BAT 預測模型融合,可以提高模型的整體泛化能力。由于公交運行環境的復雜性和數據的多樣性,單一的預測模型可能無法涵蓋所有情況下的準確預測。因此,可以嘗試使用不同的預測模型分別進行BAT 預測,并將它們的預測結果進行融合。BAT預測模型融合可以采用簡單的平均、加權平均、投票等方法,也可以采用復雜的組合技術,如集成學習(隨機森林、梯度提升等)、堆疊模型等。通過模型融合,可以綜合多個模型的優勢,提高公交行駛軌跡預測的準確性和魯棒性。
本文對公交行駛軌跡預測問題進行了分析,歸納了影響公交運行的相關因素,分析了不同預測方法的優勢、局限性和改進方向,并重點分析了基于深度學習的預測方法,比較了基于LSTM模型和組合模型的各種預測方法的機制、優勢、局限性和適用場景。最后,總結了當前面臨的挑戰和未來的研究方向,以期為研究公交行駛軌跡預測問題提供參考。