999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于時空特征向量的長短期記憶人工神經網絡的城市公交旅行時間預測

2021-03-18 13:45:56
計算機應用 2021年3期
關鍵詞:模型

(1.浙江師范大學道路與交通工程研究中心,浙江金華 321004;2.西安交通大學電子信息工程學院,西安 710049)

0 引言

通過城市公交解決城市交通問題已成共識,而旅行時間預測是提升出行體驗、提高服務可靠性、改善出行結構的關鍵技術之一。城市公共交通系統是一個具有高度的不確定性、非線性的多參數參與的、時變的復雜巨系統,其旅行時間預測較為復雜,尤其在短時旅行時間預測中(≤15 min),時變性、不確定性更強,突發事件發生概率更大,較中長期預測(≥35 min)而言,預測精度因要求更高而難度更大。文獻[1]認為僅基于歷史數據、實時數據的“時間特征向量輸入預測法”無法有效地應對突發情況,在長期預測(≥35 min)和短期預測(≤15 min)之間難以達到平衡。

城市公交旅行時間的預測有很多代表性方法。從技術上講,該領域最近3 年的預測方法可以分為五類:基于支持向量機(Support Vector Machine,SVM)、基于卡爾曼濾波器(Kalman Filter,KF)、基于全球定位系統(Global Positioning System,GPS)、基于粒子濾波(Particle Filter,PF)和基于神經網絡。支持向量機(SVM)使用專門設計的內核將輸入數據映射到更高維度的空間,以使修改后的輸入數據與目標變量之間呈線性關系。文獻[2]提出了一種基于主成分分析-遺傳算法-支持向量機的預測方法,以提高公交車到站時間的預測精度。文獻[3]提出了一種由時空參數組成的支持向量機模型(單步預測模型)。然而,文獻[4]提出SVM 的非線性來自內核技巧,它不能解決大規模問題。文獻[5]考慮了在卡爾曼過濾器(Kalman Filter,KF)模型中利用從社交網絡獲取信息的效果。文獻[6]提出基于長短期記憶(Long Short-Term Memory,LSTM)和Kalman 濾波的公交車到站時間預測模型,其中LSTM 模型用來預測公交車到站的基礎時間序列,Kalman 濾波模型用于對基礎時間數據序列進行動態調整。文獻[7]認為基于Kalman 濾波的方法需要進行調查才能估算出動態項,并且很難在給定的數據集(結合了時空信息)上構建可靠的公交車動態。文獻[8]基于公交乘客的智能手機Wi-Fi 信息提出了一個跟蹤和預測城市公交旅行時間預測模型。自動車輛定位(Automatic Vehicle Location,AVL)和智能手機定位(GPS)還可預測公交車的到達時間。文獻[9]認為這些方法不能很好地利用歷史信息,并且會忽略空間特征。粒子濾波(PF)技術已被廣泛應用于處理歷史GPS 信息,并且可以預測公交車的到達時間。文獻[10]提出了一種使用粒子濾波方法來預測車流旅行時間的方法,該方法將預測車流旅行時間視為歷史旅行時間的中位數。文獻[11]提出了一種基于非參數回歸-粒子濾波模型的組合預測方法,利用采樣-重要性重采樣思想,構建了基于粒子濾波的公交車輛到站時間預測模型。但是這兩篇論文中使用的粒子濾波算法僅適用于具有狀態空間模型的非線性隨機系統,因具有時間特性而無法預測公交車的到達時間。神經網絡由于其非線性建模能力而變得越來越流行,文獻[12]提出了一種基于循環神經網絡(Recurrent Neural Network,RNN)的到達時間預測方法,以預測公交車的??空緯r間。文獻[13]提出了一種基于深度學習的旅行信息最大化生成對抗網絡;但是,在其研究工作中,及時的GPS數據沒有與神經網絡模型結合。以上幾種模型可以在一定程度上解決城市公交的旅行時間預測問題,但這些模型所考慮的影響因素具有片面性:SVM 過于依賴內核技巧來實現不同規模的預測;KF因需要一個探針來動態監視狀態而忽略了過去的影響;GPS過分強調了公交車的當前狀態,并且隨著預測距離的增加,預測精度也會變差;PF 僅考慮公交車到站的時間,而忽略了公交車的空間影響;人工神經網絡(Artificial Neural Network,ANN)中使用的輸入過于單一,沒有考慮時間和空間特征的綜合影響。

為有效應對突發事件對旅行時間預測精度的影響,文獻[14]提出了一種基于空間特征向量的預測方法:以交叉口為節點將公交行駛路徑切分成段,計算出每個路徑上所有公交車的當前速度,并將其加權平均值認定為公交車在當前路徑上的瞬時速度,從而得出公交車通過當前路徑所需的旅行時間。但公交車的行駛路徑越長,時間累積的路徑波動越明顯,旅行時間預測精度越低,可以看出,基于空間特征向量的預測方法在長期預測情形下效果不佳。文獻[15-17]提出,空間特征向量分析可以有效地處理突發事件對旅行時間預測的影響,但無法解決公交車的遠程依賴;基于時間的特征向量分析可以有效解決此類問題,但不能應對突發事件。因此,本文提出了一種長短期記憶人工神經網絡(Long Short-Term Memory Artificial neural network,LSTM-A)預測模型。該模型通過調整時間矢量和空間矢量將長短期記憶(LSTM)法和人工神經網絡(ANN)結合起來,以實現基于時空特征向量的城市公交旅行時間的預測。

1 數據預處理

1.1 數據來源

本文使用的實驗數據來自寧波市公交公司,調查時間為2019 年9 月1 日至9 月20 日,共包含5 804 504 條數據。實驗數據的數據結構如表1所示。

表1 實驗數據的數據結構Tab.1 Data structure of experimental data

1.2 數據預處理

由歷史數據統計結果可知,時間切片的最優值為5 min,基于此可將一天劃分為188 個時間切片,并將每個時間切片內的歷史旅行時間作為時間矢量的特征值,建立長期滾動時間窗口以完成數據更新與遺忘。在實際駕駛過程中,車輛可能會遇到諸如道路養護、車輛故障、汽車加油和臨時停車等突發事件,因此在數據統計中存在一些異常數據,如行駛時間大于正常行駛時間等;此外,從實驗結果可以看出,在實際時間切分過程中,有一些車輛在兩個站點之間行駛時跨越兩個時間切片,此種情形下,車輛在兩個站點之間的旅行時間遠短于正常旅行時間。因此,根據歷史數據統計結果,時間窗的上限設置應為300 s 下限設置為25 s,從而過濾異常數據以減少噪聲干擾。

2 基于時空特征向量的旅行時間預測

本文提出了一種基于歷史數據時間特征向量的長期預測結合基于空間特征向量的短期預測模型——LSTM+ANN混合神經網絡模型,以準確預測城市公交旅行時間。時間特征向量用于預測長時旅行時間,通過時間切片法計算當前預測時間切片中所有公交車到達相鄰站點所需的時間,該預測方法可有效避免由于車輛長時間行駛道路狀況變化而導致的預測精度降低;空間特征向量用來進行短時旅行時間預測,通過路徑切分來計算單個車輛的瞬時平均速度,進而獲得站點間旅行時間,解決了復雜多變路況下的預測精度問題。經過大量的培訓和學習,該模型在驗證案例上取得了很好的結果。

2.1 基于時間的特征向量分析

目前存在多種基于歷史數據的旅行時間預測方法,如移動平均法、指數平滑法。當使用上述方法來處理時間切片時,時間切片的粒度相對簡單且粗糙。一種更常見的方法是將全天時間段劃分為高峰時段和平峰時段,結合公交GPS數據,不同的時間段采用不同的數據處理方法來預測站點間旅行時間。這種歷史預測方法在某種程度上解決了公交旅行時間預測問題,但與全天公交車旅行時間的波動相比,大顆粒的時間切片將不可避免地導致預測結果的相對粗糙。因此,本文提出了一種基于公交站點間實際旅行時間切片的時間維劃分方法。

2.1.1 時間切片劃分

在中國大多數城市中,兩個站點之間的距離大約為1~2 km,城市公交車的平均速度為20 km/h。因此,車輛在兩個站點間需要大約3~6 min。在此基礎上,基于寧波市0120號公交線路2019 年9 月(全月)的運行數據,對兩個站點之間的時間分布進行了統計,統計結果如圖1 所示。橫軸表示站點間的車輛旅行時間,縱軸表示兩個相鄰站點之間的行駛時間落入特定時間片的概率。從統計結果可以看出,90%的公交車在相鄰站點間的旅行時間不到5 min。因此,本文以5 min 的時間間隔將單日24 h 切分為288 個時間切片。在每個時間切片中,基于預測前20 d 內同一時間切片中的歷史數據來預測兩個站點間當前時間切片內的旅行時間??紤]到工作日、周末和節假日的不同條件,根據工作日和休息日將實驗數據分為兩組。本文提到的所有案例數據均為工作日數據。

圖1 站點間旅行時間分布Fig.1 Distribution of travel time between stations

2.1.2 歷史旅行時間

在本節中,通過時間切片將站點間的旅行時間預測切分為小時間片的預測,并基于同一時間切片的前20 d 的歷史旅行時間數據來預測該時間切片內的旅行時間。

以下內容完成了基于時間的特征向量分析,為LSTM-A綜合預測提供數據支持。這些變量組合成一個向量來描述公交站點Pij的時間信息,基于時間切片的特征向量的數學表達為式(1):

其中:Oi、Oj為公交站點i、j;Tk為時間切片k;[t1,t2,…,tn]為Oi、Oj站點間第1,2,…,n天時間切片k內的旅行時間;Pij為站點Oi、Oj間時間切片k的時間特征向量。

2.2 基于空間的特征向量分析

線路的當前位置決定了下一個目標站和后續站的距離。如果忽略了突發事件,則可以通過將距離除以當前速度來簡單地獲得站點間的旅行時間。在早期就采用了這種公交旅行時間預測模型,但這種方法過于理想化,其預測結果與實際的預測結果相差較大。近年來,研究人員使用差分方程建立了自回歸移動平均時間序列模型,并通過殘差分析和數據擬合最終實現了站點間旅行時間預測;但該模型因沒有考慮城市交通的復雜性和變異性,其殘差序列的白噪聲嚴重影響預測結果精度。因此,本文提出了一種基于線路空間切片的空間特征向量預測方法,以預測目標站點間的旅行時間。

2.2.1 空間切片劃分

根據水庫原理,由于水池中水的蓄積率取決于入水量和出水量之差,因此流入速度過快和流出速度低是造成水池淤積的主要原因。類似地,路段是否擁堵取決于上游車輛的速度和下游車輛的速度。除事故外,公交車輛的速度僅與在路段上行駛的車輛有關。因此,本文提出了一種基于交通信號收斂的空間切分方法。以寧波0120 號公交線路2019 年9 月的數據為算例,以交叉口為節點進行線路路徑的空間切分,考慮到線路的起、終點,可以將22 km長的公交線路切分為18個空間切片,并通過上述步驟初始化空間特征向量。

2.2.2 行駛速度計算

通過2.2.1 節的討論可知,車輛速度僅與當前線路路徑上的車輛有關:一方面,當道路擁擠時,車輛會降低速度;另一方面,單個車輛的瞬時速度將在不同的位置發生變化,例如,道路的前半部分由于道路施工、車輛刮擦、停車和道路變窄而變得擁擠,而后半部分則由于已經離開了擁擠區域而變得流暢。在這種情況下,如果僅根據瞬時速度進行計算,則與實際旅行時間存在較大偏差,因此,本文提出了一種基于空間切片來計算車輛瞬時速度的方法:

其中:Vi為車輛i的平均速度,n是當前線路上的公交車數量,Vj是車輛j的瞬時速度。

2.2.3 到達時間預測

公交車i在當前空間切片中,可以通過GPS坐標估算距離該切片終點的距離,然后將該距離除以當前車速Vi以預測到達時間。如果公交車i不在當前空間切片中,則應通過將切片的長度除以平均車速Vi來預測當前空間切片的時間。以0120 號線為例,并在某個時刻(假設此時車輛i處于始發站)提取路徑上的所有線路信息(位置、速度等),整個路徑的旅行時間為63.2 min,當前計算結果另存為空間特征向量。

本節中,通過空間切片法將站點間的時間預測切分為小的空間切片進行預測,并通過綜合考慮該空間切片中所有公交車輛的行駛速度來獲得目標切片中的旅行時間。通過計算線路在不同空間切片中到達終點的時間來完成基于空間的特征向量分析,并且該過程為LSTM 模型提供了數據,以便最終地綜合旅行時間預測。這些變量組合成一個向量,以描述空間切片Smn的空間信息:

其中:Smn為起點為m終點為n的線路空間向量;lmn為Smn的長度;[v1,v2,…,vn]為線路上所有公交車的瞬時速度。

2.3 基于LSTM和ANN的旅行時間預測

本文提出了一種基于LSTM 和ANN 的神經網絡LSTM-A,它結合了基于時空的特征向量,其結構如圖2 所示。在輸入層中,T是當前時刻的輸入參數,Pij是時間特征向量,Smn是空間特征向量。輸出層輸出當前的旅行時間預測結果。

圖2 混合神經網絡LSTM-A的結構Fig.2 Structure of hybrid neural network LSTM-A

2.3.1 基于時間特征向量的LSTM的計算

將當前時間和時間特征向量用作輸入參數,基于歷史信息的時間特征值由LSTM 動態更新。如果天數超過最大時間閾值,則初始時間特征向量中的值會被“遺忘門”遺忘,并且所添加的時間特征向量會通過輸入門進行更新。最后,通過輸出門由LSTM計算輸出。

遺忘門:

輸入門:

隱藏門:

輸出門:

式中:W*為權重矩陣,b*為偏好;T為舊的輸入;Pij為輸入的時間特征向量;Smn為輸入的空間特征向量;R為預測計算結果;σ為S型函數。

例如,將28 d作為時間特征向量的最大閾值,當前時間從9 月28 日移至9 月29 日時,9 月1 日的時間特征將超過最大時間窗口,9 月1 日的切片數據將通過“遺忘門”被忘記,而9 月29 日的時間特征被添加到“輸入門”,最后,結果輸出由“輸出門”的矩陣01控制。

偽代碼為算法1和算法2。

算法1 LSTM-A。

輸入:時間窗口W,R(Temporalt,Spatials);

輸出:Result。

2.3.2 時空特征向量歸一化

時間特征向量是以站點為節點進行切分的,而空間特征向量是通過交叉口為節點進行切分的,兩種測量單位特征向量不統一,因此,在對特定線路進行預測分析時,需要對兩個特征向量進行相同的運算。本文使用主成分分析對數據進行分析和投影,從而通過將空間維投影到時間維上來實現特征值歸一化。

2.3.3 基于時空特征向量的ANN計算

基于時間特征向量,將到達預測問題分解為點對點向量,僅取決于歷史向量的長度,而與向量的前一點無關。因此,在進行與距公交起點較遠的后續站點預測時,基于時間向量的到達預測更為準確。但是,面對突發事件,響應速度相對較慢?;诳臻g的特征向量將預測問題的解決變成當前路徑的長度與當前路徑的平均行駛速度之間的比值。文獻[18-19]提出該比值在預測短距離到達時間時更為準確。但是,隨著時間的流逝,在不同路徑的交通狀況發生變化后,預測值會與實際值有較大不同。

本節結合了兩種分析方法的優點,并提出了一種基于時空特征向量的LSTM-A計算方法,線性回歸模型為:

式(9)是線性回歸模型的公式,用于訓練和預測時空特征向量;式(10)是Sigmoid 激活函數,可將結果從線性轉換為非線性。

3 案例驗證與結果分析

3.1 數據采集

使用TensorFlow系統(Ubunut 18.04+Nvidia Driver 440.x+GTX 1080+CUDA 10.1+CuDNN 7+TensorFlow 2.0),驗證預測方法的可行性與適用性,采集2019 年9 月1 日至9 月20 日的數據作為訓練集(不包括6 d假期,得到14 d數據,時間窗設置為14 d),2019 年9 月21 日的數據作為測試集,將以距離較長的寧波市0114 號公交線路為案例來驗證預測模型。寧波市0114 號公交線路長度為25 km,行車時間約為86 min,途經市中心、市郊等復雜的環境區域。該線路適用于長時預測+短時預測的這種綜合預測模型。經過1 000次采樣后,結合該線路的上下行數據進行比較、分析。

3.2 預測結果

0114 號線路公交車的完整預測結果:包括從線路起點到終點的所有站點的預測結果以及當天的實際旅行時間。根據差異分析,除某些特殊站點外,每個站點的預測時間誤差均小于1 min,預測模型性能良好。由于分別獲得上、下行的統計數據,因此在一定時間段內的某些站點上很少或根本沒有公交車輛是合理的,而相對荒僻道路也會對實驗結果產生影響,因為線路上行駛的車輛較少。一般而言,在全部29 個站點的預測中,旅行時間預測的大部分偏差小于30 s,預測結果可靠。

3.3 平均絕對誤差

預測結果顯示,在整個預測過程中,超過93.1%的偏差值大于70%,并且偏差值的79%大于80%,如果刪除了個體數據不足的時空特征向量,并提取周期良好的數據特征以進行預測分析,整體預測精度高達80%。選擇不同的時間和空間尺度以增強特征值之間的相關性,重復實驗可以為模型帶來進一步的改進。

3.4 對比驗證

旅行時間歷史數據、線路空間切分數據、實時車速數據等將被用作對比實驗模型的輸入。分別比對算術平均值法(AVeraGe,AVG)、線性回歸法(Linear Regression Method,LRM)、彈性網絡(ElasticNet,EN)模型法和反向傳播(Back Propagation,BP)神經網絡法,不同預測方法的對應參數如表2所示。

表2 不同預測方法的對應參數Tab.2 Corresponding parameters of different prediction methods

對比實驗中,針對短、長距離兩種場景來預測旅行時間,并從平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)和其他方面評估預測結果。短距離場景中,任意兩個站點間的距離用于預測輸入,其預測結果如表3 所示;長距離場景中,起點到終點的距離用于預測輸入,其預測結果如表4 所示。從實驗結果可以看出,LSTM-A 在短、長距離預測時都具有更好的性能。在不考慮其他外部影響的情況下,LSTM-A 算法在短、長距離到達預測中更接近公交車的實際到達時間,因此其結果更加準確。

表3 短距離旅行時間預測結果 單位:sTab.3 Results of short-distance travel time prediction unit:s

表4 長距離旅行時間預測結果 單位:sTab.4 Results of long-distance travel time prediction unit:s

進行了一系列對比實驗,驗證了LSTM-A 算法的性能優于傳統的預測方法。

4 結語

本文提出了一種公交車到站預測方法,主要研究如下:

首先,將24 h 切分為288 個時間切片,以生成時間特征向量。此后,基于時間切片建立了LSTM 時間窗口模型,該模型可用于解決長時預測的窗口移動問題。

其次,本文將公交線路切分為多個空間切片,并使用當前空間切片的共同平均速度作為瞬時速度。每個空間切片的預測時間將用作空間特征向量,并將其發送到LSTM-A。

第三,提出了一種新型的混合神經網絡LSTM-A 來解決公交旅行時間預測問題。時空特征向量分別由前期的處理結果得到,并將它們發送到綜合模型中以完成預測任務并取得良好的效果。

總之,基于LSTM-A 的時空特征向量,有效地解決城市公交旅行時間預測問題,避免了公交車輛的遠程依賴和錯誤積累。此外,本文將公交站點間的預測問題劃分為線路空間切片預測子問題。針對每個相關的子問題引入了實時計算的概念,從而避免了復雜路況帶來的預測誤差。如實驗結果所示,該算法在準確性、適用性方面均優于傳統的預測模型。

后期可通過添加更多的特征向量來拓展深化該模型,例如交通信號的持續時間和頻率、氣候特征、公交車輛的臨時停靠點以及上下車時間的比例等。通過引入更多的特征向量來建立高維向量分析模型,以進一步提高城市公交旅行時間預測的準確性和可靠性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产精品妖精视频| 成人韩免费网站| 免费在线观看av| 精品久久久久无码| 久久精品最新免费国产成人| 免费观看欧美性一级| 一区二区三区国产精品视频| 无码久看视频| 一级成人a毛片免费播放| 久久人搡人人玩人妻精品| 国产欧美日韩一区二区视频在线| 亚洲精品国产首次亮相| 亚洲毛片一级带毛片基地| 国产精品网拍在线| 色网站在线免费观看| 思思99热精品在线| 日韩东京热无码人妻| 国产永久在线视频| 波多野结衣一二三| 欧美日韩国产成人高清视频| 国产精选小视频在线观看| 久久国产拍爱| 欧美α片免费观看| 亚洲日韩久久综合中文字幕| 国产激情国语对白普通话| 欧美精品不卡| 国产精品午夜福利麻豆| 乱人伦中文视频在线观看免费| 日韩精品成人在线| 亚洲视频无码| 999国内精品久久免费视频| 亚洲水蜜桃久久综合网站| 亚洲天堂日韩av电影| 日本免费一区视频| 日韩国产亚洲一区二区在线观看| 日韩激情成人| 囯产av无码片毛片一级| 亚洲精品国产日韩无码AV永久免费网| 欧美精品综合视频一区二区| 精品丝袜美腿国产一区| 欧美成人国产| 欧美日本一区二区三区免费| 午夜精品区| 欧美精品亚洲精品日韩专区| 波多野结衣中文字幕一区二区 | 免费看av在线网站网址| 日韩欧美一区在线观看| 久久人人爽人人爽人人片aV东京热| 精品一区二区久久久久网站| 成年人视频一区二区| 色天天综合| 网友自拍视频精品区| 伊人久综合| 人妻精品久久久无码区色视| 最新国产你懂的在线网址| 国产毛片基地| а∨天堂一区中文字幕| 在线亚洲精品福利网址导航| 亚洲v日韩v欧美在线观看| 久久久久九九精品影院 | 国产成年无码AⅤ片在线| 精品天海翼一区二区| 久久a级片| 亚洲欧美不卡中文字幕| 日韩不卡免费视频| 国产主播在线一区| 特级毛片8级毛片免费观看| 国产精品美女免费视频大全| 性欧美在线| a级毛片免费播放| 99久久无色码中文字幕| 亚洲青涩在线| 特级毛片免费视频| 国产日韩欧美成人| 欧美日一级片| 久久精品66| 97视频在线精品国自产拍| 色综合综合网| 国产欧美专区在线观看| 热热久久狠狠偷偷色男同| 成人日韩精品| 欧美一区精品|