李莉杰++舒勤



摘要:為提高高速路短時交通流預測的準確度,建立了一種基于時空相關分析和BP神經網絡的短時交通流預測方法,首先,通過分析高速路網上下游斷面間的時空相關性和空間互相關性,選取與預測目標相關性較大的歷史時段和相關斷面。然后,將各相關斷面交通流時間序列與其時間延遲序列進行重構,選取歷史時段和重構后的相關斷面作為BP神經網絡預測模型的輸入。利用四川省某高速路數據對該預測方法進行性能評價,實例證明該方法與只考慮高速路時間特性或空間特性的預測模型相比具有更高的預測精度,提高了交通流預測的實時性和可靠性。由此可見,該方法可作為高速路短時交通流預測的有效手段。
關鍵詞:短時交通流預測;時空相關分析;BP神經網絡;時間延遲
中圖分類號:TP391.9 文獻標識碼:A 文章編號:1007-9416(2017)03-0046-05
Abstract:Aiming at the shortage of traffic flow prediction based on single cross-section, the interaction of the adjacent cross-sections in the high speed road network is studied. Then according on the analysis of the spatial-temporal characteristics,a short-time traffic flow forecasting model based on the multiple cross-sections was established .The model is extended to the prediction model based on a single cross-section,and temporal-spatial characteristics of high speed traffic flow and time delay characteristics of space interaction are considered and they determine the input dimension of the forecasting model.Finally, BP neural network is the forecasting tool to estimate the prediction results.The experimental results show that the prediction model has higher prediction accuracy compared with the traditional single cross-section prediction model and improved the real-time performance and reliability of traffic flow prediction.It is of great significance to improve the traffic efficiency of high speed road.
Key Words:short-term traffic flow forecasting; spatio-temporal correlation analysis; BP neural network ; time delay
1 引言
高速公路作為一種普遍且重要的交通方式在客貨運輸中發揮著重要的作用,實時有效的交通預測信息可以誘導出行者的行為、解決或緩解交通擁堵等問題[1]。由于高速公路基本路段的交通流是非間斷交通流,上下游間交通狀態相互影響,上下游交通流參數分布具有一定相似性和延遲性,即整個路網是一個相互關聯、相互影響的系統。對交通流進行預測時,如果只考慮單一斷面的交通流數據,當出現車禍、天氣惡劣等偶然因素時,交通流的波動性變大,預測的準確性會降低[2]。目前國內外學者逐漸將交通流的時空關聯性用于短時交通流預測中,Wu 等[3]采用時空隨機效應模型對城市路網交通流量進行預測,不僅考慮了目標路段的歷史交通參數,還考慮了多個參考路段的交通參數;Min等[4]利用時空關聯性對實時路交通流進行預測;邱世崇等[5]提出了一種基于時空特性分析和數據融合的預測方法,利用最小二乘動態加權融合算法將基于時間序列數據預測結果和空間回歸估計預測結果進行融合輸出最終結果;丁閃閃等[6]提出了一種基于時空關聯和 BP_ Adaboost 的短時交通參數預測方法,先利用主成分分析對多個影響因素進行預處理,再采用Adaboost 算法對 BP 神經網絡進行優化。以上對路網時空相關性的考慮在一定程度上提高了預測精度,但往往忽略相鄰斷面空間相互作用的延遲性。
交通流短時預測預測方法主要分為兩類:第1類是基于傳統數理統計理論的方法,主要包括時間序列預測法、歷史均值預測法、卡爾曼濾波法[7]等;第2類是基于知識發現的智能模型,主要包括神經網絡預測、非參數回歸預測、支持向量機[8]等。第1類預測方法優點是方法模型簡單,缺點是隨著預測周期的縮短,交通流序列的非線性和隨機性增強,預測精度減小[9]。第2類預測方法可以充分逼近任意復雜的非線性和隨機性序列[10],對短時交通預測具有很好的效果。其中,BP神經網絡是應用最廣泛的模型網絡,具有很好的非線性逼近能力[11]。
本文首先通過時空相關分析得到與待預測斷面相關性較大的歷史時段和相關斷面,然后對相關斷面和對應的時間延遲進行重構,構建BP神經網絡預測模型。與傳統方法相比,該模型考慮了上下游相鄰斷面序列的時間延遲,融合了斷面交通流的時空特性及BP神經網絡的非線性擬合優勢,提高了短時交通流的預測精度。
2 交通流序列的相關性度量
交通流序列包含了交通流的特征和運行規律,利用R/S分析來研究時間序列的長程相關性以及空間互相關系數來對空間斷面間交通流的相互作用進行分析。
2.1 R/S分析
R/S分析主要是通過計算Hurst指數來判斷時間序列是否具有長程相關性[12]。Hurst指數的計算過程如下:設時間序列為,則t個時間序列數據的均值為
(1) 由此求得累計偏差
(2)
(3)
標準差
(4)
由公式(1)-(4)算出R/S,根據式(5)通過最小二乘法算出Hurst指數。
(5)
其中Hurst指數的取值范圍為。
2.2 互相關系數
互相關系數經常用于研究復雜網絡各單元間的內在相互作用關系[13]。對研究斷面和的交通流時間序列和,互相關系數)計算公式為:
(6)
為交通流時間序列和基于的互協方差,計算公式為:
(7)
交通流時間序列、的均值為、和標準差為、。其中:
(8)
(9)
式中:為時滯參數[14],是指兩個序列之間的時間間隔,反映了兩序列的產生在時間上的先后關系。高速公路基本路段上游觀測點的車輛按照一定速度行駛,經過一定的空間長度后達到下游觀測點,時滯參數即為交通流從上游傳遞到下游所涉及的時間上的延遲[15],也稱為偏移時間。
3 交通流時空相關分析
時空相關分析研究空間中的對象隨時間變化的關系,反映了時空數據在時間和空間上的相互作用關系,本文利用四川省高速交通流斷面數據進行分析和驗證。
3.1 時間相關分析
對高速路交通流時間序列進行R/S分析,采樣時間為15min,采樣點分別為96個(1天)、480個(5天)、960個(10天),分別計算出Hurst指數為0.69-0.88,見表1,均大于0.5小于1,說明交通流序列具有長程相關性,這表明該交通流時間序列具有分形特性,即交通流序列未來變化趨勢與歷史變化趨勢成正相關,意味著上一時刻交通流的狀態影響當前時刻和下一時刻交通流的狀態,這也決定了交通流的預測要使用歷史時段的數據。
3.2 空間互相關分析
高速路交通流不僅隨時間變化,同時也受到空間因素的影響。現階段對交通流空間變化特性的分析和描述認為,交通流互相關性大小是空間距離的函數,隨著斷面間距離的增加,空間互相關性逐漸減小,對于同一路網,兩確定斷面間的空間互相關性隨著交通負荷的增大而增大。作為計算互相關系數大小的重要參數,時滯參數的大小同樣與空間距離有關。圖為研究斷面流量互相關系數及時滯參數與斷面間空間距離的關系。可以看出,互相關系數隨空間距離增加逐漸減小,減小至一定值時趨于平穩。時滯參數在0~100Km范圍內隨斷面間距增大而增大,間距超過100Km以后,在1~2間波動,主要原因是斷面間距過大,空間相互作用的影響變小。如圖1所示。
同時,兩斷面交通流序列的互相關系數大小也會隨著時滯參數變化而變化。任選兩上下游斷面,從圖2可以看出,兩斷面的互相關系數隨時滯的增大而減小,在時達到最大,在時互相關系數未達到最大,主要原因是兩斷面間的空間距離不能使交通流變化的相互作用立即體現。
4 基于BP神經網絡的交通流預測模型
根據時空相關分析結果可以找出與待測斷面時間相關性較大的歷史數據以及空間上相關性較大的幾個相關相鄰斷面,但是相鄰斷面間的空間相互作用是非線性的,所以建立預測模型時選取BP神經網絡作為預測工具。BP神經網絡是一種單向傳播的多層前饋網絡,包括輸入層、隱含層和輸出層,BP神經網絡的基本思想是輸入信號經隱含層和輸出層的非線性函數作用后輸出,且通過調整輸入值、輸出值和權值對神經網絡進行訓練可以以任意精度逼近任意非線性函數。目前BP神經網絡因其結構簡單、可操作性強、自適應能力強等優點已被廣泛用于模式識別、預測、函數擬合等領域。
4.1 預測模型的建立
該預測模型可簡述為:利用BP神經網絡建立待預測斷面與相關斷面的歷史數據建立歷史值與預測值的映射關系,由于時滯參數的存在,相關斷面的流量序列數據要按照對應的時滯進行重構。如圖3所示。
具體算法流程如下:
步驟1:確定待預測斷面與相關斷面
確定待預測斷面,根據時空特性分析確定與待預測斷面時空相關性較大的m 個相關斷面以及斷面與兩流量序列的時滯。
步驟2:獲取斷面數據
獲取待預測斷面當前時刻t及t之前的r個時刻的交通流量以及相關斷面在時刻和時刻對應的流量序列(即斷面經時滯對的交通流產生影響)。
步驟3:明確訓練樣本與預測樣本
確定訓練樣本和預測樣本,其中,訓練輸入為:
訓練輸出為斷面當前時刻t的流量值。預測輸入為:
步驟4:數據預處理
對輸入輸出數據進行歸一化處理,設和分別為為訓練樣本的最小值,為歸一化后的交通值,通過公式(10)使訓練樣本轉換到[0,1]區間。
(10)
步驟5:訓練網絡及預測
利用訓練集對BP網絡進行訓練,訓練結束后將預測集輸入訓練好的網絡,得到預測輸出后進行反歸一化就可得到待預測斷面t+1時刻的流量。
4.2 預測模型的實現
本文采用的是MATLAB提供的神經網絡工具箱,預測模型為一個三層前向型BP神經網絡,輸入層和輸出層的節點數分別由輸入向量和輸出向量的維數決定,若輸入向量為m維數據,則根據Kolmogorov定理,隱含層的節點可為2m+1個。要注意的是,不同的隱含層節點數會影響預測的精度,所以我們需要找到最佳的隱含層節點數。首先,使用MATLAB中的mapminmax函數對輸入輸出數據歸一化處理,然后使用newff函數來初始化神經網絡以及traindgm算法來訓練網絡,訓練網絡時需要不斷調整迭代次數或調整預測精度,直至使預測誤差降到最小,最后,用sim函數對BP網絡進行預測輸出以及預測結果進行反歸一化處理。
4.3 誤差結果及分析
為了衡量神經網絡預測結果,使用以下幾個性能指標:
平均絕對百分誤差():
(11)
均方根誤差():
(12)
式中:為預測值,為真實值。
4.4 實例仿真
選擇四川省某一斷面為待預測斷面,通過時空特性分析找出與該斷面相相關性較大的4個相關斷面以及分別對應的時滯。
本文選擇2013年5月6日至2013年5月20日待預測斷面的流量序列以及4個相關斷面的流量序列為訓練集,其中流量數據的采樣時間為15min,選擇2013年5月21日待預測斷面的流量序列以及4個相關斷面的流量序列為預測集。利用訓練集對BP神經網絡進行訓練后,用預測集對待預測斷面2013年5月21日的流量進行預測。其中,BP神經網絡的輸入層節點為8個,輸出層節點為1個,隱含層節點數為18個,訓練次數為10000次,訓練精度為0.001,學習率為0.01。為了對比分析,分別進行基于交通流時間相關性、空間互相關性以及時空信息的BP神經網絡模型進行預測,采用相同的網絡結構。三種模型的預測結果如圖4所示。
從圖中可以看出,基于時空特性分析和BP神經網絡的短時交通流預測精度明顯比只基于交通流時間相關性、空間互相關性的BP神經網絡模型精度高。三種預測方法的性能指標比較見表2。
5 結語
本文通過對高速路交通流時間特性和空間特性的分析,深入分析了上下游斷面間空間相互作用的延遲性,構建了基于多斷面的BP神經網絡預測方法。通過實例仿真結果及誤差分析可知,該預測模型比只采用單一斷面數據的交通預測方法提高了精度,驗證了基于多斷面的時空預測方法的有效性。
參考文獻
[1]崔立成.基于多斷面信息的城市道路網交通流預測方法研究[D].大連:大連海事大學圖書館,2012.
[2]Lin S L,Huang H Q,Zhu D Q, et al. The application of space-time ARIMA model on traffic flow forecasting[C]//Machine Learning and Cybernetics, 2009 International Conference on.IEEE, 2009, 6: 3408-3412.
[3]WU Y J,CHEN F,LU C T,SMITH B L,CHEN Y.Traffic flow prediction for urban network using spatio-temporal random effects model. 91st Annual Meeting of the Transportation Research Board . 2012
[4]Min W,Wynter L.Real-time rode traffic prediction with spatio-temporal correlation[J]. Transportation Research Part C: Emerging Technologies. 2011, 19(4): 606-616.
[5]邱世崇,陸百川,馬慶祿.基于時空特性分析和數據融合 的交通流預測[J].武漢理工大學學報( 信息與管理工程版),2015,37(2):156-160,178.
[6]丁閃閃,王維鋒,季錦章,等.基于時空關聯和BP_Adaboost的短時交通參數預測[J].公路交通科技,2016,05: 98-104.
[7]楊兆升,邴其春,周熙陽,等.基于時間序列相似性搜索的 交通流短時預測方法[J].交通信息安全,2014,06:22-26+43.
[8]姚智勝,邵春福,熊志華,等.基于主成分分析和支持向量機的道路網短時交通流量預測[J].吉林大學學報(工學版),2008,01: 48-52.
[9]郭偉,姚丹亞,付毅,等.區域交通流特征提取與交通狀態評估方法研究[J].公路交通科技,2005(7):101-104.
[10]Messai N., Thomas P., El Moudni A. et al. Feed-forward and RTRL neural networks for the macroscopic traffic flow prediction and monitoring: the potential of each other[M]. 2003: 199-204.
[11]王秋平,舒勤,黃宏光.關于交通流量數據預測建模研究[J].計算機仿真,2016,02:194-197+464.
[12]賀國光,馮蔚東.基于R/S分析研究交通流的長程相關性[J].系統工程學報,2004,02:166-169.
[13]趙婷婷,張毅,周彧,等.城市路網交通流的空間相關性[J].清華大學學報:自然科學版,2011,51(3):313-317.
[14]WILLIAMS B M. Modeling and Forecasting Vehicular Traffic Flow as a Seasonal Stochastic Time Series Process[D]. Charlottesville,VA: University of Virginia 1999.
[15]陳彥光,劉繼生.基于引力模型的城市空間互相關和功率譜分析——引力模型的理論證明、函數推廣及應用實例[J].地理研究,2002,06:742-752.