楊鑫 趙靜 孫雨晴



摘要:文章根據交通流特性對采集到的交通流數據進行錯誤數據的鑒別、缺失數據的補充、以及遴選數據的歸一化等預處理操作,構建基于支持向量機的短時交通流預測模型。通過對數據進行預測,并與實際測試數據進行對比發現,支持向量機回歸模型在短時交通流預測方面是可行的。
關鍵詞:交通流;數據預測;支持向量機
一、交通流基本特征參數
研究交通流狀態需對實時交通流進行評價,即選取一些定性和定量指標,對交通流的基本特征參數進行比較全面的描述。
(一)速度
速度是指單位時間內所行駛的距離,通常用 v表示,單位是距離/單位時間。在交通流的狀態描述中,速度通常有兩種方法:一種是指在特定觀測地點的速度,一般使用地點平均車速;另一種是指特定路段的車速情況,用于表現空間運行狀態的為路段的區間平均車速。地點平均車速是指具體道路上的某一個特定斷面在單位時間段內所通過的所有車輛的瞬時速度的平均值;路段的區間平均車速是指該路段的長度與在該路段所通過所有車輛的平均行駛時間之比
(二)密度
密度是指在單位長度的道路上某一時間瞬時所行駛的車輛的總數,通常用k表示,單位是輛/單位長度。由于密度是瞬時值,使用電子檢測相關設備并不容易獲得,同時也存在許多檢測困難。因此,密度一般會用車輛道路占有率替換。車輛道路占有率主要包括空間上的占有率與時間上的占有率。
(三)交通量
交通量是指在單位時間內通過道路上的某一個路段截面的實際車輛數,單位為輛/單位時間,通常用q表示,用來衡量城市道路交通狀態。
(四)宏觀上交通流的三個基本參數模型
交通流的三個基本參數是指流量、速度和密度。它們之間的關系反映為交通流的速度-密度模型、速度-流量模型與流量-密度模型。道路交通流基本參數關系模型是指流量q、速度v和密度k之間的關系,也可以通過以下的關系表達式來說明:
二、支持向量機理論基礎
(一)機器學習
機器學習是指專門研究計算機怎樣模擬或實現人類的學習行為,以逐步完善自身的知識結構體系。該模型通過研究與挖掘數據之間的內在關系,找出其內部規律,并利用這種規律對未來的數據進行有效預測。
(二)經驗風險最小化
機器學習的根本目的是實現期望風險最小化。回歸估計解決問題的實質是通過構造可行的最優函數的機器學習過程。由于事先并不知道數據集的真實聯合概率分布 F(x,y),因此測試樣本與預產生兩者之間的偏差即經驗風險最小化準則的經驗風險:
經驗風險是指根據訓練樣本的數據和經驗來確定的值,經驗風險最小化原則是指用經驗風險 Remp(w)最小化代替期望風險R(w)最小化來進行計算。
(三)支持向量機原理
支持向量機的基本思想是在高維空間中尋找超平面,從而達到樣本分類的目的,并使分類的間隔達到最大。因而應滿足:
利用對偶原理將拉格朗日函數轉化為求解如下泛函數的優化問題:
三、支持向量機短時交通流建模
根據需要選擇及補充相應數據,確定試驗的數據源。文章采用的是早高峰時段的流量數據以及對應的時段。
(二)通過對數據的分析來確定核函數以及懲罰因子和損失函數等相關系數。
(三)通過構造最優化問題,并輸入樣本值和預測值進行求解:
(四)由最優解建立決策函數,并使用測試集數據對未來時刻的交通量進行有效預測。
(五)應用MATLABl軟件中的LIBSVM工具進行訓練求解,得出短時交通流預測結果。
四、仿真結果分析
結合文章使用的支持向量機的短時交通流預測模型,對某段路早高峰實測數據進行預測,預測結果如圖1所示。
從上圖可以看出,整個回歸模型實現了良好預測,預測序列與原序列具有較好的擬合程度,并達到了一定的精度,這說明該模型具有可行性,并且在實際工程中具有良好的適用性。文章在探討核函數對短時交通流的預測效果時,對預測有影響的滯后時段d控制不變,同時實驗的數據選取的是早高峰階段即6:00—8:00的五分鐘流量數據,控制了其他影響因素后來說明核函數的變化對預測效果的影響。
參考文獻
[1]姚智勝,邵春福.基于狀態空間模型的道路交通狀態多點時間序列預測[J].中國公路學報,2007(7):113-117.
[2]張學工.關于統計學習理論與支持向量機[J].自動化學報,2000(1):11.
[3]劉靜,關偉.交通流預測方法綜述[J].公路交通科技,2004(3):82-85.