張喜強 趙靜



摘要:文章以近幾年全國道路交通安全相關數據為樣本數據,分析了數據間的特性。為此,分別利用標準灰色預測模型和支持向量機(SVM)模型建立道路交通安全預測模型,利用MATLAB R2012b對兩種預測模型算法進行建模并應用數據進行仿真測試,得出相關的參數值和誤差值,最后將預測結果數據與實際值進行對比分析。
關鍵詞:交通安全;數據分析;預測結果
在過去的幾十年里,我國經濟迅速發展,機動車制造工業有著驚人的進步,道路基礎設施也進入了發展的高潮。這些都推動了我國交通運輸行業的發展,具體表現為公路里程數、機動車保有量、客貨周轉量等都以驚人的速度增長。截至2016年底,全國公路總里程超過450萬公里,其中高速公路總里程達到10.8萬公里,居世界第一;機動車保有量達到2. 79億輛,機動車駕駛人達3. 27億人,已超越美國成為世界汽車消費第一大國。在經濟發展繁榮、基礎建設興起的同時,機動車過多、道路交通事故率居高不下已成為一個嚴峻的社會難題。
一、模型算法
(一)灰色預測模型
灰色預測模型的研究對象是數據不夠完備的不確定性系統。對于少樣本的系統,可以通過部分數據的規律提取,并演化成有規律的有效信息,開發部分數據的運動行為,將動態數據進行正確和有效的描述。文章以道路交通安全預測系統為例。道路交通系統是一個動態系統,其發展變化受到很多因素的影響,于是它又是一個動態的灰色系統。因此,可以運用灰色系統的理論和方法來研究道路交通安全系統。
(二)支持向量機(SVM)模型
由Vapnik首先提出的支持向量機(SVM)通常可用于模型分類和線性回歸。支持向量機描述了如何在多層感知器網絡或徑向基函數網絡中構建一個分類超平面,并將它作為決策面,使得正例和反例之間的隔離邊緣最大化。相對于神經網絡,支持向量機是結構風險最小化的一種近似實現。
支持向量機是解決非線性、復雜性、多維問題的一種方法,其實質是建立非線性回歸方程,通過非線性函數φ(g)把數據映射到高維特征空間,然后在此空間建立線性回歸函數。具體函數為:
二、道路交通安全預測建模
(一)灰色預測建模的應用
根據樣本數據的回歸性進行選取后,計算得出發展灰數
在MATLAB中運行模型程序得到預測計算標準差比C=0.0883,估計小誤差概率P=1 。
由表1不難發現,在2012年以前實際值和預測值相差不大,誤差較小;從2012年起,預測值比實際值明顯誤差增大。如果預測越長,精度勢必越低。
(二)支持向量機預測建模
根據道路交通安全預測值中樣本數值的特性,文章選擇高斯核函數,根據上述SVM公式綜合得出基于SVM的道路交通安全預測模型,偏置b的表達式如下:
選取評價體系中全國死亡人數、受傷人數、事故次數、直接經濟損失這4重指標集合。影響因子集合為近20年全國公路運輸距離、機動車保有量、貨運量、旅客周轉量、貨物周轉量作為影響因子的集合。根據構建的交通安全預測模型公式2.2,在MATLAB R2012b中編程運行,并需要確定三個參數值,即正規化參數C和高斯核函數參數σ2,以及誤差 e。文章選擇用交叉驗證來確定三個參數值。在有限的學習數據中獲取盡可能多的有效值,從而獲得更合適的權值是交叉驗證的優點。
三、仿真結果
本模型實驗是在標準支持向量機在MATLAB中搭載C語言環境下調用libsvm3.17的環境下進行的。抽取樣本數據中隨機6個年份的道路交通事故次數指標作為訓練集,其余為測試集,分別進行測試和訓練。文章把樣本集合分為5份,做5折交叉驗證,輪流選擇其中4份訓練,剩余的1份做驗證。根據模型在驗證集合上的性能,進行兩次尋優求得,第一次確定粗略的參數,即C=1,σ2=9.1896,e=0.01353%,第二次確定精細的參數,即C=0.70711,σ2=11.3137,e=0.01323%。通過對比可以發現,將灰色預測理論應用于長期預測數據時,會產生誤差增高的現象,而應用支持向量機模型構建的模型,誤差均在0.20以下,在精度上有顯著的提升。
參考文獻
[1]孫科達.基于GA的BP神經網絡道路交通事故預測模型研究[D].浙江工業大學,2012.
[2]安杰,董龍洋.基于BP神經網絡的道路交通安全預測模型研究[J].公路與汽運,2014(3):63-67.
[3]房靖,高尚.基于支持向量機的交通事故組合預測方法研究[J].交通與計算機,2007(2):103-105,11.
[4]張文峰,成衛,董玉佩.道路交通事故神經網絡預測研究[J].昆明理工大學學報(理工版),2015(5):5.
[5]孫浩.基于支持向量機的交通安全預測模型研究[D].合肥工業大學,2009.