胡國超

摘要:將數據挖掘技術應用在交通事故分析過程中,可以加強交通事故的研判準確性,將傳統交通事故統計分析系統中存在的問題合理解決,加強交通事故分析的信息化、科學化。綜上所述,本文將基于數據挖掘技術對交通事故分析系統進行構建,以期加強統計分析、關聯分析、挖掘分析等多項功能。
關鍵詞:數據挖掘;道路交通;交通事故分析;數據倉庫
我國信息技術水平的不斷提升,各行各業都開始應用大數據技術。我國的道路交通行業在對人、車、路等多方面進行管理時,會生成海量的動態、靜態交通數據,因此使用數據挖掘技術,可以加強道路交通管理的水平,還可以加強交通事故信息分析系統的運行效果。
一、基于數據挖掘技術的道路交通事故分析系統流程設計
基于數據挖掘技術的道路交通事故分析系統可以從交通管理綜合應用平臺獲得相關數據,從而對數據進行統一分類管理在對分析系統流程進行設計的過程中,需要成立交通事故信息綜合分析數據庫,將其作為基礎,對交通事故的相關信息進行統計分析,駕駛者出現違反交通法律信息等與數據技術存在直接關聯,并且將歷史數據的預測分析作為基礎提供可視化分析功能,之后將分析與挖掘之后的結果輸出,從而對交通事故信息進行綜合分析與研究判斷。
二、基于數據挖掘技術的道路交通事故分析系統整體功能設計
在對數據挖掘技術的道路交通事故分析系統整體功能的設計過程中,其中應包含事故統計分析、關聯分析、數據挖掘分析等分析功能,在交通事故的統計分析中包含事故任意分析、特點分析、事故原因綜合分析。
三、基于數據挖掘技術的道路交通事故分析系統詳細功能設計
(一)事故統計分析功能
在對交通事故進行統計分析的過程中,會對原有的交通事故統計分析進行拓展,使原有的統計分析功能獲得完善與優化,還可以對原本沒有分析的項目擴展,將原有需要改進的項目進行優化。其中包含交通該事故信息任意分析、交通事故特點綜合分析等方面。
在任意分析的過程中,需要將時間、任意條件等數據開展單項或組合式的分析。在對交通事故特點進行綜合分析時,需要增設片區統計[1]、大城市交通事故綜合統計分析等相關功能。
(二)關聯分析功能
1.交通事故與駕駛員的信息關聯分析
為了對不同駕駛證種類持有者進行數量統計與分析,對相同、不同區域內的駕駛員數量與交通事故之間的關系進行分析,還會對不同駕照類型與每萬駕駛員交通事故的不同區域交通事故發生率進行統計??梢允褂肑S表示每萬駕駛人事故發生率,即JS=■×104,其中A表示事故數量,D表示駕駛員數量。另外,還需要對肇事駕駛員的發證區域[2]、駕駛員考試的通過率等多方面對駕駛員與交通事故之間的關系進行分析。
2.交通事故與機動車輛信息關聯分析
為了對不同區域的機動車數量與交通事故之間的發生幾率與發生關系進行分析,需要對萬車死亡的概率進行計算。可以使用WC對萬車死亡的發生幾率進行表示,利用相關的公式進行系統計算,并且作為A交通事故發生的數量,D為機動車輛的數量。
3.交通事故與違法信息關聯性分析
基于數據挖掘的道路交通分析系統中,會對管轄區域內的違法行為處罰實際情況與事故認定原因互相對比,之后將違法信息與交通事故之間存在的關系充分掌握。
4.交通事故與人口數量、經濟等相關信息的關聯性分析
系統會獲取交通事故與人口數量、經濟等相關信息,通過對不同區域中的十萬人口死亡率、GDP事故發生率等相關數據進行分析,對交通事故的實際發生情況進行分析。可以使用Jr對十萬人口的死亡率進行表示,即Jr=■×105,其中A表示交通事故的數量,r表示人口的整體數量。使用JZ對發生的的事故發生率進行表示,即JZ=■×108,其中A表示交通事故總量,Z表示GDP[3]。使用對百公里發生的交通事故率進行表示,即JP=■×100,其中A表示事故發生總量,L表示道路的總長度。使用Jx表示綜合交通事故率,JZ=■×100其中A表示事故的總量,P為人口總數量。
(三)數據挖掘分析功能
第一,對交通事故數據進行預測。使用常用的指數平滑法、自動回歸滑動平均法等平均處理模型,對交通事故發生的四項指標進行計算,其中包含事故的發生數量、死亡人數、受傷人數、造成經濟損失,可以對交通事故的未來走向進行準確預測。第二,對單項的因素進行關聯性分析。通過對單項因素的關聯性進行分析, 可以對交通事故的原因與定性影響因素之間存在的關系是否獨立進行判斷。第三,對事故的原因關聯性進行分析。將單相事故因素的關聯性分析作為基礎,對管轄區域的交通事故發生嚴重程度與事故關聯性的因素進行構建,其中包含駕駛員的駕齡、車輛品牌、車輛類型等多方面,之后會形成邏輯回歸模型,對相關定性與函數之間存在的關系進行擬合、定性、分析,可以將不同變量之間形成的影響作用完全描述,計算出最終的危險系數值,還可以提供相關原因與交通事故嚴重程度的危險系數示意圖,之后會得出相關的分析結論。第四,對交通事故多發的路段進行全面通緝分析。在數據挖掘道路交通事故分析系統中會對重點道路進行分析,將交通事故多發路段進行篩選,之后會使用將密度作為基礎的聚類算法進行計算,從而加強交通事故多發路段的統計與分析效果。
(四)可視化分析
在系統進行可視化分析的過程中,會將交通事故統計分析、關聯性分析等相關結果顯示在地圖中,可以從宏觀的角度對全國的道路交通事故區域劃分進行掌控,還可以使用分析區域進行分級、分色的顯示。
(五)重點關注
構建系統的重點關注功能時,需要將事故的上升點數據作為基礎進行分析與構建,需要對各個區域的交通事故上升實際情況進行分析,還可以劃分為3、5、10人的事故上升情況,對重點的車輛事故上升情況監控。
四、結語
基于數據挖掘技術對道路交通事故分析系統進行構建,可以加強數據的挖掘與分析效果,找出交通事故的發展規律,從而加強預防措施的科學性與準確性。
參考文獻:
[1]胡鵬. 數據挖掘在交通管理中的應用研究[J]. 計算機安全,2013(10):54-57.
[2]郭璘,周繼彪,董升,張水潮. 基于改進K-means算法的城市道路交通事故分析[J]. 中國公路學報,2018,31(04):270-279.
[3]惠寶鋒,馮桂蓮,王詠寧. 基于OLAP的道路交通事故影響因素分析[J]. 軟件工程,2018,21(07):21-23+20.
(作者單位:安徽百友司法鑒定中心)