吳 彪 王星予 劉 拓 董乃寶 張俊新 張 鵬*
(黑龍江工程學(xué)院汽車與交通工程學(xué)院1) 哈爾濱 150050) (黑龍江省交通運輸信息和科學(xué)研究中心2) 哈爾濱 150080) (遼寧交投公路科技養(yǎng)護有限責任公司3) 沈陽 110148)
城鄉(xiāng)結(jié)合部因其空間地理位置特殊、交通類型繁多、交通組成復(fù)雜,已成為交通事故多發(fā)區(qū)域[1-2],并引起專家學(xué)者的關(guān)注.劉唐志等[3]在城鄉(xiāng)結(jié)合部交通事故特征的基礎(chǔ)上,提出城鄉(xiāng)結(jié)合部交通安全改善對策;魏中華等[4]利用城鄉(xiāng)結(jié)合部交通事故數(shù)據(jù),分析了城鄉(xiāng)結(jié)合部高風險區(qū)域的形成原因;魏群等[5]采用屬性識別理論,建立城鄉(xiāng)結(jié)合部交通安全綜合評價模型;李巖[6]通過分析城鄉(xiāng)結(jié)合部交通安全影響因素,提出考慮道路條件的城鄉(xiāng)結(jié)合部交通安全評價方法;張惠玲等[7-8]利用行人安全性指標分析城鄉(xiāng)結(jié)合部各類設(shè)施對行人安全性的作用,基于TPB理論解析城鄉(xiāng)結(jié)合部駕駛員不安全駕駛行為的心理成因;李要果[9]建立城鄉(xiāng)結(jié)合部致死交通事故多項有序Logistic模型,量化分析不同因素對城鄉(xiāng)結(jié)合部交通事故的影響;牛世峰等[10]利用多分類有序Logit模型分析城鄉(xiāng)結(jié)合部交通事故嚴重程度的影響因素;Wu等[11]采用Logistic回歸模型分析事故時間、車輛類型、道路特征和事故類型等因素與城鄉(xiāng)結(jié)合部事故嚴重程度之間的關(guān)系.已有文獻對城鄉(xiāng)結(jié)合部交通事故嚴重程度的影響因素進行了初步探索,但主要集中城鄉(xiāng)結(jié)合部交通事故嚴重程度與事故風險因素之間的關(guān)系研究,對于事故致因之間的相互關(guān)聯(lián)性關(guān)注不足.
文中利用Apriori算法與灰色關(guān)聯(lián)分析方法,分析城鄉(xiāng)結(jié)合部交通事故致因的關(guān)聯(lián)規(guī)則、事故致因的關(guān)聯(lián)度,探究城鄉(xiāng)結(jié)合部交通事故致因之間的內(nèi)在關(guān)系,明確影響城鄉(xiāng)結(jié)合部交通事故頻次及交通事故嚴重程度的主要致因.
利用某中心城市城鄉(xiāng)結(jié)合部2014—2017年722起交通事故數(shù)據(jù),分析城鄉(xiāng)結(jié)合部交通事故致因.事故數(shù)據(jù)包括事故時間、事故地點、天氣狀況、路段類型、事故類型、事故原因等信息.
數(shù)據(jù)預(yù)處理結(jié)果表明:城鄉(xiāng)結(jié)合部路段交通事故主要集中在07:00—12:00、17:00—20:00 時段;工作日發(fā)生交通事故528起,占事故總數(shù)的73.13%,休息日為194起,占事故總數(shù)的26.87%;7月份交通事故數(shù)最多,為88起,占事故總數(shù)的12.19%,2月份最少,為34起,占事故總數(shù)的4.71%;最頻繁發(fā)生的事故類型是碰撞和刮擦行人;夜間交通事故嚴重程度高;直線道路最容易發(fā)生事故;轎車發(fā)生事故的比例最高;事故致因為駕駛員操作不當和違反交通法規(guī).
關(guān)聯(lián)規(guī)則基本問題可以描述為:若I={I1,I2,I3,…,Im}是由m組項目構(gòu)成的合集,定義每個交易T為合集I的非空子集,交易數(shù)據(jù)庫D為交易T的集合,即每個交易對應(yīng)唯一的標識符TID.如果X是I中幾個項目的集合,若有集合X?T,則關(guān)聯(lián)規(guī)則即為X→Y的蘊含式,其中X?I、Y?I且X∩Y=?.
鑒于Aprior可獨立挖掘數(shù)據(jù)集中的關(guān)聯(lián)規(guī)則,并且適用于小數(shù)據(jù)集的關(guān)聯(lián)規(guī)則分析[12],本文選取Apriori算法分析城鄉(xiāng)結(jié)合部交通事故致因的關(guān)聯(lián)規(guī)則.Apriori算法中衡量關(guān)聯(lián)規(guī)則強度的指標主要有支持度S、置信度C、提升度L[13].其中:支持度S為交易集中包含X和Y的交易數(shù)與所有交易數(shù)之比,為
(1)
式中:S為規(guī)則X→Y的支持度;N(X∩Y)為包含X、Y的交易數(shù);N為交易集中所有交易數(shù).
置信度C為規(guī)則前項已經(jīng)發(fā)生的前提下,規(guī)則后項再發(fā)生的概率,為
(2)
式中:C為規(guī)則X→Y的置信度.
提升度L為規(guī)則前項與規(guī)則后項的相關(guān)性,為
(3)
式中:L為規(guī)則X→Y的提升度;若L>1,則表明規(guī)則前項與規(guī)則后項正相關(guān),若L<1,則表明規(guī)則前項與規(guī)則后項負相關(guān);L值越高,則該規(guī)則提供的有效性越高.
灰色關(guān)聯(lián)分析法主要用于系統(tǒng)中各個因素之間的關(guān)聯(lián)度分析,并依據(jù)關(guān)聯(lián)度值判斷各因素之間的相關(guān)性,具體計算流程為:
步驟1確定參考序列與比較序列
參考序列
X0={X0(1),X0(2),…,X0(N)}
(4)
式中:N為參考序列長度.
比較序列
Xi={Xi(1),Xi(2),…,Xi(N)}i=1,2,…,m
(5)
式中:m為比較序列長度.
在確定研究所需因變量與自變量的基礎(chǔ)上,將因變量定為參考序列X0、自變量定為比較序列Xi(i=1,2,…,m),參考序列與比較序列構(gòu)成矩陣
(6)
式中:Xi為主元素,矩陣行表示時間,本研究采用某城市城鄉(xiāng)結(jié)合部2014—2017年交通事故數(shù)據(jù),故N=4.
步驟2序列的無量綱化處理 利用平均法對統(tǒng)計數(shù)據(jù)進行無量綱化處理,獲得平均值百分比新序列.
(7)
步驟3計算關(guān)聯(lián)系數(shù) 比較序列與參考序列之間最小絕對差和最大絕對差為
(8)
(9)
關(guān)聯(lián)系數(shù)為
(10)
式中:Loi(k)為比較序列與參考序列在k時刻的關(guān)聯(lián)系數(shù);ξ為分辨系數(shù),ξ∈[0,1].
步驟4計算關(guān)聯(lián)度 比較序列Xi與參考序列X0的關(guān)聯(lián)度為關(guān)聯(lián)系數(shù)的平均值,即
(11)
式中:?i為關(guān)聯(lián)度;N為序列長度.
城鄉(xiāng)結(jié)合部交通事故致因分類統(tǒng)計情況見表1.
在交通事故致因分析中, 關(guān)聯(lián)規(guī)則中的支持度通常取1%~4%, 置信度通常取10%~20%[15].為提高城鄉(xiāng)結(jié)合部交通事故致因關(guān)聯(lián)規(guī)則的精確度,本文取支持度S≥10%、置信度C≥40%、支持度L≥1.在界定支持度S、置信度C,以及支持度L最小閾值的基礎(chǔ)上,利用SPSS Modeler軟件Apriori算法挖掘城鄉(xiāng)結(jié)合部交通事故數(shù)據(jù)的二項集規(guī)則和三項集規(guī)則.
表1 事故致因分類表
考慮城鄉(xiāng)結(jié)合部交通事故數(shù)據(jù)的實際情況,將關(guān)聯(lián)規(guī)則前項的最大數(shù)設(shè)置為3.根據(jù)前項中因素數(shù)量的差異,分析結(jié)果可以分為具有1個前項的規(guī)則,具有2個前項的規(guī)則和具有3個前項的規(guī)則.
按照提升度排序的城鄉(xiāng)結(jié)合部交通事故致因二項集規(guī)則分析結(jié)果,見表2.
表2 二項集規(guī)則
由表2可知:違反交規(guī)與發(fā)生碰撞行人事故具有較強的關(guān)聯(lián)性,操作不當與碰撞事故具有較強關(guān)聯(lián)性,交叉口與違反交規(guī)、碰撞事故、轎車這三種事故致因具有較強關(guān)聯(lián)性,貨車與操作不當、碰撞、平直道這三種事故致因具有較強關(guān)聯(lián)性.
按照提升度排序的城鄉(xiāng)結(jié)合部交通事故致因的三項集規(guī)則分析結(jié)果,見表3.
表3 三項集規(guī)則
由表3可知:操作不當、轎車、貨車、平直道、交叉口、碰撞事故具有較強的關(guān)聯(lián)性,違反交規(guī)、轎車、碰撞事故具有較強的關(guān)聯(lián)性.
考慮城鄉(xiāng)結(jié)合部交通事故數(shù)據(jù)的完整性和影響因素的重要性,選取出行時間、道路特征、駕駛行為等因素作為城鄉(xiāng)結(jié)合部交通事故的顯著影響因素,見表4.
表4 交通事故主因素分類
城鄉(xiāng)結(jié)合部交通事故顯著影響因素指標的原始數(shù)據(jù),見表5.
表5 交通事故原始數(shù)據(jù)
依據(jù)式(7)將表5中原始數(shù)據(jù)進行無量綱化,得到表6.
表6 原始數(shù)據(jù)均值化
依據(jù)式(10)計算出各因素的關(guān)聯(lián)系數(shù),取分辨系數(shù)ξ為0.1,結(jié)果見表7.
表7 各致因因素的關(guān)聯(lián)系數(shù)
依據(jù)式(11)計算事故頻次分析中各致因因素的關(guān)聯(lián)度,見表8.
表8 事故頻次分析中各致因因素的關(guān)聯(lián)度
將關(guān)聯(lián)度大于0.5的致因因素作為事故的主要致因,城鄉(xiāng)結(jié)合部交通事故頻次分析的主要因素為:出行時間、駕駛員操作不當和駕駛員違反交規(guī).
利用國際道路評估組織的估算方法,將受傷人數(shù)視為事故嚴重程度的統(tǒng)計指標.按照灰色關(guān)聯(lián)度分析法計算流程,計算城鄉(xiāng)結(jié)合部交通事故嚴重程度分析中各的致因因素的關(guān)聯(lián)度,見表9.
表9 事故嚴重程度分析中各致因因素的關(guān)聯(lián)度
由表9可知:出行時間與發(fā)生嚴重事故的關(guān)聯(lián)度最高,道路特征為平直道、駕駛員操作不當、駕駛員無證駕駛這三個因素與嚴重事故的關(guān)聯(lián)度比較接近,關(guān)聯(lián)度相對較高.
1) 利用Apriori算法分析了城鄉(xiāng)結(jié)合部交通事故致因的關(guān)聯(lián)規(guī)則,明晰了交通事故致因之間的內(nèi)在關(guān)系,違反交規(guī)與發(fā)生碰撞行人事故具有較強的關(guān)聯(lián)性,操作不當與碰撞事故具有較強關(guān)聯(lián)性,交叉口與違反交規(guī)、碰撞事故、轎車這三種事故致因具有較強關(guān)聯(lián)性,貨車與操作不當、碰撞、平直道這三種事故致因具有較強關(guān)聯(lián)性.
2) 利用灰色關(guān)聯(lián)分析法確定了城鄉(xiāng)結(jié)合部事故致因因素的灰色關(guān)聯(lián)度,出行時間、駕駛員操作不當、駕駛員違反交規(guī)是影響城鄉(xiāng)結(jié)合部交通事故頻次的重要因素.出行時間、平直道、駕駛員操作不當是城鄉(xiāng)結(jié)合部交通事故嚴重程度的重要因素.駕駛員無證駕駛所造成的事故次數(shù)雖然較低,但是其嚴重程度較高;城鄉(xiāng)結(jié)合部平直道發(fā)生交通事故的頻次高,且較為嚴重.
后續(xù)研究可利用數(shù)據(jù)挖掘技術(shù)開展城鄉(xiāng)結(jié)合部交通事故分析與建模研究,分析相關(guān)因素對城鄉(xiāng)結(jié)合部交通事故頻次和嚴重程度的影響.