李洪奇,周倩倩+,辛 盈,劉艷芳,趙艷紅
(1.中國石油大學 (北京) 信息科學與工程學院 石油數據挖掘北京市重點實驗室,北京 102249;2.中國石油國際勘探開發有限公司,北京 100034)
我國在事故預警方面的研究已經涉及到各個方向,如鐵路、高速公路、城市道路等交通安全管理和預警,這些研究主要是通過分析道路現狀,建立預警模型,確定警限和警兆,從而對交通安全狀況進行預警。鄭曉鴻[1]調查我國道路安全現狀,基于事故形態、事故成因,其中成因包括人、車、路、環境等,建立事故預警指標體系,設計分析了預警系統架構。吳剛[2]提出了基于模糊推理的高速公路事故預警算法,通過交通流的變化狀態對道路事故風險進行預警。喻幸[3]提出了利用粗糙集理論對事故因素進行約簡,確定各因素指標權重,建立事故預警模型。侯力楊[4]從事故致因角度出發使用BP神經網絡對事故進行分級預警。以往的事故預警指標建立大多從人、車、路、環境等因素全面分析,涵蓋范圍較廣,但是存在冗余因素較多的問題,致使重要因素不突出,導致誤警。本文在已有研究成果的基礎上,以克拉瑪依市為例,采用數據挖掘方法探究該市交通事故重要影響因素,指標選取更符合實際道路情況,然后根據事故動態分布規律、人、車、路、環境等事故影響因素,以及道路交通流變化,對事故來源地進行事故預警,并應用到實際的交通管理系統中。
本文通過歷史交通事故對事故進行預警研究,事故預警指標體系主要包括事故分布規律,用于分析事故動態發展過程,以及事故成因分析,通過數據挖掘方法得到事故重要影響因素,建立造成事故的強關聯指標集合。如圖1所示。

圖1 道路交通事故預警結構
道路交通事故預警指標體系是為了能判斷道路的安全狀況,因此指標的選取需要具備客觀性和全面性,指標之間應相互聯系,要能反映出引起事故發生和影響事故嚴重程度的重要原因。通過查閱相關文獻,指標選取需要具備以下幾個原則[5]:①可測性:通過數據定量分析和對比,找到事故發生的真正原因,為評價結果提供有利的數據支撐;②可操作性:保證道路交通事故預警在實際應用中的可行性;③獨立性:指標之間相輔相成,既有一定的相關性,又相互獨立;④閾值識別:構建指標體系時需要確定指標等級,對于分類原則、臨界閾值要有較明確的識別標準;⑤靈敏性:評價指標要能靈敏地反映道路交通安全狀況,能對危險情況及時預警。
本文以克拉瑪依市道路交通事故為研究對象,首先設計了交通事故的水平指標和動態指標,然后從不同方面深入分析了事故動態分布規律的演變過程。其中水平指標包括發展水平、平均發展水平、增長量、平均增長量;速度指標包括發展率、平均發展率、增長率和平均增長率。以2008-2018年該市道路交通事故統計資料為基礎,應用基于絕對數的分析指標進行分析,包括定基增長量和環比增長量,定基發展率和環比發展率,主要反映某一時期的事故動態變化的規模、速度和水平。結果表明增長量和增長率所表現的事故發展趨勢基本一致。如果只考慮單方面指標,可能會得出錯誤的結論,不能合理掌握事故分布規律。文中將速度指標和水平指標相結合,互相補充。
事故發生可歸結為人、車、路、環境等多維動靜態因素耦合失調導致的。本文使用決策樹分析方法挖掘事故原因與各影響因素之間的內在規律。圖2展示的是各影響因素對分類模型的重要度,可以看出車輛行駛狀態、道路物理隔離、車輛種類、天氣對于事故發生的影響較為重要。
通過分析決策樹模型推理出的規則,并結合克拉瑪依市實際道路交通事故情況,事故發生原因多為未按規定讓行和超速行駛,這兩種違法行為嚴重影響了道路交通安全。

圖2 事故影響因素重要度分析
車輛非直行情況下易發生事故,在陰雨雪天氣、道路無物理隔離時發生事故的概率較大,事故發生多為小型汽車,其次是大中型汽車,貨車和客車發生事故較多。城市道路上的大中型汽車一方面能影響道路交通流情況,另一方面,數量過多,道路安全水平將大大降低,一旦發生事故,容易造成道路阻塞,甚至會引發二次事故,其造成的危險和損失比小型普通汽車大得多。
為了使預警指標的選取更具可取性和合理性,本文以受傷事故和死亡事故為研究對象,采用兩步BIRCH算法進行事故特征聚類,分析不同事故嚴重程度下影響因素的重要性和差異性。相較于經典的K-means算法,兩步BIRCH聚類算法既能處理數值型變量,又能處理分類型變量,并且不用指定聚類數目,不那么依賴于先驗知識[6]。由于事故因素較多,同一模式下對全部因素聚類分析容易造成聚類特征中的隱含信息損失,因此,本文將事故影響因素進行重組,分成“責任主體特征”和“事故環境特征”兩種模式。
由圖3,圖4可以看出,在責任主體特征方面,不論是受傷事故還是死亡事故,駕齡較低,尤其是無證駕駛引發的事故較多,受傷事故中發生事故的主體多為小型汽車,死亡事故中大型汽車的事故率也不容忽視。
由圖5,圖6可以看出,在事故環境特征方面,道路無隔離、無防護的情況下易發生受傷以上的嚴重事故,除晴天以外的天氣也有一定的事故量。一年中晴天占大多數,但是陰、雨雪天氣道路安全系數降低,更易導致事故發生。

圖3 責任主體特征—受傷事故

圖4 責任主體特征—死亡事故

圖5 事故環境特征—受傷事故

圖6 事故環境特征—死亡事故
由于事故因素無法直接量化,因此使用事故數量或事故比例對各項指標進行度量。在影響交通事故的諸多因素中,交通流的穩定程度對交通沖突的大小、道路交通安全有較大影響[7]。因此,本文構建道路交通事故預警指標體系時考慮了交通流狀況,該體系是三層結構模型,見表1,分別是目標層A、準則層B和指標層C。

表1 道路交通事故預警指標三層結構
在事故分布規律指標中,X11是事故相對于某一基期的增長量,表征的是交通事故的發展趨勢;X12是計算期事故量與基期之比,表征的是交通事故發展速度;X13是事故死亡人數與受傷人數之比,反映的是交通事故嚴重程度。在事故成因指標中,X21和X22分別是引起事故發生的主要成因和次要成因構成比例,事故原因主要有不按規定讓行、超速行駛、酒后駕駛、逆行等。X23屬于人為因素,是事故責任人3年以下駕齡(包括無證駕駛)的事故占比,X24屬于道路因素,是道路無物理隔離的事故占比,X25屬于車輛因素,是肇事汽車中大中型汽車的事故占比。X26表示在雨、雪、霧等惡劣天氣中的事故比例。X27是道路交通流量相對于某一時期的變化率。各指標級別越高,對道路安全的影響越大,事故發生的可能性和嚴重性就越大。
建立道路交通事故預警指標體系過程中,關鍵環節是確定各個指標的警限值[8-10],本文在設定警限值時主要參考了“工程評價標準”和“交通管理評價指標體系”以及應用了目前國內比較成熟的系統化分析方法,例如使用了多數、半數、少數、均數、眾數、負數和參數等原則,每個原則確定一個警限值,綜合平均這些警限值,并做適當調整得出各個指標的警限值。表2展示的是成因指標的各等級警限值[11],臨界值之間的取值通過模糊綜合評價法的隸屬度計算來確定等級。事故預警分布規律指標分級標準參見文獻[13]的表3。
1.3.1 構建預警模型
事故預警指標權重的確定和事故預警警度的計算是模型構建的重要過程。計算指標權重使用的是層次分析法(AHP)[12],使用模糊綜合評價法[13]確定隸屬度矩陣,量化各定性預警指標,指標評價由下向上分析,下層指標的評價結果是上層指標綜合評價的依據和基礎。事故預警模型的構建過程如圖7所示。

表2 道路交通事故預警成因指標分級標準

圖7 道路交通事故預警指標評價過程
通過專家和決策者咨詢對預警指標進行兩兩比較打分,采用1-9標度法構建判斷矩陣,運用定性和定量集成的AHP方法確定指標權重。設權重矩陣為A,則權重矩陣構建中的判斷矩陣如下
矩陣構建完成后計算每個矩陣的最大特征值,即所求指標的權重。最后使用CR進行一致性檢驗,若CR<0.10,則認為判斷矩陣具有協調性與同步性。CR、CI計算如下

1.3.2 計算預警警度
預警警度的計算采用兩層次模糊綜合評價,分別是準則層與指標層、目標層與準則層,預警警度計算的具體步驟為:
(1)建立因素集X
根據本文構建的預警指標體系,可得到預警因素集具有兩個層次,如下:
第一個層次包含2個因素:X={X1,X2}={事故分布規律, 事故成因分析}。
第二個層次包含Xij(i=1,2;j=1,2,…,7)個子因子,即X1={X11,X12,X13},X2={X21,X22,…,X27}。
(2)建立評價集S
評價集是各指標可作出的所有評判結果,即:Vi={v1,v2,…vn,}(i=1,2,…,n),vi表示評價等級。評價集結構和預警指標因素X對應,同樣具有兩個層次。
第1層:使用5個級別來表示道路交通安全綜合評價,即V={無警、輕警、中警、重警、巨警}。
第2層:和第1層劃分等級類似,同樣按安全級別從低到高分成5個等級。
(3)指標權重及隸屬度計算
應用AHP方法確定各指標的權重,再使用半梯形分布函數計算隸屬度,得到指標隸屬度矩陣,即量化各預警指標。
假設指標因素集為XT={x1,x2,…,xm},評價集為V={v1,v2,…vn},vj和vj+1是相鄰的兩級標準,vj+1>vj,則vj級的隸屬度函數為
(4)隸屬度模糊綜合評價
使用模糊綜合評價確定第二層的綜合評價結果:Bi=(bi1,bi2,…bik)=Ai·Ri(i=1,2)
其中,Ai是計算層對應各指標因素的權重矩陣,Ri是計算層的評判矩陣,i是計算層的指標個數,k是計算層中涉及的子指標個數。分別計算準則層兩大類指標和指標層的權重評價,得到的結果B1,B2構造總的評判矩陣R,即目標層的評判矩陣
構造準則層對于目標層的權重向量A=(a1,a2),則目標層的評價結果
由隸屬度最大原則得到B中最大值即為事故預警綜合等級。
1.3.3 判別預警級別
道路交通狀態綜合評價分為5個等級,即從I級到V級,分別對應著無警、輕警、中警、重警和巨警,不同預警信號代表不同警度[14]。見表3。

表3 道路交通事故預警等級劃分
本文選擇克拉瑪依市3個路口為研究對象,分別是昆侖路與勝利路路口、南新路與勝利路路口以及準噶爾路與勝利路路口,數據來源為2018年3個路口上半年的事故數據以及各路口的實時交通流量,事故次數增長量和事故次數發展率指標以1月份為計算基礎。通過歷史事故數據計算兩大類指標下各個子指標對應的指標值,見表4。
整理好相關預警指標數據之后,首先需要使用層次分析法對指標進行打分,構造指標評判矩陣,確定各指標的權重。表5是采用1-9標度法建立標度矩陣后的權重計算和一致性驗證。
以昆侖路與勝利路路口為例,應用半梯形分布函數計算各指標的隸屬度,得到指標隸屬度矩陣,見表6。
計算3個路口的評判矩陣和隸屬度矩陣,最終得到昆侖路與勝利路、南新路與勝利路、準噶爾路與勝利路3個路口的交通事故預警綜合評價結果,見表7。
根據最大隸屬度原則,克拉瑪依市昆侖路與勝利路路口、南新路與勝利路路口的道路交通事故預警級別均屬第II級,即輕警,預警信號是藍色,準噶爾路與勝利路路口的預警級別屬于第III級,即中警,預警信號是黃色。當預警級別在III級以上(包括III級),系統發出相應的道路交通危險警報。事故預警如圖8所示。

表4 3個路口預警指標數據

表5 指標權重及一致性檢驗

表6 評價指標的隸屬度矩陣

表7 各路口模糊綜合評價結果

圖8 系統主頁事故預警信息展示
系統集成了交通事故管理,用于事故分析與預警的數據支持,交通事故因素分析,用于挖掘事故發生與多維因素間的內在規律,以及基于視頻的車流量檢測功能,交通流量可實時獲取,準確率在80%以上,分別如圖9、圖10、圖11所示。經典的關聯規則挖掘算法曾被廣泛應用于高速公路事故預警,但由于此方法具有多次掃描事務數據庫,可能產生龐大候選集等性能瓶頸問題,因此不適合事故實時預警。本文提出的方法從建模到輸出結果時間較短,能達到實時預警效果。系統還建立了預警信息數據庫,每發布一次事故預警,預警信息都會被保存。這些信息可供交通管理部門參考,在遇到相似事件時可以借鑒歷史記錄,及時采取合理措施,為提高道路交通安全的管理水平服務。

圖9 交通事故管理

圖10 道路車流量檢測

圖11 事故因素分析
本文首先對事故動態分布規律的水平和速度指標進行分析,這比傳統的靜態方法更能反映事故發展趨勢的演變過程。利用決策樹和兩步聚類方法挖掘分析交通事故嚴重程度與人、車、路、環境等影響因素的內在關聯,構建了動、靜態指標結合的道路交通事故預警強關聯指標體系。應用層次分析和模糊綜合評價法建立了事故預警模型,形成了一套基于事故動態分析的道路交通事故預警系統,快速評判道路交通安全等級,確定道路警情,有利于交通管理部門及時采取措施,對于安全隱患道路加強警力部署和安全指揮,從而提高道路安全水平,預防交通事故的發生。該系統在克拉瑪依市實際道路安全管理上起到了一定的指導作用,有效減少了該市道路交通事故。