999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于APRIORI-TAN的交通事故傷害分析與預測*

2021-09-09 07:45:42韓天園呂凱光許江超
中國安全生產科學技術 2021年8期
關鍵詞:關聯規則

韓天園,呂凱光,許江超,李 旋,喬 潔

(長安大學 汽車學院,陜西 西安 710064)

0 引言

近年來,隨著我國道路交通基礎設施和安全法規的不斷完善,交通安全形勢整體有所改善,但事故平均傷害程度卻保持了平緩的增長[1],與發達國家相比,我國交通事故死亡率相對較高[2]。大量傷亡事故不僅直接危害交通參與者的生命財產安全,還影響正常的社會生產和生活[3]。此外,我國人口、道路里程、機動車保有量等方面尚有較大的增長空間,交通事故傷亡人數存在上升的潛在威脅[4]。探究事故規律有利于排查安全隱患和保障交通安全。

目前,計算機仿真、駕駛評價和事故大數據挖掘是交通事故預防和預測的3種理論依據。趙樹恩等[5]提出基于人車路協同的車輛彎道安全車速模型,并基于Trucksim驗證模型的可行性;Battiato等[6]通過車載監控錄像評價行駛安全,計算車輛道路運行的交通事故風險;Kaur等[7]通過分析事故數據的時空分布,進而預測和預防事故發生。仿真和主客觀評價雖然能夠先于事故發現部分隱患,但過于簡化的模型并不能解釋某些事故特征間的相關性。事故數據是道路交通安全的直接反映,挖掘事故數據有利于揭示事故特征的實際關系與潛在聯系[8]。

針對事故因素的相關關系與因果關系的挖掘被廣泛應用于事故描述、解釋、預測和預防[9]。如基于聚類算法、關聯規則、自然語言處理等算法的事故生成規則探究[10],基于樸素貝葉斯、隨機森林、神經網絡等算法的事故幾率和嚴重程度預測[11]。多種機器學習方法的組合能有效克服單一算法的缺陷,增強算法的適用性,進而提高事故分析和預測的可靠性[12]。Rusli等[13]基于邏輯回歸與決策樹探究發現長大下坡及彎坡路段的坡長與事故傷害呈正比,且正面碰撞傷害高于追尾碰撞;Xu等[14]運用卡方檢驗、聚類和關聯規則分析事故駕駛員、車輛、道路等數據關系,從人、車、路3方面提出事故預防的具體措施;AlKheder等[15]基于決策樹發現行人、老年司機和前排乘客更容易受到嚴重或致命的傷害,貝葉斯網絡比支持向量機預測事故傷害更準確。

本文以2 467條涉及人員傷亡的道路交通事故數據為數據集,運用Apriori關聯規則分析和社會網絡分析探究受傷事故和死亡事故的生成規則及其網絡關系,并基于樹型貝葉斯網絡預測事故傷害程度,為事故預防和預測提供理論依據。

1 數據預處理

1.1 數據預處理

從長安大學機動車事故鑒定中心收集2 654條涉及人員傷亡的道路交通事故數據,通過數據清洗剔除無效和冗余數據,共篩選出包含17個特征維度的2 467起事故數據。

為探究事故傷害程度與道路條件、交通環境、時間規律等因素的相關性,選擇16個特征因素(A~P)為自變量,見表1。以交通事故傷害嚴重程度為因變量,《道路交通事故信息調查》(GA/T 1082—2021)將事故分為財產損失事故、受傷事故和死亡事故3個等級,由于缺少財產損失事故數據,因此因變量分為受傷事故Y1和死亡事故Y2。

表1 事故因素的數據詳情

1.2 數據預分析

從時間分布分析,5月交通事故發生最多,1月的死亡事故率最高,7月的死亡事故率最低,月份-事故分布如圖1所示;在工作日的事故頻數明顯高于非工作日,星期-事故分布如圖2所示;11時與17時左右是事故發生的2個高峰期,凌晨死亡事故率更高,2時的死亡事故率高達56%,時間-事故分布如圖3所示。

圖1 月份-事故分布

圖2 星期-事故分布

圖3 時間-事故分布

從空間分布分析,城市公路事故量占比最大,高速公路死亡事故率明顯更高,道路分類-事故分布如圖4所示;道路最高限速越大,死亡事故率越高,最高限速等級-事故分布如圖5所示;交叉路段和丁字路口是事故發生的主要場景,坡道路段死亡事故率顯著,且上坡路段死亡事故率高于下坡路段,道路特征-事故分布如圖6所示;水泥路面死亡事故率最低,未鋪砌路面死亡事故率最高,道路兩側路面情況-事故分布如圖7所示。

圖4 道路分類-事故分布

圖5 最高限速等級-事故分布

圖6 道路特征-事故分布

圖7 兩側路面情況-事故分布

從交通環境分布分析,干路面死亡事故率只有結冰(霜)路面的1/3,路面情況-事故分布如圖8所示;車流量小(個別車輛)時事故占比最大,而交通堵塞時死亡事故率最高,達到44%,車流量-事故分布如圖9所示;雪天的死亡事故率明顯高于其他天氣,天氣-事故分布如圖10所示。

圖8 路面情況-事故分布

圖9 車流量-事故分布

圖10 天氣-事故分布

此外,人行橫道事故的死亡事故率明顯更高,事故類型-事故分布如圖11所示;同向刮擦事故數量最多,而碰撞固定物的死亡事故率最高,事故形態-事故分布如圖12所示;違規停車、其他司機錯誤、違反道路優先權和安全距離不足是事故主要原因,但超速和酒駕的死亡事故率遠高于其他原因,事故原因-事故分布如圖13所示。

圖11 事故類型-事故分布

圖12 事故形態-事故分布

圖13 事故原因-事故分布

2 事故傷害的關聯性規則分析

2.1 Apriori關聯規則

Apriori算法用以掃描數據集中滿足最小支持度minSup的頻繁項集和提取頻繁項集中滿足最小置信度minCon的關聯規則。相較于P-Growth,Eclat算法,Apriori可獨立挖掘數據集中的關聯規則,適用于小數據集的關聯規則分析。

關聯規則的支持度Support為項集中所有項同時發生的概率,如式(1)所示:

Support(A→B)=Support(AB)=P(A∪B)

(1)

式中:A為前項;B為后項。

置信度Confidence是A項發生后B項發生的條件概率,如式(2)所示:

(2)

提升度Lift用以分析存在前項A時是否更傾向發生后項B,如式(3)所示:

(3)

若Lift>1,表明A和B正相關,AB關聯規則有效。

2.2 基于Apriori算法的關聯規則挖掘

設置minCon=0.9,以保證挖掘的關聯規則的可靠性。鑒于數據死亡事故Y2占比較小,為提高數據的利用率和保證關聯規則挖掘的全面性,需要設置較低的支持度閾值以平衡死亡事故Y2的頻繁項集支持度。

當minSup=0.01時,共篩選出26條死亡事故Y2的強關聯規則,其中包括3個3-項集、9個4-項集和10個5-項集和4個6項集,見表2。關聯規則提升度全部大于5,表明前后項的高相關性。

表2 死亡事故的關聯規則

當最小支持度minSup=0.01時,共挖掘到3 213條受傷事故Y1的關聯規則,因此將Y1的最小支持度提高至0.1,最終提取出33條滿足提升度的強關聯規則,其中包括2個2-項集、14個3-項集、13個4-項集和4個5-項集,見表3。

表3 受傷事故的關聯規則

2.3 基于社會網絡圖的關聯規則分析

社會網絡分析及其可視化能夠對某一社會現象的結構與關系進行準確地量化表征與分析,基于UCINET軟件完成事故傷害關聯規則網絡的核心-邊緣分析和可視化。通過計算網絡密度分布以區分網絡核心和網絡邊緣,顯示關聯規則中各項的分布與聯系。社會網絡節點越大,表明關聯規則網絡中該項的網絡中心性越高,即在關聯規則的出現頻率越高;節點連線越粗,表明對應節點在關聯規則的共現頻率越高。

受傷事故Y1有同向刮擦M5、市區L1、工作日K1、城市道路B5、匯入/換道事故H3等14個強關聯規則項,共有42條節點連線,其中M5-L1,M5-K1和M5-B5的共現頻數大于10,受傷事故的關聯規則網絡如圖14所示。核心-邊緣分析結果顯示,Y1,M5和L1是網絡核心區域,區域密度為7.5。

圖14 受傷事故的關聯規則網絡

死亡事故Y2有碰撞固定物M6、人行橫道事故H4、高速公路B1、高速道路P4、非市區L2等10個強關聯規則項,29條節點連線,其中H4-B1,M6-B1,M6-P4,H4-L2和B1-L2共現頻數大于10,死亡事故的關聯規則網絡如圖15所示。酒駕N1和超速N12為單獨的1組關聯規則。核心-邊緣分析結果顯示,Y2,M6,H4和B1是網絡核心區域,區域密度為7.0。

圖15 死亡事故的關聯規則網絡

對比可知,市區和城市道路易發生受傷事故,非市區和高速公路易發生死亡事故。碰撞固定物和碰撞行人(人行橫道)的傷害程度高于車輛同向刮擦。超速駕駛提高了事故傷害,而酒駕強關聯于超速。由核心-分析可知,相較于受傷事故,死亡事故的網絡更加簡單,且網絡特征更加突出。事故傷害關聯規則分析結果與事故數據預分析結果相吻合,表明了APRIORI算法的有效性。

3 基于樹型貝葉斯網絡的事故傷害預測

3.1 樹型貝葉斯網絡

樹型貝葉斯網絡(Tree Augmented Naive Bays,TAN)是1種適用于離散數據的預測模型。TAN中各個屬性變量既依賴于類屬性,還至多依賴于1個非類屬性節點,降低了樸素貝葉斯非類屬性間的強條件獨立性假設要求,如式(4)所示:

(4)

式中:Y為類屬性;y為類變量值;Ai為非類屬性某一類別;Bj為Ai依賴的非類屬性的某一類別。

樹型貝葉斯網絡構建主要分為以下4個步驟:

步驟1:計算每1組非類屬性在給定類屬性的條件互信息I(A;B|Y),如式(5)所示:

(5)

步驟2:根據非類屬性間條件互信息值降序排列,依次取出其中的節點對,基于不產生環路的原則,構建最大權重生成樹。

步驟3:選擇任一非類屬性作為根節點,將無向樹轉換為有向樹。

步驟4:增加類屬性節點和每個非類屬性節點的有向連接弧,構造TAN的網絡結構。

在樹型貝葉斯網絡結構中,如果節點A依賴于節點B,則連接弧由B指向A。

3.2 事故傷害程度預測

采用SPSS Modeler軟件構建事故傷害預測的樹型貝葉斯網絡模型,如圖16所示。由樹結構分析可知,事故區域L與車流量A,道路分類B與事故形態M、事故季節J與路面情況G等相連節點之間存在較強的相關性。

圖16 事故傷害預測的樹型貝葉斯網絡模型

由構建的樹型貝葉斯網路預測事故的傷害嚴重程度,是根據樹節點的條件概率逆向計算傷害程度的分類概率。

最終分類器的預測正確率達87.56%,表明樹型貝葉斯網絡對事故傷害程度的預測效果良好。各事故因素的預測重要性如圖17所示。由于道路分類B與其他因素的條件互信息值較大,導致信息冗余度較高,因此預測重要性降低。

圖17 各事故因素的預測重要性

4 結論

1)對事故數據的可視化分析表明,在時間分布上,1月份和凌晨0~5時的事故傷害程度最嚴重,7月事故傷害程度最低;在道路環境分布上,道路最高限速與事故傷害程度呈正比,結冰(霜)路面和坡道路段事故傷害更嚴重,雪天事故傷害顯著。此外,違規停車、其他司機錯誤、違反道路優先權和安全距離不足是事故主要原因,但超速和酒駕的事故傷害明顯更高。

2)對事故傷害的關聯規則分析表明,受傷事故共有同向刮擦、市區等14個強關聯規則項,死亡事故共有碰撞固定物、人行橫道事故、高速公路等10個強關聯規則項,但死亡事故的關聯規則的相關性更高。

3)社會網絡分析不僅能夠反映關聯規則的各類數量信息,還能形象表達規則項之間的作用關系。樹型貝葉斯網絡考慮了事故因素間相關性,模型不僅有較高的預測準確性,同時能夠反映各事故因素的預測重要性。

猜你喜歡
關聯規則
撐竿跳規則的制定
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
“一帶一路”遞進,關聯民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
規則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 米奇精品一区二区三区| 3344在线观看无码| 欧洲日本亚洲中文字幕| 六月婷婷精品视频在线观看| 久久精品嫩草研究院| 久久亚洲日本不卡一区二区| 日日噜噜夜夜狠狠视频| 无码乱人伦一区二区亚洲一| 日韩精品中文字幕一区三区| 大陆精大陆国产国语精品1024| 91亚洲精选| 欧美日韩国产在线人| 精品国产免费观看| 99re这里只有国产中文精品国产精品 | 毛片一级在线| 亚洲国语自产一区第二页| 久久精品国产精品青草app| 波多野结衣一二三| 看国产一级毛片| 91福利免费| 丰满少妇αⅴ无码区| 婷婷六月色| 亚洲欧州色色免费AV| 一级看片免费视频| 久久性妇女精品免费| 国产福利不卡视频| 无码粉嫩虎白一线天在线观看| 欧美va亚洲va香蕉在线| 午夜无码一区二区三区| 国产精品v欧美| 毛片视频网| 欧美综合区自拍亚洲综合天堂| 国产99热| 福利在线不卡| 欧美特级AAAAAA视频免费观看| 国产一级视频在线观看网站| 伊人91在线| 老熟妇喷水一区二区三区| 日本AⅤ精品一区二区三区日| 人禽伦免费交视频网页播放| 午夜国产理论| 丁香六月综合网| 男人的天堂久久精品激情| 国产丝袜第一页| 伊人色综合久久天天| 97国产成人无码精品久久久| 亚洲VA中文字幕| 亚洲视频一区| 欧美日本激情| 国产精品成人啪精品视频| 91国语视频| 五月婷婷综合色| 中文字幕第4页| 黄色网在线| 久久久91人妻无码精品蜜桃HD| 日本黄网在线观看| 国产h视频免费观看| 91最新精品视频发布页| 99久久精品免费看国产电影| 国内黄色精品| 免费观看国产小粉嫩喷水| 99ri精品视频在线观看播放| 99尹人香蕉国产免费天天拍| 日韩免费毛片视频| 国产精品福利社| 欧美午夜在线视频| 自拍亚洲欧美精品| 91原创视频在线| 欧美国产精品拍自| 无码AV高清毛片中国一级毛片| 超碰精品无码一区二区| 99精品久久精品| 国产女人18水真多毛片18精品 | 啪啪啪亚洲无码| 色天天综合久久久久综合片| 国产真实乱子伦精品视手机观看| 狠狠色婷婷丁香综合久久韩国| 久久综合九九亚洲一区 | 国产后式a一视频| 她的性爱视频| 狠狠亚洲五月天| www.youjizz.com久久|