999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘技術的交通事故關聯分析

2017-12-21 14:16:14楊東紅
數字技術與應用 2017年10期
關鍵詞:數據挖掘

楊東紅

摘要:基于數據挖掘在潛在價值信息發現、具備大數據量處理能力等優勢,采用關聯規則挖掘方法對英國近10年交通事故數據進行分析,本文通過Python語言建立Apriori關聯規則挖掘模型,分析交通事故發生的頻繁因素集,發現交通事故數據中存在的關系和規則,從而為交通事故預警和管理提供數據決策支撐。

關鍵詞:數據挖掘;關聯規則;Apriori;交通事故

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2017)10-0230-01

隨著社會經濟快速發展,科技水平和人們生活提升,機動車數量近年來呈現出逐年大幅度增長的趨勢。交通建設的進度遠遠跟不上日益增長的車輛數,隨之給城市交通帶來了巨大的壓力,導致交通堵塞問題嚴重、交通事故日益頻發[1],導致國家和人民大眾大量經濟損失。

在傳統的交通事故分析中,多數采用統計學描述方法,通過事故發生概率、分析事故發生規律,基于這些規律給出一些交通相關參考意見。而數據挖掘作為一種從大量的數據中發掘有價值信息的技術,能給予決策人員基于有價值信息通識全局和潛在情況,并制定相應決策。

本文針對英國交通事故歷史數據進行分析,利用數據挖掘技術挖掘出有效的關聯規則,探討相同類型交通事故發生規律,進而通過天氣、道路情況等確定其可能的交通事故,利用關聯規則實現關聯事故的提前預警。同時,了解車輛參數、駕駛員信息對交通事故發生的潛在影響,掌握交通事故多因素關聯關系。

1 數據挖掘技術

數據挖掘是指從大量的數據中通過算法搜索隱藏于其中潛在價值信息的過程[2],自上世紀70年代起至今,數據挖掘從理論到實踐得到了快速進步,特別是在應用實踐中,其已涵蓋人類生活的方方面面。

數據挖掘常用的分析方法有分類、聚類、預測、關聯規則等,其中關聯規則分析由于其在商業領域的眾多成功應用,使得該方法在數據挖掘領域成為一個重要分支。

1.1 關聯規則

設為項的集合,其中的元素稱為項;事物數據庫為事務T的集合,每個事務都對應I上的一個子集,有,,計為X和Y關聯。

1.2 支持度

設,項集在事物數據庫D上的支持度指特定事務在D中所占的百分比,即:

若項集滿足最小支持度,則稱之為頻繁項集。Lk表示頻繁k-項集的集合。

1.3 置信度

關聯規則的置信度是指包含X和Y的事務數與包含X的事務數之比[3],即:

1.4 Apriori算法

Apriori算法采用逐層搜索的迭代方法,在分類上屬于布爾型關聯規則[4],反復沖頻繁K-項集去尋找頻繁(K+1)-項集。首先遍歷事物庫,找出頻繁1-項集的集合。記作L1,將L1自連接從而生成頻繁2-項集的集合L2,而L2生成L3,如此下去,直到不能找到LK ,即頻繁K-項集。

Apriori算法的流程圖如圖1。

2 實驗

基于數據挖掘技術的交通事故關聯分析包括3個步驟:

(1)數據預處理,由于數據存在大量缺失、異常數據等問題,因此需要進行數據預處理,包括缺失值處理、異常值處理、屬性變換、數據離散化等問題。

(2)建立挖掘模型,挖掘關聯規則。

(3)模型評估與分析,評估模型結果和分析關聯規則挖掘結果。

數據來源于英國交通部公布的2005-2015年交通事故數據,共包括1780653條交通事故數據,該數據集涵蓋了交通事故發生的地點、時間、道路類型、交通情況、人員、車輛、天氣等信息。

本文對數據缺失值處理主要采用KNN,回歸和刪除缺失值三種方法,其中對于缺失比過大的采用刪除缺失值的方法,對于連續型屬性采用回歸法填充,對于離散型屬性采用KNN法填充。

本文利用Python語言建立Apriori關聯規則模型,基于交通事故數據集中17個屬性構建關聯分析模型。

在實驗過程中,設定最小支持度min_Sup為10%,最小置信度min_Conf為35%,通過上述的關聯規則挖掘模型交通事故數據進行關聯規則提取和分析,得出一些有意義的關聯規則,下面舉例說明:

(天氣:雨)∧(光線:黑暗無光)∧(城鄉類型:農村)∧(道路類型:B)∧(車輛操作:左轉彎)∧(道路形式:單向路)∧(性別:男)∧(年齡段:中年)∧(時段:22-24)側翻(sup=0.566,conf=0.873)

以上示例代表了一個關聯模式,其后面給出了支持度和置信度的取值,以此來表征該關聯模式在總事故數中出現的頻度和符號“”前面的因素組合推導出后面的事故類型的可能性大小。通過調整算法的最小支持度、最小置信度的閾值或采用不同屬性建模,可以發現更多的關聯規則。

3 結語

關聯規則挖掘是一種非常流行的技術,可以用來識別事故發生時經常發生的不同屬性之間的關系。在本文中,將關聯規則挖掘算法應用于分析交通事故因素關系。對交通事故的發生實現了定性分析,進而依據分析結果可以交通事故的發生提出預報,為交通事故預警提供理論依據和數據支撐。

參考文獻

[1]陳錚.基于激光掃描數據的交通信息采集平臺設計與實現[D].山東科技大學,2010.

[2]RonZacharski,扎哈爾斯基,王斌.寫給程序員的數據挖掘實踐指南[M].人民郵電出版社,2015.

[3]劉雨露,方剛.目標關聯規則挖掘算法的研究與應用[J].西南師范大學學報(自然科學版),2010,35(6):115-119.

[4]高俊,何守才.布爾型關聯規則挖掘算法研究[J].計算機工程,2006,32(1):116-118.endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 亚洲二区视频| 国产在线视频欧美亚综合| 国产亚洲精久久久久久久91| 欧美综合成人| 黄色一及毛片| 久久综合国产乱子免费| 毛片视频网址| 日韩在线中文| 午夜限制老子影院888| 欧美日韩福利| 日韩精品成人在线| 久久综合五月| 99免费视频观看| 国产成人综合网在线观看| 国产欧美日韩va另类在线播放| 国产精品私拍在线爆乳| 最近最新中文字幕免费的一页| 婷婷五月在线| 99久久国产综合精品女同| 亚洲视频在线青青| 粗大猛烈进出高潮视频无码| 亚洲日韩国产精品综合在线观看| 国产成人精品综合| 国内精品一区二区在线观看| 71pao成人国产永久免费视频| 国产成人成人一区二区| 国产亚卅精品无码| 亚洲日韩精品综合在线一区二区| 四虎精品免费久久| 久久 午夜福利 张柏芝| 99热这里只有精品5| 中文字幕乱码二三区免费| 91福利国产成人精品导航| 国产亚洲男人的天堂在线观看 | 99国产精品免费观看视频| 伊人网址在线| 日韩精品成人网页视频在线| 久久动漫精品| 久久久久九九精品影院| 亚洲欧美另类日本| 中国丰满人妻无码束缚啪啪| 中文字幕2区| 国产乱子伦手机在线| 中文字幕首页系列人妻| 中文字幕欧美成人免费| 特级毛片8级毛片免费观看| 波多野结衣一二三| 成人毛片免费观看| 国产麻豆另类AV| 日本一区高清| 成人无码区免费视频网站蜜臀| 久草网视频在线| 亚洲激情99| 女人18毛片一级毛片在线| 中文字幕亚洲综久久2021| 日韩在线2020专区| 午夜国产小视频| 风韵丰满熟妇啪啪区老熟熟女| 欧美福利在线| 国产女人在线观看| 免费激情网站| 国产靠逼视频| 欧洲高清无码在线| 免费毛片a| 青青青国产在线播放| 最新国产网站| 无码精油按摩潮喷在线播放| 全部毛片免费看| 欧美一级一级做性视频| 成人免费一级片| 日韩美一区二区| 欧美第一页在线| 欧美一区二区三区欧美日韩亚洲| 青青青视频91在线 | 国产永久免费视频m3u8| 天天躁夜夜躁狠狠躁图片| 美女免费黄网站| 国产精品护士| 四虎AV麻豆| 久久婷婷人人澡人人爱91| 五月六月伊人狠狠丁香网| 台湾AV国片精品女同性|