999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于K-means的駕駛行為離散化特征聚類分析與研究

2024-04-14 02:12:21宋月亭盧巍
現(xiàn)代信息科技 2024年2期

宋月亭 盧巍

DOI:10.19850/j.cnki.2096-4706.2024.02.005

收稿日期:2023-05-26

摘? 要:為挖掘連續(xù)駕駛行為數(shù)據(jù)中潛在的特征關(guān)系,文章采用實(shí)際運(yùn)輸車輛連續(xù)的駕駛行為數(shù)據(jù)。首先通過相應(yīng)的預(yù)處理和特征提取,獲取對(duì)應(yīng)車輛在相應(yīng)時(shí)間段連續(xù)的駕駛行為數(shù)據(jù);其次采用在離散標(biāo)準(zhǔn)數(shù)據(jù)集和連續(xù)且有噪聲數(shù)據(jù)集中均有穩(wěn)定表現(xiàn)的K-means聚類方法,對(duì)駕駛行為數(shù)據(jù)進(jìn)行離散化聚類處理與分析;最后獲得三類有代表性的駕駛行為:“平穩(wěn)型駕駛”“沖動(dòng)型駕駛”和“危險(xiǎn)型駕駛”。此外,對(duì)駕駛行為中隱含的各類特征進(jìn)行分析研究,為后續(xù)進(jìn)一步根據(jù)駕駛行為數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘之關(guān)聯(lián)分析提供有力依據(jù)。

關(guān)鍵詞:駕駛行為;聚類;離散化;特征分析

中圖分類號(hào):TP391? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):2096-4706(2024)02-0017-04

Clustering Analysis and Research on Discretization Characteristics of Driving Behavior Based on K-means

SONG Yueting, LU Wei

(School of Information Engineering, The College of Arts and Sciences Kunming, Kunming? 650221, China)

Abstract: To explore potential feature relationships in continuous driving behavior data, this paper collects continuous driving behavior data of actual transportation vehicles. Firstly, through corresponding preprocessing and feature extraction, obtain continuous driving behavior data of the corresponding vehicle during the corresponding time period; secondly, the K-means clustering method, which has stable performance in both discrete standard datasets and continuous noisy datasets, is used to make discretization clustering processing and analysis on driving behavior data; finally, three representative driving behaviors are obtained:“Steady Driving”“Impulsive Driving”“Dangerous Driving”. In addition, analyzing and studying the various hidden features in driving behavior provides a strong basis for further correlation analysis in data mining based on driving behavior data.

Keywords: driving behavior; clustering; discretization; characteristics analysis

0? 引? 言

隨著經(jīng)濟(jì)與工業(yè)生產(chǎn)的蓬勃發(fā)展,以及人們?nèi)找嬖鲩L(zhǎng)的物質(zhì)生活需求,我國(guó)汽車保有量、汽車駕駛員人數(shù)呈逐年穩(wěn)步增長(zhǎng)趨勢(shì)。與此同時(shí),駕駛量的增加帶來(lái)了交通阻塞和環(huán)境污染,也使得近年來(lái)我國(guó)車禍數(shù)量明顯增加[1]。隨著交通部門管控措施的加強(qiáng)以及國(guó)民素質(zhì)的不斷提升,交通事故發(fā)生率得到了一定程度的控制,但駕駛安全問題仍不容小覷。大部分交通事故的發(fā)生是由于駕駛員未能在駕駛過程中遵守交通規(guī)則,進(jìn)行了如疲勞駕駛、超速駕駛等不良的駕駛行為操作[2]。同時(shí)駕駛員的不良駕駛習(xí)慣,如急加速、急減速、急剎車、隨意變道等,也為避讓不及造成追尾事故埋下隱患。因此,根據(jù)實(shí)際駕駛中采集到的數(shù)據(jù),分析駕駛員行車過程中隱含的各類駕駛行為特征以及其體現(xiàn)的相關(guān)關(guān)系,成為研究安全駕駛的重要內(nèi)容。

由于車載數(shù)據(jù)獲取主要通過車輛傳感器進(jìn)行收集,因此在對(duì)獲取到的車載數(shù)據(jù)進(jìn)行分析時(shí),除了需要對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行相應(yīng)的處理和標(biāo)準(zhǔn)化外,還需要考慮到,此類數(shù)據(jù)是基于駕駛員行駛過程中每間隔一秒進(jìn)行一次數(shù)據(jù)采集,致使大量數(shù)據(jù)形成連續(xù)的行車軌跡數(shù)據(jù)。因此,本文首先對(duì)大量的駕駛行為數(shù)據(jù)進(jìn)行預(yù)處理和特征提取,進(jìn)而針對(duì)連續(xù)的駕駛行為數(shù)據(jù)進(jìn)行基于聚類分析的離散化處理,并通過聚類對(duì)不同駕駛行特征為進(jìn)行安全性能分簇,最終形成三種駕駛行為特征。

1? 駕駛行為數(shù)據(jù)特征處理

本文采用泰迪杯數(shù)據(jù)挖掘大賽中提供的部分運(yùn)輸車輛駕駛行為數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),選取了其中40輛車2018年7月30日至2018年10月10日的原始駕駛數(shù)據(jù),數(shù)據(jù)主要涉及每輛間隔1秒時(shí)間下的轉(zhuǎn)向角度、經(jīng)緯度、轉(zhuǎn)向燈情況、手剎腳剎情況、GPS速度和里程等,如表1所示。

首先,由于可能存在傳感器定位偏移、數(shù)據(jù)精度缺失、數(shù)據(jù)傳輸故障等問題,需要將原始數(shù)據(jù)進(jìn)行預(yù)處理。針對(duì)數(shù)據(jù)傳輸故障等導(dǎo)致的缺失數(shù)據(jù),結(jié)合前后時(shí)間點(diǎn)數(shù)據(jù)進(jìn)行均值填充;針對(duì)數(shù)據(jù)傳輸故障等情況,對(duì)重復(fù)時(shí)間或重復(fù)設(shè)備號(hào)數(shù)據(jù)進(jìn)行刪除;同時(shí)對(duì)明顯的速度異常、轉(zhuǎn)向角度異常、里程異常等情況進(jìn)行分析修正,對(duì)于較短時(shí)間片段內(nèi)的異常,利用前后時(shí)間點(diǎn)下的均值進(jìn)行替換,對(duì)于超過一定時(shí)間段(5 s以上)的異常值,進(jìn)行刪除;同時(shí),對(duì)手剎和腳剎狀態(tài)進(jìn)行數(shù)據(jù)區(qū)分,以便區(qū)分該剎車行為致使車輛處于停止?fàn)顟B(tài)還是減速行駛狀態(tài)。

然后,由于僅含有車輛對(duì)應(yīng)時(shí)刻行駛狀態(tài),因此需要對(duì)上述異常數(shù)據(jù)進(jìn)行分析,獲取車輛在兩次停止?fàn)顟B(tài)間,相應(yīng)時(shí)間片段內(nèi)的急加速、急減速、剎車、疲勞駕駛、平均車速、最高車速等駕駛行為特征數(shù)據(jù)。查閱相關(guān)資料,并參照行業(yè)經(jīng)驗(yàn),設(shè)定對(duì)應(yīng)時(shí)間片段內(nèi),當(dāng)a>3 m/s2,且其時(shí)間域在0<t<3 s時(shí)為急加速;當(dāng)a≤-3 m/s2,且其時(shí)間域在0<t<3 s時(shí)為急減速;當(dāng)a<-4 m/s2,且使得3 s后v<0.5 m/s時(shí)為急剎車;當(dāng)連續(xù)駕駛時(shí)間Twork>4 h且休息時(shí)間Trest<20 min,或一天累計(jì)駕駛時(shí)間T>8 h時(shí)為疲勞駕駛[3]。

最終獲得具備相應(yīng)駕駛行為特征的連續(xù)駕駛行為片段,如表2所示。

2? K-means聚類算法及其離散化檢驗(yàn)

常用的數(shù)據(jù)離散化方法有等寬法、等頻法。等寬法通過劃分相同寬度的區(qū)間對(duì)連續(xù)數(shù)據(jù)進(jìn)行劃分,簡(jiǎn)單直觀,但對(duì)數(shù)據(jù)分布要求較高,各類別下數(shù)目容易不均。相較于等寬法,等頻法避免了類分布不均勻的問題,但同時(shí)也有可能將兩個(gè)非常接近的數(shù)值劃分到不同的區(qū)間,以滿足等頻對(duì)每個(gè)區(qū)間數(shù)據(jù)個(gè)數(shù)的要求。相較于上述兩種方法,在對(duì)連續(xù)數(shù)據(jù)進(jìn)行離散化轉(zhuǎn)換時(shí),可以通過聚類算法將連續(xù)變量進(jìn)行聚類劃分處理,根據(jù)聚類結(jié)果將某一類連續(xù)屬性值表述為其潛在的某種特征類型。連續(xù)數(shù)據(jù)的離散化過程主要包括確定離散區(qū)間準(zhǔn)則和將數(shù)據(jù)屬性按照一定規(guī)則劃分[4]。由于K-means聚類算法基于數(shù)據(jù)間距進(jìn)行分析,綜合考慮了各連續(xù)數(shù)據(jù)點(diǎn)的鄰近性,因此K-means聚類算法在解決連續(xù)數(shù)據(jù)離散化中有較為不錯(cuò)的表現(xiàn)[5]。簡(jiǎn)單易懂、時(shí)間復(fù)雜度低的K-means算法為數(shù)據(jù)離散化提供了極高的計(jì)算效率。該算法具體步驟如下:

輸入:K個(gè)聚類簇?cái)?shù)目;D:包含有n個(gè)對(duì)象的數(shù)據(jù)集。

輸出:K個(gè)簇的集合及類編號(hào)。

1)隨機(jī)選取D中K個(gè)樣本作為初始聚類中心。

2)計(jì)算每個(gè)樣本與初始聚類中心間的距離并根據(jù)距離分配相應(yīng)的聚類簇。

3)移動(dòng)聚類中心,選定新的聚類中心為聚類簇重心。

4)重復(fù)步驟2),直至目標(biāo)函數(shù)最優(yōu)E值最小且不再發(fā)生變化,則算法結(jié)束。

其中,樣本間的距離計(jì)算采用歐氏距離,其計(jì)算公式如下:

(1)

聚類中心計(jì)算公式如下:

(2)

目標(biāo)函數(shù)最優(yōu)E值計(jì)算公式如下:

(3)

為檢驗(yàn)該算法針對(duì)不同數(shù)據(jù)聚類性能,本文利用數(shù)據(jù)集對(duì)K-means算法進(jìn)行分析與評(píng)估,選取人工合成連續(xù)化數(shù)據(jù)集R15[6]和標(biāo)準(zhǔn)數(shù)據(jù)集Seeds,其中R15數(shù)據(jù)集包含2個(gè)維度、15種類別的600份樣本,并含有橋接噪聲或隨機(jī)噪聲;Seeds數(shù)據(jù)集包含7個(gè)維度,3種類別的210份樣本。評(píng)價(jià)指標(biāo)本文選取準(zhǔn)確度ACC(Clustering Accuracy),具體為:

(4)

其中,yi為第i簇中聚類正確的數(shù)據(jù)點(diǎn)個(gè)數(shù),準(zhǔn)確度取值范圍在0到1之間,值越大表示聚類結(jié)果越準(zhǔn)確[7]。

由于K-means聚類算法每次隨著聚類中心選取不同,對(duì)結(jié)果會(huì)產(chǎn)生一定波動(dòng)[8-10]。為避免實(shí)驗(yàn)結(jié)果的偶然性,提高實(shí)驗(yàn)準(zhǔn)確性,本文選擇在每個(gè)數(shù)據(jù)集上運(yùn)行20次,取每次聚類結(jié)果評(píng)價(jià)指標(biāo)ACC的平均值作為最終結(jié)果。實(shí)驗(yàn)結(jié)果如表3所示。

根據(jù)上述實(shí)驗(yàn)結(jié)果可以看出,K-means算法對(duì)數(shù)據(jù)標(biāo)準(zhǔn)且離散化的數(shù)據(jù)集以及包含噪聲數(shù)據(jù)且連續(xù)化的數(shù)據(jù)集均能有效果不錯(cuò)的、穩(wěn)定的準(zhǔn)確率。說明該方法針對(duì)駕駛行為這類連續(xù)化且存在噪聲的海量數(shù)據(jù),進(jìn)行離散化處理并根據(jù)聚類效果分析不同類別下的隱性特征是有效可行的。

3? 駕駛行為離散化特征聚類分析

上述實(shí)驗(yàn)已經(jīng)檢驗(yàn)了K-means聚類算法對(duì)連續(xù)化數(shù)據(jù)的穩(wěn)定聚類性能,因此,將處理后的駕駛行為特征數(shù)據(jù)帶入進(jìn)行操作及分析。首先結(jié)合輪廓系數(shù)確定該駕駛行為數(shù)據(jù)集的最佳聚類簇?cái)?shù)。輪廓系數(shù)是評(píng)價(jià)聚類效果好壞的一種簡(jiǎn)單評(píng)價(jià)方式,假設(shè)有一點(diǎn)i,記i向量到其所屬的簇中的其他所有點(diǎn)的平均值為ai,i向量到某一不包含該點(diǎn)的簇中的所有點(diǎn)的平均距離的最小值為bi,可將i向量輪廓系數(shù)表示為:

(5)

輪廓系數(shù)取值范圍在-1到1之間,值越趨近于1表示內(nèi)聚度和分離度都越好。將所有點(diǎn)的輪廓系數(shù)求平均值,就是該數(shù)據(jù)集聚類結(jié)果的總體輪廓系數(shù)。

將不同聚類簇?cái)?shù)在駕駛行為特征數(shù)據(jù)集上進(jìn)行聚類,根據(jù)其輪廓系數(shù)結(jié)果可以看出,當(dāng)聚類簇?cái)?shù)為3時(shí),輪廓系數(shù)最大,如圖1所示,表明針對(duì)該駕駛行為數(shù)據(jù)集最佳聚類簇?cái)?shù)為3。

因此將該駕駛行為數(shù)據(jù)集聚類簇?cái)?shù)設(shè)定為3,采用平均速度、最高速度、急加速、急減速、急剎車、疲勞駕駛作為特征項(xiàng),采用K-means算法進(jìn)行離散化聚類分析。為避免聚類中心點(diǎn)的選取對(duì)實(shí)驗(yàn)結(jié)果帶來(lái)的偶然性,提高實(shí)驗(yàn)準(zhǔn)確性,本文在該駕駛行為數(shù)據(jù)集中運(yùn)行20次,將每次運(yùn)行結(jié)果的聚類中心數(shù)據(jù)取平均值,作為最終的聚類中心結(jié)果。離散化聚類處理效果如圖2所示,為呈現(xiàn)聚類效果,僅利用平均速度和最大速度進(jìn)行繪圖,但在聚類劃分過程中選取的特征數(shù)據(jù)為前文處理后獲得的6個(gè)特征項(xiàng)。

因此,基于K-means算法對(duì)駕駛行為進(jìn)行特征離散化聚類,形成3類安全性能駕駛行為分簇。各類數(shù)據(jù)簇的聚類中心點(diǎn)結(jié)果如表4所示。根據(jù)其數(shù)據(jù)特征,本文將其概括為平穩(wěn)型駕駛、沖動(dòng)型駕駛和危險(xiǎn)型駕駛。

根據(jù)表中聚類中心點(diǎn)特征數(shù)據(jù)來(lái)看,第一類整體車速都相對(duì)緩和平穩(wěn),沒有過多的急加速、急減速和急剎車,同時(shí)不存在疲勞駕駛這項(xiàng)危險(xiǎn)駕駛行為,可將此類駕駛行為歸為“平穩(wěn)型駕駛”;第二類車速相對(duì)第一類有一定的提高,相對(duì)還算穩(wěn)定,和前一類別相比,在急加速、急減速和急剎車方面次數(shù)有明顯增多,說明此類駕駛行為在行車過程中,駕駛?cè)藛T經(jīng)常習(xí)慣性猛踩剎車急停或猛踩油門加速,盡管最高速度在正常限速范圍下,此類行為在某些情況下有可能釀成交通事故,同時(shí)在該類別中,有少量駕駛?cè)藛T存在一定的疲勞駕駛情況,可將此類駕駛行為歸為“沖動(dòng)型駕駛”;第三類整體車速過快,平均車速較高,同時(shí)急加速、急剎車等情況最多,在反復(fù)的猛踩油門加速過程中,使得中心點(diǎn)最高車速較為接近路段限速范圍。同時(shí)在該類別中,普遍存在疲勞駕駛的情況且次數(shù)較多,另外根據(jù)具體數(shù)據(jù)樣本,還監(jiān)測(cè)到有數(shù)次超速情況發(fā)生。此類疲勞駕駛、超速行駛等危險(xiǎn)駕駛行為是導(dǎo)致交通事故發(fā)生的重要因素,由此可將此類駕駛行為歸為“危險(xiǎn)型駕駛”。

4? 結(jié)? 論

本文針對(duì)駕駛行為的連續(xù)化原始數(shù)據(jù),通過相應(yīng)的數(shù)據(jù)預(yù)處理對(duì)駕駛行為特征進(jìn)行提取,結(jié)合K-means聚類方法,對(duì)駕駛行為數(shù)據(jù)集進(jìn)行離散化聚類處理與分析,最終在該數(shù)據(jù)集上獲得三類代表性駕駛行為歸類。根據(jù)每個(gè)類別中心點(diǎn)特征和該類別下數(shù)據(jù)樣本特征,對(duì)其相應(yīng)的駕駛行為特征數(shù)據(jù)進(jìn)行分析,挖掘駕駛行為下的隱性特征,分別將其三個(gè)類別歸為“平穩(wěn)型駕駛”“沖動(dòng)型駕駛”和“危險(xiǎn)型駕駛”。根據(jù)駕駛數(shù)據(jù)可以看出,“平穩(wěn)型駕駛”體現(xiàn)了大部分防御性駕駛?cè)藛T的駕駛行為習(xí)慣,整體駕駛較為緩和平穩(wěn);“沖動(dòng)型駕駛”體現(xiàn)了當(dāng)下很多情緒急躁駕駛?cè)藛T的行車習(xí)慣,盡管車速不算太快,但是習(xí)慣性猛踩油門或猛踩剎車,容易造成追尾,存在一定的安全隱患;“危險(xiǎn)型駕駛”體現(xiàn)了一些存在“路怒癥”或是對(duì)自己極度自信的駕駛?cè)藛T的行車習(xí)慣,由于存在疲勞駕駛和超速行駛等危險(xiǎn)行為,極易發(fā)生交通事故。因此,可以看出本文通過基于K-means的駕駛行為離散化特征分析,根據(jù)實(shí)際行車數(shù)據(jù)有效地進(jìn)行了不同代表性駕駛行為的劃分,為后續(xù)進(jìn)一步根據(jù)駕駛行為數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析數(shù)據(jù)挖掘提供了依據(jù)。

參考文獻(xiàn):

[1] 王萬(wàn)豐.我國(guó)道路交通安全事故統(tǒng)計(jì)分析 [J].中國(guó)安全生產(chǎn),2020,15(3):52-53.

[2] XING Y,LYU C,WANG H J,et al. Driver Activity Recognition for Intelligent Vehicles: A Deep Learning Approach [J].IEEE Transactions on Vehicular Technology,2019,68(6):5379-5390.

[3] 廖紀(jì)勇.基于聚類和關(guān)聯(lián)規(guī)則的駕駛行為分析與研究 [D].昆明:昆明理工大學(xué),2021.

[4] 孫吉貴,劉杰,趙連宇.聚類算法研究 [J].軟件學(xué)報(bào),2008,19(1):48-61.

[5] 張良均,楊坦,肖剛,等.MATLAB數(shù)據(jù)分析與挖掘?qū)崙?zhàn) [M].北京:機(jī)械工業(yè)出版社,2015.

[6] 于彥偉,賈召飛,曹磊,等.面向位置大數(shù)據(jù)的快速密度聚類算法 [J].軟件學(xué)報(bào),2018,29(8):2470-2484.

[7] NIE F P,WANG C L,LI X L. K-Multiple-Means: A Multiple-Means Clustering Method with Specified K Clusters [C]//Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining.Anchorage:ACM Press,2019:959-967.

[8] 江文奇,黃容,牟華偉,等.面向大規(guī)模數(shù)據(jù)精簡(jiǎn)的聚類中心點(diǎn)優(yōu)化和FCM算法設(shè)計(jì) [J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2021,51(17):144-151.

[9] 羅興隆,賀興時(shí),楊新社.二分k-means錨點(diǎn)提取的快速譜聚類 [J].計(jì)算機(jī)工程與應(yīng)用.2023,59(16):74-81.

[10] 姜子超.基于禿鷹搜索算法優(yōu)化K-Means的動(dòng)態(tài)特征子集聚類研究 [D].哈爾濱:東北林業(yè)大學(xué),2022.

作者簡(jiǎn)介:宋月亭(1995.10—),女,漢族,山東濟(jì)寧人,助教,碩士,主要研究方向:人工智能與數(shù)據(jù)挖掘。

主站蜘蛛池模板: 国产永久免费视频m3u8| 色悠久久综合| 国产精品第一区| 久久亚洲国产一区二区| 中文字幕人成人乱码亚洲电影| 日本久久久久久免费网络| av一区二区无码在线| 午夜老司机永久免费看片| 亚洲精品成人片在线观看| 亚洲第一极品精品无码| 欧美日韩福利| 亚洲综合婷婷激情| 国产成熟女人性满足视频| 在线看AV天堂| 久久综合色天堂av| 国产精品乱偷免费视频| 亚洲欧洲日本在线| 国产 日韩 欧美 第二页| 老司机精品一区在线视频 | 亚洲精品免费网站| 国产成人永久免费视频| 日韩色图在线观看| 日本免费a视频| 黄色成年视频| av在线5g无码天天| 亚洲码一区二区三区| 国产人成午夜免费看| 91福利免费| 狠狠色丁婷婷综合久久| 国产成人高清精品免费5388| 91视频青青草| 亚洲第一成网站| 试看120秒男女啪啪免费| 四虎AV麻豆| 亚洲区视频在线观看| 国产视频 第一页| 国产成人在线无码免费视频| 国产欧美精品专区一区二区| 亚洲人成在线精品| 91小视频版在线观看www| 日本精品αv中文字幕| 中文字幕无码av专区久久| 国产波多野结衣中文在线播放| 亚洲区第一页| 久久成人18免费| AV不卡国产在线观看| 亚洲天堂2014| 色婷婷亚洲综合五月| 国产精品毛片一区视频播| 老熟妇喷水一区二区三区| 国内精自线i品一区202| 夜色爽爽影院18禁妓女影院| 亚洲欧洲日韩久久狠狠爱| 一级毛片不卡片免费观看| 国产精品无码一二三视频| 精品丝袜美腿国产一区| 在线观看av永久| 天堂成人在线视频| 国产导航在线| 午夜精品区| 网久久综合| 亚洲国产天堂久久九九九| 内射人妻无码色AV天堂| 亚洲区欧美区| 97在线碰| 视频一本大道香蕉久在线播放 | 久久亚洲精少妇毛片午夜无码| 精品久久蜜桃| 综合色88| 亚洲天堂久久久| 国产精品视频第一专区| 乱人伦视频中文字幕在线| 国产第一页屁屁影院| 日韩国产 在线| 欧美综合激情| 亚洲综合极品香蕉久久网| 激情无码视频在线看| 国产欧美日韩专区发布| 欧美成人午夜视频| 中国一级特黄大片在线观看| 91精品免费高清在线| 97国产在线观看|