王 瀟
(國際關系學院 信息科技學院,北京 100091)
基于車聯網數據挖掘的貨運車輛駕駛行為聚類研究
王 瀟
(國際關系學院 信息科技學院,北京 100091)
車聯網環境下的海量信息,就挖掘分析貨運車輛的駕駛特征來說有著特殊的意義與價值。通過挖掘車輛速度、加速度等行駛數據有助于研究車輛駕駛人員的駕駛行為,有利于規范駕駛人員的駕駛行為,同時實現對車輛的智能化管理。文章以車聯網數據為基礎,將河北省范圍內運營的部分貨運車輛作為研究對象,獲取這些車輛駕駛人員的駕駛行為的特征參數,利用基于因子分析的數據挖掘方法對參數進行轉化,以此作為指標并采用K-Means聚類方法對駕駛行為進行挖掘分析。
車聯網;數據挖掘;因子分析;聚類分析;K-Means聚類
車聯網是指由車輛位置、速度、路線等車輛信息組成的龐大的交互網絡[1]。該網絡的實現,以車輛安裝的電子標識為基礎,利用無線射頻等電子技術,實現在信息網絡平臺上顯示所有車輛的屬性信息和靜態、動態信息。對這些信息進行提取并有效利用,根據不同的功能需求可以對所有車輛的運行狀態進行有效的監管,提供綜合服務。本文主要從數據挖掘的角度出發,分析司機人員的駕駛行為與道路安全之間的關系。
數據挖掘技術,顧名思義,是指在海量的、混雜的、隨機的數據中,根據需要提取出隱藏在其中的、具有應用價值的數據的過程[2]。應用數據挖掘技術,使得大量冗雜的數據重新具有了應用的價值。在數據量呈爆炸式增長的今天具有重要意義。
本文使用的數據是車載終端收集的車輛運營數據,主要是利用車聯網技術實現貨運車輛的智能化管理。數據精度符合數據分析的要求。這些數據主要包括車輛的定位信息、行駛道路信息以及車輛速度信息等內容。
4.1 數據處理
本文使用的數據是車聯網數據,該車聯網數據采集的是2016年10月10—19日這20天當中,在河北省某國道上行駛的16輛貨運車輛的車載終端的數據。該數據一共為2 000萬條原始數據。從實際的角度出發,文章在數據處理過程中舍棄了速度持續為0的數據。表1顯示的是數據處理的結果。

表1 數據處理結果
4.2 數據分析
4.2.1 駕駛行為特征參數因子分析
本文對駕駛行為特征參數進行數據分析使用的工具是SPSS19.0統計軟件,因子的提取采用的是主成分分析方法、因子旋轉采用的是最大方差法。通過對駕駛行為特征參數進行因子分析,得出變量間的KMO度量為0.61,該數值表明各個表兩件具有一定的相關性。同時,數據的球形假設檢驗得出的結果是0.000,即顯著水平是0.000,拒絕零假設,說明實驗采用的數據樣本量充足。駕駛行為特征參數的因子分析結果如表4所示。
從表2可以看出,累計方差達到了79.899%的情況下,對駕駛特征參數的分析獲得了2個主因子,并且這兩個主因子包含了原始數據的79.899%的信息,滿足了進行因子分析的要求,并且旋轉前與旋轉后的累積貢獻率也沒有發生變化。

表2 解釋的總方差
從表3可以看出,因子1與加速度有關的特征參數(平均加速度、加速度標準差、正向平均加速度、反向平均加速度)的載荷分別是0.987,0.942,0.932,0.889,明顯大于在其他變量上的載荷。通過表4能夠發現,對主因子1和主因子2進行旋轉后,旋轉因子1與加速度相關的量(平均加速度、加速度標準差、正向平均加速度、反向平均加速度)的關聯度分別是0.992,0.923,0.913,0.910。

表3 成分矩陣

表4 旋轉成份矩陣
4.2.2 基于K-Means聚類的分析
通過對主因子、旋轉因子以及駕駛行為特征變量之間的相關性可以看出:主因子1與加速度相關的變量之間有著較強的關聯性。因此,可以將主因子1作為K-Means聚類得標準。與此同時,可以將主因子2作為速度相關駕駛行為的聚類標準進行聚類。
將主因子1作為K-Means聚類的標準得出的聚類結果如表5所示。

表5 聚類結果
通過表5可以看出,貨運車輛的駕駛行為的特征參數根據主因子1的特征進行聚類,聚類為2類是比較合適的。貨運車輛駕駛人員在貨車運行過程中的變速行為均有著不同的程度,但是劇烈變化的數量比較少[4]。將主因子2作為K-Means聚類的標準得出的聚類結果如表6所示。

表6 聚類結果
由表6可以看出,對貨運車輛駕駛行為的特征參數以主因子2作為標準進行聚類,聚類為4類比較合適。貨運車輛駕駛人員在駕駛貨運車輛過程中,絕大部分沒有出現超速行為,只有極少數的車輛在行駛過程中出現了不同程度的超速行為。
本文以貨運車輛上安裝的車機終端收集的貨運車輛車聯網數據作為研究對象,提取并且進一步細化了有關貨運車輛駕駛行為的特征參數,將獲取的河北省范圍內運營的貨運車輛產生的海量車聯網數據進行處理,使其能夠更加清晰、明確地體現貨運車輛在行駛過程中的駕駛行為特征。在分析的過程中,采用了因子分析與聚類分析相結合的方法,對貨運車輛的駕駛行為特征參數進行因子分析以及聚類分析,較好地體現出了各個特征參數之間的相關性,明確地反映出了貨運車輛在行駛過程中特征行為的分布。
[1]高永強.網絡安全技術與應用[J].技術研究,2013(9):42-43.
[2]張兆鋒.基于科技文獻的科技監測信息可視化方法研究[D].北京:中國科學技術信息研究所,2007.
[3]龐明寶.基于動態環境的車輛調度問題研究[D].天津:河北工業大學,2009.
[4]任浩明.車輛主動安全中碰撞臨界安全車距算法研究[D].長沙:湖南大學,2011.
Research on clustering of freight vehicle driving behavior based on vehicle networking data mining
Wang Xiao
(Information Science and Technology School of University of International Relations, Beijing 100091, China)
The massive information under the background of Internet of car is of special signi fi cance and value. By digging vehicle speed, acceleration To analyze the characteristic of the freight vehicle driving. Through mining driving data of vehicle speed, accelerated speed and other data is helpful to standardize the driving behavior of vehicle drivers and realize the intelligent management of the vehicle. In this paper, the part of freight vehicles operating within the bounds of Hebei province as the research object to obtain the characteristic parameters of vehicle driver’s driving behavior based on vehicle networking data, and using data mining method based on factor analysis to convert the parameters as indicators, and the K-Means clustering method is applied to analyze driving behavior .
Internet of car; data mining; factor analysis; cluster analysis; K-Means clustering
王瀟(1990— ),男,河北秦皇島。