王暢 蔣思琦 韓依洋



摘 要:針對第七屆“泰迪杯”數據分析職業技能大賽C題——運輸車輛安全駕駛行為分析,以歐氏距離和物理方法為基礎,建立基于軌跡與速度特征異常檢測模型,基于差分與最小二乘法軌跡擬合模型,綜合運用MATLAB軟件編程求解,得到良好的數據擬合路線圖等結論。
關鍵詞:歐氏距離;差分;最小二乘法;MATLAB
0 引言
隨著信息技術的發展,以及車載運行監控系統的不斷改進,為了充分利用交通運輸企業的車聯網數據,挖掘車輛駕駛行為的潛在特征,對監控系統所統計的數據進行合理的整理,可以為數據的進一步挖掘提供良好的保障。
1 模型假設
(1)假設車輛行駛是在二維的平面上,即不考慮地球的形狀及地面的高度差。
(2)假設每輛車僅有一名駕駛人員。
2 基于軌跡和速度特征異常檢測模型
2.1 模型建立思想
由于原有數據的數據量大且存在異常軌跡的情況,即需要通過有效的方法解決異常軌跡并且得到擬合數據。針對異常軌跡的檢測,R-Tree異常軌跡檢測算法是目前常用的異常軌跡檢測方法。R-Tree異常軌跡檢測算法是通過找出每個軌跡點的w-鄰域點集,與該軌跡點構成點對集合,每個軌跡點僅和其w-鄰域點集中的點進行比較,然后通過指定的鄰域閾值w找出異常軌跡,但是此方法對于長且復雜的軌跡,表現出異常軌跡分段平均化的現象。即在此基礎上我們提出了根據相鄰兩點數字特征綜合考慮數據的異常情況。
2.2 模型建立
對于軌跡特征,通過歐幾里的距離進行兩點之間的距離計算,設定兩個坐標點在二維空間上的距離則兩點之間的軌跡彎曲程度本文使用兩點之間的移動距離與兩點之間的形成的直線距離的比值衡量。
對于速度特征,數據的位置變化代表著車輛運動時位置隨時間的變化情況。對于等時變化的數據,可以得到速度vi與位移li的關系:則相應的加速度:
綜合考慮軌跡特征和速度特征,設定相應的閾值,對數據進行異常點的處理。
2.3 基于差分與最小二乘法軌跡擬合模型
由于車輛的行駛軌跡沒有規律性,即在不同區域內,形成的軌跡可以完全不同,所以不能通過高次擬合的方法來完整的擬合車輛的行駛軌跡;離散的數據對應不同的坐標和不同的方位角,因此擬合過程中的擬合曲線是否連續或者擬合結果是否能夠組成一條連續的軌跡并不是必需的。故根據差分和最小二乘法的思想來分段的擬和軌跡,并且獲取合適的方位角。
2.4 結果分析
通過MATLAB軟件編程可以得到,以其中兩條路線為例(如圖 1、圖 2所示)。
根據數據處理和軌跡擬合結果顯示,綜合考慮軌跡彎曲程度和速度對于去除異常軌跡點有明顯的效果,但不能完整的處理異常數據點;通過設置權函數,運用差分和最小二乘法的思想,提高了軌跡擬合的準確性,但是設置權函數的作用比較局限。
參考文獻
[1]孫川,吳超仲,褚端峰,等.基于車聯網數據挖掘的營運車輛駕駛速度行為聚類研究[J].交通運輸系統工程與信息,2015,15(06):82-87.
[2]陳錦陽,劉良旭,宋加濤,等.基于R-tree的高效異常軌跡檢測算法[J].計算機應用與軟件,2011,28(10):34-37.
[3]李紅巖.車輛軌跡異常檢測應用研究[D].長春:長春工業大學,2019.
[4]姚連璧,錢瑾斐.基于移動最小二乘法的軌跡擬合切線方位角計算[J].同濟大學學報(自然科學版),2018,46(11):1589-1593.