王海濤
摘? 要:隨著人們生活水平的提高以及人們生活節奏的加快,電動自行車以其輕便、簡潔、低能、環保等特點廣受人民的追捧與喜愛,我國電動自行車的數量也急劇增長,而隨著該行業的迅速發展也隨之帶來了一些問題,例如交通堵塞問題、電動自行車交通事故、電動自行車失竊問題等。得益于定位系統和位置移動算法的快速進步,現全國部分地區的電動自行車安裝了防盜追蹤系統,為本文研究提供了海量軌跡數據。在軌跡數據處理方面,本文選取一個月內在電動車平臺上的數據,該數據主要是反映車輛通過GPRS通道上報的數據,根據數據提供的車輛不同時刻經緯度及速度,對軌跡數據進行異常點清洗,采用基于啟發式異常檢測算法進行噪聲過濾,根據時間及停留點進行軌跡分段和道路匹配,將處理好的數據應用Echarts進行可視化顯示。
關鍵詞:電動車平臺? 軌跡數據分析? 數據可視化? GPRS通道
中圖分類號:U491? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2021)01(a)-0108-03
Abstract: In recent years, with the development of China's economy and the acceleration of people's life pace, electric bicycle is widely popular and popular with its light, simple, low energy and environmental protection, and the number of electric bicycles in China has also increased greatly. With the rapid development of this industry, some problems have been brought along with it, such as traffic jam, electric bicycle accident, and electric bicycle theft. Thanks to the rapid progress of positioning system and location mobile algorithm, the electric bicycle in some parts of the country has installed anti-theft tracking system, which provides a huge amount of track data for this research.In the aspect of trajectory data processing, this project selects data on the electric vehicle platform within one month, the data is mainly is reported data through the GPRS channel response vehicles, according to data provided by the vehicle longitude and latitude and speed, the different time to abnormal point trajectory data cleaning, noise filter based on heuristic anomaly detection algorithm, track segmentation and road matching are carried out according to time and stop points, and the processed data are visually displayed by applying Echarts.
Key Words: Electric bicycles; Trajectory data analysis; Data visualization; GPRS passageway
近幾年,隨著我國經濟的發展與人們生活節奏的加快,電動自行車以其輕便、簡潔、低能、環保等特點廣受人民的追捧與喜愛,我國電動自行車的數量也急劇增長,而隨著該行業的迅速發展也隨之帶來了一些問題,例如交通堵塞問題、電動自行車交通事故、電動自行車失竊問題等。所以對電動自行車行駛軌跡數據進行研究,可有效控制和管理以上問題。
首先,基于電動車軌跡數據的軌跡段生成與分析,可獲得電動自行車的實時位置,將其進行可視化顯示后,可觀察出不同時間段,不同路段電動自行車的速度,從而分析出行駛速度過快的路段,提醒過大用戶在該路段安全騎行,減速慢行,以此提高交通質量。
此外,通過對電動車軌跡數據的分析,也可有效追回失竊的電動自行車,從而保護廣大人民的財產,保障社會秩序。
關于軌跡數據方向的研究,隨著大數據及數據挖掘分析技術的快速發展,軌跡數據的研究也取得了諸多成果。人們通過對大量軌跡數據的分析研究,從中獲取有價值的信息。其實際應用主要有以下兩個方面:
(1)挖掘人類活動和遷移規則,并分析車輛和大氣環境的運動特征。例如,優化城市交通路線,個性化推薦路線,道路網絡預測和城市規劃。
(2)大量的軌跡數據反映了一些人的行為、生活習慣、社交網絡和趨勢等私人信息。例如,攻擊者可以根據用戶的歷史移動軌跡數據特征,并且可以挖掘其活動范圍和活動場景。
1? 軌跡數據獲取
本文選取了615輛電動自行車在2017年7月1日至2017年7月31日時間跨度內的行駛軌跡信息,共2557021條數據,由于每輛電動自行車使用頻率不同,故每個設備采集到的位置信息數量也不同,利用Django框架模式,將原始數據以id為鍵進行分組,并統計每組中數據條數,通過Echarts平臺提供的柱狀圖模型進行直觀顯示。
1.1 軌跡噪聲過濾
由于數據采集過程中,傳感器容易受到各種因素的影響,例如,樓宇密集處、高架橋下、隧道等,會使得采集的數據不準確,發生位置偏移。為了使研究結果更加準確,在使用數據前需要對數據進行噪聲過濾。
1.2 軌跡的提取
軌跡長度過長會使其復雜度增加,不利于數據挖掘分析的進行,故本階段需要對已經經過初步清洗的軌跡數據進行分段。
軌跡分段主要有三類實現算法:
利用“時間間隔”分段。如果兩個位置點之間的時間間隔超過了某一特定閾值,則認為該兩點分別是兩段軌跡的端點,從而將一條長軌跡分為兩段較短軌跡。
基于軌跡形狀分段。根據軌跡點的方向角度變化的大小進行分段,若變化超過了某一特定的閾值,就將其分為兩段;另一種方法是“線簡化”算法,其是利用了軌跡壓縮的算法,將軌跡壓縮點作為分段點,實現一條長軌跡轉化為多條短軌跡。
基于語義信息分段。其中又包括兩種方法:其一是根據停留點分段。還有一種是根據出行模式的不同。本文的原始數據中提供了車輛狀態信息,可直觀的判斷出處于設防的車輛此刻為停留狀態。此外,在此之前,進行了停留點的檢測。故本文采用了語義信息分段中的基于停留點進行軌跡分段的算法。
2? 軌跡可視化
本文采用Django框架MVT模型,其中T即Template,為表現層,負責呈現經過V即View處理后的結果。而Web端,采用了百度提供的鷹眼軌跡服務。根據鷹眼 Web服務 API v3.0介紹,鷹眼Web服務以HTTP/HTTPS的形式提供軌跡上傳、查詢、分析和地理圍欄等功能,開發者需要從服務器端請求以調用這些功能。
電動自行車終端管理模塊:統一管理系統內所有設備,每輛設備管理字段包括名稱、車輛描述、創建時間、最后位置以及最后定位時間等,可對根據設備號對設備進行檢索和刪除。
電動自行車監控模塊:其中又分為實時監控和軌跡查詢兩個部分,實時監控支持實時上傳軌跡數據,可在地圖上定位到設備的當前位置;軌跡查詢支持根據設備號和日期查詢特定設備一天內的所有行駛軌跡。
電動自行車移動性分析模塊:主要通過對檢索篩選后所呈現的軌跡分析其移動規律,如通過24h時間軸可分析出電動自行車一天中主要使用時間段;通過將速度以漸變色形式呈現,分析哪些路段電動自行車行駛速度較快等。
3? 軌跡數據挖掘
本文對原始軌跡數據進行過預處理并完成了可視化的基礎上展開的,通過之前的研究與實踐,所采集的軌跡數據已經比較精確的呈現在地圖上,合理運用系統的索引功能與速度顯示功能,可從軌跡中發掘電動自行車的移動規律以及人們的行為規律等,這對解決電動自行車交通事故、電動自行車失竊以及人們出行規律有很大幫助。
3.1 速度分析
在可視化顯示部分,本系統不僅顯示了電動自行車行駛軌跡,而且還將電動自行車在每個軌跡點的速度通過色彩漸變直觀地呈現了出來,顏色由紅色為低速,漸變到黃色為中速,最后漸變為綠色為高速。通過對電動自行車軌跡速度的監控,可以從中分析出車輛所在路段路況。
3.2 出行量分析
電動自行車的出行量反映了人們日常生活規律、活動范圍、聚居走向等信息,這對于分析人類社會活動屬性以及人類社會發展狀態有很大幫助。本文在時間段上電動自行車出行量的分析方面,著重探索了二十四小時中每個時間段電動自行車的出行量,從中挖掘使用者在一天中不同是時間間隔的活躍度;在空間范圍內電動自行車出行量方面,本文探索了全國不同地區電動自行車使用密度,并通過所得數據分析了各地區產生差異的因素。
3.3 使用者分析
電動自行車的行駛軌跡不僅能反映出電動自行車位置移動變化信息,進一步分析軌跡信息,還可以從中挖掘出使用者本身的身份信息、所處環境以及社交網絡等,通過對電動自行車行駛軌跡分析,可得到使用者日常行程信息、活動區域信息等。這些信息的挖掘一方面可以為電動自行車失竊問題提供查巡方向,使得能有效追回失竊車輛,維護社會治安;另一方面,挖掘到的使用者信息,可用于追查使用者本身,在某些刑偵案件中,可提供十分寶貴的線索。
4? 結語
軌跡在大數據時代作為一個具有代表性的形式,不僅顯示了位置移動變化,還反映了人們的個體屬性、生活環境甚至社交網絡等。而隨著全球定位系統GPS的廣泛應用,位置信息的采集也越來越容易,大量的軌跡數據中蘊含著龐大的信息體系,如果能合理高效地提取出這些信息,將會給未來社會、環境、安全等各方面帶來巨大利益。本文是基于電動自行車軌跡的數據分段與分析。電動自行車作為深受現在人民追捧的一種交通工具,在受益與它的簡潔、輕便、環保、靈活等優點的同時,也煩惱于它所帶來的交通、安全等問題。本文的研究目的正在于為解決這些問題提供有效的方法策略。
參考文獻
[1] 林樹寬.基于GPS軌跡數據的擁堵路段預測[J].東北大學學報:自然科學版,2015,36(11):1530-1534.
[2] JD Mazimpaka.Trajectory data mining: A review of methods and applications[J].Journal of Spatial Information Science, 2016,13 (2016) :61-99.
[3] 高強,張鳳荔,王瑞錦.軌跡大數據:數據處理關鍵技術研究綜述[J].軟件學報,2019,28(4):959-992.
[4] Elliot, Fishman, Christopher,等.電動自行車交通發展的主要趨勢——近10年文獻綜述[J].城市交通, 2016,14(2):83-96.
[5] 楊陽,吉根林,鮑培明.基于網格索引的時空軌跡伴隨模式挖掘算法[J].計算機科學,2016,43(1):107-110.
[6] Arifin Z, Ibrahim M R, Hatta H R. Nearest tourism site searching using Haversine method[C]// International Conference on Information Technology, Computer, and Electrical Engineering. IEEE, 2019:293-296.
[7] 王欣.基于聚類和距離的大數據集離群點檢測算法[J].制造業自動化,2011,33(8):101-104.