譚曉艷
摘要:交通大數據是智能交通系統發展的必然結果,可視分析技術為我們提供了一種直觀有效的方法,它將復雜的交通數據及其分析結果通過可視化方式直觀地展現出來并支持對結果的交互式篩選和瀏覽,進一步加強對其的研究非常有必要,從而提高大數據的利用率。基于此本文分析了交通大數據可視分析。
關鍵詞:交通;大數據;可視分析
1、交通大數據可視化流程中的核心要素
數據可視化流程中的核心要素包括3個方面。
1.1數據表示與變換
數據可視化的基礎是數據表示和變換。為了允許有效的可視化、分析和記錄,輸入數據必須從原始狀態變換到一種便于計算機處理的結構化數據表示形式。通常這些結構存在于數據本身,需要研究有效的數據提煉或簡化方法以最大程度地保持信息和知識的內涵及相應的上下文。
1.2數據的可視化呈現
將數據以一種生動直觀,容易理解和方便操作的方式呈現給用戶,才能向用戶傳播準確有效而有價值的信息。然而數據的呈現方式有多種多樣,如何有效地從眾多多樣性呈現方式中選擇出最佳的視覺編碼形式是數據可視化的重要任務。判斷一個視覺編碼是否符合可視化呈現的因素包括很多方面,如數據本身的屬性以及用戶感知與認知系統的特性等。大量的數據采集通常是以流的形式實時獲取的,針對靜態數據發展起來的可視化顯示方法不能直接拓展到動態數據。
1.3用戶交互
對數據進行可視化和分析的最終目的是解決特定的任務,這些目標任務通常有生成假設、驗證假設和視覺呈現三類任務。數據可視化可以用于從數據中探索新的假設,也可以證實相關假設與數據是否吻合,還可以幫助數據專家向公眾展示其中的信息。交互是通過可視的手段輔助分析決策的直接推動力。
2、交通大數據可視方法
大數據可視化技術分為科學可視化和信息可視化,信息可視化在挖掘信息等方面扮演著重要的作用。信息可視化是將數據信息轉化為視覺形式的過程,增強數據顯示效果,使用戶直觀的觀察和瀏覽數據,從而發現數據中隱藏的特性、模式以及規律。早期的可視化主要使用簡單的圖表將復雜的數據簡化,而進入20世紀,隨著計算機技術的發展、處理數據能力的提升,用戶可以使用更多的可視化方法觀察自己的數據,主要領域有數據挖掘可視化、網絡數據可視化、社交可視化、交通可視化、文本可視化、生物醫藥可視化等。
2.1平行坐標系
多維數據是指研究的對象具有三個屬性以上的數據。多維數據難以在平面或空間中建立模型,因此人們對多維數據的認知也相對困難。但由于多維數據分析可以揭示不同維度屬性間的隱藏關系,所以近年對多維可視化的研究成為熱點。其中,平行坐標系為研究應用較廣泛的多維可視化技術。
2.2熱力圖
熱力圖是用一個帶有顏色的數據矩陣表示圖形。起初,熱力圖是由軟件設計師CormacKinney在1991年首先提出并注冊,用二維矩陣顯示描述金融市場信息。隨著熱力圖的發展,呈現了很多不同種類的熱力圖:網絡熱力圖、生物熱力圖、樹圖等。使用熱力圖可以直觀、清晰的看到數據隨著時間或地理位置的變化狀態,無需任何分析經驗。熱力圖中的每個熱力點(HeatPoint)由三個部分組成(X,Y,Weight),每一個熱點都有一個位置和權重,權重越大,該點越顯著,也就代表漸變的一個衰變因素。熱力圖的實現:統計篩選所有點,根據權重值和范圍值算法計算權重值,并獲取最大和最小權重的熱力點;對照顏色表,采用具體的插值算法獲取權重值對應的顏色。
2.3漏斗圖
漏斗圖為數據可視化的一種表達方式,在GoogleAnalytics中表示目標和渠道,在WebTrends中代表場景分析,在Omniture的SiteCatalyst里則為產品轉換漏斗。漏斗圖適用于業務流程比較規范、周期長、環節多的流程分析,通過漏斗圖各環節數據的比較,能夠直觀的發現和說明問題所在。使用漏斗圖進行分析的場景有電商代表的網站、營銷推廣等,它具有快速發現問題、直觀展示兩端數據、提高業務轉化率、提高最終轉化率等特點。將漏斗圖應用于交通流量數據中,統計交通地感線圈的總流量,按照流量的大小依次遞減分布,顏色的深淺也表示流量的多少,增強表示了地感線圈流量的排列。獲取一定的時間段中每條路總流量分布情況,了解哪條上車流量較多,哪條路上車流量較少。
3、交通數據可視化平臺系統應用
3.1數據存儲
數據處理是交通數據可視化分析的基礎,為數據分析可視化提供可靠的數據來源,從兩部分對數據進行處理:數據庫中提取數據、交通數據預處理。從數據庫中提取原始數據需要根據時間、空間的需要進行篩選,構建相應的python語句查詢滿足要求的數據。本文使用的數據庫為MongoDB,該數據庫有高性能、易部署、存儲方便、模式自由等特點,是一個基于分布式文件存儲的數據庫。將結構化、非結構化的交通數據存儲在MongoDB數據庫中,從而可以對數據進行查詢、搜索、分析等操作。
3.2邏輯處理
邏輯處理是使用交通數據對不同應用進行分析的過程,包括交通狀態、擁堵路段的判斷,上下客熱點區域的聚類,具體的理論過程已在第三、四章中進行了描述。
3.3可視分析
可視分析為原型系統的展示部分,定義各個可視化組件的交互事件,實現了組件之間的交互協同,實現不同組件間的交互作用,更好的實現交通數據的可視化。
3.4交通狀態判別的指標
交通狀態判別是判斷交通道路的狀態是暢通、輕微擁堵、擁堵或是嚴重擁堵。本質上,交通狀態判斷是對道路擁擠程度的判斷。而擁堵狀態可以分為偶然發生的擁堵和經常發生的擁堵。偶然發生的擁堵一般由交通事件引起的不定時、不定點的擁堵,如大型活動(足球賽、演唱會等)、突發交通事故、惡劣的天氣、道路施工養護等。雖然偶然發生的交通擁堵預測困難,但是對于有計劃的活動引起的交通擁堵可以估測出時間和地點。
總之,可視分析通過豐富的交互手段為用戶提供從概覽到細節的探索能力,其圖形化的分析結果展示方式也便于用戶理解數據中蘊藏的規律。因此,可視分析近年來在智能交通領域受到極大的關注,需要重點加強研究。
參考文獻:
[1]郝娜,李鑫.基于大數據的智能交通系統淺析[J].石家莊職業技術學院學報,2018,30(04):31-33.
[3]梁榮華.“大數據可視分析”專欄序[J].中國圖象圖形學報,2015,20(04):453.
(作者單位:南京市城市與交通規劃設計研究院股份有限公司)