劉文杰
摘 要:本文以城市交通數據可視化為研究對象,本文首先分析了數據可視化的基本框架,包括數據可視化的流程和核心要素,進而探討了點數據和線數據可視化的方法,在此基礎上,本文給出了城市交通大數據可視化的效果。相信對從事相關工作的同行能有所裨益。
關鍵詞:城市交通 大數據 可視化 地圖
中圖分類號:TP311 文獻標識碼:A 文章編號:1674-098X(2017)12(c)-0121-02
隨著智能交通在物聯網、云計算、移動互聯等領域的結合應用和迅速發展,其發展模式已經從傳統的信息不均衡、信息處理能力低效的系統發展成為真正的運用新技術的智能交通系統。智能交通系統是多個與交通有關的系統的綜合應用,包括車路協同系統、公眾出行便捷服務、車聯網等,這些應用運用大數據技術、云計算技術、移動互聯技術等為交通系統的智能化效率的提高提供重要的支持,不斷提高智能交通系統的數據分析判斷能力,以優化交通的運行管理,精準地掌握交通狀況,給車輛和出行者帶來更加智能化的服務。目前大數據技術已經應用在很多城市的智能交通領域,公眾出行越來越離不開交通大數據分析帶來的便利。
隨著大數據技術的興起,智能交通的發展也在飛速前進的階段,交通大數據的總量已從TB級躍升為PB級并仍在不斷攀升。但目前,在如何運用大數據技術有效處理分析這些日益劇增的交通大數據分析獲取更有價值的信息的問題上,我國的智能交通發展仍然處于開始階段。如何運用大數據技術,有效分析利用交通大數據,實現大數據的可視化,使其發揮出應有的價值,是現階段智能交通發展的重要任務。
1 數據可視化基本框架
1.1 數據可視化流程
科學可視化和信息可視化分別設計了可視化流程的參考體系結構并被廣泛應用于數據可視化系統中??梢暦治鰧W的基本流程則通過人機交互將自動和可視分析方法緊密結合。從數據到知識的轉化方式有兩種途徑,交互的可視化方法和自動的數據挖掘方法。過程中用戶即可以對可視化結果進行交互的修正,也可以調節參數以修正模型。
在相當多的應用場合,異構數據源需要在可視分析或自動分析方法之間被整合。因此,這個流程的第一步需要將數據預處理并轉換,導出不同的表達,便于后續的分析,其他的預處理任務包括數據清洗、數據規范、數據歸類和異構數據源集成。在任何一種可視化分析過程中,人都是最核心的要素。機器智能雖然在很多場合都比人的效率要高,但是機器只能承擔替代一部分人所承擔的工作,并不能夠最終決策或對知識進行加工和使用。所以數據可視化的目的并不是替代人的判斷和決策,而是為人所用,增強人的能力,提高人的效率。
1.2 數據可視化流程中的核心要素
數據可視化流程中的核心要素包括3個方面。
1.2.1 數據表示與變換
數據可視化的基礎是數據表示和變換。為了允許有效的可視化、分析和記錄,輸入數據必須從原始狀態變換到一種便于計算機處理的結構化數據表示形式。通常這些結構存在于數據本身,需要研究有效的數據提煉或簡化方法以最大程度地保持信息和知識的內涵及相應的上下文。
1.2.2 數據的可視化呈現
將數據以一種生動直觀,容易理解和方便操作的方式呈現給用戶,才能向用戶傳播準確有效而有價值的信息。然而數據的呈現方式有多種多樣,如何有效地從眾多多樣性呈現方式中選擇出最佳的視覺編碼形式是數據可視化的重要任務。判斷一個視覺編碼是否符合可視化呈現的因素包括很多方面,如數據本身的屬性以及用戶感知與認知系統的特性等。大量的數據采集通常是以流的形式實時獲取的,針對靜態數據發展起來的可視化顯示方法不能直接拓展到動態數據。
1.2.3 用戶交互
對數據進行可視化和分析的最終目的是解決特定的任務,這些目標任務通常有生成假設、驗證假設和視覺呈現三類任務。數據可視化可以用于從數據中探索新的假設,也可以證實相關假設與數據是否吻合,還可以幫助數據專家向公眾展示其中的信息。交互是通過可視的手段輔助分析決策的直接推動力。有關人機交互的探索已經持續很長時間,但智能、適用于海量數據可視化的交互技術,如任務導向的、基于假設的方法還是一個未解難題,其核心挑戰是新型的可支持用戶分析決策的交互方法。這些交互方法涵蓋底層的交互方式與硬件、復雜的交互理念與流程,更需要克服不同類型的顯示環境和不同任務帶來的可擴充性難點。
2 數據可視化
2.1 點數據可視化
點數據描述的對象是地理空間中離散的點,具有經度和緯度的坐標,但不具備大小尺寸。這是地理數據中最基本也是最常見的一種,如地標性建筑、區域內的餐館等。常用的點數據可視化方法將對象根據它的坐標直接標識在地圖上。如圖1所示地圖標出了北京市某區域所有的加油站。圓點是最常用的標識符號,本例中采用的是紅色的圓點??梢钥吹?,加油站沿主要街道分布,在綠色的風景區相對少一點。數據對象的其他屬性可以用其他視覺元素表示,如大小和顏色可用于表示數值型屬性。
除了圓點,其他符號也可以被用作地圖上的標識。當數據對象屬于不同類別時,通常用不同的符號區分。圖標或符號的選取需要遵循一定的原則。第一,符號必須直觀且符合常識。例如,用刀叉表示餐廳,用大寫的字母P表示停車場。第二,符號的數量不宜太多。當不同的符號太多時,用戶難以記住每種符號的意義。最重要的是,可視化必須有圖例來解釋各種符號的意義。
總體而言,用圓點在地圖上標識點數據非常有效,符合人們看地圖的習慣,可以在有限的空間中顯示較多的信息。但是,當數據中有海量的點數據需要在地圖上標識時,點之間會產生大量互相重疊的情況。特別地,當區域數據分布不均時,數據密集的方會有大量的點相互重疊,而數據稀疏的地方則空白居多。
2.2 線數據的可視化
在地理空間數據中,線數據通常指連接兩個或更多地點的線段或者路徑。線數據具有長度屬性,即所經過的地理距離。常見的例子是地圖上兩個地點之間的行車路線。線數據也可以是一些自然地理現象,例如河流等。最基本的線數據可視化通常采用繪制線段來連接相應地點的方法。在繪制連線的時候,通??梢赃x擇采用不同的可視化方法來達到最好的效果,如顏色、線的類型和寬度、標注都可用于表示各種數據屬性。當然,也可通過對線段的變形和精確計算放置的位置減少線段之間的重疊和交叉,增加可讀性。
3 城市交通大數據的地圖可視化效果實現
3.1 數據準備與預處理
現有的數據來源為:公交車基礎線路數據、公交車GPS 數據、公交車刷卡數據,出租車GPS數據,地鐵基礎線路數據、地鐵刷卡數據。如圖2為公交線路空間數據。
3.2 基于公交刷卡數據的站點客流量可視化
利用公交刷卡數據統計站點的客流量上車人數與下車人數。將公交站點分顏色級別表示客流的登量與降量,紅色表示登入量,綠色表示登出量。在站點處繪制圓圈,圓圈大小表示總客流量(登入量+登出量)。效果如圖3所示。
另外,利用三維視圖可以更加生動地顯示其站點的客流量大小。在傾斜的地圖上,用有過渡效果的圖片來表示立體柱子,標定在地圖中具體的公交位置上,用柱子的高度表示流量的大小。
3.3 基于公交線路數據的流量和速度可視化
利用公交刷卡數據統計公交站點間的流量,以透明度疊加來顯示流量的大小。濃度大的站點間線路表示客流量大,濃度低的表示客流量小。可以將流量數據以熱力圖的效果展現出來(如圖4所示)。
4 結語
可視分析技術為我們提供了一種直觀有效的方法。它將復雜的交通數據及其分析結果通過可視化方式直觀地展現出來并支持對結果的交互式篩選和瀏覽。此外,當人們從可視化產生的圖像中發現一些意料中或者意料外的特征時,也可以啟動分析算法來有針對性地自動深入挖掘交通信息。
參考文獻
[1] 姜煒.大數據進入ZB時代[J].網管員世界,2012(14):14-15.
[2] 范琳琳.可視化數據挖掘研究[J].吉林省教育學院學報,2006(9):43-44.
[3] 黃江濤.多維數據及數據挖掘結果可視化研究與實現[D]. 西南科技大學,2005.