劉芳芳 張錦濤 黃杰
摘要:本文以城市交通數據可視化為研究對象,介紹了一種基于大數據的城市交通可視化系統,進而探討了交通數據可視化的方法與實現,從總體框架、前臺實現、后臺實現、分模塊實現幾個方面進行研究,該系統主要采R語言進行數據的分析與處理,然后通過Echart、D3等外部類庫來調用R語言分析所產生的結果,進一步生成可視化圖表。
關鍵詞:城市交通;數據可視化;R語言
中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2019)05-0092-01
0 引言
隨著大數據時代的到來,對于數據的挖掘與應用已經在各行各業大受歡迎,大數據的分析已經成為了各個領域的核心競爭力[1]。近年來,我國城市基礎設施建設的迅猛發展,產生了大量的數據,目前,交通大數據的總量已從TB級躍升為PB級并仍在不斷攀升,這些大數據每天不間斷地產生,具有不同格式、不同結構的特征,要想直接抽取其背后隱藏的規律和模式非常困難,因此,比較理想的處理方法是“信息可視化”。
信息可視化技術是一種把復雜或抽象的信息以直觀形象的方式呈現出來并快速被人理解的手段。如何運用大數據技術,對城市交通大數據進行可視化分析,研究城市交通的分布規律和模式,為交通監管和規劃提供決策支持,是智能交通發展的重要方向[2]。
1 設計理念
在交通數據領域中,雖然已經有大規模的數據產生,但是現有的數據中各個城市的數據相互獨立,存在數據分散儲存、結構不統一和數據不完成等一系列問題,因此該系統將分布廣泛的數據整理處理,并且采用黑、白、藍、紅四種顏色為主色調來展示可視化效果,通過這四種顏色的強烈碰撞,給用戶一種簡約又充滿生機的視覺感受;增強用戶的使用興趣,從而來增加網頁的瀏覽,促進網頁的推廣使用。
2 總體架構
本系統搭載了Tomcat 7.0服務器,前臺界面通過Java SSH框架來實現,用R語言加載相應類庫然后對對應的數據庫進行訪問,然后通過Echart、D3等外部類庫來調用R語言分析所產生的結果,進一步生成可交互的可視化圖表。
3 前臺實現
本系統采用了Struts作為系統的整體基礎架構,用于MVC的分離,在Struts框架的模型部分,控制業務跳轉,利用Hibernate框架來對持久層提供支持,而Struts和Hibernate用Spring來管理,Spring是一個輕量級的框架。
4 后臺實現
后臺通過R語言來實現數據分析與處理,并將結果返回前臺界面中。R 語言是一套由數據計算、操作和圖形展示功能整合而成的套件。包括:有效的數據存儲和處理功能,一套完整的數組(特別是矩陣)計算操作符,擁有完整體系的數據分析工具,為數據分析和顯示提供的強大圖形功能,是一套(源自S語言)完善、便捷、有效的編程語言(包括條件、循環、自定義函數、輸入輸出功能),使用R語言簡化了系統的數據處理,大大地提升了系統的性能。
5 分模塊實現
按照實現功能的不同,將模塊分為上傳模塊、數據讀取、數據處理、數據挖掘與分析、下載與截圖等模塊。系統功能模塊圖如圖1所示。
5.1 上傳模塊
數據上傳模塊完成文件型數據集的上傳,支持的文件型數據格式有csv和txt,并在 上傳時自定義數據分隔符,是否含有首行變量等信息。在文件上傳的模塊中主要采用了SWFUpload工具,SWFU pload是一個客戶端文件上傳工具, 最初是由Vinterwebb.se開發, 它整合了Flash與JavaScript技術,為Web開發者提供了一個具有功能豐富的標簽的文件上傳模式。在文件上傳模塊中將需要上傳的文件上傳至Tomcat服務器中。
5.2 數據讀取
數據讀取模塊分為讀取文件型數據和數據庫型數據,使用Hadoop進行分布式儲存與分布式計算,Hadoop中的HDFS分布文件系統用來儲存,海量的數據文件型數據直接從服務器中讀取。
5.3 數據處理
數據處理模塊包括缺失值處理與數據值預覽功能。可以直接在預覽框中對缺失數據修 改、刪除操作,或者由系統設定的三種缺失值處理方法,直接進行處理。經過處理之后,可對數據集中的信息進行可視化預覽,點擊統計信息描述,選擇預覽的數據項與輸出圖形,這樣就可以進行數據預覽了。
5.4 挖掘與分析
挖掘與分析運用了K均值聚類分析、關聯規則分析與決策樹分析。對于這三種分析方法分別采取不同的算法進行數據挖掘分析與結果的展示。
5.5 下載與截圖
下載與截圖模塊可將分析產生的結果直接下載到本地。
6 結語
數據可視化技術提供了一種直觀有效的方法。將復雜大量的交通數據通過篩選分析可直觀地展現出來城市交通的一些特征。通過這些特征對于國內交通現狀有一定的指導作用,可改進我國交通信息記錄方式,也為交通部門的改善提供依據與建議。
參考文獻
[1] 宮睿.海量城市交通數據可視化與人類出行行為的可視分析研究[D].電子科技大學,2018.
[2] 劉文杰.城市交通大數據可視化框架及實現[J].科技創新導報,2017,14(36):121-122.