戚陸越,吳 升(1.福州大學 空間數據挖掘與信息共享教育部重點實驗室,福建 福州 350002;2.福建省空間信息工程研究中心,福建 福州 350002)
時間序列數據可視化研究綜述*
戚陸越1,2,吳升1,2
(1.福州大學 空間數據挖掘與信息共享教育部重點實驗室,福建福州350002;2.福建省空間信息工程研究中心,福建福州350002)
時間序列數據可視化綜合了時間序列數據挖掘、數據可視化、計算機圖形學、計算機交互技術等學科的理論和方法。從時間和數據兩個角度分析了時間序列數據的特征;從用戶的角度探討了時間序列數據可視化的主要任務;綜述了時間序列數據可視化從以人為中心到以計算機為中心,再到人機交互方式的發展歷程;詳細介紹了時間序列數據可視化的5類圖表和5類表達方式。最后,對時間序列數據可視化研究進行總結和展望。
時間序列;可視化;交互
時間序列數據是按時間順序排列的一系列觀測值。與一般的定量數據不同,時間序列數據包含時間屬性,不僅要表達數據隨時間變化的規律,還需表達數據分布的時間規律。早期,人們將時間序列數據繪制在圖紙上,以圖形可視化的方法來發現時間序列數據的規律。計算機技術發展以來,涌現出許多基于時間序列數據的研究[1],例如相似序列搜索、降維、聚類、分類、模式分析、預測等,但主要是基于計算機進行數據挖掘和機器學習,對于人機交互可視化的研究較少。人的眼睛具有很強的模式識別能力,是輔助模式搜索、模式匹配、模式發現等數據挖掘任務的有力工具。如何將海量的時間序列中隱含的知識規律,以人們易于理解的方式進行交互可視化,是非常值得研究的問題。目前,數據可視化技術已被廣泛地應用于呈現、探索和分析時間序列數據,并出現了一些可視化工具,如Treemaps[2]、ThemeRiver[3]、Spirals[4-7]等。時間序列數據可視化已成為數據挖掘的前沿研究領域,因為它將機器智能與人腦智能更加緊密地結合,讓傳統的“黑箱”挖掘過程變得清晰可見,讓用戶更好地參與到整個數據挖掘過程之中,因此具有廣闊的應用前景。
時間序列數據的定義包含兩個方面,一是數據與時間密切相關,并隨時間變化;二是數據按時間的先后順序排列。因而,時間序列數據的特征包含以下兩個方面:
(1)時間屬性[8]
時間具有特殊的語義結構,經過人為抽象劃分為不同層次的時間尺度,例如分、時、天、周、月等。各層次間的包含關系有的是規則的(例如60分鐘為一小時,7天為一周等),有的是不規則的(例如一個月可以是 30天或31天)。時間隱含內在的周期性特征,例如季節的更迭。時間還具有確定性和不確定性的特征,例如列車經過站點的時間有一定的規律,但也可因特殊情況晚點,導致時間不確定。
(2)數據屬性[8]
按統計尺度分為定性和定量特征;按參照標準可分為非空間和空間特征;按變量個數分為單變量和多變量特征。
從用戶任務的角度,時間序列數據可視化有以下幾個基本目的:分類、聚類、查詢、模式發現和預測;從用戶分析進程的角度,概括起來有以下三個基本目的:探究分析、驗證分析、分析結果表達。
(1)探究分析
探究分析的目的是洞悉數據,從時間序列數據中提取相關信息,并提出假設。即從問題出發,先分析數據,從數據中發現模式規律、異常值、離群值等,再從數據導出模型。
探究分析包含兩個方面的任務:發現數值的規律和發現時間的規律。具體任務如表1所示。

表1 探究分析任務舉例
(2)驗證分析
驗證分析的目的是證明或推倒假設(假設源于數據的探究過程或數據相關的模型)。
(3)分析結果表達
分析結果表達的目的是傳遞和分享數據分析結果。
計算機未出現以前,時間序列數據的可視化主要以手繪為主,例如AIGNER W[8]是現代統計圖形的創建人,他用餅圖、輪廓圖、條形圖、折線圖等描述經濟時間序列數據。JOSEPH繪制的人物傳記圖,用時間軸描述著名歷史人物的壽命[8]。隨著計算機技術和可視化技術的發展,時間序列數據的可視化在圖表可視化方法、表達方式、交互方式等方面不斷豐富與發展。
3.1時間序列數據的可視化圖表
歸納起來,時間序列數據可視化圖表主要有以下幾類:
(1)傳統統計圖表
傳統的統計圖表是最簡單而常見的時間序列數據的表示方法,例如折線圖、條形圖、金字塔圖、雷達圖[9]、星狀圖等。
(2)樹圖
樹圖[10]是一種層次數據的可視化方法。GOUTHAMI C[2]綜合樹圖提供全局概貌和坐標軸統計圖提供趨勢特征的優勢,設計了一種表示時間序列數據的樹圖可視化交互系統,并以微博數據、石油日產量數據等為例介紹樹圖表現時間序列數據的方法。
(3)熱力圖
熱力圖(heatmap)是時間序列數據進行聚類分析的有效方法,它采用顏色編碼系統對數據進行可視化。主要有兩類,一類為顏色矩陣圖,用顏色值對二維陣列中的數值編碼,如參考文獻[11]用heatmap表示“9·11恐怖襲擊事件”之后4個監測站點的9種多環芳烴濃度值的變化規律。另一類以地圖為背景,疊加顯示與地理位置相關的熱點,生成熱點圖,像百度熱力圖。
(4)日歷圖
[4]提出基于聚類和日歷圖的可視化方法,可表現和識別多時間尺度(天、周、月)的單變量時間序列數據的模式和趨勢。日歷圖可按日歷的形式展示時間序列數據的全局特征,對于單變量的、特定的、已知時間尺度的時間序列數據表現效果較好,而對多變量、模式未知、無先驗知識的時間序列數據的表現具有一定局限性。
(5)螺旋圖
螺旋圖有利于分析時間序列數據的周期特征。CARLIS J V等人[5]首次提出螺旋圖的原型,用點、條形圖的大小表示數值。之后,螺旋圖在維度[6]、螺線形狀模型[7]、交互[12]等方面的表達不斷改進與發展。如參考文獻[12]從視覺表達和交互兩方面對傳統的螺旋圖進行改進,用雙色著色編碼方法和概括+細節的交互方式表現溫度序列數據。
3.2時間序列數據可視化的表達方式
(1)隱喻表達法
隱喻表達法基于用戶熟知的認知背景建立易于理解和使用的可視化環境。例如,ThemeRiver[3]用河流隱喻為時間,河流自左向右流動表示時間前進方向,河流的寬度、顏色等可視變量表示不同的主題對象和屬性值。參考文獻[13]用樹的年輪隱喻為時間,圓心表示時間的起點,沿半徑向外發散的射線表示其他屬性。
(2)三維表達法
與二維表達相比,三維表達可能會遮擋或隱藏部分信息,沒有二維表達直觀,但可表現高維的時間序列數據。例如參考文獻[14]提出時間隧道,將兩種及以上不同的可視化視圖疊加顯示來分析數據的異同;參考文獻[15]設計了一種基于網絡圖的三維交互可視化環境,以時間切片的方式對時間序列數據進行三維可視化。
(3)地圖結合表達法
地圖與其他可視化方式相結合可較好地呈現與空間位置相關的時間序列數據。時間序列與空間位置的關系包含兩個方面,(1)位置作為時間序列的外部屬性,單條序列的位置穩定,例如參考文獻[16]將3D鉛筆圖標和3D螺旋圖標配置到地圖上,分別表達月度醫療時空序列在時間上的線性變化和周期變化特征以及空間上的分布特征。參考文獻[17]基于GIS設計了圓環地圖來表達25個郵政編碼標識區域24周內的疾病時間序列數據。(2)位置是時間序列的內部屬性,記錄事件隨時間的位置變化,如參考文獻[18]將地圖和折線圖相結合建立時空立方體,表現實時運動對象的移動軌跡。
(4)郵票表達法
郵票表達法指基于某種可視化方法將時間序列數據按時間點生成一系列圖表,并在一個視圖空間內有序地平鋪展示。該方法既可表示時間序列的全局概貌,又能以縮略圖的形式呈現每個圖表的細節,但在時間上缺乏連續性,對時間多維、高密度的時序數據及屏幕大小有一定的局限性。郭殿升等人[19]提出VIS-Stamp系統,按時間點平鋪展現地圖的縮略圖,以對犯罪時空序列數據進行可視分析。
(5)動畫表達法
動畫表達法指在一個視圖空間內逐幀地播放時序數據可視圖表,動態、連續地展現時序數據的變化趨勢。HANS R[20]提出Trendalyzer,基于交互的動態氣泡圖表現經濟、社會等統計數據的變化趨勢。ROBERTSON G[20]將Trendalyzer與兩種靜態表達法在趨勢分析的效力方面進行對比,其結果表明,Trendalyzer雖然在表達上快速、生動,但在準確性和分析效果方面略遜一籌。
3.3時間序列數據的交互可視化
時間序列數據的交互可視化旨在將“黑箱”分析過程透明化,為用戶提供可視、可控的分析環境。基本的可視化交互操作方法主要有[8]:選擇、平移、縮放、查詢、布局、編碼、抽象/具體、過濾、畫筆鏈接等。
常見的交互可視化模型有3種[8,21]:概括+細節模型、聚焦+上下文模型、對偶界面模型。概括+細節模型旨在解決用戶在同一時間只能關注有限數據的問題,該模型首先提供數據的全局視圖,通過放大、過濾等交互操作獲得關注數據的細節圖。聚焦+上下文模型可解決一個視圖中無法顯示所有數據的問題,該模型為用戶呈現關注數據的細節并適度地展示上下文信息。對偶界面模型指對應于相同數據的不同視圖之間相互關聯,對其中任意一個視圖的內容進行操作,其余視圖的內容都隨之變化,可充分利用多個視圖協同呈現數據的不同特征。
本文主要從3個方面對時間序列數據可視化的研究進行歸納總結:(1)可視化呈現什么數據,需考慮時間屬性和數據屬性兩方面的特征;(2)可視化完成什么任務,即用戶需解決什么問題;(3)基于給定的數據和任務如何選擇合適的圖表、表達方式可視化及交互設計,以期為時間序列數據分析提供新的思路。
目前,時間序列數據的可視化面臨多方面的挑戰。隨著計算機技術的發展,時間序列的數據量更為龐大,數據的周期模式更為隱秘,傳統的時間序列數據可視化方法遇到許多瓶頸,亟需改進傳統的時間序列數據可視化的表達方式;或結合多個視圖建立交互式的分析系統,而如何實現多視圖的交互操作是當前研究的重點和難點。將可視化技術、交互技術與時間序列數據分析方法更緊密地結合起來而不是獨立地研究是探索和分析時間序列數據的趨勢。
參考文獻
[1]FU T C.A review on time series data mining[J].Engineering Applications of Artificial Intelligence,2011,24(1):164-181.
[2]GOUTHAMI C.Temporal treemaps for visualizing time series data[D].University of Maryland,2004.
[3]張龍飛,姚中華,宋漢辰,等.基于 Themeriver的可視化技術發展綜述[J].系統仿真學報,2013,25(9):2091-2096.
[4]VAN W,VAN S.Cluster and calendar based visualization of time series data[C].IEEE Symposium on Information Visualization,San Francisco,1999:24-29.
[5]CARLIS J V,KONSTAN J A.Interactive visualization of serial periodic data[C].11th Anual Symposium on User Interface Software and Technology,1998:29-38.
[6]SIRIPATANAA,JAROENSUTASINEEK,PRUEKSAAROOM S,et al.The development of interactive 3D spring visualization for periodic multidimensional direction timeseries data sets[C].9th International Conference on Electrical Engineering,2012:1-4.
[7]CHENG S H,JIANG Z F,QI Q,et al.The polar parallel coordinatesmethod fortime-seriesdata visualization[C]. 2012 International Conference on Systems and Informatics,2012:11-14,161.
[8]AIGNER W,MIKSCH S,SCHUMANN H,et al.Visualization of time-oriented data[M].London:Human-ComputerInteraction Series,2011.
[9]楊婷,吳升.案事件時空聯機分析處理與可視化[J].微型機與應用,2014,33(11):85-87.
[10]張昕,袁曉如.樹圖可視化[J].計算機輔助設計與圖形學學報,2012,24(9):1113-1124.
[11]PLEIL J D,STIEGEL M A,MADDEN M C,et al.Heat map visualization of complex environmental and biomarker measurements[J].Chemosphere,2011,84:716-723.
[12]TOMINSKI C,SCHUMANN H.Enhanced interactive spiral display[C].Proceedings of the Annual SIGRAD Conference,2008:53-56.
[13]ESPER J.Influence of wood harvest on tree-ring time-series of picea abies[J].Forest Ecology and Management,2012,284:86-92.
[14]AKAISHI M,OKADA Y.Time-tunnel:visual analysis tool for time-series numerical data and its extension toward parallel coordinates[C].IEEE 8th International Conference on Information Visualization,2004:456-461.
[15]ITOH M,TOYODA M,KITSUREGAWA M.An interactive visualization framework for time-series of Web graphs in a 3D environment[C].14th International Conference on Information Visualization,2010:26-29.
[16]TOMINSKI C,SCHULZE-WOLLGAST P,SCHUMANN H. 3D information visualization for time dependent data on maps[C].Proceedings of International Conference on Information Visualization,2005.
[17]HUANG G,GOVONI S,CHOI J.Geovisualizing data with ring maps[J].ArcUser,2008,10(2):54-55.
[18]VINH P T,THI H N.Visualization cube for tracking moving object time-oriented[C].2011 International Conference on Information and Electronics Engineering,2011(6):258-262.
[19]Guo Dianheng,Chen Jin,MACEACHREN A M,et al.A visualization system for space-time and multivariate patterns(VIS-STAMP)[J].IEEE Transactions on Visualization and Computer Graphics,2006,12(6):1461-1474.
[20]ROBERTSON G,FERNANDEZ R,FISHER D,et al.Effectiveness of animation in trend visualization[J].IEEE Transactions on Visualization and Computer Graphics,2008,14(16):1325-1332.
[21]陳為,張嵩,魯愛東.數據可視化的基本原理與方法[M].北京:科學出版社,2013.
Review on time-series data visualization
Qi Luyue1,2,Wu Sheng1,2
(1.Spatial Information Research Center of Fujian Province,Fuzhou University,Fuzhou 350002,China;2.Key Lab of Spatial Data Mining & Information Sharing,Ministry of Education,Fuzhou 350002,China)
Time-series data visualization integrated time-series data mining,data visualization,computer graphics,computer interaction technology,and theories of other disciplines.In this article,we summarized the features of time series data from time and data;we discussed the main task of time-series data visualization from the perspective of the users;we reviewed the visualization development of time-series data from the people-centered to the computer-centered,and to the man-machine interactive way;we introduced five kinds of charts and five types of expressions of time-series data visualization in detail.Finally,we summarized and prospected the research on time-series data visualization.
time-series;visualization;interaction
TP391
A
1674-7720(2015)12-0007-04
2014-12-16)
戚陸越(1991-),女,碩士研究生,主要研究方向:時間序列數據可視化與可視分析、信息共享與服務等。
國家“ 863 ”重大項目課題( 2012AA12A208 )
吳升(1972-),男,博士,教授,博士生導師,主要研究方向:時空數據分析與可視化、信息共享與服務、數字區域與智慧城市、應急信息系統等。