王怡人
摘要:本文首先對對大數據時代的數據可視化概念進行解讀、辨析和研究,在理解了大數據與信息可視化的概念之后,闡述了國內外研究現狀,總結現在已有的呈現方式、評估方式、技術手段和工具,提出了大數據時代下可視化所面臨的挑戰。
關鍵詞:大數據;信息可視化;用戶
數據信息可視化是近年來不斷發展的交叉學科,是藝術和科技的融合。在如今信息爆炸的時代,人們接受數據的要求是快速、高效、準確的。設計師在設計一個好的數據可視化時,在符合信息真實性的同時,將大量的數據通過圖像等手段將抽象難以理解的數據整理成受眾方便理解的形式,涉及到計算機科學、統計學、藝術設計等各種學科領域。筆者在閱讀了國內外多篇文獻后將它們的各種理念,方法等總結如下。
1數據的含義 數據(Date),是用來描述科學現象和客觀世界的符號記錄,是構成信息和知識的基本單元。數據是沒有進行加工處理的事實,也就是說單個數據之間互不相關,獨立存在,人們用一定的方式將其排列或表達就使之間有了意義,供專業人員進行交流、描述、解讀。
大數據是具有4個特點的數據——數據量大(Volume)、變化速度快(Velocity)、數據類型多樣化(Variety)與價值密度低(Value)。從計算機技術的角度說,大數據是結構復雜、數量龐大、類型眾多的數據集合。通俗來說,大數據就是海量資料。在效率至上的時代,其規模巨大而人工無法在較短的時間內采集、管理、處理、分析并整理出通俗易懂的內容。從而又孕育出大數據技術——處理、管理等大數據技術。
可視化,不僅僅是可以看見,更多的是指易于理解。是把復雜的、不直觀的、不清晰、難于理解的事物變得通俗易懂,一目了然。以便于傳播、交流和溝通,以及進一步的研究。可視化不限于視覺層面,除了結合國標、文字、表格、錄像等形式、也可以結合聽覺、嗅覺、觸覺等感覺,并加入交互處理的技術,理論和方法,讓用戶易于理解??梢暬⒅匾曈X表達、交互方式和人類的心理感知,通過對心理學、圖形設計等知識等合理運用來展現數據并有效傳達其隱含意義。
2國內外研究現狀
縱觀最近幾年的國內外大部分數據可視化的著作和論文資料,可視化在學術界的優秀成果,可以涵蓋城市數據可視化科學可視化、圖可視化、高維數據可視化、人機交互(HCI)、AR/VR、數據敘事、可視分析等多個方面。
數據可視化是從Date Visualization翻譯而來。從Ben Fry的著作《可視化數據》,Nathan Yau的著作《鮮活的數據——數據可視化指南,Julie Steele和Noah lliinsky的著作《數據可視化之美》和Tufte、Few、cCandless等作家的可視化入門書籍中可以得到,如何發現問題、數據收集、可視化的分類和步驟、可視化工具的選取和應用技巧方面來對數據可視化技術的實際操作進行指導。國內的很多資料也都是從國外的網站、文獻翻譯而來的。含金量較高的學術論文往往是提出最新的高效算法和對其他相關技術的研發。在具體的可視化實現方面,在各個領域包括傳統的醫學、天文學等,新興的社會媒體、人機交互、ARNR等領域,國內外都研究在逐步地深入研究。
隨著時代與技術等發展,可視化是一個高度綜合的交叉型領域,深度和廣度都在不斷的擴展。大量的研究專注于搜集和分析過去和現在的事件,研究如何利用現在科技更好的展示數據,優化人機的互動,較少有利用這些信息,來尋找未來可能發生的事情。除了讓用戶獲取已有的信息,幫助用戶及時發現之后發生的事情,對未來事件的識別和描述,讓用戶未雨綢繆,及時準備,應該是一個新的研究方向。
從最近的幾場可視化研討會上,我們可以了解到可視化前沿技術的發展狀況,了解現在研究者的各種看法與觀點?,F在的研究內容,可以包括大規??茖W數據可視化、城市數據可視化、靈活構建可視化、新聞數據可視化、生物醫學領域數據可視分析、文化遺產應用數據可視化、理解和診斷深度學習模型等多種方向。
3呈現方式
可視化除了傳統的桌面呈現方式之外,近年來,學術界又提出了多層次的可視化、富交互多角度探索,以及通過故事敘事的形式表現分析目標。
多維度可以表現在解釋數據關聯趨勢的多種手段,而這些手段可以是地圖、圖表、圖像、動畫、標簽云等。運用這些手段可以使可視化的過程更加直觀化、關聯化、藝術化,增加了用戶與數據之間等交互性?,F在,多變量可視化的研究,大量是平行坐標,散點圖矩陣。研究同時還會伴隨時空或層次的信息,表現這些層次上還需要努力。
富交互多角度方面,用戶不僅可以在數據可視化平臺上更加容易的理解數據所傳達的信息,用戶也成為改進優化的一種因素。了解數據可視化的人群不只限于數據可視化的用戶,還有相當多的關注結果的觀眾。用戶既是數據的提高者也是優化結果的觀眾。
隨著技術的發展,交互技術和新的展示方式的發展,數據可視化已經不再局限在平面或桌面上。AR、VR領域的研究飛速發展,越來越多的可穿戴設備讓人們可以身臨其境的感受數據,深入理解數據。由此,也有一些研究人員開始研究更多自由度的交互和沉浸式的表現。
通過故事敘事的形式表現分析目標,將數據轉化為視覺共享的故事。在可視化數據故事和一般數據可視化之間繪制一條線,縮小視覺數據故事的范圍,從而促進通過數據可視化的講故事講解技巧進行更好的結構化討論??紤]到將數據轉換為視覺共享的故事以及更加集中的定義的整個過程,我們認為可以擴大視覺數據故事的研究范圍。通過在視覺數據講故事過程中追求這些新的研究途徑,可視化可以使數據更加有效的講故事。故事除了前面提到的線性敘述,更多的是非線性的敘述。是跳出時間先后順序的敘事技巧。這種技巧多運用在文學、戲劇、電影、小說和電子游戲中。設計師需要多去研究交叉學科的知識。
動態圖可視化,就是動態展現信息的圖表,用戶能與之交互的圖表。用戶用手點一點,就可以看到自己想要了解的數據,并用動畫的方式呈現出來。這樣的圖表,前期需要整理數據之間的相互關系程度,邏輯思想,現在有的分析方法可以分為small multiples和animation兩類,當然還有其他的方式。實現震撼人心的視覺效果,也有不少工具可以使用——Processing,Ocam,Adobe premiere,Adobe effecto