曾瀟瀟
(華中科技大學,武漢 430070)
在人類所有的感官中,視覺被認為是一種主要的、強大的輸入通道。它吸收了我們周圍的一切事物,并將這些信息傳遞給大腦,以便對它的含義進行即時分析。在視覺與認知的密切聯系下,學習和創造視覺設計的第一步是通過理解人類視覺感知的工作方式。視覺感知是相對的,不斷地掃描,不斷調整焦點,不斷適應。我們的視覺將信息傳遞給我們的大腦,我們的大腦負責處理所看到的信息,人類的視覺和認知進行特定的相互作用。更重要的是,人類視覺的復雜和神秘的本質,它為視覺設計師創造了大量的機會來利用人類的視覺感知,因為它與信息可視化有關。在所有獨特的視覺特征中,兩種感知特性在信息可視化中被普遍應用:前意識的處理和格式塔法。
在感官記憶中進行的前意識的視覺處理,是創建視覺表征的基礎。在沒有意識干預的情況下,觀眾可以瞬間感知到前意識關注的視覺屬性。信息可視化研究的關鍵問題之一是研究人類視覺系統如何處理和分析圖像,這項研究的一個重要的初步結果是,少量的視覺特性可以被“低級”視覺系統快速而準確地檢測出來。這些特性被稱為“前意識”,因為它們的檢測似乎是在集中注意力之前。要充分認識到這一觀點的價值可能是困難的,但理解前意識的處理對于可視化設計是很重要的。特別是,通過開發前意識的處理能力,可以回答幾個重要的設計問題,例如,可以立即感知到什么?哪些視覺特性是好的鑒別器?是什么誤導觀眾呢?怎樣才能設計出這樣引人注意的信息?
來自北卡羅來納州立大學的Christopher G. Healey創建了一個網站,以展示關于信息可視化體驗的前意識處理方法。圖1中給出了他的一個例子:該圖顯示了如何根據顏色差異搜索目標圓——在所有較亮圓圈中較暗的圓會凸顯出來。這是前意識處理的基礎卻普遍使用的用法。前意識設計中也會使用其他一些基本工具包括長度,寬度和強度,還有更高級的符號,包括照明和運動方向。
格式塔組織法則也被稱完形法則,描述如何在圖形顯示中安排視覺符號,以優化圖像達到一個更好、更有效的可視化效果。這些法則關注的是人們如何解讀世界,提供有關知覺組織的相關原則。格式塔法最早是由德國心理學家在20世紀初提出的,它們的主要目的是幫助理解感知模式,同時也提供對許多基本感知現象的清晰描述。心理學家稱他們為法則,這些原則更像是啟發式,是解決問題的思維捷徑。

> 圖1 Christopher G. Healey運用顏色差異搜索目標

> 圖2 Chernoff Faces

> 圖3 用平行坐標表示汽車變量的關系
一個著名的格式塔定律被稱為“花瓶”圖,這幅圖畫出了圖形組織和邊緣分配的關鍵要素,以及它對形狀感知的影響。人們可以注意到,在花瓶畫中,感知到的形狀取決于被分配的黑白區域的邊界。與其相反,物的認知可以被認為是識別物體的基本知覺行為的一部分。必須承認格式塔法在信息可視化中起著重要的作用。這些法則適用于圖形的創建以避免其相互干擾。具體來說,根據格式塔法則,可視化設計應該避免不加標記,使用感知有效的編碼,而不是分散觀眾的注意力。用真實的信息創建有效和富有表現力的視覺設計是信息可視化的重中之重。
在信息可視化的一個定義中,有必要說明“使用計算機支持的交互式數據可視化來放大認知”強調信息可視化與人類認知的緊密聯系。圖形的一個顯著優點是通過人類視覺幫助簡化任務完成所需要的信息。尤其是為了使知識具體化,僅當數據無法輕易提供信息時,使用信息可視化可以提供幫助。視覺輔助的認知是由于它增加了記憶和資源的處理,通過前意識的屬性、格式塔定律,和許多其他的知覺屬性。通過簡化對信息的搜索并增強對模式的識別,可視化可以實現感知推理操作。
Edward Tufte愛德華·塔夫特是《紐約時報》的“數據達芬奇”(The da Vinci of data)的作者,他用簡潔的文字和巧妙的插圖書籍顯示了數據的視覺效果。除了在信息設計方面的著述,Tufte也是該領域的先鋒。通過他的作品,他提出了視覺化設計的關鍵原則,為展示信息提供了實質性的和重要的見解,以達到最大的效果。
Tufte的原則的一個后果是通過信息可視化實現卓越的圖形化能力。根據Tufte的說法,圖形化的卓越是“精心設計的有趣數據的展示——實質、統計和設計的問題。”知道優秀的圖形是由復雜的想法(圖中沒有歧義或混亂)、精確性(真實的結果和不失真的演示)和效率(極少量的圖表“垃圾”)組成的,這是一個關鍵的問題。卓越的圖形能力將使觀眾在最短的時間內獲得最多的創意,并且在最小的空間內使用最少的筆墨。這樣的圖形化的優秀通過兩個目標來實現:(1)通過圖形完整性原則來說明數據的真實性;(2)通過設計原則實現的清晰和精確的可視化。
圖形完整性原則涉及具有清晰,詳細和徹底的標簽,可用于防止圖形失真和模糊。Tufte還將“謊言因素”定義為“描述圖形中顯示的效果大小與數據中顯示的效果大小之間關系的值”。具體地說,數字的表示,就像在圖形本身表面上測量的那樣,應該與所代表的數量成正比。Tufte介紹的另一個設計原則是“數據墨水比”。Tufte將數據墨水稱為“非可擦的圖形核心”,非冗余墨水是為了響應數字的變化而排列的。從定義上說,非數據墨水是不傳遞信息的墨水,而是用于衡量尺度、標簽和邊緣。為了進一步擴展,數據墨水比率是“用于提供實際數據的墨水比例,與整個顯示器使用的像素總量相比?!彼羞@些細節和目標的教訓是,好的圖形應該只包括數據墨水;應盡可能刪除所有非數據墨水,以避免在演示文稿中引起注意力分散、無關的內容。其目標是設計一個具有最大可能的數據——墨水比率的顯示器,而不會消除有效通信所必需的內容。
非數據墨水的概念也導致了避免“圖表垃圾”的討論。圖表垃圾是圖表和圖表中的所有視覺元素,對于觀看者來說,沒有必要去理解圖表上的信息,或者轉移觀眾對這些信息的注意力。不需要的元素的例子包括重的或暗的網格線,不必要的文本,或不適當的復雜字體。有趣的是,有研究表明人們接受這種“極簡主義”的信息可視化方法。與Tufte所寫的不一致的研究表明,在某些情況下,圖表垃圾被認為是有用和有效的。這些信息可視化學者認為,精化并非都是壞事,視覺修飾可能還有其他好處。特別是當使用圖的目的是說服或演示時,它們應該被設計成幫助提供數據的可記憶性的特定目標。通過對現有研究的評價,支持數據圖形必須引起讀者的興趣,這是通過使用圖形圖像來實現的。
當涉及到信息可視化時,有很多技術可以被利用。這些技術包括簡單的圖表,如條形圖和線形圖,以及更高級的技術,如熱圖和散點圖矩陣。有些技術是為特定目的而創建的,因此很難對它們進行分類。在本節中,主要重點將介紹幾種常用的信息技術。
讓我們從定義多變量數據開始,因為它是許多技術中常用的術語和概念。多變量數據指的是三維以上的數據。換句話說,在數據集中每個案例中有三個以上的變量。
可視化多變量數據的第一種方法是通過多個視圖。使用這種技術,如果一個人不能在一個圖中顯示所有的維度數據,你可以嘗試在多個圖形中顯示它們,每個圖形都傳遞一個特定的信息。思想的邏輯進展是確定一種更直觀的方式,使每個變量都有自己的顯示,每個變量得到一個圖并顯示在對應的軸上,將多變量數據表示劃分為數個子圖,子圖再將數據映射到二維平面上。雖然這種可視化技術易于實現和直觀,但存在一個直接的缺點:隨著變量數量的增加,每個變量所需的子圖的數量也會增加。這增加了一次有太多子圖的風險,這增加了影響判斷的因素,使信息的理解和處理具有挑戰性。
一種更復雜的可視化多變量數據的方法是使用散點圖矩陣。散點圖矩陣是可視化設計人員所鐘愛的圖形工具之一。散點圖會呈現一個視覺顯示,以捕獲一對變量之間的相關性。給定一組n個變量,有n個選擇2對變量,因此有相同數量的散點圖。這些散點圖可以被組織成一個矩陣,使得在一個地方可以很容易地表示和觀察所有的成對關聯。
另一種有趣的視覺形象被稱為Chernoff Faces。赫爾曼·切爾諾夫是一位應用數學家、統計學家、物理學家和教育家,他發明了切爾諾夫臉譜,用人臉的形狀來顯示多變量數據。Chernoff在美國統計學會雜志上發表的論文中他建議簡化,卡通形式的面孔形狀能夠代表數據集中的許多變量。如圖2通過映射數字頭偏心,眉形、眼大小,眼睛偏心率、瞳孔大小,鼻子大小,鼻子寬口曲率、口寬度,和嘴開放,能夠達到視覺理解。Chernoff的臉譜幫助觀眾更快更準確地檢測出模式、分組和相關性。這一理論建立在這樣一個事實基礎之上:人類的大腦有能力識別面部特征的細微差異,同時也能同時吸收許多面部特征。
當數據集由純分類數據組成時,就會使用一種流行的可視化工具——馬賽克圖。鑲嵌圖讓分析師可以檢驗兩個或更多的分類變量之間的關系。馬賽克圖以長度為1的正方形開始,然后根據與第一個分類變量相關聯的概率的比例水平劃分。然后,每個水平的橫條根據第二個分類變量的條件概率的比例,在垂直方向上進一步分裂??梢允褂玫谌偷谒膫€變量,等等。
類似馬賽克圖的可視化技術是treemap。Treemaps是理想的情況,在這種情況下,需要可視化大量的樹結構(或層次結構)數據。treemap的空間首先被分割成矩形,這些矩形的大小和順序都是基于一個數量變量。通過可視化嵌套的矩形來捕獲treemap的層次結構。例如,代表一個國家的矩形可能包含代表該國的多個矩形。表示狀態的每個矩形依次包含代表這些狀態中的城市的矩形??梢允褂迷S多不同的算法來確定treemap中矩形的大小和順序,并考慮到treemapping的一般規則。一般來說,在treemap中,矩形的大小是:最大的矩形將被放置在左上角,最小的矩形將被放置在右下角,中間的所有東西都放在treemap的中間部分。當矩形被嵌套時,層次結構被呈現。
另一個被廣泛采用和有用的可視化技術是平行坐標。平行坐標是最著名的可視化技術之一,也是最常見的可視化學術論文主題之一。雖然一個人對平行坐標的最初印象可能是令人困惑的,一旦他們理解了,就很容易理解為什么他們是理解多維數字數據集的強大工具。如何通過一個例子更好地解釋平行坐標的作用。圖3顯示了一個平行坐標的例子,其中包含了汽車變量的關系,包括每加侖(MPG)里程、氣缸數、馬力、重量,以及它們被引入的年份。在這個可視化中,每個汽車變量都被映射到一個垂直軸上。因此,每一個數據值都在直線上的某個位置上,并被縮放到位于底部的最小值和頂部的最大值之間。對于行中的每一個情況,數據點都是連通的,并構成折線??梢詮倪@個可視化中獲得有用的見解。例如,圓筒軸是值得注意的,因為它只有幾個不同的值。由于柱體的數量只能是一個整數,在這個例子中只有8個值,所以所有的線都要經過一小部分點。在MPG和氣缸之間的空間中,可以看出,八缸汽車的里程一般比六缸和四缸汽缸低。
線條的“外觀”即它們如何交叉以及如何折疊,可以說明的不僅僅是數據。例如,線路的過度交叉是反向關系的指標;例如,汽缸越多,里程越低。在氣缸和馬力之間也可以發現類似的相關性:氣缸越多,馬力越大。還有一些交叉線表明,更多的汽缸并不總是意味著更多的權力;然而,總體趨勢顯然存在。 在馬力和重量之間,情況是相似的:更大的馬力意味著總體上更重的汽車,但是在價值上存在一些差異。 人們也可以看到,只有一個很輕的高馬力八缸汽車是個例外。最后,重量和年份之間的界線十分交叉,這意味著多年來汽車變得更輕。
經過幾十年的信息可視化的快速變化,創造引人注目、視覺刺激的內容的能力比以往任何時候都要大。通過專門的努力,研究人員、學者和實踐者已經開發出可視化的理論、技術、軟件工具和應用程序,它們可以用于各種各樣的目的,并且可以以一種引人注目的方式面向目標受眾。為了最大限度地利用這些發現和技術,可視化學習者要思想開放,不斷地尋找新的知識和技能,同時跟上潮流和變化這是很重要的。■