(江南大學設計學院214122)
信息可視化是可視化技術在非空間數據領域的應用,可以使數據的呈現效果更加直觀,方便用戶的觀察和瀏覽。可視化應用廣泛,處理的信息類型豐富,相應地發展出了多種信息設計形式和風格。不同的可視化形式和風格適用于不同的信息類型與場合,但其目的都是相同的——“任何圖表與可視化的首要和最終目的是作為協助我們的眼睛和大腦發掘現象背后隱藏信息的一種工具”。
信息可視化設計通過對數據進行編碼、構建,對信息進行展示、比較、組織、關聯,從而使讀者根據信息建立心理模型,利用可視化工具對信息進一步挖掘。因此,信息可視化設計是否準確地傳遞了信息、合理利用了人眼和大腦的工作規律是十分重要的。由于可視化信息種類多且內容復雜,同時人接收信息過程具有一定主觀性,傳達效率與質量難以量化評價。針對這一問題,在此引入一個判斷依據——信息密度,希望從一個側面對信息可視化的效果進行衡量和評價。
信息密度這一概念在大眾傳媒的研究中早已出現,其定義為:在大眾傳媒這個信息群體的信息測量,即在大眾傳媒特定的單位傳播時空中(有限的版面、頁碼或節目時間里)的信息容量、信息流量。將此概念引申到信息可視化設計研究中,信息密度是指在可視化單位面積(紙張的版面、顯示器的屏面)內有效信息量以及可挖掘信息量,既信息密度=信息量/面積。
需要注意的是,有一個概念易與信息密度產生混淆,既Edward R.Tufte提出的數據-油墨比公式:數據-油墨比=數據編碼所用的油墨量/繪制圖表所用的油墨量總和。這個公式提出的目的是定義一種簡潔的可視化風格,不能直接說明信息密度。相同的信息量,在不同的可視化風格下可能會有不同的設計產出,并非所有視覺元素都用于信息表達。例如,Nigel Holmes在為《時代》(Time)所設計的一張圖表中,使用了女性身體曲線等豐富的視覺元素來傳達鉆石價格走勢,是典型的低數據-油墨比圖表。相對于這張圖表,經過簡化的折線圖有著高數據-油墨比。顯然,這兩張圖的數據-油墨比差別很大,但是第一張裝飾豐富的圖表與同等大小的簡化圖表所包含的信息量是一致的,因此信息密度相同。
確定合適的信息密度十分重要。信息密度的定位會影響到視覺設計的產出效果,關系到讀者在閱讀中的視覺認知過程,繼而影響信息接收的效率和質量,既信息傳達效果。根據人眼的生理特性——中心凹結構,人眼能夠清楚分辨事物的中心凹視野范圍只有2°,在進行多次掃視和凝視后才能形成視覺信息集合,因此視覺對于一定單位面積內容的獲取時間相對穩定。同時根據認知原理,在大腦將圖像轉變成視覺工作記憶的過程中,用于信息暫存和加工的工作記憶容量與時長都十分有限,因此一定時間內能夠獲取的信息量存在上限。綜合人眼和大腦的工作特點,在一定時間內視覺感知面積和工作記憶容量都有限。因此,單位面積內的信息量,既信息密度會直接影響到讀者閱讀時的認知過程,進而影響到信息傳達質量。
在信息可視化設計中,信息密度太小,設計內容單薄膚淺,可挖掘空間小,浪費版面資源,并會留下輕視讀者能力的傲慢印象;信息密度過大,大量數據和復雜圖形超出讀者的信息處理能力,勢必需要更多時間針對這一面積進行信息的接收,讀者會感覺到疲勞繼而逃避刺激源,這種抵觸心理將使信息難以順利傳達。
根據信息密度的概念公式——信息密度=信息量/面積,確定信息密度首先要確定指定面積內的信息量。在目前的可視化設計中,根據內容,信息分為以下六類:統計數據、空間類信息、時間類信息、事物自身屬性信息、事物之間的關系信息和思想類信息。由于信息種類繁多,對于信息量的衡量不必也不能統一地進行精確測度,需要結合具體情況評估。在此針對信息特性探討一個通用的評估思路。
數據是信息的表現形式和載體,數據的量化決定了信息量。數據主要有兩種類型的存在:數值(value)和關系(relationship),兩者共同決定了數據的體量與復雜度。
數值的量化取決于數值的數量和屬性。數值的數量既數值個數的總和,顯然,數值數量越大,數據量便越大。數值的屬性情況則由這個數值的維度或變量決定,根據變量數,可以將數據分為單變量數據、雙變量數據、三變量數據和超變量數據。數值的維數越大,信息越復雜,信息量越大。在可視化設計中,數值并不是指某個具體數字,而代表著一個信息單位。例如,在條形統計圖中,一個條形數據就是一個數值,這個數值的屬性則由它的坐標、色彩和說明文字共同組成;在流程圖解中,一個分步圖是一個數值,這個數值的屬性由圖形和說明文字組成,圖形和文字的復雜度決定了數值的復雜度。
關系則表示了數值之間的邏輯或自然聯系,表達了事物之間的相關性。組成信息圖的數值之間勢必存在著一定的關系需要表達。常見的信息關系有空間關系、時態關系、層次關系和網絡關系。空間關系中的數值在信息關系主要體現在空間上的方位和距離,常見的空間關系圖有地圖,地圖中的數值數量越多,空間關系越復雜,信息量越大。時態關系中的數值表示某個時間點的狀態的數據,聯系在一起可以表示事物隨時間的發展變化過程,如衛星云圖,按照時間前后可以表達一段時間內云圖的變化和氣象情況。時間點越多,每個時間點對應的數值越多,數值關系越復雜,信息量越大。層次關系則表現了信息之間的等級或層級關系,具有確定的層級結構,常見的層次數據圖有節點連接圖和樹圖。層次越多,子節點越多,信息量越大。網絡關系的數據具有網狀結構,數值之間的關系更加綜合,層級關系更加復雜,信息量根據具體的結構復雜度確定。在一個可視化視圖中,可能會同時出現多種信息關系,需要逐步理清,綜合應用。
可視化視圖的信息量一方面來自于視圖所展示的信息數據,另一方面來自于視圖背后需要再次進行挖掘的信息,這些信息由信息接收者自行解讀和挖掘。雖然視圖本身的質量會影響挖掘質量,但影響作用更大的是讀者本身的知識背景、對挖掘進行的投入等無法掌控的因素。因此,最終挖掘到的信息量因人而異、因時而異、因地而異,需靈活對待。
在確定了信息量的范圍之后,結合信息可視化視圖的展示面積,便可衡量出指定區域內信息密度的大小。
信息可視化設計發展到今天,針對不同分支領域都有了大量研究成果和應用實例,但對于信息可視化評價的研究仍然較少,尚需對相關理論基礎、方法和應用進行深入研究。結合認知科學和信息特性,本文提出以信息密度為依據的評估思路和量化方法,對信息可視化的設計傳達質量進行評價。在不同學科領域的應用中,信息密度的評估方法可以再深入細化,使評估方法更加適應學科特性。同時,在可視化的設計過程中,明確合理的信息密度也有助于設計人員可視化流程進行把控調整,最終達到信息傳達的目的。