郭志武
深圳市中醫院,518033 廣東 深圳
在大數據時代,數據分析與數據可視化已廣泛應用于各行業,為管理與決策提供了有力的支持。數據可視化是將數據以圖、表和文字說明等形式直觀地展現出來,便于閱讀者理解及洞察其中隱含的規律,獲取有價值的參考信息。數據可視化是數據分析結果的呈現形式,其效果對于數據分析結果的解讀與洞察至關重要。
目前,業界并未發布數據可視化的統一標準與規范,數據可視化在實際應用中也存在許多爭議與分歧。鑒于此,一些組織和商業公司自行發布了關于數據可視化的規范或指南,用于產品設計及應用指引。IBCS協會發布了國際商務交流標準(international business communication standards),對設計報告、演示文稿、儀表板以及其中包含的圖表和表格的應用提出了建議與規范[1]。Google于2019年6月發布了Material Design數據可視化設計規范指南,在數據可視化設計原則、圖標類型與選擇、可視化樣式、動態圖表與儀表板等方面提出了指引[2]。阿里巴巴于2016年發布了支付寶數據可視化規范,目前已更新為AntV螞蟻數據可視化解決方案,包括圖表分類與使用指引、設計原則以及一系列產品[3]。百度推出了開源的數據可視化產品ECharts,并提出了數據可視化規范[4]。此外,一些商業公司(如Tableau)盡管沒有發布數據可視化規范,但其開發的產品也遵循著內部的規則與獨特的風格;一些報刊雜志(如商業周刊、華爾街日報、經濟學人等)的圖表制作,具有其特有的樣式與配色,隱含了某種可視化規范。這些隱性的規范也具有一定的影響力。
本文重點介紹IBCS、Google以及AntV 3種數據可視化規范的主要內容,并探討數據可視化規范的構成要素。
IBCS是一套應用于商務交流及圖表設計的規則與建議標準,由IBCS協會管理及更新,目前版本為1.1版。IBCS協會成立于2014年,是一個非營利的組織。IBCS包含了7類規則,35個小節,總共105條細則。
1.1.1IBCS的7類規則
7類規則的首字母為SUCCESS,規則含義和釋義見表1。7類規則又可被歸納為3個部分,概念規則(conceptual rules)包括SAY和STRUCTURE;感知規則(perceptual rules)包括EXPRESS、SIMPLIFY、CONDENSE和CHECK;語義規則(semantic rules)包括UNIFY。

表1 IBCS的7類規則
1.1.2IBCS常用的10條規則
IBCS 105條細則詳細闡述了不同場景、不同類型的數據可視化規則,提出了具體建議與要求。以下是IBCS常用的10條規則,稱為IBCS TOP TEN。
規則1:報告和演示文稿如要傳達信息,應該將它們置于在每個幻燈片或報告頁面的頂部。
規則2:每個頁面、圖表或表格都應具有一個唯一標題。標題應該標明組織、單位、度量和時間段。
規則3:時間和結構是最重要的分析類型。時間按水平方向由左到右排布,結構按垂直方向由上到下排布。
規則4:“年”和“月”等時間段應該用不同的類別寬度標識。
規則5:圖表是感知的關鍵。盡量使用柱狀圖、條形圖和線圖,而不是餅圖或儀表。
規則6:采用標簽指明數據。在圖表中用標簽指示數據系列和值。避免使用值坐標或網格線。
規則7:采用不同的場景展示要比較的數據類別。對實際、計劃和預測的數據應使用(提前定義的)標準的符號。
規則8:差異是不同場景之間的差值,應該用統一顏色表示差異的好壞。采用指針來標示相對差異。
規則9:不同圖表比較時應該保持一致的縮放。禁止截斷坐標軸,對同一單位使用相同的刻度,必要時添加縮放指示器。
規則10:使用高亮顯示以促進理解,但必須使用統一的標記,如用于注釋的橢圓、趨勢箭頭和差異標記等。
許多知名公司(如SAP、Microsoft等)都支持IBCS,眾多軟件產品也接受IBCS認證。IBCS對商務交流的統一規范具有明顯的益處,遵循統一標準的視覺元素可以傳達明確的含義,以便于理解與交流。
Material Design是Google在2014年發布的UI設計庫,至今已演變成一整套設計標準,包括組件對象、圖標、顏色、形狀、視覺設計語言、數據可視化等內容。Material Design數據可視化設計規范指南于2019年6月發布,是Material Design規范的一個分支,主要針對數據圖表設計。Material Design數據可視化設計規范為數據可視化提供了詳盡的指南,可用于可視化設計與實踐應用,該指南主要內容包括設計原則、圖表類型、圖表選擇、圖表式樣、交互、儀表板。
1.2.1設計原則
數據可視化是一種以圖形描繪密集和復雜信息的表現形式。數據可視化的視覺效果旨在使數據容易對比,并用它來講故事,以此來幫助用戶做出決策。數據可視化可以表達不同類型和規模的數據,包括從幾個數據點到有大量變量的數據集。數據可視化設計原則如下。
(1)準確 優先考慮數據的準確性、清晰度和完整性,以不會令人曲解的方式呈現信息
(2)幫助 強化探索和比較能力,以幫助用戶瀏覽數據。
(3)可擴展 數據可視化須適應不同的設備尺寸,同時預估用戶對數據深度、復雜性和各種場景的需求。
1.2.2圖表類型
(1)時間趨勢 顯示一段時間內的數據,例如趨勢或多個類別的比較。常用圖表有折線圖(line charts)、柱狀圖(bar charts)、堆疊柱狀圖(stacked bar charts)、蠟燭圖(candlestick charts)、面積圖(area charts)、時間線圖(timelines)、地平線圖(horizon charts)和瀑布圖(waterfall charts)等。
(2)類別比較 多個不同類別數據之間的比較。常用圖表有柱狀圖(bar charts)、分組柱狀圖(grouped bar charts)、氣泡圖(bubble charts)、多線圖(multi-line charts)、平行坐標圖(parallel coordinate charts)、子彈圖(bullet charts)等。
(3)排名 顯示項目在有序列表中的位置。常用圖表包括有序條形圖(ordered bar charts)、有序柱狀圖(ordered column charts)、平行坐標圖(parallel coordinate charts)等。
(4)部分與整體 顯示局部與整體的關系。常用圖表有堆疊柱狀圖(stacked bar charts)、餅圖(pie charts)、圓環圖(donut charts)、堆疊面積圖(stacked area charts)、樹狀圖(treemap charts)、旭日圖(sunburst charts)等。
(5)相關 顯示兩個或以上變量之間的關系。常用圖表有散點圖(scatterplot charts)、氣泡圖(bubble charts)、柱狀-線圖復合圖(column and line charts)、熱力圖(heatmap charts)等。
(6)分布 顯示每個值在數據集中出現的頻率。常用圖表有直方圖(histogram charts)、箱形圖(box plot charts)、小提琴圖(violin charts)、密度圖(density charts)等。
(7)流向 顯示多個狀態之間的數據流動。常用圖表有桑基圖(sankey charts)、甘特圖(gantt charts)、和弦圖(chord charts)、網絡圖(network charts)等。
(8)關系 顯示多個項目之間的關系。常用圖表有網絡圖(network charts)、韋恩圖(venn diagrams)、和弦圖(chord charts)、旭日圖(sunburst charts)等。
1.2.3圖表選擇
Material Design指南詳述了各種圖表選擇的場景和細微差別,為數據可視化圖表選擇提供了指引。例如針對時間趨勢類圖表的使用場景提出建議,見表2。

表2 時間趨勢類圖表的使用場景
1.2.4圖表樣式
數據可視化可以使用多種樣式和形狀,使數據更容易理解,以適應用戶需求。圖表樣式包括圖形元素、文字排版、圖標、軸和標簽、圖例和注釋等,均可自定義及優化。視覺個性化元素包括形狀、顏色、大小、面積、體積、長度、角度、位置、方向、密度等,這些元素的綜合應用提供了豐富的可視化效果。
1.2.5交互
具有交互模式的圖表可讓用戶隨意控制圖表數據,這種模式可以使用戶專注于圖表的特定值或某一范圍。推薦以下交互模式,可以提高用戶對圖表數據的理解。
(1)漸進式披露 提供了按需求逐步展示詳細信息的明確途徑。
(2)直接操作 允許用戶直接對UI元素進行操作,最大限度地減少屏幕上所需的操作數量,包括縮放和平移、分頁和數據控制。
(3)改變視角 通過數據篩選、鉆取或動畫效果,可使同一可視化設計從不同的視角來呈現數據,以適應于不同的用戶和數據類型。
1.2.6儀表板
儀表板是將一系列圖表整合在一起的數據可視化界面,多個獨立的圖表有時可以比一個復雜的圖表更好地表達故事。儀表板設計應考慮整體布局、圖表樣式及交互,通過設計布局突出最重要信息,使用顏色、位置、大小和視覺權重來確定信息的焦點。儀表板分為分析類、操作類和展示類,適用于不同的場景。
AntV螞蟻數據可視化規范的前身為支付寶數據可視化規范,于2016年發布。其作為一套數據可視化設計語言,對數據圖形進行了拆解、提煉,從色彩搭配、組件規范、基礎元素、功能上進行了歸納總結。該規范提供了一套簡單方便、專業可靠、無限可能的數據可視化解決方案和數據可視化最佳實踐,超過2 000家公司正在使用AntV產品。最新版的螞蟻數據可視化規范的內容主要包括設計原則和圖表用法。
1.3.1設計原則
AntV數據可視化設計有4條核心原則,以重要等級進行排序,4條原則相輔相成且呈遞進關系。
(1)準確 從數據轉化到可視表達時不歪曲,不誤導,不遺漏,忠實反映數據里包含的信息。
(2)有效 信息傳達有重點,克制不冗余,避免信息過載,用最適量的數據-油墨比(Data-ink Ratio)表達對用戶最有用的信息。
(3)清晰 表現方式清楚易讀,具條理性,可以幫助用戶快速達成目標,在最少的時間內獲取更多的信息。
(4)美 對數據的完美表達,合理利用視覺元素進行藝術創作,不過度修飾,給用戶優雅的體驗。
此外,AntV還對配色、交互方式以及移動端可視化設計原則提出了建議,在圖表組件設計方面做了指引。
1.3.2圖表用法
圖表用法是整個規范的核心部分。AntV針對每一種圖形做了介紹,提出了該圖形適合的數據、功能、數據與圖形的映射、適合的數據條數,并建議了適合的場景與不適合的場景。AntV從功能角度將圖表分為9類。
(1)比較類 包括柱狀圖、雙向柱狀圖、氣泡圖、子彈圖、色塊圖、漏斗圖、直方圖、K線圖、馬賽克圖、分組柱狀圖、雷達圖、玉塊圖、南丁格爾玫瑰圖、螺旋圖、堆疊面積圖、堆疊柱狀圖、矩形樹狀圖、詞云等。
(2)分布類 包括箱形圖、氣泡圖、色塊圖、等高線、分布曲線圖、點描法地圖、熱力圖、直方圖、散點圖等。
(3)流程類 包括漏斗圖、桑基圖。
(4)占比類 包括環圖、馬賽克圖、餅圖、堆疊面積圖、堆疊柱狀圖、矩形樹圖。
(5)區間類 包括儀表盤、堆疊面積圖。
(6)關聯類 包括弧長鏈接圖、和弦圖、桑基圖、矩形樹圖、韋恩圖。
(7)趨勢類 包括面積圖、K線圖、卡吉圖、折線圖、回歸曲線圖、堆疊面積圖。
(8)時間類 包括面積圖、K線圖、卡吉圖、折線圖、螺旋圖、堆疊面積圖。
(9)地圖類 包括帶氣泡的地圖、分級統計地圖、點描法地圖。
出于交流與共享、便于理解的目的,制訂一整套數據可視化規范十分必要的。數據可視化規范的范疇非常廣泛,涉及到數據可視化的定義、可視化對象與設計等多個層面,有必要對數據可視化規范的構成要素進行探討。本文綜合業界已有的數據可視化規范,并考慮數據可視化的實際應用要求,提出數據可視化規范的構成要素如下。
目前尚無數據可視化的權威定義,已有的各種定義在表述上、內涵上存在差異,因此有必要明確數據可視化的定義,界定其范疇。
數據可視化的本質是通過視覺對象揭示數據規律,其目的是為了更方便閱讀和理解數據。為實現這一目的,數據可視化必須遵循一些原則。數據可視化規范須明確制定數據可視化原則。
可視化對象包括圖形、表格、文字說明等。可視化對象種類繁多,有必要對其進行精選和分類,并界定每一可視化對象的功能、適用場景與條件、數據類型及最佳實踐案例。必須按照數據可視化原則來選擇可視化對象,以達到最佳的可視化效果。
每一個可視化對象均應得到合理設計。為了達到最佳的可視化效果,針對可視化對象的設計須制訂相應規范。可視化對象設計包含如下內容。
(1)組件與元素 如圖形的標題、圖例、坐標軸、網格、標簽等。
(2)形狀 可視化對象的幾何形狀、比例、尺寸、邊框、陰影等。
(3)顏色 各個組件的顏色,包括前景色和背景色。
(4)字體字號 對象中所有文字的字體字號。
(5)突出顯示 采用高亮、加粗或指針等方式突出顯示某一個元素。
(6)動畫效果 可視化對象的顯示方式及動態效果。
可視化界面是最終展示的整體界面,其設計包括4個方面。
(1)界面大小 考慮可視化界面顯示終端設備的多樣性,可視化界面應自適應各種尺寸、比例及滾動方向。
(2)整體布局 根據需要展示的內容設計整體布局。常見的布局有左右布局、上下布局,在此基礎上可以任意分割及排列組合,形成各式布局。布局方案也需要遵循一定的原則。
(3)配色方案 色彩的運用是可視化設計的一個重要內容。從理論上來說,配色方案是無窮的,但最佳的配色一定遵循某種原則,數據可視化規范應具體闡述并給出最佳實踐案例。
(4)交互操 從某種意義上來說,數據可視化是用數據講故事,呈現的是多個具有關聯關系的可視化對象,因此可以通過交互操作來改變展示內容以及進行鉆取、深化、篩選等操作。交互操作的設計影響最終的展示效果
3小結
IBCS、Material Design數據可視化設計規范指南以及AntV螞蟻數據可視化規范作為業界具有影響力的規范,為數據可視化的設計與實踐提供了詳細的指引和有益的參考。但3個規范各有其側重點,在某些方面甚至存在分歧。因此,有必要參照數據可視化規范的構成要素,從各個層面對數據可視化制訂完整而詳盡的規范。