馬竹青
(中國青年政治學院,北京100089)
大數據時代數據圖表呈現模式
馬竹青
(中國青年政治學院,北京100089)
大數據時代數據的呈現除了數據表格外,圖表是其主要呈現形式。圖表可以將分散在數據表格單元格的每個獨立數據關聯起來,清晰、直觀地表現出其發展規律和變化趨勢。通過比較型數據和多項指標評估項目的圖表呈現,展現大數據時代數據圖表呈現模式。
大數據;數據呈現;數據圖表化
大數據伴隨著互聯網、移動互聯網、物聯網、車聯網的發展,凸顯重要,面對龐大數據的時代,關注數據的呈現模式日益重要。數據的圖形化模式,以提供一種形象的、直覺的解讀或展現數據,是一種全新的視角,透徹地理解信息的實質,有著藝術和色彩的感染力,更加強化了認知效果和記憶力,這樣的圖形化表達不僅是信息處理技術的變化,更是人們認識事物和傳遞信息的智慧。
圖表是一種重要的交流工具,精心設計的圖表比數據表格更容易了解數據走向、變化趨勢,一目了然展現數據之間的關聯,簡單、直接,一擊即中。
比較數據在數據分析中是常用的一種分析方法,例如,數據的差異比較、兩兩比較、環比、同比;某時間前后數據變化趨勢。
1.1比較視力矯正前后的數據

圖1 比較視力矯正前后Pic.1 Comparison of Visual Acuity Before and After
老人隨著歲月視力有不同的衰減,看東西逐漸變得模糊,一旦嚴重則需要做白內障手術。作為臨床信息積累,需要掌握手術后的視力改進情況,將好的經驗推廣。例如,部分數據為例,如圖1所示的數據,在Excel電子表格平臺實現,設置次坐標軸、分類間距變小、邊框虛線、無填充柱形圖等功能。
這樣的柱形圖表,針對每個姓名矯正前后以中線對稱,便于比較,實線的柱形圖是矯正前的,其數據靠下,虛線的柱形圖是矯正后的,數據在上,后者高于前者,一目了然獲取前后數據,直觀。
1.2比較兩個公司銷售額的信息
在商業營銷中常常比較不同分公司銷售業績,或者同公司不同營業員的業績等。例如,部分數據為例,如圖2所示的數據,在Excel電子表格平臺實現,通過“條形圖”類型,設置A公司最小值-7 000,最大值7 000設置,設置B公司數據的次坐標軸且“逆序刻度值”,設置次坐標軸最小值為-7 000,最大值為7 000、縮小條形圖的分類間距、邊框虛線、無填充色,以及縱坐標軸的標簽為“低”,效果參加圖2。

圖2 比較兩個公司銷售額Pic.2 Comparison of Two Company Sales
1.3比較計劃完成與實際完成的數據
實際工作中會有預期和現實、計劃和實際完成的兩類不同數據比對,以了解預期和現實、計劃與實際完成的狀況,例如,是超額還是滯后等,若超額,超了多少;若滯后,又滯后了多少,希望在一個圖表呈現出這4個數據。一般情況,我們獲取的數據如圖3所示的左側,只要計劃完成和實際完成兩列數據,為了繪制所需圖表,需要重新設計產生圖表的數據,將圖3左側數據修改為中圖的4列數據,“超額”列數據由公式產生,其值是實際完成——計劃完成;“未完成”列的值是計劃完成——實際完成。目標是滿足構成堆積柱形圖條件,使同行數據疊加。每2行空1行以便柱形圖之間產生1個間隔。
新的數據構成之后,就很容易實現如圖3右側的圖表,一目了然展現每個城市計劃與實際完成的情況,例如,北京,計劃完成1 230,實際完成了1 780,超額完成了550;而上海,計劃完成2 190,實際完成1 500,滯后了690。
圖表的視覺效果與數據關聯,讓數據與圖表設計更有意義,從而提供更高效的決策。

圖3 比較計劃完成與實際完成Pic.3 Compare the Plan to Complete with the Actual Completion
1.4比較考試成績整體與細節數據的圖表

圖4 比較成績整體與細節Pic.4Comparative Scores Overall and Details
如圖4左側所示數據,顯示三個科目的分科成績與總分,希望通過一張柱形圖類型圖表來呈現各自數據以及相互關聯,即在分類軸上顯示每個學生,其對應的3個科目和總分的柱形圖,且總分柱形圖包含了3個科目成績的細節柱形圖,如圖4右側所示。實現方法,主要設置總分柱形圖的次坐標、間隔10%、重疊-30%,以及具有一定透明度的純色填充。
其效果使用一個較大柱形圖顯示某個學生總分,使用其包含的3個柱形圖顯示各科成績,清晰表示了整體與細節的關系。
項目評估經常針對經濟、社會、投資等方面,從多個視角實施論證和評價,為決策者選擇項目及實施方案提供依據,并力求客觀真實、準確地完整地匯集數據資料,并呈現于決策者面前,有科學依據地給予正確的決策;項目評估,在可行性研究的基礎上,根據有關法律、法規、政策、方法和參數等進行全面技術經濟論證和評估,其目的是判斷項目方案的可行性或與其他方案比較優劣。
這里我們用高校學生對教師的評估來舉例。每學期每個學生將對他所上課的教師進行評價,使用十項評估項目考評,如圖5所示,每項評估項目的評價有5個等級:很好、好、一般、差和很差,依次得分5、4、3、2和1。

圖5 多項指標評估Pic.5 Evaluation of a Number of Indicators
對教師的評價結果顯示在數據表格里,顯然不夠凸顯,我們將評估項目和得分兩列數據圖表化,制作如圖5所示的雷達圖圖表,十個項目構成的十邊形環,每個角代表一個項目得分,坐標軸的間隔為0.5,這樣構成了10個環,按十個項目得分構成的閉合圖形就是該教師十項分數,外環分數高,內環分數低,以此清晰顯示十項得分。
數據圖表化,更直觀的顯示數據,使數據的比較或變化趨勢一目了然,從而更清晰地展現數據以及其關聯,吸引用戶的注意力,用圖表說話,圖表為數據增色,它的目的是迅速傳達信息,更加明確顯示數據相互關系,并能突出呈現重點和邏輯關系。
(由中國青年政治學院贊助)
Data Chart Presentation Mode in Big Data Era
MAZhu-qing
(China Youth College for Political,Beijing100089,China)
In addition todata table,the data chart is the main presentation mode in the bigdata era.Charts can be associated with each individual data in a data table cell,clearly and visually show its development regular pattern and changing trend.By comparing the type of data and a number ofindicators toassess the project's chart presents toshowthe bigdata era data chart showingmode.
Bigdata;Data presentation;Data chart
TP391.41
A
1674-8646(2015)09-0064-02
2015-06-13
馬竹青(1955-),女,北京人,教授,碩士,從事計算機教學、數據庫、數據處理研究。