文/楊曉宇 李晉芳
互聯網作為一個數據平臺、一個數據集散地、聚集了海量的數據,在大數據時代下,互聯網企業的決策離不開用戶行為數據。我們完全可以借助數據理論和技術,本文分析了豐富的內容,找出了統計規則,為互聯網企業實現更好,更快的可持續發展提供了定量依據。
在數據可視化的研究中,大多集中在特定的媒體上。其中大部分集中在媒體如何獲取數據,以及如何從信息圖的角度進行研究和分析。
筆者對2018年乒乓球亞洲杯和羽毛球世錦賽期間國外媒體66篇體育新聞可視化作品進行統計,研究樣本可視化總體形式統計結果顯示:作品中只有9篇是以靜態方式展現的(占比14%),單向動態有18篇(占比27%),而最多的就是雙向動態互動方式,共有39篇(占比59%)。
對比國內媒體可視化總體形式,176篇國內的體育新聞中,可視化案例靜態方式一共有170篇(占比97%),幾乎所有的國內體育媒體的可視化作品都只是停留在靜態信息圖的階段。另外單向動態的只有6例(占比3%),雙向動態互動方式0例。雙向動態的互動模式在國內體育新聞可視化中處于空白狀態。在前文所介紹的國外相關領域領先的媒體中,雙向動態模式幾乎成為了一則優秀可視化體育新聞作品必備的特點之一。停留在靜態階段可以說是國內體育新聞可視化發展的最大瓶頸。
可視化作為數據新聞的表達形式,是可視化大數據的最重要的環節。只有通過可視化,數據才能輕松地向觀眾傳達信息。通過對三種媒體數據新聞可視化形式的調查分析,可以看出傳統的文字和圖片并不是數據新聞最重要的形式,信息地圖,地圖和圖表豐富多樣。時間占多數。如表1所示。

表1:數據可視化形式對比
作者將圖表分為三種媒體可視化表示形式(包括直方圖,餅圖,折線圖等),表格,地圖,時間線,散點圖表,網絡圖表,字體圖表等(包括金字塔,文本圖表)云,文本圖表等。從表中可以清楚地看出,圖表是主要的絕對主力。原因是大多數數據可以使用直方圖,餅圖,多邊形等良好的性能,其他形式的基礎有局限性,如地圖數據必須與地理位置有關,時間線必須有時間跨度變化,等等。強制使用會增加受眾理解的難度,畫蛇添足。
在數據集的視覺設計過程中,通過對數據進行針對性的分析,可以還原事物本質,使人們如同擁有一個“新相機”。
在2011年8月英國發生全國性騷亂的背景下,《衛報》發起了“解讀騷亂”項目,旨在通過收集、分析和處理數據,對騷亂的原因和影響進行深入分析。這個項目的數據收集主要來自三個方面。首先,通過對參與暴亂的人、警察和普通居民的深入采訪,獲得第一手資料。其次,對社交媒體上的內容進行數據分析。第三,收集犯罪嫌疑人的有關個人信息和法庭記錄。在這個龐大的項目中,《衛報》不僅使用了可視化技術來展示其數據分析的結果,還將其作為隨后披露暴亂的依據。報道題為“英國的騷亂:貧窮是原因嗎?”在這一部分,項目組通過對收集到的數據進行分析,完成了“財富因素與暴亂”的對比信息圖、“解釋暴亂”的法庭數據分析。通過分析參與暴亂的主要群體,研究他們的經濟能力,在信息圖上標注2000多名暴亂參與者的家庭住址,可以發現他們大多生活在英國的貧困地區。此外,對暴亂參與者的家庭地址和騷亂的位置二維數據分析比較,發現這些人主要是步行的方式參與騷亂,從而得出參與暴亂的人更有可能是偶爾,而不是故意長途旅行參加騷亂。在對數據的全面分析中,《衛報》發現,貧困是全國性騷亂的主要原因。
3.2.1 清晰、有效的歸納
數據可視化的信息圖功能是簡化復雜信息。統計學家愛德華曾說過,“良好的信息設計是一個清晰的視覺觀念。
3.2.2 準確、簡潔的組織
由于信息傳輸和接收的對象不同,相關信息的圖形傳輸會有一些偏差,容易被誤解。因此,有必要在初始設計中合理地總結信息,以使信息具有一定的結構,而不是簡單地堆疊幾何圖。交互設計師通常是工程師。他們不需要像科學家那樣思考和分析與大腦相關的所有時間常數,而只需設計好系統。
3.2.3 富有美感
數據可視化應該在設計上很漂亮。否則,難以直觀地吸引用戶并獲得大量的用戶瀏覽信息。
數據可視化是解決方案。因此,面對海量數據,我們首先應該考慮如何根據領域問題合理地提取相應的數據。在提出問題以創建信息可視化時,我們應該盡可能地關注以數據為中心的問題。注意以“為什么”開頭的問題,這意味著您開始使用更正式的數據描述重寫分析。
許多數據可視化和BI儀表盤都成為數據過載的犧牲品——主要原因在于可視化內容過于擁擠,很多不必要的內容可能會讓數據更加難以理解。例如,三維圖表雖然看起來令人印象深刻,但它們往往會使數據的解釋更加困難。
4.2.1 對多維數據的視覺設計
大量數據和信息中有許多多維數據。這些多維數據的可視化非常重要。有許多方法可以直觀地設計這些數據,并為不同的數據類型選擇不同的方法。這些方法基本上實現了多維數據的呈現,使用戶能夠從各個方面分析和理解數據,并獲得所需的視覺效果。用戶可以更方便地觀察和分析數據,從而獲得有價值的信息,大大減輕了用戶的工作量,提高了工作效率。
4.2.2 對層次關系的設計
在數據處理和分析過程中,層次關系可以最清晰地繪制數據中包含的信息。在設計此類數據的可視化時,我們可以使用樹結構來描述它。但是,樹結構只能描述少量數據,但不能描述大量數據。因此,在制作大數據時,我們應該考慮在盡可能小的空間中呈現盡可能多的層次關系。
4.2.3 對文本數據的視覺設計
在數據處理和分析過程中,我們會遇到各種文本信息,而且文本信息量也非常大。有了這么多的文本信息,很難找到我們需要的文本。我們必須設計一個非常清晰的視覺界面,以幫助我們快速找到我們需要的文本。同時,在單文本信息的設計中,要突出文本信息的特征,將其與其他文本信息區分開來,并注意文本信息的視覺效果,以便我們一目了然,從而實現文本的可視化。
隨著網絡技術的發展,大數據時代已經到來,從數量變化到質變。隨著用戶對數據分析的需求不斷增長,對數據可視化的需求將越來越強烈。普通用戶還需要或積極參與可視化項目的設計和創建,更多元化的數據可視化技術將大有作為。