□高云
2013年被稱為“大數據元年”。大數據主要被人們用來描述和定義信息爆炸時代產生的海量數據,具有規模大、價值高、交叉使用等特征,它不僅有“規模更大的數據”量上的進步,還具有不同于以前數據組織和應用形式質的飛躍。大數據的火熱促進了數據新聞的進一步發展,它主要是指對一些數據進行統計、分析和挖掘,以直觀化、可視化的方式呈現,更容易詮釋出新聞的輪廓。該技術的發展對傳統新聞生產模式和整個運作體系帶來了新的理念,注入了新的活力。
數據新聞也被稱為數據驅動新聞。從新聞報道的演變來看,數據新聞并不是一種全新的報道方式,它與精確新聞、計算機輔助報道有著密切的關系。20世紀60年代,美國學者、新聞記者菲利普·邁耶提出了精確新聞報道的理念,強調新聞報道中社會調查研究方法、調查數據與結果的科學應用。其特點是新聞工作者在采訪時能運用科學的方法進行系統觀察,這種觀察具有代表性,在內容上它是以精準的數據為依據的,可以使新聞報道更顯客觀、公正。20世紀90年代初,隨著互聯網的普及和計算機技術的發展,計算機輔助新聞實踐逐漸增多,它主要通過計算機來處理、分析原始數據,增加了新聞報道的便利性,增強了信息的接近性,強化了新聞的準確性,使得新聞工作者逐漸不再依賴新聞解釋和消息來源。
大數據時代到來,數據信息的爆炸性增長,促進數據新聞逐漸走向流行。2010年8月,國際數據新聞圓桌會議在荷蘭阿姆斯特丹首次舉行。會議定義了數據新聞,指出數據新聞本質是一種工作流程,包括以下步驟:重復抓取數據、過濾數據、重組數據以及深度挖掘數據,聚焦專門信息以過濾信息,最后對數據進行可視化操作并將它們合并成新聞故事。這也說明數據新聞的關鍵不在于數據,而在于運用數據可視化講故事的能力。因此,在大數據的背景下,以海量數據為基礎對新聞事件之間的關系進行整理和挖掘顯得越來越重要。
數據新聞作為大數據時代的一種新聞表達方式,已經成為備受關注的新聞形態,其在呈現方式、敘事方式與生產流程等方面表現出了新特點。
數據可視化就是將大量數據組合構成數據圖像,同時將數據的各個屬性值在信息圖表上表現,這種呈現方式符合受眾圖片化閱讀的習慣。其中,信息圖表包括地圖、圖形、圖表、圖解、動畫、視頻等視覺化工具。2015年《二十世紀以來和傳染病的斗爭:疫苗的影響》獲得“最佳可視化”單項獎。該作品中以縱向的黑色線條為界,左側和右側有大量點狀的顏色塊,顏色塊用來表示傳染病在某一年、某一州的病發數量,縱向黑色線則表示疫苗的引入時間。顏色越接近于藍色和白色,表明發病數量越少;越接近于紅色,表明發病數量越高。整個圖像通過可視化的圖表清楚地說明疫苗可以有效控制傳染病的發生,這種表達形式將我們對于抽象數據的不理解轉換成對于圖形的認識,將冗雜的數據文本變成人們容易接受的動態文本,實現了“枯燥”向“有趣”轉化,使得受眾更加輕松容易理解報道內容,也降低對數據理解的復雜度。
用數據講故事是數據新聞的一大特點,這是因為在數據新聞報道中,數據不再是單純的文字輔助工具,它自己本身就可以是一種信息。新聞工作者通過大量的數據找到有價值的新聞線索,并用數據圖表來講述復雜的故事。數據可視化技術豐富了新聞內容的生產,增強了報道的說服力。2016年,澎湃新聞在兩會期間發布了《最近十一年的<政府工作報告>都說了些什么》。在這篇報告中,使用時間軸、氣泡和信息圖等數據圖表去展示11年來政府工作報告中關注的重點內容。通過時間軸上氣泡的大小,我們可以看到2006年至2016年政府工作報告中同一詞匯出現的頻率,同時,報告中還統計出每年政府工作中出現頻率低但同樣可以反映出當年熱點的詞語。澎湃新聞用簡潔明了的數據圖表幫助讀者更加清晰地理解政府的工作報告,這種方式改變了以文字為中心的傳統新聞報道,數據成為主要內容,而復雜的故事則通過數據圖表來講述。
數據新聞生產流程中不可或缺的三個部分始終是獲取數據、處理數據、呈現數據。在獲取數據中,數據來源主要從政府機構、高?;蛘邆€人、社交網絡平臺等來獲取。在處理數據中,新聞工作人員需要識別原始數據的真實性,利用Excel、聚合圖表、Access數據庫等軟件進行數據的歸納、處理、篩選,完成圖表數據的制作。在呈現數據中,工作者通過可視化技術,以信息圖表的形式發布。信息圖表比起文字報道更簡單、更有趣、更直觀,既可以使受眾得到有價值的信息又有利于新聞內容的傳播??傊瑪祿侣勑枰獙Υ髷祿M行深度挖掘,從中發現有價值的新聞主題,然后經過一系列的處理、分析、挑選,不斷提煉相關的新聞信息,再把復雜難懂的信息以數據新聞的形式,構成清晰易懂的新聞故事。
在大數據的背景下,我國的媒體順應趨勢開設了自己的數據新聞欄目,雖然獲得了可喜的成績,但是依然存在著困境,這極大地阻礙了數據新聞的發展。
大數據時代,使用數據說話成為新聞工作者必備的技能??墒?,我國的數據新聞團隊存在著人才缺乏、數據素養偏低等問題,使得對社會的熱點、公眾關注的話題缺乏分析和處理的能力,而自身專業技能的不足,又使得在數據的挖掘和處理利用上有待提高。如數據新聞的制作過程與傳統新聞存在差別,它對于傳統新聞工作者提出了更高、更具體的要求,既包括搜集數據、分析數據、信息圖表的選擇和制作,還包括所涉及的社會統計學、數據挖掘分析、平面設計的知識。而我國如今具備上述條件的全能型人才不足。
數據新聞制作的前提是海量的數據,而海量的數據有賴于開放的數據源。西方的數據新聞起源早而且越來越成熟,這與西方開放的數據環境息息相關。而中國數據新聞來源的開放很大程度受制于兩個方面,一方面是政府原因,我國政府信息公開起步較晚,相關部門的數據獲取渠道不通暢,甚至一些重要的數據因為機密、隱私等原因無法獲取,這使得數據資源獲取受阻,新聞報道缺乏數據支持。另一方面是商業原因,很多重要的數據掌握在一些運營商、服務商以及權威機構手中,出于商業利益保護,有時候這些機構拒絕公開自己的數據,拒絕數據的流通,這使國內的數據在獲取方面受到影響。
數據可視化技術是指通過利用先進的圖像處理技術和計算機網絡技術,對新聞內容進行圖像化處理,將新聞數據轉化成可視的數據圖表,以可視化的形式代替了文字形式,向公眾傳播更加具有視覺沖擊力的新聞。但是,當前我國的數據新聞存在著為了可視化而可視化的現象,注重的是新聞作品的表現形式,這使得內容缺少新聞價值,也缺乏去挖掘數據背后的意義。在可視化的過程中堆砌大量的信息圖表輔助報道,并沒有給受眾具體說明新聞的真正價值,為了可視化而可視化,其結果往往只能適得其反。
數據新聞具有的數據可視化、數據講故事、數據深挖掘等新的特點促進了從業人員的思維方式和生產理念的革新。但是在實踐過程中也存在著人才缺乏、數據源不開放、濫用可視化技術等問題,這些問題嚴重阻礙了數據新聞的發展。總之,互聯網技術的進步、信息的爆炸性增長、人們日益改變的閱讀習慣等都給數據新聞的發展帶來了廣闊的空間。數據新聞的發展是一個不容阻擋的趨勢,已經成為傳統新聞轉型的必然途徑之一。