文丨王瓊
?
數據新聞與數據素養
文丨王瓊
開欄語:過去,我們用文字、視頻、圖片傳達信息,隨著信息技術的發展和數據時代的到來,我們正在用數據發掘和闡釋真相,為受眾提供個性化、交互式的可視化閱讀。現在,數據新聞、可視新聞、智能新聞已成為世界新聞發展的重要前沿領域。
從本期開始,《中國傳媒科技》與武漢大學新聞與傳播學院鏑次元數據傳媒實驗室合作開設“鏑次元數據新聞專欄”,圍繞數據新聞的前沿問題,追蹤動態、分享洞察、激發思考、傳播知識。
我們期待廣大讀者通過《中國傳媒科技》微信公號(ID:meizj-tmt)和鏑次元微信號小秘書(ID: dyclub2015)與我們保持聯系,提出問題,分享經驗,共同成長。
何謂數據新聞?
數據新聞的英文是Data Journalism,它的相關概念有:計算機輔助報道(Computer- Assisted Reporting,簡稱CAR)、精確新聞(Precision Journalism)、數據驅動新聞(Data-driven Journalism)、計算新聞(Computational Journalism)、可視化新聞(Visualization Journalism)。
這些詞的詞義與相互之間的關系為何?到底什么是數據新聞?我也曾一頭霧水。
2013年到美國訪學,通過自己的學習、媒體調研,了解什么是數據新聞。我曾向一個媒體編輯部詢問這是否是一個很新的行業,他們說這個行業已經存在25年,只不過以前稱之為計算機輔助報道。這個時候得到了第一個線索:數據新聞在美國編輯部那里是從計算機輔助報道演變而來。那么,計算機輔助報道是什么?脈絡從何來?
目前已知最早采用計算機輔助報道的概念出現在1952年,當時美國大選,哥倫比亞廣播新聞在晚間選舉報道借助美國政府所有的計算機來幫助預測哪位總統候選人會獲勝。
最近這幾年數據新聞廣為人知,其中一個經典案例是媒體在2012年時用數據新聞預測出奧巴馬會在大選中獲勝。但其實早在1952年,美國媒體已經做過類似報道,也是從那時候起計算機輔助報道開始為人所知。
在此之后大約十五年的時間里,大型計算機開始逐漸普及。
1967年,美國聯邦信息自由法案開始實行,民眾有權利要求政府公開信息。雖然這法案是面對民眾,但從后來發展來看,真正去查閱資料并獲取與民眾相關信息的群體是記者,記者也因為信息自由法案而獲得更多的采訪權,自由法案可以說為數據新聞發展奠定非常重要基礎。
這一年還發生另外一件重要的事情,美國記者Philip Meyer借助計算機報道在底特律發生的種族暴亂。在做這次報道之前,他獲得尼曼獎學金在哈佛大學做了一年的訪問學者,受到社會科學研究方法啟迪,把社會科學的研究方法用到了記者報道方法來,讓研究更為深入。
當初的刻板印象是此類暴亂肯定是由南方的黑人引發的。但當時Philip Meyer開始使用新的方式切入報道,也就是問卷調查。他的問卷得到兩位大學教授的支持,還有三十多位訪問員參與這項調查,主要是收集黑人參與動亂的動機。
問卷結果卻與人們的“預判”有出入,甚至可以說,與大部分人的社會認知截然相反,這引起了社會轟動,加之此報道在當時獲得普利策新聞獎,由此他所采用的新的報道方式廣為人知。
之后1973年Meyer出版了《精確新聞學》,成為精確新聞學的創始人。他在這本書中展現了記者如何使用社會科學調查方法:如問卷、抽樣、訪談等,影響非常深遠。他向記者展示了計算機可以成為輔助報道的有力工具。

精確新聞學Precision Journalism
計算機輔助報道早于精確新聞,強調計算工具(計算機)的使用;精確新聞強調方法論,強調用科學研究的方法。之后有越來越多的記者使用計算機來分析美國政府機關的數據,其中比較著名的案例包括1974年《費城問詢者報》分析所得稅退稅數據,通過數據分析發現:所得稅征收偏袒富人。
80年代中期,個人計算機開始流行,隨之計算機輔助報道在美國興盛起來。當時任職于《普羅維登斯報》的一位記者Elliot Jaspin開發了一款軟件,通過軟件可以下載數據到個人計算機上,記者可以運用商務電子表格和數據管理程序來輕易地分析數據,這與目前記者使用的數據分析軟件已經非常類似。

計算器輔助報道的實用手冊Computer-Assisted Reporting: A Practical Guide
到了1989年,Elliot Jaspin前往密蘇里新聞學院開辦了密蘇里計算機輔助報道協會,并教授相關課程。1993年與IRE合并(調查記者與編輯協會,Investigative Reporters and Editors,簡稱IRE),成立了NICAR(美國計算機輔助報道協會,The National Institute for Computer-Assisted Reporting,簡稱NICAR,該協會目前仍是美國新聞界非常重要的協會,每年會吸引上千名的數據新聞從業者參加)。
從90年代開始,計算機輔助報道開始在全美編輯室穩定發展。1996年IRE的Brant Houston出版了《計算機輔助報道的實用手冊》,至今仍被記者與學生廣泛使用。目前鏑次元實驗室在翻譯此書,預計一年后跟讀者見面。
到了90年代中期,互聯網改變一切,美國新聞機構在網站推出了可視化圖表、交互式平臺的新聞。21世紀初,互聯網成為主導力量。
故事講到這里,計算機輔助報道明顯具有技術驅動的背景。那么問題來了,數據新聞既然跟計算機輔助報道相關,那為什么計算機輔助報道要變成數據新聞?如果一模一樣的話,那為什么要“改名”?
我在美國媒體訪問時,問了他們編輯同樣的問題:既然做的工作是計算機輔助報道,為什么要改稱為數據新聞?他們回答:因為當時被稱之為計算機輔助報道的時候,計算機非常難得,但現在計算機很普遍,若還維持這個名稱,會顯得有點silly。

Your Right to Know
另外,數據新聞一詞并不是出自美國,而是英國。根據谷歌趨勢,數據新聞在2010年年末開始使用,被稱為互聯網之父的Tim Berners Lee在此時敦促英國記者挖掘政府發布的海量數據。此外,數據新聞的發展也需要信息自由法案來推動。英國在2000年就通過了法案,但在2005才開始真正實施,在開放進程方面,英國晚于美國。
Heather Brooke有一本很有影響力的書Your Right to Know,講英國人民如何使用政府公開數據。此書作者從2005年開始倡導、培訓、推動如何使用挖掘政府公開數據。
在英國政府數據開放的頭一年,出現一則很重要的數據新聞報道“Justice by postcode(根據郵政編碼來進行宣判)”,揭示了英國不同地區定罪率存在巨大差異。這個報道讓許多記者注意到了數據的重要性,而以往報道個案的方式無法發現案件審判與地區之間的關系。
2006年,自由信息法案已經公布了一年,媒體從開放數據出發,做出了與之前截然不同的新聞,英國數據新聞開始蓬勃發展。在發展過程中,衛報扮演了一個很重要的角色。
Simon Rogers是英國衛報數據博客的創始人,他認為對數據的解讀并不只是數據記者的專業能力,人人都可以來做數據新聞,只要你有計算機、對數據新聞有素養,皆可以通過數據來觀察我們的社會。
2010年英國衛報發布一部引起轟動的作品,是根據維基解密釋放出來的數據制作的,關于伊拉克和阿富汗,這篇報道引起很大反響。就在這一年,“數據新聞”這個詞開始出現,對于數據新聞的定義,是和計算機輔助報道在實踐當中的發展、數據開放的進程密不可分的。