黃駿
【摘 要】數據新聞,也稱為數據驅動新聞,它是將大數據運用于新聞實踐的重要體現。本文將從基礎支持、媒體專業和受眾三個角度來分析數據新聞流行的原因。但作為新事物,數據新聞也隱含著三種潛在的問題:開放數據、數據隱私和新聞教育。
【關鍵詞】數據新聞 開放數據 新聞教育
數據新聞(Data Journalism),也稱為數據驅動新聞(Data-Driven Journalism),它是將大數據運用于新聞實踐的重要體現。廣義上說,“數據新聞”是大數據時代新聞學形成和發展的新領域;而狹義上來看,它是“基于數據的抓取、挖掘、統計、分析和可視化呈現的新型新聞報道方式”。①
從寬泛意義來講,最早的數據新聞可以追溯到1821年5月5日《衛報》創刊號上的一篇新聞報道,這篇報道是有關當地未成年人接受免費教育的調查。②報道中調查數據的收集僅僅是依靠四個牧師的手工統計,因此調查結果并不具有準確性。早期的“數據新聞”更應該稱之為“數字新聞”,其操作上主要運用的社會科學統計方法,存在人工的、零散的、非系統性的缺陷,與當下所談論的“數據新聞”大相徑庭。
歐美的數據新聞實踐已經實現了系統化的運作。BBC的數據新聞團隊由20人組成,包括記者、設計師和研發人員,負責為BBC的新聞網站制作數據新聞。除了承擔數據項目和視覺效果的制作外,團隊還包攬了新聞網站所有的信息圖表和多媒體專題的制作。比如BBC有關“歐元區債務網”的專題報道,探討了歐元區各國錯綜復雜的國內貸款,運用顏色和比例箭頭,并輔之以簡明易懂的文字,以視覺化的方式來闡釋復雜的問題。③它能夠鼓勵用戶去關注這樣的網站,閱讀其中的報道,并且不會被這些數字嚇到。而來自英國《衛報》的數據博客在該領域同樣值得關注,它包括一個主頁、各國范圍的發展數據的搜索引擎、網上和《衛報》視覺藝術家們的數據可視化作品,以及探索公共開支數據的工具。每天,他們會使用谷歌電子表單(Google spreadsheets)來分享完整的數據,隨后分析這些數據,并將之可視化。最后再用這些數據為報紙和網站提供新聞故事。
相較于國外數據新聞的蓬勃發展,國內的該領域實踐還處在起步探索階段。網易新聞的“數獨”欄目是我國數據新聞報道較早的嘗試。在2012年11月,“數獨”板塊發布了它第一條新聞《最適合兒童成長的國家》④,該新聞是針對當時貴州畢節5名兒童死亡的事件,結合國際慈善組織發布的一個指數報告制作的數字圖表新聞。不過“數獨”新聞的模式還是保持著單向性的傳播模式,沒有有效的與網民形成互動。最近,南方報系和央視也在嘗試運用大數據來報道新聞,不過傳播效果還有待進一步檢驗。
數據新聞“熱”的原因
不管是傳統紙媒還是數字新媒體,都在使盡渾身解數去了解并且使用數據來豐富新聞實踐。它不僅僅是技術操作上的變革,更是思維觀念上的轉換。那么數據新聞為何會如此受歡迎呢?
從基礎支持角度來看。大數據時代數據的極大豐富和開放,為媒體進行數據的挖掘、分析和分享提供了便利。大數據是指大小超出常規的數據庫工具獲取、存儲、管理和分析能力的數據集。⑤它具有海量數據規模(Volume)、快速的數據流轉和動態的數據體系(Velocity)、多樣的數據類型(variety)、巨大的數據價值(Value)這四大特征。而數據新聞正是基于互聯網等技術平臺,以大量數據的采集和分析作為主要特征的新聞樣式,海量數據的支撐使當下的數據新聞更加復雜、多樣和深入。
從媒體專業角度來談。數據新聞為專業媒體奪回輿論主導權創造了條件。眾所周知,新媒體科技的發展使專業媒體的優勢逐漸喪失,web2.0時代為公民新聞的發展創造了條件,專業媒體在報道新聞的時效性上大打折扣。不過正如彭蘭教授所說,如果媒體能夠利用大數據技術,把更多的注意力放在對未來趨勢的預測上,那么就有可能在公民新聞難以達到的高度上,來實現媒體價值的重塑。⑥其中,深度報道是數據新聞可以重點嘗試的領域,媒體工作者可以通過挖掘隱形數據的背后價值、捕捉復雜數據背后的意義來主導新聞議題。
從受眾角度來說。它不僅能夠吸引受眾的眼球,更能促使網民眾包來參與制作數據新聞。在基于大數據基礎上的受眾分析中,受眾的數據是媒體進行采訪報道的重要來源,這有利于更好地反映受眾的想法和行為。此外新聞機構將給予受眾更多的方式來參與內容的制作,并且能夠收集到盡可能多的數據源以此來完成新聞的生產。美國一家非盈利新聞編輯部(ProPublica)的編輯Scott Klein說:“我們想要確保我們的數據不止用一種方式敘述,而是希望任何人將他們自身經歷和團體的故事加入進來,形成成千上萬種敘述方式。”⑦
數據新聞應注意的問題
在媒介生態環境下,數據新聞看似前途光明,但作為新事物卻隱含著不少潛在的問題。筆者將從以下三個角度來闡釋媒體在進行數據新聞操作上應該考慮的問題:
第一,開放數據(open data)尚未廣泛推廣。數據從哪兒來?政府和企業組織公開的信息數據是數據新聞的重要數據來源。2009年1月,奧巴馬簽署了開放和透明政府備忘錄,要求建立更加開放透明的政府,參與、合作的政府,體現了美國政府對開放數據的重視。2009年12月,美國行政管理和預算管理局(OMB)為落實奧巴馬開放和透明政府備忘錄,發出開放政府指令,指示各機構打開大門為美國公眾提供數據。
在美國,新聞機構從聯邦政府那里獲取他們所需要的數據,如美國健康人道服務部(Department of Health and Human Services)和環境保護機構(the Environmental Protection Agency),以及地方的城鄉機構。新聞機構也會從一些非常規的渠道獲取數據集,諸如世界銀行、各式各樣的非盈利組織以及維基解密(Wikileaks)。⑧有時,新聞機構獲取數據的程序很復雜,甚至有些政府組織拒絕公布數據。在這種情況下,新聞機構可以通過《信息自由法》(FOIA)來獲取數據,這個聯邦法律是由美國政府實施,旨在允許全部或部分的信息文件的揭露。
受美國的data.gov以及英國的data.gov.uk的啟發,越來越多的國家都開設了數據門戶網站去促進民眾或企業對政府數據的再利用。比如在datacatalogs.org這個網站上,你可以找到大量數據門戶網站最新的索引信息。而衛報世界政府數據,則是一個元數據搜索引擎,囊括了許多國家的政府數據條目。⑨但在中國,雖然數據開放化正在逐步實施,但相比于美國開放程度還是有較大差距。數據新聞應當是一種開放式的新聞,應當能夠讓每一個公眾公開地獲取數據,實現全員參與的公共服務體系。但事實上,政府以及企業并沒能做到真正的數據開放化,公眾甚至是一般的媒體都無法利用開放數據來參與數據新聞的制作和報道。
這種基于大數據的限制性訪問創造了一種新的“數字鴻溝”:即大數據的富有者(the Big Data rich)和大數據的貧困者(the Big Data poor)。⑩紐約城市大學的教授Lev Manovich指出:“只有社交媒體公司有真正接觸社交大數據的渠道——尤其是用于交易的數據。在Facebook工作的人類學家或者是在谷歌工作的社會學家可以接觸到這些數據,而余下的學術團體卻無法做到。”⑾這也印證了為什么央視的數據新聞欄目《“據”說兩會》必須與百度大數據合作才能完成。
第二,數據隱私權受到侵害。大數據一方面被看作是反映社會問題的權力工具,為多樣的領域(癌癥研究、旅游業和天氣變化等)提供新的洞察;而另一方面大數據又被看作是數據專制(Big Brother)帶來的麻煩,使隱私受到侵害,降低了民主自由以及增加了政府機構的控制。⑿
媒體或社交公司在進行用戶數據搜集時,不可避免將會涉及用戶隱私的問題。要求研究者去獲得每一個發布推文(tweet)用戶的同意是沒有道理的,但不能因為數據可以直接獲取就不去檢驗研究者在搜集數據時的道德問題。因為這些數據內容可以公開獲取并不意味著它可以被任何人用來消費。⒀
大數據顯示了一系列道德考量問題,特別是隱私、允許使用和傷害保護等問題。媒體得考慮到這些問題中哪些是可以用來分析或是被提出來的。例如媒體要做某地公民的工資標準議題時,就得將個人收入納入到隱私考量中。數據越大,涉及到的隱私保護難度也越大,這就需要媒體工作者提高數據素養,能夠分清哪些數據可以使用、哪些數據則受到保護不能使用。
第三,新聞教育跟不上數據新聞的趨勢。從學科領域來說,數據新聞應該是新聞傳播、計算機科學和藝術設計三者結合的產物,而中國當前的新聞教育還僅僅停留在單一學科的學習和培養階段。這就要求目前的新聞傳播學生以及媒體從業者具有跨學科學習的能力,新聞傳播專業的學生要學習有關計算機編程的相關課程,而計算機專業的學生則要提高新聞寫作與新聞編輯的實踐能力。
在新聞教育上,美國依然走在世界的前面。哥倫比亞大學新聞學院以及西北大學的新聞學院開設了計算機科學和設計等跨學科計劃。在佐治亞理工學院Irfan Essa教授主講計算機新聞學的課程,并由學者Ian Bogost 主持了一個探索將電子游戲融入到新聞實踐的項目。⒁而在中國,香港大學新聞與傳播研究中心開設的數據新聞研究室是該領域的較早嘗試。最近中國傳媒大學也開始開辦“數據新聞報道實驗班”,針對本校優秀學生進行選拔,以培養具有較高新聞素養和數據處理分析水平的新聞傳播復合型人才。不過總的來說,中國大陸開展數據新聞教育培養的學校還是鳳毛麟角,沒有形成規模化和集群化的培育模式。
數據新聞是未來的發展趨勢,記者需要成為數據專家,過去的新聞工作者能夠通過與他人聊天完成新聞報道,但是未來記者需要鉆研數據,運用各種可視化工具來分析和呈現數據,幫助公眾了解社會方方面面的變化和趨勢。英國的獨立多媒體記者Adan Westbrook表示,數據新聞是未來新聞業最具發展潛力的領域之一。數據新聞使新聞回歸本質:挖掘公眾無暇處理的信息,核實信息,理解信息的內涵后將之發布給公眾。如果更多的記者這樣工作,公眾將更加文明和有見識。⒂
由此可見,不管是新聞傳播專業的學生還是媒體工作者,都需要不斷地進行跨領域、跨學科學習,只有這樣才能在面對紛繁復雜的信息數據時從容地進行收集、處理和分析,幫助公眾更好地了解社會,從而履行媒體公共性的職能。
參考文獻
①方潔、顏冬,《全球視野下的“數據新聞”:理念與實踐》[J].《國際新聞界》,2013(6):76
②Rogers, S:The first Guardian data journalism:May5,1821.Retrieved on May 22, 20 13,from TheGuardian,http://www.guardian.co.uk/news/dat-
ablog/2011/sep/26/datajournalism-
guardian.
③Euro zone debt web:Who owes what to whom?,from BBC NEWS,http://
www.bbc.co.uk/news/business-15748696
④《最適合兒童成長的國家》,網易“數獨”,http://data.163.com/12/1121
/02/8GQ6KCF000014MTN.html
⑤James Manyika, Michael Chui, Brad Brown, Jacques Bughin, Richard Dobbs,Charles Roxburgh,Angela Hung Byers:Big data:The next frontier for
innovation,competition,and productivity,from McKinsey Global Institute,http://www.mckinsey.com/insig-
hts/business_technology/big_data_the_next_frontier_for_innovation
⑥彭蘭,《“大數據”時代: 新聞業面臨的新震蕩》[J].《編輯之友》,2013(1):10
⑦⑧Aitamurto T,Sirkkunen E, Lehtonen P.Trends in Data Journalism[J].Espoo: VTT, 2011
⑨OReilly:Data Journalism Ha-
ndbook.Retrieved on may 11,2014,fr-
om DataDrivenJournalism.net,http://
datajournalismhandbook.org/.
⑩Boyd D, Crawford K.Six provocations for big data.A Decade in Internet Time: Symposium on the Dynamics of the Internet and Society[J].Social Sci.Res.Netw.,New York.[Online].Available:http://ssrn.com/
abstract,2011,1926431.
⑾Manovich,L:‘Trending:the pr-
omises and the challenges of big social data,in Debates in the Di-
gital Humanities, ed. M. K. Gold, The University of Minnesota Press,Minneapolis,MN,[Online]Available at:
http://www.manovich.net/DOCS/Manov-
ich_trending_paper.pdf(15July2011).
⑿⒀Danah boyd & Kate Crawford:CRITICAL QUESTIONS FOR BIG DATA, I-
nformation,Communication & Society,
15:5,662-679
⒁Hamilton J T, Turner F. Acco-
untability through algorithm: deve-
loping the field of computational journalism[C]//A Center for Advanc-
ed Study in the Behavioral Sciences Summer Workshop. Duke University in association with Stanford University,2009:27-31
⒂Westbrook,A:Data-driven journalism: what is there to learn? Paper presented at the Conference of datadriven journalism Amsterdam ro-
und-table. The Netherlands.http://
mediapusher.eu/datadrivenjournali-
sm/pdf/ddj_paper_final.pdf.
(作者:湖北大學新聞傳播學院碩士研究生)
責編:周蕾