□陳涵宇
大數據時代下記者的生存之道
□陳涵宇
本文依據數據新聞生產與團隊構成的特點,說明記者在制作數據新聞過程中應當具備較強的數據收集能力、獨到的數據分析視角以及專業的可視化制作能力,并對三種能力進行分析,為提高記者自身素養提出建議。
數據新聞;記者;技能;素養
在二十一世紀的信息革命中,技術的革新推動了大數據時代的來臨,而新聞學與大數據結合在一起,就產生了數據新聞。數據新聞的生產流程不同于傳統新聞的生產,雖然依然有采編這樣的傳統環節,但數據已成為新聞報道的支柱,因此如何高效準確地獲取數據成為記者必備的素養。另外,為了能夠更好地跟團隊內的數據分析人員、編程人員和設計人員進行溝通,作為一名記者,不僅要做好數據收集,還要學會基本的數據清理、分析,并對可視化、設計方面有所涉獵,這樣才能夠使數據新聞作品呈現出較好的表達和傳播效果。
由數據新聞的特點可知,數據新聞是以開放的數據為基礎的,如果記者不能有效地收集數據,那么數據新聞也就無法制作。在許多國內外數據新聞的團隊中,例如《網易數讀》《泰晤士報》《衛報》,記者最重要的一項工作就是收集數據,因此數據收集的能力應當是十分重要的。中國進入二十一世紀以來,政府數據的開放程度也得到明顯提高,但相較于英美等發達國家以及港澳臺地區來說,官方數據的開放程度還十分有限,這也加大了國內數據新聞記者在數據收集環節的困難程度,也迫切要求記者能夠掌握以下在現有條件下收集數據的技能。
(一)從網絡上收集數據
在互聯網時代,搜索信息與數據的首選當然是網絡。對于一些公開的政府或企業信息,記者可以直接登錄官網或數據庫進行下載。但有些時候,在網頁上采集數據可能不那么容易。因為記者有時還需要從網頁的字里行間中收集數據,或者從成千上萬的社交媒體評論中收集關鍵字,這樣的工作量十分巨大。并且往往官方提供的數據格式為PDF,這種不能進行編輯的文件格式達到一定數量的時候,整理起來十分繁瑣。因此記者要想能夠高效準確地收集數據,還應學會用一些網頁采集數據的工具,比如說C++、Python、PHP。這也要求記者要對HTML語言有一定的了解,掌握一些編程的技能,從而能夠獨立完成網絡上的數據收集。
從網絡上收集數據是記者的一項基本技能,但由于從網絡上只能搜索到公開發表的信息,并且數據往往也不完整,有較大的局限性。
(二)與企業合作獲取數據
企業因為自身性質或發展的需要,往往會存儲龐大的用戶數據,例如:滴滴出行目前擁有3億乘客和1500萬司機的出行數據,將這些數據挖掘分析之后就能制作出精良的數據新聞。近年來媒體在報道有關民眾出行的新聞選題時會常常與相關的企業合作。一方面隨著定位技術與云端技術的不斷發展,像百度地圖、高德地圖、滴滴出行可以提供定位與出行服務的公司崛起,人們的出行和位置信息能夠被保存與利用;另一方面,人們出行的新聞成為這幾年新聞報道的一大亮點,因其貼近生活而能受到廣大民眾的關注,因此媒體與企業合作能夠為數據新聞提供強大的數據支撐。比如在2014年春節前夕,中央電視臺與百度地圖合作,使用人口流向的可視化報道方式向觀眾展示了中國人的春節“遷徙”圖,報道方式令人耳目一新。
(三)收集第一手數據
對于一些適合深度挖掘的新聞事件,并且網絡、政府、企業都無法提供有效數據的時候,記者還要通過線上、線下的采訪和調查問卷獲取到第一手的數據。這種方法雖然需要大量的人力物力,但收集數據的可靠性、時效性較強,并且能夠直接錄入數據,避免了在數據整理環節的麻煩。
由于數據新聞需要以海量的數據支撐新聞的準確性,因此一些媒體會讓讀者參與到新聞的數據收集環節,幫助媒體收集或提供數據,以眾包的形式來完成數據的收集。讓讀者參與到新聞的生產過程中,不僅可以節省媒體收集整理數據的時間,而且讀者可以以自己的角度思考數據,為記者提供更多的報道方向。例如英國的《衛報》在報道2009年英國國會議員的開支丑聞中第一次采用眾包,不僅快速地完成了一幅關于議員報銷變化的全景圖,有些讀者還幫助《衛報》找到一些有趣的故事,例如“一位議員花了兩百英鎊買了一支自動鉛筆,還有一位議員報銷了印度進口的大毛毯”。正如《衛報》網站“數據博客”和“數據倉庫”前任主編——西蒙·羅杰斯說的那樣:“網絡讓數據分析變成了一個通力合作的過程,對我們而言,這意味著數據新聞報道會更加出彩、更加徹底。”①
不同類型的新聞,對數據的嚴謹性和時效性要求也有所不同。記者需要對新聞進行合理的考量,采取合適的方式進行數據收集,因此數據收集的能力是體現數據新聞記者素養的重要指標。
在收集到足夠的數據后,就要開始對數據進行分析,發現其中隱藏的新聞線索。記者可以學習使用Excel、SPSS、R等一些較為簡單的數據分析工具,先對數據進行初步的判斷,清除一些無用、錯誤的信息。如果記者還能夠熟練掌握其它較為復雜的數據分析工具、獨立進行數據的深入分析當然是好事,但記者在數據分析中最重要的便是利用自身的新聞敏感,從數字中發現問題,并且確定數據新聞的切入點。目前,在各大媒體的激烈競爭中,運用技術手段對數據進行分析往往不能形成優勢,因此如何在繁瑣的數據中找到新穎的報道角度則會為作品加分不少。在2012年倫敦奧運會結束后,各大媒體紛紛對奧運會獎牌數量進行分析報道。而英國媒體《衛報》不滿足于僅僅對獎牌數量和排名進行解讀,而是將GDP、人口以及參賽規模等因素與最終獎牌數結合在一起,制作了《2012倫敦奧運會另類獎牌榜》,使體育賽事與各國的國情聯系在了一起,切入角度十分新穎。因此,記者在數據分析的環節中,最重要的任務是以記者的角度尋找線索,而不是成為數據分析的專家。
另外,由于新聞記者多是文科背景出身,對于統計學大多沒有系統的學習經歷,因此在初步分析數據的過程中會忽視一些問題而導致結果出錯,也就是會掉入“數據陷阱”中,常見的數據陷阱有:相關不等于因果、數據源使用不當、忽略數據背景和遺漏方法論。②在2010年,英國《衛報》基于391000份伊拉克戰爭記錄制作了交互式的數據新聞,地圖上的每一個紅點代表此地發生過交戰,點擊紅點就會出現此次交戰的過程已經傷亡人數。這則新聞的構思、對龐大數據量的分析以及可視化設計方面都表現突出,但之后也有人質疑數據的真實性,因為數據源是來自于美國軍方重大行動數據庫SIGACTS,而因為當時在軍事行動中沒有專門的組織記錄傷亡人數,并且戰事激烈,美國和伊拉克雙方都不會再去仔細核實數據,因此最終結果無法還原真實情況。
一個數據新聞記者不僅要有扎實的采編能力和收集數據的能力,還能夠對數據進行基本的分析,如果再要承擔可視化的工作必然十分困難。況且可視化又是一個全新而又十分復雜的領域,但這并不意味著記者可以對可視化一竅不通。因為在可視化的制作過程中,記者需要與設計人員進行充分的交流,商定出最合理的可視化方案來呈現新聞。中國傳媒大學新聞傳播學部新聞學院教授沈浩曾說過:“在跟媒體朋友的交流中我們了解到,數據新聞在媒體內部的實踐過程中,經常遇到的問題是團隊內部成員之間,由于知識背景不同導致交流出現障礙,無法理解對方的想法和意見。”③因此,數據新聞記者應在學習和實踐中不斷提高自己對設計領域的了解,在交流環節能夠讓可視化風格適應整體的新聞策劃,或是為得到更好的可視化效果而對新聞故事進行調整,最終設計出風格一致、結構清晰的作品。對于一些只需簡單進行可視化包裝就可說明問題的選題,記者可以嘗試自己獨立完成,在實踐中提高對設計的認識。
在數據新聞剛剛崛起的時代,記者成為數據新聞領域的全才固然好,但對素質的培養應有“孰輕孰重”的觀念。記者首先能夠采取合適的方式,高效地、準確地收集到數據,成為數據收集領域的專家;其次,記者還能以獨特的視角觀察數據、分析數據,尋找最佳的新聞切入點;最后,記者對可視化領域也要有所了解,從而能夠與團隊內的其他成員相互溝通、相互學習。
注釋:
①西蒙·羅杰斯.數據新聞大趨勢:釋放可視化報道的力量[M].中國人民大學出版社,2015:228-229.
②王瓊.數據新聞與數據素養[J].中國傳媒科技,2016(1).
③沈浩,談和,文蕾.“數據新聞”發展與“數據新聞”教育[J].現代傳播(中國傳媒大學學報),2014(11):139-142.
(作者系蘇州大學鳳凰傳媒學院本科生)