□文│劉銀娣 曹承資
(作者單位:華南理工大學新聞與傳播學院)
記者從這個職業產生伊始就開始將數據運用到自己的新聞作品中,不過在很長的一段時間內,其都只是人工運用社會科學統計方法處理數字,再將數字整合到新聞故事中,作為其發現事實和作出評論的依據和支撐。20世紀中期的計算機技術革命拓展了這一新聞形式,記者可以借助計算機處理更多更豐富的資料,這種新型的報道方式被稱之為“計算機輔助報道”(Computer-Assisted Reporting,簡稱為CAR)。[1]梅耶·埃略特·賈斯平(Meyer Elliot Jaspin)和菲利普·梅耶(Philip Meyer)則稱其為“精確新聞學”,包括在“全面的數據采集和采樣實踐活動,審慎分析以及對分析結果的清晰直觀呈現”。[2]到了21世紀,呈幾何倍數成長的數據量則從根本上改變了計算機輔助報道的范圍,數據挖掘和分析技術的便利性和易學性也進一步提升了記者計算機輔助報道的能力,由此也產生了一個新的名詞:數據新聞。
數據新聞并非一個新的概念,它與計算機輔助報道一脈相承,然而前者更強調計算機在新聞報道中的“工具價值”;后者則強調“數據”在新聞報道中的“本體價值”,對數據的處理和分析不僅是新聞報道的“工具”,而且是新聞報道的“基礎”,強調讓數據處理和呈現貫穿整個新聞工作流程,反映數據化的社會現實和背景,而非作為“事實”和“觀點”的“佐證”,其概念的內涵和外延比計算機輔助新聞報道更加廣闊。[3]數據新聞拓展了新聞來源,增強了新聞記者的獨立性。同時,這種新聞形式還強化了新聞行業的權威性,重塑記者和新聞報道的公信力。除此之外,數據新聞生產的開放性還改變了新聞客觀性的實現形式,增強了新聞報道的透明性,它是信息傳播技術真正融入新聞行業的成果,豐富了新聞的報道范圍和呈現形式。
新聞來源,即新聞材料的出處和供應新聞材料的媒介,是新聞的重要組成部分,交代新聞來源是西方國家新聞媒介發布新聞的基本要求之一,我國也已有相當一部分新聞,尤其是重要新聞都會交代新聞來源。在特定的情況下,新聞來源甚至比新聞本身重要得多。[4]而數據新聞之于新聞行業最重要的核心價值之一就是拓展新聞來源,增強了新聞記者的獨立性。
正如杰里 ·維曼(Jerry Vermanen)在《數據新聞手冊》引言中提到的,“在這個信源數字化的時代,記者可以而且必須更接近信源”,數據新聞可以幫助新聞機構“尋找獨特的故事(而不是從通訊社獲得)和執行看門狗的功能”。[5]如前所述,在計算機技術滲透到新聞行業以前,數據更多的僅被看作新聞的補充和證明材料,而非獨立的新聞來源。在很長的一段時間內,因為沒有獨立、客觀的新聞來源,記者和新聞媒體在新聞報道的過程中其實是處于被動和從屬地位的,因為“新聞的內容主要是新聞來源提供的準備好的信息”“記者只不過是接受了其他傳達者傳達的信息,并利用各種引語形式把其他傳達者的話語轉換成了自己的話語”。[6]換言之,新聞來源才是新聞的話語主體。因此,新聞報道的并不一定是事實,只不過是由新聞來源所決定和展現的事實。直到計算機輔助報道技術出現后,記者開始不斷探索和擴展如何運用數據去完成報道、了解讀者以及評估新聞報道的影響,這一方面拓展了新聞來源,另一方面,這種融合了數據的新聞報道形式的不斷變革,也讓記者逐漸擺脫了對傳統新聞來源,包括記者采訪、通訊社發稿、資料供應社發稿等的依賴和控制,增強了記者的獨立性。正如卜衛總結的:“每一種新聞報道形式的變化實質上都在追求擺脫新聞來源的控制,強調記者報道的獨立性和系統性。”[7]植根于大數據背景下的數據新聞則更是為我們打開了另外的方向:一方面,通過經常瀏覽新聞報道的應用程序編程接口(Application Programming Interface,API), 可 以讓我們直接獲取一手的數據主體信息;另一方面通過挖掘大量的公開的用戶行為數據、企業數據和政府數據,可以以一種比記者采訪以及傳統通訊社、資料社向我們提供新聞來源更加客觀、真實和便利的方式來發現和傳遞未經過濾的信息。將數據用作新聞來源并不會消除記者驗證事實,理清新聞背景、評估新聞價值的需要,恰恰相反,其會增加這方面的需求,而這也正好可以增強記者審查事實、講述新聞故事的獨立性。
新聞學是一門理解和解釋“事實”的科學,強調的是對新近發生事實的報道。事實是新聞的核心,新聞行業的權威性正是來自于為大眾過濾信息,發現和呈現真正有價值的事實信息,讓大眾在通過新聞媒體了解社會事實之后,不用再耗費精力查閱其他資料來辨別信息真偽和價值,有效減少大眾發現有價值的事實信息的成本。然而,計算機和互聯網技術的出現和普及則不僅給我們帶來了信息超載的問題,還使得傳統的知識過濾機制失效,人人都能在網絡上發出聲音,哪怕他公布的事實多么經不起推敲,他的觀點多么滑稽可笑,我們充斥在布滿謠言和流言的世界里,我們的注意力被龐大的信息海洋淹沒。[8]而數據是事實的一種特殊的存在方式,用數據化的事實說話,比用一般的事實,例如采訪、資料供應者發稿等更令人信服。正如卡迪夫大學(Cardiff University)新聞學教授理查德·薩姆布魯克(Richard Sambrook)寫道:“在懷疑主義盛行的時代,社會充斥著對實證引導的新聞的需求。人們更愿意去相信那些通過數據收集和分析發現的新聞故事,更愿意閱讀那些通過數據來呈現的新聞事實,過去簡單的以個體采訪、個體觀點或假設為來源的新聞已經無法得到受眾的信任,因此,我們非常需要借助科學實證方法生產更接地氣的新聞。[9]整合數據處理、新聞敘事以及可視化和多媒體呈現技能的數據新聞則在將人們與更負責任的信息聯系在一起方面發揮著至關重要的作用。當人們在信息海洋中,為了如何辨別信息真偽,如何建立獨立、理性、客觀的觀點而不知所措時,數據新聞在某種程度上為我們揭穿偽科學、宣傳、誤導以及網絡謠言提供了一種讓人更加信賴的方式。正如黃色新聞、小報為更嚴謹、客觀的新聞品牌,例如《衛報》《紐約時報》《華盛頓郵報》等創造了市場機會一樣,而今魚龍混雜的媒體環境也為專業新聞機構數據新聞的發展和新聞公信力的增強創造了機會。當然,如前所述,數據并不意味著真理,在數據的海洋中,也充斥著大量人為創造或篡改的偽數據、有偏差和缺陷的數據,這些數據可能因為我們的無知或不負責任而歪曲了事實,誤導了大眾,即使是真實有效的數據,也可能因為采用了不當的數據處理方法和技術而被歪曲,還可能因為不完整的數據呈現或誤導性的數據可視化設計,掩蓋事實真相。因此,審查以及公開數據和數據處理方法就顯得尤為必要。“政治真相”(PolitiFact)、“衛報數據博客”(Guardian Datablog)等數據新聞組織就已經采用了比之前任何一個時代更細致、審慎和公開的方式認真核查事實,力爭用數據說“真話”,以確保數據新聞的權威性和公信力。
客觀性是新聞業的基本準則,媒體發布的新聞信息應以事實為基礎。然而事實不是靜止不變的。尤其是在眾聲喧嘩的時代,我們的事實存在于一個相互連接的網絡內,文章需要鏈接到數據來源,讓所有的人都可以公開獲取、驗證,據此來解決我們的分歧。因此,隨著數據和算法越來越深入地嵌入到新聞信息的收集、策劃、挖掘、展示和優化方面,對于新聞組織而言,如何最大程度地直面其用戶,并將所有的過程和數據向其用戶公開展示已經變得越來越重要了,這不僅集中體現了數字化時代的開放、共享精神,而且這種開放的生產模式將會幫助媒體建立起新聞報道的透明性和權威性,消除讀者的懷疑,更好地實現新聞客觀性的價值追求。因此,著名數據新聞記者斯科特·克萊恩(Scott Klein)指出:對于記者而言,開放記錄非常重要,而且可以說對于數據記者而言,這是最基礎的條件,因為這不僅是記者制作數據新聞的基礎,也是數據新聞獲取受眾信任的基礎。[10]這項公開發布數據的能力不會改變記者最根本的倫理和責任:在這項工作中,不是所有的數據都可以發布,特別是可能暴露新聞線索爆料者的個人身份信息或細節,將其置于危險境地的信息不可以發布。
數據新聞讓記者可以更好地將技術與新聞敘事技巧整合在一起,為我們提供和傳遞更多的社會事實,讓我們可以更好地理解我們所生活的世界。然而,對于大多數人而言,數據科學仍然是非常可怕和枯燥的,為了人們更好地理解數據及蘊藏在其背后的新聞故事,還需要通過可視化的技術去呈現數據。過去,靜態圖表一直被用于支持新聞故事,長篇新聞中的圖表是新聞故事的有益補充。在這種格式下,文本講述故事,圖表則通過數字給出更加詳細的很難想象和描述的信息。在當代媒體格局下,受眾地位和需求發生了巨大的變化,受眾注意力成為了最為稀缺的資源之一。因此,媒體不僅要向受眾提供可靠的有價值的信息,還要關注信息的可讀性和與讀者的互動性,于是出現了新聞故事傳統價值和“交互”這一新媒體流行語的混合物。從靜態圖形到動態交互圖形的過渡引起了網絡上復雜的數據可視化的流行,使得融合了數據可視化技術的數據新聞也跨過計算機輔助報道,迅速獲得巨大關注。數據新聞可視化是一種將大量數據組合成數據圖像,更直觀地展示數據及其結構關系、發現和傳播數據中隱藏的信息的一種信息呈現技術和手段。數據可視化并不是故事的附屬物,其本身就是故事。故事在啟發性非常強的可視化的幫助下變得更加重要而深刻。盡管數據可視化并不等同于數據新聞的概念,但是幾乎所有的數據新聞都需要采用數據可視化的方式去呈現。這種呈現方式豐富了過去以文字報道和簡單的圖文混合為主的新聞呈現形式,將圖表、圖解、地圖、動畫、視頻等視覺化工具整合到新聞表達和敘事中,增強了新聞的可讀性和互動性,滿足了受眾的閱讀需求。
海量數據及其處理技術的產生為整個社會生產和知識傳遞帶來了新的方法和發展機遇。數據新聞正是媒體為適應和回應信息環境的變化而作出的新的嘗試。當然,機遇和挑戰并存,一方面,數據新聞讓我們拓展了新聞來源,增強了新聞的公信力和透明性,豐富了新聞的呈現形式;另一方面新聞組織及其從業人員數據素養的缺乏、數據壁壘和數據獲取的限制又給記者的工作帶來了很多困難。目前,數據新聞已經成為各個新聞組織競相發展的方向,新聞組織和從業人員數據技能訓練和數據素養的培養也逐漸提上日程。然而,筆者認為數據新聞并不會完全取代傳統的新聞報道,只會成為新聞的重要分支。在發展數據新聞的過程中要避免跌入“技術中心”的陷阱,注意數據新聞的基礎是“數據”,然而其核心卻是“新聞”,處理數據是基礎、是手段,將數據轉化為能夠引起讀者閱讀需求的新聞背景和新聞故事才是數據新聞的最終目標。從數據中發現新聞故事并不會降低對新聞敘事技巧的要求和對新聞核心理念的堅持。相反,因為數據是社會建構的,為了理解數據集,我們更需強化對人文素養和新聞敏感性的培養,以更好地理解那些創造這些數據集的人及發生在他們身上的新聞故事。
注釋:
[1]Tow Center for Digital Journalism. The art and science of data-driven journalism[EB/OL].http://www.internews.org/sites/default/files/resources/Tow-Center-Data-Driven-Journalism.pdf
[2]Philip Meyer. The New Precision Journalism[M].Bloomington: Indiana University Press, 1991:7
[3]Nick Diakopoulas. The Rhetoric of Data[EB/OL].[2016-9-11] http://towcenter.org/blog/the-rhetoric-of-data
[4]程曼麗,喬云霞.2012新聞傳播學辭典[M].北京:新華出版社,2012:32
[5]Jonathan Gray,Liliana Bounegru,Lucy Chambers.Data Journalism Handbook[EB/OL].http://www.datajournalismhandbook.org/1.0/en/
[6]曾慶香.大眾傳播符號:幻象與巫術[M].北京:中國廣播影視出版社,2012:100-103
[7]卜衛.計算機輔助新聞報道——信息時代記者培訓的重要課程[J].新聞與傳播研究,1998(1)
[8]戴維·溫伯格.知識的邊界[M].胡泳,高美譯.太原:山西人民出版社,2014:17
[9]Richard Sambrook.Journalists Can Learn Lessons From Coders in Developing the Creative Future[EB/OL].http://www.theguardian.com/media/2014/apr/27/journalistscoders-creative-future
[10]Scott Klein. Journalism: Or, How Big Data Busted Abe Lincoln[EB/OL].http://gizmodo.com/how-big-data-bustedabe-lincoln-1692001519