董衛民,吳坤玉,2
(1.浙江傳媒學院新聞與傳播學院,浙江杭州310018;2.中國海洋大學管理學院,山東青島 266100)
一般認為,數據新聞(Data Journalism)是由精確新聞(Precision Journalism)發展而來。精確新聞在20世紀60年代興起于美國,其實質是把新聞采訪報道活動等同于科學研究,通過問卷調查、內容分析等手段,以數據驗證事實,確保新聞報道的社會責任。在精確新聞之前就有“計算機輔助新聞報道”的提法和做法,即以20世紀50年代計算機技術應用為基礎,使用計算機輔助收集、處理信息的新聞報道方式。直到20世紀90年代中后期,運用計算機技術進行數據檢索、參與制作新聞,始終是新聞生產的一個重要輔助手段。
2010年8月,阿姆斯特丹首屆國際數據新聞園桌會議將數據新聞界定為“通過反復抓取、篩選和重組來深度挖掘數據,聚焦專門信息以過濾數據,可視化地呈現數據并合成新聞故事。”[1]數據新聞還有一個廣為人知的名稱,叫做“數據驅動新聞”(Data-Driven Journalism)。2011年,在倫敦Mozilla 大會(Mozilla Festival)上,來自多個新聞機構的數據新聞倡導者及業余愛好者共同編撰了《數據新聞手冊》(DataJournalismHandbook),將專家們對于數據新聞的理解及各媒體所做過的嘗試都寫于該手冊中。美國的一些知名高校,如斯坦福大學、哥倫比亞大學等紛紛開設數據新聞、新聞可視化報道方向的專業或課程,數據新聞的內涵基本被界定為“運用計算機程序對事實材料和統計資料進行采集、分析和呈現的量化報道方式,也指一種通過上述方式生產的新聞品類”[2]。可以看出,數據新聞是在數據開放基礎上,以數據抓取、分析為驅動,以嚴謹的新聞敘事邏輯、恰當的可視化呈現方式,實現服務公眾利益的創新型新聞報道方式,它既是大數據時代新聞報道新方式,也是新媒介生態下的新聞生產新形態。
與西方數據新聞以主流紙媒為生產主體不同,中國數據新聞生產是以商業網媒,如搜狐、新浪、網易、騰訊,以及新華網、財新網、澎湃等傳統主流媒體旗下的網絡媒體為主體。以數據挖掘和信息可視化技術發展為參照,中國數據新聞演進路徑非常清晰。
數據新聞在中國的興起同樣可以追溯到精確新聞。1984年9月27日,《新聞記者》雜志刊登署名丁凱的《精確新聞學》一文,“精確新聞學”由學界引入并逐步引發業界的關注和嘗試。1996年1月3日,《北京青年報》將其新聞報道《1995年,北京人你過得還好嗎?》冠上“精確新聞”之名,該報道圍繞一個話題,以圖表數據、專家評論、抽樣調查等手段為支撐,挖掘新聞背后的深層價值。1997年8月16日,央視《中國財經報道》欄目推出“每周調查”,電視媒體的“精確新聞”生產由此起步。2000年后,精確新聞式微,大數據時代開啟,但精確新聞理念與生產實踐推動了高校傳媒類專業對學生數據素養培育的重視,問卷調查、數據分析等社會科學研究方法也被引入新聞教學中。2010—2012年,計算機輔助新聞(Computer-Assisted Reporting)和數據庫新聞(Data Base Journalism)增多,兩者分別從工具輔助和內容創新角度推動了中國數據新聞的發展,比如財新網于2010年創建數據新聞欄目“數字說”,2011年搜狐推出“數字之道”;其他如網易的“數讀”、新浪的“圖解天下”、騰訊的“數據控”等以靜態圖表呈現數據信息,拉開數據新聞本土化實踐帷幕;紙媒如《南方都市報》《新京報》等,也紛紛嘗試以數據可視化手段報道新聞。
2013年,《紐約時報》的數據新聞產品《雪崩》引發廣泛關注。在數據挖掘、可視化技術加持下,中國也迎來數據新聞快速發展期。新華社于2013年成立新華網多媒體產品中心數據新聞部,并于同年推出“據說新聞”。之后,以財新網為代表的數據新聞生產在國內“異軍突起”。2013年10月8日,財新網成立財新數據可視化實驗室,結合新聞編輯和數據研發將數據應用于新聞采編,打造“數字說”頻道,先后推出《三公消費龍虎榜》《星空彩繪諾貝爾獎》《中東地區的敵友關系》《曼德拉的世紀人生》《“十八大”后落馬高官一覽》等重磅數據新聞產品。其《青島中石化管道爆炸事故——財新記者實拍圖集》報道榮獲2014騰訊傳媒大獎年度數據新聞亞洲出版業協會(SOPA)“2014年度卓越新聞獎”,成為當時國內數據新聞標桿產品。2014—2016年,數據新聞生產發展依舊可圈可點,比如央視于2014年1月推出“據說”系列報道,于2015年推出《數說命運共同體》;新華網的《據說新聞》欄目獲得第25屆中國新聞獎新聞名專欄獎。因注重用戶交互體驗,突出場景化和細節設計,數據新聞之數據開始走向“主體化”——成為新聞報道中被呈現的內容主體。
2017年之后,數據新聞降溫,但是這種降溫也被學者解讀為回歸理性,因為從這個時期開始,“國內的數據新聞報道開始專注于數據本身和內容深度,有些數據新聞還做成了‘特稿’的形式,各家媒體也開始有了各自的風格。媒體產品的生產者開始思考,究竟什么樣的主題和線索適合使用數據新聞進行表達”[2](23)。2020年,數據新聞在抗擊“新冠疫情”報道中再一次引發關注,比如,澎湃的《圖釋兩千年傳染病史:若瘟疫無法被根除,該如何與之相處?》,數可視的《疫情何時能結束?人類戰“疫”史的這些數據或許能給你些線索》,上觀的《87例沒有“湖北接觸史”的人,他們是怎么感染上新冠肺炎的?》,DT財經的《返工潮之下,哪些城市面臨最大的疫情防擴壓力?》及北京大學可視化與可視分析實驗室的《疫情方寸間》等產品,對抗擊“新冠疫情”進行了數據化、可視化及交互性報道;其中“交互性報道”的增強,進一步提升了用戶對數據新聞良好的閱視體驗,“數據抗疫”也成為中國互聯網新聞發展史上的重要一頁。
“所有的新聞報道都是故事”[3],新聞與世界發生關聯不僅靠信息內容,還要有一個能夠把信息融入新聞常規的合適形式,或者說敘述規制,這個規制最合適不過的就是故事。每一種新聞形態都有自己獨特的新聞敘事常規,與傳統新聞敘事常規不同的是,數據新聞以“數據”講故事——在數據驅動下以可視化方式講述一個個“復雜并接近真相的故事”[4],變革了傳統新聞內容生產及其敘事模式;它以海量數據信息結合獨特敘事技巧,用“數據故事”再造新聞與世界的關系,最終以新的知識生產形態塑造大眾對生活和世界的認知。與傳統新聞形態相比,數據新聞的創新向度主要體現在新聞內容、敘事模式及知識生產的創新轉向。
作為科技產物的大數據,既是經濟現象,更被解讀為社會文化現象。美國學者路易斯(Seth Lewis)和韋斯特蘭(Oscar Westlund)從大數據作為社會文化現象的角度,認為在提升計算能力、算法精度及利用數據挖掘模式做出經濟、技術、社會判斷的基礎上,“大數據帶有真理、客觀與準確的光環,它能夠提供更高層級的智能和知識,能夠產生此前人類無法獲知的洞見”[5]。大數據與新聞“融合”,對新聞形態創新而言,首先體現在新聞報道內容上,即以數據為驅動,全面創新新聞內容生產,數據成為新聞核心元素,新聞則是對數據的結構化、知識化、故事化建構。比如,《三公消費龍虎榜》大小套疊的豎狀圖譜,任意點開就可以顯示對應機構、財務信息,各部分共同組成“機構與財務”關系網的視覺呈現,圖標內容就源自于各類數據。在歷年政府部門公布的三公消費數據基礎上,對其跟蹤展示,達到輿論監督目的,三公消費數據就成為受眾關注的新聞內容主體。
數據新聞在內容創新方面,主要體現在兩個層面:一是對數據信息深度挖掘,以及由此帶來的打破時空限制,凸顯歷時性、空間感體驗等“新”內容的生成。二是隨著數據新聞生產主體多元化,新聞媒體與互聯網公司、移動平臺企業,甚至政府機關“跨界合作”,促進了新聞內容多元化。據澎湃數據新聞主編呂妍介紹,截至2019年5月,就有包括高校、內容公司、數據持有方等80多家單位參與澎湃新聞澎客的內容生產。[6]當下的數據新聞內容生產也表現出側重描述、突出數據完整性、兼顧解釋的傾向。2020年的抗擊“新冠疫情”報道中這種傾向尤為明顯,如財新網的《境外輸入病例30天:從哪兒來?到哪兒去?歸國之路幾多曲折?》,澎湃的《763例確診患者的故事,還原新冠病毒向全國擴散的路徑》等,皆通過詳細的數據描述,滿足大眾對“新冠疫情”信息的獲取需求。
對數據新聞而言,可視化的基本含義就是借助圖形化呈現方式,實現信息的生動傳達和最大化溝通效果。無論對數據新聞如何界定,其實質都是圍繞數據抓取、清洗、分析,對尋找到的新聞點進行可視化呈現。因此與傳統新聞相比,數據新聞的另一個創新點,就是以可視化路徑創新新聞敘事模式。優先從視覺獲取外界信息,有生理科學支持,符合人類認知的生理特質。不過人類的視覺也容易出現審美疲勞,從簡單的圓柱狀、餅狀圖開始,數據新聞可視化呈現方式就在不斷突破,比如《青島中石化管道爆炸事故——財新記者實拍圖集》,將地理位置、數據地圖等信息有機組合,用黃、紅、黑分別標注損傷管道、爆炸地點、人員傷亡等,密密麻麻的各色斑點讓用戶一覽事故整體狀況,再通過點擊不同場景和閱視交互,用戶會對事故產生立體感知,彰顯了數據新聞的敘事張力。
中外新聞媒體都在嘗試數據新聞可視化且尤其注重在用戶體驗上下功夫。例如,中國國際電視臺(CGTN)制作的數據新聞產品《中國廁所革命:改善衛生和改變觀念》,用游戲輔助用戶理解“廁所革命”,可以說是以趣味設計來召喚用戶。又如英國《衛報》的數據新聞產品《這八張圖標幫助解釋為什么聯合政府贏得2019年澳大利亞選舉》,其可視化圖表分別利用顏色和條狀編碼不同數據,雙重設計有效規避用戶或因色覺障礙對新聞的誤讀,這種人性化操作被學者解讀為“關懷設計”[7]。可視化呈現對繁冗、巨量的數據信息進行勾陳、梳理、歸納,使其形成一個相對流暢的視覺敘事鏈,從而創新新聞敘事模式,提升闡述功能,同時亦能增強用戶的交互體驗。
作為一種社會知識生產類型,傳統新聞形態因時效性要求而呈現“轉瞬即逝”的特征,亦因孤立的事件報道而成為碎片化存在。因此,其新聞知識雖然真實,但不精確、不系統,是“片面真實”。新聞形態隨技術發展在變化,“知識社會學不應關心什么構成了正當的知識,即對原則或事實的陳述,而更應該關注不同類知識產生的情境及其功能”[5](43)。數據新聞在數據驅動下以探索新聞發生的“情境及其功能”為知識生產導向,最終得以“接近真相”。“互聯網之父”蒂姆·伯納斯·李(Tim Berners-Lee)曾提出“數據驅動新聞是未來趨勢”,認為“新聞的未來,是分析數據”。[8]從《圖釋兩千年傳染病史:若瘟疫無法被根除,該如何與之相處?》《87例沒有“湖北接觸史”的人,他們是怎么感染上新冠肺炎的?》等產品中,可以看到多方數據挖掘提供獨特報道視角、數據地圖直觀呈現帶來的現場震撼,以及歷史數據梳理出的疫情發展規律等知識圖譜。數據新聞在知識生產形態上,通過全新的技術載體,攜帶著迥異于傳統新聞生產的專業規范和敘事規制,其開放、透明的產品生產過程也為大眾參與知識生產提供了契機。
數據是數據新聞生產知識、傳播知識的根本,也是其核心競爭力,它以數據內容完整性和新聞呈現可視化,在認知向度上以交互性推動、強化其知識生產。比如,財新網的《了解你附近的“新冠肺炎”定點醫院》《新冠逝者:獻給疫情中離去的生命》等產品,用戶可以參與完善數據、補充或更正相關信息等,不僅提升了用戶體驗,也詮釋了數據新聞的開放性、透明性原則。通過分析路透社“新冠疫情”數據新聞報道,研究人員也發現,“國外媒體非常重視數據發展的歷史、趨勢、統計學分析等數據延伸出來的信息”[9]。數據新聞種種“延伸出來的信息”及用戶對這些信息的自主分析、利用乃至再生產,都以“接近真相”為導向,在認知向度上推動知識生產的創新轉向。
雖然數據新聞生產演進中不斷嘗試創新傳播,但在具體實踐中也存在一些明顯的問題,比如報道領域的“交互可視化呈現與移動端不適配”,“數據分析閱讀門檻較高;生產邏輯與傳統新聞的人文主義訴求沖突”[10],以及遭遇數據壁壘、數據質量不高、生產投入大、新聞價值不確定等都制約著數據新聞的可持續發展。未來數據新聞的發展應當以打破“數據壁壘”,構建數據專業主義為導向,從以下幾個路向探索突破。
數據新聞生產所依賴的首先是作為內容的數據。就新聞實踐來看,“國內數據新聞作品的報道選題分為兩大類,即以復雜的社會議題為主的調查型數據新聞和以一般社會民生與地域話題為主要報道方向的常規型數據新聞”[11]。無論是調查型抑或常規型數據新聞,都以巨大的數據支撐,數據的量化、清洗和分析作為詮釋事件價值的關鍵。數據來源一般有政府與非政府機構數據、商業平臺數據和媒體數據。然而,目前國內政府機構數據開放程度低、更新慢,穩定而安全的數據獲取渠道對媒體而言并不順暢。此外,每時每刻都在裂變式增長的數據多掌握在數據科技企業手里,比如百度、阿里巴巴、騰訊等。大數據一方面成為企業的平臺資產,另一方面,公眾的隱私權意識在提升,新聞媒體獲取數據愈發不易;再者,媒體自身的數據生產能力不足。這些因素導致數據源單一、結構單一,嚴重制約著數據新聞的外部發展空間。
在當下媒體融合轉型態勢下,數據新聞既是新聞媒體制作高質量報道的專業訴求,也是其保持競爭優勢的重要抓手。澎湃數據新聞主編呂妍就認為:“真正發展到最后,還是要尋求數據驅動報道和調查性數據新聞,才能夠在整個媒體機構里面站住腳。”[6](24)如何在技術和政策驅動下打破“數據壟斷”,推動數據新聞選題空間拓展,破解以話題為主的選題現狀,使調查型和常規型數據新聞生產平衡協調,滿足用戶多層次信息需求,規避數據新聞因技術含量大、專業性強、解讀門檻高而導致的“精英化偏向”,是數據新聞未來發展的重要路向。
數據新聞以敘事單元架構故事,不同敘事單元都是用戶出入的途徑,打破線性閱視的敘事束縛,用戶獲得全新閱視賦權;而且數據新聞敘事主體也不再完全受制于編輯室,用戶可以從不同路徑進行多線性交互瀏覽。但目前國內數據新聞可視化仍以圖解數據居多,交互性不強,即使如《圖釋兩千年傳染病史:若瘟疫無法被根除,該如何與之相處?》這樣的近期產品,依然存在這樣的缺憾。因此,依托新技術應用,推進高交互可視化,是數據新聞未來發展另一個重要的著力方向。
數據可視化簡單說就是把數據圖表化、圖像化,使信息的傳播與溝通更加高效、便捷,利用人的視聽感知系統識別圖像,以減輕受眾對新聞信息的認知負擔。[12]與傳統新聞相比,數據新聞的原始信息不再是文字,而是數據。數據成為新聞敘事主體,可視化則成為數據新聞基本敘事手段和意義闡釋載體。作為訴諸視覺語言的信息與意義呈現手段,可視化為新聞消費者在碎片化、海量化信息中找尋、匯集有價值的信息鏈提供了清晰、直觀的速達路徑,也為其認知信息情境開辟出迥異于傳統新聞的視覺空間,提供嶄新的感知體驗。融媒體時代,作為新聞體裁創新成果的數據新聞,互動性可視化是其至為重要的創新所在,因為“互動性‘數字核心型’可視化報道不僅更具有視覺上的吸引力,而且通過對交互性元素的設計和融入使受眾成為主動的信息挖掘者”[13]。所謂“互動性‘數字核心型’可視化報道”,即數據新聞可視化。未來數據新聞發展的一個重要方面,即在于推動數據呈現和表達從早期的靜態信息圖表、當下的動畫短視頻動態信息圖轉向交互式信息圖,使用戶參與到數據信息分析、解讀,直至新數據生成及意義生產中,從而在交互敘事中重建新聞闡釋語境。
即將到來的智能媒體時代,是以視覺圖像為中心的時代,媒介載體更加傾向于使用圖像、圖表、動畫等可視化形式敘述事實、傳遞信息。[14]作為技術與媒體結合的產物,數據新聞未來的高交互可視化發展,則需要在智能化加持上進行突破。比如。隨著移動智能終端普及,數據新聞的呈現經歷短視頻、動漫及H5形式嘗試之后,在5G技術和人工智能推動下,AI、VR、AR等智能技術與設備也會在交互性可視化探索中,發揮智能科技的推動作用,使其新聞結構和敘事能力更加貼合受眾,以智能化的現代“圖式”提升新聞用戶的閱視體驗。對此,學界、業界均有思考和實踐。比如,學者李本乾認為:“人工智能技術將對數據內容帶來革命性的改變,比如用人工智能的方法抓取數據、分析數據,并進行內容推送。”[15]業界方面,比如,前財新傳媒首席技術官(CTO)、財新數據可視化實驗室創始人黃志敏就認為,在一個大的媒體生態或框架中,數據新聞“應該叫智能媒體的一部分。所以,它未來的發展肯定不僅僅是采訪寫稿等,它可能會跟很多的技術相結合,包括機器學習、機器寫作等”[6](24)。2021年7月5日,澎湃新聞總裁、總編輯劉永鋼在一場對話中提出:“媒體要越來越智能化,越來越交互化,越來越輕量化、可視化。”[16]數據新聞對智能化技術的加持,不僅能夠強化用戶的新聞接收體驗,也會在數據視頻化轉向和新聞產品個性化交互提升上帶來突破,使新聞交互更加具有真實可感性,為視聽數據帶來全新的生產方式和更加豐富多樣的產品形態。從這個角度來說,智能化是數據新聞未來發展的新路向。
如前所述,知識社會學“關注不同類知識產生的情境及其功能”。作為知識生產類型之一的數據新聞發端于精確新聞,開源、開放數據運動為其提供政治和文化土壤,計算機技術為其提供存儲和分析工具,大數據則為其提供生產材料,三者共同構成數據新聞生產的“情境”。這些“情境”決定了數據新聞的知識生產是量化、精準、可檢驗,即科學的。然而,大數據時代的數據處理有“要全體不要抽樣,要效率不要絕對精確,要相關不要因果”等特點,如何對數據進行科學呈現和解讀,就成為重要的數據新聞倫理規范。
因此,數據新聞未來發展當以知識生產的科學“情境”為依托,建構數據專業主義。具體可以從三個方面作思考與規劃:一是打造數據生產專業團隊,培養數據分析能力與敘事能力兼具的復合型人才,以打破傳統新聞與數據新聞之間的“數據溝”,在數據新聞科學性、故事性與交互性上實現突破。二是提升新聞生產主體的專業理念,使其能夠迅速捕捉數據背后的新聞價值,對數據進行深刻性解釋而非“模糊化”處理,在技術性表達和新聞性追求上保持平衡,以避免信任危機。三是抓住“媒體深融”的政策利好和技術迭代機遇,搭建高質量數據庫(或數據平臺),以穩定、安全的數據獲取渠道保障數據新聞生產的自主性、科學性和可持續性,在重大突發事件后續報道、調查性報道的數據推導和智能交互上進行結構性變革。
“大數據的核心就是預測。”[17]在既有的新聞認知和實踐經驗上,先有事實、后有新聞,新聞是對“已經和正在發生事實”的記錄、傳播與闡釋等理念,已成為主導新聞生產的基本“法則”。但是,數據新聞的產生沖擊了上述“法則”,這種沖擊主要體現在預測性報道的“復蘇”。隨著數據新聞的深入發展,預測性報道也愈發引起學者關注,早在2014年就有學者提出“未來越來越多的深度報道和調查性報道將由數據驅動,或者是基于大型數據挖掘與分析而對事件發展趨勢的預測性分析”[18]。還有學者通過與傳統預測性報道作比較,認為大數據帶來的思維轉型在海量數據和強大計算能力基礎之上的相關性分析法,至少在三個向度上重構了預測性新聞(報道),即在預測方式上,“具有更加準確和快捷特點”。在預測時間上,“把處于未來某個階段的事件與當下連結起來,使預測的事件回歸到新聞本質”。在預測內容上,“可以包含與人類活動相關的所有事件”[19]。而在新聞生產實踐領域,中國的央視、英國的《衛報》等,也已經在借助互聯網平臺及媒體自身數據庫的數據采集和分析能力,探索數據驅動下的深度報道和預測性報道的嘗試。
在全數據采集基礎上,預測性報道以算法模型為科學依據,通過深度數據挖掘和關聯分析,可以實現超越實際經驗范圍,預測報道新聞事件的發展、變化規律。尤其是在交通、天氣、體育賽事、政治選舉、就業、經濟走勢、疾病防治等方面,預測性報道已經有許多成功案例,比如,谷歌公司對流感的預測、百度數據團隊的“世界杯預測”等。當下尤其在突發公共衛生事件,如新冠肺炎疫情報道上,預測性報道大多通過事件走向預測,對公眾抗疫提供幫助,比如,紐約時報的《冠狀病毒爆發將有多嚴重?關于新型冠狀病毒的6個要點》《用圖表告訴你冠狀病毒將會惡化多久》;看看新聞的《疫情何時能結束?人類戰“疫”史的這些數據或許能給你些線索》等,都體現了數據新聞預測性報道的“前瞻性”預判。據此可知,數據新聞的預測性報道不僅擔負起了傳統新聞的“環境監測與瞭望”使命,更在數據敘事和高交互可視化驅動下,把“環境監測與瞭望”的新聞職責、媒體使命提升到了風險預測和社會治理的新境地,這也將是未來數據新聞發展的另一個值得期待的重要向度。
美國新聞評論家和作家沃爾特·李普曼(Walter Lippmann)認為:“只有當社會狀況達到了可以辨認、可以檢測的程度時,真相和新聞才會重疊。”[20]美國知名社會學家、新聞研究者邁克爾·舒德森(Michael Schudson)對此這樣闡釋:“如果社會事件都是自發隨機出現的,都能公平地代表‘隱藏的事實’,那報紙只要報道一下新聞就完全可以了,還會覺得自己為社會作了重要的貢獻。但如果事件本身就是有權有勢的個人和組織人為制造的,那簡單的新聞報道不僅無法完整揭示真相,還會呈現出一個扭曲的現實。”[21]因此,從新聞發展史角度看,數據新聞的史學價值主要體現在兩個方面:一是以數據發掘、清洗和分析,把新聞報道向“真相”推進;二是數據的可檢測性、呈現方式的可視化、接收的可交互性,把新聞對事實的“辨認”“檢測”程度提升到科學化、制度化的程度,從而“逼近”真相與新聞的“重合”。當下數據新聞尚難到達“真相與事實重合”,其原因除了數據開放制度不健全和數據保護主義導致數據管控方提供數據的“偏向性”“自利性”外,媒體對引用數據的高度依賴,也造成了數據操控者對新聞生產的“價值滲透”,甚至“數據霸凌”致使數據難以支撐新聞的真實傳達,無法與公眾建立互信。
數據新聞隨數據開放而來,攜帶技術基因,在智能化、5G加持及媒體融合“情境”下,也會獲得新的發展機遇。因此,數據新聞生產未來發展要在提升數據素養,培育數據發掘、可視化制作團隊,推動新聞敘事范式“數據化”“科學化”轉向的同時,借助媒體融合契機,觸摸資本市場的突破邊界并在新技術加持下搭建媒體自有的數據平臺,建構數據專業主義下的新聞生產新規制、知識生產新范式,最終推動數據新聞生產走向“真相與事實重合”之境。