(四川師范大學 新聞與傳播學院,成都610066)
2013年被稱為大數據(Big Data)元年。在談到大數據的革命性影響時,哈佛大學定量社會研究所主任加里·金(Gary King)認為:“龐大數據源帶來的定量化的方法,將橫掃商界、學界和政界,所有領域都將被觸及。”[1]9
大數據對信息傳播的影響,產生了一種新的新聞信息傳播形態——數據新聞(Data Journalism),這也是融合傳播(Convergence Communication)在大數據時代的傳播新模式。什么是數據新聞,它與融合傳播有什么關系,其傳播流程怎樣,將如何改變記者的傳播角色?本文將結合國內外數據新聞傳播實踐,從融合傳播的角度進行研究和分析。
數據新聞與“精確新聞”、“計算機輔助報道新聞”等概念,存在承接和遞進關系。精確新聞(Precision Journalism)最早可以溯源到20世紀50年代,美國記者利用計算機對當時美國數據庫中的信息進行分析。60年代,美國學者菲利普·邁耶(Philip Meyer)提出精確新聞概念,出版了著作《精確新聞——一種社會科學報道的理論》,主張將社會調查方法應用到新聞傳播實踐,提高信息傳播的科學性、真實性和客觀性。70年代,這種信息傳播的理論和方法風行美國,后傳遍世界各國。80年代,中國新聞界開始運用這種方法傳播新聞信息。精確新聞在信息傳播中往往依靠數據來提高準確性,而數據的獲得在當時主要還不是依靠計算機,民意測驗、問卷調查等是常用方法。
正是由于計算機、數據存儲等技術條件限制,精確新聞在新聞信息傳播中并未得到大范圍運用。計算機輔助報道新聞(Computer-Assisted Reporting,簡稱CAR)的出現開始改變這種狀況。作為從精確新聞到數據新聞的過渡,CAR是隨著電腦普及和存儲數據技術的提高逐漸興起的,與數據庫漸漸成為新聞記者發現新聞信息線索的重要來源有關。盡管計算機幫助記者搜集分析數據,但是CAR對新聞信息生產流程和傳播方式并未產生重大影響。
進入21世紀,在全球化背景下,互聯網等新媒體和云存儲等新技術快速發展,為數據新聞出現提供了技術條件。目前,國內外學者對數據新聞的定義,比較認同的是歐洲新聞學中心(European Journalism Centre)和開放知識基金會(Open Knowledge Foundation)共同開發的《數據新聞學手冊》(TheDataJournalismHandbook)所下的定義:簡單來說,就是用數據來報道新聞,它為記者將傳統的新聞嗅覺與運用規模龐大的數據信息結合起來報道新聞創造了可能[2]2。數據新聞是一種新的新聞信息生產方式,改變了傳統意義上的新聞信息生產流程。信息的采、寫、編都離不開數據,從開始的數據發現到中間的信息制作、最后的信息呈現都是如此。從精確新聞的提出,到數據新聞的發展,實際上都體現出社會技術背景與新聞生產的意識和理念之間的互動[3]。
盡管數據新聞已被《衛報》、《華盛頓郵報》、BBC、CCTV等國際主流媒體使用,但是作為一種新的信息傳播形態,其傳播實踐和理論研究還處于起步階段。正如哥倫比亞大學陶氏新聞中心主管埃米莉·貝爾(Emily Bell)所言:“大部分的新聞編輯室仍不了解數字科學的發展前沿、傳播信息及其對信息使用者的影響。我們想倡導那些具有這些領域相關技術的人才,以及對新聞學充滿熱情、具有相關知識的人才進行研究或者提出設想。這不僅有利于解讀這個世界,還能為新聞學在這個復雜多變的領域里提供指導。”[4]
美國陶氏基金會(Tow Foundation)與約翰·奈特基金會(John S. and James L. Knight Foundation)2012年4月30日宣布,他們將提供200萬美元來資助哥倫比亞大學新聞研究院,旨在支持哥倫比亞大學數字新聞學陶氏中心的研究工作,主要專注于以下三個方面:一是影響,衡量新的實踐及工具如何影響聽眾及新聞編輯室資源;二是新聞信息的透明度,關注公共數據——哪些是可用的,哪些不是,哪些是有用并與人民的生活息息相關;三是數據形象化,衡量哪些形式在傳達信息與吸引讀者方面最有效[5]。2012年,國際上第一個“數據新聞獎”(Data Journal Awards,DJA)設立,由“全球編輯網絡”(Global Editors Network,GEN)發起和組織,谷歌資助獎勵,有286個項目參賽,6項獲得大獎。2013年6月,8個新聞作品從300多個參賽作品中脫穎而出,獲得年度“數據新聞獎”。
媒體融合(Media Convergence)是新媒體時代傳媒發展趨勢,“是數字技術、社會需求和產業政策共同作用的結果”[6]。報紙、廣播、電視等傳統媒體與網絡、手機等新媒體融合成為全媒體。傳統媒體的全媒體轉型基本上是沿著“內容數字化、渠道立體化、經營集團化”的思路進行擴張的[7]。如成都傳媒集團所屬報刊、廣播、電視媒體的內容均做到數字化,既可在傳統媒體渠道發布,也可在集團主要的網絡平臺——成都全搜索網站發布,傳統媒體與全搜索網站都成為集團的媒體成員[8]。丁柏銓把媒介融合分為物質、操作和理念等三個層面的融合[9]。
融合傳播是媒介融合的一種實現方式,是從傳播學的角度對媒介融合發展的概括。與融合傳播相關的概念還有融合新聞(Convergence Journalism),澳大利亞學者史蒂芬·奎恩(Stephen Quinn)2005年出版的著作《融合新聞導論》和《融合新聞:多媒體報道基礎》對融合新聞進行了研究。國內學者蔡雯認為,融合新聞又稱“多樣化新聞”,主要指利用多媒體手段進行新聞傳播活動。有學者認為,融合傳播的概念應該包括融合新聞,因為傳播的概念比新聞大。美國西北大學教授李奇·戈登(Rich Gordon)將融合傳播概括為所有權融合、策略性融合、結構性融合、信息采集融合和新聞表達融合等類型[10]184。
數據新聞體現了融合傳播的特征,這里以信息采集融合和新聞表達融合為例來加以說明。信息采集融合是指新聞從業者以多媒體融合的新聞技巧完成新聞信息采集[11]66。這種新聞技巧包括多種渠道的采訪手段,如利用搜索引擎抓取數據、采訪專家、在論壇中提問、從政府官方部門了解信息等,信息的呈現有文字、圖片、視頻等多種形態。
新聞表達融合是指記者和編輯綜合利用多媒體的與觀眾互動的工具與技能完成對新聞事實的表達[11]66。數據新聞用圖表、文字、視頻等方式表達新聞事實,例如2014年春節期間,中央電視臺《晚間新聞》與百度合作,利用百度地圖定位對國內春節期間人口遷徙情況進行數據可視化報道。公眾可以在搜索欄中選擇時間、輸入地址名,查詢不同地方的人口流向。同時,為我國交通部門根據人口遷徙變化制定政策提供參考。在隨后的全國“兩會”期間,中央電視臺再次與百度合作推出《兩會解碼——兩會大數據》欄目,利用全新的立體成像技術和人機互動技術,就民眾關注的大學生就業、醫患問題、收入分配等熱點話題進行報道。
由此可見,數據新聞的傳播,與單一媒體的信息傳播不同,依靠的是多種媒介收集信息,制作出適合不同媒介特點的新聞信息,充分體現了融合傳播的特點。
數據新聞在敘事方式上,拋開了傳統的以文字講故事為中心,變為以數據傳播為中心,最大的特點在于用可視化數據傳播新聞信息。簡而言之,就是把復雜的新聞信息轉化為圖形、表格、地圖等生動易懂的形式表達出來,化繁為簡,幫助受眾更客觀科學地了解事件發生、變化脈絡。這種表達方式,使新聞信息傳播更加便捷、完整,在一定程度上體現了媒介發展的“人性化”。
提及可視化的數據,就不得不聯想到可視化的新聞敘事和“數據可視化”。可視化的新聞敘事與麥克盧漢所提出的“媒介是人體的延伸”有密切關系,人們認知世界的方式是靠聽覺、視覺、嗅覺等,而廣播、電視、報紙等媒介就是人們這些認知方式的延伸。可視化新聞敘事的出現,綜合以上感官功能,滿足了人們自然的、綜合的信息接受和傳播需求。今天,人們越來越習慣通過影像等視覺方式接受信息和參與互動,即所謂的文化或傳播的“視覺轉向”。數據新聞的可視化呈現,有效調動了人們參與新聞信息的整合與挖掘的潛能。
韓衛國等將“數據的可視化”解釋為:將大量數據組合構成數據圖像,同時將數據的各個屬性值以多維數據的形式表示,使人們能夠以更直觀的方式從不同的維度觀察數據及其結構,發現其中隱含的信息[12]。這里的數據可視化,是從科學的可視化角度分析的,與數據新聞的可視化有所區別。因為在新聞傳播領域中的可視化數據,只是一種全新的新聞信息呈現形式,可以是用可視化數據傳播新聞信息,也可以僅僅是展現數據而已。
英國《衛報》是全球第一個成立數據新聞部的報紙,其工作團隊組成人員包括:負責選題策劃的文字記者,負責收集、處理數據的數據記者,負責網頁設計、版面編輯的技術人才。工作流程大致可以歸納為:數據記者根據文字記者的選題,針對海量數據信息進行搜集,經過篩選、分析后,用圖表、地圖等形式將數據可視化,完成數據新聞制作流程。數據地圖、時間線、交互圖表,是《衛報》使用最多的可視化數據形式。在這個過程中,離不開電腦軟件工具的支持,包括用于地理定位的Google earth、用于互動式的圖表Google map等。
《衛報》的數據博客對英國騷亂的報道,將新聞報道中對大數據策略的“深”運用與借助于多媒體方式的“淺”表達結合起來[13],是數據新聞報道可視化的經典案例。發生于2011年夏的英國騷亂事件,當時政客們認為暴徒利用Facebook、Twitter等社交媒體發動的煽動性言語和組織,是導致這場騷亂的首要原因,而與貧困無關,甚至一度要求關閉社交媒體。于是,《衛報》和倫敦的政治經濟學院合作,采用數據新聞報道手段,針對Twitter上的260萬條關于騷亂信息進行分析,與英國曼切斯特大學合作分析社交媒體在暴亂中扮演的角色。《衛報》的數據小組通過一些簡圖,標出已發生騷亂的地點,然后把貧困人口的數據與發生騷亂的地點聯系起來,證明了貧困與騷亂是相關的。
在分析騷亂原因時,兩個可視化作品起到重要作用:一是一段視頻,表明已知騷亂地點與參與者家庭的聯系;二是可視化作品“騷亂中的謠言”在Twitter等網站上傳播。利用可視化手段,把一些難以描述的信息廣泛傳播,幫助受眾更好理解騷亂事件發生的起因和謠言傳播方式,為以后分析該類事件提供經驗。
《泰晤士報》可視化團隊成員包括數據挖掘師、數據記者、圖表編輯、內容設計編輯,通常的工作流程是內容設計編輯選取每一期的新聞選題,然后數據挖掘師根據選題抓取相關數據,接下來數據記者通過分析相關數據進行撰寫,形成觀點,最后圖表編輯和內容設計編輯一起制作圖表。團隊中最核心的成員是數據記者,通常由傳統媒體的記者轉型而來,需要具備撰文、制圖、分析數據的能力。
此外,《華盛頓郵報》采用地圖新聞,《紐約時報》采用可查詢的交互地圖、動態圖標、信息圖等方式實現新聞可視化。
德國之聲記者米爾科·格倫茲(Mirko Lorenz)將數據新聞傳播分為四個步驟:挖掘數據、過濾數據、數據可視化、新聞報道呈現[14]。英國伯明翰城市大學教授保羅·布拉德肖(Paul Bradshaw)依照新聞學中的“倒金字搭”理論,提出了數據新聞傳播過程的“雙金字塔”結構,如圖1[15]。倒金字塔自上而下分別為編輯、清理、情境、綜合,然后通過傳播,變成視覺化、敘事、社會化、人性化、個性化、應用化,顯示了數據新聞是怎么生產,以及經過傳播層面后怎樣對社會和個人產生影響。在倒金字搭結構中的編輯、清理、情境、綜合等可以理解成數據新聞生產過程中的數據收集、整理、分析、整合四個階段,然后通過傳播數據實現正金字塔結構中的數據可視化、社會化、個人化和定制化。

1.數據新聞的倒金字塔結構
雖然不同學者對數據新聞傳播流程說法不同,但主要包括以下三個步驟。
1.數據搜集
數據搜集是數據新聞傳播的第一個環節,可以通過以下幾種方式進行。一是利用搜索引擎在各大網站中搜索和抓取數據,如利用“關鍵字+site:網址”的方式,從海量網絡資源中尋找關于此關鍵字的信息;二是從專門的數據庫、數據中心甚至數據網站中獲取數據,例如谷歌旗下的一家子公司Freebase就是數據愛好者組成,提供人、地點等實體圖;三是從企業、政府等公開數據中抓取。
數據搜集的渠道是多元的,但必須圍繞選題進行。《衛報》關于英國騷亂的報道就是圍繞主題進行,否則收集再多數據也只是一堆廢材。
2.數據處理
這是數據新聞傳播流程中關鍵一步,決定新聞是否有效和科學。擁有海量數據,如果不會辨別數據真實性、時效性和關聯性,數據新聞就制作不出。數據記者處理數據過程中,要篩選出哪些跟選題相關,哪些是干擾性的。
布拉德肖把數據處理分為數據清洗、情境化和綜合三步驟。數據清洗是把獲取的數據轉化為可使用的數據形式,刪去重復、空白、缺損等有問題的數據。數據情景化是指數據用于一定語境中,才會有意義。數據綜合是指數據信息用各種圖表表示出來,實時呈現數據的時空分布,實現數據的整合和導航。
3.數據呈現
數據呈現是把搜集和處理后的數據,通過可視化技術,以信息圖表等形式發布。信息圖表的模式,多有規律可循,比如災害事件的信息圖表報道,一般有點狀呈現、線性呈現和平面展開三種模式[16]。數據講述故事比文字傳播生動有趣,能增加新聞信息可讀性,而數據可視化離不開Many Eyes、Flare、Dataw等源代碼數據工具的支持。
相比傳統媒體中靜態的新聞信息圖表,數據新聞的交互式信息圖表,不僅傳播大量信息,而且用戶可根據需求點擊相應新聞,挖掘數據背后深層次的信息。
盡管新媒體對于新聞選擇必要性、重要性、正當性的認定和把握,同傳統媒體在有些地方是不同的,但傳統媒體和新媒體的數據呈現,目的都是為了幫助受眾更全面立體地了解新聞事件,并利用這些數據為生活、工作和學習服務。
數據新聞是媒體適應和回應數字時代融合傳播的新嘗試,它對記者傳播角色的影響,最重要的是改變了數據獲取、分析和傳播方式。記者單純掌握傳統新聞報道的技能已經遠遠不夠,還需要把握如何利用數據尋找、分析和可視化新聞故事。記者比以往任何時候都更需要組織、驗證、綜合和解釋數據的能力,不能僅僅使用傳統意義上的文字、音頻和視頻進行信息傳播,還必須學會數據搜集、分析和闡釋,成為全能信息傳播者,具有撰寫、拍攝、編輯等技能,通文字,懂數據,既要能文,也要能“數”。
這就要求記者或者學習如何直接處理數據,或者與可以處理數據的人合作,借助數據工具分析和篩選有價值的信息。直接處理數據既包括對原始數據的收集整理,也包括運用這些數據來講述故事。與處理數據的人合作,就是與計算機程序員、數據分析員、圖表制作員等密切合作,分析海量數據中隱藏的關系,挖掘大數據背后的價值,以直觀形象的方式解讀信息,擔當起解讀者的角色。在《芝加哥論壇報》,有一個新聞應用團隊,他們與編輯記者密切合作,幫助他們調查和報道故事,在線描繪故事,為芝加哥當地的特定群體建立永久的網絡資源。
數據新聞要求記者用社會科學的方法制作信息,以可視化手段傳播信息,增加信息傳播的精確性、深度性和形象感。根據受眾上網瀏覽的數據和喜愛觀看的內容,分析他們的心理、需求和行為習慣,有針對性地進行新聞信息傳播,“在融合中創新自己的商業模式,變革組織方式、運作流程、運作模式等”[17]。2011年,淘寶根據5個月賣出眼罩和耳塞等輔助睡覺的工具情況,制作出失眠地圖,地圖顯示廣州、深圳等城市失眠率居于全國前列,說明經濟發達地區人們壓力比其它城市大。有些數據是已經公開的,但需要深入挖掘,重新賦予意義,這一方法比起記者自己去建立數據庫更為便捷和經常。比如美聯社關于4500頁記錄伊拉克戰爭期間私人安保承包商行為解密文檔的報告,這份材料已經被獨立記者掃描并傳到云端,美聯社記者運用這些數據進行了深入的分析報道。
參考文獻:
[1]郭曉科.大數據[M].北京:新華出版社,2013.
[2]GRAY J, BOUNEGRU L, CHAMBERS L.TheDataJournalismHandbook[M].Sebastopol, CA: O’Reilly Media, Inc., 2012.
[3]盧一波,鄧偉,彭蘭.開放與參與——信息圖表生產中的互動設計及社區形成[J].新聞界,2013,(22):32-35.
[4]Emily Bell. How a new research effort will help newsrooms determine what’s next[EB/OL]. Knight Blog.(2012-04-30).http://www.knightfoundation.org/blogs/knightblog/2012/4/30/emily-bell-how-new-research-effort-will-help-newsrooms-determine-whats-next/.
[5]Knight and Tow Foundations provide $2 million for news innovation research[EB/OL].(2012-04-30). http://www.journalism.columbia.edu/news/674.
[6]石磊.數字報業的內容融合與渠道融合——媒介融合時代的報業發展戰略[J].新聞界,2009,(2):14-16.
[7]余曉陽,張金海.傳統媒體的數字化轉型與新媒體的平臺化發展——基于雙邊市場理論的經濟學分析[J].新聞界,2012,(5):61-64.
[8]石磊,李弋,田大菊,謝婉若.新媒體時代數字出版的機遇與發展策略——以四川數字出版產業為例[J].新聞界,2012,(24):61-64.
[9]丁柏銓.媒介融合:概念、動因及利弊[J].南京社會科學,2011,(11):92-99.
[10]石磊.新媒體概論[M].北京:中國傳媒大學出版社,2009.
[11]石磊.分散與融合——數字報業研究[M].北京:中國社會科學出版社,2010.
[12]韓衛國,王勁峰,王海起,胡建軍.基于數據可視化的交通流量分析[J].武漢理工大學學報(交通科學與工程版),2004,28(5):668-670.
[13]黃超.復雜議題融合報道中的大數據策略——以《衛報》網“解讀騷亂”專題為例[J].新聞界,2013,(21):9-15.
[14]楊敏.數據創新傳統新聞報道模式[N].中國社會科學報,2014-04-04.
[15]BRADSHAW P. The Inverted Pyramid of Data Journalism[EB/OL].(2011-07-07). http://online journalism blog.com/.
[16]鄧偉,盧一波.點狀、線性、平面:災害事件報道中的三種信息圖表模式[J].新聞界,2013,(4):35-40.
[17]石磊.媒介融合,報業發展新支點——從報紙消亡論說起[J].西南民族大學學報(人文社科版),2006,(7):130-133.