梅殿杰 肖 濤
科技革命發展到今天,我們已經從信息時代走到了數字智能時代,如果數據被賦予背景,“數據”就成了信息;如果數據能夠總結或反映出規律現象,“數據”就是知識;如果數據能夠經過各式各樣的分析后為我們提供正確的決策,那么“數據”就是不可多得的資源。
當今國際媒體界的排頭兵——老牌英國報紙《衛報》,早在1821年就以圖表的形式分析了當時英格蘭曼徹斯特各個學校的學生數量以及就讀每所學校需要花費的費用,可以說是數據新聞的雛形。到了1952年,美國由于當時計算機行業的發達,計算機輔助報道(CAR:Computer Assisted Reporting)首先被哥倫比亞廣播公司使用,為當時的美國總統大選做預測。從英國的圖表分析到美國的計算機輔助報道,數據新聞的雛形已經初顯。它拓展了當時的新聞操作空間,豐富了新聞報道的形式。
1967年,美國底特律、洛杉磯等地區發生黑人暴動,強烈的種族騷亂受到當時各大媒體的關注。其中有一名叫作飛利浦·邁耶的記者,通過計算機輔助用隨機抽樣的方法對當時的437名黑人進行了調查,并寫出了一組系列報道名為《十二街那邊的人們》。數據分析的結果對當時輿論傾向認為“騷亂參與者大多數來自社會最底層,沒有接受過良好教育”的刻板印象產生了強烈的反差,這是傳統新聞手段難以達到的效果。飛利浦·邁耶在1973年《精確新聞學》一書中把《十二街那邊的人們》這篇報道稱之為精確新聞的開端,并正式把精確新聞定義為“將社會科學和行為科學的研究方法應用于新聞實踐的一種新聞報道”。
隨著科學技術日新月異的發展,信息數據以一種爆炸式增長的方式傳至世界各地。數字智能的快速跟進,移動媒體碎片式閱讀習慣,圖形、圖像、圖表的傳播方式因相比文字更為直觀的表現,讓現在的人們更容易接受。隨著大數據時代的到來,數據新聞這一新興的新聞生產方式也逐漸走進大眾視野。數據新聞(Data Journalism)這一詞組的最早提出者是Every Block的創始人艾德利安·哈洛瓦緹。Every Block是一種信息服務業務,通過展現身邊環境的數據變化來幫助大眾了解他們所居住的周邊發生了什么事情。艾德利安·哈洛瓦緹認為,記者發布的數據信息應改變我們所習以為常的“大量文字”,轉而代之的是經過處理過的、結構化的、機器可讀的數據。
在2010年,英國《衛報》憑借著在維基解密獲取的大量真實戰爭數據資料,制作了關于伊拉克戰爭的數據新聞。將近40萬條戰爭數據被記者放大到了地圖上,大大小小每一場戰役都以紅點的形式標注出來并輔以各種相關信息,包括每場戰爭的死亡人數、參戰雙方、作戰位置地點、開戰時間、戰爭持續時間,等等。它以一種直觀的形式揭露戰爭的殘酷,間接推動了英國當時在伊拉克撤軍的行動,被新聞業界稱為數據新聞的典型案例。
數據新聞的生產最基本的要求是新聞生產者要會操作編程軟件,在網頁上通過Python語言等在網頁上抓取自己需要的信息。作為新聞的生產者如果單純通過復制粘貼就想在數以萬計的具有價值的新聞數據中提煉出自己想要的信息,那么就失去了做這條新聞的最根本價值。除了數據新聞前期的數據開發工作需要編程等技術外,數據新聞的后期是需要視覺設計等可視化技術的。在當前的數據新聞行業,能夠同時掌握大數據開發、可視化技術的新聞工作者極少。2015年中國傳媒大學首創性地開辦了數據新聞專業,開設了計算機編程、視覺傳達等一大批專門為數據新聞服務的課程。自此其他高校開始紛紛效仿,我國的數據新聞專業人才培養正式起步。
獲取有價值的數據,是優秀數據新聞的前提。當今世界因為各個國家的社會發展程度和開放程度不同,所以不同國家的記者獲取新聞數據的難度也不一樣。一般情況下,北美記者比歐洲記者更容易找到他們所需要的信息,歐洲記者又要比其他地區的同行更容易。
在北美和歐洲媒體獲取信息的渠道較廣,有政府部門公開的各項詳細數據,有各種慈善公益組織發布的指標,也有諸如“斯諾登棱鏡門”這種重大曝光事件帶來的龐大數據。反觀國內,由于新聞的管控,信息公開渠道相對較少,數據新聞只能在有限的數據資源下展開相關整理,所以國內的數據新聞發展一直沒有太大起色。
國外的數據新聞在操作中很重視對來源的交代,方便讀者自行判斷數據的可信度,這體現了新聞從業者對受眾的尊重。英國的《衛報》會在每則報道后附上整理好的原始數據,點擊鏈接便可下載。國內的數據新聞都不曾開放源數據,一家紙媒數據新聞部門的負責人曾表示在合適的時候將開放原始數據,但競爭壓力以及開放可能帶來的其他風險讓人顧慮重重。
隨著數據新聞研究的逐年開展,國內數據新聞的數量越來越多,但整體質量卻參差不齊。大多數的數據新聞報道都只是停留在對數據的整理以及可視化呈現上,對數據的深度挖掘整理分析,得出具備更大新聞價值的東西卻很少。
在國外,數據新聞起源于傳統媒體。英國《衛報》于2009年成立的數據新聞小組是國際公認的數據新聞行業領跑者。《衛報》在數據新聞上的一些做法,對后世影響深遠。許多媒體諸如《紐約時報》《華爾街日報》等知名傳統媒體都紛紛效仿《衛報》,成立了自己的數據新聞欄目。
反觀國內,網絡媒體幾乎是通過二次傳播通過轉載來做自己的新聞,長此以往對數據整理就有了自己的一套成熟的流程。2011年5月,搜狐就憑借《分稅制下的財政樣本》打開了網絡媒體數據新聞的開端。國內的傳統媒體到了2013年才開始對數據新聞有所涉及,2013年5月人民日報旗下的人民網一篇《走進中央黨校的國際政要》打出了傳統媒體的“第一槍”。到了2014年央視的春節特別節目《據說春運》才開始了電視媒體在數據新聞的“探險”。
目前,大數據已經廣泛應用到了多個領域里。大數據時代的新聞傳播帶來的不僅僅是數據新聞,更多的是在新聞領域中的變革。大數據的到來對新聞生產以及媒介經營等方面都有本質性的改變。
在2014年春節前夕,中央電視臺利用來自互聯網的大量實時數據推出了當時頗受關注的數據新聞——《“據”說春運》。這則新聞在春節前后這幾天幾乎是每天一期,每期時長在三至四分鐘左右,為觀眾直觀呈現了當年的春運趨勢。春運一直以來都是在年關將至這段時期國內各大媒體著力進行策劃并爭相報道的選題,每年總體情況差不多,所以新聞呈現形式的創新就變得至關重要。綜合分析當時各大主流媒體在春節前夕的新聞報道,中央電視臺《晚間新聞》欄目中推出的《“據”說春運》所呈現的數據新聞報道受到了廣泛的關注和好評。數據新聞是新聞媒體工作者深度挖掘數據里的可用信息并輔以高度可視化的形式呈現新聞,數據可以是數據新聞的來源,也可以是數據新聞的展開線索。
為了制作這幾期《“據”說春運》,中央電視臺特意從百度數據平臺那里實時共享了大量的數據資料,并采用百度數據平臺來統計更多的樣本。通過深度挖掘海量數據資料和高質量的一手信息,讓《“據”說春運》的報道整體顯得更全面和完整,在新聞報道中發現了今年春運中的規律和趨勢。比如在2014年1月25日那期的節目中所提出的“逆向遷徙”。在大多數人以往的印象里春運是工作在外地的中青年群體在除夕到來之前搭乘火車、汽車、飛機等多種交通工具,返回各自的老家一起共迎新年。此時的北上廣一線城市的總體人數會因此驟減。但隨著時代的發展,高強度的工作壓力致使大多數工作者無法享受假期。在新聞中有數據顯示,當年的成都到北京的火車線路一直是一條“旺線”,當時近40個小時的乘車總時長,硬是連一張硬座都不好買。由于親人的思念,更多打工者的父母專門從家鄉出發來到子女們工作的地方陪孩子過年。這些孩子的父母為了和孩子團聚成了春運“逆向流動”的根本原因。
“今日頭條”的口號是“不做新聞生產者,只做新聞搬運工”。這就代表“今日頭條”是在大數據背景下發展起來的信息搜索產物。數據處理技術在“今日頭條”網絡平臺上將信息按照用戶的閱讀量和個性化需求呈現出新聞熱點,通過后臺系統的算法將用戶可能會喜歡的信息準確推送,達到信息傳播的實效性目的。
大數據時代的新聞傳播對傳統的新聞生產帶來了巨大的影響與挑戰。相信憑借著數據新聞自身的特殊功能和優勢,會有更多優秀的數據新聞出來。但限于數據新聞以數據呈現新聞的局限性,必然在人情味、質性分析等層面存在某些先天性缺陷,不能取代傳統的新聞生產。而傳統新聞因面臨數據新聞的刺激和挑戰會進行變革,從而創新新聞生產方式,產生更多形態多樣的新聞產品。