唐 丹,劉道偉
(武漢理工大學,湖北 武漢 430070)
2017年12月8日,習近平總書記在主持實施國家大數據戰略學習時強調,我們應該深入了解大數據發展現狀和趨勢及其對經濟社會發展的影響,推動實施國家大數據戰略,更好地服務我國經濟社會發展和人民生活改善。[1]
數據新聞正是大數據在新聞領域的全新運用,不論是傳統媒體還是新媒體,都在適應這一變化。2011年,我國的數據新聞開始于互聯網四大門戶網站,即搜狐“數字之道”、網易“數讀”、騰訊“數據控”(后改為新聞百科)、新浪“圖解天下”。本文追溯我國數據新聞的發展源頭,運用定量與定性的方法,分析2011年至2018年9月30日之間三大門戶網站的數據新聞,深入了解我國數據新聞的現狀,從而引發對數據新聞發展的思考及未來發展的展望。
為使研究更為客觀、全面,本文選取樣本為搜狐“數字之道”、網易“數讀”、新浪“圖解天下”三大門戶網站的所有數據新聞,騰訊“數據控”因網站原因無法獲取資源。所有文本資料由“爬蟲”軟件進行網頁抓取,避免人為因素導致的錯誤,樣本庫“數字之道”661篇,“數讀”355篇,“圖解天下”377篇,共計1393篇,根據分析需要,本文從新聞議題、數據來源、可視化、互動方式等維度進行編碼,展開進一步分析。
新聞議題指的是新聞所涉及的領域,結合我國當前數據新聞主題較為繁多的特征,故本文根據《中文新聞信息技術標準》分為24類,包括政治、法律、司法、外交、國際關系、文化娛樂等。[2]通過對該類目進行編碼統計,將文本量化,以分析其數據新聞主題傾向。

表1 三大互聯網數據新聞議題分類統計
由表1可知,自2011年數據在我國開始實踐至今,三大互聯網數據新聞所涉及的報道議題十分廣泛,其中,政治議題所占比重最高,達到18.1%,排在第二位的是占比13.5%的文化娛樂等社會性議題,第三位為經濟議題,占比12.8%,第四、五位分別為醫藥衛生與教育。從以上數據分析可以看出,我國數據新聞議題不僅涉及政治經濟等硬新聞,如三大平臺都對每年的“兩會”進行過系列專題報道,還涵蓋了醫藥衛生、教育等與受眾息息相關的議題,但其比重相較于國外媒體,仍處于較低水平,文化、娛樂等軟新聞則出現增加趨勢。
數據新聞被稱為數據驅動的新聞,在于挖掘和展示數據背后的關聯與模式。[3]可以說,數據是數據新聞的消息源,有無明確數據來源、數據來源是否單一都影響著一篇數據新聞的真實度與可信度,甚至決定著數據新聞的質量與深度。

圖1 三大平臺數據來源分布
分析文本得知,三大互聯網平臺的數據新聞大多數都標注有數據來源,未標注數據來源的新聞數量占比12.4%。同時,三大互聯網的能夠充分利用各個渠道獲取數據并加以利用,主要分為以下幾類:國內政府部門、國外政府部門、世界組織(官方、非官方)、企業與調查機構、高校與研究中心、媒體(傳統媒體、新媒體)、學術文獻。
這幾類數據來源中,媒體占比高達58.93%,包含國內外傳統媒體、網絡媒體、自媒體等,超過其他所有數據來源占比之和,數據來源排在第二位的是企業與調查機構。數據來源排在第三位的是國內政府部門,相比較其他數據來源,政府部門掌握著大量、優質的數據,這些數據的獲取通常需要消耗大量的人力、物力、財力,非政府機構無法完成,因此,政府部門是數據新聞重要的數據來源。
在單篇數據新聞的數據來源數量上,大多數為兩個及以上,單一信源較少,不同數據相輔相成,增強了新聞的完整性與故事性。但在數據的性質上,我們也應該看到,以上六類數據來源皆為第三方數據,據統計,三大平臺自有數據或自主調查獲得的數據僅為10篇,占比0.7%。
與傳統的新聞不同,信息的主要載體不再是文字,而是信息圖表,文字僅對圖表所呈現的數據的輔助說明。數據新聞的個性呈現形式得益于可視化技術的發展,數據新聞將復雜、抽象、難懂的數據轉化為簡單、生動的新聞報道。[4]

圖2 數據呈現方式分布
三大互聯網平臺的數據新聞呈現方式雖然都應用到一般靜態圖表、動態交互圖表、視頻動畫,但簡單易制作的一般靜態圖表占據了絕對的比重,達到91.8%,這類圖表包括散點圖、餅狀圖、折線圖、柱狀圖等常用的數字類統計圖形,也包括關系圖、對比圖、分布圖、時間線等進行非數字類數據統計形式,通常來說,一般靜態圖表可以滿足對數據的分析與直觀展示。
動態交互式圖表為發布在網絡上,綜合了文字、圖像、音頻、視頻等符號,以動態為表現特征,具備了和受眾及時互動,實現雙向交流等功能的信息圖表。[5]在三大平臺中,動態交互圖表主要為數據地圖、交互圖表、H5、交互時間線等。在動態交互圖表中,受眾可以根據自己的需求點擊頁面內容,以獲得對應信息。交互式圖表不同于傳統靜態圖表,憑借動態、隱藏的特點,可用簡潔易懂的畫面承載更多的信息。當H5技術成熟時,新浪“圖解天下”將其運用到數據新聞的可視化當中,受眾可以在網頁或掃碼在手機端進行瀏覽。通過各種觸控滑動點擊、搖一搖、重力感應等,給受眾帶來新的體驗。視頻動畫在三大平臺的應用當中并不常見,一種是將數據內容制作成動畫形式,以風趣、形象的方式展示數據,讓數據真正“活”起來;另一種是將相關的新聞視頻插入數據新聞中,以更好完整地展現該條新聞。
數據新聞在我國的發展已歷經7年,三大互聯網平臺憑借其技術優勢、資源優勢、人才優勢不斷進行創新,但與國外相比,我國數據新聞仍處于“追趕者”的地位,通過前文對三大平臺數據新聞的分析,我們將進一步總結我國數據新聞的發展中存在的問題。
什么是“數據新聞”?這一問題伴隨著數據新聞的產生而提出,國內外學者對其內涵進行深入研究,雖眾口不一,但大多數認同“數據新聞即數據驅動的新聞”。在這一理論背景下,眾多媒體的數據新聞實踐開始由“內容為王”轉向“數據為王”,即過分追求數據這一形式,而忽略了數據本身的意義。[6]由此產生的數據新聞具備了數據的外殼,卻沒有數據的內核,單純以數據對傳統新聞加以包裝,并進行簡單的可視化,即所謂“偽數據新聞”。在國內三大互聯網平臺的數據新聞頻道的表現為缺乏對數據的深度挖掘,如網易數讀數據新聞作品《公共場所禁煙支持率:酒吧、餐館比例低》中,其數據來源為中國疾病控制預防中心在彭博基金會支持下進行的一項民意調查,新聞作品中采用單一的統計圖表對調查結果的相關數據進行可視化展示。此類新聞作品的共同點為,沒有進行相關的數據處理與深度分析,難以形成獨特的“新聞點”。
“偽數據新聞”的另一種表現為數據新聞的呈現方式。數據新聞的一大優勢在于適應“讀圖時代”受眾的需求,將枯燥的數據進行場景化與可視化的表現,降低受眾的閱讀成本。但是,在當前我國互聯網三大平臺的數據新聞作品中,大量存在文字為主,可視化信息圖表為輔的現象,顯然,這與數據新聞的可視化特征背道而馳。
“數據”作為數據新聞的基礎,從某種程度上而言,數據的質量直接決定了數據新聞作品的優劣。影響數據質量的因素為數據來源及數據開放程度,從數據來源來看,政府部門是重要的權威數據來源,國外媒體如《衛報》數據新聞中68%的數據來源于國內外政府部門[7],相比較而言,我國互聯網三大平臺這一比例僅為21.9%,而各大媒體的二手數據來源則占比達到58.93%,這無疑極大地降低了數據的可信度;另一方面,在數據新聞的全球化實踐中,數據新聞成為新聞透明實踐的重要陣地,透明化和開放化等新的操作理念逐漸顯現出來。[8]開放和鼓勵用戶參與是《衛報》數據新聞報道最突出的兩大特征,因此《衛報》選擇向用戶開放評論、數據及應用工具,吸引用戶參與。國內互聯網三大平臺標注數據來源的數據新聞作品占比87.6%,但指向并不明確,受眾無法準確找到原始數據,從而阻隔了新聞生產者與受眾的聯系,并降低了受眾對數據的信任度。
媒介融合帶來技術賦權下受眾話語權的提高,媒體更加注重受眾的互動與反饋。數據新聞更是如此,與受眾的互動不僅可以提升參與度,更可以成為媒體了解受眾行為的重要渠道,并構成媒體的數據來源體系。縱觀國內三大互聯網平臺,與用戶的互動主要集中為數據新聞下方的評論及部分調查,但這種互動是單向互動而非雙向互動,未能有效激發受眾的分享與轉發行為。
當前,移動終端成為媒體競爭“注意力”的重要戰場,也是受眾獲取信息的主要渠道,三大互聯網平臺數據新聞的發布平臺增加了手機客戶端,并開通微信公眾號、微博賬號,在“兩微一端”支持下,試圖實現內容的多平臺分發,加強了與受眾的互動,但從其公眾號的粉絲數與閱讀數來看,效果并不明顯。
數據新聞雖然是對傳統新聞報道的一次重大革新,但是從全球數據新聞獎歷屆作品來看,其依然遵循傳統的新聞價值判斷,在新聞主題上,以嚴肅的“硬新聞”為主,雖然也有文藝、體育等“軟性”話題,但只占到較小的比例,這亦與數據新聞在宏觀敘事及預測方面的優勢有所關聯。市場經濟與受眾本位的傳播觀對媒體的滲透乃至控制,使得大眾傳媒越來越“討好”受眾群體。“越不用花腦筋、越刺激的內容,越容易為觀眾欣賞和接受。這幾乎是收視行為的一項鐵律。”[9]因此,眾多媒體為迎合受眾,出現媚俗化、娛樂化現象。數據新聞作為各大媒體新開拓的領域之一,也未能避免。
通過對三大數據新聞平臺有關文化、娛樂這一議題的分析,我們可以看出,三大平臺文化、娛樂類的數據新聞作品近幾年處于上升趨勢,在2018年出現最高值,占比22.6%。同時,在新聞用詞上也出現了眾多“娛樂化”傾向,大量使用網絡用語,如“屌絲”“高富帥”等,這樣的用詞將原本新聞的嚴肅性消解,呈現出非理性的特點。
互聯網三大平臺數據新聞的發展并非一帆風順,我們可以將其分為三大階段,2011—2014年為發展前期,數據新聞實踐剛剛起步,各大平臺爭先投入,數據新聞快速發展;2015—2017年為瓶頸期,三大平臺的數據新聞經歷了初期的快速發展后,陷入低谷;2018年起為后增長期,三大平臺的數據新聞更新數量開始回升并趨于穩定。如何在七年的發展中總結經驗,突破瓶頸,保持我國數據新聞的良性發展,成為必有之思。
由于數據新聞對傳統新聞生產模式的變革,數據新聞生產者除了需要具備傳統的新聞素養,還需要提高“數據素養”,即有效地獲取數據、科學地分析與解讀數據、準確直觀的表達數據。[10]當前我國媒體的數據新聞生產者大多存在能力缺位,傳統媒體隊伍缺乏具備計算機、可視化能力;而三大互聯網平臺的數據新聞隊伍則缺乏傳統記者的新聞素養,導致新聞作品重技術、輕敘事的傾向。人才隊伍的創建有賴高校的專業培養,當前,我國的數據新聞人才培養尚處于起步階段,部分高校的新聞傳播專業已經開設相關的數據課程,中國傳媒大學也已正式開設數據新聞專業,這為媒體打造適合數據新聞實踐的“文理藝”兼容的人才隊伍奠定了良好的基礎。因此,國內相關的數據新聞平臺應該加強與高校的聯系,打造業界與高校的聯合培養模式,彌補我國數據新聞專業人才的不足,唯有如此,才能以專業人才帶動專業數據新聞作品的生產,提升數據新聞質量,規范其專業要求。
國內數據新聞的生產長期受制于數據開放不足,但在當前全球所倡導的數據開放背景下,我國政府部門的數據公開程度日益提高,這為數據新聞的發展提供了良好契機。同時,國內媒體應當發揮自身主動性,構建全方位、立體化的數據來源體系。一方面,我國數據新聞媒體應當加強自有數據庫建設,改善當前大多數依靠第三方數據的局面。一個完善的數據庫不僅可以幫助記者在數據集里查明異常值,在最新消息中保持領先,亦可以幫助記者在新聞發生時快速周轉,寫一篇有深度的文章。[11]因此,數據庫建設是數據新聞生產的重要環節,國內三大互聯網平臺應當充分發揮所擁有技術及資源優勢。另一方面,重視社交平臺這一數據來源。社交化是當前互聯網的一大特征,由此產生海量的一手數據。當前,我國三大互聯網平臺搜集一手數據的方式大多數為問卷調查,數據獲取成本較高。對比之下,國外優秀的數據新聞媒體則更加重視對社交平臺數據的抓取,并從中尋找有價值的新聞線索,其新聞作品與受眾的聯系也更加緊密。
CNNIC第41次《中國互聯網絡發展狀況統計報告》顯示,截至2018年8月,我國手機網民規模達7.88億人,占比為98.3%。[12]通過移動端接受信息已經成為受眾的重要媒介使用習慣,國內三大互聯網平臺當前都已建立起“兩微一端”及APP的移動端傳播矩陣,以擴大數據新聞作品的傳播范圍,但是其數據新聞的傳播效果并不突出。一方面,其呈現方式較為單一,并未對受眾的體驗產生實質性提升,隨著H5技術的成熟,國內三大互聯網平臺制作了部分H5新聞作品,但總體仍以一般性圖表為主,交互式、個性化圖表較少。另一方面,受制于技術與成本原因,數據新聞在移動端的適配問題仍然存在,多數互動性較強的作品都是基于PC端的掃碼行為獲取,未能兼顧PC端與移動端的差異,導致部分作品在移動端的呈現效果減損。因此,在未來的實踐當中,國內數據新聞平臺應當在進一步突破移動端技術瓶頸的同時,把握當前數據新聞的交互趨勢,如游戲化、定制化,提升受眾的深度閱讀體驗,并讓數據新聞為受眾提供個性化服務。
數據新聞在互聯網三大平臺的實踐中,折射出數據新聞在我國的“本土化”進程,其發展仍然存在數據開放程度低、缺乏專業規范、復合型人才缺失、各媒體平臺數據庫建設力度不足等諸多問題。在數據新聞日益受到關注的今天,媒體應該進一步思考如何突破技術瓶頸,打造專業團隊,充分利用好社交媒體的同時,警惕過分娛樂化,在“數據新聞熱”下回歸理性思考,總結已有經驗與發展規律,讓數據新聞能更好地釋放其優勢與活力,更好地服務于新聞業的發展。