◎榮曉曼
近年來,大數據、5G、人工智能等技術發展迅速,使社會進入了大量生產、傳播和消費信息的時代,并給人們提供了全新的科學計算和數據獲取方法,信息爆炸、數據海洋成為社會的重要特征之一。①大數據成為重要的社會資源,影響了新聞原有的呈現方式和傳播形態,催生了數據新聞這一新型新聞報道形式。大數據技術幫助媒體和記者收集數據信息,擴大報道材料的范圍。數據新聞通過對數據信息進行有效挖掘和分析,彌補了傳統新聞采集方法和宏觀描述的不足,使新聞報道更接近事件的真實面目。國內各類媒體開始運用數據新聞進行報道,部分主流媒體建立了專門的數據新聞欄目,以專業性和精準性為數據新聞報道實踐提供了有益的探索。本文以主流媒體新華網、財新網的數據新聞報道為研究對象,探討數據新聞欄目的現狀、特點及存在的問題。
數據新聞并不是新事物。1821年5月5日出版的《衛報》創刊號上(當時的《曼徹斯特衛報》)就刊印了一個數字表格,這可以稱為數據新聞的開山之作。它的用意很簡單,就是讓信息一目了然、便于查詢。②米爾科·勞倫茲(Lorenz,2010)認為,“數據新聞是一個工作流程,包括以下基本步驟:通過重復爬取、過濾和重組來深度挖掘數據,聚焦特殊信息來過濾數據,可視化呈現數據,合成新聞故事。”國內學者在對國外數據新聞進行考察和學習時,結合我國新聞行業的發展狀況,也對數據新聞提出自己的理解。祝建華梳理了數據新聞發展的歷史:“新聞經歷了1980年開始的精確新聞,1990年開始的電腦輔助的新聞,2000年開始的數據庫新聞,直到2010年開始的數據驅動新聞。近年大數據概念引入后濃縮為數據新聞。”③方潔認為,數據新聞是一種基于數據采集、挖掘、統計、分析和可視化展示的新型新聞報道方式。④筆者從對數據新聞概念的梳理中,總結出數據新聞的特征:數據量級、數據驅動、互動可視化。數據量級指的是數據新聞較其他基于數據的新聞來說,在數據獲取的量上更倚重大數據。數據驅動指數據新聞制作過程要通過對數據的反復篩選來深度挖掘數據,以數據來驅動新聞的生產。互動可視化強調用可視化的方式呈現數據并講述新聞。
根據對數據的挖掘程度,數據新聞可以劃分為常規型和調查型兩類;根據選題內容,可以分為實證類、環境類、醫療衛生類等。⑤有學者把可視化的呈現類型劃分為統計圖表、數據地圖、數據動畫、信息圖、時間軸等。⑥數據可視化是數據新聞最主要的特征之一,在劃分數據新聞類型時常以視覺呈現狀態劃分為以下幾類。一是信息圖表。信息圖表又稱為信息圖,是將信息以形象化的手段呈現出來,以獲得更好的傳播效果,具體來說就是“圖形+數據”。因此,信息圖的本質是對復雜信息的簡化和可視化。信息圖可以分為靜態、動態和交互三種類型。二是時間軸。時間軸是從時間的維度,系統、完整地記錄、展現事物的變化軌跡,是基于時間順序呈現事物發展的可視化形式。時間軸通常會運用在跨度很大、線索較多的事物的演變全過程。三是數據地圖。數據地圖是把數據添置在地圖的坐標中,宏觀、清晰地揭示地理位置與數據之間的關聯。數據地圖通常采用兩種呈現方式:一種是把數據以小圓點的方式標注出來,受眾點擊小圓點即可獲得具體的信息;另一種是將數據以熱力圖的方式附著于地圖之上,使多維度數據同時展現,便于受眾對比并深入了解整體情況,發現數據背后的深層原因。四是社會網絡關系圖。社會網絡關系圖能夠幫助受眾清晰且快速地了解新聞人物之間的復雜關系。其用直觀的圖形梳理人物關系,通過色彩、形狀將人物關系進行區分,用線條將相關聯的人物和時間相連。
Lewis(2015)概括了“大數據時代的新聞業”這一主題的研究,主要有三個視角:一是基于案例的實證研究視角,主要描述和解釋新聞產業的發展;二是對概念體系的研究,以解釋和理順上述新聞業的變化;三是從批判的角度進行研究,質疑該領域一些被認為理所當然的規則。他認為,這三個角度的研究并不相互排斥,在一項研究中,這三個角度的交叉往往同時發生。在這一理論基礎上,本研究選擇了國內主流媒體的數據新聞報道進行量化分析。
本文選取2022年1—8月新華網《數據新聞》欄目和財新網《數字說》欄目發布的數據新聞報道為研究對象,對樣本數據新聞報道的數據來源、報道選題、數據處理程度、可視化設計與呈現等方面進行描述和比較,總結主流媒體數據新聞的現狀及存在的問題,并探討其對主流媒體的作用。本文選取的數據新聞均為不定期更新的新聞,其中新華網8篇,財新網61篇,樣本總量為69篇。
筆者根據Lorenz(2010)所描述的數據新聞的生產過程模式,結合數據可視化產品評價標準,分別從數據來源、報道選題、數據處理程度和數據可視化設計與呈現四個方面提出假設,對樣本進行分析。
第一,是否標明數據來源。高質量的數據源不僅是高質量可視化產品的保障,還是判斷作品可信度的主要依據。因此,筆者首先對數據新聞的來源進行分析,包括對數據來源的描述、數據來源的機構、數據來源的數量這三個指標的統計。數據來源描述是指數據源在數據新聞中的描述程度,可分為無數據來源、數據來源模糊和數據來源清晰三種類型。模糊意味著沒有給出數據鏈接或來源,讀者無法知道數據來源。清晰意味著讀者可以通過鏈接或報告中的特定引用找到數據的具體來源信息。
第二,數據新聞的選題。筆者對數據新聞的選題進行分析。根據兩個數據新聞報道欄目的選題,將題材范圍確定為政治及國際形勢、經濟、文體教育衛生、社會民生四大類。
第三,數據處理程度。依據數據可視化生產的過程,考察對數據的使用情況。數據可視化需要通過調查、挖掘,并采用較為復雜的數據處理技術,挖掘數據背后的關系、趨勢。對數據新聞的數據處理程度進行賦值,具體為:完全沒有數據處理的為0分,僅將數據處理簡單化,如總量統計、百分比計算、均值計算等為1分,數據做多樣化描述的為2分,做探索性統計分析、大數據挖掘等復雜處理的為3分。
第四,數據新聞的呈現形式。借用方潔、高璐(2015)的賦值方式,對數據新聞報道中呈現形式的難度賦分如下:全文靜態設計為0分,僅表格或表格變體靜態設計為1分,靜態信息地圖設計或結合數據的靜態時間線為2分,交互式時間線和普通視頻為3分,交互式地圖和3D動畫設計為4分,游戲設計為5分。
本研究假設國內主流媒體的數據新聞有較高的質量和影響力。要細化研究問題,需驗證以下幾個假設。
研究假設a:主流媒體的數據新聞有比較明確的數據來源,雖然有少量數據來源描述模糊,但樣本中的絕大多數描述是清晰的,新聞可信度較高。
3.加強供應商關系管理,轉變物資儲備方式,改進資源占有方式。供應商關系管理是指運用供應鏈管理思想,通過搜尋、考核、評價等方式,對作為企業重要外部資源的供應商分層次建立合作關系,并對其關系進行管理和維護的活動。實行供應商資格預審制及供應商許可供應產品目錄制,將其優勢產品列入可供應產品目錄。對每個有交易的供應商進行動態量化考核,建立供應商動態量化評價體系。考核得分由整體實力、供應量、合同執行情況、網上報價率、獎懲等5個部分組成。對考核優秀的供應商在招投標、付款、供應份額上給予傾斜,不斷培養優秀的主力供應商群體,并逐步與之建立穩定的合作關系。
研究假設b:數據新聞會結合時事或熱點進行選題,注重新聞本身的價值。
研究假設c:樣本的數據新聞數據處理程度較高,對數據進行了較為復雜的處理與挖掘。
研究假設d:數據新聞的呈現形式多樣,樣本呈現的可視化程度高,各分值都有分布。
研究假設e:樣本中占多數的數據新聞能增強用戶體驗,引發用戶的主動參與,如點贊、轉發、評論。
該假設需明確統計樣本有無交代數據來源及交代數據來源占比。統計發現,財新網《數字說》標明數據來源的有61篇,其中注明了來自公開資料整理的有59篇,數據來源模糊的僅有2篇,有明確數據來源的新聞占比為96.7%。新華網《數據新聞》有3篇數據來源模糊,5篇標明了數據來源。財新網《數字說》中大多數數據描述是清晰的,新聞可信度高;新華網2022年的《數據新聞》欄目中,數據新聞總量較小,多數數據新聞也有清晰的數據來源,假設a成立。(見表1)

表1 數據來源的數量及描述
假設主流媒體在選題時會考慮選題的新聞價值和社會影響力,主要圍繞重大事件和受眾普遍關心的社會現象進行選題。《數字說》和《數據新聞》樣本的選題主要集中在時政類、財經類、民生類、文教衛類這四大類型。從表2可見,財新網《數據說》選題主要集中在經濟和文教衛,兩類的占比分別為41%和44%。新華網《數據新聞》文教衛類數據新聞占比較高,為50%。該欄目結合2022年北京冬奧會的發展動態實時更新新聞信息,以圖文結合的形式對熱點新聞和事件做出快速反應。因此,假設b成立。

表2 數據新聞選題統計表
將數據處理的程度進行量化打分:完全沒有處理的為0分,簡單化處理的為1分,多樣化描述的為2分,大數據挖掘的為3分。財新網《數字說》的數據處理得分為:1個0分,16個1分,41個2分,3個3分。財新網《數字說》的數據處理程度很高,體現在多樣化描述的數據新聞較多。新華網《數據新聞》的數據處理得分為:8個0分。可見,財新網《數字說》比新華網《數據新聞》數據處理程度高。新華網《數據新聞》的新聞均未對數據進行處理,是數字新聞,大部分報道是以圖片化的方式將數字報道的內容做了簡單呈現。財新網《數字說》對數據做出多樣化描述呈現的新聞占比較高,部分還進行了較為復雜的數據挖掘和處理。因此,假設c部分成立。
可視化形式主要有信息圖、數據地圖、靜態統計圖、動態圖、Flash動畫、熱力圖等。財新網《數字說》數據新聞呈現形式打分情況:1篇0分,23篇1分,30篇2分,1篇3分,3篇4分,3篇5分。《數據說》的數據新聞整體呈現形式多樣,可視化程度較高,主要集中在靜態信息圖設計或靜態時間軸,也有部分可視化程度很高的動畫設計和游戲設計。新華網《數據新聞》中的8篇新聞均為0分,可見其在呈現形式上比較單一,它以圖文新聞為主,將文字新聞圖片化,無可視化程度高的數據新聞。綜上所述,財新網《數據說》的數據新聞可視化程度較高。因此,假設d部分成立。
從財新網《數據說》和新華網《數據新聞》2022年1月—8月的數據新聞中各選擇5篇評論數或點贊量最多的新聞報道進行分析,發現可視化類型、選題和受眾的參與行為有一定的相關性。可視化類型主要集中于餅圖、面積圖、折線圖、表格等。這些可視化類型使受眾能快速比較數值的大小,發現數據的變化規律,理解數據之間的關系。另外,選題的受關注情況與選題在社會中的熱度有關。
新華網《數據新聞》點贊量最大的5條新聞皆為圖文形式,其中有2條與2022年北京冬奧會有關(見表3)。財新網《數據說》評論數最多的5條新聞,可視化類型大部分為信息圖,這5條新聞的選題是當時發生的災難或疫情的相關報道(見表4)。兩個欄目的數據新聞報道雖然能幫助受眾快速地獲取信息,但用戶體驗不足,點贊量和評論量小,因此假設e不成立。

表3 新華網《數據新聞》數據可視化產品點贊Top5(2022年1月1日—8月31日)

表4 財新網《數據說》數據可視化產品評論Top5(2022年1月1日—8月31日)
分析發現,兩家主流媒體的數據新聞都有比較明確的數據來源。數據新聞主題會結合時事或熱點進行選題,注重新聞本身的價值。在數據處理程度方面,財新網《數字說》的數據處理程度比新華網《數據新聞》高。在數據呈現的可視化程度上,《數字說》也比《數據新聞》高。在數據新聞報道的交互性方面,《數據說》中部分新聞里的信息地圖可以實現互動,但大部分新聞報道的交互設計不足。
對2022年1月—8月新華網《數據新聞》和財新網《數據說》的數據新聞內容進行分析發現:主流媒體數據新聞報道的數據處理程度和可視化程度不一。整體來說,做復雜的數據處理的較少,數據可視化程度高的新聞報道比重低,交互程度較低。兩個數據新聞欄目的優勢在于:新聞報道絕大部分有比較明確的數據來源,新聞可信度較高;新聞內容豐富;選題結合時事熱點,注重新聞本身的價值。《數據說》選題覆蓋領域較廣,《數據新聞》數據圖形化處理的形式較多。在數據新聞處理程度上,《數字說》比《數據新聞》數據處理程度高。在可視化程度方面,《數據說》的可視化程度較高。在用戶體驗方面,兩個平臺的用戶點贊數、評論數總體都不高,用戶參與情況一般。
研究表明,以新華網和財新網為代表的主流媒體,利用已有的公信力和專業性進行數據新聞的傳播,在傳播技術、選題、新聞質量方面有很大的優勢,但在傳播效果方面還有可以提升的空間。主流媒體的數據新聞應當更關注用戶的特征和需求,在交互設計方面,將用戶“介入”納入數據新聞報道的生產過程中,增加更多的動態信息圖、視頻和3D動態圖形等呈現方式,讓平面的“可視化”變得更加“立體化”⑦,增強數據新聞的體驗功能,更好地滿足用戶的個性化需求,推動數據新聞在中國的發展。
注釋:
①許向東.數據新聞可視化[M].北京:中國人民大學出版社,2018:11.
②[英]西蒙·羅杰斯.數據新聞大趨勢[M].岳躍,譯 .北京:中國人民大學出版社,2015:52.
③林暉.數據驅動的研究型報道:互聯網時代的財經新聞新趨向——兼談財經新聞人才培養改革[J].新聞記者,2017(02):64-68.
④方潔,顏冬.全球視野下的“數據新聞”:理念與實踐[J].國際新聞界,2013(06):73-83.
⑤許向東.數據新聞可視化[M].北京:中國人民大學出版社,2018:71.
⑥張彬,過宏雷.數據新聞可視化設計的表現形式探析[J].大眾文藝,2015(10):183-184.
⑦謝帥光,朱愛敏.大數據時代新華網數據新聞的可視化路徑探析[J].視聽,2022(06):143-145.