張雪婷
當媒體處于大數據的語境之下,數字技術全面滲透至新聞傳播領域,作為媒體轉型的抓手和新聞生產革新的入口[1],數據新聞應運而生。從數據與財經新聞的關系來看,傳統財經新聞高度依賴數據,財經新聞的數據屬性讓其與數據新聞的部分生產流程彼此連貫溝通,對數據的有效處理能夠實現財經新聞和數據新聞的對接。
彭博社作為國外最大的財經資訊公司和金融信息服務供應商,與我國財經新聞及資訊服務的全媒體集團財新傳媒定位相當,皆專注于財經新聞,都開設了數據新聞可視化欄目,在定位、媒體地位和屬性上有一定關聯和可比性。
本文選擇中國財新網和美國彭博社兩國具有代表性的財經媒體彭博社為調查對象,對2019年2月1日至2019年4月12日期間,兩個財經媒體平臺在其欄目下發布的所有數據新聞為樣本,采用定量和內容分析方法進行比對。

圖2-1 財新與彭博數據新聞生產總量
統計發現,財新71天共發布36篇數據新聞,單位時間生產量為0.51篇/天;彭博71天共發布33篇數據新聞,單位時間生產量為0.46篇/天??梢钥闯鲐斝略谏a總量和效率上稍微高出彭博,數據新聞實踐略顯積極。
根據統計,財新36篇作品中參與制作的總人次達107人,平均每篇新聞團隊成員數量為2.97人;彭博33篇作品中參與制作的總人次達129人,平均每篇新聞團隊成員數量為3.91人。財新2人團隊完成一篇數據新聞報道的比重最大,占47.22%;3人以上團隊占30.56%。彭博3人以上團隊完成一篇數據新聞報道的比重最大,占48.48%;3人以下團隊只占15.15%??梢?,財新團隊成員更穩定,趨向于2人合作。彭博團隊成員更加多樣化,3人及3人以上的協同作業是常態。

圖2-2 財新與彭博數據新聞團隊人數分布

表2-1:財新與彭博數據新聞團隊總人數及平均人數

圖2-3 財新與彭博數據新聞生產總量
財新在記者人數上的分配明顯多于彭博,而彭博的數據技術人員的數量多于財新。兩者在設計上人數相當。財新的“數字說”很少標注“編輯”,彭博的人員分工標注不明的情況也較多。
國內外數據新聞平臺的核心競爭力在于團隊人員的協同合作和自身角色職能的專業化程度。彭博在完成一篇數據新聞的過程中更加傾向聚合眾人之力,在人員結構上也更為完整,深耕某一細分報道方向的記者(譬如汽車行業、銀行等等)、圖表設計、數據處理或技術人員、編輯通常構成了彭博完成一篇數據新聞的團隊。不足的是彭博并沒有明確標出每一篇報道人員分工情況,只給出了部分參與制作者的名字及其Twitter超鏈接,需要從社交網站上的名片去推斷其身份。反觀財新,一名記者加上一名設計人員通常是標配,數據處理和技術人員略顯不足。
數據來源數量反映了媒體數據庫的建設水平和數據挖掘能力,也映射了不同國家數據開放浪潮的進展程度,是一篇數據新聞中對數據進行系統化剖析、解碼的前提。根據統計數據,財新單篇新聞數據來源個數集中于1-3個,只有1個數據來源的比例占到了41.7%,;而彭博的數據來源個數則更加多樣,彭博單篇數據新聞來源個數最多的也是1個,占到36.4%,但是5個以上的數量來源占比也高達了21.2%,比財新多出18.4%。

圖3-1 財新與彭博數據新聞數據來源個數
本文根據財新和彭博數據新聞生產的實際情況,將數據來源類型分為政府、非政府、自采、其他媒體、在線挖掘和來源不明六類。其中政府渠道不僅包括本國政府下設機關部門等公開發布的數據,也包括聯合國專門機構和國際各種政府間機構等發布的數據。非政府渠道則具體包含各類企業公司、專業調研機構、NGO(非政府組織)等提供的數據。自采與其他媒體的區別在于媒體自身作為主導通過眾籌或采訪等方式自主調查的一手數據。在線挖掘是指通過對社交媒體、搜索引擎進行大數據挖掘。未標注數據或只標注“公開資料”,無法追溯數據的確切來源都歸為“來源不明”的情況。
統計可得,財新對于非政府渠道數據的采用比例最高,占到38.8%,其次是政府渠道,且引用的其他媒體數據的占比也要明顯高出彭博;相對應地,彭博自采獲得的一手資料使用頻率高于財新,而且還涉及到了在線挖掘的方式,并無來源不明的情況。財新對于在線挖掘的運用尚處空白,且來源不明的數據占到7.5%。

圖3-2 財新與彭博數據新聞數據來源類型
可以看出,國外媒體獲取信息的途徑更豐富,政府部門公開數據,社會組織,學術研究機構,市場調研機構發表的報告,用戶自主生成的內容[2]等都構成了多樣化的數據渠道。
中國的數據或信息的來源渠道較狹窄,主要有政府公開的信息,但也僅限于宏觀層面的概貌,以及媒體報道中的小型數據,盡管還有社會組織的調查報告,但樣本量較小,缺乏詳實的數據。另外數據來源還存在來源標注較為籠統、模糊不清的問題。
將財新和彭博對于數據的處理方式按照層次由低到高劃分為四類。第一類是沒有進行數據處理,指的是將得到的數據資料原封不動地呈現,沒有數據分析這一過程,僅僅是進行了可視化處理。第二類是簡單的計算,指的是圍繞選題把收集到的數據進行頻數、百分比、均值等簡單的計算,處于統計學中初級的描述統計層面。第三類是多樣化的描述與統計,運用到了更深層次的數據分析原理和技術,揭示出數據之間隱含的聯系和變化,甚至進行因果關系以及預測性質的邏輯推理。第四類是大數據探索,指的是結合當下大數據挖掘、深度算法分析、云計算等技術,找到互聯網上存儲的龐雜數據之間的規律和新聞價值。
根據統計,在數據處理方式上,彭博對數據的統計和分析更為深入,多樣化的描述統計占比最高,達51.5%,超過半數,也不乏對大數據探索的嘗試。財新絕大多數是對現有數據進行簡單描述和可視化,而鮮少挖掘數據背后深層次的意義,無數據處理的比例也較高,占到了27.8%。

圖3-3 財新與彭博數據新聞數據處理方式
從調查數據中,可以看到當下以財新網為代表的財經類數據新聞對于數據分析處理投入的人才和重視程度都還有所欠缺,財經類媒體處理的新聞數據往往更為專業而復雜,有時需經過從內部編碼到解碼的過程,助力讀者了解事物的全貌或復雜關系。但數據化的敘事方式和呈現架構要服務于財經新聞的報道原則,數據新聞中的數據和算法只是驅動器,過于重視數據價值而忽略新聞價值便是本末倒置了[3]。

圖4-1 財新與彭博數據新聞報道國別
根據統計數據,財新對于本國的報道超過半數,有25篇,占到69.4%;其次是全球視野的報道有8篇,占22.2%;最末是對其他國家的報道,僅有3篇,只占8.3%;沒有涉及國內外對比的報道。彭博同財新一樣,對于本國的報道在數量上最多,但未超過半數,有15篇,占比45.5%;差異較大的是彭博對于其他國家的報道數量明顯多于財新,有11篇,占比33.3%;全球視野報道的比例相差無幾,國內外對比的報道鮮少涉及,只有1篇。說明財新的報道范圍更偏向國內,以國內新聞為主體,但也不乏對國外和全球動態的關注;彭博放眼國際,格局更加開闊,在兼顧本國報道同時,也注重國際視野。
對于選題類目的構建,是根據對彭博和財新數據新聞的實際觀察,并結合國內媒體業界主流的選題類型劃分為政治、經濟、能源環境、災難事故、社會、文化科教、醫療衛生和其他共8類。
由表可得,基于財經類媒體本位,財新和彭博的數據新聞選題都致力于經濟類報道,分別占比52.8%和60.6%,彭博略高于財新。兩者其次關注的都是政治領域,對政治選題的重視程度具有一致性。在能源環境和社會議題上的重視程度也相當。不同的是,財經還對災難事故、醫療衛生領域也有所關注,彭博則未涉及。因此,財新在選題類型上更加多樣化,以政經為主線,有向外延展之勢;而彭博集中于政治經濟社會三大類,選題向廣義的經濟領域靠攏。

圖4-2 財新與彭博數據新聞選題類型
彭博給予政治經濟社會等更為宏大而嚴肅的議題更高的關注度,站在宏觀的新聞背景下灌注微觀的人文關懷。不僅反思本國國家機器在整個社會系統運行過程中的現象和問題,如《需要:3732名女性來治理美國商界》《民主黨人如何向富人征稅》等報道展現了對社會公眾利益的高度關注,也有諸如《全球性別差距有多大?看你看哪個數字》《歐盟選舉:民粹主義達到頂峰了嗎?》等報道對其他國家乃至全球形勢進行深入的觀察和剖析。對社會多維度的關照所獲取的數據成為彭博將公共利益具體化的支撐。
財新的選題將專業化與大眾化相結合。反映到財新作為一家媒體的議程設置上,財新的選題對于普通民眾而言更具接近性,緊隨時事熱點,致力于將選題切入口民生化。如《10美元能買多少面包?全球城市生活成本排行榜發布》《世界睡眠日:睡眠時間夠了,但你睡得好嗎?》《“吸貓擼狗”很費錢 為什么入坑的人越來越多?》,標題語言和敘事上都較彭博來說更加“接地氣”,照拂到了范圍更廣的大眾媒介素養和專業知識水平。對于金融市場等專業化領域較強的報道,也利用到專有名詞和術語,通過分析、解讀數據給讀者提供參考,進一步增強新聞的權威性和專業度。
參考喻國明、陳力丹等學者對于數據新聞功能的研究,結合財新、彭博數據新聞的生產實際,將新聞功能類目下分為盤點與整合統計、對比聯系新聞事實、梳理事件過程、說明形勢與解讀觀點、預測這5種功能。由于一篇數據新聞可能有多重功能,因此采用多選的方式統計出彭博、財新每篇數據新聞最顯著的1-2種功能,得到的結果如圖所示。

圖4-3 財新與彭博數據新聞選題類型
可以看出兩家平臺都對數據新聞事件梳理、事實對比功能的涉及較少。財新數據新聞的盤點、整合統計功能最為常見,有23篇;其次是對形勢和觀點的解讀說明,有9篇;但并沒有實現數據新聞的預測功能。彭博的數據新聞在說明形勢和解讀觀點上的功能占比最大,有19篇;另外值得一提的是,相較財新,彭博采用復雜算法和數據分析技術擬合出的圖表,更直觀、清晰和有效地揭示問題,提供預見性、趨勢性的內容總結。
數據新聞的信息功能一定程度上依賴于數據處理的復雜程度,因此財新的數據新聞流于盤點整合這類淺層認知的功能,對形勢觀點的說明解讀還不深入,缺少預測功能。相對而言,彭博預測事物未來趨勢和走向的探索走在財新的前列。譬如彭博在《千禧一代將決定誰管理印尼4萬億美元的經濟》報道中對印尼的選民年齡結構、總統候選人在社交媒體上的粉絲數量、消費階層的購買力等多類變量進行分析,預測印尼千禧一代在投票選舉上對于印尼能否成為全球第四大經濟體發揮的作用。
可視化呈現形式多樣,目前學界還沒有統一的標準來劃分,所以依照財新、彭博數據新聞的實際情況,將可視化歸納為以下四種常見的基本類型:全文字靜態是指全篇沒有對數據進行可視化處理,沒有生成圖表,只是將數字穿插于文本之中;靜態信息圖僅以各式表格、圖表可視化呈現數據,但讀者處于被動接受狀態;動態信息圖是指圖表本身呈動態,更加生動形象,但仍是單向的呈現;動態交互信息圖、H5、動畫則是可視化技術更為高級的形式,多媒體融合使得內容意涵的表達更為鮮活豐富,雙向互動性質則將信息選擇的自主權交還給用戶,真正實現了媒體與用戶的聯動。

表5-1 財新與彭博數據新聞的可視化呈現
由表可得,雖然全文字靜態從嚴格意義上來說不能稱其為數據新聞,但彭博和財新都還是存在此種情況,彭博數量略少。彭博和財新都是以靜態信息圖為主,但財新的比例更高,占到研究樣本的83.3%。動態信息圖的呈現上彭博有5篇,財新為3篇。差異最大的在動態交互信息圖、H5、動畫的形式上,彭博有4篇使用了動態交互信息圖,1篇使用了動畫;財新在這類形式上則是空缺的。其次,在視覺設計上也表現出較大差異,彭博的信息圖表用色沉穩低調,圖表美化也以簡約規范為主;財新則偏好用飽和度較高、對比鮮明的色彩,并配以大量與報道主題相關的象形符號和圖形修飾圖表,有較強的視覺吸引力。
財新的數據新聞很大程度延續著平面編輯的樣式,即生產創作還聚焦于“一張圖帶你讀懂xx”思路,有利于新聞要素的鋪展,制作起來方便簡單、節省成本,但只是對傳統新聞數字圖表的延伸。得益于數字技術和數據信息處理軟件的發展,以形象、互動的可視化方式呈現新聞是數據新聞的獨特個性,并豐富了數據新聞的表現形式。但另一方面,可視化終究只是更好觸達、刺激用戶視覺通道的呈現工具,不能與數據新聞劃等號,所以也不應拘泥于可視化[4]。
統計財新、彭博單篇數據新聞不同類型圖表的個數,繪制出下圖??傻?,財新制作一篇數據新聞運用僅運用到1種類型圖表的情況最多,有11篇(占30.6%),其次是運用2種類型圖表,有7篇(占19.4%),沒有運用圖表的數據新聞也有4篇(占11.1%);彭博制作一篇數據新聞利用2種類型圖表的篇數最多,有15篇(占45.5%),其次是利用到3種類型圖表,有8篇(占24.2%),沒有運用到圖表的數據新聞為1篇。

圖5-1 財新與彭博數據新聞單篇圖表類型個數

圖5-2 財新與彭博數據新聞的圖表種類使用頻次
如上圖所示,本調查還分別對財新、彭博使用頻次最高的前六類圖表進行了統計:二者相同之處在于都對柱狀圖、條形圖、時間軸有著較高的使用頻率,不同的是財新更青睞氣泡圖、環形圖和餅圖,彭博則對折線圖、列表和地圖的使用更為頻繁。
差異化存在的原因與數據處理環節的區別和選題內容傾向直接相關。對于圖表的選用并無統一的標準,但不可否認的是圖表的運用需建立在傳播者和用戶雙方共通的意義空間上,不僅要考慮與數據的適配性,還要站在用戶的認知角度權衡圖表的使用率和易讀性。
互動是作為數據新聞成長沃土的新媒體生而有之的規律和特性,也是數據新聞無法回避的生產路徑。對于互動方式類目的構建,參考2012年Webber & Rall分析美國三個新聞網站中的交互信息圖的研究,并結合當下國內外數據新聞互動狀況,將交互由低到高分為5個類別:無交互;低級交互:包括對象交互(點擊網頁上的按鈕或圖案,出現文本、聲音、圖像等回應)和線性交互(用戶在預設的框架下按照一定順序瀏覽信息);中級交互:等級交互(提供預先設定好的不同路徑選項,用戶可以選擇特定路徑來獲取信息)或超鏈接交互(用戶可點擊超鏈接轉入其他頁面);高級交互:用戶能夠自行鍵入信息、自設內容框架或操作組件對象完成特定目標;游戲交互:具有強制性的和明確的參與規則、對用戶的使用情況進行評估,或提供用戶間互動和比較的機會[5]。

圖5-3 財新與彭博數據新聞互動方式
根據統計數據,財新數據新聞中無交互的數量是最多的,有29篇(占80.6%),低級交互4篇,中級交互和高級交互一共不超過3篇,無游戲交互;彭博的數據新聞中也有9篇沒有交互功能(占27.3%),比例明顯低于財新,低級交互的形式是最多的,幾近半數,有16篇(占48.5%),中級交互和高級交互也分別比財新多出4篇和1篇,同樣無游戲交互。
雖然財新和彭博的數據新聞都有各自的特點和長處,但總結上文所述財新與彭博數據新聞平臺的差異,我們可以看到,在生產環節上財新缺少對計算機程序、數據統計等技術人才的重視,生產團隊結構有待優化;在數據來源及處理方面,相對而言,財經專業媒體數據庫建設水平和數據挖掘能力都還有所欠缺;在文本內容方面,財新數據新聞選題立意、社會意義的深度尚且不足,通過數據分析展現出的解釋力和預測力還有一定提升的空間;在可視化交互方面,我國的視覺設計、色彩搭配和圖表應用還需努力與國際高水準的可視化作品接軌,彌補互動機制的空缺。
分析這些差異背后的原因,以問題為導向,本調查針對我國財經類數據新聞平臺提出以下幾點建議:
數據新聞是一個復合型的學科和行業,運用到科技手段幫助的數據新聞,當下我國數據新聞缺乏對良好的技術環境以及對技術人才的合理運用,導致每一次新興科技與新聞的結合似是曇花一現、進展緩慢,這一點在機器人新聞、沉浸式新聞等領域也有所體現。而技術人才能動性和創造性能否得到充分發揮對于數據新聞的挖掘、清洗、分析和呈現起著相當重要的作用,因此在數據新聞業內應當營造一種合適的技術氛圍,加強對計算機程序、數據統計等技術型人才的尊重和任用。還需堅持打破部門之間的壁壘、打破記者和編輯的壟斷格局,形成一支跨部門協作的集成工作團隊和結構完善的人才隊伍。
國內的數據新聞一經發布,便已定型,是典型的“一次性”閱讀材料。但國外的數據新聞注重數據的動態更新和維護,時間和內容上的拓展延長了一篇數據新聞報道的生命周期,提升了新聞價值。今后需把開發超越新聞報道概念的數據產品和工具作為前進方向,依據事實的推進更新新聞要素,形成新舊數據更迭,減少過期數據對用戶的信息誤導[6]。而且還應充分考慮用戶體驗,給予每個終端對應呈現方式上的變化,如適應多屏的布局排版、交互手勢和按鍵等,優化不同終端交互界面。這些都應以樹立產品觀念為前提,著力開發用戶操作體驗更佳、傳播效果更為理想的交互產品。
我國政府近年不斷鼓勵數據的開放,諸如北京、上海等大城市開始探索開放數據,構建數據開放平臺,但政府信息公開、開放數據運動的進程與歐美國國家依舊存在差距。另外,國外許多媒體或機構都建設了結構化的專業數據庫,并開放查詢、下載。財新作為我國原創財經媒體,依托專業的團隊和強大的原創新聞優勢,積累的數據資訊和分析報道已為拓展自身角色成為信息服務商、數據供應商奠定了基礎。媒體可以整合公共數據、自身積累的報道素材及數據,在線挖掘個性化的多維數據來搭建高品質數據庫[7]。
無論從生產團隊、文本內容還是可視化交互哪一部分的分析來看,都指向了數據挖掘和分析的薄弱。數據挖掘和分析旨在揭示隱藏在大容量或復雜數據背后的關聯性和底層邏輯,不僅呈現數據之間的相關性,還需發揮數據的解釋張力,增強數據的判斷力和預測力。
而且,互聯網時代社交媒體、搜索引擎的大數據已經成為反映輿情民意的主要渠道,財新應加快拓展來自社交平臺和移動媒體的數據渠道。擁有成熟的數據挖掘和分析水平之后,權衡好專業化與大眾化的報道角度,以服務公共利益為出發點,挖掘數據之間的關聯性并延伸至主體間的內在聯系,這也是媒體履行功能、承擔社會責任的重要途徑。