程挺松 桂思睿 何倩兒 梅沁怡 謝倩栩
摘要:突發公共衛生事件報道中,數據新聞已成為常規范式。但數據新聞在新冠肺炎疫情報道的應用中暴露出信源透明度低、數據中心主義泛濫和前瞻效力弱的問題。作為數據新聞的“生命”,數據的獲取和排列方式決定了信息傳遞的效率。為深入研究數據挖掘、表征和加工在報道突發公共衛生事件中的功能,文章對上述問題進行了反思,并以澎湃新聞“美數課”數據新聞欄目發布的171張與新冠肺炎疫情相關的數據可視化圖表為研究對象,運用定量分析和個案研究相結合的方法,探究數據新聞生產中各個環節具有的功效與存在的不足。研究發現,疫情期間,數據新聞生產中數據的獲取、表征和加工堅守了新聞的價值本位,革新了新聞的生產方式,而共享環境缺失、人本邏輯偏離和前瞻性不足是數據新聞工作者需要攻克的難題。
關鍵詞:突發公共衛生事件;新冠肺炎疫情;數據新聞;澎湃新聞;可視化圖表
中圖分類號:G210.7 文獻標志碼:A 文章編號:1674-8883(2022)06-0041-05
基金項目:本論文為大學生創新創業訓練計劃項目“突發公共衛生事件數據新聞的傳播困境研究”成果,項目編號:202113290011
不同于以文字邏輯敘事的傳統報道,數據新聞以數據“說話”,深度契合了新冠肺炎疫情期間受眾信息獲取的需求。大數據的功能由輔助新聞報道的“工具”,轉變為預測和決定傳播內容的“引擎”[1]。因此,數據的獲取和表征決定了數據新聞信息傳播的功效。疫情期間,數據新聞的生產有三個環節:數據挖掘,獲取與疫情相關的海量元數據;數據表征,以豐富的可視化手段呈現結構化、脈絡化的信息;數據加工,通過引入可視化元素拓寬新聞敘事的深度和廣度。文章統計了2019年12月至2021年11月期間,澎湃新聞“美數課”欄目下171張可視化圖表的數據來源和可視化手段等相關信息,深入探究數據新聞生產各個環節中蘊含的傳播學理論知識,對數據新聞報道突發公共衛生事件的前景和價值展開預判。
一、數據挖掘
(一)多方數據源交互印證新聞真實
客觀真實是堅守新聞本位的首要原則。新冠肺炎疫情期間,數據新聞通過數據可視化的方式呈現病例數據、物資運輸、擴散途徑和疫情防控等方面的信息。因此,在突發公共衛生事件中,新聞真實的前提是數據真實。澎湃新聞通過征引多方數據源,在數據維度上建構了真實的信息環境。
第一,數據來源數量眾多。疫情期間,澎湃新聞發布的可視化圖表由多個數據源合力驅動。統計發現,在選定的時間范圍內,澎湃新聞“美數課”中以可視化圖表為敘事手段的報道共39篇,包含171張可視化圖表,共引用數據源357個,平均每張可視化圖表引用數據源2.09個。若以單篇數據新聞報道為統計單位,剔除同一報道內不同圖表重復引用的數據源,得出數據源引用渠道為4~8個的圖表類數據新聞報道有16篇,占比最高,達到41%;15篇圖表類數據新聞報道的數據源為1~3個,占比38%;引用9個及以上數據源的圖表類數據新聞報道有8篇,占比21%。
第二,數據來源的種類豐富。學者周謙豪、梁佳霽和許鑫將數據新聞的數據源分成五大類別:一是自主獲取,二是研究機構,三是政府(或政府間機構),四是企業(或非政府組織),五是其他媒體[2]。
依照此類標準,對171張可視化圖表的數據源進行分類統計(見圖1)。從整體上看,政府(或政府間機構)類數據源利用率最高,占比達到30%,數據主要來源于國家與地方衛健委和各類行政主體;來自研究機構的數據源和其他媒體類數據源的利用率相對持平;企業(或非政府組織)類的數據源引用率為18%,信息源主要包括權威性強、專業性強的數據機構。自主獲取數據源的數據新聞報道數量最少,只占總數的2%。
同時,文章摘錄不同種類數據源的詞條,發現澎湃新聞多次引用同一數據源,如在研究機構一類的數據源中,約翰霍普金斯大學發布的數據就被引用了19次。同樣,在以其他媒體為數據源的圖表中,央視新聞數據的引用頻率最高,達到14次(見圖2)。
因此,數據新聞在報道突發公共衛生事件時,通過引用多方數據源印證疫情相關信息的真實與客觀,這是在新聞信息獲取角度對馬克思報刊“有機運動”和人民報刊“有機整體”思想的另一種詮釋,即由多元新聞生產,新聞傳播主體相互影響、相互作用共同塑造的新聞真實[3]。新冠肺炎疫情期間,由多方數據源合力驅動的數據新聞不僅滿足了受眾獲取疫情信息的需求,還能根據媒介議程設置的不同,征引與報道議題相關度最高的元數據。
(二)各類數據源深度契合媒介議程設置
疫情期間,澎湃新聞挖掘和引用能夠充分發揮媒介議程設置效力的數據源,深刻體現其“數字是骨骼”的新聞生產理念。
統計發現,從媒介議程設置的角度出發,171張可視化圖表的報道議題可以分為以下七大類別(見表1)。
澎湃新聞對不同種類數據源的引用與媒介議程存在一定關聯,主要表現為以下兩個方面。
第一,以政府(或政府間機構)和其他媒體發布的數據建模,通過權威的客觀數據佐證病例數據和病毒擴散途徑的真實,以此保障受眾的知情權。疫情期間,某一區域內的病例基數和感染者的行程軌跡對受眾的生命安全構成直接威脅。因此,受眾獲取議題為“病例數據”和“擴散途徑”類信息的優先級最高。這就要求上述兩類信息的來源準確、客觀,才能消除受眾的不安和恐慌心理。統計表明,171張可視化圖表中,議題指向為病例數據和擴散途徑的圖表共有56張,引用數據源120個。
整理和歸類這56張圖表的數據源,發現政府(或政府間機構)和其他媒體類數據源引用比例很高,共引用83次,兩類數據源累計占比72%(見圖3)。政府(或政府間機構)一類的數據源中,除國家、各地衛健委和政府分管部門之外,還包括一些知名政府間國際組織,如世界衛生組織和世界銀行。而源于其他媒體的數據源中,信息獲取的對象主要是不同國家最具權威或知名度很高的媒體單位,如我國的人民日報、央視、新華網,境外的BBC、衛報和紐約時報等。在突發公共衛生事件中,權威的數據來源渠道能夠營造更加客觀的敘事氛圍,一定程度上增強受眾對信源的信任。
第二,以研究機構發布的數據制圖,科普疫情防控知識,從而提高疫情防控的效率。文章對31張傳播疫情知識、解讀相關病理的知識科普類可視化圖表進行了數據源統計。統計表明,在知識科普類的數據新聞報道中,源于研究機構的數據引用率最高,共有38處,占比達到47%(見圖4)。此類數據的來源主要包括海外研究院所、高校和外文文獻。經過專業學者的研究和分析,海量數據得以優化重構,能夠從知識的視角為受眾提供疫情相關信息。而對此類數據源的征引,能夠極大提升受眾信息獲取的效率,從而實現媒介議程設置效益的最大化。
(三)信源不夠透明,共享環境尚未形成
學者楊宏認為,數據新聞對元數據的披露應當做到翔實且透明,一篇專業的數據新聞應盡可能讓讀者有機會鑒證報道的真實性[4]。與財新“數字說”欄目相似,澎湃新聞也存在數據開放程度低的問題。
首先是數據源界定不明,信源披露不夠詳細和明確。統計表明,新冠肺炎疫情期間,澎湃新聞引用的357個數據源中,共有24處以“公開資料整理”和“其他媒體報道”一類的模糊陳述標注數據源。此類較為籠統的標注,阻礙了受眾自主探索數據真實性,因而不利于數據新聞的社交化傳播。
其次是數據共享不夠全面。雖然澎湃新聞標注了每一張可視化圖表的數據來源,但標注形式僅僅是以詞條文本的形式置于圖片內部,并未對詞條設置超鏈接功能,使其能夠跳轉到元數據的獲取界面。突發公共衛生事件的信息量龐大,信息結構也較為復雜,因此數據新聞報道應當打通受眾與數據的溝通渠道,否則受眾將依然被置于較為封閉且被動的信息接收環境中,這一定程度上有礙于數據新聞的傳播。
二、數據表征
數據可視化是數據新聞生產的第二環節。在突發公共衛生事件中,數據新聞可視化強化了信息的表征力,能夠將病例數據、人口流動、病毒擴散途徑等疫情相關信息置于全新的敘事背景下,讓受眾直觀感知疫情風險,從而滿足受眾安全避險的需求。新冠肺炎疫情期間,澎湃新聞生產的171張可視化圖表不僅種類豐富,而且議題分布廣泛。
(一)圖表多元,豐富新聞敘事手法
澎湃新聞數據處理技術精湛,多元圖表的應用延展了信息傳遞的思路。澎湃新聞產出的可視化圖表不僅種類豐富,而且結構多元。多數圖表的結構為復合型,即圖表之間的相互嵌入與交聯。因此,若以傳統意義上的圖表種類作為分類依據,很難體系化梳理171張可視化圖表。
學者譚劍、王明玉和白東鳴以圖表敘事主題為標準,將可視化圖表分為對比型、分布型、關聯型、趨勢型和地理型五大類別[5],較為全面地展現了不同形式的可視化圖表。按此類標準,剔除僅以文字呈現的簡單列表19張和敘事主題不明確的圖表2張,對剩余的150張數據新聞圖表進行分類整理。
統計發現,對比型敘事圖表占比最高,達到71張,主要包括面積圖、氣泡圖和多系列條形圖一類視覺對比性強、易于受眾識別的圖表。關聯型敘事圖表20張,主要有雙線圖、桑基圖和節點關系圖等,能夠清晰展現不同數據之間的關系。分布型敘事圖表主要包括散點圖和熱力圖,能夠展示數據的分布和聚合情況,共11張。趨勢型和地理型敘事圖表共55張,分別以時間軸和區域地圖為信息載體,顯示時空整體維度下的數據特征。
部分可視化圖表同時擁有兩類敘事主題。疫情期間的信息量龐大,于宏觀而言,疫情發展趨勢、波及范圍和社會影響具有整體性;于微觀而言,不同的病例個體有不同的移動路徑和感染癥狀。因此,澎湃新聞以多元圖表擴充敘事主題,做到了宏觀與微觀的結合,符合疫情期間信息傳播的規律,彰顯了“設計是靈魂”的新聞生產思路。
(二)主題明確,切合新聞報道議題
文章統計了不同報道議題下可視化圖表敘事主題的數量分布(見表2)。數據表明,澎湃新聞產出的可視化圖表與報道議題存在一定聯系。從表中數據可知,對比型圖表在病例數據、疫情影響和知識科普類議題中應用率較高,其原因有兩點:一是面積圖和多系列條形圖一類的對比型圖表能夠通過圖幅的大小和長短差異,較為直觀呈現病例基數的變化,量化疫情造成的社會影響;二是對比型圖表避免了對疫情專業知識的直接陳述,而是通過構圖差異和視覺沖擊,闡明病理與癥狀的內在聯系。
例如,澎湃新聞于2020年5月21日發布的《圖解|全球累計確診破500萬,“解封”之路并非一片坦途》就使用氣泡構圖的方式,從流行程度和死亡人數等維度出發,對比新冠肺炎疫情和人類史上其他重大突發公共衛生事件的異同。
關聯型圖表在擴散途徑類議題中應用率較高,是因為雙線圖、桑基圖和節點關系圖能夠清晰還原感染人口的運動軌跡,挖掘地域、防控力度、病例種類等多維度信息之間的內在關聯。同時,趨勢型和地理型的圖表能夠打破時空的限制,折線圖和地圖基底散點圖一類的圖表能夠在時空的整體維度下,呈現脈絡化的病例數據信息。在這種情況下,圖表傳遞的信息不僅是單一的病例數據,還有建模賦予的整體性和連貫性,這是宏觀視角下對疫情發展態勢的“數據把握”。
(三)本位偏離,人本邏輯亟待回歸
有學者認為,在大數據新聞中,作為科學技術手段的大數據“凌駕”于人之上,漸漸形成了一種數據中心主義[6],呈現出與人本邏輯背離的趨勢。新冠肺炎疫情期間,澎湃新聞生產的可視化圖表中,存在部分圖表與受眾需求脫節的問題,主要表現為對專業化外文圖表的直接引用和列表呈現形式下的數據堆砌。
統計發現,171張可視化圖表中,有18張圖表是對外文文獻、研究報告和海外媒體的直接援引,而并未將其轉換為中文圖表;同時,數據呈現能力一般的簡單文字列表共有19張。此類列表的敘事維度較為單一,與傳統文字報道的敘事邏輯如出一轍。在信息傳遞的環節中,媒介起到勾連現實世界和信息世界的作用。而現實世界最終會以什么樣的方式進入信息世界,一方面取決于符號表征問題上的新聞專業理念與倫理,另一方面取決于傳者和受者之間的認知距離[7]。雖然數據可視化增強了數據表征力,但外文圖表的應用和數據的簡單羅列無法縮短傳者和受者之間的認知距離,本質上依舊是數據中心主義的體現。
三、數據加工
數據加工作為數據新聞生產的最終環節,是以可視化元素對建模后的數據進行可視化渲染的工序。可視化元素的引入不僅能夠使圖表更加美觀,更重要的是能夠提高信息傳遞的效率。研究發現,新冠肺炎疫情期間,澎湃新聞加工數據的方式主要包括色彩注入和動態呈現。
(一)為數據注入色彩
數據新聞的誕生是數碼設備普及的必然結果,而移動終端的迭代更新也為色彩的顯示提供了設備支持。疫情期間,澎湃新聞產出的可視化圖表具有極高的色彩應用率,信息呈現色彩為兩種及以上的可視化圖表有131張。除去色彩僅僅起到美化作用或增強視覺效果而無實際指代意義的圖表37張,對余下的94張可視化圖表進行定量研究,發現色彩的注入不僅能夠提高信息對比度,還可以構建新的敘事維度。
1.色彩指代信息,增添敘事維度
研究表明,色彩對信息的指代有兩種實現手段:一是以原色指代同一層級下的不同信息,如性別、醫護人員職位、國家與地區等;二是以某一原色下色調的深淺差異呈現一類信息下的不同指標,如病例基數、波及范圍和民眾對待疫情的態度等。這兩種實現手段都具有共同的功能指向,即引入信息載體、構建敘事維度。筆者對每一張可視化圖表中色彩的指代信息都進行了標記和歸類。統計發現,94張可視化圖表中,色彩指代的信息非常廣泛,不僅包括地理位置、病毒機理和病例數據等一類便于統計歸類或量化的信息,還包括政策響應、態度觀念一類數據表現張力弱的信息(見圖5)。
色彩的注入不會受到圖表類型和議題內容的限制,是相對獨立的可視化渲染方式。在表征形式上,文字或圖像類的具體信息被轉化為具有視覺沖擊效果的色彩,填充于圖表或圖示的不同位置,與圖表的敘事主題相得益彰。這不僅壓縮了新聞的敘事篇幅,還能挖掘不同敘事主體之間的關系,豐富新聞的敘事手段。例如,可視化圖表以病例數據建模,同時以某一原色色調深淺作為背景,指代政策響應力度的強弱。因此,受眾能從強烈的視覺對比效果中直觀解讀政策響應力度與病例數據的內在關系。同理,被色彩渲染過后的地理位置類信息能夠清晰對比不同地域內病例數據和疫情防控水平的差異。
對于信息范式廣、數據表現張力弱的信息,如疫情影響和民眾對于疫苗接種或疫情前景的態度觀念,色彩構建的獨立敘事維度也能自然將其囊括其中。
2.色彩對比度不高,表征強度負載
圖表色彩所容納的信息不能超過人類大腦信息處理系統的閾值,否則會造成敘事環境紊亂的后果,這與數據新聞的傳播理念背道而馳。研究過程中,筆者發現部分可視化圖表的色彩存在對比度不高的現象。而出現此現象的原因在于海量的信息超出了色彩所能容納的極限。因此,數據新聞生產者只能通過削弱色彩對比度、擴充色彩種類的方式增加信息載體的數量,但這卻造成了表征強度負載的問題。例如,澎湃新聞于2020年2月16日發布的《回溯45個重點疫區的數據,我們該如何看待當前疫情?》,在呈現湖北病例數據的面積餅圖中,指代病例數據的“紅色”被分為了色調強度不同的7種色彩。由于對比度不高,這些色彩的效果并不理想,受眾無法從色彩的差異上讀取相關的病例數據。因此,雖然色彩的應用能夠增添新的敘事維度,提高信息傳遞的效率,但過度的渲染卻會造成事倍功半的后果。
(二)為數據構注入活力
1.隱藏時間基軸,優化新聞內容
171張可視化圖表中,動態呈現的可視化圖表雖然只有9張,但表現亮眼。動態可視化圖表所具有的顯著優勢是能以時間序列下可視化元素的運動呈現數據變化的趨勢。因此,時間敘事的維度被隱藏,時間序列上的信息也被運動中的可視化元素指代,進而縮短新聞報道的篇幅,優化了新聞內容。9張動態可視化圖表中,有7張圖表的議題指向為病例數據。動態呈現的方式在讀者獲取信息的過程中構建了相應的時空維度,同時又規避了以靜態文字或圖表來呈現時間變動要素的冗雜和贅余,是對新聞內容的二次整合,也極大節省了受眾讀取信息的時間成本。在動態呈現效果的加持下,受眾能從病例數據的變化中見證疫情發展的整體趨勢,從而構造“疫情整體觀”。
2.前瞻力度不足,預測報道稀缺
疫情發展前景是每一位受眾迫切想要知曉的問題。但研究發現,澎湃新聞僅是通過動態效果重現疫情在過去的發展趨勢,沒有預測新冠肺炎疫情未來的走勢。其原因在于新聞預測不僅受到數據處理技術的限制,還受到新聞倫理和社會效益的約束。學者王茜認為,預測性新聞帶來了新的新聞倫理問題[8]。突發公共衛生事件話題嚴肅,社會創傷面大,與國計民生有直接關聯。而預測性報道能提供的事實只是一種概率性描述,不具備“導向標”的權威性和準確性。一旦預測性事實與社會實際出現了偏差,媒體的公信力和話語權可能會淪為眾矢之的,并且伴隨著經濟損失的巨大風險。因此,若要更大程度地發揮數據新聞的預測功能,首先應當解決的是新聞倫理與法規問題。
四、結語
新冠肺炎疫情期間,從數據挖掘到數據表征,再到最后的數據加工,數據新聞生產的各個環節都充分發揮了數據的獨特作用,適應了突發公共衛生事件信息的傳播規律。但由于數據再挖掘能力的不足和新聞倫理的約束,出現了一定程度的人本邏輯偏離,數據預測的應用也存在諸多限制,期冀數據新聞在未來能不斷發展與創新。
參考文獻:
[1] 李春節,黨東耀.我國大數據傳播研究的現狀與前沿[J].青年記者,2021(18):32-33.
[2] 周謙豪,梁佳霽,許鑫.國內外數據新聞研究與實踐:基于文獻計量和內容分析的比較研究[J].文獻與數據學報,2021,3(2):47-64.
[3] 楊保軍.新媒介環境下新聞真實論視野中的幾個新問題[J].新聞記者,2014(10):33-41.
[4] 楊宏.中美數據新聞專業規范對比研究:以新冠肺炎疫情期間財新“數字說”與紐約時報“UpShot”欄目為例[J].青年記者,2020(36):40-41.
[5] 譚劍,王明玉,白東鳴.數據新聞如何選擇合適的可視化圖表[J].新聞與寫作,2021(8):108-112.
[6] 萬穎.大數據新聞的創新與困境[J].湖南師范大學社會科學學報,2021,50(5):151-156.
[7] 劉濤.理解數據新聞的觀念:可視化實踐批評與數據新聞的人文觀念反思[J].新聞與寫作,2019(4):65-71.
[8] 王茜,尼古拉斯·迪亞科波洛斯.預測性新聞中的倫理問題探討[J].青年記者,2020(13):86-87.
作者簡介 程挺松,本科在讀,研究方向:數據新聞與數字媒體。桂思睿,本科在讀,研究方向:中國媒介與社會。何倩兒,本科在讀,研究方向:中國媒介與社會。梅沁怡,本科在讀,研究方向:中國媒介與社會。謝倩栩,本科在讀,研究方向:中國媒介與社會。