王詠梅 劉研
【內容提要】大數據及相關分析技術推動著新聞報道方式與新聞生產手段的變革,對傳統新聞報道的運作范式提出了新的挑戰。本文主要針對大數據新聞報道的3個認識誤區,即大數據新聞非全數據新聞、大數據新聞的基礎數據并非全部是真實數據、分析方法制約著大數據新聞的客觀性等進行簡要分析,旨在提示在新聞報道中應當科學地運用大數據,避免產生錯誤的新聞報道。
【關鍵詞】大數據 新聞 認識誤區
人類信息的傳播方式與傳播效果既受到科技手段的制約,也受到科技能量的推動。新聞的本質是有價值的信息,新聞的歷史演變大致經歷了口頭新聞、手抄新聞、早期印刷新聞、報紙、廣播電視、電子新聞等幾個階段,其傳播方式與效果同樣與科技密不可分。如何確保新聞報道的真實性、客觀性、全面性,始終是新聞從業者面對的重要問題。計算機技術、互聯網技術與通訊技術的不斷發展,為新聞從業者更好地解決這些問題提供了重要的輔助手段。①比如,興起于20 世紀60 年代美國的精確新聞報道,“為新聞報道提供了更高的精確度和效率”。②
除了精確新聞報道以外,將科技用于提升新聞報道的真實性、客觀性、全面性的具體表現還有計算機輔助新聞、數據庫新聞、數據驅動新聞以及大數據新聞。③ “大數據”的概念來源于維克托·邁爾-舍恩伯格與肯尼思·庫克耶所著的《大數據時代》,作者將大數據時代描述成生活、工作與思念的大變革,認為大數據對社會的好處將是無窮無盡的。④而“大數據新聞”尚不是一個成熟的專業概念,本文將其粗略地理解為依托大數據進行新聞內容挖掘與報道、受大數據驅動的新聞生產方式。
從現有的研究和討論的成果來看,學者與業者主要關注大數據背景下新聞生產所面臨的機會與挑戰、新聞傳播理論與實踐的范式創新、新聞與傳播學教育中的專業設置和人才培養、新聞生產中大數據運用的倫理等問題。雖然有學者對大數據新聞的認識誤區問題進行了研究,但尚不具體,需要進一步加強。本文主要針對大數據新聞報道的3個認識誤區進行簡要、具體分析,旨在提示在新聞報道中應當科學地運用大數據,避免產生錯誤的新聞報道。
首先,大數據新聞并非全數據新聞。
對于大數據新聞而言,最重要的變化體現在報道思維的轉變,即由傳統媒體的定向性思維轉向互聯網的發散性思維,發散性思維意味著依托大數據進行新聞報道的創新。需要指出的是,大數據的數據來源非常復雜,任何事物(比如某個組織、個體)所具有的自然屬性與社會狀態以及狀態的變化,都有可能成為大數據中的一個數據單位——byte。“在目前被廣泛引用的IDC和EMC聯合發布的‘2020年的數字宇宙報告預測,到2020年,全球數字宇宙將會膨脹到40000EB,均攤到每個人身上是5200GB以上。”⑤盡管大數據的數據量非常巨大,即使某個特定的大數據新聞前期具備40000EB的基礎數據,對這個基礎數據的分析、挖掘也可能只是全部新聞數據“冰山的一角”,而非全部數據。如果不注意大數據新聞的本身不是全數據新聞,在一定條件下會對新聞報道的全面性造成影響。
對于大數據與非全數據的關系,王馥芳在其《從大數據危機到全數據革命》一文中指出,大數據的“不完全代表性”體現在4個方面:一、大數據在很大程度上是外部事件驅動以及數據服務商商業模式主導的結果;二、大數據有可能受到數據運營商的操縱;三、大數據在某些情況下可能只是諸多無效信息的無度膨脹;四、真正有價值的數據是認知無意識數據,但限于目前的大數據挖掘技術,這部分數據仍不可能被挖掘出來。⑥
其次,大數據新聞的基礎數據并非全部是真實數據。
大數據中的數據有很大比例來源于互聯網,數字化是大數據新聞的顯著狀態。從這個意義上來看,大數據新聞是某種語境下的宏觀抽象,而非鮮明的個體形象,通常不能為讀者講述生動的、引人入勝的、真實的“故事”?;ヂ摼W生態系統中存在著大量虛假信息、偽劣數據,而真相信息、重要數據極其匱乏。針對這一現象,邵培仁教授提到了“信息污染”的概念,認為媒介信息中混入了有毒性、有害性、欺騙性、誤導性的信息元素,對媒介生態、信息資源以及人類身心健康造成破壞、損害等不良影響。⑦因此,大數據新聞的基礎數據中所包含的數據并非全部是真實數據,在新聞數據飛速增加的背后,很可能裹挾著大量的“被污染了的”虛假數據、娛樂數據、廣告數據,這些附加數據的存在同樣影響著大數據新聞的真實性,從長遠的傳播效果來看,會逐步降低讀者閱讀新聞時的情感體驗。
最后,分析方法制約著大數據新聞的客觀性。
丹納·博伊德與凱特·克勞福德認為大數據成為文化、技術和學術研究的現象,其依據是技術、分析方法、神話三者的互動,其中,研究方法是大數據的重要組成部分。⑧大數據新聞的分析方法具有自己的特性,是否恰當地運用了分析方法,制約著大數據新聞報道的客觀性。相對于大數據以前的新聞進行隨機抽樣、精確分析以及探求因果關系而言,大數據在理論上囊括所有數據,強調效率,而非精準;強調相關性,而非因果關系。⑨面對與特定新聞相關的海量的數據,“我們傳統的數據組織和處理模式已經無法滿足其需求,再加上大數據具有規模大、價值高、交叉復用等特征”,⑩因此,大數據新聞需要在分析方法、分析理念上進行全面創新。大數據的背后隱藏著有關人類行為特征的客觀、普遍規律,只有科學地對大數據進行分析才能充分體現出大數據新聞的價值。
大數據新聞的特別價值在于采取科學的分析方法對某些危害社會、個人健康乃至生命安全的重大事件進行預測式報道,從而減少這些重大事件的危害范圍與危害程度,比如即將出現的大規模傳染性病毒、將要發生的食品衛生安全事件等。一個典型的運用大數據進行重大社會事件預測式報道的案例,是在2013年10月“中國網”等相關媒體報道的。日本NHK電視臺報道了日本相關機構運用大數據預測大規模流感即將發生的事件,為相關部門采取恰當措施防止流感的進一步擴散提供了情報支撐。根據最終的統計數值來看,除了個別偏遠地區的情報統計并不十分確切以外,流感的實際情況與大數據預測分析的結果基本一致,而這些個別情況所造成的影響,也可以通過“社會媒體”等大數據進行彌補。
結語
“在運用大眾傳播手段創造共識時我們必須時刻提醒自己:人類傳播科技日臻完美的同時也使得進行空前的大規模破壞的手段逐漸完善。無論是大眾傳播工具還是原子能,這些工具的發明者本人并沒有指明怎樣去使用這些工具?!睂⒋髷祿鳛樾侣剤蟮赖氖侄尉哂袃擅嫘裕枰覀冊趯嶋H工作中正確地運用大數據,發揮其應有的正面價值,避免在新聞報道造成不必要的損害。為了更好地面對大數據新聞帶來的機會與挑戰,需要我們在新聞與傳播學的教育上進行相應的調整,比如從新聞專業設置、師資隊伍建設、人才的培養模式等方面進行重新思考和重新定位,努力培養兼具新聞與傳播學、計算機科學、信息科學等學科才能的綜合性人才。
注釋: ①米切爾·斯蒂芬斯、新聞的歷史[M].北京大學出版社, 2014.
②③喻國明、從精確新聞到大數據新聞——關于大數據新聞的前世今生[M].青年記者,2014,(12).
④ 維克托·邁爾-舍恩伯格、 肯尼思·庫克耶.大數據時代[M].浙江人民出版社,2013.
⑤數據轉引自“中國統計網”:http://www.itongji.cn/article/040I14R014.html
⑥王馥芳.從大數據危機到全數據革命.中國社會科學網,http://www.cssn.cn/zx/201503/t20150324_1557599.shtml
⑦邵垃仁等.媒介生態學[M].中國傳媒大學出版社,2008,168-188.
⑧danahboyd& Kate Craw-ford (2012) CRITICAL QUES-TIONS FOR BIG DATA, Information, Communication & Society, 15:5, 662-679, DOI: 10.1080/1369118X.2012.678878
⑨鄭宇.大數據與小數據:節目生產、營銷與評估的秘密.看傳媒,2015-5-10.
⑩陳力丹、李熠祺、娜佳.大數據與新聞報道[J].新聞記者,2015,(384)
中國網:日本用大數據技術預測流感 預測與分析結果精確http://www.china.com.cn/news/world/2013-10/21/content_30353446_2.htmLouis Wirth.Consensus and mass communication. American Sociologist Review. Vol.13, No.1(Feb.,1948),pp.1-15
(作者單位:王詠梅,內蒙古日報社;劉研,內蒙古大學文學與新聞傳播學院 )
編輯:范永