張 洋 米明宇
(1.北京信息職業技術學院,北京100015;2.中央廣播電視總臺,北京 100859)
舍恩伯格認為“大數據不僅改變現有的生活方式,在更重要的意義上大數據正在改變人們的思維方式,以及計算機‘思考’的方式[1]。”大數據正在改變人類世界運轉的方式,新聞領域作為媒體的一種形態,并非大數據技術的重點發展行業,但由于新聞的本質是對數據的搜集和分析,其最終呈現的形態也歸于數據的一種,所以其思維方式、生產流程、傳播方式、交互性等必然要受到大數據技術發展的巨大影響。
新聞的本質在于客觀、真實,大數據在新聞領域的應用因其具有完備性和多維度,使得新聞更加客觀真實。這種客觀和真實是建立在龐大、復雜、抽象的大數據基礎上的。區別于以往計算機輔助報道或者精確新聞,包含數據信息的新聞不再是局部的調查抽樣和相對簡單的量化分析,而對數據規模的要求、數據的挖掘和呈現的深度都有所加強。
大數據技術將看似毫無關聯的海量數據用圖表的方式進行對比,篩選出新聞事件過程中產生的錯綜復雜的數據,并將其還原成新聞事件本身,讓受眾對新聞故事一目了然。數據本身就是故事,大數據實現新聞挖掘,催生數據新聞。新聞生產從傳統的確定新聞選題、根據選題搜集數據的“新聞找信息”,逐漸轉向通過算法對海量數據進行分析、發現新聞熱點或者異動事件的“信息找新聞”。新聞人對數據的解讀將引導受眾更加清晰地明確數據產生的背景及其未來趨勢走向,從而深刻理解新聞事件背后的意義和內涵。
與文字和數字相比,人類更容易接收圖片的信息,因此在大數據背景下的新聞敘事必須采用公眾最容易理解的形式輸出。新聞數據的呈現主要是數據展示和數據解讀,數據展示是通過圖表、地圖、動畫、視頻等方式將新聞相關數據直觀呈現,數據解讀則是分析產生數據的原因和數據形成的規律等。
區別于傳統的數字展現,數據新聞的呈現方式更趨于可視化,利用數據挖掘和分析,將隱藏于數據枯燥、乏味背后的新聞故事以生動形象的視覺效果進行呈現[2]。根據對新華網《數據新聞》、網易《數讀》、財新《數字說》、搜狐《數字之道》、澎湃《美數課》五個數據新聞欄目的全樣本調查發現,可視化是所有數據新聞的展示方式,其中應用時間軸、信息圖、3D動畫、交互地圖等更具互動性可視化形式的新聞占比達96.8%[3]。
傳統媒體因其傳播媒介所有,新聞節目內容呈現形式通常單一。進入網絡及媒介融合時代,特別是以智能手機為代表的智能終端大量普及的今天,所有新聞媒介的內容呈現形式均由原有的傳統單一媒體,演變為文字、圖像、聲音、影像等多元媒體融合的新媒體形式。
在大數據時代,新聞媒介在傳播信息的同時,也在不斷采集和積累數據。新聞即是數據,數據也是新聞。關注新聞節目或者主持人所獲得的即時反饋讓用戶獲得被關注感,由此激發觀眾不斷發表評論,表達自己的想法,電視臺再對這些數據進行分析,找到與節目相關的有效數據,從而策劃觀眾更感興趣、更關注的節目主題。新聞在傳播的過程中,觀眾與節目的互動即是與該節目相關的最強大數據資源。
大數據的價值在于對它的挖掘,沒有算法挖掘的數據并無意義。大數據技術競爭核心除了指對數據的占有量,更高層面的是算法的智能程度。
從大數據技術誕生的那一天起,智能算法就存在其中了。傳播領域應用智能算法進行新聞分發已成為行業共識。大數據技術和智能算法在新聞領域的應用,重構了新聞生產流程和傳播方式,但也在一定程度上由于引領了新聞話語主動權而使專業媒體的意識形態地位受到沖擊。傳統媒體時代,從社會建構的觀點來看,新聞傳播能夠實現意義的建構、話語的生產和認同的重塑。[4]而數據時代的到來,用戶毫無保留將自己的行為數據交給智能算法,使其得到用戶的決策偏好,勾畫出個人信息圖景,從而預測用戶的行為甚至思想,再反推送給用戶,于是用戶接受了算法給予的思想、行為和選擇。用戶以為的自己所做的選擇,可能只是算法在對信息環境、用戶個性綜合分析的基礎上發出的一個行動指令。算法正在無意識地偷走用戶的主觀力量,因此主流專業媒體對算法的開發和把關至關重要。
大數據時代,物聯網和互聯網每一天生成并存儲的數據量大得驚人,但真正能被專業媒體掌握的數據少之又少。不僅用戶數量并非全覆蓋,更因為各個智能單位為了維護自身利益,數據共享幾乎難以實現,新聞媒體能夠訪問的數據在維度上很難實現多元化。因此無論是數量還是維度,目前的大數據都不能成為全數據。既然不是全樣本,那么就一定存在某種程度上的偏頗性,因此對大數據的分析要充分考慮其樣本覆蓋程度。
由于各行業對擁有數據的壟斷和不開放,數據難以做到公開透明,這就可能造成行業數據在采集、存儲、分析、整理和傳輸的過程中被人為篡改或丟棄。大數據受到如此追捧,卻難以做到誠實的本質,根本問題在于管理制度、法律法規的完善遠遠落后于技術的發展速度,技術在產業領域的應用帶來的問題呈集中爆發趨勢,然而對技術本身倫理和道德的研判還在進行中。
個性化服務需要以用戶行為數據為算法基礎,然而無止境的數據搜集和過渡的數據獲取,將個人隱私問題推上大數據時代負面影響的風口浪尖。互聯網平臺應用Cookie技術對用戶日常網絡行為進行記錄并隨時整理以實時進行個性化推薦,這為用戶的工作和生活提供了便利,然而用戶必須認識到,只要身處網絡,所有的匿名數據均可以追蹤到本人。數據挖掘甚至可以通過社交網絡中用戶數據畫出用戶家庭、同事、好友關系聯絡圖,用戶對隱私權的主動權,目前完全取決于網絡服務平臺對隱私數據的應用程度。
新聞生產對大數據進行分析和整理時,不可避免同樣要涉及用戶隱私,整個過程用戶不具有知情權和決定權。用戶對數據的獲取和處理不具有知情權,因此也無法對數據采集說“不”。用戶承擔了巨大的隱私安全風險,而新聞生產也有可能因此而觸犯用戶個人隱私。忽略隱私問題一味發展大數據產業,將是飲鴆止渴,必然引發更大問題而阻礙大數據產業的發展。新聞媒體作為傳播信息的主體,保護公眾個人隱私將是其持續發展的必要條件,因此新聞內容生產的過程中要特別注意挖掘和使用用戶數據的尺度,找到新聞內容生產與用戶隱私保護之間的均衡點,從技術和制度兩方面真正實現用戶隱私安全,這將是大數據背景下新聞媒體可持續發展的重要保證。
大數據時代,新聞發展的機遇和挑戰并存,無論是新聞呈現的可視化、互動性,還是專業媒體話語引領、用戶隱私的保護,都需要新聞人有扎實的專業能力、數據挖掘能力、視覺表達能力,以及保護用戶隱私的職業道德。記者需要借助計算機算法在大數據中挖掘出新聞價值,如果不夠客觀,新聞便失去公信力。因此新聞人在大數據時代不能迷信大數據,而是要更加冷靜、客觀,建立準確的分析模型,謹慎得出結論。