本刊特約評論員

■ 沈 陽清華大學新聞與傳播學院教授、博士生導師
大數據的本質是一種更加精準、精確、精妙描繪世界和改造世界的認知方法。從數據到信息、從信息到知識、從知識到智慧,這是人類在智能互聯網時代的認識和表達邏輯。這個邏輯的實現,源于數據生產力的大幅度提升,也源于數據生產關系的進一步理順。
數據生產力的變化體現在人類所獲數據的量級持續上升,2020年將達到100ZB。當前,互聯網公司對個人的刻畫維度達200萬個,人臉識別公司正從身份識別走向情感和情緒識別。人類由單純積累數據向深度開發利用數據的階段過渡。由數據統計到信息歸納是一次飛躍,由知識到智慧更意義非凡。前者主要依靠大數據,后者需要人工智能解決。
媒體的數據屬性正在持續深化。就媒體運營的各個環節而言,數據所起到的作用日益顯著。選題階段,編輯和記者僅憑自己的專業能力便可判斷一個選題的價值,甚至偶得佳作。 但數據支持能夠使閱讀量、正面傳播效果、時度效表現等情況愈加明晰。寫作階段,基于大數據的輔助寫作系統漸趨成熟,機器新聞在財經、地震、體育等細分領域已達實用化水平。傳播階段,數據有助于描畫不同平臺投放、不同介質觸達等情況。評估階段,數據分析作為輔助手段已非常普遍。以此觀之,數據在當今媒體全流程中發揮的價值已經不小,大數據和人工智能的進一步成熟將使之發揮更大作用。
現在,網絡游戲里的人物和任務已全部可量化顯示。未來,如果專家的采訪、受眾的分析、事件的解剖也能全量化,其精確性將有質的飛躍。
媒體大數據近年來取得突飛猛進的發展。一是新媒體乃至傳統媒體的運營和成長初步建立了多套評估體系。微博、微信以及各類客戶端的單一和融合傳播指數層出不窮,代表了行業的強勁需求。二是各類媒體融合大數據平臺,如中央廚房、媒體大腦、媒體云等,實現了集中化數據分析、多介質分發管理和全流程邏輯控制。三是人工智能和大數據在媒體領域的運用如火如荼。用戶洞察、受眾分析、機器新聞、侵權追蹤、輔助寫作等明顯進步。四是智能推薦逐步成為各類App的標配,且其對用戶興趣的理解水平達到了新的高度,這也是未來智能互聯網人機交互的起點。
然而,媒體大數據也暴露出諸多弊端。一是純數據評估缺乏專業意見和價值判斷,雖然實現了評估自動化,但可能無法真實反映行業發展。二是媒體融合大數據平臺的實用價值、使用頻度、人機交互友好性等還不盡如人意,尚存較大提升空間。三是細分領域的應用雖然持續深入,但還沒有形成整個行業的普遍應用,通用性、易用性、普及化程度有待提高。四是某些智能推薦平臺雖然獲取了海量用戶,但低俗內容把控不嚴導致受眾信息繭房現象突出,智能化和反低俗化之間仍待權衡。記錄真實、發現美好、強化監督、感知風險,真正實現媒體的社會價值,還需持續探討。
除了媒體大數據本身的問題,大數據應用的共性矛盾也在凸顯。一是數據造假現象較為突出。從閱讀量、日活量、發行量等數據的不可靠性,到機器ID、虛假賬號、擬人操作的盛行,互聯網灰暗產業的體量已較為龐大。二是數據產權保護意識不到位。如何在數據的積極利用和產權保護方面取得平衡,也是亟待解決的矛盾。三是個人隱私泄露嚴重。目前部分互聯網公司掌握機器ID所關聯的用戶數據。人臉識別成熟后,生物ID所關聯的用戶數據也將進一步被挖掘,受眾持續讓渡自己的隱私權。
這些矛盾需要管理部門、網絡平臺、專家學者、廣大網友在媒體發展中逐步解決。方興未艾的媒體大數據尚需支持、鼓勵和批評!