周笑漩
[關(guān)鍵詞]大數(shù)據(jù);新聞;分析
“大數(shù)據(jù)新聞”是大數(shù)據(jù)時(shí)代的產(chǎn)物,是一個(gè)有別于“精確新聞”、“數(shù)據(jù)新聞”的概念。科學(xué)運(yùn)用“大數(shù)據(jù)新聞”,可以充分挖掘新聞價(jià)值,提升新聞的客觀性、可讀性。
一、概念淺析
美國(guó)學(xué)者尼葛洛龐帝在1996年出版了《數(shù)字化生存》一書(shū),在書(shū)中提出了“數(shù)字化生存(Being Digital)”的概念。這一概念認(rèn)為“人類生存于一個(gè)虛擬的、數(shù)字化的生存活動(dòng)空間,在這個(gè)空間里人們應(yīng)用數(shù)字技術(shù)(信息技術(shù))從事信息傳播、交流、學(xué)習(xí)、工作等活動(dòng)”,即是數(shù)字化生存的核心含義。
隨著對(duì)數(shù)字化生存的深入認(rèn)識(shí)。人們注意到數(shù)字的存在和其巨大的力量。有著“互聯(lián)網(wǎng)之父”之稱的蒂姆·伯納斯·李(Tim Berners—Lee)有一句名言,他說(shuō)“新聞的未來(lái),是分析數(shù)字”。這一觀點(diǎn)引起了廣泛的注意,成為數(shù)字化生存時(shí)代新聞突圍的方向之一。
數(shù)字化生存時(shí)代,一個(gè)最顯著的特征是人類的生活被數(shù)字包裝和裹挾。海量的數(shù)字構(gòu)成了人們生活中的一個(gè)極其重要的側(cè)面。“大數(shù)據(jù)”的概念越來(lái)越深入人心,有分析認(rèn)為,近幾年來(lái),人們?cè)诨ヂ?lián)網(wǎng)留下的信息和運(yùn)用各種社交媒體留下的信息痕跡,甚至超過(guò)了自有記載以來(lái)人類保留的信息總和。有統(tǒng)計(jì)表明,早在2011年,全球的數(shù)字量就已經(jīng)達(dá)到1.8Z,目前沒(méi)有看到2015年乃至2016年的數(shù)字總量,不過(guò)可以推測(cè),也將是一個(gè)極其海量的數(shù)字。面對(duì)新的新時(shí)代,傳統(tǒng)的信息處理模式以及新聞生產(chǎn)方式已經(jīng)無(wú)法滿足時(shí)代的要求,所以變革正在迅速發(fā)生,我們有必要定睛看看這個(gè)信息化時(shí)代的新聞生產(chǎn)。
大數(shù)據(jù)對(duì)于新聞報(bào)道的影響產(chǎn)生于新聞采集、制作、傳播、反饋的全過(guò)程。從原始數(shù)字的收集,到對(duì)數(shù)字的分解,直至條分縷析之后將數(shù)字可視化、形成具體的新聞報(bào)道,這也就是“大數(shù)據(jù)新聞”的全過(guò)程。
對(duì)于“大數(shù)據(jù)新聞”的概念,學(xué)術(shù)界有著不同的看法。比較權(quán)威的說(shuō)法,見(jiàn)于中國(guó)人民大學(xué)方潔的定義。他認(rèn)為。“大數(shù)據(jù)新聞”是基于數(shù)字的掘取、統(tǒng)計(jì)、分析和可視化呈現(xiàn)的新型新聞報(bào)道方式。“大數(shù)據(jù)新聞”的核心是對(duì)數(shù)字的處理這一定義涵蓋了多重定義中的共通部分。
但是應(yīng)該注意到:“大數(shù)據(jù)新聞”與“精確新聞”和“數(shù)據(jù)新聞”的區(qū)別。在20世紀(jì)60年代,美國(guó)學(xué)者菲利普·邁耶提出了“精確新聞”的概念,他提出“記者在采訪新聞時(shí)運(yùn)用調(diào)查、實(shí)驗(yàn)和內(nèi)容分析等社會(huì)科學(xué)研究方法來(lái)收集資料、查證事實(shí),從而報(bào)道新聞。”即為“精確新聞”。精確新聞?dòng)镁_的具體數(shù)字分析新聞事件,以避免主觀的、人為的錯(cuò)誤。它側(cè)重于微觀的具體調(diào)查、實(shí)驗(yàn)和內(nèi)容分析。而數(shù)據(jù)新聞,則指以數(shù)字、公式、字母等靜態(tài)形式來(lái)輔助文字報(bào)道。現(xiàn)在所說(shuō)“大數(shù)據(jù)新聞”。顯現(xiàn)的是對(duì)大數(shù)據(jù)的挖掘與處理的結(jié)果,可以通過(guò)復(fù)雜的交互式、動(dòng)態(tài)化的圖片和視頻來(lái)呈現(xiàn)這類新聞。
二、運(yùn)用“大數(shù)據(jù)新聞”需要注意的幾個(gè)問(wèn)題
大數(shù)據(jù)不等于全數(shù)字。記者既要保證從不同信息源拿到足夠多的數(shù)字,也要對(duì)這些數(shù)字的客觀性進(jìn)行考察。與傳統(tǒng)的抽樣統(tǒng)計(jì)相比,大數(shù)據(jù)的優(yōu)勢(shì)在于擁有足夠多的原始數(shù)字。互聯(lián)網(wǎng)時(shí)代的人際關(guān)系、社會(huì)活動(dòng)、地理位置等一切信息都可以被轉(zhuǎn)換為數(shù)字。因而為全面獲取數(shù)字提供了可能性。大數(shù)據(jù)的來(lái)源有很多,新聞報(bào)道、門戶網(wǎng)站、搜索引擎、社交網(wǎng)站、政府和企業(yè)的統(tǒng)計(jì)、物聯(lián)網(wǎng)和傳感器的檢測(cè),都是獲得數(shù)字的來(lái)源。全面獲取數(shù)字,是將大數(shù)據(jù)分析運(yùn)用于新聞報(bào)道的必要基礎(chǔ)。獲取了足夠多的數(shù)字之后,要對(duì)數(shù)字做客觀的判斷。數(shù)字的定義和界定、統(tǒng)計(jì)方法、統(tǒng)計(jì)范圍等等,包含和傳遞著某方面的價(jià)值判斷,也決定著數(shù)字反映真實(shí)的程度。
數(shù)字并不完全是客觀的,如果用新浪微博的數(shù)字分析社會(huì)事件或者社會(huì)動(dòng)態(tài).記者要注意到微博的用戶主要為高收入的年輕群體,它并不能反映社會(huì)各階層所有人的全貌。如果報(bào)道調(diào)用公安部門的數(shù)據(jù)庫(kù),要同時(shí)記錄的偏向,比是否存在受警員績(jī)效考核制度的影響而導(dǎo)致某些案件病沒(méi)有被記錄在案。因此記者在獲取數(shù)字時(shí),一定要注意幾個(gè)問(wèn)題:來(lái)源在哪、記錄者是誰(shuí)、記錄方式是什么、記錄的目的是什么、記錄者的立場(chǎng)是什么、有無(wú)遺漏、相關(guān)問(wèn)題是否應(yīng)該用定量的方法解決?這些數(shù)據(jù)中是否有隨意的成分等等。
同時(shí)要注意分析模型的科學(xué)性。數(shù)字是冷冰冰的,記者需要借助某種模型挖掘價(jià)值。模型不等于科學(xué)判斷,以數(shù)字判斷現(xiàn)實(shí)需要小心翼翼地操作,模型是否合理?其他模型有無(wú)參考價(jià)值?邏輯上是否嚴(yán)密、判斷結(jié)論是否有主觀因素的強(qiáng)烈影響?這都要求記者有較強(qiáng)的數(shù)據(jù)素養(yǎng)和科研精神。
三、科學(xué)使用“大數(shù)據(jù)新聞”,要做幾方面的工作
打開(kāi)思路,挖掘新聞事件。要求新聞從業(yè)者從舊有的新聞報(bào)道流程中擺脫出來(lái),從舊有的新聞采集、呈現(xiàn)、傳播方式中擺脫出來(lái)。
打開(kāi)技術(shù)的閘門,善于運(yùn)用新技術(shù)。使用靜態(tài)圖表、動(dòng)態(tài)圖表和交互式圖表,生動(dòng)展現(xiàn)新聞事件全貌。提高用戶參與度和界面友好度,是“大數(shù)據(jù)新聞”呈現(xiàn)的核心優(yōu)勢(shì)。
提升新聞工作者的數(shù)據(jù)素養(yǎng)。以人文類學(xué)科的學(xué)術(shù)背景為主的新聞從業(yè)隊(duì)伍,天然有種對(duì)數(shù)據(jù)的陌生感和恐懼感,要努力克服,形成愛(ài)數(shù)據(jù)、善用數(shù)據(jù)的思維習(xí)慣和氛圍。 (編輯/周洋)