喻國明
摘要:文章對大數據、大數據方法與大數據新聞傳播的內涵進行了界定,并從現實生活中新聞媒體對大數據的實際應用案例入手,分析現階段大數據方法在新聞傳播創新中的難點與關鍵,即大數據方法與新聞傳播價值邏輯之間的矛盾以及大數據的數據源的開放等。
關鍵詞:大數據方法;新聞傳播創新;理論定義;操作路線
中圖分類號:G210 文獻標志碼:A 文章編號:1001-862X(2014)04-0005-003
一、大數據方法與新聞傳播創新
1.何謂大數據
提到大數據的大,一般人認為指的是它數據規模的海量——隨著人類在數據記錄、獲取及傳輸方面的技術革命,造成了數據獲得的便捷與低成本,這便使原有的以高成本方式獲得的描述人類態度或行為的、數據有限的小數據已然變成了一個巨大的、海量規模的數據包。這其實是一種不得要領、似是而非的認識。其實,前大數據時代也有海量的數據集,但由于其維度的單一,以及和人或社會有機活動狀態的剝離,而使其分析和認識真相的價值極為有限。大數據的真正價值不在于它的大,而在于它的全——空間維度上的多角度、多層次信息的交叉復現,時間維度上的與人或社會有機體的活動相關聯的信息的持續呈現。
以數據的交叉復現對于還原真相的價值為例:一個家住北京的男人借去杭州出差的機會到上海與情人幽會,回到北京后怕被老婆發現,把相關的短信、微信、通話記錄統統都刪除掉;但他老婆如果掌握了大數據分析方法的話,便很容易獲得真相:查詢酒店的開房記錄、刷卡消費的記錄、甚至他在上海期間一不留神轉發的一條微博都可能透露出他的位置信息。正如《大數據時代》中所引述的,一個孕婦的口味及消費模式等是有一定規律的,單一一條信息并不足以判定她的狀態,但關于她的不同來源的數據集合一旦與孕婦特型(如果我們掌握了這個分析模型的話)高度相關,人們便很容易對她的真實狀態進行一種準確的判斷而不管她自己承認或者不承認。
因此,大數據分析的價值和意義就在于,透過多維度、多層次的數據,以及歷時態的關聯數據,找到問題的癥結,直抵事實的真相。
2.何謂大數據方法
大數據的數據與過去傳統的結構性的數據有很多不同。過去結構性的數據比較單一,成本、時間耗費比較多,而且從它的數據量以及解釋的單一化的層面上來說,其實都存在著缺陷,但是傳統數據的優勢在于結構性好、功能性強。大數據來自于生活的自然流露,包括在生活中的購物行為、搜索行為、表達行為等等,這些都反映著人的真實生活狀態。因此大數據的數據來源本身隨著數字化記錄、存儲和傳輸技術的日臻完善而變得非常豐富,而且其數據的采集幾乎可以與信息的發生同步,獲得數據信息的成本又很低,等等。至于大數據分析,現實的情況是,說的人很多,鼓吹其神奇價值的喧囂聲浪很高,卻鮮見其實際運用得法的模式和方法。造成這種窘境的原因無外乎有二:一是對于大數據分析的價值邏輯尚缺乏足夠深刻的洞察,其次便是大數據分析中的某些重大要件或技術還不成熟。
3.何謂大數據新聞傳播
大數據新聞傳播不同于傳統新聞報道那樣的簡單數字交代,而是展示了一種從宏觀與中觀的層面對與社會某一方面的趨勢、動態和結構性的把握。作為大數據方法在新聞傳播時間中的初級應用是借助類似百度指數等各類數據采集和分析工具去挖掘散落在社會文本“碎片”中的具有新聞價值的資訊描述和意義表達。傳統的新聞采集數據的方式更多的是通過線人、采訪這種形態,大數據方法為媒體工作者提供了一個全新的專業工具,去幫助大家挖掘新聞。
大數據方法視野下的新聞傳播創新包含這樣兩個層次的內涵:首先,它是新聞形態的一種創新,包括可視化信息、人性化的嵌入。其次,它是一種全新意義上的內容創新,及通過碎片化的數據及文本的挖掘技術,實現了新形態上的“減少和消除不確定性”的新聞內容。
二、大數據在新聞傳播領域的實際應用
目前利用大數據資源的實際社會成效、有實際影響力的產品依然屈指可數。數據源的代表性和價值、良好的供給與需求的合作以及有廣泛影響力的平臺,是大數據應用獲得成功的兩條重要因素。
大數據可以實現一種在興味盎然的“新聞游戲化”的參與中完成的傳播讀解和消費的過程。例如《華盛頓郵報》關于奧巴馬就職典禮的報道在其網站中貼出了千兆像素的巨幅圖片展示奧巴馬宣誓就職場景,它可以清晰地放大每一個局部,讓每個參與者“找到”自己和自己的熟人。還有獲得2013年美國新聞獎的雪崩報道,以及阿拉伯之春立體四維報道西亞北非17國的情形,都是運用最新大數據的技術手段改革新聞報道的典型案例。
近期較為成功的大數據報道的案例,就是央視《新聞聯播》在2014年春節期間播出的11集“據說”春運和春節。數據說春運和春節的成功有幾大因素,其中包括新聞形式上的可視化的突破、內容上的數據化新聞和故事化的畫面表達,呈現出“大數據小故事”。
大數據已經是一種客觀存在。只不過,相當長一段時間人們缺少有效整合這些數據的技術和手段,并且使用起來成本很高。互聯網的OTT突破了原來的局限,解決了信息不對稱的問題。其中的關鍵是大數據擁有方的合作與開放。本次作為“據說春運”節目的合作方的百度公司,百度作為最大的中文搜索平臺,每天要處理60億次相關的搜索請求,其海量的數據能夠相當翔實地反映中國網民具體的需求、興趣點,搜索者本人的個人特點,等等。實際上,百度已經可以被視為是中國最大的內容提供者。
三、現階段大數據方法在新聞傳播創新中的難點與關鍵
大數據方法在新聞傳播創新中的難點與關鍵,現階段主要集中在大數據方法與新聞傳播價值邏輯之間的矛盾,以及大數據的數據源的開放等問題。
1.大數據與新聞的價值邏輯之間的矛盾
大數據與新聞報道之間存在著幾對矛盾。首先,實際上的相關關系在新聞傳播中進行因果關系的解讀所構成的矛盾。大數據的核心特色是強調伴隨性指標的相關關系,大數據方法甚至于公開拒絕因果關系的認識邏輯。但新聞的傳統解讀卻是具有強烈的因果邏輯的。如果在新聞報道的呈現中不把因果關系考慮進去,不但與人們的認識邏輯相悖,而且也容易滋長解讀上的隨意性和偶然性,這樣便使數據對于新聞報道來說失去了核心意義。其次,大數據的內在邏輯與新聞表達的邏輯在某種程度上是相悖的。因為大數據強調的是信息結構化,拋開故事中心,“去故事化”,這就和傳統報道中的故事化訴求有矛盾。如何將結構化的數據表現出人類生活的溫度和質感是大數據在應用于新聞傳播過程中的一項極為重要的課題。另外,大數據方法與新聞傳播所要求的精確性之間也是存在矛盾的,新聞是要講究精確性,而大數據方法卻是以模糊性的呈現和把握為特點的。endprint
2.數據源的開放問題
在人人都在說大數據的時代,數據源的開放便非常重要了。互聯網本身是由開放精神組成的。如果我們無從得到權威的數據源的話,大數據方法就是一句空話。因此,大數據時代,Google也好,百度也好,必須有開放的心態。因為數據一旦不公開,就像很多媒體在前兩年打造自己的微博,看起來是一個交流的平臺,但是完全忽略了一個核心東西——只有開放和實現彼此連接,才是具有真正交流價值的平臺。就現實而言,有質量的大數據源常常是掌握在政府及大公司手中,如何開放這種大數據源的使用,事關社會的發展和人民生活的福祉,必須從制度和機制上給予保障。在這方面,美國政府的數據開放政策不但為政府開放數據源起到了一種很好的參照作用,對于大公司所掌握的數據源的開放也有著重要的借鑒意義。如果掌握著數據的公司或政府將數據源封閉在自己的圈子里,數據的巨大社會價值和商業價值就無法實現。實踐表明,對于掌握著數據源的大公司和政府而言,數據放開使政府和公司得到的會比貢獻出去的更多。
大數據方法在未來發展中的“行動路線圖”是怎樣的呢?首先,大數據分析在方法論上需要解決的問題在于:如何透過多層次、多維度的數據集實現對于某一個人、某一件事或某一種社會狀態的現實態勢的聚焦,即真相再現;其中的難點就在于,我們需要洞察哪些維度是描述一個人、一件事以及一種社會形態存在狀態的最為關鍵性的維度,并且這些維度之間的關聯方式是怎樣的,等等。如何在時間序列上離散的、貌似各不相關的數據集合中,找到一種或多種與人的活動、事件的發展以及社會的運作有機聯系的連續性數據的分析邏輯。其中的難點就在于,我們對于離散的、貌似各不相關的數據如何進行屬性標簽化的分類。概言之,不同類屬的數據集的功能聚合模型(用于特定的分析對象)以及數據的標簽化技術,是大數據分析的技術關鍵。
其次,從表現角度來說,嵌入是關鍵詞。我認為,大數據呈現的結果和結論,與人的需求、人的行為、人的認識邏輯需要有一種相適應的嵌入。尤其是在大數據剛剛進入到社會生活領域的時候,一定要順勢而為,跟人的需求相關,跟人的認識行為邏輯相關,這樣人們就比較容易去解讀它,然后去把握它,去消費它,去使用它。比如,與新聞媒介相結合的時候,新聞媒介自身的傳播邏輯、傳播規則、傳播樣式,新聞媒介在傳播過程的需求點上,可嵌入哪些以大數據的服務、大數據的呈現,這要有更多的數據專家去解讀。
最后,與現有的可視化技術發展相聯系。日常生活中一些重大的新聞如果能夠運用大數據來報道,其深度會大大強化,也能夠給人以更強的動感和說服力,并且幫助人們比較準確地把握未來。在這個意義上,大數據與新聞的結合,將是新聞競爭的巨大技術驅動力。
(責任編輯 焦德武)endprint