陳敏學(xué)
大數(shù)據(jù)與新媒體傳播
陳敏學(xué)
現(xiàn)如今,數(shù)據(jù)量的大規(guī)模增長以及對數(shù)據(jù)越來越廣泛的應(yīng)用,都在表示著大數(shù)據(jù)的時代已經(jīng)到來。大數(shù)據(jù)對我們生活的影響是在不斷擴(kuò)大并且不斷深入的,在生活的方方面面都能體會到大數(shù)據(jù)的影響。媒體作為信息的收集者與傳播者,無時無刻不在與信息打交道。但是就目前來看,媒體對于大數(shù)據(jù)的應(yīng)用遠(yuǎn)遠(yuǎn)不足,媒體行業(yè)仍然在探討如何更好地利用大數(shù)據(jù)以提升整個行業(yè)的水平。大數(shù)據(jù)的應(yīng)用是必然的,作為媒體,要不斷創(chuàng)新思維,改變固有觀念,迎接大數(shù)據(jù)時代的挑戰(zhàn),發(fā)展自我;同時也不應(yīng)在大數(shù)據(jù)的信息時代迷失自我,在信息爆炸的時代更應(yīng)該提升專業(yè)化水平,堅守媒體的本質(zhì)和精神。
大數(shù)據(jù);媒體;個性化;互動;社會責(zé)任
[作者]陳敏學(xué),復(fù)旦大學(xué)新聞學(xué)院。
近年來,隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)量呈現(xiàn)爆發(fā)式增長,大數(shù)據(jù)的概念逐漸被越來越多的人所接受,其影響也滲入社會的方方面面。國際數(shù)據(jù)公司(IDC)預(yù)計,到2020年,50%的商業(yè)分析都將通過依托于認(rèn)知計算技術(shù)的規(guī)范分析進(jìn)行,并且在分析中,對分析有高價值的數(shù)據(jù)將翻倍,傳遞給決策者的數(shù)據(jù)將有60%具有可操作性。同時,IDC《中國大數(shù)據(jù)技術(shù)與服務(wù)市場2013—2017年預(yù)測與分析》研究報告顯示,中國的大數(shù)據(jù)技術(shù)和服務(wù)市場將以年復(fù)合增長率38.7%的速度從2013年1億6550萬美元增長至2017年8億5010萬美元。在中國,大數(shù)據(jù)首先更多地被應(yīng)用于擁有成熟的IT系統(tǒng)并且積累了足夠多數(shù)據(jù)的或者以顧客為導(dǎo)向隨時應(yīng)對市場變化的部門。之后,更多的行業(yè)和部門開始對大數(shù)據(jù)進(jìn)行理性運用,電信和銀行根據(jù)需求進(jìn)行了基于Hadoop的應(yīng)用,政府和醫(yī)療也已經(jīng)開始了他們的大數(shù)據(jù)計劃。
大數(shù)據(jù)、云計算等前沿技術(shù)的蓬勃發(fā)展,對于社會發(fā)展的意義重大。大數(shù)據(jù)不斷深入發(fā)展的趨勢不能阻擋,雖然“大數(shù)據(jù)”一詞在很多領(lǐng)域引起非常多的關(guān)注,但媒體很少提及大數(shù)據(jù)對自身的影響。如2014年2月,《紐約時報》發(fā)表了一篇名為《大數(shù)據(jù)時代》(The Age of Big Data)的文章,文中列舉了很多案例說明大數(shù)據(jù)對社會多個部門產(chǎn)生的影響,卻沒談及在當(dāng)今形勢下,新聞業(yè)乃至整個傳媒業(yè)會受到怎樣的影響[1]。毫無疑問,新聞行業(yè)不能將自身置于大數(shù)據(jù)時代之外,若不能很好地適應(yīng)大數(shù)據(jù)的發(fā)展,不能將傳統(tǒng)新聞報道與大數(shù)據(jù)相結(jié)合,隨時會被整個時代所淘汰。傳統(tǒng)的新聞行業(yè)有自身的局限性,如何更好地適應(yīng)大數(shù)據(jù)的發(fā)展,是需要探討的問題。
(一)大數(shù)據(jù)概念
在2008年《自然》期刊中,提到了現(xiàn)代科學(xué)面臨最艱巨的挑戰(zhàn)之一,就是如何應(yīng)對正在產(chǎn)生的信息洪流。一千萬億字節(jié)就已經(jīng)是很大的容量,但是事實上的需要遠(yuǎn)超于此,這些數(shù)據(jù)都是“大數(shù)據(jù)”的資本[2]。在這里,多次提到了“大數(shù)據(jù)”的概念。“大數(shù)據(jù)”的概念首先強調(diào)了“大”,表示了系統(tǒng)需要管理的數(shù)據(jù)規(guī)模極大,相對于之前的CPU和儲存技術(shù)而言,這些規(guī)模過大的數(shù)據(jù)處理需要特別對待。從歷史發(fā)展來看,超大規(guī)模在提出時表示的是GB級別的數(shù)據(jù),海量數(shù)據(jù)提出時表示的是TB級別的數(shù)據(jù),而大數(shù)據(jù)則是指PB(1015)及以上級別的數(shù)據(jù)[3]。
Gartner研究公司認(rèn)為,“大數(shù)據(jù)是需要利用合理成本的新處理模式進(jìn)行處理才能使其擁有者具有更強的洞察力和決策力的海量、髙增長率和多樣化的信息資產(chǎn)”。在這里,強調(diào)更多的是大數(shù)據(jù)的“資產(chǎn)性”作用。
(二)大數(shù)據(jù)基本特征
在此之前,數(shù)據(jù)的產(chǎn)生與收集一直存在,但是大數(shù)據(jù)有獨有的特征。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計算技術(shù)的迅猛發(fā)展,數(shù)據(jù)的數(shù)量不僅以指數(shù)形式遞增,而且數(shù)據(jù)的結(jié)構(gòu)越來越趨于復(fù)雜化。相對于以往普通“數(shù)據(jù)”,“大數(shù)據(jù)”具有更深層次的內(nèi)涵。根據(jù)IBM商業(yè)價值研究院全球企業(yè)咨詢服務(wù)部執(zhí)行報告《分析:大數(shù)據(jù)在現(xiàn)實世界中的應(yīng)用》,大數(shù)據(jù)具有四個主要特征,即數(shù)量(volume)、多樣性(variety)、速度(velocity)以及精確性(veracity),簡稱為“4V”。“數(shù)量”主要是指數(shù)據(jù)規(guī)模迅速增長,數(shù)據(jù)量從TB上升至PB級;“多樣性”指向數(shù)據(jù)的多種形式,結(jié)構(gòu)化與非結(jié)構(gòu)化相結(jié)合,從單一的文本形式轉(zhuǎn)變?yōu)槎嗝襟w形式;“速度”強調(diào)數(shù)據(jù)的運動,要求分析流數(shù)據(jù),數(shù)據(jù)運動的速度極快,這便要求在不到一秒內(nèi)做出決策;“精確性”有兩個層面的意義,一是原生數(shù)據(jù)的內(nèi)生性和不精確性,二是在數(shù)據(jù)的管理上,可靠性和可預(yù)測性使大數(shù)據(jù)的分析結(jié)果有精確性。
(三)大數(shù)據(jù)發(fā)展現(xiàn)狀
在國外尤其是西方發(fā)達(dá)國家,大數(shù)據(jù)的利用已經(jīng)十分廣泛且成熟。政治和經(jīng)濟(jì)領(lǐng)域中,很多決策基于數(shù)據(jù)分析而得出。在學(xué)術(shù)領(lǐng)域,美國麻省理工大學(xué)計算機(jī)科學(xué)與人工智能實驗室建立了大數(shù)據(jù)科學(xué)技術(shù)中心。該技術(shù)中心主要致力于加速科學(xué)與醫(yī)藥發(fā)明、企業(yè)與行業(yè)計算,并著重推動在新的數(shù)據(jù)密集型應(yīng)用領(lǐng)域的最終用戶體驗的設(shè)計創(chuàng)新。在產(chǎn)業(yè)領(lǐng)域,國外許多著名企業(yè)和組織都將大數(shù)據(jù)作為主要業(yè)務(wù),如IBM、EMC、微軟、戴爾、惠普等國際知名廠商都提出了各自的大數(shù)據(jù)解決方案或應(yīng)用[4]。
國內(nèi)的大數(shù)據(jù)產(chǎn)業(yè)也緊跟世界潮流不斷發(fā)展。國內(nèi)大數(shù)據(jù)已經(jīng)應(yīng)用在金融、電信、政務(wù)、醫(yī)療、文化等行業(yè),并逐步擴(kuò)展到其他行業(yè)擴(kuò)展。如金融領(lǐng)域,螞蟻金服大數(shù)據(jù)應(yīng)用于螞蟻信用,綜合考慮個人用戶的信用,構(gòu)筑信用消費生態(tài);交通運輸領(lǐng)域,中國家庭中GPS的廣泛使用;體育領(lǐng)域中專業(yè)球隊的比賽也利用大數(shù)據(jù)進(jìn)行分析,為球隊制定可靠、有效的戰(zhàn)術(shù)、戰(zhàn)略提供有力的數(shù)據(jù)參考。
不論是國外還是國內(nèi),大數(shù)據(jù)的發(fā)展是十分迅速的,不僅是大數(shù)據(jù)的信息量,更是大數(shù)據(jù)的應(yīng)用量,并且大數(shù)據(jù)的應(yīng)用范圍一直在不斷擴(kuò)大。
(一)應(yīng)用現(xiàn)狀與困境
著名的O'Reilly公司斷言:數(shù)據(jù)是下一個英特爾,像“英特爾內(nèi)置”一樣,未來屬于將數(shù)據(jù)轉(zhuǎn)換成產(chǎn)品的公司和人們。有效的組織和使用大數(shù)據(jù)能夠推動社會經(jīng)濟(jì)和科學(xué)研究的巨大發(fā)展,并帶來前所未有的機(jī)遇。歐美等經(jīng)濟(jì)發(fā)達(dá)國家的一些出版?zhèn)髅狡髽I(yè)在大數(shù)據(jù)技術(shù)的應(yīng)用上已走在前列,這些企業(yè)充分利用大數(shù)據(jù)技術(shù)挖掘企業(yè)的核心價值資源,建立新的商業(yè)模式。目前,國外出版?zhèn)髅狡髽I(yè)有關(guān)大數(shù)據(jù)應(yīng)用主要集中在產(chǎn)品策劃、產(chǎn)品營銷、智能分析和可視化、數(shù)字化教育等方面[5]。
以產(chǎn)品營銷為例,對媒體而言,廣告主是直接的服務(wù)對象。而今用戶大量的在線行為數(shù)據(jù)觸手可及,有針對地投放廣告成為可能,媒體就可以滿足廣告主對精準(zhǔn)營銷的需求。如美國衛(wèi)星電視運營商DirectTV通過部署測試可尋址電視廣告,使其營收中有10%的收入是可尋址廣告帶來。通過可尋址廣告系統(tǒng),廣告主可以自主選定他們感興趣的家庭類型,同時DirectTV會委托第三方數(shù)據(jù)提供商在其注冊用戶中尋找符合要求的家庭[6]。根據(jù)第三方提供的數(shù)據(jù),從各個維度各個層面推斷用戶購買產(chǎn)品的意向,從而為廣告主推薦最為優(yōu)化的用戶。如此一來,通過對大量信息的收集,優(yōu)化其產(chǎn)品營銷使廣告主的投放更具有針對性,以一種和用戶進(jìn)行互動的形式,達(dá)到商業(yè)利益上的雙贏。
同時,媒體應(yīng)用可視化技術(shù),對大數(shù)據(jù)進(jìn)行分析應(yīng)用,提升其信息傳播的能力。大數(shù)據(jù)可視分析是指“在大數(shù)據(jù)自動分析挖掘方法的同時,利用支持信息可視化的用戶界面以及支持分析過程的人機(jī)交互方式與技術(shù),有效融合計算機(jī)的計算能力和人的認(rèn)知能力,以獲得對于大規(guī)模復(fù)雜數(shù)據(jù)集的洞察力”[7]。媒體向大眾傳遞信息,可視化的展示尤為重要。通過可視化處理,大數(shù)據(jù)可以以一種更為生動有趣的形式傳遞到大眾,提升了媒體信息傳遞的水平。
但由于媒體業(yè)在大數(shù)據(jù)的時代缺乏立足的根基,被技術(shù)公司遠(yuǎn)遠(yuǎn)落在后面。根基的先天不足加上發(fā)展開始時間晚,屬于媒體業(yè)的想象空間并不多,大數(shù)據(jù)對媒體的價值非常有限。大多數(shù)媒體機(jī)構(gòu)在大數(shù)據(jù)領(lǐng)域并不具備顛覆創(chuàng)新和業(yè)務(wù)轉(zhuǎn)型的條件,原因是多層次的。首先最為本質(zhì)的問題就是媒體業(yè)所掌握的數(shù)據(jù)資源有限,接下來關(guān)鍵的問題是,媒體業(yè)缺乏處理大數(shù)據(jù)的能力。媒體業(yè)自身生產(chǎn)的數(shù)據(jù)本身就十分有限,對于有限內(nèi)容的數(shù)字化程度也不夠。以紙媒為例,在新媒體的沖擊下,傳統(tǒng)媒體特別是紙質(zhì)媒體所受的沖擊首當(dāng)其沖。國內(nèi)的《新聞晚報》《上海壹周》等,國外的《紐約太陽報》、紙質(zhì)版的《獨立報》等也紛紛停刊,甚至有媒體人稱“紙媒已死!”傳統(tǒng)以版面為對象的生產(chǎn)方式,在開展新媒體業(yè)務(wù)時難以適應(yīng),需重新轉(zhuǎn)化編碼。而在內(nèi)容數(shù)據(jù)庫的建設(shè)方面,很多媒體甚至處于“零”的狀態(tài)[8]。媒體業(yè)在大數(shù)據(jù)環(huán)境下該如何生存和發(fā)展,這是今天媒體人亟須解決的難題。
除了要解決技術(shù)方面存在的困難,媒體作為社會的“守夜人”,應(yīng)該時刻注意內(nèi)容至上。誠然,在大數(shù)據(jù)技術(shù)的支撐下,媒體可以根據(jù)用戶受眾的需求,推送其感興趣的新聞內(nèi)容,更具針對性。如“今日頭條”能夠分析出一些用戶在不同的城市有規(guī)律的往返與切換,從而識別出潛在的目標(biāo)受眾,把相應(yīng)的信息推薦給他們。2016年春運期間,中國鐵路總公司與其下屬的18個鐵路局在“今日頭條”上發(fā)布臨客增開信息,單條資訊的閱讀量達(dá)到了50萬。但是,如果完全以用戶為依據(jù)不加以專業(yè)引導(dǎo),新聞會形成碎片,不利于完整性新聞的傳播,更不利于媒體發(fā)揮輿論監(jiān)督的“守夜人”作用。
(二)媒體在大數(shù)據(jù)時代的發(fā)展展望
首先在數(shù)據(jù)的獲取方面,大數(shù)據(jù)應(yīng)用獲得成功的兩個重要因素一是數(shù)據(jù)源的代表性;二是價值、良好的供給與需求的合作以及有廣泛影響力的平臺。數(shù)據(jù)搜集是數(shù)據(jù)新聞生產(chǎn)流程的第一個環(huán)節(jié),也是最重要的一環(huán),直接影響后續(xù)階段的可信性和有效性。隨著數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù)的發(fā)展,數(shù)據(jù)新聞分析的數(shù)據(jù)量級遠(yuǎn)超傳統(tǒng)新聞圖表的數(shù)據(jù)規(guī)模[9]。媒體在處理傳統(tǒng)新聞圖表的數(shù)據(jù)時已捉襟見肘,在選取、管理及處理的過程中均有明顯的滯后性[10],這就需要媒體運用更多的手段來處理新時代下的數(shù)據(jù)。同時,數(shù)據(jù)的共享性還需要更進(jìn)一步的提升,媒體所獲得的數(shù)據(jù)對于其提升遠(yuǎn)遠(yuǎn)不足,這就需要全社會共同的努力,將數(shù)據(jù)資源進(jìn)一步社會化。
20世紀(jì)40年代美國學(xué)者提出的“社會責(zé)任論”是目前世界四個主導(dǎo)性新聞理論之一,其中一點便是將新聞界提供的信息流、思想流和感情流送達(dá)每一位社會成員,這是對新聞完整性的要求,以保證每個公民平等地分享信息。大數(shù)據(jù)分析下的個性化新聞在一定程度上會造成信息的碎片化,新聞的發(fā)布或許會根據(jù)數(shù)據(jù)分析因人而異。但是大數(shù)據(jù)的發(fā)展是不可阻擋的,并且大數(shù)據(jù)帶來的發(fā)展機(jī)遇不可忽視,媒體處理好個性化與專業(yè)化的問題就顯得尤為關(guān)鍵。媒體充當(dāng)著社會記錄者與信息傳播者的角色,并將自身定位成社會解讀者和分析預(yù)測者。深度解讀和去偽存真本是媒體的重要職責(zé)。在大數(shù)據(jù)的環(huán)境下,媒體在大數(shù)據(jù)全面深刻的洞察功能和豐富的挖掘能力作用下,滿足受眾需求的同時,以專業(yè)的理論和強大的社會責(zé)任感處理整合信息,既不盲目跟風(fēng),亦不因噎廢食,媒體的傳播力、公信力和影響力將得到大大的提升。
大數(shù)據(jù)時代的產(chǎn)生得益于計算機(jī)與互聯(lián)網(wǎng)等技術(shù)的迅猛發(fā)展及在各個領(lǐng)域的廣泛應(yīng)用。大數(shù)據(jù)對各行各業(yè)來說,既是機(jī)遇也是挑戰(zhàn)。大數(shù)據(jù)這一概念從出現(xiàn)到現(xiàn)在,經(jīng)過近幾年的發(fā)展,已經(jīng)在應(yīng)用方面不斷深入和發(fā)展。數(shù)據(jù)的量在不斷地擴(kuò)大,大數(shù)據(jù)的儲存處理技術(shù)也在不斷發(fā)展。反過來,從傳統(tǒng)的數(shù)據(jù)儲存發(fā)展到現(xiàn)如今的Hadoop等一系列海量數(shù)據(jù)儲存技術(shù),讓數(shù)據(jù)的量得以不斷擴(kuò)大,大數(shù)據(jù)的應(yīng)用也因此更具科學(xué)性。作為時代發(fā)展的趨勢,如果能很好地應(yīng)用大數(shù)據(jù),無疑會給自身帶來更大的發(fā)展。媒體行業(yè)也是如此。對于媒體行業(yè)來說,大數(shù)據(jù)仍然較為陌生,如何更好地利用大數(shù)據(jù),仍然是值得媒體行業(yè)探討的話題。以開放的思想和嚴(yán)謹(jǐn)?shù)膶I(yè)知識迎接大數(shù)據(jù)時代,是媒體行業(yè)在大數(shù)據(jù)時代的發(fā)展方向。
[1]官建文,劉揚,劉振興.大數(shù)據(jù)時代對于傳媒業(yè)意味著什么?[J].新聞戰(zhàn)線,2013(2):18-22.
[2]Big data:Science in the petabyte era[J].2008,455:1-136.
[3]于艷華,宋美娜.大數(shù)據(jù)[J].中興通訊技術(shù),2013(1):57-60.
[4]李學(xué)龍,龔海剛.大數(shù)據(jù)系統(tǒng)綜述[J].中國科學(xué):信息科學(xué),2015(45):1-44.
[5]吳仁群.大數(shù)據(jù)在出版?zhèn)髅狡髽I(yè)中的應(yīng)用[J].科技與出版,2016(1):24-26.
[6]黃升民,吳殿義.大數(shù)據(jù)在媒體運營中的應(yīng)用及思考[J].山西大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2015(2):73-78.
[7]任磊,杜一,馬帥,張小龍,戴國忠.大數(shù)據(jù)可視分析綜述[J].軟件學(xué)報,2014(9):1909-1936.
[8]王武彬.大數(shù)據(jù)浪潮中的傳媒業(yè)——兼談大數(shù)據(jù)討論的若干誤區(qū)[J].新聞記者,2013(6):28-31.
[9]徐銳,萬宏蕾.數(shù)據(jù)新聞:大數(shù)據(jù)時代新聞生產(chǎn)的核心競爭力[J].編輯之友,2013(12):71-74.
[10]吳文平,陳沁蓉.以大數(shù)據(jù)為支點推動轉(zhuǎn)型[J].新聞戰(zhàn)線,2014(1):53-55.