趙晶,徐喆


摘 要:大數據時代帶來的變革已在商界初露端倪,媒體行業亦敏銳地察覺到大數據將帶來巨大的變革,因此各媒體通過平臺合作的方式擴大對資源的利用、增強對數據的分析能力。但無論紙質媒體、電視媒體、網絡媒體或社交媒體,對大數據的使用尚處于摸索階段。筆者認為,媒體在大數據時代的變革首先體現在新聞時效性方面,在下一階段,媒體應充分借助大數據的預測功能進行預測性新聞報道;變革之二應體現在新聞采編方式上,媒體可利用“記者錄入語音數據+大數據后臺同步提取、分析、編寫新聞”的方式進行新聞編寫工作;變革之三應體現在擴大數據庫規模上,媒體可借助媒介社區平臺擴大現有數據庫。此外,大數據時代媒體可通過媒介融合方式挖掘信息的二次價值。
關鍵詞:大數據;發展現狀;預測性報道;媒介社區;媒介融合
中圖分類號:G206.6 文獻標識碼:A 文章編號:1672-8122(2013)09-0047-04
一、大數據的產生與發展
早在1980年,著名未來學家阿爾文托夫勒便在《第三次浪潮》一書中,將大數據熱情地贊頌為“第三次浪潮的華彩樂章”。不過,大約從2009年開始,“大數據”才成為互聯網信息技術行業的流行詞匯[1]。
隨著移動通訊技術、云計算、物聯網等技術的發展,數據的積累已經達到前所未有的地步。大數據的發展基于以云計算為代表的大存儲量的基礎之上,計算機存儲單位已從G、T發展到P (1P=1024T)。可以說,沒有云計算的迅速發展,不會有大數據時代的到來。業界通常將大數據的特點歸納為四個“V”,即多樣性(Variety)、體量(Volume)、速度(Velocity)和價值(Value)。IBM網站關于大數據四個特點的界定中,則用真實性(Veracity)替代了“價值”[2]。
大數據的出現首先對商業產生了重大影響,觸感敏銳的商家逐漸舍棄被動的銷售模式,轉而通過分析客戶以往的消費習慣,主動為其推薦“可能需要的產品”,如卓越、當當等網站會推薦“可能感興趣的書”,在“淘寶”網站上進行購物時會出現“瀏覽過此寶貝的人還瀏覽過……”等信息。我們不難發現,商界已經先于其他領域,牢牢抓住大數據的契機,通過對客戶消費習慣的分析,總結出客戶選擇的偏好,從而制定個性化的推薦服務。
二、媒體大數據發展現狀
隨著商界充分挖掘大數據潛藏的巨大價值,傳統媒體、網絡媒體、社交媒體等也逐漸意識到大數據可能帶來的巨大變革,開始摸索著向大數據時代前進。
紙質媒體依靠紙質平臺很難用客觀的數據對新聞報道的好壞進行分析(好壞是指單篇報道的受歡迎程度),因此目前其主要借助網絡媒體、社交媒體的平臺,通過分析這些平臺上所轉載新聞的點擊率、轉發率等數據進行分析。據《中國微博元年市場白皮書》的統計數據顯示,截止2010年8月,全國共有466家主流新聞機構開通了“新浪微博”,其中包括118家報紙、243家雜志、36家電視臺和69家電臺[3]。借助“微博”平臺,編輯可以根據“微博”評論量和轉發率來判斷一條新聞的好壞,適當調整新聞采編的方向。解放日報報業集團社長尹明華曾說:“一篇稿子好不好,不能光憑主觀判斷,而是要有數據分析。這些數據可能有一部分來自內部專業人士,更多的則來自社會。[4]”
此外,紙質媒體也通過與網絡媒體聯手的方式擁抱數據時代。2012年7月,解放日報報業集團和深圳騰訊公司聯手打造了“大申網”,上海網絡用戶只要登錄QQ,就會獲得最即時的定向推介。此次合作對解放集團有兩大益處,其一,借用騰訊網平臺可以實現新聞的實時報道,彌補了紙質媒體在時效性方面的天然缺陷;其二,騰訊網可以通過分析用戶瀏覽新聞的習慣,定向推介特定的新聞,增強了新聞報道的影響力。
其次,有少量傳媒集團著手與專業調查機構合作,深入開發大數據的潛在功能。如浙江報業集團去年開始投資數據分析項目,將目光放在了未來社交網絡數據的深度挖掘上[1];2012年2月,佛山傳媒集團與尼爾森公司合作,佛山傳媒集團希望借助尼爾森大數據分析的平臺,通過對數據的整合、分析、管理,為他們的轉型發展提供戰略性的策略依據[5]。
在大數據時代的發展背景下,電視媒體主要通過依靠數字技術收集受眾信息以及與網站合作的方式參與其中。目前,數字電視收視率可以通過數字機頂盒實時記錄電視家庭戶的頻道及廣告收視、電視互動服務使用的情況,從而形成了實時的海量數據流,通過回傳通道傳給位于前端的匯總服務器。
走在大數據前列的大型網站,已經意識到大數據時代的核心在于海量數據及其存儲分析能力,正在這兩方面尋求突破。如優酷土豆股份有限公司的搜索平臺擬挖掘和推算出4億多視頻用戶的瀏覽行為數據;搜狐網站正著手搭建基于云計算的大數據平臺,將旗下數據資產全面打通整合,獲取每月9億多人次的用戶數據資產[1]。
可以說,無論傳統媒體還是新媒體,都已經意識到大數據將帶來的巨大變革,但是大數據究竟會對其產生什么樣的影響、帶來哪些變革,尚處于摸索階段。
三、大數據可推動媒體預測性報道的興起
大數據究竟會給媒體帶來什么變革?筆者認為,第一個方面體現在對傳統新聞時效性定義的顛覆上。
目前我國學界較認同的新聞的定義為:新近發生的事實的報道[6]。但在大數據時代的背景下,新聞報道如果僅僅滿足于“對新近事實的報道”是遠遠不夠的。大數據的核心就是預測[7]。為了牢牢把握住受眾的眼球,媒體有必要借助新的大數據技術、憑借自身龐大的數據庫資源,做到一些高準確率的、預測性的報道。
事實上,在美國已經出現利用計算機分析撰寫報道的先例。Narrative是一家擁有大約30名員工的美國公司,它運用Narrative Science算法,大約每30秒就能夠撰寫出一篇新聞報道。2011年該軟件通過收集相關信息寫出了大約40萬則關于少年棒球聯盟的新聞報道。2012年這一數字預計將達到150萬[2]。
但是由于社會環境的復雜性,以及計算機本身計算能力的限制,這種預測性新聞并不適合所有的領域。計算機相對人腦而言不夠靈活,需要人工對其進行重復訓練才可以達到自行分析、編寫新聞的目的,具體而言就是要提供給計算機很多不同的新聞數據,然后根據一定的準則將這些數據分割,通過固定的計算機算法,計算機會學習到一定的概率信息,以后碰到相似問題,計算機就可以按照之前給出的新聞模板生產新聞。但通過這種方式制作的新聞會顯得過于千篇一律。并且,由于計算機需要在一遍遍重復訓練后才可以變得準確度更高,因此,對于數據量過小的新聞領域而言,其錯誤率顯得過高,目前只在體育新聞及金融新聞可行性較大。
因此,在新聞報道中,僅僅將大數據的預測功能作為一種輔助功能,即僅作為提示記者下一個關注點的一種工具,具體采寫過程應該由記者自己完成。
四、大數據可改變新聞采編方式
從上述論證來看,要挖掘大數據的預測功能尚有很長的路需要探索,并且給我們提出一種警示,在媒體發展過程中想最大限度地發揮大數據的優勢,勢必采取人機合作的方式,這種合作方式首先應該體現在對傳統新聞采編方式的改變上。目前,記者的新聞編寫工作主要通過電腦輸入來完成,雖然較之以往的手寫方式便捷許多,但由于記者工作性質的特殊性,需要四處移動,有時無法在截稿時間節點前完成稿件的輸送。
記者可以在專業的數據采集平臺錄入音頻或者圖片數據,而后通過后臺完成數據的抓取以及新聞編寫工作,當然這僅僅指可以套用模版的小稿件。具體操作模式為:記者只要在采訪過程中隨時錄下所需的音頻數據,并且在音頻數據末尾輸入特殊的“符號”,其后通過專業的數據抓取平臺提取相關數據并加以分析,由計算機后臺按照一定的編寫模式撰寫稿件,在得到記者確認后提交稿件庫。比如,在“新浪微博”的博文中添加“@愛馬克”的信息后,“愛馬克”軟件自動為讀者收藏“微博”中的網頁,從而提取讀者感興趣的網頁、文字等數據。筆者認為,可以開發一個類似“愛馬克”的軟件,記者只需在數據錄入過程中添加一個數據提取的道口就可以利用大數據分析后臺進行新聞的編寫工作。
根據現狀來看,大數據時代對于音頻、圖片等方面數據的分析并非不可能。在IBM發布的一份名為《分析: 大數據在現實世界中的使用》的報告中顯示,組織在大數據工作中主要利用的內部數據源有38%來自音頻數據、34%來自靜態圖片或音頻。而在大數據分析能力方面,25%的受訪者報告正在利用語音來分析大數據[8]。
如果這種新的采編方式得以實現,那么將大大加快媒體的發稿率。
五、媒體應充分利用媒介社區資源
此外,在大數據時代,數據本身的價值遠遠大于其技術革新的價值,數據本身是大數據時代的最重要的部分。媒體若要在大數據時代處于行業領先地位,就必須在現有數據庫資源基礎上拓展數據庫規模。
目前,新聞記者獲取新聞源主要通過三種方式:第一,條線記者會定期收到來自條線通訊員提供的信源;第二,從報社的爆料平臺獲取信源;第三,從網絡上獲取信源。前兩種方式雖然在一定程度上保證信源的可靠性,但戈夫曼曾在《日常生活中的一種自我呈現》中指出,當個體處于他人面前時,常常會在他的行動中注入各種各樣的符號,這些符號戲劇性地突出并生動勾畫出了若干原本含混不清的事實[9],即通訊員可能出于對自己利益保護的原因,刻意隱瞞某些事實,致使報道存在片面性的缺陷,并且信源的渠道有限。第三種獲取信源的方式雖然擴大了信源的數量及規模,但逐一瀏覽網頁、辨別信源真偽耗費記者大量精力。
筆者認為,在大數據時代下,可以充分利用媒介社區資源,擴大信源采集量。對于媒介社區的概念在學界尚存在爭議,爭論的焦點主要集中在對社區概念的認定上。目前對社區概念的理解主要有三種,一種說法認為社區是“社會共同體”,是人組成的“群體”;另一種說法認為社區是“地理區域”,或者是指定的“物理空間”;第三種觀點認為,社區概念是上述兩派的合集[10]。
本文涉及的媒介社區主要指第三種,即“社會共同體”和“地理區域”的集合體。所謂“社會共同體”簡而言之就是具有相同興趣愛好、宗教信仰、共同話題等群體,而“地理區域”主要涉及生活環境、血緣關系等方面。
自15世紀古登堡發明印刷機以來,媒介社區逐步開始形成,首先出現的是以讀書會的形式存在的媒介社區,在以廣播為代表的電子媒體出現之后,形成了以廣播節目的“粉絲”為主的媒介社區,在網絡時代,又形成了以虛擬社區為主的媒介社區,所謂虛擬社區就是擁有共同興趣愛好的群體在網絡上形成的小社會。本文所指的媒介社區主要涉及以網絡為主的虛擬社區,但這些虛擬社區既有“社會共同體”特性,又具有“地理區域”特性。
從“社會共同體”這一定義出發分析媒介社區發展現狀,目前主要通過形成大量專業型網站、“討論組”、“討論群”、“貼吧”等方式來實現,比如以吸引汽車愛好者為主的“汽車之家論壇”、以音樂愛好者為主的“音悅臺”網站,其討論的內容往往圍繞一個主題,經常發布諸如新的行業動態、內幕爆料等信息。從“地理區域”這一概念出發分析媒介社區的發展現狀,主要由于生活在某一相同地理社區中的居民,或出于維護自身利益的目的、或出于在同一社區里分享飲食、購物、交通、房地產等方面信息的目的,成立了大量的社區生活網站、“討論群”等,比如上海眾多區縣擁有諸如“南匯生活網”、“閘北生活網”等生活服務類的論壇網站。
無論是依托“社會共同體”還是“地理區域”存在的媒介社區,由于處在媒介社會中的個體對所在社區文化、環境等內容較為熟悉,其提供的信源具有較高的可靠性,并且數據量巨大。在大數據時代,紙質媒體可以考慮抓取這些媒介社區資源,通過與以往數據進行對比、分析,推選出可靠性較高的信源,供相關條線的記者使用。
六、媒體應挖掘信息的二次價值
縱觀各大媒體目前的運營模式,其所擁有的人脈資源以及采編所得的新聞資源只顯現出一次利用的價值,這種價值僅僅產生于引起受眾的關注以及由此產生的廣告價值。當然,獲得這種一次價值的前提是我們所采集的信息能夠引起受眾的興趣,否則或許連一次價值都無法體現。但由此產生的成本卻是高昂的。對于信息這一特殊商品而言,發布一次信息與發布10次信息所產生的成本差異不大,因此,應盡量挖掘信息二次利用的價值。
所謂二次價值主要涉及兩方面,其一,指對數據的重復使用所能產生的額外的經濟效益;其二,指在對數據的二次利用過程中產生的對整個媒體的戰略布局等產生深刻影響的作用。
從第一個方面來看,信息的二次利用最易產生經濟利益的方式就是授權其他媒體進行轉發,但在國內目前知識產權保護極度不完善的情況下,這種二次利用幾乎產生不了多大的價值。
對傳統媒體而言,信息二次利用的真正價值在于通過對龐大的數據庫進行分析、整合,從而預測出市場走向。大數據技術的革命并非像以往的技術革命一樣,在技術層面完全顛覆之前的技術。大數據是基于現有的網絡技術,通過對海量數據的收集、分析和預測,得到數據或者事件之間的相關性的方式。在大數據時代,最重要的部分在于現在已經擁有的龐大的數據庫資源。大數據是人們在大規模數據的基礎上可以做到的事情,而這些事情在小規模數據的基礎上是無法完成的。大數據是人們獲得新的知識、創造新的價值的源泉[7]。
七、大數據促進紙質媒體、網絡平臺融合
哈羅德伊尼斯認為,每種傳播技術都有自身的偏好,他在《傳播的偏向》一書中指出,根據傳播媒介的特征,某種媒介可能更適合在時間上的縱向傳播,而不是適合知識在空間上的橫向傳播,尤其是該媒介笨重而持久,不適合運輸的時候;它也可能更加適合知識在時間上的縱向傳播,尤其是該媒介輕巧而便于運輸的時候[11]。紙質媒體作為一種以文字為載體的傳播媒介,有著可以保存、流傳的特征,便于對數據進行分析,實現價值的二次挖掘。但由于大數據時代是建立在以云計算等數據大存儲量的基礎之上發展起來的,紙質媒體假如希望自身的數據能夠得到大量地、快捷地分析和利用,首先應該完成由傳統編輯平臺向“電子平臺”的轉變,然后利用電子平臺的大數據分析能力起到對新聞事件的分析、預測功能。
此外,利用大數據的預測功能,可以分析讀者的偏好,正確把握市場走向。大數據是一種基于相關分析法的預測方式,它只關注事物與事物之間的相關性,而不關注他們的因果關系,它僅基于已獲得的客觀數據,而不依賴主觀推斷。
眾所周知,目前一份報紙為了預測其市場前景,一般都會采取市場調研的方式來實現。但我們必須認識到,一個個體一旦脫離其日常生活的常態,參與到某種調查過程之中,無論他是有意還是無意,或出于保護自己的目的、或出于討好調查者的目的,在潛意識中會提供一些偽數據,即無論在調查過程中如何嚴格按照調查步驟采集數據,他們所采集到的數據往往與真實數據是有偏差的。
可能有人會提出反對意見,認為大數據同樣可能存在數據虛假的問題。但大數據之于一般市場調查樣本分析相比,其樣本量巨大,因此可以忽略某些數據誤差,從而更接近真實數據。因此,由大數據分析得出的有關受眾偏好的數據更為可信,因為它只關注被調查者已經采取的行為,并通過這種行為推斷出受眾的行為偏好,這種預測范圍既可以統括某個整體,也可以具體到某個特定的個體。只有與網絡平臺合作,紙質媒體才可以等準確地獲得這些信息。
對于網絡媒體而言,雖然可在網絡平臺獲取海量數據,但信源的不可靠性嚴重阻礙其在大數據時代的發展。例如筆者分別在百度地圖、谷歌地圖和丁丁地圖上搜“浦東新區惠南鎮社會保障服務中心”這一信息,卻意外獲得三種不同答案。百度地圖將其定位在惠南鎮城西路附近,并沒有給出精確的位置;谷歌地圖顯示的地址是“上海市浦東新區惠東路4號”;而丁丁地圖顯示的地址為“靖海路201-205號”,可見網絡平臺的數據可靠性不高。
而報紙媒體雖然近幾年來遭受公信力下降的詬病,但與網絡媒體相比,其數據的可靠性仍處在較高水平。因此,報紙媒體與網絡平臺的合作,可以相互揚長避短。
八、大數據促進電視臺、網絡平臺融合
電視媒體雖然具有強烈的畫面沖擊感以及新聞的時效性等天然優勢,但近幾年隨著網絡視頻的發展,逐漸出現收視率、廣告量下降的趨勢。筆者認為,在大數據時代發展前景下,在媒體行業內,或許電視媒體受到的沖擊最大。因此,電視媒體謀求與網絡媒體的融合發展勢在必行。
根據央視索福瑞媒介研究有限公司的監測數據顯示,2013年央視春晚在央視一套的收視率僅為11.36%,低于2012年的收視率17.37%,以及2011年的18.34%。(如圖1所示)[12]。而據CNTV提供的數據,2013年春晚網絡視頻直播累計觀看人數達2.09億人次,較去年上升141%,最高同時在線人數達2255萬,較去年上升97%[13]。這意味著,現在越來越多的受眾選擇視頻網站取代電視來觀看春晚。并且在未來的發展過程中,網絡平臺除了電視臺的頻道資源無法獲得之外,其余資源均可通過各種途徑獲得。因此,電視臺的競爭力逐漸喪失。
圖1 2007年至2013年央視一套(CCTV-1)央視春晚收視率
有些電視臺已經預見大數據時代電視臺的轉型勢在必行,正在摸索“多屏融合”的合作方式,即電視機、計算機、手機等平臺相互合作,進行視頻資源的共享。
2013年3月,樂視網(視頻網站)在北京召開發布會,宣布與富士康科技集團達成戰略合作,與富士康合作開發互聯網電視機頂盒產品[14]。樂視機頂盒就是直接通過互聯網觀看視頻內容,其視頻量遠遠大于電視媒體的供應量?;ヂ摼W電視機頂盒若成功開拓市場,那么意味著海量的網絡視頻資源將消化電視臺現有的觀眾或者說用戶資源。其實,互聯網電視機頂盒的發展已有6、7年的歷史,但由于政府管控等原因一直沒有得到發展空間。2011年年底,廣電總局下發了《持有互聯網電視牌照機構運營管理要求》,規定只要與獲得牌照的7家內容集成商(截止今年1月,廣電總局共頒發了7張互聯網電視集成業務牌照,詳見圖2)的平臺對接,就可以讓自己的視頻內容獲得除電腦、智能手機、平板電腦外的終端支持,此前被叫停的一些視頻網站的機頂盒產品,如小米盒子等也獲得了新的市場空間[15]。市場調研公司奧維咨詢的調研報告指出,2011年智能電視的年出貨量將突破340萬臺,而互聯網電視保有量將達到1700萬臺,到2014年互聯網電視滲透率將上升到80%[16]。
據筆者認為,今后幾年內,將是互聯網電視機頂盒的大發展時期。一方面,由于互聯網電視牌照的限制,網絡平臺欲在這一領域發展,必須取得與上述牌照方的合作;另一方面,由于互聯網電視機頂盒的發展是大勢所趨,為拓寬媒體資源,電視媒體也將謀求與各大網絡媒體的合作。
此外,我們必須認識到,網絡平臺最大的問題在于其缺乏原創性的內容,隨著大數據的概念以及它所能夠產生的經濟效益逐漸被人們所認同,對于知識產權的保護、對于信息源的保護必將被提上議程,屆時,以轉載、轉播為主的網絡媒體就將遇到有價值的內容匱乏或者運營成本高昂的局面。因此,網絡媒體為了避免大數據時代可能出現的數據枯竭現象的產生,有必要和傳統媒體合作。
參考文獻:
[1] 張意軒,于洋.大數據時代的大媒體[N].人民日報,2013-01-17.
[2] 彭蘭.“大數據”時代:新聞業面臨的新震蕩[J].編輯之友,2013(1).
[3] 2010中國傳媒創新報告課題組:2010中國傳媒創新報告[J].傳媒,2011(2).
[4] 尹明華.大數據時代的報業轉型[N].人民日報,2013-01-31.
[5] 王亞亮.大數據推動媒體大轉型[N].佛山日報,2013-02-25.
[6] 郝雨,王艷玲.新聞學概論[M].上海:上海大學出版社,2006.
[7] (英)維克托邁爾—舍恩伯格,肯尼思庫克耶著.盛楊燕,周濤譯.Big Data—A Revolution that Will Transform How We Live, Work ,and Think大數據時代[M].杭州:浙江人民出版社,2003.
[8] Michael Schroeck、Rebecca Shockley、Janet Smart、Dolores Romero-Morales、Peter Tufano:分析:大數據在現實世界中的使用,IBM網站http://public.dhe.ibm.com/software/cn/pdf/Choosing _right_environment.pdf.
[9] (美)歐文戈夫曼著.馮鋼譯.The Presentation of Self in Everyday Life、日常生活中的自我呈現[M].北京:北京大學出版社,2012.
[10] 羅自文.新型“村落”的崛起:媒介社區的內涵與本質[J].國際新聞界,2011(10).
[11] (加)哈羅德伊尼斯.傳播的偏向[M].北京:中國人民大學出版社,2003.
[12] 王雨琦,周飛亞.你家電視死了嗎[N].人民日報,2013-02-22.
[13] 陳文.2億觀眾網上看央視春晚[N].新聞晨報,2013-02-18.
[14] 曉航.樂視網與富士康達成戰略合作[N].中國質量報,2013-03-29.
[15] 郎朗.互聯網電視機頂盒將現新局面[J].中國廣播,2012(2).
[16] 郎朗.廣電總局扶正互聯網機頂盒 視頻網站各投靠山[N].21世紀經濟報道,2011-12-24.