文|蘇玥成
所謂的大數據,可以稱為在合理時間內擷取、管理、處理、整理,并為數據者提供決策支持的資訊,通常被認為具有4“V”特點,即Volume、Velocity、Variety、Value。通過大數據技術,可以進行大量數據,甚至全數據的采集和分析,但其核心意義主要體現在管理和應用層面。
1980年《第三次浪潮》中被稱為“華彩樂章”的大數據在近年來爆發式的展現在人們面前。隨著互聯網信息技術的不斷發展,數據積累、采集、發布的渠道日趨豐富,社交媒體的廣泛普及更為數據采集、分享提供了前所未有的理想環境。
目前,大數據已經不再是一個單純的IT概念了,它的影響已經延展到各行各業,并且通過移動互聯網以及各類終端走進人們生活的方方面面。在傳媒業,大數據技術催生出一種全新的新聞形式——數據新聞。它從海量數據中發現和挖掘,通過分析和洞察得到更有價值的信息,然后再通過數據分析、判斷后,通過可視化操作將信息傳遞給受眾。
縱觀近年來大數據新聞的媒體實踐,主要表現在調查性新聞、趨勢預測性新聞、深度報道、新聞線索與選題發現、可視化敘事、受眾反饋價值分析、用戶內容消費行為和傳播行為分析、采編業務工作初制等幾個方面。
統計顯示,我國網民數量已經突破5億,而且網民和電視觀眾這兩個群體是高度重合的。2014年1 月25日,央視新聞與百度的合作,以春運為主題,將大數據分析結果可視化,成功制作了一期“數據說春運”,廣受好評。
春運高峰,每天有數千萬人次在全國各個城市之間遷徙,在遷徙途中,人們使用智能手機等各種終端時,產生了大量的數據。這些數據可以很權威的反映出春運的真實情況。央視《晚間新聞》欄目敏銳地抓住這一選題,并聯合百度LBS定位大數據,在25日推出了“數據說春運”特別節目,首次采用百度地圖LBS定位技術,將大數據分析結果可視化,播報國內春節人口遷徙情況(如圖1、2)。

圖1、2 為央視“據說春運”系列圖

圖3、4 為央視“據說春節”系列圖
【導讀】統計顯示,我國網民數量已經突破5億,而且網民和電視觀眾這兩個群體是高度重合的。2014年1月25日,央視新聞與百度的合作,以春運為主題,將大數據分析結果可視化,成功制作了一期“數據說春運”,廣受好評。在一些業內人士擔憂互聯網對電視的沖擊時,央視有效利用互聯網與新技術打造出“據說春運”、“據說春節”與大數據的巧妙結合,開創了一種全新的傳統媒體和新媒體之間的互動模式。2013年11月7日,新華社稿件《愛在那兒——“爸爸去哪兒”大數據解讀》在新媒體專線和“新華社發布”“新華社中國網事”等微博、微信客戶端上發布,獲得較好社會反響。這是新華社首次運用大數據分析對媒介事件進行解讀,為視頻節目收視評估提出了全新的標準,具有極大的商業開發價值。
以百度提供的遷徙動態圖為例,百度通過LBS開放平臺分析手機用戶的定位信息,能夠映射出手機用戶的遷徙軌跡,數億用戶的遷徙軌跡就構成了一張實時變化的動態圖。我國目前5億多手機網民,而百度LBS開放平臺的定位服務覆蓋了數十萬款App,每天的位置請求數量超過數十億,由百度LBS提供的定位信息數據無疑是最有說服力、最能反映出春運人口遷徙動態。
首次播出后,觀眾們對這種運用數據可視化技術播新聞的新穎方式非常感興趣,網絡中一片叫好之聲。隨后除夕之夜,央視新聞聯播推出“據說春節”,采用百度地圖的位置信息、百度指數來解讀春運、年貨、年夜飯的詞頻信息,每天用數據來解讀回娘家、恐聚族等春節期間熱門話題,成為許多觀眾每天追看的單元,引發巨大關注(如圖3、4)。
從上述節目的形式和內容來看,央視新聞對于從數據中挖掘新聞、提煉新聞越來越熟練,呈現給觀眾的內容也更加豐富有趣,除了視頻、文字還有景區熱力圖這樣的服務性資訊,更加貼近普通觀眾的生活和民生。作為中國影響最大、受眾最廣的媒體,在一些業內人士擔憂互聯網對電視的沖擊時,央視有效利用互聯網與新技術打造出“據說春運”、“據說春節”與大數據的巧妙結合,開創了一種全新的傳統媒體和新媒體之間的互動模式。近幾年,電視與互聯網的融合趨勢越來越明顯,很多火爆的電視節目通過互聯網的二次傳播得以影響更多觀眾,但這種臺網互動的模式,主要體現在傳播層面。而央視新聞“據說春運”“據說春節”調用百度的大數據,將其融入新聞內容的策劃與創作過程中,是互聯網和傳統媒體的融合的典型案例,央視借力新媒體和新手段,把媒體報道的范圍和創造性提升到了新的水平。
2013年11月7日,新華社稿件《愛在那兒——“爸爸去哪兒”大數據解讀》在新媒體專線和“新華社發布”“新華社中國網事”等微博、微信客戶端上發布,獲得較好社會反響。這是新華社首次運用大數據分析對媒介事件進行解讀,為視頻節目收視評估提出了全新的標準,具有極大的商業開發價值。報道在形式上采用大數據統計發布的形式,在對象選擇上貼近網絡用戶的關注焦點,迎合受眾心理和受眾需求,是一次大膽而有益的嘗試。稿件發布24小時內,已在微博、微信、客戶端等平臺轉發數千次。
《愛在那兒——“爸爸去哪兒”大數據解讀》作為新華社新媒體中心創意的系列產品的開篇之作,是由新媒體中心創意聯合數托邦創意分析工作室,進行數據挖掘、分析和發布的。雙方用新浪網提供的數據,抓取了新浪微博上涉及“爸爸去哪兒”的45.5萬條原創微博,并對36.7萬個獨立原發作者(去除疑似“水軍”用戶)、1300余萬條用戶微博以及近1億的關系數據進行分析,描繪出節目口碑、“收視群體素描”等內容。稿件采用圖片、圖表等易于接受的方式,將節目受眾的地域、性別、年齡、職業、娛樂偏好等標簽展現出來,結論和數據淺顯易懂,同時具有很高的參考價值和商業價值。
據數托邦聯合創始人楊玥介紹,數據來源于45萬余條微博,摒棄了統計“大于30”即可稱為“大樣本”的傳統概念,充分體現了大數據時代“樣本等于整體”的概念。在數據來源中以客觀數據分析為主,不包含主觀數據,更加反映了數據分析的嚴謹性與科學性。分析中尤其關注人民日報、南方周末等嚴肅時政類媒體的受眾群,因為他們更為成熟、理性,這樣的分析體現了報道對用戶選擇的重視程度。數據挖掘過程中除了性別、地域、年齡這些傳統的數據分析類目以外,還有針對性的增加了媒體偏好、笑點、淚點以及贊助商回報等內容,角度新穎,內容充實、結論可信,符合新媒體受眾的需關注點與興趣點,迎合了大眾需求,同時具備很高的商業價值。稿件統計結果采用簡單、活潑的方式呈現,通俗易懂,充分考慮到新媒體受眾的接受特點,有很強的可讀性與視覺沖擊力。在必要的時候加入了數據統計口徑的定義和說明,增加數據分析的預測性和延展性,使受眾理解,同時也反映數據統計的嚴謹性與科學性(如圖5)。

圖5 為新華社制作 《爸爸去哪兒》節目受眾的“媒體偏好”
稿件播發后,反響熱烈。多個機構通過各種渠道聯系稿件的主創團隊,以期得到更詳細的分析數據,用于節目營銷、廣告招商、臺網合作方選擇等工作中。
新華社作為官方媒體,緊隨央視之后試水大數據,顯示了大數據對當前新聞傳播的重大影響。這一舉措既體現了大數據時代傳媒的主動轉型,也表現了新聞媒體行業在大數據的驅動下的理念創新。
2014年,大數據在新聞傳播方向的發展方興未艾。伴隨移動技術的發展,微博用戶迅速增長,微博成為網絡輿情的重要來源,如何把握微博輿論的敏感內容和傳播趨勢是一個大課題,而監控微博輿情能夠讓網絡輿情的研判和引導更加科學化。在今年的全國兩會期間,大數據便成為了各家媒體報道的重點形式。
兩會期間,實時微博輿情監控系統應用大數據技術,持續不間斷地采集最新海量微博數據(最高可達每小時上百萬條),并對采集到的微博數據進行數據分析、提取。基于大數據分析,可以從時間、空間兩個維度提供兩會熱點話題在微博中擴散的趨勢。同時結合地理位置信息服務,通過地圖看到微博用戶在討論兩會中的什么熱點話題、用戶的地理位置以及討論的時間。
以新華社為例,今年新華社在政府工作報告發布的重要節點播發了《大數據解讀政府工作報告》《“來自報告的你”——對政府工作報告的“貼身”解讀》《兩會微談:“權力入籠”嚴防“牛欄關貓”?》等稿件,得到媒體較好采用(如圖6、7)。
在這些報道中,通過挖掘報告中的“熱詞”和重要數字,并與歷年進行對比,從而對今年的報告做出準確解讀。內容豐富,表達凝練,簡潔明了,將復雜的問題用圖解的方式呈現出來,讓普通人更能夠理解和把握報告的主要內容。而稿件《來自報告的你》緊抓時下流行,標題引人入勝,還在文中虛擬出人物“董小姐”,將普通百姓的生活和報告中的關注熱點連接到一起,簡單易懂,讓百姓有很強的代入感。通過“新華社中國網事”新浪微博,該稿件以圖文結合的方式同步解讀政府工作報告,令人印象深刻。

圖6、7 為新華社大數據解讀政府工作報告
稿件中通過大數據分析制作圖表,用可視化方式呈現,提煉精良。不同于傳統的新聞播放,該稿件完全以圖片為主,文字量小,符合讀圖時代受眾的“快餐口味”;稿件中的圖表使本來晦澀的時政新聞變得清新明快,淺顯易懂,利于受眾接受;圖表以整塊的豎版長方形圖片出現,內容以條狀帶配合文字劃分,符合移動互聯網時代的智能手機、平板電腦等終端的呈現要求,從而使得稿件適合在微博、微信朋友圈等網絡平臺中閱讀和傳播。

圖8、9 為湖南衛視制作“我是歌手2”數據盤點圖
2014年4月4日,湖南衛視金牌節目“我是歌手2”第二季落下帷幕,9日,湖南衛視官方微博推出“我是歌手2”大數據,用圖表、關鍵詞的形式呈現了“我是歌手2”第二季關注熱點。報告中用數據詳細展現了誰是“爆紅”歌手?誰家粉絲最奔放熱情?最受歡迎十大金曲、最受關注“外圍”人物、最難忘瞬間、最熱門關鍵詞都有哪些(如圖8、9)?
報告通過對各大門戶網站新聞報道的收集,對微博、微信、貼吧等平臺的觀測,累計大量數據,通過圖表清晰直觀的展現了各類人群對“我是歌手2”的關注。報告關注了節目受眾的年齡、地域等多個方面,并對節目中的出彩瞬間,熱門話題、受歡迎的金曲等一一做了總結。在“我是歌手2”的收官之時推出這一系列數據,是湖南衛視自身對節目的獨特總結。利用大數據的方式,節目組能更好的重新認識和定位“我是歌手”這個節目,也讓觀眾在欣賞之余能對節目有更深入的了解。
湖南衛視近年來發展迅速,尤其是在創新方面積極探索,多有收獲。此次,湖南衛視結合本臺黃金欄目,采用大數據新技術,從數據中發現、挖掘信息,并通過數據的可視化將信息傳遞給受眾。既通過數據來了解觀眾正關注什么話題,從而進行自身的建設;又用數據來為觀眾解讀話題,引導觀眾審閱節目。
該報告由湖南衛視“我是歌手”官方微博首發,在短時間內被大量關注和轉發,隨后多家媒體在報道中均使用了此份大數據報告。湖南衛視的此次大數據解讀完美收官“我是歌手2”,再一次吸足了媒體、網民的關注。
互聯網發展到今天,生產、存儲、積累的數據量之大,已經超越了一般人所能想象的范圍。數據讓人們不僅能掌握歷史信息,還能更好地預測未來變遷。數據新聞絕不僅僅只是有趣而已,大數據帶來了對新聞傳播領域的一種新的理解。大數據支持的新聞報道從關注社會表層現實到發掘社會深層現實,有助于媒體建立起新聞報道的透明性;媒體從信息收集者和平臺搭建者到社會意義生成者,有助于提供可靠的洞見和預測;可視化新聞敘事可適應受眾理性認知和感性認知整合的需求。對于媒體行業發展而言,在未來,大數據的挖掘與分析能力關乎核心競爭力的培育。某種程度上,誰用好了數據,誰就將有可能獲得更大的市場競爭力。
而在商業模式層面之外,媒體融合帶來傳播平臺多元化、復合化,更激發了對傳統新聞理念的改造和更新。大數據新聞作為新的實踐形態引發了的對新聞理念的反思,盡管不能簡單認為依賴大數據新聞的實踐和創新可解決新聞業發展中的重大問題,正如數字化、媒體融合并未徹底改變新聞業的特質一樣,但技術變革帶來的新聞理念更新和探討必然會逐步深入,這應當引起每一個新聞從業者的深思。