李娜
大數據不僅僅是中國熱,它是一個現象。不久的將來也許大數據這個詞,人們不會時髦地去談論,但是數據影響社會生活,影響媒體發展已經是方方面面的了
2014年,百度基于LBS(基于地理位置的服務)的大數據和可視化展現技術推出了“百度遷徙”,結合央視的報道,首次實現了全程、動態、即時、直觀地展現中國春節前后我國人口大遷徙的軌跡與特征,也讓老百姓真正體會到了大數據的應用價值。隨著大數據的可視化實現,大數據越來越被社會大眾所熟知和認可,特別是在新媒體環境下的傳播領域,大數據挖掘與應用也隨之愈受重視和關注。
在中國傳媒大學新聞學院任教的沈浩教授,擁有20多年統計和數據分析經驗、精通多種統計分析技術和傳播研究方法的資深專家,尤其在數據可視化領域,堪稱一位虔誠的布道者。他經常對學生說:“只有看得見,才能做得到;只有看得見,才能做得好。”
新媒體越來越具有大數據味道
在接受記者采訪之前,沈浩剛剛從中央電視臺趕回來,現在社會各界特別是媒體界對于大數據應用的重視與認可,也讓他的生活倍加忙碌起來,他所帶團隊在中國傳媒大學從事大數據研究,在業界的影響也可見一斑。
對于新媒體時代,沈浩說:“今天很多新的概念,層出不窮,包括對新媒體,到底什么是新媒體,是不是能講清楚,其實也是一個很值得商榷的事情。其實今天談新媒體,不是‘新,而是‘全媒體,甚至已經把傳統媒體的那些概念等全都包含在里面。現在新媒體第一個特性肯定是要跟互聯網沾邊的,但是如果我們今天去談新媒體,可能一個手機的Apps就是新媒體,比如微博、微信。再進步一說,其實更多跟數據有關。”之前,媒體和大數據是兩個領域,但隨著新媒體的不斷發展和衍生,這兩個概念越來越多地融合在了一起。“今天的新媒體,或者新興的媒體,一定是基于數據的。如果不基于大數據,它的新媒體特性就體現不出來。因為新的媒體,就要social(社交),互動,大眾傳播,要通過人際互動,我們才能感知這種傳播效果。所以我們說微博、微信的互動都是數據驅動的。”再例如“今日頭條”,這種新聞聚合和個性化推薦內容,也是數據驅動的,現在的新媒體應該是由數據驅動的媒體。有一種說法:未來的新聞媒體,就是數據分析,新媒體越來越具有大數據的味道。
“在新媒體時代的大數據挖掘與應用,可以讓我們越來越多地從數據中觀察到人類行為的復雜模式,以數據為基礎的技術決定人們的未來,但并不是數據改變我們,而是我們對數據可用知識的增加。”這句話是沈浩為美國復雜網絡專家巴拉巴西教授的一本新書《爆發》中文版寫的推薦語。這本書的核心觀點是說人類行為的93%是可預知的。今天人們甚至把大數據當成了第四生產要素,是一種新的石油。最簡單也最貼近我們實際的例子,今天我們每個人都在使用微博,當然也包括微信。微博跟微信是不一樣的,微博的數據是可以通過爬蟲或API數據接口獲取轉發數據。當然移動公司也可以分析我們發了多少條短信,什么時候發,但是它不能分析我們發什么內容,微博可以。“今天如果你在微博上發文字,我不光知道你什么時候發,而且你發的什么內容,說的什么事情,我也可以進行挖掘和分析。”所以沈浩經常對學生說:“你要好好寫微博,將來你的雇主在雇傭你之前都會仔細看你的微博,由此了解你的性格,了解你的消費方式,了解你的生活態度,甚至你的價值觀。你相信這一點嗎,如果你相信,你就要好好寫。”
推動大數據人才培養
大數據的影響也帶來了新聞報道方式的改變,因為在新聞學院任教,更接近新聞傳播領域,二者結合更讓沈浩感觸頗深。“過去,新聞是新近發生的事實的最新報道,現在,人們越來越關注的,比如說能不能從數據中發現新奇有趣的事情具有報道的價值。”
到了新年,推特發布的一個實時數據,看到人們正好在發推特搞新年祝賀,在一個時間軸上,這也是大數據上很重要的實時應用,可以捕捉到每個城市各個地方在不同時區進入新年時人們發布新年祝賀這樣詞匯的一個捕捉和監測,這些都是大數據應用。我們可以看到,最典型的在大數據時代對于傳媒特別是新聞報道領域誕生一種新的新聞報道形式,叫數據新聞。“這也是大數據時代帶給我們對新聞傳播領域的一種新的理解和趨勢,更是對廣電行業,特別是我們傳媒行業提出了一些新的挑戰,也是一種機遇。過去我們更多的是在傳播內容上,現在我們要針對微博、軟件、技術、工程實現等各種各樣的挖掘能力。”
數據新聞報道實驗班的設立,最初也是源于沈浩的一些經歷和想法:“當時由于中央臺春季百度遷徙圖的報道受到了有關領導的表揚,并提出了應該加強‘兩會大數據報道,由于人才培養和技術實現路徑,有關部門找到了我。那段時間,我去了中央電視臺、國際廣播電臺、人民日報、人民網等主流媒體,大家都有這些需求。我給他們做一些講座,或者培訓,講怎么做數據可視化的數據新聞報道。交流過程中,我感到新聞傳媒領域對大數據人才的需求,急需懂數據、懂數據挖掘的、又懂新聞的復合型人才。記得我從中央臺回來,路上就給學院領導打了一個電話,我說應該從新聞學院招募一些,比如在新聞專業、傳播專業、創意專業(媒創),還有媒體市場與分析專業方向,這四個專業中招募一個興趣小組,各招10個人,然后組成一個實驗室。但是領導聽了我的想法以后,認為可以更具體一些。向學校領導匯報后相關領導說:直接成立一個班就可以了,先弄一個實驗班。所以在學校的各方大力支持下,就成立了全國第一個數據新聞報道實驗班。”
由于是第一屆實驗班,而且大數據這個方向需要文理的綜合能力,對于學生各方面素質要求也比較高,所以我們對進入這個實驗班的學生考核還是比較嚴的,“我們要求英語達到六級,學習成績比較高。這次實驗班招來的20個學生中有幾個學生都是各學院綜合測評第一名。”對于實驗班學生的發展,沈浩也是信心和擔憂并存:“現在大數據分析是熱門趨勢,是急性需求,特別是在傳媒大學的背景下學習大數據分析研究,在媒體領域很有優勢,這些學生將來的發展是很有可為的。”他給記者介紹說,關于數據領域過去培養的畢業生,很多都去了新媒體,新媒體比較熱也是大趨勢,急需這些人才,他們更多的不是當記者編輯,而是做經營分析和數據管理分析。比如有很多畢業生去搜狐做消費者產品體驗研究;在聯想做消費者用戶研究;在淘寶做消費行為的商家體驗研究,更多的從技術方面影響媒體。也正因為認識到數據的重要性,傳媒大學很早就在研究生中開了很多定量研究課。
“但是對于實驗班的學生我也有擔憂的地方。他們考研可能存在問題,后續的兩個學期可能更多的是學新技術,但考研往往不考這些東西。我們這個學習量非常大,要在有限的時間內學會很多過去你可能沒想過的,比如網絡爬蟲、網頁設計、新媒體的應用、可視化技術、數據挖掘的技術,這些時髦的東西碩士考試不會涉及。但我相信如果這些學生是優秀的,干什么都行。另外一點擔憂是師資問題,不是一個人的能力,需要師資團隊,逐步摸索和完善教學計劃,這需要一個體系,如果說所有的學生最后都培養成為像沈浩一樣的,我相信一定有競爭力,但這是不可能的,每個人的個性發展不可能都一樣。我也不能把我的知識都讓學生掌握成像我一樣。這需要多個學科多個老師,這個師資隊伍的成熟還需要時間的培養,當然,這也不是我們一個學校的問題,好在我們的師資相對要好一點。這個領域對于整個社會都很新,大家都在摸索前進。”
適應并迎接大數據時代
在日新月異的新媒體發展中,沈浩能夠走在媒體大數據挖掘的前端,他說自己這一路走來,并沒有受到沖擊,而是更多的隨著自己的興趣“玩兒”出來的。沈浩畢業于北京師范大學數學系,畢業后分配到中國傳媒大學(當時叫北京廣播學院)的數學教研室,由于在上學時候對計算機的興趣,他又通過學習有了扎實的計算機功底,由于在傳媒大學的環境中,沈浩漸漸對新聞傳播產生濃厚的興趣,并且攻讀了傳播學博士,可以說是一個典型的復合型人才,這些基于他本身興趣的學術背景,為他走上大數據研究之路奠定了扎實的基礎。
沈浩在傳媒大學工作后最早從事數學教學,后來因為教研室的帶頭人在統計分析和傳統調查、傳播研究方法領域非常強的柯惠新老師帶領下,把沈浩和教研室的其他同事都帶入到定量研究和調查研究方法上,同時得益于當時像丁俊杰(現中國傳媒大學廣告學院副院長)這樣比較有遠見的領導,把一些學數學、數理的人轉到新聞學,“所以1998年開始,我們正式到了新聞學院,一直專注于在新聞傳播領域的數據、定量研究。慢慢進入市場研究領域,比如說CCTV的改版研究,特別是收視率、收聽率、互聯網調查等等這方面研究的工作,我們做的是比較早的。”
后來基于個人興趣和背景,沈浩2003年轉到數據挖掘領域,“那時候轉得很早,很少有人知道。在2005年的時候我就給研究生開公選課,講社會網絡分析。其實今天的社會網絡分析就是現在的微博呈現的網絡科學,大概在2009年,我開始關注互聯網的數據采集,到現在成立大數據挖掘與社會計算機實驗室,通過對海量數據的采集,運用空間技術、社會網絡科學、情感分析技術以及可視化技術,提取空間數據和人類的情感數據,用來研究人類社會行為。”沈浩對于新的技術或者應用都會去嘗試,也經常和自己的學生說要親近互聯網,特別是現在的學生都是“90后”,已經是數字一代,不斷嘗試才能適應新媒體時代的數據挖掘需求。“人家說我的數據分析很好,是因為我干了20多年,一直從事這個工作。而且我干這東西不累。我喜歡這個事兒。”
大數據不僅僅是中國熱,它是一個現象。這個現象隨著社會的發展,特別是移動互聯網,以及各種技術的發展,使得我們越來越感知到將來數據在各個領域的作用會越來越大。不久的將來也許大數據這個詞,人們不會時髦地去談論,但是數據影響社會生活,影響媒體發展已經是方方面面的了。“如果你不具有這種處理分析數據的能力,你可能就處于劣勢。甚至你現在的商業模式就是以數據驅動的。所以,現在IT領域和大數據專家經常提的一個話題,叫‘軟件定義一切,數據驅動未來,算法統治世界。
責任編輯 王海珍