黃智銳
大數據時代,數據科學讓人們越來越多地從數據中觀察到人類社會的復雜行為模式。廣電大數據涉及的內容非常廣泛,既有生產業務系統數據,又有運營數據、收視數據,還有來自雙向有線網絡的用戶數據,以及新媒體平臺的互動數據、社交媒體數據等,形式多種多樣,有文字、圖片、視音頻。隨著渠道不斷拓展,數據形態也發生了變化,從以往的結構化數據向非結構化數據轉變。從數據采集渠道來看,主要有三大來源,分別是廣播電視臺、有線網絡公司和第三方合作伙伴。
廣播電視臺通過傳統媒體制播業務產生大量數據,如廣電新聞具有不可替代的權威性、公信力和影響力,擁有真實、快速的社會事件動態和輿情數據;播出傳輸環節產生豐富的頻道頻率版面節目信息數據,也是重要的EPG數據基礎;廣告營銷掌握整體市場動向,形成了一套體現頻道、欄目價值的數據體系;在影視劇購銷過程中,圍繞一部影視作品所產生的信息匯聚后,可重新整合成包含多維度的產品數據。在媒體融合的趨勢下,廣播電視臺紛紛建立各自的互聯網新媒體產品,進一步優化內容傳播的最后一公里。通過網站、微信、微博、客戶端等,傳統媒體采集和積累了海量用戶數據,并逐漸形成清晰的用戶畫像。
有線網絡公司作為廣電運營商,目前用戶數已達2.4億戶,數字化率超過87%,系統內有豐富的數據資源,包括網絡建設相關的支撐數據、客服數據、行政數據,更有各種來自有線用戶的賬務、行為數據、認證數據等。有線網絡的大數據來自于實時系統,沒有人為干預,是最底層、最真實的數據。大量數據背后隱藏著用戶行為習慣和喜好等信息,用戶規模使垂直化的數據變得更有價值。
廣電媒體通過與第三方公司合作,將傳統收視率調查、在線研究、手機測量等結果整合,掌握了涵蓋廣播、電視、電腦、手機等多終端的全媒體數據信息。雖然收視率本身看似只是一個簡單的數字,但其背后卻有著一系列科學的樣本采集、測量統計等數據基礎。在電視機主導的時代,以央視索福瑞為代表的收視率調查公司利用安裝在樣本戶家里的收視率測量儀采集收視數據,通過處理分析得出收視報告。在跨屏時代,由于受眾收視行為具有多場景、自主碎片化和多任務整合化的特點,受眾測量從電視受眾測量向視頻受眾測量升級,數據采集手段也相應調整,結合各視頻網站和互聯網數據分析公司的統計數據成為主流。此外,社交媒體對于傳統媒體節目的收視情況具有日益重要的影響,因此對其針對性的收集數據并進行調查和測量有助于全面了解節目的傳播效果。
現在各行各業都在為大數據而興奮,因為大數據已經對人們的社會生活產生了重大影響。廣電行業對大數據技術并不陌生,早在十多年前就已圍繞收視統計分析和雙向網絡改造等提出了大數據概念,但由于各種原因,遲遲沒能結出碩果。這些年,廣電行業正遭受前所未有的挑戰,新媒體新技術的沖擊給傳統廣電業務帶來巨大壓力。廣電系忙于應付紛繁復雜的外部環境,進行各種資源整合與架構重組,通過公司化、聯盟化等手段搞活機制,沖出困局。
此時,互聯網企業把握時機,緊鑼密鼓地通過各種手段收集加工數據,效果比廣電更快、狠、準。這些公司憑借自身互聯網技術的專業性和業務靈活性等特點,快速部署,迅速落地了諸如智慧城市、智慧醫療、平安社區等基于大數據運營的項目,更有大舉進軍媒體業務之勢,他們對數據的追求更積極,意愿更強烈。
反觀,雖然廣電內部不時傳出各種大數據聯盟、數據產業公司等成立的消息,但往往是雷聲大雨點小,一部分僅僅是參與感的結合,落實規劃和全面整合力度有限,龐大的用戶基數并沒有發揮出應有的效果。此外,行業內對數據價值的利用進展緩慢,前期積累起來的經驗和優勢逐漸被消弭,被超越。廣電大數據先發優勢逐漸喪失,這幾年廣電并沒有產出有效的數據化產品,導致廣電在數據運營方面的價值空間下降。
完整性、準確性和連續性,是廣電大數據的特點,也是其價值優勢,如何運用互聯網思維擁抱大數據,為廣電行業帶來春天呢?大數據科學里有三句話,分別是“軟件定義一切”“數據驅動未來”“算法統治世界”。軟件是一切的基礎,不僅指計算機軟件,還包括運用這些軟件的人才。數據時代已經來臨,要發揮大數據的強大威力就必須學會如何從海量的數據中發現知識,尋找隱藏其中的趨勢、模式、相關性和應用方法。數據越多往往越讓人不知所措,最難的是要懂得通過怎樣的維度去看怎樣的結果。
當前,對于廣電大數據來說,要像其他互聯網巨頭企業那樣提供單一的工具化、社會化服務,顯然優勢和能力都不足夠,但在垂直化應用方面卻是一片天地。有效應用大數據,不但可以提高節目生產效率,實現媒體多維度的交互呈現,促進構建多元化媒介的新生態,給廣播電視臺帶來全新的制播方式,還可以為廣電有線網絡帶來全新的服務體驗和發展空間。在節目制作方面,策劃和推廣可以通過采集分析觀眾喜好、特征,有針對性地創作內容和傳播方式,在播出階段,通過互動數據,節目組能及時掌握來自各種渠道的觀眾反饋信息,播后通過深入的數據分析,進一步調整和優化節目內容。在廣告營銷方面,大數據可以助力構建適應媒體融合發展的支撐體系,實現廣告定價、精準投放、傳播監測等。有線電視網絡公司通過基于雙向數字電視機頂盒回傳數據進行收視數據研究,樣本更大,分析研究更為精準、客觀,數據結果也相對權威、可靠和及時,并可將傳統數據調查方法與廣電行業大樣本收視數據相結合,提供多維度個性化報告。隨著新媒體的發展,內容碎片化、媒體分眾化趨勢更加顯著,消費個性化的同時,更需要利用好數據分析。被大數據催生的數據新聞模式正被熱捧,這類新聞具有數據公信力基礎,用數據說話,不會帶有偏見,而且這些數據新聞往往加入了大量可視化元素,對媒體而言,達到了科學與藝術融合呈現的效果。
數據挖掘和應用往往具有實時在線、邊生產邊應用的特點。在一些可落地的產品上先行先試,讓一線團隊了解數據的價值和關聯,從而對數據資產實現進一步的定義和變現。做好數據分析,人才是基礎,大數據不是一般人能學會的,一定要有IT技術基礎,因此大數據團隊更多是偏向IT方面的人才。廣電大數據雖然經過了十多年的發展,但對大數據的理解相對保守,數據分析能力不強。這是因為業內缺少專業IT技術力量,對數學算法的掌握能力不足,受限于對業務的理解和場景模型的設計能力。近年來,各地廣電通過內部“創業”,組建專業化子公司,或者采用外包合作等形式,人才缺口問題得以緩解。
其次,如果把大數據比作一種產業,那么這種產業實際盈利的關鍵,在于提高對數據的加工能力,通過加工實現數據的增值。把數據從生產系統中抽取出來,對這些數據進行結構化清洗、轉換、整理、加載、分發,用于數據分析和統計,將會是一筆巨大的開銷。所謂“數據驅動未來”,打通數據孤島,實現數據融合,并重新對數據進行全面的多維度整合,從而產生更多數據集合。社會的變革不是正態的,而是靠轉折點去改變,幫人們快速從數據海洋中尋找到這些拐點,靠的就是算法,所以說“算法統治世界”。如果能夠了解造成拐點的原因,很多問題將會迎刃而解,數據價值得以最大化體現。