馮結蘭 文詩妍
(廣西財經學院 新聞與文化傳播學院,廣西 南寧 530022)
大數據目前已廣泛應用于各行各業。在殘酷的市場競爭中,企業利用已掌握的數據,為客戶提供精準服務。廣電行業對于數據的敏感度不太高,所以前幾年的數據應用一直落后于競爭對手。隨著近年移動互聯網的飛速發展,以及視頻網站和OTT TV的全面興起,廣電媒體面臨著異常嚴峻的形勢,大數據進入了廣電媒體的視野。
不過,對內部流程、分工已經相對固化的廣電媒體而言,面對一門新近崛起的技術和學問,在人才、技術、規范等方面都面臨著諸多難題,需要加以解決。
缺少可靠的數據來源,再高超的技術都是無本之木、無源之水。廣電媒體不僅大數據資源匱乏,數據孤島還普遍存在。
廣電媒體的大數據主要是自身的業務數據,它們主要來源于廣電網絡、IPTV、各頻道頻率、新媒體部門,包括內容數據、用戶數據、收視數據、報料數據等。這類數據可控性較好,數據質量也有一定的保證。但最大的問題在于:數據資源不夠廣泛,覆蓋范圍有限。
關于數據來源,普遍認為互聯網與物聯網是形成且提供大數據的平臺。互聯網是產生大數據的源頭,能夠在社交、媒體、交易等不同領域持續產生各類數據。物聯網設備則時時刻刻都在形成新的數據,數據量伴隨著時間持續增加。這兩類數據資源作為大數據金礦,正在不斷產生各種應用。[1]廣電系統是以行政區域為邊界的,各省、直轄市、自治區廣電媒體互不相通,廣電的臺與網分離,這使得各家廣電媒體手中的數據都是有限的。即便是中央級媒體,對于自己在各省市的精準收視狀況,也無法掌握。廣電在鼎盛時期時一直是單向傳播,無法收集用戶行為數據。雙向網改后,高清互動機頂盒的普及和置換需要很長時間。廣電網絡一直未研究出數據精準到人的方法,“大模樣”數據使廣電難以實現用戶畫像。可以說,廣電媒體手中的數據量有限,且現有數據在技術應用上有一定難度。
當前,數據孤島在各行業普遍存在,整個社會中數據開放度低,數據難以共享。這也導致數據應用難以深入,限制產業發展。近年來在國家政策推動下,政府數據加快了共享開放的步伐,但是很多基礎性、關鍵性數據仍被政府束之高閣,民眾難以共享。大量數據資源毫無關聯地沉淀在各部門信息系統中,缺乏統一開發利用,難以發揮利民惠民、支撐政府決策的作用。[2]我國信息數據資源80%以上掌握在不同政府部門。各地政府往往通過行政手段來進行公共管理,能夠根據需求獲取各類海量數據。全國各地政府部門均擁有大規模的數據庫作為支撐。從廣電大數據產業發展來看,數據孤島是很大的障礙。目前在大數據的采集、分析和應用過程中,各部門各自為政,資源難以整合,都只是在自己手頭起著有限的作用,未碰撞在一起發生化學反應。比如,廣電媒體的呼叫中心有很多用戶數據,購物頻道也有很多數據,廣電網絡的數據更是主要資源,廣電媒體的IPTV、移動客戶端,也有很多的數據資源,但至今未打通,沒有實現整合。
經濟社會發展中,人才的質量和數量決定著科技水平的高低。大數據技術從引進到迅猛發展期,只用了短短幾年的時間,這導致人才儲備問題尤其突出。
大數據人才短缺的問題,是一個帶有世界性的普遍問題。對我國來說,這一領域的矛盾尤為突出。數據顯示,2016年以來,我國大數據產業規模逐年增長,2021年大數據產業規模超1.2萬億元。中商產業研究院預測,2022年中國大數據產業規模將超1.4萬億元。
大數據產業對人才的需求日益增長,但目前的人才培訓體系無法滿足企業的大數據應用需求。[3]領英(LinkedIn)發布的《2016年中國互聯網最熱職位人才庫報告》則顯示,數據分析是當下中國互聯網行業最熱門的需求職位之一,數據分析人才的供給指數最低,僅為0.05。它還特別強調,數據分析人才將伴隨著大數據在互聯網行業更多的應用而愈加重要。
大數據人才缺乏,是目前整個社會的普遍現象,電視行業亦如是。廣播電視臺有很多技術人員,但他們都是后期制作、通信工程領域的,大數據技術、大數據分析人才十分稀少。于廣電媒體,大數據專業人才不僅需要具備大數據領域的技能,還需要理解廣電媒體的業務。比如對新聞線索的收集以及數據新聞寫作,需要大數據技術人才具備較高的新聞敏感性,具有一定的新聞傳播學基礎;對廣電網絡收視數據分析、對電視及手機客戶端的精準推送業務,也需要技術人員對媒體特點、欄目需求有一定程度的了解。
數據正越變越大。據中國信息通信研究院發布的《大數據白皮書(2020年)》[4],2020年全球數據產生量約47ZB,而到2035年,這一數字將達到2142ZB,全球數據量即將迎來更大規模的爆發。中國信息通信研究院要對極其龐大的數據進行統一管理、高效分析,還面臨著技術層面的挑戰。
首先,數據壓縮技術是巨大的挑戰。中國的數據體量超大,對存儲空間、數據壓縮技術、能源消耗等方面要求高。PB(千萬億字節)、EB(百億億字節)級數據量要求改變傳統的數據存儲方式,使用專用的設備和壓縮技術,對存儲系統進行相應等級、操作簡便地擴展。傳統的結構化數據庫難以承受數據量級和復雜性的增長,需要探索適合大數據的數據存儲模式。
其次,技術的主要挑戰來源于對大數據的采集和分析。微軟大中華區董事長兼CEO柯睿杰認為,數據智能并非那么觸手可及。要想從來源眾多、數量巨大、形式各異的大數據獲得一目了然的信息,就需要真正高效、可靠的數據管理和分析平臺,從而為用戶提出一個切實可行的方案。[5]對于大數據處理的技術專業而復雜,包括數據清洗、數據分析發掘、數據可視化等領域有很多關鍵技術,還需要用到自然語言理解、機器學習、深度學習等人工智能技術創新,需要運用到包括數學、經濟學、社會學、計算機科學和管理科學在內的多學科技術。我國在新型計算平臺、分布式計算架構、大數據處理、分析和呈現方面與國外仍存在較大差距,我國關于大數據的底層技術基本都來源于谷歌等國外大公司。這些年我們的商業模式有所創新,但通過技術手段來推動創新的能力有限。[6]
當前廣電媒體的大數據應用,還處于一個初級階段,從應用程序上講是描述性、預測性的東西多,指導性應用少,從數據源的角度看,以單一數據源進行分析的多,多元數據的應用少,主動去收集數據的應用偏少。[7]概況而言,廣電大數據應用方面存在如下問題:行業應用不深入、數據范圍較單一和片面、數據變現難。
賽迪顧問股份有限公司大數據產業研究中心提供的數據顯示,互聯網、金融和電信三大領域的大數據應用在各行業總規模中所占比重超過70%;健康醫療領域和交通領域近年不斷“上架”新應用,但行業規模占比相對較小;而在其他眾多民生領域,大數據應用仍處于淺層次信息化層面,行業發展水平參差不齊。[8]廣電媒體的數據應用還很初級、很零散,主要以數據收集為主,在基礎統計分析、風險預測等方面還需改進。由于沒有互聯網平臺,電視臺難以利用大數據技術開展業務,傳統運營體系也無法得到提升。廣電網絡和IPTV對于用戶收視行為數據的挖掘分析才剛剛開始,距離應用還有較遠距離,大數據并未與廣電業務深度融合,應用場景也不足。
廣電數據范圍較單一和片面。廣電媒體大數據在收集樣本信息的時候,因為傳播方式的多樣化、傳播端口的差異,致使樣本代表性有限,信息難以全面,因而分析出來的結果并非百分百準確。目前應用較多的是有線網絡的機頂盒數據,全媒體數據因為用戶有限、收集和處理方法復雜,因而應用的頻率和范圍都有限。廣電媒體行業數據來源相對單一,各媒體主要堅守在自己的活動范圍內,收集和應用的都是廣電媒體自己的數據,對外部數據的引入和應用較少。但是,對大數據而言,其價值往往在于不同種類、不同業務范圍的數據的碰撞組合。要增加大數據的價值,應加大對外部數據的引入和應用。[9]
數據變現難。廣電媒體由于使用范圍的局限性,較少用于為第三方提供服務。廣電網絡的收視數據限于地域,未能連通全國的數據,因而收視統計結果基本只用于本臺的節目制作和研究部門作為參考,難以得到廣告主和廣告企業的認可,沒有人愿意為之付費,因而仍無法替代數據公司的抽樣調查結果。即便對于本臺節目制作和研究部門,因目前市場普遍認可的衡量標準仍是第三方的抽樣調查結果,因而自己的全樣本數據分析也只是作為輔助和參考。[10]目前廣電大數據主要應用于企業的自我管理,也涉及幫助企業做產品設計、營銷推廣。
面對大數據應用面臨的難題,廣電媒體需積極應對,在數據源、人才、資金、技術等方面為大數據應用創造條件。
廣電媒體應在保障薪酬待遇的基礎上,一方面完善配套措施,力求引進一流的大數據人才,保證業務發展的需要,另一方面,應從現有員工中挖掘有潛力的跨界人才,重點培養。廣電可與相關的大數據培訓機構合作,對已有的優秀采編及技術人員開展相關的業務培訓并進行考核,使其具備承擔大數據分析工作的能力。在建立健全多層次、多類型的大數據人才培養體系的同時,廣電媒體還應建立適應大數據發展需求的人才評價與考核機制,以保證人才的可持續發展。[11]
廣電媒體可以設立專門的機構作為大數據收集、整理、開發、應用的主體,以保證相關工作的順利開展。該機構應既掌握大數據技術,又有廣電業務經驗,對廣電大數據應用的方向和痛點了然于心。
貴州省大數據管理局的設立和定位對廣電媒體的大數據整合工作而言非常有啟發性。廣電要想實現數據應用,也需要設立統籌管理大數據的部門。
目前,廣電數據散落于各個部門或單位,大數據應用一般只局限于部門內部,加上各部門的壁壘和數據保密的需要,很少將所有數據集中利用。零散的數據難以發揮其價值。數據只有足夠大,才能實現其真正的效用。廣電媒體的數據,存在于不同的子系統中。只有將這些零散的數據進行歸類并整合,才能發揮最大效益。另一方面,大數據知識體系繁雜,技術應用門檻較高,需要對業務了解、技術嫻熟的專業人士操作。各部門、頻道集中的媒體技術人員,主要是視頻編輯、通信工程、設備操作人員,有大數據知識和技術的人才還相對偏少。這類人才主要集中在技術中心的互聯網管理部門。[12]單是依靠各個頻道或者部門,很難摸索出大數據應用之道,需要由專業人士進行專門的開發應用。建立專門的大數據部門,才能打破數據孤島,實現大數據的整合應用。
廣電媒體要解決數據共享的問題,就需要建立屬于自己的數據庫。廣電媒體的數據分散在不同部門中,只有將這些零散數據進行歸類并整合,構建廣電大數據庫,才能發揮最大效益。
大數據庫本質上是一個用戶數據管理系統,它并沒有推翻以往數據庫的基礎,但是相對于以往的數據管理系統而言,它的數據數量劇增、數據結構多樣、數據處理速度更快、數據價值更高。
廣電媒體各部門一直是各自為政,各部門都有自己的數據,但都相對獨立和私密。概而言之,這些數據可以分為:一是內容數據,廣電媒體過往及現今每天源源不斷生產的內容;二是用戶數據,運營多年從電視端到電腦端、手機端所拓展的用戶群體;三是收視及評價數據,雙向網改、開通移動端App后,廣電媒體可以直接收集到用戶的反饋;四是廣告及營銷數據,廣電媒體做了幾十年的廣告和營銷活動,有很多優質客戶和活動數據。
打通數據孤島,加快數據開放,就要統籌搭建數據共享平臺,建設廣電行業大數據庫,助推廣電行業建立統一的數據開放、共享平臺。
隨著大數據的廣泛普及和應用,人們對數據資源的價值越來越重視和認可。但囿于單個組織的局限性,數據應用一般需先經由數據交易擴展數據源。
互聯網與物聯網是形成且提供大數據的平臺。[13]這兩類數據資源作為大數據金礦,正在不斷產生各種應用。還有一些企業,比如商品交易、特定群體消費信息等在業務中也積累了許多數據,他們是獲取、加工處理相對便宜的數據資源,也是當前最常見的應用資源。
這些數據中,既有公開數據,也有非公開數據。在需要運用公開數據時,利用大數據挖掘技術,對可獲取的數據進行挖掘即可拓展大數據來源,對非公開數據,則需要以數據交易的方式獲得。
2.3.1 公開數據采用數據挖掘
目前,有很多公開的數據來源或數據分析,可免費供研究者或企業使用。比如政府機構、職能部門、行業協會的統計數據或分析報告,還有百度等互聯網公司、億贊普等數據調查機構收集、發布的數據。尤其是政府部門掌握的數據資源,普遍被認為質量好、價值高,是最重要的公開數據來源。對一些政府公開數據、企業官網數據、社交數據等,可以通過圖像識別、語音識別、語義理解等技術獲得。
中國政府也著力推動數據開放。政府大數據和產業大數據中,必然有大量的數據屬于公開數據。未來,數據開放和流通的市場會更健全。與民生保障服務相關的信用、交通、醫療、衛生、就業、社保、地理、文化、教育、科技、環境、統計、氣象等領域的數據均可方便獲得,
這必將促進不同行業數據的融合。
相對于互聯網企業,廣電媒體的數據體量并不大。廣電媒體要實現對大數據的應用,僅僅依靠自身數據是遠遠不夠的,要充分利用外部數據。外部數據可以幫助廣電媒體更好地了解客戶、拓展應用。比如電商、醫療、出行、教育等行業的數據,可以使得廣電媒體的營銷更精準,還能促進廣電與其他行業的融合,設計出更多基于場景的傳媒產品。無論是用戶收視分析、企業經營分析,還是營銷設計、產品設計,都在呼吁廣電媒體推進與其他領域數據的融合應用。
廣電媒體應與這些擁有數據的機構展開充分合作,首先是將這些擁有新聞價值的數據資源作為素材,進行報道;其次應加大投入,對這些數據機構所發布的數據,進行二次分析處理,深入思考數據應該怎么用,形成有邏輯的數據資產;再者,廣電媒體還應將這些數據資源與自身數據相結合,開展跨行業數據應用,服務于自身業務的發展。廣電媒體還應結合自身的傳播渠道優勢,或通過專題活動宣講,展示廣電大數據的行業應用成果及在各個行業領域的融合應用成果,增強社會關注度。[14]
2.3.2 非公開數據開展數據交易
數據已被視為固定資產。既然是資產,就可以交易。廣電媒體有自己的數據,但也有開展業務需要的數據,這都需要去數據交易市場買和賣。不同種類的數據,需要“相遇”。數據交易解決了數據流通不暢的痛點。未來,跨行業、跨領域的數據疊加整合之后產生的數據產品最有價值。每個單位,既可以將自己的數據放入交易市場,也可以從數據交易場所買回自己需要的數據,求得業務的發展。正如神州數碼控股有限公司董事局主席郭為所言,“整個大數據產業存在的問題,一個是數據交換問題,一個是商業規則問題”。數據的屬性只有與其實際應用相融合才能實現應用價值。數據交易對社會發展影響巨大,建立數據交易中心,明確數據商業化運作的規則非常重要。
廣電媒體有自己的數據,用戶數據、收視數據、內容數據,都可以進入數據交易市場,在脫敏之后進行交易、交換;廣電媒體的業務發展,也需要更多數據的指導和支撐,所以需要在市場上購買源數據或者數據分析結果。比如可以向電信運營商、生活服務提供商、電商等購買用戶數據,以推廣自己的業務;向百度云、騰訊云等購買新聞熱點分析、節目播放反饋數據等;也可以向影視節目制作機構出售收視分析數據,為影視節目制作提供參考。廣電媒體應多思考和運用數據交易方式滿足自己數據變現和數據應用的需求。
綜上,大數據應用是廣電媒體要面對的重要課題。面對廣電媒體大數據整合與應用中存在的資源、技術、人才等諸多難題,可以通過成立大數據部門、構建廣電媒體大數據庫、開展數據挖掘與數據交易等方式加以解決和優化,推動廣電媒體在新時代的發展。