張 霄
云南漫畫派對雜志社有限公司
大數據在出版傳媒企業中的應用
張 霄
云南漫畫派對雜志社有限公司
隨著信息技術的發展,各行各業都或多或少地應用了信息系統,尤其是20世紀90年代數據倉庫技術產生以來,數據規模出現了PB級的增長。以前企業只是把信息系統作為輔助業務管理的一個工具,而不重視數據的作用,而現在,企業發現通過數據分析可以更好地理解用戶需求和企業運營,幫助企業持續增長和盈利。在這種背景下,“大數據分析”概念應運而生。大數據分析的本質是從數據中發現價值,通過大數據分析發現新的商業機遇和商業價值。基于此,本文將著重分析探討大數據在出版傳媒企業中的應用,以期能為以后的實際工作起到一定的借鑒作用。
大數據;出版傳媒;應用
我國第十三個五年規劃綱要提出:“實施國家大數據戰略,推進數據資源開放共享”。可見作為“十三五”“十四大戰略”之一的“國家大數據戰略”,廣泛應用大數據已成為當今社會的必然趨勢。大數據技術則是指從各種各樣類型的巨量數據中,快速獲取對自身有價值的信息的技術,大數據的核心是大數據技術。目前所說的"大數據"不僅指數據本身的規模,也包括采集數據的工具、平臺和數據分析系統。大數據研發目的是發展大數據技術并將其應用到相關領域,通過分析巨量數據幫助企業發展。因此,大數據時代帶來的挑戰不僅體現在如何快速從巨量大數據中獲取信息,也體現在對大數據技術的開發和研究。
數據體量巨大、數據種類多樣、數據時效性高和數據價值密度低是大數據的大數據的四個基本特征。大數據的數據量是以PB,EB 和ZB來計算的,在云計算、移動互聯網、社交網絡、寬帶化的推動下,一個大數據的時代已然到來,大量數據被記錄,隨之數據的容量也越發龐大。數據來源多樣化的特征體現了大數據的強大之處,換言之,兩個看似無關的數據通過分析,可以發現兩者存在著巨大的關聯。大數據的“快”體現在兩個方面。一是數據產生地快。數據可以是爆發性的產生,也可以是像細流一般的產生,但是由于客戶量巨大,短時間內同樣能夠產生大量數據。二是數據處理地快。大數據可以通過批量處理和流處理兩種方式,實現數據的快速處理。數據的規模并不能為制定成功決策提供幫助,數據的真實性才是數據分析的基礎,但是由于某些數據中無法消除的不可預測性,比如天氣因素和人的情感。這也使得追求高質量的數據成為了大數據的必要要求和挑戰。
2.1 大數據選題決策
對于出版活動而言,這些網絡痕跡能夠清晰地顯現出受眾群的年齡、性別、收入、生活范圍、受教育程度等人口統計學指標,以及內容偏好、閱讀方式、購買習慣等,使得對數字內容的用戶行為的實時監測成為可能。以這些信息為前提的數字出版活動,能真正做到以用戶需求為導向。具體到我國的數字出版市場,眾多的社交平臺(SNS,包括微博、豆瓣、人人網等)上所發表的書評、相關書籍的討論,數字出版平臺(中國知網、起點中文網等)的購買、下載、閱讀信息等,電商平臺(亞馬遜、當當等)的瀏覽記錄、收藏記錄、購買記錄,以及各大門戶網站讀書頻道的點擊率、評論等,這些均能提供相關受眾的數據。深入挖掘和分析這些數據,根據不同的細分市場,篩選出適宜數字出版的議題,作為備選選題,以此作為數字出版的依據。大數據不僅為選題決策提供了依據,而且也進一步指導了后期的營銷活動,為分析細分市場容量奠定基礎。
2.2 催生新的個性化產品
借助大數據產生的一系列人口統計學指標,以及受眾內容偏好、閱讀方式、購買習慣等,出版社可以準確地為相應的用戶,通過手機或其他數字產品推送符合用戶喜好的數字產品和廣告,目前電商在這一塊做得比較成功,如亞馬遜、當當等。
2.3 基于大數據的編排制作
編排制作主要包括內容審核、編輯、校對、排版等環節,效率和質量是重點。近年來,基于XML結構化數據標準構建的互聯網環境下的數字化生產加工平臺得到應用,其中多人異地協同在線編纂平臺為作者、讀者、編輯、出版方等不同角色的實時交流和共同編纂提供可能,不僅能自動記錄所有的過程版本,而且能使成品數據和生產過程中的碎片化數據同時入庫,易于內容追溯和提取。在編輯過程中,數字批注工具基于預先定義好的常用校對符號,能對稿件進行電子化審讀和標注;大量的數據庫能確保內容找到與之匹配的排版樣式,自動排版,并和不同的模板結合,最終生成各種形態的出版物。基于大數據的編排制作,不僅提高了編輯工作的效率,也保障了成品的質量。
2.4 基于大數據的營銷推廣
人民衛生出版有限公司推出的“一書一碼”,就是讓用戶將貼碼在人衛智網激活,根據定價等獲得積分,可以兌換圖書或獲得其他服務,以此激勵用戶注冊,從而獲取用戶數據。在當下新型的營銷手段中,無處不見大數據。亞馬遜就是最典型的基于數據分析挖掘技術,根據用戶的相似性和產品的相似性進行智能化推薦的案例。由美國出版商阿歇特、西蒙·舒斯特和企鵝共同出資成立的網絡書店書呆網(Bookish.com),其核心系統—圖書推薦平臺,也是借助大數據進行精準營銷。當讀者選擇了自己最想看的書,頁面上就出現與該書相關聯的4種圖書,讀者再次選擇,平臺再次推薦,并根據讀者的選書信息改善算法,從其龐大的圖書數據庫中選出最符合需求的書籍。
總之,大數據的發展及其政策環境,使得大數據在當下出版中的應用成為可能和必然。大數據在出版流程中打造了環形閉合式結構,貫穿從選題策劃、內容生產、編排制作到營銷推廣的所有環節,要求我們在以后的實際工作中必須對其實現進一步研究探討,以促進企業的更好更快發展。
[1]梁瑩.大數據分析在出版中的應用與展望[J].出版廣角,2015,02:15-17.
[2]春軍.淺析大數據在企業中的應用[J].工程機械,2013,01:73-74. [3]劉鯤翔,杜麗娟,丁雪.大數據技術在數字出版中的應用前景展望[J].出版發行研究,2013,04:9-11.
[4]祝興平.大數據分析技術及其在數字出版中的應用[J].出版發行研究,2014,04:13-16.