楊 丹
云南漫畫派對雜志社有限公司
大數據在當下出版中的應用研究
楊 丹
云南漫畫派對雜志社有限公司
當前,隨著科學技術的發展,大數據技術應用到了各個方面。對于出版行業而言,大數據在出版流程中打造了環形閉合式結構,貫穿從選題策劃、內容生產、編排制作到營銷推廣的所有環節。因此,對于國內出版傳媒企業要盡快實現數字化轉型,要結合自身實際做好大數據應用規劃,借助大數據來推動企業流程的變革和業務模式的創新。基于此,文章就大數據在當下出版中的應用進行簡要的分析,希望可以提供一個借鑒。
大數據;出版;應用
目前對于大數據(Bigdata)并無統一的定義,互聯網上對其普遍定義為:大數據或稱巨量數據、海量數據、大資料,指的是所涉及的數據量規模巨大到無法通過人工,在合理時間內截取、管理、處理,并整理成為人類所能解讀的信息。大數據有四大主要特點,可以歸納為4個V,包括Volume(數據體量大)、Variety(數據類型繁多)、Velocity(處理速度快)、Value(價值密度低)。
在大數據時代,如何挖掘和深入利用如此多的數據,這就涉及大數據技術的運用。大數據的利用過程可以簡單地分為大數據采集、大數據預處理、大數據存儲及管理、大數據分析、大數據應用、大數據安全等幾個方面,其中最重要的莫過于大數據的分析。準確的數據分析是數據應用前提,也是大數據得以實現其價值,為使用者帶來利益的保證。從這個角度說,大數據主要涉及的技術包括云技術、分布式文件系統和并行計算框架。
大數據和云技術是相輔相成、息息相關的。大數據為云計算提供可資分析的信息內容,云計算為大數據提供基礎架構,以實現數據的分析。隨著數據量躍升到PB(1024TB=1PB)、EB(1024PB=1EB),甚至ZB(1024EB=1ZB)級別,大量的重復信息或無效信息也必然產生,需要強大的計算能力和可擴展的存儲空間對此進行收集和過濾,云技術無疑具備這種能力。
分布式文件系統可以將非本地節點上的物理儲存資源,通過計算機網絡連接起來,使得眾多的節點組成一個文件系統網絡。并行計算則可以一次性執行多個計算。分布式文件系統和并行計算框架都是大數據時代的關鍵性技術,Hadoop框架是目前較有代表性的實現模式。
2.1 基于大數據的選題策劃
大數據首先助力選題策劃。這在當下涉足出版的新媒體企業中,尤其突出。這些企業大多具有強大的互聯網基因,其對結構化、半結構化和非結構化數據的采集、分析和應用,相對傳統出版單位,具有天然的資源優勢和技術優勢,尤其是能通過所擁有的社交平臺和電商平臺記錄的用戶行為數據,快速準確地捕捉到社會熱點以及某個領域的流行趨勢等,以此作為選題策劃的重要參考。近年來,很多暢銷書的成功打造,就是基于大數據對選題策劃的介入,在國內最具代表性的就是2014年自營式電商企業京東基于1700萬網站用戶數據分析而推出的《大衛·貝克漢姆》。
2.2 基于大數據的內容生產
在內容生產環節,不管是選擇作者還是確定作品內容的表述方式、故事情節的發展走向,大數據都是決策時最好的依據,電子出版公司Coliloquy曾在這方面做過成功的嘗試。Coliloquy借助亞馬遜的Kindle創建互動內容,通過“選擇你自己的歷險經歷”的模式,允許讀者進行人物角色和情節線索的設計,并對讀者選擇后所產生的數據進行匯總,再把數據分析結果發給作家,以此來調整故事線索,《饑餓游戲》(《TheHungerGames》)的暢銷就是基于這樣的理念和實踐。
2.3 基于大數據的編排制作
編排制作主要包括內容審核、編輯、校對、排版等環節,效率和質量是重點。近年來,基于XML結構化數據標準構建的互聯網環境下的數字化生產加工平臺得到應用,其中多人異地協同在線編纂平臺為作者、讀者、編輯、出版方等不同角色的實時交流和共同編纂提供可能,不僅能自動記錄所有的過程版本,而且能使成品數據和生產過程中的碎片化數據同時入庫,易于內容追溯和提取。在編輯過程中,數字批注工具基于預先定義好的常用校對符號,能對稿件進行電子化審讀和標注;大量的數據庫能確保內容找到與之匹配的排版樣式,自動排版,并和不同的模板結合,最終生成各種形態的出版物。基于大數據的編排制作,不僅提高了編輯工作的效率,也保障了成品的質量。
2.4 基于大數據的精準營銷
所謂精準營銷就是將出版產品以“最小化營銷成本、最大化營銷效果”準確地推送給有確實需求的用戶。利用大數據技術進行營銷時,出版傳媒企業既可以深度挖掘客戶信息,實現精準投放,也可以利用社交網等各種平臺保持與用戶的個性化互動式溝通來提高用戶的忠實度,或通過對社交網絡中用戶圈子的分析來實現有針對性的營銷活動。
在大數據營銷方面,亞馬遜做得非常出色。亞馬遜利用基于大數據的個性化推薦系統替代先前的專家推薦系統,大大提高了銷售量。系統通過分析客戶消費信息(如購買什么書、關注什么書等)來準確地給讀者推薦圖書。除個性化推薦系統外,亞馬遜在大數據營銷方面又進入了一個更高階段——預判發貨。預判發貨的核心是利用大數據技術深度分析顧客以前的消費記錄、搜索記錄以及心愿單等信息來預判顧客對新商品的購買意愿,并在未下單前直接將商品郵寄給顧客或離顧客較近的倉庫,這樣顧客一旦下單,收貨時間就將以“小時”計,而不是以“天”計。預判發貨模式在某種程度上可提升顧客的忠誠度,提升亞馬遜在高端客戶中的口碑。
總而言之,大數據目前在出版中的應用仍然處于起步階段,還有很多需要深入研究和探討的問題。對國內出版傳媒企業來說,當前首先要盡快實現數字化轉型,并結合自身實際做好大數據應用規劃,借助大數據來推動企業流程的變革和業務模式的創新。
[1]劉鯤翔,杜麗娟,丁雪.大數據技術在數字出版中的應用前景展望[J].出版發行研究,2013,04:9-11.
[2]祝興平.大數據分析技術及其在數字出版中的應用[J].出版發行研究,2014,04:13-16.
[3]梁瑩.大數據分析在出版中的應用與展望[J].出版廣角,2015,02:15-17.