梁瑩
目前大數據技術還處于起步階段,無論是軟件技術、硬件技術都還不完善,但是大數據分析的前景廣闊。因此,出版企業必須仔細分析、認真應對,找準大數據應用的切入點,從而實現大數據分析對出版活動的指導作用。
有人說“得數據者得天下”,海量的數據充斥在社會生活的方方面面。近年來,數據量呈現一種爆發式增長的趨勢。隨著互聯網、物聯網、云計算等技術的發展,傳統的數據庫已無法應付龐大的信息量,云存儲、云計算的出現使得大數據分析變成一種可能。在大數據時代,出版業只有跟緊時代的步伐,認真理解大數據、采集大數據、分析大數據,才能使大數據為我所用。
一、大數據分析的定義
大數據分析(Big Data Analytics,簡稱BDA)包括對大數據的采集、恢復、存儲、管理、挖掘等技術,然后通過分發、知識共享等手段最終實現對決策的支持,其實就是通過定量分析等方法從海量數據中提取出價值,來揭示一種規律或趨勢。
大數據分析包括幾個方面:可視化分析、數據挖掘算法、預測性分析能力、語義引擎、數據質量和數據管理等,其中可視化分析結果最為直觀。
二、大數據分析在出版中的應用
1.出版業中有哪些大數據可以利用
首先我們要明白出版中涉及哪些大數據,可以進行怎樣的應用。出版單位的ERP等數據庫是結構化數據庫,它們會提供各種各樣的企業有效數據,雖然它們在整個大數據家族中所占的比例比較小。互聯網上產生的大規模非結構化數據,比如日志、圖片等,這些數據多而雜,但是加以分析卻可以對出版社在策劃、營銷、客服等方面的決策提供有力的指導。
美國的創業公司Hiptype開發了一套電子書閱讀分析工具,能夠提供與電子書有關的豐富數據。它不僅能統計電子書的試讀和購買次數,還能繪制出“讀者圖譜”,包括用戶的年齡、收入和地理位置等。此外,它還能告訴出版商讀者在看完免費章節后是否進行購買,有多少讀者看完了整本書,以及讀者平均看了多少頁,讀者最喜歡從哪個章節開始看,又在哪個章節半途而廢,等等。
2.大數據在出版中應用的幾個方面
通過采集、分析、解讀大數據,為讀者提供分眾化服務和體驗將成為新時代出版業競爭的焦點。由于大數據分析具有及時、迅速、分析高度智能等特點,因此我們勢必要厘清大數據分析如何應用在出版的各個環節。
(1)選題策劃階段
我們做選題策劃,很多時候都是聽取一些發行人員的建議,或者直接發放調查問卷,根據問卷樣本來做決策,但是這樣常常會產生偏差。那么如果對了解或以前使用過相關產品的客戶數據進行分析,就可以實現精準策劃。比如對一些社交網站平臺(如微博、微信)和電商平臺(如當當網)提供的用戶大數據進行分析,如用戶的性別、年齡、職業、愛好、地理位置等個人信息以及用戶的瀏覽記錄、收藏記錄、購買記錄、評價記錄等記錄信息,從這些信息中可以篩選一些關注度高的話題作為備選選題,篩選出較為活躍的有話語權的人物作為作者,通過分析用戶的個人信息確定目標讀者,從而實現精準策劃。
如盛大文學網站運作就運用了數據分析的方法,網站根據小說作者的知名度、小說的點擊率、讀者對小說的反饋來評定這本小說的暢銷程度,結合市場上已出版的此類型小說的銷售數據來決定是否要將這本小說出版發行,或做成紙質版、電子版等,比如桐華的《步步驚心》就是網絡小說暢銷后,再推出紙質版。
再比如美國學樂出版社的全球暢銷書《39條線索》,這一小說的選題是建立在其在線游戲基礎上的。出版社通過建立在線游戲追蹤最吸引人的線索和角色,以此為構思基礎創作了《39條線索》系列小說。
(2) 編輯出版階段
很多出版社都有ERP系統(即Enterprise Resource Planning,企業資源計劃系統),ERP系統應用在出版中,一般含有編輯管理系統、印制管理系統、發行管理系統、財務管理系統等。在這些系統里會有一些生產記錄、財務記錄、管理記錄以及一些資源的匯總統計。這個數據庫對于實時監控圖書的稿酬、銷售、印次、印數和庫存等提供了精準的數據,這些數據分析有助于編輯對圖書銷售狀況的掌握和運營成本的管理,以此及時調整策略,增加收入。
鳳凰出版傳媒集團的“零距離編校系統”是一個網上在線編輯平臺,省去了排版公司這一環節,直接由印刷廠和編輯聯系,進行稿件的版式制作等印前業務。 在這個平臺上會產生諸如編輯對稿件的修改記錄、編輯與專家的溝通記錄、封面的設計修改記錄等一系列數據,通過對這些數據進行分析,可以得出哪位作者的文稿錯誤率較高,哪些錯誤出現的頻率高,編輯對哪些知識區域有盲點等,這些數據分析結果會給編輯提供最好的解決建議,從而使編輯可以有針對性地應對。
(3)營銷階段
在營銷階段,可以利用大數據分析實現精準營銷,根據大數據分析的結果預測群體行為和個體偏好。比如在選題策劃階段提到的對目標讀者群的定位,在營銷階段,就可以針對這些目標讀者投放廣告和試讀產品,從而增加銷售的可能性。
出版社的官網如果加以利用可以收集到很多數據,比如用戶注冊信息、用戶行為記錄、用戶需求信息等。除官網外,出版社也會和一些電商平臺合作,比如當當網、淘寶網等,電商可以為出版社提供數據分析結果,諸如目標用戶的特征信息及構成等,有利于出版社了解產品在市場上的認知程度及客戶構成。比如當當網會根據用戶瀏覽、購買偏好等向用戶推薦相關產品;淘寶網也有“淘寶指數”服務,用可視化圖表的方式告訴客戶其某具體時間段內的消費行為、消費偏好以及何時達到消費的最高峰等。淘寶還會根據客戶的時間偏好、消費偏好等在合適的時間為其推薦合適的產品。
在一些社交網絡平臺上,諸如微博,出版單位會針對一些目標客戶投放圖書的節選、音頻、視頻文件,或舉行針對性的促銷活動,既可以吸引讀者消費,提高銷售收入,也可以為顧客提供更優越的產品和購物體驗,增加客戶的忠實度。如磨鐵圖書就會定期在微博上向其目標客戶投送一些新書預告,甚至讓讀者參與到封面設計中來,增強與讀者的互動。
大數據分析還可以根據讀者的差異提供個性化定制服務。個性化定制需要有強大的數據作為基礎,這就需要個性化定制服務平臺能夠與各種終端、社交網絡、電商平臺和大數據分析平臺實現無縫對接,從而能夠在這一鏈條上實現對讀者消費行為、體驗和需求的實時了解和跟蹤。比如Coliloquy在“Kindle主動型內容開發者計劃”的支持下所開展的個性化定制服務。Coliloquy出版的電子書允許讀者根據自己的喜好來設計人物角色和情節線索,這里的作家可以為同一個場景寫多個視角,或給每本書寫作多重情節,他們也可以讓自己的讀者投票決定故事的走向和結果。
(4)售后管理階段
大數據分析還可以幫助出版單位進行售后管理,比如用戶滿意度調查研究等,對用戶的購買記錄、評價記錄進行分析,可以為售后服務提供決策,及時改進策略,增加客戶黏性。而且通過對客戶的大數據進行分析,可以分析出圖書銷售規律,等等。通過售后管理還可以為選題策劃提供幫助,通過銷售數據分析何種選題、何種品類的市場份額更大,對于出版商調整出版品種結構具有指導意義。
北京開卷信息技術有限公司已與多家出版社合作,定期向出版社提供開卷數據。比如提供各條產品線的數據監測及市場預測,還會根據數據分析目前我國圖書市場的整體環境、圖書市場的暢銷趨向、圖書銷售的一般規律,并針對某出版社的主要產品線分析其圖書市場的競爭格局等。
三、大數據分析在出版中應用需注意的問題
1.傳統出版還未成功轉型為數字出版
真正實現對大數據分析的應用必須建立在完全數字出版的基礎上,但是目前很多傳統出版單位還沒有將數字出版進行到底,既沒有借助技術公司的力量來發展出版,自己也沒有對數字出版進行有效的投入。維克托在《大數據時代》一書中也提到了出版社數字化的問題:“出版社沒有看到數據化的需求,也意識不到書籍的數據化的潛力。”
2.數據的有效性和真實性怎樣實現
大數據雖然擁有的數據比較多,但是數據也很雜亂,數據中會摻雜進去一些虛假信息。這就很有可能會帶來規律的喪失,增加大數據分析的難度,或者得出錯誤的結論。大數據分析是一個工具,可以幫助我們分析和預測,但是我們不能過分依賴大數據,因為并不是所有的數據都是可靠的。因此真正做出解決方案還需要在數據分析的基礎上綜合考量完成。
3.分析哪些方面、如何分析,還需要論證
大數據分析過程中需要對數據從多方面考慮,比如數據是否容易獲得,能獲得的比例,有很多公共數據并非都能獲得;是否有明確的數據分析思路,分析哪些層面、哪些因素才是最主要的;進行數據分析的模型是否科學,提取的分析屬性是否到位,如果沒有提煉到數據的關鍵屬性,精準分析也就無從談起;基于數據分析所得出的結論是否獨到并且確實有用,只有確實有用的結論才能切實指導決策,否則都是空談。以上這些方面一環扣一環,任何一環出錯得出的結論就可能是錯的,從而影響最后的決策。
四、大數據分析在出版中的展望
數字出版的領頭羊——勵得·愛思唯爾集團,將開發數字決策工具作為其未來十年轉型新方向,其開發的大數據技術HPCC(高性能計算集成)能夠對大約3000萬篇論文和3億條引用數據進行分析,并在瞬間得出分析結果。該項大數據分析技術整合了科研論文、引用信息、專利和其他的獨特內容集合,對科研機構的績效進行分析,并為學術機構的領導人提供決策服務。勵得·愛思唯爾集團首席戰略官白可珊認為:“未來專業出版的方向就是整合我們的優質內容,將這些內容數字化,然后通過技術進行分析,為專業人士提供解決方案和重要見解。” 誠然,勵得·愛思唯爾集團的業務已經成功地從以紙質出版為主轉型為以數字出版為主,其不僅擁有出版的核心內容,也擁有絕大多數出版社所缺少的技術。
大數據分析既給我們帶來了挑戰,也帶來了希望,盡管多數出版商與科技公司比起來“技”不如人,但是出版商作為內容把關人這一地位依然穩固。通過數據分析,我們有可能發現新的規律、創造新的價值。一般來說,把決策建立在數據分析的基礎上,通過量化分析而不是僅憑直覺和經驗,將使決策更為科學。當然,大數據自身還存在信息安全性、隱私暴露等問題,大數據分析高度依賴于用戶的規模和技術,這對于出版企業來說,都是相對欠缺的。由于技術的短板,國內的出版企業要憑自身實力獲得完整的大數據目前來說還存在一些困難。大數據還需要一個高效的存儲平臺來實現數據的可視化、預測分析等,而出版社目前主要是依賴互聯網技術企業提供數據分析的平臺,很難建立自己的平臺。隨著時間的推移,對爆炸型增長的數據量想要實現精準的分析,還需要硬件設施的不斷更新和分析技術的更加成熟,沒有進行有效分析的數據可以說是無序的,無用的。目前大數據技術還處于起步階段,無論是軟件技術、硬件技術都還不完善,但是大數據分析的未來前景廣闊。因此,出版企業要想利用好大數據,就必須仔細分析、認真應對,找準大數據應用的切入點,從而實現大數據分析對出版活動的指導作用。
[1]維克托·邁爾-舍恩伯格, 肯尼思·庫克.大數據時代[M]. 浙江:浙江人民出版社, 2013:5.
[2] 張春磊,楊小牛.大數據分析(BDA)及其在情報領域的應用[J]. 中國電子科學研究院學報,2013(2):18-22.
[3] 彥飛. Hiptype:讓出版商更懂讀者的大數據分析工具[EB/OL]. http://tech.sina.com.cn/i/csj/2012-08-07/10177476268.shtml, 2012-08-07/2014-06-09 .
[4]秦雯.大數據提升數字出版運營效率[EB/OL]. http://cbfx.chuban.cc/jt/rdjj/2012wznh/zlt/201212/t20121208_133637.html, 2012-12-08/2014-06-09.
[5] 劉鯤翔,杜麗娟,丁雪.大數據技術在數字出版中的應用前景展望[J]. 出版發行研究, 2013(4):9-11.
[6] 繁星.“大數據”思維影響圖書出版[N]. 社科新書目,2014-03-31.
[7] 孫玉玲.大數據時代數字出版產業的發展趨勢[J]. 出版發行研究, 2013(4):5-8.
[8] Coliloquy:讀者和作者互動 換個方式講故事[EB/OL]. http://www.techweb.com.cn/news/2012-01-19/1143543.shtml, 2012-01-19/2014-06-09.
[9] 白可珊. 愛思唯爾未來十年轉型新方向 開發數字決策工具[N]. 中國出版傳媒商報, 2014-09-01.
(作者單位:江蘇鳳凰教育出版社, 南京大學信息管理學院)