劉保靈
(山東友誼出版社,山東 濟南 250001)
大數據在近幾年成為各行業的流行語,大數據的定義是“需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產”。將其應用到出版行業,大數據帶來的更多是運營模式的改變,而不是說在企業內引入大數據管理的方式就一定會取得成果。數據分析、經營決策的終端是人,對大數據的應用要以企業管理人員的思維方式變化為基礎。大數據理論的研究和發展在客觀上促使出版企業思考大數據在行業內的應用方式,而國外出版行業的一些成功案例表明正確應用大數據會給企業帶來良好的效益,是企業未來的發展方向。
有關出版的很多研究文章都提到了精準定位。定位的要求是精準,需要準確定位某個消費群體,以最適合的渠道發行該出版物,使消費者以最適合他們自己的消費方式來購買。而大數據分析就是從這點出發,要求做到對每個出版物都精準定位,使消費者充分了解出版物內容,并把出版物送到有真正需求的消費者手中。充分利用出版企業的資源,減少浪費,獲得最大化的社會效益和經濟效益。
第一,文學門戶網站的作品越來越受到出版社的重視。門戶網站的作者涉及的題材多樣,寫作水平參差不齊,但這些在網上發布的作品現在仍然是選題的一大來源。
第二,微博、博客、朋友圈、公眾號等平臺上媒體個人發表的文章也成為出版內容的一大來源。在這類平臺上發布的文章可能不是很系統,但勝在時效性強,一些作者發表的時評、隨筆都可能成為一段時間的網絡熱點,極具出版價值。但以傳統出版的方式無法體現這種時效性。
第三,近年來興起的知識付費,使很多付費聽書、收費授課成為熱點。但這種付費經濟處于起步階段,很多有聲讀物和視頻內容的質量一般,不能使消費群體覺得物有所值。對出版社而言,有大量優質內容可以轉為有聲或多媒體出版物,加入付費經濟這個市場。
要整合現有的大量可出版的內容,結合現有的精品作者資源,從上述新出現的渠道選取真正的精品做成出版物,出版社現有的小數據分析模式已經無法承擔這個復雜的任務,需要采用大數據分析的方式。通過大數據的分析能得出哪種類型的作品、哪個作者更有可能被市場接受,獲得較高的效益。
線上支付的發展使中國出版物消費群體的消費模式發生了巨大的變化。從書店的線下支付到網站的線上支付,經歷了很大的變革。實體書店從出版物市場的主要消費場所淪為出版物的展示廳,新華書店有教育讀物支撐尚可以穩定經營,民營實體書店的大量倒閉說明了出版物市場的現狀,大眾紙質書的消費日漸減少,消費主力逐漸向電子書等數碼產品轉移。
消費方式的多樣化決定了出版物的發行渠道不再僅限于實體書店和網店,而是需要在更多的平臺發布。在出版物正式出版前需要謹慎選擇發行渠道,保證以最適合的方式獲得最大的效益。
出版物從策劃編輯到發行,最基本也最重要的就是精準定位。定位包含很多內容:一是找準目標群體,細分市場;二是選擇合適的發行模式和渠道;三是確定最適合的發行時間。針對這些出版發行要素,可以通過分析出版大數據歸納出參考性信息,為決策者提供足夠多的信息以制定出正確的決策。比如著名圖書出版商西蒙·舒斯特,組織專家團隊通過對消費者購買圖書和閱讀行為的數據進行全面的收集分析,得出相關的信息,掌握暢銷書作者受歡迎、某些圖書銷售不佳的原因。通過得到的信息,他們可以快捷地找出問題并進行有針對性的調整。
細分市場的圖書獲取方式、購買方式、支付方式各不相同。一本書適合哪個市場、可能取得多大的銷售量,這些都可以通過大數據分析來測算。上面列舉的采購部門基本都是通過信息系統來操作,出版社如果能和相關的數據公司合作,就可能了解這些部門通過什么方式獲得圖書信息、哪類圖書的頁面停留時間最長、讀者對哪類圖書最感興趣以及最希望通過什么方式獲得該圖書,通過對這些數據信息的分析,就可以獲知潛在消費者的消費需求,以最適合的方式為消費者提供服務。
就目前出版行業大數據應用的發展來看,國內出版行業對大數據的應用尚處于起步階段,幾乎沒有成功案例,各個出版社雖然意識到了大數據對于出版的重要作用,但在認識上還處于起步階段,對大數據了解不夠透徹,重視度不高;另外,大數據的應用存在很多實際困難,比如先期投入巨大、數據收集困難、缺乏相關人才儲備。這些因素使得大數據在出版行業的應用相對滯后。
大數據的數據量呈爆炸式增長,從目前的統計結果看,全球數據庫數據量的90%都是在近10年內產生的。在海量數據里甄別有效數據、選擇適合的樣本進行分析、選用合適的分析工具、建立科學的數據分析模型,這些工作是數據分析的基礎。要做到這些,就必須有一個專業高效的數據分析團隊,團隊里需要包括了解圖書編輯的策劃人員、熟悉出版物市場運行的銷售人員、專業的IT技術人員、擅長流程管理的部門領導人。出版社可以在社內發掘或者外聘有經驗的人員組成數據分析工作組,專門負責搜集選題,撰寫選題出版和發行的可行性報告;對社內有出版意向的選題進行分析,論證出版的可行性。
在建立數據分析團隊的基礎上,收集數據也是大數據分析的基礎。首先要盡可能整合出版社內部現有的數據,除紙質書電子化外,還有每本已出版圖書的銷售數據,包括銷售量、銷售周期、發行時間、首印量、加印量等。對于外版書,出版社應考慮盡可能與其他公司合作。現有的東方數據庫、開卷等專業圖書數據發布商在數據收集和發布分析上已經具有很大的規模。出版社如果自己進行數據收集,工作量相當大。另外,圖書索引數據相對來說容易搜索,而涉及銷售、退貨率、銷售地區、消費人群等細化數據,現在大部分出版社是不完全公開的。而這些不易搜集的數據又是數據分析所需要的。因此出版社應考慮與外部數據供應商建立合作共贏的關系,盡可能從這些數據供應商拿到準確的數據,供數據分析使用。
根據現有數據分析圖書的出版發行方案,應包括目標人群、目標人群的消費習慣、支付方式、最優印量、圖書成本、盈虧平衡點、重點發行渠道、重點發行地域、上市時間、退貨率控制、根據某一時間段的銷售量確定的加印數量。將出版涉及的編輯、發行、印刷、物流等環節需要處理的事項盡量細化,提供詳盡的數據和案例分析,以供決策者參考。比如某意見領袖可能會在某些場合提到某書,即便不是推薦,也可能給該書帶來大量的銷售額。這類案例在國內出版市場時有發生,在意見領袖給予某書好的評價后,該書在市場上可能會供不應求,此時加印數量就是一個需要綜合分析的數據。通過大數據分析,可能會得出該類型圖書最后的總銷售量,需要綜合各方面因素考慮首次加印數量。加印少會導致一段時間的缺貨,影響銷量;加印多,投入大,短時間內會加重出版企業的負擔,同時還要考慮社內倉庫的倉儲量和物流發貨速度。如果擁有大數據分析工具,就能綜合考慮各因素,加權各因素影響量得出一個最優的加印量,避免出現供不應求和浪費資源的情況。
一個適宜現代市場環境的數據模型的建立,需要諸多實際案例的論證并逐步完善。數據類型中適合出版社使用的多為結構化數據,想要通過分析這些數據得出結論,就需要建立數據模型,對于數據模型是否適用,需要通過實踐來檢驗。企業領導層在數據應用方面通常缺乏經驗,在應用大數據時必須不斷進行事中控制和事后反饋,及時解決應用時出現的問題和漏洞,并使這種監控成為制度。