[摘要]大數據將革新出版業對信息和知識的搜集、儲存、傳播方式,對整個出版產業體系的重構產生深刻影響。產業重構時代的出版業如何應對大數據,在實施大數據戰略過程中應注意哪些關鍵問題,這些都需要出版業界進行前瞻性的深度思考。
[關鍵詞]產業重構;出版;閱讀;大數據
[作者簡介]作者系浙江大學傳媒與國際文化學院副教授,美國威斯康星大學麥迪遜校區研究學者(2013-2015年)。
大數據的獲取、處理和應用正逐漸成為出版界關注的熱點。出版業可借助不斷增長的數據蓬勃發展,國內外出版業已開始對大數據展開各類探索。大數據將革新出版業對信息和知識的搜集、儲存、傳播方式,對整個出版產業體系的重構產生深刻影響。需特別說明的是,針對出版業而言,我更愿意以“產業重構時代”來指稱出版業當前所處的時代背景,這一概念與“傳統時代”“后轉型時代”相對,可涵蓋“大數據時代”“數字時代”等提法。因為,無論是“大數據”“物聯網”“云計算”等先鋒事物也好,還是“多媒體”“跨媒體”“全媒體”“超媒體”等新概念也罷,最終落實到出版業,其最重要的主題和效果就是“產業重構”。與其他概念相比,“產業重構時代”這一概念更具常態性、概括性。產業重構時代的出版業如何應對大數據,在實施大數據戰略過程中應注意哪些關鍵問題,這些都需要出版業界進行前瞻性的深度思考。
一、“數據化”的前提是深度“數字化”——出版業運營大數據應以行業數字化轉型、媒介融合為基礎和支撐
全球權威的IT研究與咨詢公司Gart-ner于2013年9月發布的大數據分析報告稱,全球范圍內的媒體和通訊行業以及銀行金融業站在了大數據投資的最前沿;從大數據企業的分布行業來看,目前媒體和通訊是最先接受并實施大數據項目的行業[1]。例如,在影視傳播領域,我們已看到根據大數據分析來拍攝的影視劇。出版業是一個歷史悠久的知識產業,在人類新的生活、學習方式和新技術的影響下,出版業受到媒介大融合和新興傳媒的挑戰,其產品定位、運作模式必然因時而變,如何重塑出版業是一個重要的命題。
一直以來,出版業被許多人視為一個強調藝術追求、專業Z5FNkyC+UjxKGLvNp0dq2g==經驗而缺乏科學實證的行業,這在出版市場行為中表現尤為明顯。作為微觀經濟組織的出版機構,在實踐中決定供給量時通常是依憑經驗判斷,如一種圖書的總印數主要受其讀者規模大小的影響,與定價的關系并不明顯,而出版機構很難精確地了解自身產品的讀者數量。就本質而言,傳統意義上的出版業是一個感性化的行業,盡管業界資深專家的經驗和約定俗成的行業準則也會備受重視,但整體來看,出版業在洞悉消費者需求上表現欠佳,這對出版業長遠發展極為不利。在大數據環境下,這一狀況可得到根本性的扭轉,大數據技術以一種科學化、結構化的思維來看待出版業,出版業在縮小市場風險、提升經營績效上存在極大空間,這對出版業來說無疑是一個極好的轉型契機。
大數據不僅僅是一門技術,更是一種全新的商業模式,它與云計算共同構成了下一代經濟的生態系統,正是在這一意義上才出現了“一切皆信息”的論斷。在大數據環境中,出版業對于市場將有更為精準的把握,但大數據背景下的出版產業競爭或將更為激烈,出版業與其他內容產業的界限更加模糊,大數據對出版業的數字化轉型和商業模式選擇提出更高要求。對于出版業來說,這可謂是新情況下遇到老問題——出版業對大數據的利用應以行業數字化轉型、媒介融合為基礎和支撐。大數據的本質是更加廣泛、深入的數字化,以及全社會范圍內的數據互聯互通。而中國傳統出版業還處在數字化的轉型關鍵期,要想在內容、閱讀、營銷、管理等方面實現“數據化”運作、充分利用大數據,首先應繼續深入推進“數字化”。
目前中國數字出版產業的商業模式和數據信息平臺構建遠未成熟。未來出版業的商業模式應真正建立在信息技術與大數據基礎之上,而實現這一愿景的一個必要前提是出版機構真正轉型為信息化企業,而不是僅僅停留在目前的企業信息化層面。出版業若想得到持續發展,需用更廣闊的視野、更理性的模式來整合行業發展,其中,全行業數據信息平臺的打造是一個亟待先行的重要環節。
在這個以創新、轉型為主題的時代,越是靠近變革的前沿,我們越有必要回顧反思自己曾經走過的路。事實上,原國家新聞出版署早在1997年發布的《新聞出版科技發展“九五”計劃和2010年長期規劃綱要》中就已前瞻性地提出:“利用電子計算機技術、通信技術和信息處理技術,建立新聞出版業務、管理信息數據庫全國聯機服務網絡(金版工程),充分發揮信息技術的作用,把新聞出版業建成現代化的信息產業”,并在“新聞出版各領域科技發展的主要任務”中,專門單列“信息處理”領域的發展任務:“建設全國性的新聞出版行業信息網絡系統(金版工程),在統一規范、統一數據格式的前提下,實現管理、業務數據等方面的資料信息的網上傳遞、雙向發送和接收,爭取實現信息資源的共享。”[2]但時至今日,建立統一的行業數據標準、構建數據共享體系、完善數字出版組織與管理體系依然是中國出版業的重要奮斗目標,例如:我國出版業迄今仍然沒有一個統一規范的出版物信息描述和交換標準,中國出版物在線信息交換(CNONIX)標準的應用推廣仍被作為當前新聞出版業改革的一個工作重點。“大數據”的基本要求就是信息整合和共享,中國出版業界應以理性、長遠的眼光看待這一問題,應在部門與整體利益、短期與長期利益之間做出理性的抉擇。否則,如果只是一味地被動應變,等到喪失主動權的轉型徹底結束,出版業再高喊“狼來了”也無濟于事,屆時再有“與狼共舞”的豪情壯志也不過是一廂情愿的奢望罷了。
二、從數據到知識到行動——大數據將考驗出版機構的數據采集、分析與整合能力
對產業組織而言,大數據問題的本質不是技術創新,也不是數據形態的多樣化,而是實現“數據驅動業務”的相關戰略與戰術。出版行業作為傳遞知識、信息的內容產業,將被“大數據”深刻影響,這是毋庸置疑的,但“數據”并不等同于有序化的“信息”“知識”,將大數據轉化為出版生產力也并非易事,大數據將考驗出版機構對數據的采集、挖掘、分析、組織與整合能力。
數據是對客觀事物和現象進行記錄、可以鑒別的符號,只有經過處理、解釋,數據才有意義,才成其為信息。信息是經過加工并對客觀世界產生影響的數據,是事物存在方式和運動規律的一種表現形式。知識則是人類對客觀世界的認知成果,是從相關或不相關的信息中提煉、重構、創造而成的,其內涵比數據、信息更為寬廣、豐富。若加以粗略劃分,出版業所能獲取、掌握的大數據可轉化為兩個層面的知識、信息:其一是出版業傳遞給公眾的部分知識、信息內容;其二是可直接作用于出版機構自身市場預測、策劃、營銷等環節的信息、知識。
1. 大數據給出版業內容生產模式帶來變革契機,但出版機構的內容把關人角色未變
出版業首先是內容產業,出版物的核心價值取決于以內容為底蘊的知識、信息價值,這是出版的基本原理。以傳統觀點來看,出版業與其他傳媒行業相比所擁有的最根本的核心價值,就在于它的產品中的絕大部分是適于傳播的、有序化的信息和經過人類的理論與實踐驗證、可進行歷史性傳承的知識。對于出版業中的教育出版和專業出版板塊而言,此點更是不容置疑。現代出版業中的教育出版、專業出版、大眾出版三大領域正是基于其產品的傳承知識、傳播信息和創造娛樂三大功能而發展(上述出版領域的出版物兼具不止一種功能的情況是存在的)。與其他新興傳媒、娛樂形式相比,目前數字出版物和傳統出版物在創造、提供娛樂方面并不具備優勢,出版物的核心優勢應立足于傳承知識、傳播信息這兩大功能進行構建。而傳承知識、傳播信息這兩大功能,均對應于出版業對信息、知識的序化、組織、整理能力,這些能力是出版業的立身之本。縱使出版業披上了“數字化”的華麗外衣,“內容”依然構成出版的核心競爭力。
出版業將大數據轉化為可向受眾傳播的知識信息產品,在國外已有操作實例。出版業主動迎接大數據給予的變革契機的同時,應認清并鞏固自身的核心價值所在。全球領先的內容解決方案和技術服務提供商Publishing Technology上市公司的首席執行官喬治·羅西斯最近就發表了這樣的觀點:盡管出版共同體在越來越多的層面受到挑戰和改變,但出版者堅守住了其內容把關人的角色[3]。
2. 大數據對出版機構自身的市場預測、策劃、營銷等活動而言是創造價值的重要手段
就大數據對于出版業的第二個功用而言,出版業利用大數據的一個關鍵是如何從海量數據中發現知識,尋找潛藏在大數據中的模式、趨勢和相關性,探索客觀世界的內在規律以及可能的市場前景,這需要出版業擁有更好的數據洞察能力、信息組織能力和知識管理能力。在大數據背景下,傳播的工具與模式日益多元化,但信息泡沫正給人類造成新的重負,數據信息有序化、規范化的必要性和價值更加凸顯。美國著名傳記作家大衛·麥卡洛曾說過:“信息、事實、數據的價值取決于我們對它們的理解,取決于使用者的判斷力。[4]”商務智能和數據分析公司Information Builders的企業營銷副總裁杰克·弗瑞瓦爾德也指出:“信息是重要的戰略資產,但其價值取決于你如何看待和應用它。企業應收集對自身有意義的信息。[5]”
如何合理、有效地開發利用自身的用戶數據、產品數據、銷售數據等戰略資產,將其轉化為出版生產力,成為出版機構亟待解決的問題。大數據環境下的出版機構應具有更大的創造性和靈活性,應將大數據滲透到組織發展的每一個環節,實現自身的全面轉型:首先,出版機構需完善、重構自身的信息技術系統和信息資源平臺,打造大數據的基礎能力。當然,并非所有的出版機構都有足夠的資源、能力打造自身的數據運營系統。隨著云計算技術和模式的成熟,出版機構可更加靈活地選擇第三方信息服務。其次,以精準營銷、提升效率等為切入點,創新大數據在出版業的應用模式。就國際經驗來看,目前出版業對大數據的價值挖掘主要應從以下幾方面著力:
(1)分析用戶行為數據,實施精準營銷。出版業可通過大數據挖掘分析用戶行為記錄,判別其類型與偏好,對用戶形象進行描摹,制定有針對性的產品組合和營銷決策。例如,《哈利·波特》系列小說的出版商Scholastic Corp通過在線游戲用戶記錄,追蹤最吸引人的線索和角色,據此創作了又一套全球暢銷書《39條線索》系列小說。
(2)依托專業團隊,優化分析大數據的方法,拓寬數據挖掘處理能力,做好大數據運營的組織、技術準備。正如美國《出版商周刊》所言:出版業開發、利用大數據需要依靠專業的“數據科學家”,所謂“數據科學家”是指同時兼具傳統的8c0f9aee5a0ffb2eb035ac78a1353954數學、統計技能及編程技術、企業家本能與調查天賦的復合型專家[5]。
(3)提升數據共享能力,實現數據價值最大化。國外的Bookseer、CoverCake、Thomson Digital、ePubDirect等公司正致力于推進大數據技術與出版業的融合。社會化媒體驅動的信息數據庫BookMachine,將自身定位為供全球出版專業人士免費交流和共享數據、信息、技能的平臺[6]。
三、關注數字化閱讀的那些事兒——大數據背景下出版行業應正視數字化閱讀的新特質、積極應對閱讀行為嬗變
閱讀作為一種社會行為,每一次傳播技術的革新和媒體語境的變遷都會造成其對象、形式、性質的變化,新媒體環境下的數字化閱讀更是如此。現階段的數字化閱讀主要包括網絡在線閱讀、手機閱讀、電子閱讀器閱讀等多種方式。新媒體環境下閱讀行為的發展變化主要體現在以下方面:一是新媒體的開放性和包容性導致的讀者閱讀身份變化;二是新媒體的個性化和移動化導致的讀者閱讀習慣和閱讀時空變化;三是新媒體的超時空性和超媒體性導致的讀者閱讀興趣、閱讀方式、閱讀質量變化;四是新媒體的交互性和消費性導致的讀者閱讀能力和閱讀效率變化。
作為重要學習能力之一的閱讀,由于新媒體環境下閱讀時間和空間的隨意性、閱讀的消費性,而在客觀上出現了淺閱讀、泛閱讀、非導向性閱讀、“缺乏主流”閱讀、偽閱讀、超閱讀、功利性閱讀、娛樂性閱讀、重圖輕文等問題。閱讀本身是人從符號中獲得意義的一種社會實踐活動和心理過程,閱讀方式的改變并不一定導致閱讀心理的退化和閱讀理解的困難。無論讀者選擇何種媒體閱讀,都面臨著一個閱讀內容選擇的問題——閱讀什么、閱讀重點、閱讀時間分配等都需要進行甄別和思考。面對閱讀行為的數字化嬗變,出版行業應建設性地整合、生產、傳遞各類知識、信息,對閱讀內容進行科學建構與評估,以改善和促進社會閱讀。這其中應把握兩個關鍵點:
1. 新媒體和大數據背景下,出版業需重新認識、界定“閱讀”乃至“出版”的概念
新興的數字閱讀設備和閱讀平臺,使“閱讀”這一人類獲取知識信息、發展智力的最根本途徑獲得了新的介質,并通過引入音頻、視頻等多種技術帶來全新的閱讀體驗,讓閱讀變得多媒體化。傳播學領域的媒介環境學派(Media Ecology)將從媒介形態及其變化的視角解讀社會文化、歷史變遷視為其研究旨歸,以媒介環境學派的觀點來看,數字化閱讀和傳統閱讀由于擁有不同的傳播介質和符號形態,所以具有不同的內容、時間、空間和感知偏倚;由于它們具有不同的參與條件,所以又具有不同的社會偏倚。簡而言之,數字化閱讀形式營造了新的閱讀體驗和閱讀文化,重塑了出版業,并對社會文化生態形成深遠影響。閱讀與語言研究學者瑪麗安·伍爾夫所說的“我們不僅是所讀圖書的產物,而且也是閱讀方式的產物”在大數據背景下得到極好的映證[7]。種種跡象已表明,新媒體閱讀與傳統的紙質閱讀,有著本質上的區別,閱讀已然成為一個內涵極廣的概念,新媒體閱讀、數字化閱讀、移動閱讀、超文本閱讀等概念與傳統的閱讀概念并非一回事。
2. 大數據背景下出版業應充分關注閱讀行為的變遷與轉型,積極應對數字時代閱讀的新特點、新趨向,加大對數字化閱讀行為的探究、開發、利用和引導力度
所謂“大數據”,其實質是一種在多樣、海量的數據中快速收集、分析數據的能力,預測可視作大數據的核心力量。大數據在許多行業中的一個主要訴求就是洞悉、預測進而開發消費者需求。對于國內出版業來說,應盡快完善數字閱讀平臺,只有建立了完善的數字閱讀平臺,才能提取受眾的購買與閱讀偏好,而只有大量地掌握了受眾閱讀行為數據,才能真正實現大數據創新。
傳統意義的閱讀主要是一種帶有私密性的個體行為,傳統的閱讀為社會個體維系著有利于思考的超然。新媒體環境下人類的閱讀方式發生深刻變化,閱讀也轉變為可被測量的半公開行為乃至集體行為(如網絡閱讀平臺上的分享、轉發與評價等行為)。目前,各種數字閱讀設備和網絡閱讀平臺能揭示銷售額背后的奧秘,它們不僅可顯示數字出版物的內容吸引了多少購買者,還能顯示其閱讀強度。國內外一些出版商已從社會化媒體數據中發現了新的選題和目標讀者的新需求。
然而,一個關鍵問題依然存在:現在數字出版商和各類移動終端所提取的閱讀行為數據,大多是用戶點擊、購買、瀏覽、分享、評價的記錄,但用戶真正的閱讀體驗和心理認知不易了解,如何了解用戶真正的閱讀體驗、獲得其反饋,仍是一個難題。
四、警惕“數字鴻溝”和“信息孤島”等問題——出版業對數據所有權和數據管理問題應予以前瞻性的關注
大數據背景下,信息的戰略價值愈加凸顯,出版業獲得更為廣闊的發展前景,但出版業仍會面臨資源稀缺、信息孤島、產業弱小、安全隱患等諸多問題的挑戰。
1. 數據所有權問題
對于傳統出版業來說,大數據在相當長的時間內仍將是一個新鮮事物,但即使目前沒有大體量的數據,出版業仍有必要為大數據實踐做好準備,其中最大挑戰是數據采集。在大數據環境下,對于數據的壟斷將給企業占據優勢地位提供強力支持。出于維護行業地位的考慮,部分優勢企業必然會強化自身對數據的掌控乃至壟斷。因此,一個并非多余的擔心便是,未來對數據的訪問、使用受到數據所有權影響,大企業和政府若限制訪問權限,數據將更加難以獲得。從開卷圖書市場研究所等機構的統計數據來看,目前中國的出版單位在市場表現上正出現兩極分化。在這種情況下,出版業內部及出版業和其他內容產業之間極易出現新的“數字鴻溝”和“信息孤島”。出版業為消減“數字鴻溝”和“信息孤島”問題,又不得不牽涉到上述第一、第二兩個層面的問題:推進出版與科技的深度融合和出版產業轉型升級,加快行業大數據信息平臺的建設,實現全產業鏈的信息數據共享,在產業鏈上下游之間創造“無邊界信息流”,提升產業鏈協同效率。此外,出版界必須及時向行業外發出自己的聲音,表達自身作為信息產業、內容產業重要環節對于數據的迫切需求,明確數據在了解社會、行業現狀和推動產業發展中的作用。
2. 版權保護問題
與數據所有權密切相關的版權保護問題在大數據背景下更為突出。大數據環境下的版權成為一種受威脅的資產。在網絡環境下,內容的流動和數字化的閱讀讓版權保護成為一個很嚴重的問題。版權作為現代出版業發展的CXCystBnbBKxj7pK10Cq6yMo8Z4FpFuoGndni1xblP4=重要基石,其開發、保護和利用直接決定出版業價值鏈的建構與維系。若為出版業的發展考慮,大數據背景下內容版權問題仍需擺上前臺,數字版權管理應得到更多的重視。
3. 隱私保護問題
大數據的興起為出版業重塑商業模式、預測市場風險等提供新契機的同時,極易引發濫用數據與侵犯隱私等法律、政策和倫理問題。首先,大數據的存儲與應用不可避免地增加了用戶隱私泄露的風險,甚至可能危及用戶人身安全。其次,一些敏感數據的所有權和使用權并沒有明確界定,很多基于大數據的分析未考慮其中涉及的個體隱私問題。而數據資產化后,數據管理——對數據的產生、收集、保存、維護、處理、利用整個生命周期的管理——將成為一個新的核心問題,數據安全與隱私保護便是其中的一個方面。有效的數據管理是大數據走向成功應用的關鍵。
政府和業界的當務之急,是制定嚴格的法律條例和行業規則,打擊那些傷害用戶、利用用戶隱私牟利的企業,通過加大對侵害用戶隱私行為的懲罰力度,使這類行為得不償失。只有技術和公共政策兩方面緊密結合才能保證大數據的利用得以順利實現。
五、不可神話大數據的應用——大數據是一種工具和解決思路,但不能包治百病,出版業仍需練好內功
出版業對大數據的理解不能過于礙,大數據不僅是一種技術,更是一種工具、能力、思路和戰略,但同時也不應夸大大數據的作用。
1. 大數據不能替代文化風格與思想深度
出版機構利用大數據,不僅可更好地實現營銷與內容相關聯,將內容定向推送給關聯讀者,而且還可根據讀者喜好定制內容。現在已經有人這樣設想:如果能量化用戶閱讀的題材、場所、時長、標注章節及重復瀏覽內容,大數據背景下可量化定制的“快銷書”將指日可待。目前專注于為亞馬遜Kindle設備提供內容的Coliloquy公司的“動態小說”生產模式已經部分實現了這一猜想,這家公司用于定制的內容產品主要是浪漫愛情小說、科幻小說等類別。
出版業是一個強調內容積累、文化語境與知識傳承的行業,很難做到完全以用戶為中心決定內容資源配置,一切由數據說了算的定制生產模式一時也難以取得主導地位。盡管定制生產模式將每一個用戶視作獨立的細分市場有其合理性,但出版業界仍需思考的是:過于強調讀者閱讀興味和大數據分析的作用,是否存在對讀者的曲意逢迎;是否會干擾作者的構思、創作和文化風格的形成,使得作品不倫不類;是否會降低作品的思想深度,進而可能對整個出版文化生態造成負面影響。文化生產領域存在類似的案例:近年來國內出現的古典詩詞相關軟件,可通過詞譜適配、字庫處理、類似判別等功能,實現電腦智能作詩或輔助寫作。但是,如果缺乏特定語境、思想深度和文化意蘊,這種電腦智能詩詞有多大價值是需要存疑的。
2. 數據的真實性、可靠度問題應引起關注
大數據的核心內涵包含4個V——數據量(Volume)、時效性(Velocity)、多樣性(Variety)、可疑性(Veracity)。其中第四個V(可疑性)指的就是當數據來源變得更多元時,數據本身的真實性、可靠度和質量是否有保證。如果數據本身就有問題,那么分析后的結果也不會正確。
以消費行為數據分析為例,當前的消費者需求日益分散化、復雜化、個性化和多變化,在理性消費的基礎上滲透了越來越多的非理性情感因素,消費者在消費時往往帶有一定的盲目性,而且越來越受制于自身之外各種因素的影響,他們通常在尋找到特定產品前對自身的真實需求并沒有十分明確的認知。因此,有時基于消費者的數據分析可能會導致不科學的結果。在目標消費群不成熟、基礎市場需要培育的情況下,出版業對相應大數據的利用更應慎重。
3. 中國出版業完善自身數據分析、數據管理體系尚需時日
大數據在出版領域的應用潛力很大,但需要出版業從各個層面練好內功。在微觀組織層面,出版機構形成數據分析、數據管理的習慣至為關鍵:出版機構一方面應根據不同的數據維度收集有效數據,優化分析方法;另一方面,應從版權購買、產品營銷和用戶溝通等方面入手,更好地將大數據嵌入出版運作流程中,使之成為一種經營資產和管理要素。
我國出版業數據統計工作中還存在統計理念和指標體系滯后、統計方法不完善、數據質量亟待提升等問題。因此,在政府管理與公共服務體系建設層面,出版業數據統計工作需進一步擴大行業覆蓋面,完善統計指標體系和數據監測系統,規范與出版統計有關的術語用法,健全數據信息公開制度,使數據信息更加科學、全面地反映行業發展態勢,為政府和業界科學決策提供參考。
[本文為國家社科基金項目“新媒體環境下閱讀行為嬗變與國民閱讀素養提升策略研究”(12CTQ015)的學術成果之一。]
參考文獻
[1]Kart,Lisa,Nick Heudecker & Frank Buytendijk. Survey Analysis: Big Data Adoption in 2013 Shows Substance Behind the Hype. https://www.gartner.com/doc/2589121?ref=SiteSearch&sthkw=big%20data&fnl=search.
[2]新聞出版科技發展“九五”計劃和2010年長期規劃綱要,http://www.chuban.cc/cbfg/dlcbfg/yskjbz/200701/t20070104_8320.html.
[3]Lossius,George. The Publisher: Innovator or Traditionalist?. Publishers Weekly (Special Issue: The Digital Spotlight),October,2013.
[4]McCullough,David. “The Love of Learning”. http://www.bc.edu/bc_org/rvp/pubaf/08/McCullough_BCCommencement08.pdf.
[5]Reid,Calvin. Can “Big Data” Fix Book Marketing?. Publishers Weekly,May 28,2012.
[6]Reid,Calvin. BookMachine: A Meetup for Global Book Professionals. Publishers Weekly (Special Issue: The Digital Spotlight),October,2013.
[7]Wolf,Maryanne. Proust and the Squid: The Story and Science of the Reading Brain. New York:HarperCollins,2007.