張弛
[摘 要] 構(gòu)建因應(yīng)工業(yè)4.0的精準(zhǔn)出版,既需要大數(shù)據(jù)技術(shù)支持,也需要大數(shù)據(jù)哲學(xué)視域。精準(zhǔn)出版所表現(xiàn)的“量身定做”和“私人定制”是基于數(shù)字人類學(xué)和文化組學(xué)的“量子人性”概念,大數(shù)據(jù)“一切皆可量化”的價(jià)值功能通過數(shù)據(jù)挖掘與量化分析進(jìn)行用戶畫像,使精準(zhǔn)出版進(jìn)入“圖書基因組計(jì)劃”的文化基因量化分析層面。精準(zhǔn)出版對讀者用戶群中“可能讀者”或“潛在讀者”的關(guān)注和開發(fā)是基于大數(shù)據(jù)“第四范式”的“一切皆可預(yù)測”的價(jià)值功能,依據(jù)大數(shù)據(jù)分析為讀者推薦產(chǎn)品,使出版能為讀者用戶提供更加貼身的個性化服務(wù)。精準(zhǔn)出版所依據(jù)的全媒體閱讀方式是基于語義分析意義上的“超文本”原理,全媒體的移動化、社交化、互動式、網(wǎng)絡(luò)化的趨勢給精準(zhǔn)出版創(chuàng)造了個性化、定制化的機(jī)遇。
[關(guān)鍵詞]精準(zhǔn)出版 大數(shù)據(jù) 大數(shù)據(jù)哲學(xué)
[中圖分類號] G237[文獻(xiàn)標(biāo)識碼] A[文章編號] 1009-5853 (2019) 03-0091-06
[Abstract] In response to industry 4.0, lean publishing demands big data technology support as well as big data philosophy field of vision. The private ordering of the lean publishing is based on digital anthropology and culture comics. Every thing can be measured in big data, which can create lean publishing personas by data mining and quantitative analysis. Thus, the lean publishing is at the level of quantitative analyse of Book Genome Projects culture comics.The lean publishing can recommend products to potential readers according to personas based on big data analysis,which can guide the ordering. The readers can get more comfortable personalized service. The Omani media reading realizes that the lean publishing does semantic analysis by hyper-text. Hence,the lean publishing expects the trend to the mobilization,socialization,interaction and networking.
[Key words] Lean publishing Big data Big data philosophy
目前,對于中國出版業(yè)來說,因應(yīng)工業(yè)4.0和大數(shù)據(jù)潮流盡快構(gòu)建基于大數(shù)據(jù)的滿足用戶個性化需求的精準(zhǔn)出版服務(wù)新業(yè)態(tài)已是大勢所趨。所謂精準(zhǔn)出版是粗放出版的對稱,是指針對不同讀者對象量身定制精確營銷的出版模式。作為出版業(yè)發(fā)展的新業(yè)態(tài)和新模式,基于大數(shù)據(jù)的精準(zhǔn)出版既是一種技術(shù)應(yīng)用,也是一種思想方法和哲學(xué)方法。只有充分理解精準(zhǔn)出版的哲學(xué)思想方法,才能高屋建瓴地加快推進(jìn)精準(zhǔn)出版新業(yè)態(tài)建設(shè)。精準(zhǔn)出版的大數(shù)據(jù)哲學(xué)向度主要有以下幾個方面:在主體論意義上“量化人性”的“數(shù)字人類學(xué)”和“文化組學(xué)”;在科學(xué)認(rèn)識論意義上“一切皆可預(yù)測”的“第四范式”;在語義分析意義上“一切可連接”的“超文本”和非結(jié)構(gòu)性數(shù)據(jù)分析。
1 基于“數(shù)字人類學(xué)”和“文化組學(xué)”的精準(zhǔn)出版
英國當(dāng)代數(shù)學(xué)家及人類學(xué)家托馬斯·克倫普(Thomas Crump)在《數(shù)字人類學(xué)》一書中指出:“數(shù)字的本質(zhì)是人,數(shù)據(jù)挖掘就是在分析人類族群自身”;處于一定時(shí)間、地點(diǎn)條件下的人類族群活動是一個動態(tài)系統(tǒng),“所有特定的聚居人群的經(jīng)濟(jì)、社會和政治都是一些動態(tài)系統(tǒng)”。而數(shù)字人類學(xué)就是關(guān)于“這種系統(tǒng)是如何運(yùn)作的假設(shè)”。從這個意義上說,“人人都是建模者(modeller)”[1]。按照托馬斯·克倫普的觀點(diǎn),數(shù)字本質(zhì)上是人的行為和客觀世界運(yùn)動的記錄,是人類行為和客觀世界的數(shù)字符號化或者定量化。只是在小數(shù)據(jù)時(shí)代,人類行為數(shù)字化只限于處理具有嚴(yán)格邏輯性的結(jié)構(gòu)化數(shù)據(jù),難以量化處理雜亂無章瞬息萬變的人的情感和心理行為數(shù)據(jù),而大數(shù)據(jù)改變了人類掌控?cái)?shù)據(jù)的能力,大數(shù)據(jù)MapReduce和Hadoop等非關(guān)系數(shù)據(jù)分析技術(shù),使人們分析處理海量的雜亂無章的非結(jié)構(gòu)性數(shù)據(jù)的能力發(fā)生了質(zhì)的飛躍。大數(shù)據(jù)“一切皆可量化”的功能和價(jià)值使“量化人性”成為現(xiàn)實(shí)。被稱為大數(shù)據(jù)預(yù)測專家的埃里克·西格爾(Eric Seagal )因此提出了“量子人性”概念[2]。他認(rèn)為,在大數(shù)據(jù)時(shí)代,人們對人性的認(rèn)識已經(jīng)由傳統(tǒng)定性分析的經(jīng)驗(yàn)層面進(jìn)入到精準(zhǔn)量化分析的量子層面。
基于“數(shù)字人類學(xué)”的精準(zhǔn)出版不僅是一種業(yè)態(tài)模式,更是一個洞悉分析人性的邏輯過程。離開人來討論精準(zhǔn)出版,其結(jié)論肯定缺乏精準(zhǔn)性。精準(zhǔn)出版是一個全程出版概念,既包括出版選題策劃環(huán)節(jié)的“量身定做”和“私人訂制”,也包括出版印制環(huán)節(jié)的“按需印刷”,還包括銷售環(huán)節(jié)的“精準(zhǔn)營銷”和“精準(zhǔn)服務(wù)”。云南出版集團(tuán)曾開展為期一年的“精準(zhǔn)出版年”活動,提出 “十個精準(zhǔn)”:定位精準(zhǔn)、導(dǎo)向精準(zhǔn)、策劃精準(zhǔn)、作者精準(zhǔn)、讀者精準(zhǔn)、編輯精準(zhǔn)、校稿精準(zhǔn)、印刷精準(zhǔn)、發(fā)行精準(zhǔn)、效益精準(zhǔn)”[3]。在這十個精準(zhǔn)中,最重要的是讀者精準(zhǔn),其他的精準(zhǔn)都是圍繞讀者精準(zhǔn)展開的,而讀者精準(zhǔn)是基于大數(shù)據(jù)的用戶畫像?!坝脩舢嬒袷怯脩魯?shù)據(jù)的標(biāo)簽化,是真實(shí)用戶的虛擬代表,是建立在一系列數(shù)據(jù)之上的目標(biāo)用戶模型”[4]。用戶畫像要求洞悉讀者行為軌跡和讀者心智,通過數(shù)據(jù)挖掘?qū)崿F(xiàn)讀者數(shù)據(jù)標(biāo)簽化。由此可見,實(shí)現(xiàn)精準(zhǔn)出版必須對讀者進(jìn)行用戶畫像,讀者用戶畫像必須運(yùn)用大數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,數(shù)據(jù)挖掘的背后一定要還原為人,這就是“數(shù)字人類學(xué)”之于精準(zhǔn)出版的哲學(xué)意義所在。
“數(shù)字人類學(xué)”強(qiáng)調(diào)“數(shù)據(jù)挖掘就是在分析人類族群自身”,而“文化組學(xué)”(cultureomics)可以說是“分析人類族群自身”的具體體現(xiàn)。
“文化組學(xué)” [5]從產(chǎn)生開始就與圖書出版存在著天然聯(lián)系,其創(chuàng)始人艾略茲·利波曼·埃頓(Erez Liebeman Aiden)在2007年3月訪問谷歌研究部主任彼特·諾維格(Peter Norvig)時(shí),其初始目的是能進(jìn)入谷歌圖書系統(tǒng)以獲得一些數(shù)據(jù),而谷歌圖書正雄心勃勃地試圖掃描人類出版的每一本書的每一頁。通過與谷歌合作,對1000多萬種圖書進(jìn)行數(shù)據(jù)挖掘,埃頓發(fā)現(xiàn)幾個世紀(jì)以來,文字或單詞在出版物上的增長和減少,反映了人類文化的演變。2010年,埃頓與其助手米歇爾聯(lián)合設(shè)計(jì)出“n-grams”軟件,并由谷歌推出。這種研究方法用類似基因組分析的方法研究圖書數(shù)據(jù)庫,他們將這種方法稱為“文化組學(xué)”?!巴ㄟ^對世界各類書籍的數(shù)據(jù)挖掘,艾略茲·利波曼·埃頓正嘗試實(shí)現(xiàn)絕大多數(shù)的人文研究的自動化”[6]??梢?,“文化組學(xué)”是將文字或單詞等關(guān)鍵詞作為文化基因,利用大數(shù)據(jù)挖掘整理出隨時(shí)間推移文化如何發(fā)生改變的量化指標(biāo)。例如,通過數(shù)據(jù)挖掘發(fā)現(xiàn),在19世紀(jì),技術(shù)進(jìn)步平均需要66年才能被主流文化所接受容納,而在1880年至1920年間,這一過程只需要27年。
“文化組學(xué)”通過數(shù)據(jù)挖掘和量化分析來揭示人類心理行為和文化發(fā)展趨勢,這是在原有的純邏輯模式下難以實(shí)現(xiàn)的。一直以來,閱讀作為一種文化體驗(yàn),個人讀書時(shí)的心境狀態(tài)和思考過程具有很強(qiáng)的個體性,這種私密性是外人無從體會的。在全媒體時(shí)代,出版商和作者不僅可以通過信息互動掌握出版物的銷售額,而且可以一窺讀者的閱讀強(qiáng)度。交互創(chuàng)作出版公司交互創(chuàng)作出版公司的聯(lián)合創(chuàng)始人麗莎·盧瑟福(Lisa Rutherford)堅(jiān)信“書籍應(yīng)該可以是互動的”這一觀念。她和亞馬遜“Kindle互動型內(nèi)容開發(fā)者計(jì)劃”合作,在交互創(chuàng)作出版公司出版的網(wǎng)絡(luò)版電子書中允許讀者自己設(shè)計(jì)人物角色和情節(jié)線索,經(jīng)數(shù)據(jù)分析,讓作家調(diào)整故事以迎合大眾口味”。 “文化組學(xué)”在圖書出版中的具體運(yùn)用案例是蘋果公司收購書燈(Booklamp)的“圖書基因組計(jì)劃”(Book Genome Project)[7]。該計(jì)劃根據(jù)不同讀者閱讀興趣和購書記錄的大數(shù)據(jù)分析,對每個讀者進(jìn)行“智能分組”,對每個讀者進(jìn)行基于“圖書基因組計(jì)劃”的“量身定做”和“私人定制”?!皥D書基因組計(jì)劃”根據(jù)不同人群的文化屬性進(jìn)行用戶畫像和智能分組,具有鮮明的“文化組學(xué)”基因。
“文化組學(xué)”和“圖書基因組計(jì)劃”都聚焦人的文化屬性,把洞悉人性放在中心位置,正如圖靈獎獲得者理查德·衛(wèi)斯里·漢明(Richard Wesley Hamming)所說,計(jì)算的目的不在于數(shù)據(jù),而在于洞察人和事物。同樣,“出版的目的也不在于‘出版,因?yàn)楦鼮閺V闊的利益回饋是通過出版衍生更多的關(guān)系和交流”[8]。互聯(lián)網(wǎng)巨頭之一的騰訊一直把洞悉人性作為關(guān)注焦點(diǎn),從關(guān)注廣告,到關(guān)注人與人脈,關(guān)注人群背后的數(shù)據(jù)與需求,并通過騰訊強(qiáng)大的用戶平臺、關(guān)系鏈及營銷工具,為生產(chǎn)提供高效的社會化營銷解決方案。圍繞人脈這一核心要素,在大數(shù)據(jù)時(shí)代,騰訊社會化營銷平臺提供打通的用戶產(chǎn)品、數(shù)據(jù)庫的營銷工具;而騰訊MIND 3.0則通過對用戶行為數(shù)據(jù)的洞察、分析和挖掘,深描每一個用戶族群,通過差異化標(biāo)簽在品牌和受眾之間建立社會化的營銷關(guān)聯(lián)[9]。對于出版業(yè)來說,“通過精確的數(shù)據(jù)分析、方便快捷的個性化服務(wù),去鎖定用戶、增強(qiáng)忠誠感,對于學(xué)術(shù)出版、專業(yè)出版,尤其賦予意義”[10]。因此,精準(zhǔn)出版不是傳統(tǒng)的經(jīng)驗(yàn)式的抽樣調(diào)查分析,而是建立在“數(shù)字人類學(xué)”和“文化組學(xué)”基礎(chǔ)上的量化分析和人性洞悉。
2 基于“第四范式”的精準(zhǔn)出版
“范式”一詞最早出現(xiàn)在科學(xué)哲學(xué)家托馬斯·庫恩(Thomas Kuhn)的《科學(xué)革命的結(jié)構(gòu)》一書中,哲學(xué)意義上的范式通常是指關(guān)于科學(xué)研究的一系列基本觀念和實(shí)踐規(guī)范。這些基本觀念和規(guī)范包括3方面內(nèi)容:“(1)共同的基本理論、觀點(diǎn)和方法;(2)共同的信念;(3)某種自然觀(包括形而上學(xué)假定)。”[11]由此可見,范式涉及哲學(xué)本體論、認(rèn)識論和方法論問題。作為本體論的范式回答研究對象的本質(zhì)為何以及其真實(shí)性何在的問題;作為認(rèn)識論的范式回答認(rèn)識者與被認(rèn)識者的相互關(guān)系問題;作為方法論的范式回答認(rèn)識者如何獲得知識及研究方法的理論體系問題。庫恩認(rèn)為:“常規(guī)科學(xué)即解難題(puzzle)”[12];研究范式對科學(xué)家共同體起規(guī)范的作用,規(guī)范他們共同的思想觀念和研究方法,科學(xué)共同體的任務(wù)是在范式的規(guī)范下開展研究,進(jìn)而推動科學(xué)發(fā)展。
“第四范式”是已故圖靈獎得主吉姆·格雷提出的,2007年1月他在《科學(xué)方法的一次革命》中提出:“用于這種數(shù)據(jù)密集型科學(xué)的技術(shù)和方法是如此迥然不同,所以,從計(jì)算科學(xué)中把數(shù)據(jù)密集型科學(xué)區(qū)分出來作為一個新的、科學(xué)探索的第四種范式頗有價(jià)值?!盵13]吉姆·格雷之所以將大數(shù)據(jù)密集型范式作為獨(dú)立的第四范式與實(shí)驗(yàn)型第一范式、理論型第二范式、計(jì)算型第三范式區(qū)別開來,是因?yàn)橐郧叭N范式的共同特點(diǎn)是研究需要模型和假設(shè),而第四范式處理PB級以上大數(shù)據(jù)的能力使人們能做到?jīng)]有模型和假設(shè)也可以分析處理數(shù)據(jù)。中國工程院倪光南院士指出,科學(xué)研究的實(shí)踐型范式、理論型范式、計(jì)算型范式都是在已知規(guī)律的情況下發(fā)現(xiàn)新的規(guī)律,而大數(shù)據(jù)“則是在未知規(guī)律的情況下,運(yùn)用計(jì)算機(jī)能力從大數(shù)據(jù)中發(fā)現(xiàn)規(guī)律并發(fā)揮規(guī)律的作用”[14]。能夠基于“未知”來探求“未知”進(jìn)而發(fā)現(xiàn)規(guī)律,這是大數(shù)據(jù)第四范式的方法論革命,其意義在于從“未知”中發(fā)現(xiàn)問題和規(guī)律,進(jìn)而精準(zhǔn)預(yù)測。而公認(rèn)的大數(shù)據(jù)的核心價(jià)值就是精準(zhǔn)預(yù)測。埃里克·西格爾指出:“有若干因素將會推動預(yù)測技術(shù)的不斷發(fā)展:爆炸式的數(shù)據(jù)增長、功能更加強(qiáng)大的計(jì)算機(jī)、更加廣泛深入的理解以及科學(xué)的發(fā)展。組織與個人之間越來越多的交互行為將受到預(yù)測的驅(qū)動?!盵15]
基于大數(shù)據(jù)的精準(zhǔn)預(yù)測導(dǎo)致兩個重要的認(rèn)識論轉(zhuǎn)變:第一,從小數(shù)據(jù)時(shí)代的經(jīng)驗(yàn)式預(yù)測到大數(shù)據(jù)時(shí)代的精準(zhǔn)性預(yù)測轉(zhuǎn)變。在小數(shù)據(jù)時(shí)代,因?yàn)槿狈A康?、全面的、?zhǔn)確的數(shù)據(jù)作為支撐。人們對事物發(fā)展趨勢的認(rèn)識往往是以經(jīng)驗(yàn)為基礎(chǔ)的,日常表現(xiàn)為“大概”性的猜測。胡適曾將這種習(xí)慣“大概”的中國人稱為“差不多先生”[16]。顯然,“大概”“差不多”是與小數(shù)據(jù)時(shí)代相聯(lián)系的。在大數(shù)據(jù)時(shí)代,海量、實(shí)時(shí)、準(zhǔn)確的數(shù)據(jù)收集及其挖掘技術(shù)轉(zhuǎn)變了人類認(rèn)識事物的路徑,即涂子沛在他的著作《大數(shù)據(jù)》提到的“將計(jì)算機(jī)運(yùn)用于數(shù)據(jù),而不是數(shù)據(jù)用于計(jì)算”。大數(shù)據(jù)挖掘中“Hadoop處理數(shù)據(jù)是以數(shù)據(jù)為中心,而不是傳統(tǒng)的以程序?yàn)橹行摹盵17]。因此,“大數(shù)據(jù)的洪流也在改變著人們對數(shù)據(jù)及其作用的認(rèn)識”。“數(shù)據(jù)不再僅僅是科學(xué)研究的結(jié)果,而且變成科學(xué)研究的活的基礎(chǔ)和工具”[18]。大數(shù)據(jù)的實(shí)時(shí)性、整體性、高效性、相關(guān)性成為精準(zhǔn)預(yù)測的主要科學(xué)基礎(chǔ)。第二,社會科學(xué)認(rèn)識方式從“非科學(xué)”到“科學(xué)”的轉(zhuǎn)變。在小數(shù)據(jù)時(shí)代,量化人性和定量人的行為是困難的,而大數(shù)據(jù)時(shí)代賦予“定量人性”以現(xiàn)實(shí)可行性?!盁o尺度網(wǎng)絡(luò)”概念的提出者艾伯特·拉斯洛·巴拉巴西(Albert-LászlóBarabási)指出,“人類行為93%是可以預(yù)測的”,“人類大部分行為都受制于規(guī)律、模型以及原理法則,而且它們的可重現(xiàn)性和可預(yù)測性與自然科學(xué)不相上下”[19]。巴拉巴西由此提出人類社會發(fā)展呈現(xiàn)冪律式周期爆發(fā)運(yùn)動。雅虎的首席科學(xué)家沃茨(Watts)更進(jìn)一步指出,由于大數(shù)據(jù)出現(xiàn),社會科學(xué)將脫下“準(zhǔn)科學(xué)”的外衣,真正走進(jìn)科學(xué)的殿堂[20]。從哲學(xué)意義上講,大數(shù)據(jù)第四范式從“未知”發(fā)現(xiàn)“未知”的認(rèn)知方式改變了傳統(tǒng)哲學(xué)關(guān)于“可能與現(xiàn)實(shí)”的關(guān)系,大數(shù)據(jù)的核心價(jià)值在于發(fā)現(xiàn)潛在價(jià)值和防范潛在風(fēng)險(xiǎn),大數(shù)據(jù) “一切皆可預(yù)測”的功能和價(jià)值大大提高了人類行為的前瞻性和防范風(fēng)險(xiǎn)的能力。
從精準(zhǔn)出版的意義上講,“一切皆可預(yù)測”和“可能與現(xiàn)實(shí)”關(guān)系的改變要求我們改變關(guān)注點(diǎn),即從關(guān)注“現(xiàn)實(shí)讀者用戶”轉(zhuǎn)變?yōu)橥瑫r(shí)要關(guān)注“可能讀者用戶”或“潛在讀者用戶”,過去我們通常強(qiáng)調(diào)“讀者是上帝”,但關(guān)注的只是存在著現(xiàn)實(shí)買賣關(guān)系的“讀者”,而不關(guān)注對“潛在讀者用戶”的挖掘。主要原因是缺乏對讀者用戶數(shù)據(jù)的挖掘。在出版領(lǐng)域,將可能的“潛在用戶”挖掘、發(fā)展成“現(xiàn)實(shí)用戶”的常見措施是基于智能分組的出版物推薦系統(tǒng),讀者用戶只要在淘寶、京東、拼多多、當(dāng)當(dāng)和亞馬遜有過購買出版物或者瀏覽過出版物的記錄,都會同時(shí)伴隨出現(xiàn)相關(guān)出版物的推薦。運(yùn)用這種推薦系統(tǒng)的成功案例是2013年推出新版《紙牌屋》的奈飛公司(Netflix),它改變了過去單純依靠算法來優(yōu)化推薦系統(tǒng)的傳統(tǒng)模式,而是通過模擬人的大腦活動建構(gòu)更接近人的個性化需要的智能化出版物推薦系統(tǒng)。埃里克·西格爾指出:“Netflix是預(yù)測分析應(yīng)用的先行者,它租借出去的70%的影碟都通過預(yù)測分析在網(wǎng)絡(luò)得到推薦。推薦對于零售業(yè)來說越來越重要。這不僅僅是商家單方面的銷售指數(shù),如果能精準(zhǔn)地為客戶推薦產(chǎn)品,那也是為消費(fèi)者提供的貼身化和個性化服務(wù)?!盵21]滿足讀者用戶個性化需要的精準(zhǔn)出版本質(zhì)上也是智能出版,而智能出版是大數(shù)據(jù)時(shí)代的必然產(chǎn)物。從人類精神生產(chǎn)和智能活動的進(jìn)步來看,數(shù)據(jù)是信息的基礎(chǔ),信息是知識的基礎(chǔ),知識是智能的基礎(chǔ)。人類的智力活動,就是將數(shù)據(jù)轉(zhuǎn)化為信息,將信息轉(zhuǎn)化為知識,將知識轉(zhuǎn)化為智能的邏輯過程。
3 基于“超文本”的精準(zhǔn)出版
“超文本”一詞最早由美國學(xué)者特德·納爾遜(Ted Nelsom)在1965年提出,雖然在他之前,范尼瓦·布什(Vannevar Bush)在1930年代就提出了存儲擴(kuò)充器(memory extender,Memex)的想法,他設(shè)想了文本的一種非線性結(jié)構(gòu),但第一次正式使用“超文本”一詞的是特德·納爾遜?!俺谋尽奔仁且环N超鏈接的,將不同空間和不同格式的信息數(shù)據(jù)組織起來的網(wǎng)狀文本,更是一種用戶界面范式。網(wǎng)狀非線性是其結(jié)構(gòu)特點(diǎn),多通道并行傳輸是其傳播特點(diǎn)。
從哲學(xué)意義上研究“超文本”的主要是羅蘭·巴特(Roland Barthes)和德里達(dá)(Derrida)等解構(gòu)主義語言學(xué)家,他們從語義分析角度出發(fā),指出語言表達(dá)過程中言語所表達(dá)的意義既不是線性的,也不是單一的,其原因在于語言中能指與所指之間的對應(yīng)關(guān)系會受到“第三者”的干擾,或者由于語境變化而產(chǎn)生意義分裂,能指會滑向另一層所指,所指也會滑向另一層能指。語言的意義由此會從原來的線性單一結(jié)構(gòu)演變成非線性的、復(fù)雜的、無邊的網(wǎng)狀結(jié)構(gòu)。羅蘭·巴特在《S/Z》一書中指出:當(dāng)讀者閱讀文本時(shí),意識中“理性的邏輯方式與象征的邏輯扭作一團(tuán)。這象征的邏輯不是演繹的,而是聯(lián)合的:它與另外的觀念、另外的意象、另外的意指作用具體之文聯(lián)合起來我們被告知唯一的文本不存在”[22]。羅蘭·巴將對文本閱讀的設(shè)計(jì)只是“理想文本”。但其“理想文本”概念一直被視為超文本的理論基礎(chǔ)。而真正意義上“超文本”是直到計(jì)算機(jī)和網(wǎng)絡(luò)普及,特別是大數(shù)據(jù)、云計(jì)算、新一代人工智能蓬勃發(fā)展起來以后才得以實(shí)現(xiàn)的。在泛互聯(lián)和大數(shù)據(jù)條件下,讀者的閱讀已經(jīng)由以往單一的文本閱讀擴(kuò)展為文字、圖片、音頻、視頻等多媒體甚至全媒體交互式閱讀,閱讀介質(zhì)也由以往的平面媒介擴(kuò)展為立體媒介閱讀,以至于“媒介不再是訊息,它是訊息本身”[23]。
從哲學(xué)方法論意義上說,基于大數(shù)據(jù)的“超文本”改變了科學(xué)主義的決定論觀點(diǎn)??茖W(xué)主義認(rèn)為只有自然界是決定論的,只有自然現(xiàn)象是遵循必然規(guī)律并可以預(yù)測的;而人類社會是非決定論的,是雜亂無章,無規(guī)律可循的。顯然,這種決定論觀點(diǎn)是與小數(shù)據(jù)時(shí)代相聯(lián)系的。在小數(shù)據(jù)時(shí)代,人們的社會活動錯綜復(fù)雜,人的社會活動數(shù)據(jù)變動不居,千頭萬緒;特別是個人情感數(shù)據(jù)、人群社會交往數(shù)據(jù)等,大都是非結(jié)構(gòu)性數(shù)據(jù),既難以收集,更難以分析整理。正如中國工程院院士李國杰所說:“人們?nèi)粘I钪兴a(chǎn)生和獲取的數(shù)據(jù)85%以上是非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)的關(guān)系數(shù)據(jù)庫無法勝任這些數(shù)據(jù)的處理,因?yàn)殛P(guān)系數(shù)據(jù)庫系統(tǒng)的出發(fā)點(diǎn)是追求高度的數(shù)據(jù)一致性和容錯性?!盵24]在大數(shù)據(jù)條件下,以Hadoop和MapRduce為代表的非關(guān)系數(shù)據(jù)分析技術(shù),使人類獲得了處理非結(jié)構(gòu)性數(shù)據(jù)的強(qiáng)大能力。通過社交網(wǎng)絡(luò)服務(wù)(SNS)獲取人們的網(wǎng)聊記錄,通過在線支付獲得人們的消費(fèi)記錄,通過LBS獲得地理位置信息,通過視頻監(jiān)控、電子郵件獲取人們的言談舉止數(shù)據(jù)。這些“超文本”數(shù)據(jù)大大擴(kuò)展了對人的認(rèn)知范圍和認(rèn)知深度。出版作為符號信息的社會化工作,“隨著符號的精細(xì)化、準(zhǔn)確化、形象化,同時(shí)也伴隨著人類精神的自我認(rèn)知與發(fā)展,人類精神活動得以在其中直觀展開”[25]。
從精準(zhǔn)出版的意義上講,“超文本”對傳統(tǒng)出版有兩個重要改變:一是“超文本”的網(wǎng)絡(luò)全媒體結(jié)構(gòu)改變了人們傳統(tǒng)的、單一的、線性閱讀方式,交互式、體驗(yàn)式閱讀大大提高了人的閱讀參與性和閱讀興趣。由于全媒體閱讀的發(fā)展,中國三大電信運(yùn)營商都投入巨資進(jìn)入圖書閱讀市場,中國移動推出“和閱讀”,中國電信推出“天翼閱讀”,中國聯(lián)通則推出“沃·讀者”。還有一些網(wǎng)絡(luò)文學(xué)運(yùn)營商不斷拓展閱讀體驗(yàn)新空間,如塔讀文學(xué)推出“富媒體互動閱讀計(jì)劃”,其網(wǎng)上運(yùn)營的“閱space”客戶端,圍繞互動閱讀提供圖文并茂、音頻視頻交互、頁面多樣套用的閱讀內(nèi)容。時(shí)代出版?zhèn)髅酵瞥觥皶r(shí)光流影TimeFace”閱讀社交化計(jì)劃,“QQ閱讀”把閱讀和社交結(jié)合起來,其精彩內(nèi)容可以在朋友圈鏈接、傳遞、分享。這種閱讀方式移動化、社交化、互動式、網(wǎng)絡(luò)化的趨勢是“超文本”帶給出版精準(zhǔn)化、個性化、定制化的機(jī)遇。二是“超文本”的網(wǎng)絡(luò)無邊、即時(shí)特性改變了傳統(tǒng)單一的學(xué)習(xí)方式,在線學(xué)習(xí)大大提高了人們學(xué)習(xí)的便捷性和選擇性。中央電視臺曾以“慕課來了”作過專題報(bào)道,“慕課”作為一種基于互聯(lián)網(wǎng)和大數(shù)據(jù)的教學(xué)模式,其“線上+線下”的資源整合模式比傳統(tǒng)單一線下教學(xué)更有優(yōu)勢?!澳秸n”的迅猛發(fā)展使得課程教材出版也出現(xiàn)了“紙質(zhì)版教材+光電網(wǎng)絡(luò)教材”的價(jià)值構(gòu)造。美國高等教育在線學(xué)習(xí)公司Sipx副總裁海瑟·魯蘭·斯特圖斯(Heather Rez Stratus)指出,“ 慕課對于出版產(chǎn)業(yè)拓展出版空間具有重要價(jià)值?!秸n需要內(nèi)容,學(xué)術(shù)出版商應(yīng)該抓住這一機(jī)會為‘慕課提供內(nèi)容,從而拓展新的市場”[26]。從體量上說,慕課是面向億萬人的超大課堂;從個人需求來說,慕課又是私人定制、按需組合的精準(zhǔn)課堂??梢哉f,“慕課”既拓展了傳統(tǒng)的課堂學(xué)習(xí)方式,也拓展了傳統(tǒng)的線下出版方式。
當(dāng)然,“超文本”不僅僅只是改變了傳統(tǒng)的出版格式和格局,更重要的是改變了出版?zhèn)鞑サ睦砟詈退伎挤绞?。事?shí)上,基于羅蘭·巴特的“理想文本”理念和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,全球出版業(yè)在幾十年前就已經(jīng)開始從紙媒體時(shí)代向多媒體時(shí)代的轉(zhuǎn)型。中國很多出版機(jī)構(gòu)不僅擁有紙質(zhì)出版物的出版權(quán),還擁有電子音像和網(wǎng)絡(luò)出版物的出版權(quán),在出版?zhèn)鹘y(tǒng)紙質(zhì)圖書基礎(chǔ)上,不少出版機(jī)構(gòu)還推出電子版、手機(jī)版、網(wǎng)絡(luò)版以及應(yīng)用程序(App)等多種媒體出版物。但是,幾十年過去后,多媒體出版的效果并不盡如人意。分析其原因主要有兩個。
第一,只轉(zhuǎn)變媒體方式而沒有轉(zhuǎn)變出版理念。很多出版機(jī)構(gòu)還是沿用老式的出版理念來運(yùn)營新媒體,像搬家一樣將老的、紙質(zhì)的內(nèi)容拷貝到新媒體上,而并不在意這些內(nèi)容的簡單搬家式移植是否符合讀者用戶的個性化需要,這種用老思維嫁接新技術(shù)的做法本質(zhì)上是沒有理解新媒體的價(jià)值和意義。其實(shí),新媒體之新,不僅僅表現(xiàn)在技術(shù)上和形式上將文字、圖表、音頻、視頻等多種格式的文本集于一身,更重要的是它從傳播學(xué)意義上消解了傳播者和接受者主客二分的二元身份,使傳播者能變成接受者,使接受者能變成傳播者。同時(shí),新媒體特別是網(wǎng)絡(luò)媒體的應(yīng)用還改變了傳統(tǒng)傳播的時(shí)空特性。而在線閱讀、移動閱讀打破了以往傳播時(shí)間和傳播空間的局限性,使閱讀成為可以實(shí)時(shí)、實(shí)地進(jìn)行的個性化選擇。顯然,新媒體突破了傳統(tǒng)媒體的主客二分和時(shí)空局限性,具有個性化、互動性、精準(zhǔn)性、及時(shí)性、移動性、開放性、海量性、低成本等特點(diǎn),而其中精準(zhǔn)傳播和互動傳播是新媒體最本質(zhì)的特征。美國《在線》(OnLine)雜志在對新媒體進(jìn)行定義時(shí)指出:“新媒體是所有人對所有人的傳播。從這個意義上說,傳播受眾不再是單純的、被動的信息接受者,受眾同時(shí)也是轉(zhuǎn)播主體?!泵绹鴮W(xué)者J·A·巴倫(J.A.Barron)在20世紀(jì)60年代提出的受眾參與理論在互聯(lián)網(wǎng)、移動互聯(lián)時(shí)代日益變成日常傳播實(shí)踐。正因?yàn)槿绱?,新聞傳播學(xué)界有人提出以“用戶”概念替代“受眾”概念[27]。
第二,缺乏大數(shù)據(jù)思維,不注重讀者用戶的數(shù)據(jù)收集、數(shù)據(jù)挖掘和數(shù)據(jù)利用,只是把新媒體當(dāng)做簡單的傳播工具。目前,很多紙媒出版的App都不注意分析用戶行為數(shù)據(jù),很少有運(yùn)用“用戶網(wǎng)絡(luò)行為畫像”的成功運(yùn)作案例。用戶畫像是一種能將定性與定量方法很好地結(jié)合在一起的載體,定性的方法通過對用戶的生活情境、使用場景、用戶心智進(jìn)行分析,對用戶的性質(zhì)和特征做出抽象與概括;定量的方法可以對特征做精細(xì)的統(tǒng)計(jì)分析與計(jì)算,獲得對于用戶較為精準(zhǔn)的認(rèn)識,便于在數(shù)值排序的基礎(chǔ)上實(shí)現(xiàn)核心用戶的發(fā)掘與突出[28]。但遺憾的是,出版行業(yè)目前在運(yùn)用“用戶畫像”實(shí)現(xiàn)精準(zhǔn)出版方面還沒有真正起步。最突出的表現(xiàn)是,移動用戶的閱讀高峰一般出現(xiàn)在晚上十點(diǎn)至凌晨一點(diǎn)這一時(shí)間段,這一時(shí)間段很多出版媒體的App反而不再更新內(nèi)容,因?yàn)轶w制原因,這一高峰段傳統(tǒng)媒體員工都下班了。媒體既然面對的是讀者和用戶,就要知己知彼,讀懂用戶的消費(fèi)需求。為了精準(zhǔn)了解用戶行為,美國創(chuàng)業(yè)公司海馬(Hiptype)推出一套專門的電子閱讀分析工具,既能統(tǒng)計(jì)讀者的試讀次數(shù)和購買次數(shù),還能統(tǒng)計(jì)讀者的年齡、職業(yè)、性別、收入、居住地址及閱讀愛好,并通過對數(shù)據(jù)分析繪制“讀者圖譜”。當(dāng)今的社會化閱讀,早已將大眾傳播的內(nèi)容移植到人際交往平臺上,社交平臺產(chǎn)生的大量“超文本”非結(jié)構(gòu)性數(shù)據(jù),一般都是通過音頻、視頻、網(wǎng)絡(luò)日志、圖片、聊天記錄等非邏輯形式表現(xiàn)出來的。過去由于缺乏大數(shù)據(jù)技術(shù),這些非結(jié)構(gòu)性數(shù)據(jù)大都被當(dāng)做“數(shù)據(jù)垃圾”和“數(shù)據(jù)廢氣”舍棄。在大數(shù)據(jù)時(shí)代,處理“黑暗數(shù)據(jù)”和“數(shù)據(jù)廢氣”已不是太大的技術(shù)難題,出版行業(yè)要真正建立基于讀者用戶個性化需要的精準(zhǔn)出版新業(yè)態(tài),亟需進(jìn)行出版理念和思維方式的革命。
注 釋
[1] [美]托馬斯·克倫普.數(shù)字人類學(xué)[M].北京:中央編譯出版社,2007:110-111
[2] [15] [21][美]埃里克·西格爾(Eric Siegel)著;周昕譯.大數(shù)據(jù)預(yù)測[M].北京:中信出版社,2014:259,235,149
[3] 孫海悅.云南出版集團(tuán)開展“精準(zhǔn)出版年”活動[N].中國新聞出版廣電報(bào),2016-03-29
[4] 曾鴻,吳蘇倪.基于微博的大數(shù)據(jù)用戶畫像與精準(zhǔn)營銷[J]現(xiàn)代經(jīng)濟(jì)信息,2016(16):306-308
[5] [美]艾略茲,利波曼,埃頓.數(shù)字化圖書的定量文化分析[J].科學(xué),2011(1):176-182
[6]楊鑫倢.終有一天,大數(shù)據(jù)會“顛覆”出版業(yè)[N].IT時(shí)報(bào),2013-08-16
[7]愛德華·諾沃特卡.極具創(chuàng)意的圖書基因組計(jì)劃[EB/OL].[2018-06-11].http://www.bookdao.com/article/27706/.htm
[8] 白志如.國內(nèi)眾籌出版項(xiàng)目的內(nèi)容分析與發(fā)展建議[J].出版科學(xué),2014(5):74
[9] 麻震敏.大數(shù)據(jù)時(shí)代:營銷智慧的進(jìn)化論[J].成功營銷,2012(7):82-83
[10]蔡 翔.傳統(tǒng)出版融合發(fā)展 :進(jìn)程、規(guī)律、模式與路徑[J].出版科學(xué),2019(2):10
[11] 鄧仲華,李志芳.科學(xué)研究范式的演化:大數(shù)據(jù)時(shí)代的科學(xué)研究第四范式[J].情報(bào)資料工作,2013(4):19-23
[12]T.S.庫恩著;李寶恒,紀(jì)樹立譯.科學(xué)革命的結(jié)構(gòu)[M].上海:上??茖W(xué)出版社,1980:29
[13]Tony Hey Stewart Tansley Kristin Tolle著;潘教峰,張曉林譯.第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)[M].北京:科學(xué)出版社,2012:11
[14]黃曉艷,單曉釗.關(guān)于大數(shù)據(jù):訪中國工程院院士倪光南[J].高科技與產(chǎn)業(yè)化,2013(5):40-45
[16]涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2013:329
[17]陳明.數(shù)據(jù)密集型科研第四范式[J].計(jì)算機(jī)教育,2013(9):103-106
[18]梁娜,曾燕.推進(jìn)數(shù)據(jù)密集科學(xué)發(fā)現(xiàn)提升科技創(chuàng)新能力:新模式、新方法、新挑戰(zhàn):《第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)》譯著出版[J].中國科學(xué)院院刊,2013(1):115-121
[19][美]艾伯特·拉斯洛·巴拉巴西著;馬慧譯.爆發(fā):大數(shù)據(jù)時(shí)代預(yù)見未來的新思維[M].北京:中國人民大學(xué)出版社出版,2012:Ⅲ
[20]D.J.Watts.“A twenty-first century science”[J].Nature,2007,volune445:489
[22][法]羅蘭·巴特著;屠友祥譯. S/Z[M].上海:人民出版社,2000:136
[23][美]尼葛洛龐帝著;胡泳,范海燕譯.數(shù)字化生存[M].??冢汉D铣霭嫔?,1996:68
[24]李國杰.大數(shù)據(jù)研究的科學(xué)價(jià)值[J].中國計(jì)算機(jī)學(xué)會通訊,2012(9):10
[25]侯亞丁.媒介產(chǎn)業(yè)的價(jià)值生態(tài)[J].出版科學(xué),2015(1):53
[26]孫牧. 大數(shù)據(jù)推動學(xué)術(shù)出版革新[N]. 中國出版?zhèn)髅缴虉?bào),2013-10-08
[27]曹疆.從內(nèi)容為王到用戶至上[N],中國產(chǎn)經(jīng)新聞報(bào),2013-04-14
[28]牛溫佳,劉吉強(qiáng),石川,等.用戶網(wǎng)絡(luò)行為畫像:大數(shù)據(jù)中的用戶網(wǎng)絡(luò)行為畫像分析與內(nèi)容推薦應(yīng)用[M].北京:電子工業(yè)出版社,2016:3
(收稿日期: 2019-04-04)