殷建文
(珠海市圖書館,廣東 珠海 519000)
在新媒體時代背景下,圖書館的閱讀形式不再僅僅是以文本和圖像等形式的閱讀,取而代之的是集文字、圖像與視頻于一體的立體化閱讀形式[1]。在閱讀媒介上,也不再僅僅是紙質(zhì)媒介,而是更多地采用數(shù)字閱讀終端以及移動閱讀終端。在交流方式上,也由傳統(tǒng)的淺顯交流,到如今的充分體現(xiàn)動態(tài)性、共享性、社會性以及參與性的多位一體的深入交流。隨著圖書館的閱讀形式發(fā)生變化,圖書館的閱讀服務(wù)也要隨之變革。閱讀服務(wù)在圖書館的整體運(yùn)營中應(yīng)處于主導(dǎo)地位,其關(guān)鍵點(diǎn)在于有效地組織和開展閱讀服務(wù),以提升圖書館的社會地位,讓更多的讀者參與到閱讀中來。因此構(gòu)建圖書館的閱讀社區(qū)勢在必行,也符合圖書館閱讀服務(wù)發(fā)展的潮流。
目前,國內(nèi)圖書館讀者閱讀社區(qū)的構(gòu)建主要研究點(diǎn)在于構(gòu)建網(wǎng)上閱讀社區(qū),有學(xué)者認(rèn)為,閱讀社區(qū)是一種以交流為主要導(dǎo)向的網(wǎng)絡(luò)閱讀討論組織系統(tǒng)[2]。構(gòu)建圖書館的閱讀社區(qū)有利于加強(qiáng)讀者與圖書館之間的互動,通過讀者與作者之間互動,讀者與讀者之間的互動,以更方便的網(wǎng)絡(luò)形式開展閱讀討論,引導(dǎo)更多的讀者進(jìn)行深入的閱讀和交流,從而有效地提升圖書館對于讀者的吸引力和凝聚力。有學(xué)者研究認(rèn)為,如今的閱讀更多的是社交性閱讀、個性化閱讀;以閱讀作為媒介,強(qiáng)調(diào)在閱讀過程中的分享、傳播和社交,通過社會化閱讀創(chuàng)造更大的閱讀價值。
國內(nèi)外到目前為止已經(jīng)有一些流行的閱讀社區(qū)[3],如國外的ZITE、FLIPBOARD、FPO等閱讀社區(qū),以及國內(nèi)的超星閱讀社區(qū)、當(dāng)當(dāng)讀書以及網(wǎng)易云閱讀等閱讀社區(qū)。與傳統(tǒng)的圖書館閱讀方式相比,基于閱讀社區(qū)的閱讀方式更加注重讀者之間的聚合,通過高效的互動體驗,讓讀者在移動終端能夠隨時閱讀,享受個性化服務(wù),然而現(xiàn)有的讀者閱讀社區(qū)還存在較多的問題。第一,每個閱讀社區(qū)中的閱讀資源有限,都含有較高的同質(zhì)化閱讀信息,缺少優(yōu)質(zhì)的閱讀資源,現(xiàn)有閱讀社區(qū)都偏向于盈利性質(zhì),所以其涵蓋的閱讀資源在文學(xué)、娛樂和資訊范圍內(nèi),缺少自然科學(xué)、工程技術(shù)等工科類別的閱讀資源。第二,現(xiàn)有的數(shù)據(jù)挖掘技術(shù)僅僅只是挖掘閱讀流程中的前端資源,挖掘的資源有限,對于讀者閱讀行為數(shù)據(jù)都缺少必要的挖掘,而這些行為數(shù)據(jù)恰恰能夠解決很多專業(yè)性的問題。第三,現(xiàn)有閱讀社區(qū)在互動流程上還不夠完善,由于每個讀者都有自己的觀點(diǎn),都可以通過系統(tǒng)進(jìn)行交流,意見雜亂無章且沒有經(jīng)過充分考慮和驗證,在社區(qū)的交流中有大量的低質(zhì)量無意義的錯誤信息,導(dǎo)致交流的效率不高,交流的成本較大。
知識傳承是圖書館的歷史使命,需要全面構(gòu)建基于讀者需求的閱讀社區(qū)系統(tǒng),通過閱讀社區(qū)系統(tǒng)能夠更好地推廣閱讀,營造良好的閱讀氛圍,激發(fā)讀者的閱讀興趣。另外,良好的閱讀社區(qū)文化還能夠傳承文明,構(gòu)建知識體系,升華民族的文化素質(zhì)[4]。如今的傳統(tǒng)圖書館存在缺少數(shù)字化的讀者閱讀社區(qū)系統(tǒng)、閱讀活動單調(diào)、閱讀資源不足、缺乏整體的系統(tǒng)規(guī)劃、讀者體驗較差、缺乏深度交流等問題。現(xiàn)有問題在一定程度上影響圖書館推廣全民閱讀,也不利于新興媒體對于電子圖書館的閱讀推廣。在新興媒體的時代背景下,讀者的閱讀文化素養(yǎng)與習(xí)慣正伴隨著閱讀方式和閱讀形式改變,因此圖書館構(gòu)建基于數(shù)據(jù)挖掘的讀者閱讀社區(qū)勢在必行。基于數(shù)據(jù)挖掘的圖書館讀者閱讀社區(qū)可以利用微博、微信等新興媒體平臺,引領(lǐng)讀者大眾進(jìn)行閱讀,讓讀者有機(jī)會了解更多的優(yōu)秀作品,并能夠及時解決讀者在閱讀中的疑惑。
圖書館讀者閱讀社區(qū)能夠在閱讀服務(wù)的基礎(chǔ)上進(jìn)行深入數(shù)據(jù)挖掘,再通過新興媒體平臺對讀者的各項數(shù)據(jù)進(jìn)行挖掘。根據(jù)數(shù)據(jù)挖掘的結(jié)果向用戶推薦各種閱讀資源,也可以進(jìn)一步豐富圖書館的圖書藏書量[5]。筆者認(rèn)為基于數(shù)據(jù)挖掘的圖書館讀者閱讀社區(qū)構(gòu)建框架包括5個要素,分別是讀者、推廣主體、圖書載體、推薦渠道和品牌活動。圖書館閱讀社區(qū)的5個要素中,讀者是社區(qū)的核心,在圖書館閱讀過程中要強(qiáng)調(diào)讀者與讀者之間的交流;推廣主體是閱讀社區(qū)的另一個主要功能點(diǎn),包括對圖書資源的推廣以及構(gòu)建社會公眾志愿推廣活動;圖書資源是閱讀社區(qū)構(gòu)建的基礎(chǔ)條件和保障,圖書館圖書資源包括紙質(zhì)版和電子版資源;推薦渠道是讀者閱讀社區(qū)賴以生存的主要功能,通過對圖書館讀者的各項數(shù)據(jù)挖掘結(jié)果進(jìn)行針對性的推薦,保障了閱讀社區(qū)的良好生態(tài);品牌活動是閱讀社區(qū)活躍度的有力保障,通過構(gòu)建品牌社區(qū)文化并擴(kuò)展到全民閱讀生態(tài),能夠保障圖書館的閱讀社區(qū)獲得良好的效果。

圖1 圖書館讀者閱讀社區(qū)構(gòu)建框架
圖書館讀者閱讀社區(qū)的5個關(guān)鍵要素是在一定范圍內(nèi)進(jìn)行組合和配置的,通過關(guān)鍵要素之間的相互作用,能夠提高圖書館讀者相互分享知識的意識,升華讀者的閱讀境界,讓讀者在獲得知識的同時能夠愉悅身心[6]。在新媒體時代背景下,圖書館閱讀過程是一個復(fù)雜的網(wǎng)狀結(jié)構(gòu),讀者不再是一個個單獨(dú)的閱讀者,而急需在閱讀過程中利用社交平臺進(jìn)一步理解、分享各自的閱讀內(nèi)容,提升閱讀的效率,分享閱讀的知識。圖2給出了一個圖書館閱讀社區(qū)的三層架構(gòu)模型。

圖2 圖書館讀者閱讀社區(qū)的三層架構(gòu)模型
該模型分為3個層次,頂層的應(yīng)用界面構(gòu)建了讀者操作系統(tǒng),是面向讀者的應(yīng)用界面;中間層則是核心業(yè)務(wù)層,包括了閱讀社區(qū)的主要業(yè)務(wù)流程,以及支撐圖書館閱讀社區(qū)的數(shù)據(jù)挖掘的主要業(yè)務(wù)流程;底層是數(shù)據(jù)存儲區(qū),通過關(guān)聯(lián)數(shù)據(jù)庫存儲數(shù)據(jù),方便進(jìn)行數(shù)據(jù)挖掘。在該架構(gòu)模型中,讀者通過統(tǒng)一的平臺結(jié)構(gòu)進(jìn)入到讀者閱讀社區(qū)中,在閱讀社區(qū)中讀者可以通過一站式的方式對圖書館的圖書資源進(jìn)行檢索、借閱和評價交流,讀者的所有檢索行為、借閱行為以及評價交流內(nèi)容都會被記錄下來,并存儲在底層數(shù)據(jù)庫中;其次,閱讀社區(qū)系統(tǒng)將會根據(jù)讀者的閱讀行為,從閱讀主題、著者、閱讀題材和閱讀系列4個主要方面進(jìn)行數(shù)據(jù)挖掘和關(guān)聯(lián),并將挖掘結(jié)果推薦給不同的用戶;與此同時,數(shù)據(jù)挖掘還會挖掘用戶在社會網(wǎng)絡(luò)上的自媒體內(nèi)容,從挖掘結(jié)果中推斷出不同用戶的活動情景特征,并根據(jù)活動情景特征推薦相應(yīng)的圖書資源。根據(jù)該系統(tǒng)的實(shí)踐與應(yīng)用,圖書館可以在對讀者用戶的閱讀、偏好以及行為數(shù)據(jù)挖掘的基礎(chǔ)上,為讀者用戶推送符合其閱讀需求的閱讀資源,并提高圖書館資源的閱讀量。
雖然圖書館逐漸朝著數(shù)字化、智能化發(fā)展,但是紙質(zhì)資源仍然是社區(qū)圖書資源的基礎(chǔ)數(shù)據(jù)。筆者分別對紙質(zhì)圖書和電子圖書構(gòu)建了獨(dú)立的數(shù)據(jù)庫,兩個數(shù)據(jù)庫之間缺乏數(shù)據(jù)上的關(guān)聯(lián)。為了實(shí)現(xiàn)對讀者進(jìn)行紙質(zhì)電子資源的一體化推送服務(wù),需要整合現(xiàn)有的數(shù)據(jù)庫,構(gòu)建數(shù)據(jù)關(guān)聯(lián)規(guī)則,以補(bǔ)充館藏的不足并為讀者提供豐富的圖書資源。在構(gòu)建數(shù)據(jù)關(guān)聯(lián)規(guī)則上,主要構(gòu)建兩個部分,一是構(gòu)建本地紙質(zhì)電子圖書數(shù)據(jù),二是構(gòu)建網(wǎng)絡(luò)閱讀社區(qū)的圖書數(shù)據(jù)。

圖3 讀者社區(qū)圖書資源的數(shù)據(jù)關(guān)聯(lián)規(guī)則
在構(gòu)建本地紙質(zhì)電子圖書數(shù)據(jù)中,指導(dǎo)思想是構(gòu)建異構(gòu)系統(tǒng)之間的數(shù)據(jù)關(guān)聯(lián)服務(wù),而不能簡單地復(fù)制所有的數(shù)據(jù)。構(gòu)建數(shù)據(jù)關(guān)聯(lián)規(guī)則的具體方法是通過圖書唯一識別號ISBN將兩個數(shù)據(jù)庫中的圖書資源合并起來,然后分別為紙質(zhì)圖書和電子圖書的ISBN號給出對應(yīng)的ID號,最后記錄圖書的各項基礎(chǔ)信息[7]。該方法能夠極大地減少兩個數(shù)據(jù)庫合并過程中的冗余性,又能夠有效地構(gòu)建紙質(zhì)電子圖書的關(guān)聯(lián)規(guī)則。當(dāng)某個讀者需要對應(yīng)的數(shù)目字段時,可以通過“ISBN+ID”號來獲得其喜愛的圖書資源以及圖書形式。
在構(gòu)建網(wǎng)絡(luò)閱讀社區(qū)的圖書數(shù)據(jù)中,同樣可以采用ISBN號來構(gòu)建關(guān)聯(lián)規(guī)則,并將網(wǎng)絡(luò)圖書資源的ID號保存在本地數(shù)據(jù)庫中。針對網(wǎng)絡(luò)的不同社區(qū),需要采用不同社區(qū)提供的批量檢索資源的接口,對同關(guān)鍵詞的檢索結(jié)果進(jìn)行存儲和編號。紙質(zhì)和電子圖書數(shù)據(jù)庫的重要作用一般是體現(xiàn)在關(guān)聯(lián)分屬于不同異構(gòu)系統(tǒng)的圖書數(shù)據(jù)上,雖然圖書資源有不同的形式,但是可以為讀者構(gòu)建統(tǒng)一的圖書檢索、瀏覽和借閱的入口。
讀者社區(qū)的閱讀環(huán)境構(gòu)建包括線下的圖書館環(huán)境構(gòu)建和線上的社區(qū)環(huán)境構(gòu)建。隨著泛在知識環(huán)境的到來,讀者對圖書館的環(huán)境需求更加多樣化和縱深化。新興媒體時代背景下的用戶希望能夠隨時隨地根據(jù)需求,通過多種途徑、多種渠道,以低成本、更可靠地獲取高質(zhì)量的信息資源。因此,針對讀者社區(qū)閱讀環(huán)境的構(gòu)建勢在必行。
在對線下圖書館的環(huán)境構(gòu)建上,主要是對圖書館員的再培養(yǎng)。因為隨著圖書館網(wǎng)絡(luò)社區(qū)化的實(shí)施,圖書館的角色迫切需要從僅僅提供圖書服務(wù)和數(shù)據(jù)庫等資源服務(wù),轉(zhuǎn)化到提供更具有信息附加效果的服務(wù)。這就需要圖書館的館員不斷學(xué)習(xí)新的知識,將自己培養(yǎng)成為具有豐富知識的復(fù)合型圖書館員,為更多的讀者解決疑難問題。同時圖書館方應(yīng)該定期開展培訓(xùn)講座,聘請行業(yè)專家傳授互聯(lián)網(wǎng)、數(shù)據(jù)庫和數(shù)據(jù)挖掘的知識。
在對線上社區(qū)環(huán)境的構(gòu)建上,主要是構(gòu)建閱讀流程上的社區(qū)服務(wù)流程,包括檢索流程、篩選流程、評價流程和反饋流程。檢索流程是讀者在使用閱讀社區(qū)時通過各種方式從信息源處查詢并挑選相關(guān)圖書資源給讀者,閱讀社區(qū)服務(wù)還能提供信息加工服務(wù),為讀者刪除一些不必要的信息。篩選流程則是對讀者從各個信息源獲取到的圖書資源進(jìn)行信息的相關(guān)性、可靠性以及適用性的判斷,并從圖書資源中篩選出有價值的信息傳遞給用戶。評價流程則是對經(jīng)過篩選之后的資源進(jìn)行進(jìn)一步篩選,讓讀者能夠更進(jìn)一步了解到圖書資源的價值。反饋流程則為讀者提供圖書資源的梳理,虛化重組,并幫讀者判斷圖書資源是否偏離閱讀目標(biāo)。
在圖書館讀者閱讀社區(qū)中,讀者的閱讀行為一般包括資源檢索、圖書瀏覽、借閱和評價等行為。為了有效地記錄讀者在社區(qū)中的閱讀行為,首先要求讀者登陸閱讀社區(qū),然后根據(jù)讀者在社區(qū)中的操作將讀者的行為都記錄在數(shù)據(jù)庫中,再通過數(shù)據(jù)挖掘技術(shù)將相關(guān)圖書資源信息推薦給讀者。在對社區(qū)讀者閱讀行為數(shù)據(jù)挖掘過程中,主要包括兩個方面,一是記錄讀者的閱讀行為,二是通過閱讀行為挖掘并分析讀者的關(guān)注資源。
在記錄讀者的閱讀行為上,每個讀者在閱讀社區(qū)中的圖書檢索、借閱和評價行為應(yīng)該被跟蹤和記錄。然而,由于讀者在圖書檢索中將會產(chǎn)生大量的無關(guān)日志數(shù)據(jù),檢索信息重要性比圖書借閱和評價的重要性低得多。所以,在記錄讀者閱讀行為上僅僅記錄讀者產(chǎn)生的圖書借閱和評價數(shù)據(jù)。其中,圖書借閱數(shù)據(jù)包括兩個方面,一方面是紙質(zhì)圖書的借閱數(shù)據(jù),另一方面是電子圖書的全文閱覽數(shù)據(jù)。針對紙質(zhì)圖書的借閱,可以通過訪問圖書館集成管理系統(tǒng)來獲得讀者各個圖書資源的外借記錄,而電子圖書館的借閱數(shù)據(jù)字可以通過跟蹤讀者是否點(diǎn)擊全文閱覽電子圖書鏈接的行為來獲取。圖書評價數(shù)據(jù)一般分為圖書評分、自定義分類和自由書評3種模式。其中,圖書評分太直觀沒有記錄價值,自定義分類信息有深度且內(nèi)容主題突出,可以用于挖掘分析,自由書評的信息量太大難以挖掘,可以僅僅記錄其中的關(guān)鍵詞。因此,在記錄圖書評價數(shù)據(jù)上需要記錄自定義分類信息和自由書評關(guān)鍵詞。
在對閱讀行為數(shù)據(jù)挖掘過程中,主要從4個方面進(jìn)行數(shù)據(jù)挖掘,分別是主題偏好、作者偏好、題材偏好和系列偏好。其中,主題偏好是需要從閱讀行為中挖掘出讀者對于圖書主題內(nèi)容的喜愛程度,以及讀者關(guān)注和閱讀的該主題以外的其他圖書。一般采用讀者在撰寫自由書評時的關(guān)鍵詞來分析讀者對于某個主題的偏好。粉絲偏好是從閱讀行為數(shù)據(jù)中挖掘出讀者對于某些著作的作者的喜愛程度,通過分析并統(tǒng)計讀者的借閱數(shù)據(jù)即可完成對作者偏好的挖掘。題材偏好則是從閱讀行為數(shù)據(jù)中挖掘出讀者關(guān)注和閱讀過程中比較相似的一些圖書題材,由于圖書的題材并不是以主題內(nèi)容劃分的,所以在挖掘過程中需要統(tǒng)計圖書的功能類型,來確定讀者真正喜愛的圖書類型和功能。系列偏好是從閱讀行為數(shù)據(jù)中挖掘出讀者對于某個圖書出版系列的喜愛程度,挖掘讀者對于圖書系列的偏好需要結(jié)合讀者的自由書評和圖書系列信息共同挖掘。為了更形象化地展示4種偏好挖掘的作用,圖4給出了閱讀深度和閱讀廣度上的4種偏好的分布。

圖4 閱讀深度和閱讀廣度上的4種偏好的分布
互聯(lián)網(wǎng)和智能技術(shù)的普及,還可以分析讀者在社交網(wǎng)絡(luò)中的自媒體內(nèi)容數(shù)據(jù),而這些內(nèi)容數(shù)據(jù)已經(jīng)成為了社區(qū)平臺推薦系統(tǒng)的重要發(fā)展方向。在社區(qū)讀者自媒體內(nèi)容數(shù)據(jù)挖掘中,主要采用文本分析的方式對自媒體內(nèi)容進(jìn)行分析,針對社區(qū)讀者應(yīng)該分析文中的隱含主題詞,主要包含4個階段的分析流程,分別是下載字典、分詞、刪除停用詞、構(gòu)建詞云。在下載詞典的過程中,本系統(tǒng)采用R語言進(jìn)行,該語言的相關(guān)軟件為開源免費(fèi)軟件,可以從官方網(wǎng)站上下載,并安裝該語言提供的字典包。字典包是對應(yīng)行業(yè)的專業(yè)詞庫,在對自媒體內(nèi)容分析時可以通過字典包對內(nèi)容完成分詞。在對自媒體內(nèi)容進(jìn)行分詞時,采用R語言提供的Rwordseg工具包,該工具支持中文的分詞過程,且功能強(qiáng)大,使用方法簡單。社區(qū)平臺可以直接為讀者提供該工具包,讀者并不需要了解該工具包的具體原理,只需要按照說明調(diào)用該工具包,即可完成對相應(yīng)自媒體內(nèi)容的分詞。
一般來說,由于自媒體文本內(nèi)容屬于自然語言文本,所以在文本當(dāng)中包含有大量的虛詞,而這些虛詞沒有任何的實(shí)際意義,只是為了語句通順而添加的輔助詞,這些輔助虛詞都與主題內(nèi)容無關(guān),所以需要在數(shù)據(jù)挖掘之前將這些詞清洗掉,通過R語言提供的常用的虛詞包將虛詞清洗掉后,剩下的實(shí)詞將作為文本挖掘的輸入完成詞云的構(gòu)建。詞云是一種場景的文本分析結(jié)構(gòu)圖,其運(yùn)行方式是將所有的詞語放在同一張圖中并根據(jù)詞語在文本中出現(xiàn)的次數(shù)來顯示詞語的大小,從而完成對文本的分析。在社區(qū)讀者自媒體內(nèi)容數(shù)據(jù)挖掘中,通過詞云的排序即可統(tǒng)計出每個詞出現(xiàn)的頻次,進(jìn)而從排在前面的詞獲取讀者在自媒體內(nèi)容中的主題詞。
為了應(yīng)對日益發(fā)展的圖書館數(shù)字化、互聯(lián)網(wǎng)化、智能化,筆者對基于數(shù)據(jù)挖掘的圖書館讀者閱讀社區(qū)構(gòu)建進(jìn)行了研究。從圖書館閱讀社區(qū)的內(nèi)涵和現(xiàn)有問題分析了構(gòu)建讀者閱讀社區(qū)的背景,給出了構(gòu)建讀者閱讀社區(qū)的思路與設(shè)計,分別從數(shù)據(jù)關(guān)聯(lián)、閱讀環(huán)境、行為挖掘和自媒體內(nèi)容挖掘4個方面進(jìn)行了構(gòu)建研究。展望未來,在今后的圖書館讀者閱讀社區(qū)的構(gòu)建上,還應(yīng)該結(jié)合云計算與大數(shù)據(jù)分析等方法,朝著更智能、更有個性化的圖書館讀者閱讀社區(qū)方向發(fā)展。