劉 鵬
(阜新高等專科學校,遼寧 阜新 123000)
數字化技術的發展和智能設備的應用使圖書館的數據也呈現出大數據的“4V”特征,即大量(Volume)、多樣(Variety)、高速(Velocity)、價值(Value),其中,讀者數據(如到館、圖書外借、電子資源下載與瀏覽、空間利用、訪問日志等)的動態特征最為明顯,呈指數型增長,高校圖書館也開始重新審視這部分數據所能創造的價值與服務升級,如何發現并利用這些數據的深層價值,推動服務的快速更新迭代,讓圖書館的服務更懂讀者,更能精準服務于讀者,正是當前圖書館界關注的焦點。重慶大學圖書館以數據為中心重新設計圖書館的智慧服務架構,不斷提升數據管理與數據服務的能力,在該校圖書館主頁的“猜你喜歡”、學院數字圖書館、課程文獻中心等模塊為讀者學習提供了精準的支持。南京大學圖書館成立智慧圖書館研發與測評中心,不斷推進數據融合與智慧服務,全面構造基于數據的智慧服務新生態,于2019年4月26日發布新一代圖書館服務平臺NLSP(Nanjing University Library Services Platforms)。此外,北京大學、深圳大學、寧波大學等高校的圖書館也在積極探索并推進新一代圖書館服務平臺的建設,也都把數據作為重要的支撐點和發力點來驅動服務創新。本文以我國部分高校圖書館的數據服務案例為研究對象,詳細梳理數據研究與利用的現狀、特點及趨勢等,在此基礎上構建數據服務框架,全面感知讀者數據,根據不同層級讀者的需求特征,從數據消費者到價值貢獻者,為讀者提供分眾化、個性化的閱讀推廣服務,在閱讀推廣常態化的大環境下,以數據視角詮釋如何提升閱讀推廣工作的價值貢獻力。
北京大學圖書館從2006年開始發布閱讀報告,是國內最早發布年度閱讀報告的高校圖書館。該報告認真梳理了北京大學圖書館與讀者之間的關系,將數據劃分為空間數據、資源數據和活動數據,主要從整體概況、讀者到館量與主頁訪問量、資源檢索與利用、讀者借書及特征、閱讀設備與閱讀活動等五個維度具體呈現,力求數據的完整;在方案實施方面,跨平臺建立基礎數據池,對數據進行清洗、去噪,建立數據關系,借助可視化技術展現結論;在創新應用方面,主要從檢視館藏布局與服務方式的有效性、發現資源利用趨勢及特征差異、總結資源利用規律并優化配置、發掘熱門資源并促進深度閱讀等方面來推動數據價值的落地,真正做到讓數據來推動服務的優化與升級。
重慶大學圖書館與維普資訊從2016年開始合作,聯合打造新一代資源服務門戶,通過全面整合資源數據、運行數據,構建面向學科、面向讀者、面向場景的智慧圖書館服務平臺,于2016年12月16日正式啟用。智慧圖書館服務平臺實現了紙質資源、電子資源的元數據收割與高效管理,并以讀者運行數據的分析利用為驅動,打通了資源層、數據層和用戶層之間的交互通道,最終面向讀者提供基于需求導向的教學課程資料庫、科研專題資料庫、學院數字圖書館、個人資源庫等智慧化產品,為高校圖書館探索智慧化服務提供了寶貴的實踐經驗。2017年底,重慶大學圖書館又與京東閱讀合作,深度挖掘電子書的閱讀特征,不再簡單地以“借”的數據來考量讀者的閱讀情況,而是更多地關注“讀”的數據,例如,每一本書的閱讀進度、閱讀時長、閱讀時段以及所有外借圖書的類別特征、閱讀率等,這些更為精細化的閱讀數據為圖書館開展智慧服務提供了更有價值的數據支撐。
南京大學圖書館依托超星公司的技術優勢,聯合開發了基于云部署、微服務架構、紙電融合的新一代圖書館智慧服務平臺,于2019年4月26日發布。該平臺以紙質資源管理系統、電子資源管理系統和資源發現服務的多維組合、按需定制為基礎,推動多層級服務、數據相互關聯的統一部署,打破以往各系統孤立運行的模式,實現資源與服務的智慧融合。新一代圖書館智慧服務平臺集成了中央知識庫、采選平臺、館員智慧服務平臺、讀者應用服務平臺四大模塊,強化數據驅動下的技術融合與快速迭代,并以數據融合為支撐在平臺管理深度與開放互聯廣度上不斷突破創新,最終在AI智能服務、VR沉浸式服務、機器輔助服務、空間場景服務等方面滿足讀者的智慧需求。
隨著閱讀推廣工作的常態化開展,閱讀推廣不應過多注重形式的創新,而應更加關注內容的匹配性、價值性、系統性,因此,圖書館需要通過數據來驅動閱讀推廣價值貢獻力的提升。通過前面的案例分析發現,我國部分高校圖書館已開始關注到數據的價值,并通過數據中心及平臺建設等方式應用數據,但目前處于初期探索階段。綜合以上案例,筆者將數據服務框架分為數據生產層、數據分析層和數據應用層三部分(見圖1)。數據生產層主要是對圖書館的資源數據、讀者數據和運行數據進行再組織的過程,以使輸出的數據能被分析層接受,具體包括清洗、校驗、加工、抽取、存儲、備份等環節;數據分析層主要是圍繞對數據生產層傳遞過來的數據在閱讀推廣層面可能產生的創新驅動能力進行精細化分析,包括到館人次、借閱冊次、電子資源下載、讀者活動、空間利用、科研等層面數據的特征分析,而不再僅僅是簡單的到館人次、借閱冊次等數據搜集;數據應用層主要是根據分析層的數據特征和不同讀者群體的特征,推進閱讀推廣工作的分眾化、智慧化,重構閱讀推廣的價值貢獻力和導向效應。

圖1 數據服務框架
3.1.1 數據生產層。圖書館的數據可以分為資源數據、讀者數據和運行數據,數據生產層需要將這三類數據進行融合、組織、輸出。資源數據包括館藏紙質資源、電子資源、自建特色數據庫、機構知識庫等,在資源數字化的基礎上,要不斷細化資源粒度,例如,紙質圖書從整本揭示到章節、段落甚至句子的有序碎片化揭示,是因為單純以文獻為單元的知識組織方式已經無法滿足讀者對信息的精細化需求,只有通過知識元的重構才能為讀者提供更有價值的資源信息,縮短讀者的等待時間、閱讀時間。讀者數據能夠幫助圖書館快速識別讀者的基本特征,通常包括所在學院、專業、研究方向、課題、科研成果、興趣、關注領域等屬性,這類數據不完全局限于圖書館的自動化系統,如果具備條件,盡可能地與高校教務處、學生處、研究生處、科研處等部門的業務系統進行數據共享,以便形成相對全面、多維的讀者數據體系。運行數據指讀者在利用圖書館過程中產生的各種動態變化數據,包括到館人次、借閱冊次、電子資源下載、讀者活動、空間利用、科研等數據,這類數據在構建讀者畫像及數據分析層中將發揮重要作用,因此要保證數據屬性的完整與有效。
3.1.2 數據分析層。數據分析層主要是對數據生產層傳輸過來的數據,通過全樣思維、關聯分析、構建畫像、千人千面等技術或方法,圍繞其在閱讀推廣層可能產生的創新驅動能力進行精細化分析,而資源數據主要用于與分析結果進行匹配化推廣,因此,這里主要介紹讀者數據、運行數據的關注屬性及分析維度(見表1)。對讀者數據的分析應根據教師讀者和學生讀者不同身份的屬性特征進行不同維度的靜態畫像描述,如教師讀者側重于研究方向、課題及科研成果信息等,學生讀者側重于學院、專業、興趣及關注領域等,據此分析結果在應用層向讀者推送常態化閱讀服務;對到館數據應重點關注讀者到館、離館人次的時間特征及在館時長等;對借閱數據的分析應重點關注圖書借閱的主題特征、借閱時段規律、借閱周期反映出的閱讀深度特征等;對電子資源下載數據的分析應重點關注文獻下載的主題特征、時段特征及需求量等;對讀者活動數據的分析應重點關注讀者參與時段呈現的規律、活動主題特征及參與人數等;對讀者空間及座位利用數據的分析應重點關注空間預約時段規律、使用方向特征及座位預約時段規律、座位使用密度分布等;對科研數據的分析應重點關注成果的學科分布、主題特征,成果發表時間規律、刊物等級分布,成果類型、數量等。通過這些數據的特征性、規律性分析,可以在應用層向讀者提供更有價值的服務,例如,根據座位使用密度進行館內閱讀信息發布,在人流密度較高區域放置實體閱讀圖書推廣專架,根據讀者到館時段規律,在人流高峰時段開展閱讀推廣微活動,這些都可以增加資源的閱讀率和曝光度,讓閱讀推廣工作更有價值。

表1 數據分析方法
3.1.3 數據應用層。數據應用層是數據分析結果在閱讀推廣工作方面的具體實踐,讓閱讀推廣工作能夠真正幫助到讀者,產生價值和效益。在策略方面,以數據分析層的結果為依據,根據讀者特征向其推送具有個性化需求的閱讀服務,而不是簡單的寬口徑、大眾化服務,同時,滿足讀者定制閱讀需求,通過反饋、評價、互動等機制不斷優化閱讀服務策略;在資源方面,通過資源粒度的細化和知識元的重構,向讀者推送重新組織后的資源,縮短其從過量資源中獲取目標信息的時間;在對象方面,在根據高校圖書館讀者身份屬性將讀者群體分為教師讀者和學生讀者基礎上,還可以根據所在學院、專業、科研、課題等對讀者進行二次分層,對不同讀者群體開展不同形式、內容差異化甚至千人千面的閱讀推廣服務,為不同讀者個體創造個性化的閱讀推廣服務;在渠道方面,分為線上和線下兩種形式,線上以微信、微博、官方網站主頁等為閱讀服務主渠道,隨著讀者向社交媒體的分流,還可以開通抖音短視頻、今日頭條、知乎、豆瓣等社交新媒體的官方服務號,拉近與讀者之間的距離,線下服務要結合讀者的密度分布、流動趨勢、時段規律等特征投放閱讀資源,例如,在人流密度較高的閱覽區域設立閱讀推廣專題書架等。
根據數據服務框架功能界定及數據生產層、分析和應用層的主要任務和功能,在閱讀推廣數據價值貢獻力提升的路徑中,主要圍繞以下四個方面推進:
3.2.1 資源粒度精細化。資源粒度精細化主要從三個方面推動資源數據化進程,為閱讀推廣數據化驅動在資源層面打好“地基”:一是深化紙質資源的數字化揭示。在現行版權框架下,難以對館藏紙質資源進行全文數字化加工,只能通過對內容的深度揭示進行粒度細化,例如,對某一本圖書的揭示除了依托OPAC系統通過題名、責任者、主題詞等揭示,還要把圖書的目錄、章節、書評等內容進行數字化揭示,以便實現更加精準的檢索與匹配。重慶大學圖書館已經在其使用的弘深搜索中加入了紙質圖書的摘要項,對圖書內容進行詳細介紹,如果能擴展到章節、目錄等并提供檢索服務,將會大幅提升圖書與讀者之間的契合度;二是電子資源的元數據整合。需要考慮統一的數據建模與編碼方式,并在下一代圖書館服務平臺理論指導與實踐驅動下,推動跨類型的數據流通和知識的再組織與再融合,與數據庫商協作,加速數據本地化的部署與服務。三是自建資源庫的共建共享。與教學單位協作,對未公開發表的原生資源(講義、教案、課件、實驗數據等)通過多點采集、分布建庫、授權使用等流程推動本校原創智力成果的再開發與再利用。
3.2.2 讀者群體分眾化。構建不同層面的讀者社群畫像,可以從兩個維度推進(見圖2):一是根據高校讀者靜態屬性分為教師讀者群、學生讀者群、社會讀者群等。教師讀者群可以按學科、課題、科研、年齡等進行再次分層;學生讀者群可以按學院、專業、興趣、關注領域等進行再次分層;社會讀者群可以按年齡、學歷等進行再次分層,層級越細,服務越精準;二是在靜態屬性分層基礎上,結合高校讀者動態特征對社群進行校正或再次分層。這主要依托讀者的行為數據完成,包括到館人次、借閱冊次、科研、讀者活動、空間及座位利用、電子資源下載等數據,且對這些數據的分析不是簡單地關注“次數”“冊次”等,而是要關聯分析、挖掘特征。例如,對某一高校讀者的借閱數據分析,可以通過借閱周期判定閱讀深度,文學類圖書一般3—7天為有效閱讀,非文學類圖書一般7天以上為有效閱讀,對于電子書則可以通過閱讀器來準確獲知閱讀情況,閱讀率在80%以上為有效閱讀,從而能夠準確分析讀者的閱讀特征。例如,重慶大學圖書館通過與京東閱讀合作,能夠準確掌握讀者對每本電子書的閱讀情況(閱讀深度、閱讀時間、閱讀周期等),從而分析讀者的閱讀喜好,進而推送相關資源,在讀者動態特征獲取方面可以與網絡中心合作,獲取讀者網絡瀏覽cookie,在保障隱私的前提下,分析讀者關注社會信息的特征,以此作為一個參照維度,向讀者推送相應的校內資源,類似于今日頭條、淘寶等網站的相關信息推送策略。

圖2 讀者社群畫像構造
3.2.3 推廣渠道移動化。閱讀推廣渠道主要包括線下閱讀空間、傳統媒體和新媒體。線下閱讀空間的主要受眾群體為經常活動在圖書館的讀者,圖書館以空間為載體為他們提供線下閱讀推廣活動,如沈陽師范大學圖書館歷時3年精心打造了5大類22個主題閱讀空間,以空間為陣地,聯合本校各學院開展主題閱讀、經典閱讀、繪本閱讀、影音閱讀等特色閱讀活動,發揮空間優勢與能動作用。傳統媒體主要包括網站、電臺、電視臺、報紙等,適用于推廣體量較大的內容,讀者需要有充足的時間來閱讀推廣內容。新媒體,通常有微信、微博、抖音短視頻等,相對于前兩種推廣渠道,新媒體具有移動化、多元化、個性化等特點,迅速成為讀者的流量高地,高校圖書館應該充分利用新媒體介入讀者社群,為其提供全新的閱讀推廣服務。通過調查發現,中國國家圖書館、上海圖書館、河南工業大學圖書館、內蒙古農業大學圖書館等在抖音短視頻平臺率先開設官方服務號,發布的內容以講座、活動介紹、服務宣傳等為主,這些新穎、活潑的服務方式引起了讀者的高度關注,在提高圖書館在讀者社群的曝光度的同時也充分利用了讀者的碎片化時間推進閱讀推廣,點擊率較高,效果較好;武漢大學、吉林大學珠海學院等在微信平臺開設了官方視頻號,高校圖書館也可以借鑒。在數據時代,依托新媒體搜集讀者關注的領域與閱讀喜好,可以幫助圖書館實現個性化的點式推送,突破媒體邊界,讓閱讀推廣深深扎根于讀者社群中。
3.2.4 評價機制多元化。多元化評價可以從主體跟蹤、客體反饋兩個層面展開:一是主體跟蹤。圖書館作為閱讀推廣的實施主體,在開展閱讀推廣的同時應更加注重效果的跟蹤與評價,避免主觀推測,而是以開展閱讀推廣之后產生的一系列閱讀數據作為依據。例如,對某一場讀書分享會的效果進行評價,在活動之后可以圍繞相關圖書(主題相關、作者相關等)的借閱數據(借閱次數、閱讀時長等)、相關資源(論文)的下載數據等進行深度分析,挖掘趨勢與規律特征,如圖書熱度不單純以借閱次數為評價標準,還應結合借閱時長,以準確評價閱讀的有效深度,這樣真實的數據才能對閱讀推廣效果進行有效評價。二是客體反饋。每項閱讀推廣活動結束后都可以增加簡短的反饋單元,與讀者建立互動通道,接受讀者的反饋,客體反饋能夠比主動跟蹤更能準確感知服務的價值貢獻度。反饋單元在內容設計上要講究實用性,而非形式化,杜絕“非此即彼”的評價模式,如對某本書的評價不是簡單的“有用”或“沒用”,而以分值形式(從1-10打分)評價,這樣更能準確地捕獲讀者的價值反饋,而這些價值反饋在評價機制中也更有參考價值。
在資源組織層面,通過不斷細化粒度,在進行推廣時既能保證資源的覆蓋面,又能降低讀者的閱讀難度,讓不喜歡讀書的人開始喜歡讀書、讓不會讀書的人開始高效讀書,引領讀者走進閱讀、深入閱讀,而不是將所有資源全盤扔給讀者,讓讀者自行篩選。
在推廣對象層面,以數據為驅動,在保證讀者隱私安全的前提下,根據讀者靜態屬性、動態特征等建立不同層面的讀者社群畫像,提供分眾化的閱讀推廣服務,幫助讀者重建專注化的閱讀能力、培養讀者的閱讀興趣、降低讀者獲取有效知識的難度、打造系統化的知識體系,避免給讀者造成更大的閱讀壓力,從而提高推廣內容的受用度。
在推廣途徑層面,依托傳統媒體、線下空間進行閱讀推廣的同時,應該順勢而為,有效借助新媒體的力量推動閱讀推廣渠道的多元化發展,促進閱讀內容的生產與交換,為不同層級讀者打造有溫度、有活力的閱讀圈。
在效果評價層面,依托閱讀數據對閱讀推廣效果的多元化、全景化進行評價,可以進一步準確修正閱讀推廣的策略體系(包括制度、規劃、內容、形式、途徑等),使閱讀推廣更懂讀者,進而讓閱讀推廣產生更大的價值貢獻力,而不能讓閱讀推廣淪為展示行政業績的工具,只注重規模,不注重效果。
數據正在加速各行業的顛覆性變革,圖書館的發展也開始趨向智慧化,同樣,閱讀推廣服務要以數據為驅動以體現其價值性,為此,我們要以數據思維來重構閱讀推廣環境,從資源、途徑、方法等層面推動服務場景與服務能力的升級。