鄭 艷
(武漢職業技術學院,湖北 武漢 430074)
在互聯網信息時代,現代網絡科技的迅猛發展助力圖書館行業發生了巨大的變革,轉變了傳統圖書館的構成模式、閱讀渠道,也隨之改變了圖書館的管理與服務方式。盡管從大數據技術應用層面來看,現代圖書館在資源獲取、圖書內容、閱讀服務等方面顛覆了人們對原有圖書館的認知,然而從社會地位性、認可度方面來看卻不及傳統圖書館時期。究其原因,主要還是信息化的便利性使得讀者改變了傳統的閱讀方式,很多讀者不再往返于圖書館耗時耗力獲取資料,這也成為現代圖書館在轉型期發展的陣痛,我國圖書館行業正面臨著重大的機遇和挑戰[1]。因此,如何在大數據時代,利用網絡科技的力量獲得成功轉型、重新得到讀者青睞,現已成為圖書館行業的重要使命。
在大數據時代各行各業都與數據掛鉤,“大數據”這個名詞已經膾炙人口,如今社會企業、醫療機構、高等院校、金融領域等都在分析使用大數據。大數據技術讓人們從數據系統中獲取到更多有深度價值的信息資源,幫助人們及時做出重大決策,這也對大數據研究提供了重要依據。鑒于存儲、分析大數據所需的軟硬件成本較低而實用性很強,這也就使得越來越多的行業對大數據產生了興趣,傳統圖書館行業更要在逆境中求生存、化阻力為動力,利用大數據技術轉變管理及服務模式。在現代圖書館管理中,大數據技術能夠將圖書館數據轉化為信息資源,為讀者提供個性化服務。因此,當前大量的大數據研究都在分析圖書館大數據的應用問題,力求通過大數據技術優化圖書館工作效率及服務品質。在大數據背景下,現代圖書館數據庫具備以下特點:
從圖書館表面管理來看,圖書館中的各類圖書、雜志、刊物等數據組織井井有條,讀者可以通過類別查詢所需內容;然而針對存儲的圖書研究數據卻不盡人意。通常大部分圖書館的數據較為混亂,數據研究者慣于使用自我認知來分類組織數據,這些數據通常經項目管理,而項目完成了數據也就受到封存。
數據研究者在組織數據時沒有規范格式標準,盡管有些圖書學科或領域已創建數據標準,然而大部分學科往往都缺少規范化,尤其是政治、社會研究這類集中的數據庫。此外,數據格式也缺乏統一性,數據研究者慣于用自己的格式對數據進行收集,即便是同一個數據研究者,不同數據格式也會用于不同項目,這就給收集數據帶來很大阻力[2]。
圖書館數據庫中所存儲的數據龐大,鑒于圖書多源異構的特征,這個大數據也不同于其他數據領域,因此在圖書館數據收集、處理、分析及轉換等方面均存在一定問題。圖書館大數據要獲得科學合理應用,其應用技術區別于其他領域,這也正是當前圖書館大數據存在的不足之處。
作為圖書館數據分析師,不但要掌握基本的計算機和統計學技術,同時必要具備圖書館管理領域知識和技能。當前,大部分圖書館之所以在大數據技術方面應用不足,主要是專業人員技術力量的不足,圖書館管理人員更需要加強大數據信息的管理培訓,這是一個循序漸進的過程,絕非靠短期突擊學習所能達成。
在互聯網信息時代,大數據的挖掘來源于行業各個領域,現在很多行業并未實質做好大數據的研究準備工作。據了解,社會半數以上的行業機構因缺少專業人才、應用平臺而無法實現大數據的處理及應用。然而,圖書館行業的大數據研究起步甚至更晚,究其原因主要還是基于圖書館更像是一個獨立的組織單位,自成一體與其他行業的關聯性不強。
盡管現在很多人都明白應用大數據分析的優勢,但大數據研究還需要一些較大的成本投資,比如高性能的計算機服務系統、分析服務系統等。基于有些圖書館規模較小、成本預算不足,無法將大數據技術普及到圖書館實際管理中;同時專業人才成本較高,其所研究數據極少能受到充分重視也是問題之一。據了解,當前很多圖書館研究數據仍為多年前所產生的,顯然資源數字化本非一項簡單工作,還需要耗費大量的時間和精力。
大數據要實現使用功能,必須要經過數據收集、存儲、處理、轉換等環節,通過這些技術應用才能呈現真實的數據信息。圖書館數據庫中的數據類型多且雜,其數據表象不同,一些數據沒有數字化;同時大量數據中還包含了許多錯誤、無意義的數據,要排除這些無用數據則需要花費更多的數據處理時間。鑒于圖書館數據類型、格式的特異性,大數據研究者要將其實現集成必定是一項龐大且困難的工作,很多類型的數據看似具備可用性,實則在通過處理之后其可用性會明顯降低;同時基于數據的可訪問性,圖書館數據庫發生系統入侵的風險問題也必須慎重考慮。
眾所周知,傳統圖書館運營模式下,讀者首先要確定自己需要哪本或哪個方面的書籍,隨之通過圖書館查詢系統搜索該書籍所在館內具體位置實現借閱,或是自行瀏覽圖書館挑選感興趣的書籍。但隨著知識學科的進步發展,現在的圖書資源越來越豐富,此種傳統借閱方式將消耗讀者大量的查找時間;同時由于書籍的多樣性,讀者的選擇困難度更高,亟待通過技術行為幫助其解決找書問題,那么大數據技術的優勢就顯現出來了。圖書館通過借閱系統中的個人借閱信息,應用大數據技術分析其近期借閱書籍的喜好和關注點,繼而以此為依據給讀者推薦合適的書籍。如依據借閱信息判斷讀者喜歡的圖書類別,通過借閱時長分析讀者的喜好程度。圖書館管理人員將所有讀者的借閱信息進行分類、量化、評估,再與其他館內圖書進行相似計算,就可以實現類似書籍的自動推薦,幫助讀者獲取到一些他們可能感興趣但未能觸及的書籍。
實現閱讀推廣是發揮圖書館服務的一項重要工作。圖書館除了優選推薦讀物給受眾者,還應通過書評為讀者精確推廣閱讀內容。圖書館以引薦指導讀者為目的創建書評資源庫,可以邀請一些專業領域學者綜合對館內所有藏書進行多方位評價,將一些精品書、好書通過書評方式引薦給讀者。圖書館還能通過大數據技術搜集網絡書評,獲取一些熱門網上書店如當當網、天貓書城、文軒網等在線書評,包括圖書購買問答區的評價信息,利用大數據處理技術對這些數據進行分類、整合再向讀者進行推薦,從而為讀者提供閱讀決策意見,提高圖書推薦的精準性。
行為數據分析包括很多內容,有讀者的圖書查詢檢索記錄、借還流通日志、下載資源地址等,這些行為數據經過分析可以反饋出讀者群體的閱讀需求、閱讀時間、閱讀趨向等。圖書館可以充分利用這些大數據為其管理決策做出有效支撐。例如,在采購圖書時,可以通過大數據技術對圖書借閱量進行數據分析,及時了解哪些圖書資源匱乏,進行有針對性的補充;針對搜索次數多、預定借閱多、瀏覽簡介多、續借次數多的書籍,我們都應該增加復本數量,以保證讀者的借閱需求。據實踐了解,借助大數據技術以讀者意愿驅動采購,能夠促進圖書借閱率獲得顯著提高。尤其是在高校圖書館方面,鑒于教學的時間規律性特點,高校的圖書館往往會有圖書借閱高峰期,那么借助讀者借閱行為數據的分析,就能知悉不同時間段的圖書借閱頻率,更有利圖書館合理安排工作人數,并實現圖書館的高效管理和服務。
鑒于圖書館數據庫信息的龐大復雜性,加之互聯網病毒侵襲、網絡故障等問題均有可能導致圖書館數據庫系統產生故障、系統崩潰。為提高圖書館數據庫系統的安全性,盡量減少故障發生率、減小損失率,對數據庫進行定期維護是圖書館管理工作中的一項必要任務。鑒于當前圖書館信息數據海量陡增,需要在傳統圖書館管理工作思維的基礎上,強化數據備份處理功能,在原有冷備份方式上采用網絡備份新技術,進一步提高數據備份的效率,降低圖書館數據庫的故障產生率。
在大數據背景下,圖書館行業要順應時代發展需求,充分利用大數據及時實現數字化圖書館的管理與服務,才能在新時代的大弄潮中占有一席之地。通過大數據技術的應用,改變傳統圖書館模式、提高圖書館管理效率、提升知識服務層次、提供個性化服務需求,以此發揮出圖書館的最大最優功效。