朱 進
(信陽市圖書館,河南 信陽 464000)
大數據是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
麥肯錫全球研究所給出的定義是一種規模大到在獲取、存儲、管理、分析等方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度較低等四大特征。
大數據廣泛應用于各行各業,圖書館作為信息的聚集地,收集大數據、分析大數據、開發和運用大數據,在現代圖書館的發展中,具有十分重要的現實意義,也是我們建設智慧圖書館重要內容,大數據在優化館藏、服務模式、精準服務、服務效率上推動圖書館發生巨大的改變。
現代圖書館不僅有豐富的紙本資源,而且有海量的電子資源,包括電子期刊、電子圖書、學位論文、檢索數據庫、會議文獻、專利文獻以及多媒體資源等,各個圖書館還有自建的特色數據庫,數字資源的存儲量也會呈幾何式增長,這些資源和數據是圖書館大數據應用中的重要基礎。同時,近年來,新技術新媒體的發展運用到圖書館工作中,如基于社交媒體所產生的大量數據,也是我們分析讀者需求、聯系讀者交流、推送圖書館服務重要的應用手段,這些多樣化的數據構成了圖書館的大數據庫,需要圖書館具備強大的數據儲存能力,從而為用戶提供高效的服務。
圖書館中存在的數據不僅僅是指現階段圖書館內部已存在的書刊數據及建設中文獻等多種結構性數據,還包括圖書館當前階段還未建設完畢的半結構化數據與非結構化數據。用戶不僅是簡單的信息數據獲取者,也是信息數據的制造者與傳播者,現階段圖書館廣泛地運用新媒體,如:微信、微博等新型社交媒體,以及讀者的檢索信息、網絡定位等,這些信息與數據大多數都是半結構化或非結構化的數據,且在數量上大大超過了結構化數據,因此,可以得出圖書館數據存在異構、結構數據并存的大數據特征。
圖書館大數據智慧墻,對接圖書館云平臺管理系統,實現數據實時更新,通過不同維度來提供數據的統計和分析。主要實現業務統計、綜合統計、全局業務統計、同步圖書館數據和大數據分析等功能,充分利用圖書館各項數據進行統計分析,不僅可以協助進行設備的維護管理,還可以有效促進圖書館業務的不斷發展(見圖1,P262)。

圖1 信陽市圖書館大數據展示平臺
流通業務統計系統包含圖書借閱統計、借閱排行,還書統計、圖書預約統計、今日圖書借還量統計等模塊,頁面精確顯示各項業務數據,為館員提供可視化管理工具;相關功能模塊可根據館方需求作定制化處理。
針對讀者的圖書業務數據進行統計與分析,包含圖書館當天進館人數統計、當月進館人數統計、當日讀者借還書情況、當日讀者辦證情況、各個時段入館讀者分析,各個時段讀者借書量統計等;依據讀者借閱數據,顯示讀者統計圖表,為進館讀者提供可視化參考信息,提高全民讀書活躍度。
將圖書館圖書信息進行統計分析。據讀者借還數據、圖書借還率等,分析讀者喜好并推薦熱門書籍;統計圖書借還總量,館藏圖書總量,便于館員直觀統計本館圖書信息;對接圖書館新書上架,實時顯示新書推薦,為讀者提供參考,館員也可一目了然的獲取新上架圖書信息。
全局業務統計包含借還書辦證總量統計、年度月度圖書業務統計、讀者分布統計、設備分布統計、設備使用率統計等相關功能模塊,館員可直觀便捷的獲取所需的業務統計數據,精簡館員工作量,也為讀者提供相應的參閱信息。
運維業務統計,包含終端數量統計、流通數據統計、終端狀態統計、終端故障匯總、硬件/軟件故障匯總、終端分布與運行狀態、智能書架借閱數據、分館數據及終端排行等業務統計,同步圖書館數據分析和運維等功能,充分利用圖書館各項數據進行統計分析,協助進行設備的維護管理。
根據讀者借還圖書數據、年齡、性別、學歷、時段等多維度了解讀者的群體,結合圖書查詢、借閱、頻率等業務行為,深度分析各維度讀者群體的閱讀偏好,推薦相應的熱門書籍;根據設備的使用與維護情況,統計分析各類型設備的使用率,便于設備更好的管理與使用;根據讀者、書籍、設備及地理位置信息,分析其中的關聯信息,將會為圖書館業務發展運用提供大數據支撐。
高質量的圖書館信息資源利用對圖書館管理和服務都有巨大的提升。圖書館建成統一的信息管理平臺,利用海量的數據存儲,圖書館工作人員可以分析、挖掘、運用用戶的行為,了解不同讀者的需求,比如閱讀特點、閱讀偏好、館藏結構、圖書借閱情況、閱讀規律、讀者層次等,建立數據模型,在館員采購時圖書、期刊、數據庫,開展讀者活動時,導入數據模型,分析權重和評價等讀者需求,采購讀者真正需求的各種資源和推廣讀者受歡迎的讀者活動等,從而有據可依,更加精準和高效,有利于提高館藏資源和讀者的滿意度,更加有效地為讀者提供服務。
隨著網絡化、數據化的快速發展,圖書館作為傳統的知識信息共享渠道,圖書館也必須快速適應數字化進展。當前,圖書館原有的借書還書、讀書看報、查詢檢索等基本功能,已經不能滿足讀者的需求,應該與網絡同行,與時俱進地為讀者提供更優質的服務,同時滿足不同讀者的個性化的需求,在全社會都進入網絡時代的情況下,圖書館滿足用戶的需求不能僅限于辦理圖書借還、查詢、閱讀等基本功能,應與時俱進為用戶提供更優質的服務和個性化信息。例如在傳統圖書館中,讀者只能在館內平臺和網站上查詢檢索,通過學習大數據的構建,讀者可以通過微信等新媒體平臺查詢相關信息。此外,新媒體平臺還可進行活動預約、圖書續借、信息推送、數據庫移動平臺的使用等。大數據平臺的建設,將讀者由傳統“被動式”向“主動式”轉變,由“機械化”向“智能化”轉變,逐漸達到“智能化”“個性化”的服務方式轉變。大數據平臺的應用,還提高讀者各項業務使用率,增強讀者的黏性,方便提升圖書館的服務效率,實現了良性循環。
大數據平臺的運用,為圖書館的各項業務指標的量化提供了數據支持,由傳統“紙質化”向現代“數字化”轉變,經過一段時間的積累,大量的數據能夠長期保存。同時,在數字化的過程中,應當注重數據結構的完整性,例如圖書館大量館藏的音頻、視頻等多媒體非結構化數據,這類數據庫建成后注重整理和過濾,保證圖書館數據資源的完好性和使用便捷性。
有了大數據的支持,統計分析就有了樣本,也對圖書館的館員提出更高的要求,館員要具備相應的專業水平,館內設備信息化硬件、軟件水平等都有較高的要求。通過大數據系統的建設,圖書館整體工作人員專業能力、服務水平、軟硬件設施條件等有了更大的提升。圖書館可在現有資源的基礎上,加強大數據建設和管理,注重用戶數據收集和業務分析,提高圖書館核心競爭力,使圖書館切實成為充滿活力、又具備前沿科技的信息資源分享場所,在大數據的時代下進一步提升競爭力和多元化服務水平。
隨著網絡化信息化深入發展,圖書館作為數據與信息的聚集地,大數據也將充分應用到圖書館各項工作中來,有力地推動了圖書館的管理和運行模式,例如館藏資源優化、讀者信息挖掘、服務效能提升、業務模式創新等方面具有重大意義。
大數據技術能使圖書館的館藏資源得到更充分的利用。圖書館除了不斷豐富館藏資源外,還需對各類信息進行專業化的收集整理,并加入運用。數據庫、期刊等購買預算較大,利用大數據結合云計算的分布式處理、分布式數據庫和云儲存、虛擬化技術,根據用戶數據分析使用頻率,可將這類特殊信息的存儲更新與成本控制進行最優化處理,增強圖書館的館藏資源建設能力。
大數據技術大大提高了圖書館的管理效能。各個圖書館不同程度地應用大數據技術,且這個應用趨勢越來越廣泛,越來越深入。在圖書信息的收集整合、館藏優化、紙電同步、開發應用等環節大有為可為,在服務讀者中,把讀者喜好、讀者層次、交流溝通等環節的應用能夠達到服務更加便捷和精準。大數據技術在圖書館的大量運用,達到了管理一體化,整合了圖書館資源的各個要素,大大提高了圖書館的管理效能,必將會對圖書館的發展產生深遠的影響。