劉中凱
【摘 要】圖書館的圖書自動化管理系統存儲了大量的讀者、館藏、流通的數據,對這些數據進行統計、分析、挖掘等操作,不僅能夠得到圖書館各方面的的宏觀信息,更能得到一些揭示讀者行為習慣的隱含信息。這為改進圖書館工作的不足、為圖書推送、采購、流通、參考咨詢等環節提供決策參考、為讀者提供個性化服務起到非常大的作用。
【關鍵詞】圖書館;大數據;個性化服務;數據挖掘
一、高校圖書館與大數據
根據百度上的最新定義,大數據是指需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。圖書館大數據從來源上可以分為很多類,其中和圖書流通相關的大數據包括讀者數據、館藏數據、借閱數據等。運用工具對這些數據進行分析、挖掘生成我們需要的信息,從而為圖書館管理提供幫助,為決策者提供數據支持是圖書館人的一項重要工作內容。
二、我館的大數據的統計分析過程
1.方法步驟
1)通過鏈接圖書館自動化管理系統(ILAS3)服務器后臺,導出需要的數據庫表。
2)使用數據庫軟件、程序、工具對這些表進行分析、處理等操作,得到我們需要的統計數據。
3)使用數據挖掘工具對數據庫表和統計數據進行數據挖掘,得到隱含在數據中的信息。
4)對得到的數據進行分析。
2.ILAS3中的主要原始數據
1)讀者數據表
讀者數據表記載著所有的讀者的信息,含有3萬多條數據,包括讀者記錄號、姓名、讀者證號、性別、讀者類型、單位、注冊時間、注銷時間等信息。
2)圖書入庫數據表
圖書入庫數據表記載著圖書入庫環節等相關信息,含有70多萬條數據,包括圖書的記錄號、條碼號、入庫時間、最后一次借閱時間、價格等信息。
3)圖書信息數據表
圖書信息數據表記錄著館藏圖書的相關信息,含有30多萬條數據,包括圖書的記錄號、條碼號、書名、價格、ISBN、分類號、尺寸等信息。
4)流通日志數據表
流通日志數據表記載著圖書在流通環節的信息,含有400多萬條數據,包括借閱日期、借閱圖書記錄號、借閱圖書條碼號、讀者記錄號等信息。
三、數據分析及對策
根據數據庫表中原始數據,可以得出大量統計數據,限于篇幅,在這里只能抽取出一些基礎的、比較有針對性的加以說明。
1.館藏圖書數量
1)從2008年的50471冊到2016年的712997冊,館藏圖書增速明顯,近五年的平均增速為6.26%,年均增加藏書4萬冊以上。
2)《海南省高等學校圖書館“十二五”發展規劃》中關于發展目標和任務中規定:到2015年,高職高專院校生均紙質藏書(建設性指標)60~80冊、生均新書(指標)2~3冊。從上看,我校圖書館已經達到或超過該項要求。
2.圖書正復本數量
1)我館圖書正復本量維持在2.5~3.0之間,并且還有逐年下降的趨勢,這符合我館目前“在有限財力情況下盡可能用較低正復本量換取更多類圖書”的總體要求。
2)從正復本量排名前4為的O(數理科學、化學)、T(工業)、H(語言、文字)、G(文教、科學、體育)大類中都有小類(O1數學、TP自動化計算機、H1漢語、G8體育)和我校某個系部的專業對應,正復本量相對較多一點。
3)從整體上看,除Z類(綜合性圖書)外,所有的類的正復本量相差并不顯著。
3.每個大類藏書比例變化
1)高校圖書館的藏書結構完全取決于師生讀者的專業學習研究領域及愛好等,同時兼顧類別齊全等因素,所以,各館的藏書結構并沒有統一的指導意見,從以下的分析中我們可以看出,我館的藏書結構是考慮了以上兩種因素的結果,比較合理。
2)2009年以后我館藏書的分布結構趨于穩定,不再有顯著變化。整體上看,比例較高的I類(文學)、K類(歷史地理)以非專業書籍為主,比例有所下降;H類(語言文字)普通話、中文、英文等對口書籍,比例有所提高;T類(工業)圖書時效性比較強、更新率比較快,比例有所提高。
3)除此之外,比例較高的F類(經濟)包括有旅游類書籍、B類(哲學)包括有心理類類書籍、O類(數理化學)含有數學類書籍,都有相對應的對口專業。
4)根據我校系部各專業分布、學生人數等具體情況,通過一定的算法,確定各類圖書配置比例,進而建設我館自己的圖書配置模型是下一步的工作內容之一。
4.歷年借閱量、流通率統計
1)借閱量的高峰出現在2008、2009、2010這三年,這三年的新書上架量比較高,以后幾年借閱量逐年下降,并且下降很快。分析原因,主要是我校新館剛剛建成投入使用,目前部分新書還沒有來得及上架,學生幾乎看不到近兩年采購的新書,非常遺憾。
2)紙質圖書借閱量逐年下降還有一個重要的客觀因素:轉向電子圖書,這是一個一定時期內不可逆轉的全球性趨勢。
3)圖書流通率是是檢驗圖書館工作水平、衡量圖書館工作效率的主要指標之一。提高圖書流通率,是館員核心的工作內容之一。圖書流通率近幾年下降比較快,除去客觀因素外,圖書館員的當務之急,就是通過數據分析和挖掘,找出不同讀者群體的閱讀需求,有針對性的進行推送、咨詢等服務。
5.按照學年統計借書量
1)借閱量根據學年的不同呈現出很明顯的規律性。第一學年是學生借閱量最大的一年,也非常容易理解,這一年是大學的第一年,對大部分同學來說,有時間和精力多看些書。隨著課業的增多以及實習等因素,第二學年、第三學年及以上(五年制等)借閱量隨之大幅減少。
2)第一學年學生借閱量前三名是I類(文學)、K類(歷史、地理)、G類(文教、科學、體育),廣泛涉獵的心態比較明顯。
3)第二學年學生借閱規律也非常明顯。I類(文學)、K類(歷史、地理)雖說仍舊是前兩名,但所占借閱比例減少。G類(文教、科學、體育)、B類(哲學)、D類(政治、法律)、F類(經濟)、J類(藝術)、T類(工業)類因和某些專業相關,借閱比例明顯提高。
4)第三學年及以上學生借閱規律性:I類(文學)、K類(歷史、地理)但所占借閱比例進一步減少。專業關聯性較高的G類(文教、科學、體育)、B類(哲學)、F類(經濟)、H類(語言、文字)、J類(藝術),借閱比例維持不變或進一步提高。
5)根據以上規律,圖書館在制定圖書資源推廣的時候,應著重考慮不同年級讀者的需求。
四、結論
本文抽取了圖書借閱大數據中的幾個片面的點進行統計、分析,并針對其中反映出工作不足的地方提出相應的解決辦法。從總體上看,這些信息和措施為我館建設適合自身需要的業務模型提供了重要依據,使各項管理更加規范化、專業化。不足的地方是分析和統計的是片面的點,是容易獲得的數據信息,不夠全面和深入,尤其是對反映讀者閱讀習慣、喜好等的挖掘還很不夠,而這對未來圖書館服務創新、服務個性化等都有重要作用。在時代高速發展的今天,圖書館應該順應大數據時代的潮流,更好地運用大數據分析實現觀念的轉變、服務的提升,讓圖書館煥發新的活力。
【參考文獻】
[1]楊亮、雷智雁. 閱讀2.0: 大數據環境下圖書館個性化服務研究[J]. 現代情報. 2014年第4期:74-77
[2]楊海燕. 大數據時代的圖書館服務淺析[J]. 圖書與情報. 2012年第4期:120-122
[3]高珊. 大數據時代的圖書館用戶服務創新[J]. 上海高校圖書情報工作研究. 2014年第4期:45-49
[2]韓翠峰. 大數據時代圖書館的服務創新與發展[J]. 圖書館. 2013年第1期:121-122