胡杰
摘??要:多個維度分析與挖掘高校圖書館讀者的圖書借閱行為規律,以便更好地提供個性化服務與精準的閱讀推廣,為圖書館的智慧化運營與采購決策提供新的思路。該文在分析了相關研究現狀的基礎上,對大數據時代如何科技賦能高校圖書館的智慧化建設進行了一定思考。以寧波工程學院為例,通過PL/SQL?Developer平臺采用SQL對該校圖書館圖書近5年的圖書借閱數據進行預處理、數據挖掘、結果分析等流程,對處理后的數據進行統計與分析得出讀者借閱書籍與不同因素之間的多角度關系。并利用這些數據,為圖書館智慧化服務與精準推薦提供數據依據,對圖書館提高讀者服務能力、圖書閱讀推廣及圖書資源采購等方面具有借鑒意義。
關鍵詞:借閱數據??圖書館??高校??數據分析
中圖分類號:G25??????文獻標識碼:A???????????文章編號:1672-3791(2022)06(b)-0000-00
隨著數字化改革在各行各業不斷的深入,大數據正在以不同的形式和方式影響著人們的生活與工作。信息化時代的今天,在各個領域中都會產生海量的數據,而數據挖掘可從海量的生產數據中挖掘出反映用戶的屬性以及信息行為等有效的信息。在這種大環境下,高校圖書館每日產生大量的讀者圖書借閱數據,其中包含了大量十分有價值的信息,而如何通過海量的借閱行為的數據去觀察預測讀者的借閱習慣與喜好,從而進一步完善智慧圖書館的建設,不斷提升借閱服務水平值得思考。
1??研究背景
在大數據蓬勃發展的時代背景下,各個行業都不可避免地受到其影響,大數據技術正以自身的巨大魅力推動著社會上方方面面的深刻變革。高校圖書館的建設過程中,依托數字信息技術等新型科技力量賦能高校圖書館的服務升級,打造智慧化圖書館服務新生態,已逐漸成為了現代高校圖書館的發展方向。
現階段,數據的分析和挖掘在圖書館領域中的研究較多,已有許多該領域的學者發表了大量的相關研究文章。但大多成果還處于理論研究狀態,投入圖書館實際工作應用中的還比較少。如張連分從智慧化系統角度研究,認為采用基于大數據的圖書館服務,包括建立以大數據為基礎的圖書推薦系統,使用數據分析技術來提高圖書館的個性化服務水平[1],劉海鷗等人則從預測讀者喜好角度思考,提出基于大數據并行處理技術對融合后的海量數據進行深入挖掘,引入情境推薦算法來預測用戶的情境興趣偏好,以此實現精準的個性化推薦服務[2]。楊莉等人則是對圖書館入館數據進行深度挖掘,通過分析圖書館入館行為數據,采用ARIMA算法預測年入館人流量趨勢,對于圖書館管理規劃與資源調配有一定的借鑒意義[3]。李榮等人利用匯文文獻信息系統抓取了用戶借閱數據,利用數據庫技術探索用戶群體的借閱行為變化趨勢[4]。而徐震等人通過研究圖書館的借閱量進行估計模型的設計,用相關模型預測借閱量[5]。通過已有的相關研究文獻可以看出,數據挖掘在提升圖書館的精準服務和轉型升級方面有著巨大的作用,但在研究讀者借閱數據時較少地通過多維度進行分析。
該文基于寧波工程學院圖書館的金盤系統近5年的用戶圖書借閱數據,采用PL/SQL?Developer平臺對海量且雜亂的借閱數據進行SQL語句編程分析,在多個維度分析了圖書館圖書借閱的情況,為優化高校圖書館業務管理、提升讀者服務質量提供了有效的數據支撐,實驗研究結果將應用于該校圖書館的讀者服務工作和決策制定方面。
2??相關數據分析
2.1??研究對象
該文以寧波工程學院圖書館近5年的讀者圖書借閱數據作為研究對象。從該校圖書館的金盤系統中導出相關數據,利用數據庫技術SQL語句對相關數據進行去重、清理、挖掘,通過多個不同的維度分析研究該校的圖書借閱情況。
2.2??研究方法
在PL/SQL?Developer平臺上采用SQL語句對于高校圖書館的圖書借閱數據進行處理。主要分析處理了數據庫中的流通日志表、館藏書目庫表、讀者庫表等多張數據表。流通日志中包含了借閱書籍、借閱時間、借閱者信息等內容。通過流通日志表關聯館藏書目庫可以關聯出借閱書籍的詳細信息,包括書目名稱、索引號、圖書種類等信息;之后再對讀者庫表進行關聯,關聯出借閱者的具體信息,主要是學號、姓名、性別、所在學院、所學專業等信息。通過關聯后的數據表進行去重、挖掘與分析。
該文基于統計學方法分為4個維度,分別為人群所屬部門、基于中圖法的圖書類別、基于讀者性別、基于月份借閱分布等進行可視化分析與研究。
2.3??數據可視化分析
通過金盤系統采集了2016年12月至2021年12月時間段的5年圖書借閱數據,共計241288條借閱數據。基于借閱者人群所屬部門的維度進行分析,如表1所示,針對不同學院和專業的人群圖書借閱情況。由于金盤系統并沒有學生專業信息,只能選擇以借閱者所屬學院為單位進行分析。在總借閱數量上,建工學院最多,為40?837冊,而讀者人數最多的經管學院借閱圖書總數為37?764冊,人文學院在總人數將近為經管學院人數一半的情況下,其借閱總數有38?023冊。在人均借閱方面,機械學院為4.66、國交學院為3.89、機器人學院為6.07,這3個學院人均借閱圖書的數量較少;而人文學院為24.17、建工學院為18.15、外語學院為14.68,人均借閱圖書數據較多。這里需要說明一些特殊的情況:機器人學院近年才剛剛成立,缺少歷史借閱數據。國交學院就讀學生的專業為中外合作專業,在校時間較短;機械學院不在本部校區,借閱圖書相對不便,導致3個學院借閱較少。其他學院無特殊情況,但是其借閱圖書的人均借閱量方面還是有一定的差別的。可以看出,不同學院的人均圖書借閱量是有較大差別的。
從圖書館的圖書類別角度分析。目前高校圖書館的圖書分類多是根據《中國圖書館分類法》進行圖書分類,該法將圖書館的所有圖書分為22個基本大類。從中圖分類法的角度分析,對該校圖書借閱數據進行進一步的挖掘。如圖1所示:最主要的借閱種類是I文學為69?909冊和T工業技術為62?793冊。而I文學、T工業技術、H語言與文字、O數理科學和化學、F經濟這5個類別的書籍借閱數大約占據總借閱圖書數據的九成。與以往的認知存在一定誤差:該校在學校定位方面雖然是以工科為主的多科性協調發展的高校,工科專業的學生占了總人數中的絕大多數,但是圖書館的圖書借閱方面,在I文學以及H語言與文字、F經濟等文學類經濟學類的書籍借閱數量占比較高,3種類別的圖書借閱總數加起來多達114?630冊,其數據超過了該校圖書館總借閱圖書數量的47.5%。這項數據說明該校學生借閱書籍的種類,并不一定是學生專業相關的書籍,決定讀者借閱什么類型的圖書,除了學生所學的專業影響借閱圖書種類外,興趣愛好是很大的一個因素。需要注意的是,工科學生讀者對于文學類書籍的閱讀需求也比較大。
從圖書借閱者的性別角度進行分析,該校的圖書總借閱人數為241?359人。其中有借閱行為的男性讀者總數量為113?725人,女性讀者總數量為127?634人。不同類別圖書的借閱情況如圖2所示。進一步通過查詢該校相關數據可知,該校學生的男女比例大致為7∶3,而借閱人數男女比例接近1∶1,這強烈說明了該校男同學借閱書籍的熱情度遠遠低于女同學。針對I、H、F類圖書的借閱情況,可以看出:在I、H、F類圖書中,女生的借閱占比為66.72%,男生的借閱占比是33.28%。說明這3類書在女性讀者中借閱較多。女性讀者更為喜愛閱讀C、F、G、H、I、J等類別的書籍,其借閱量均超過了男性讀者,而男性讀者則傾向于借閱E、N、O、P、T、U、V、X、Y等類別的書籍,尤其是T類書籍,男生的借閱人數遠遠超過女生。結合該校的性別比例可以發現,男性學生借閱圖書的熱情還有進一步激發出來的空間。可以得出結論,不同的性別對于借閱書籍的行為以及不同類別的書籍的借閱占比,或者說喜愛程度有一定的關聯性。
從借閱圖書的時間軸線上分析,由于高校學生的學習階段存在階段性,一年可分為春季學期和秋季學期兩個學期。可從不同月份圖書的借閱情況進行深入分析。在寒暑假期間即2月份、7~8月圖書借閱情況出現十分明顯的下降,尤其是在暑假期間,圖書館借閱圖書數量趨近于0。開學初的3月份以及9~10月份,學生借閱書籍的需求表現得十分旺盛,借閱熱情高漲,特別是在9~10月份達到了一年借閱書籍的最高峰,月均借閱量將近4萬冊。9~10月考慮到有新生入學的因素,這部分人群對于高校圖書館具有一定的好奇心與借閱圖書的需求。之后讀者的借閱書籍數量便出現了緩慢下降的趨勢。而秋季整個學期的圖書借閱量又整體多于春季學期的圖書借閱量,春季學期的圖書借閱量大約是秋季學期的圖書借閱量的80%。由此可以看出圖書館的圖書借閱情況和時間月份有一定的關聯關系。
3??數據價值與應用
3.1??對圖書館閱讀推廣工作的啟示
從圖書的閱讀推廣角度上看,需要著重分析圖書借閱量不高的地方。針對借閱量不高的學院,如機械學院,需要加強圖書館自身服務的建設。
(1)解決不同校區間學生借閱圖書館圖書不便的問題。包括如何使非本部的這部分學生能夠同本部學生圖書資源共享,實現不同校區學生借閱書籍的通借通還,使所有讀者都能夠更加便捷地借還圖書。
(2)提高對圖書館空間的建設的要求,讀者的閱讀環境構建是對于讀者閱讀的需求有潤物細無聲的激勵作用。以環境為依托,給讀者提供一個溫馨舒適的閱讀環境,提高圖書借閱量的一個基本條件就是提高進館人數,只有讓讀者進入圖書館,才有機會瀏覽書籍、借閱書籍。通過圖書館的空間建設,達到一定的視覺沖擊與溫馨感,由此來吸引更多的讀者走進圖書館、愛上圖書館,才能進一步促進圖書的閱讀推廣。
(3)從閱讀推廣的推廣活動角度上分析,要結合讀者的興趣進行閱讀推廣。對借閱量較大的圖書類別進行有效推廣從而激發讀者參與興趣,特別是考慮到現階段該校男性讀者的借閱熱情不高,借閱圖書數量不多等情況,可策劃適量地吸引男性讀者的內容,包括體育、計算機、國際時事等主題的閱讀活動,吸引男性讀者參與其中,提高男性讀者的黏性。
3.2??對圖書館圖書采購工作的思考
對于圖書館圖書采購的決策的思考,在高校圖書館進行圖書采購過程中,通常是根據圖書館圖書采購經費的情況進行有選擇的挑選。當前部分高校的文獻采購工作是根據學校發展規劃、學科布局、館藏比例以及經費實際情況等因素綜合考慮后進行圖書采選工作。在經費一定的情況下,考慮學校的發展定位為工科為主時則優先采購工科類書籍、學校的優勢專業有哪些則優先采選相關專業的書籍。什么類別的書需要增加采購,什么類別的書需要適當減少采購,還應考慮讀者的借閱情況,即圖書館圖書的供求關系,需要采購者盡量保持不同類別圖書的供求平衡。對于借閱量較大而采購量不多的圖書種類應加強采購;反之,對于采購量較大而借閱數據較少的圖書,則需要適當減少采購量。可以對比歷史數據中不同類別書籍的采購比例與讀者的借閱比例,促使采購比例與借閱比例保持相對的一致性,既能動態地保持圖書的供求平衡,也能在某種意義上提高文獻資源的利用率,實現高校圖書館和大學生閱讀需求建設的良性互動,進而提升高校圖書館的服務水平。
3.3??對圖書館讀者服務工作的啟迪
通過分析不同時間段讀者的圖書借閱情況,對圖書館讀者服務方面有一定的工作啟示。可以看出不同時間段的讀者圖書借閱量存在較大的差別,在每學期開學初的1個月左右的時間是圖書館全館圖書借閱量最大的時間段。因而圖書館管理員需要在開學初加大服務力度,做好充分的準備為廣大學生提供信息咨詢、答疑解惑服務。同時巨大的借閱人流量也是圖書館進行必要服務宣傳的最佳時期,圖書館需充分利用館內人流高峰期積極進行讀者服務與入館培訓工作。積極引導讀者熟悉圖書館空間功能,包括創客中心、研修包間、電影院、自修室等空間使用,進一步觸發圖書館空間使用的活躍度。抓緊這一黃金時間段提高讀者的用戶黏性,用自身優質的讀者服務促進圖書借閱數量的提升。這對圖書館的工作人員提出了更高的要求,作為圖書館的直接服務人員,在自身素質與業務能力方面亦要有所提升,要改善傳統的服務方式與工作流程,充分融入大數據的工作平臺中[6]。
4??結語
隨著以信息技術為核心的大數據時代的到來,數據庫技術在高校智慧圖書館的建設過程中具有極高的應用價值。該文以寧波工程學院圖書館5年時間的圖書借閱數據為研究對象,多個維度地分析了該校圖書館的圖書借閱情況。在分析結果的基礎上,進一步思考圖書館圖書借閱數據對于圖書館的閱讀推廣、文獻采購、讀者服務等工作方面的啟示,針對性地提出了具體的想法與服務思路。對圖書館的讀者服務工作、資源優化方面以及數字化轉型方面有一定的積極影響。
參考文獻
[1] 張連分.數據驅動的是圖書館服務創新研究[J].圖書館工作與研究,????2021(1):104-108,123.
[2] 劉海鷗,姚蘇梅,黃文娜,等.基于用戶畫像的圖書館大數據知識服務情境化推薦[J].圖書館學研究,2018(24):57-63,32.
[3] 楊莉,袁少博,曾本沖,等.圖書館入館行為數據分析及可視化[J].電子測量技術,2020,43(14):22-28.
[4] 李榮,廖映紅,李雙.東北財經大學圖書館用戶借閱記錄數據集[J].圖書館雜志,2021(6):1-6.
[5] 徐震,李楊,馮玉平.基于大數據的圖書館借閱量估計模型設計[J].技術與市場,2022,29(2):85-87.
[6] 龍穎,孟德光.大數據思維下高校圖書館精準服務策略探討[J].內蒙古科技與經濟,2021(22):124-125.