
摘要:數據挖掘技術是圖書館用戶行為分析的重要方法和工具。圖書館流通數據是圖書館業務流程優化的重要依據之一。以蘇州工業園區獨墅湖圖書館青少年卡為例分析分析其借閱情況。
關鍵詞:數據挖掘;流通數據;圖書推薦
圖書館借閱信息是伴隨著圖書館門戶公開化而誕生的副產品,但其在館藏采購、館藏管理、讀者需求分析等方面具有不可忽視的作用。隨著圖書館資源和管理數字化進程加快,每日都會從圖書館管理系統中產生龐雜的表單信息,如何讓信息從無序到有序,便于從中了解讀者借閱興趣與傾向、館藏圖書的利用率,有必要對流通數據進行深度剖析。。并以此為客觀依據,向讀者提供積極、主動、個性化信息服務,這也與泛在圖書館所要求打破被動服務壁壘,提高以讀者驅動為導向的主動服務意識的宗旨相一致。
一、數據挖掘技術在圖書館管理中的具體應用
(一)用戶資源管理
用戶就是指日常中,經常利用圖書館來獲取自己所需的信息資源和信息服務的所有個人及集體。圖書館在長期的為用戶提供信息服務過程中,慢慢的積累了許多的用戶信息資源。我們運用數據挖掘的先進技術,對用戶信息資源進行仔細的分析和統計,就可以了解到用戶對圖書館信息資源的需求服務需求是什么,這樣我們就可以針對不同的個性化需求,制定出符合用戶需求的信息資源建設和服務措施,最終完成與用戶需求信息的收集。
(二)讀者信息服務
如何給讀者提供良好的信息服務,使讀者可以簡單快捷的查找、檢索到所需的信息資源。我們要利用好數據挖掘技術,把各種類的信息數據進行整合,在把紙質的圖書和各種操作平臺的電子版信息,以四種規則給我們的讀者提供完整統一的一個信息數據平臺,這樣就會使讀者提高了查找、檢索信息的命中率。
由于現在網絡信息技術非常廣泛,個人的很多信息都被收集和分析,因此我們要做好讀者個人信息的管理,解決好隱私保護和信息安全的合法性,確保每位讀者的個人信息安全。
(三)圖書采購管理
我們利用數據挖掘技術,把流通數據庫和采訪數據庫中的歷史記錄數據進行關聯性分析和序列分析,就能夠非常容易的計算出圖書文獻的頻繁借閱信息集合,然后我們在進行科學合理的分析各類文獻利用率,最后在把這科學準確的分析報告及對用戶需求的預測提供給圖書采購部門,這樣采購部門就可以根據所提供的用戶需求信息,進行科學的選擇按需采購。
(四)圖書借閱流量方面的周期分析
通過數據挖掘相關的技術,我們可以在數據庫當中將流通量本身的周期性尋找出來,并且對讀者的借閱高峰期以及借閱的低峰期進行有效地分析,與此同時,通過數據的有效地利用分析,對圖書的流通部門進行有效地、科學的安排,在圖書資源以及人力資源極為有限的情況下,針對讀者提供更多全面、優質的圖書服務,并且為所有的流通部門平日的工作提供具有科學性的參考以及分析。
(五)支持圖書館決策管理
管理的好壞是任何企業發展最重要的環節,在圖書館的管理上,科學的決策管理是體現圖書館整體管理水平的高低。利用數據挖掘技術提供信息,使圖書館的管理不用再像以往用經驗去做決策。
二、基于數據挖掘的圖書館讀者服務優化措施
通過對圖書館的資料倉庫中儲存的海量信息進行聚類分析、數據挖掘可以幫助圖書館優化讀者服務提供行之有效的技術支持,其應用范疇主要集中在以下幾個方面:
(一)個性化圖書推薦
圖書推薦是圖書館為讀者提供個性化服務的一個重要舉措利用數據挖掘技術獲取的信息,比如讀者的借閱歷史記錄、閱讀興趣或研究方向,可向其推薦相關專題或專業的最新資料;或者通過數據挖掘關聯規則方法的使用,為讀者檢索提供關聯借閱的信息,使讀者檢索含有A 關鍵字的書籍時,能夠得到諸如“借閱過該圖書的會員還借閱了”之類的信息,節省檢索的時間和精力此外,對于某些缺少借閱經歷或剛剛涉足專業學習的讀者來說,很大的一個困惑就是不知道要借閱什么書,圖書館可以圖書流通日志挖掘出各大類、分類書籍中借閱量最大的前幾名書籍,作為圖書推薦,或組織專家撰寫各專業學習的書單,動態更新相關專業的優秀文獻書目,以供讀者借閱參考
(二)指導制定書籍采購計劃
傳統的圖書采購計劃制訂主要采用專家法與經驗法,但這種計劃制訂容易受到主觀因素尤其是個人喜好的影響,花費大量資金購置的圖書也可能并不能很好地滿足讀者的閱讀需求那么,怎樣才能將有限的資金用到最緊缺的資源上去呢? 運用數據挖掘技術分析圖書館的借閱流通記錄、檢索請求,以及文獻拒借集和頻繁借閱集,就能夠很準確地獲得信息采集的目標,進而有針對性的補充文獻書籍并增加館藏復本
(三)優化書庫書架管理
圖書館文獻資料集中,藏書量往往有上百萬冊甚至更多,所藏資料囊括了各個專業領域,為讀者的學習提供服務由于藏書量大、種類繁多,科學、人性化的排架管理對于優化館藏建設十分重要,數據挖掘技術的應用可以為圖書管理員提供文獻借閱量的變化趨勢、購置時間的先后順序,進而預留架位,避免頻繁倒架,增加管理員工作量和讀者的檢索時間。
(四)讀者借閱信用管理
圖書資源作為公共財產,要保證有限的圖書資源為盡可能多的讀者服務,必須加強讀者的借閱信用管理可以對逾期還書信息進行聚類分析,將多次逾期歸還圖書、借閱信用較低的讀者納入一個單獨的群集,減少單次可借閱圖書數量,并設立按時提醒還書的服務,通過手機短信、E m ail等途徑提醒借閱者按時還書以方便其他讀者的借閱。
三、我館青少年卡借閱數量分析
以下數據均截取前10
園區中小學各學校借閱證使用情況(截止2014.11.11)
序號學校名稱持證人數借閱
總冊數人均借閱量占總借閱量比例備注
1蘇州工業園區蓮花學校22543049313.53 16.55%青少年卡發放正常,使用情況良好。
2蘇州工業園區第二實驗小學3201245567.67 13.33%
3蘇州工業園區車坊實驗小學21352166910.15 11.76%
4蘇州工業園區勝浦實驗小學2633155545.91 8.44%2013年下半年開始已經拒絕辦證。
5蘇州工業園區婁葑實驗小學2695131334.87 7.13%青少年卡發放正常,使用情況良好。
6蘇州工業園區斜塘學校1966126736.45 6.88%
7蘇州工業園區青劍湖學校2554117454.60 6.38%
8蘇州工業園區方洲小學1954111805.72 6.07%
9蘇州工業園區翰林小學739915312.39 4.97%
10蘇州工業園區第八中學86476468.85 4.15%
說明:
1.發放的青少年卡借閱證數量為42696張,截止2014年11月11日借閱量為184226冊,平均借閱量為4.31冊/證。有效發放讀者證(學校真正發放到學生手中的青少年卡)平均借閱量為5.33冊/證。
2.以上序號排序按照各學校借閱數量排列。蓮花學校、二實小、車坊實驗小學、勝浦實小、婁葑實小、斜塘學校、青劍湖學校、方洲小學借閱總量相對比較高。
3.蓮花學校、翰林小學、車坊實小人均借閱量相對比較高,人均借閱量均達10冊以上。
4.由此說明,青少年卡的使用率與以下2個因素相關:①、與總分館的距離越近,利用率越高;②、小學生因課業負擔相對比較低,證件利用率也相對比較高。
青少年卡在總館與各分館的借閱情況(截止2014.11.11)
序號館藏地冊數總分館借閱量所占比例
1A108青少年閱覽室6079848.43%
2B301文藝閱覽室13062
3B101社科閱覽室14134
4B303科技閱覽室652
5B403工具書閱覽室18
6流動服務車456
7其他108
8方洲鄰里中心分館2316012.57%
9松澤社區分館2068911.23%
10浪花苑社區分館121426.59%
說明:
1.各學校在總館的借閱量都相對比較集中。
總館主要借閱量集中在青少年閱覽室、文藝閱覽室圖書。
青少年借閱文藝閱覽室言情類小說比較多,需引導;科技閱覽室圖書相對比較不適合青少年閱讀,故借閱量比較少。
2.各分館的借閱量主要受周邊學校青少年卡發放情況影響;其次是學校的重視程度。
總館借閱量為89228冊,分館借閱量合計為94998冊。
【參考文獻】
[1]]周志超,張遠,侯勝超.高校圖書館流通數據挖掘的新思路[J].現代情報,2013(10):33-10
[2]王云青.數據挖掘技術在圖書管理中的應用研究[J].邢臺學院學報,2013(12):28-4
[3]張永恒.數據挖掘技術在省圖書館中的應用探索[D].2009
[4]施曉華.數據挖掘技術在圖書館學科數據館藏分析中的應用[J].情報雜志,2011(1):164-168.
[5]李文闊,李水先《數據挖掘在毅字圖書館中的應用研究綜述》[J],新世紀圖書館,2012,(2):30-33
[6]黃輝《談數據挖掘技術在圖書館工作中的應用》[J].西北工業大學學報(社會科學版),2007(03):91-93
[7]張煒,洪霞.基于OPAC讀者行為的知識發現研究[J].圖書館論壇,2011(01):17-19
[8]柯青.以用戶為中心的研究范式—理論起源[J].情報資料工作,2008(04):51-55
[9]宋麗花.數據挖掘技術在讀者服務優化中的應用[J].現代商貿工業,2013(23)