張宏偉,史惠媛
黑龍江中醫藥大學,黑龍江 哈爾濱 150040
?
數據挖掘在高校圖書館文獻采購決策中的應用——以黑龍江中醫藥大學圖書館為例
張宏偉,史惠媛
黑龍江中醫藥大學,黑龍江 哈爾濱 150040
摘要:在高校圖書館文獻采購過程中,應用數據挖掘技術對讀者利用圖書館歷史數據進行分析,可以預測出圖書采購經費分配比例,按照讀者閱讀需求采購熱點圖書,補充缺漏圖書及復本量不足圖書,進而為文獻采購工作提供科學、合理的決策依據。
關鍵詞:高校圖書館;文獻采購;數據挖掘
【引文格式】張宏偉,史惠媛.數據挖掘在高校圖書館文獻采購決策中的應用——以黑龍江中醫藥大學圖書館為例[J].中國中醫藥圖書情報雜志,2016,40(2):22-24.DOI:10.3969/j.issn.2095-5707.2016.02.006
程煥文先生認為資源是圖書館絕對的至高無上的王[1]。文獻采購是高校圖書館文獻資源建設的第一站,是決定文獻資源建設質量的最重要的關鍵環節。隨著圖書價格持續上漲,高校圖書館文獻購置費相對有限,在圖書采購過程中如何保證館藏結構科學性的同時,提高紙質文獻資源利用率,是圖書館亟待解決的問題。
數據挖掘(date mining)是從大量的、隨機的數據中,提取隱含在其中的、潛在有用的信息和知識的過程。圖書館自動化管理系統每天會產生大量流通、檢索、查詢等數據,對這些數據進行挖掘,可以獲知讀者個性化需求、文獻利用率等信息。利用這些信息對已有館藏進行評估,可以為文獻采購工作提供科學、合理的決策依據。
目前,高校圖書館紙質文獻傳統采購決策過程中,決策主觀性較強,客觀依據不足[2]。文獻采購多以現場采購和書目采購為主,采購人員少,對各專業、學科所需文獻資源把握不到位、訂購精確度不高。一方面受采購人員的知識結構、專業背景、業務素質及工作經驗等因素的限制,圖書館文獻采購決策長期以來停留在憑經驗和靠感覺的水平上,文獻采購時主觀判斷成分過多。另一方面讀者參與文獻采購的熱情不高,使得文獻采購的采全率和采準率不高,導致學校投入的有限購書經費所購文獻資源利用率不高,讀者文獻需求得不到滿足和保障[3]。
為了使文獻采購工作更客觀、科學、合理,有必要應用數據挖掘技術對讀者借閱流通、檢索查詢、預約借書、博碩學位論文引文等歷史數據進行定性和定量分析,獲知讀者個性化閱讀需求,為圖書館文獻采購決策提供數據參考,進而提高文獻資源采選質量和館藏資源利用率。
2.1 依據借閱流通數據指導采購資金分配
利用金盤圖書管理系統集成統計模塊對每年各大類圖書借閱流通情況進行統計,得到讀者借閱量趨勢變化情況,進而預測讀者需求量,指導下一年采購經費在各大類文獻中的投入增減情況[4]。遵循文獻利用率最大效應原則,對于零借閱的圖書應減少或停止采購,保證各大類圖書的借閱流通數量和采購經費所占比重相一致,有針對性地補充館藏文獻資源,從而達到資源優化配置。
黑龍江中醫藥大學圖書館2013、2014、2015年圖書采購經費分別為166.1萬、155.9萬、143.2萬元人民幣,借閱量分別為71 112、87 278、80 538冊。表1中列出這3年各類借出圖書所占采購經費及借閱量的百分比,據此可以指導2016年制定文獻資源采購計劃,合理分配各類圖書采購經費,使采購決策更加科學合理,最大限度地提升館藏資源利用率。

表1 2013-2015年黑龍江中醫藥大學圖書館圖書采購經費分配與圖書借閱量統計(%)
2.2 依據檢索查詢數據獲知讀者亟需文獻
利用數據挖掘的關聯規則對讀者每個月圖書檢索查詢數據進行自動捕捉、采集和整理,過濾冗余信息。將讀者關注度較高的檢索詞按使用次數降序排列(見圖1)。對照2014年熱門圖書檢索詞排行榜,取檢索次數≥50次的圖書作為熱點圖書,這些是讀者迫切亟需的文獻資源,圖書館應對照館藏規劃,優先采購人氣熱點圖書。
2.3 依據圖書預約借書數據補充館藏復本量
預約借書是指讀者預約登記某種借出狀態的圖書,該圖書歸還后,預約讀者優先得到此書的借閱權,館藏復本量不足是讀者預約借書的原因。圖書預約信息真實反映了讀者對某類圖書的實際需求。首先,采購人員基于金盤管理系統,對預約數據進行統計。其次,根據讀者預約次數,形成預約熱點圖書的書目表。最后,通過與館藏書目數據比較,制定符合讀者需求的采購計劃,確定復本采購數量。及時補充館藏復本量不足的圖書,提升圖書館的服務質量和服務效果,使高校圖書館文獻資源保障能力得到加強。

圖1 黑龍江中醫藥大學圖書館熱門檢索詞排行榜
2.4 依據博碩士論文引文量補充缺漏圖書
博碩士學位論文的引文真實地反映出作者在撰寫過程中對專業文獻的需求特點和規律,其引文具有數量大、范圍廣和學術質量高的特點。博碩士學位論文是對以前成果的借鑒、利用和創新,參考文獻具有精選性,對文獻的學術價值具有評測功能。因此,對博碩士學位論文引文進行數據挖掘,可以發現博碩士所在學科信息需求的一般規律和特點,有利于指導圖書館文獻信息資源的館藏建設。基于博碩士學位論文在線提交系統,對博碩論文引文量進行統計分析,對照館藏將文獻引用頻次≥3的缺漏圖書,列為預采購圖書。并根據文獻購置經費的許可程度,最終有重點、有層次對缺漏圖書進行補充。
2.5 依據科技查新參考文獻獲知教學科研文獻需求
科技查新,是為避免科研課題重復立項和客觀正確地判別科研成果的創新性而設立的一項工作。通過科技查新工作,能為科研立項,科技成果的鑒定、評估、驗收、獎勵,專利申請等提供客觀依據,為科研人員提供快捷、可靠、豐富的文獻支持。
黑龍江中醫藥大學圖書館檢索中心(中國中醫藥文獻檢索中心黑龍江分中心),是國家中醫管理局于1995年批準成立的,為首批國家級定點查新分中心,也是我省中醫藥領域唯一的國家級查新單位。由于科研人員研究方向多,文獻需求廣,因此不易從個體角度來分析其文獻需求,但可以從群體角度來研究高校教研室、重點實驗室所需文獻需求。基于我館科技查新系統,對科研人員申報的科技查新參考文獻進行數據挖掘,可以對我校重點實驗室所關注的研究領域、研究熱點和發展方向進行分類和預測。通過專家咨詢、建立模型與數據可視化等動態結合方式,生成重點實驗室所需科研文獻采購報告,為滿足該重點實驗室文獻需求提供客觀準確的采購依據。
2015年,我館采購原則是“保證中醫藥學科,兼顧醫學相關門類,關注學校新增專業,滿足醫、理、文、工、管多學科發展需求”。通過對上述5類數據綜合分析,形成科學、合理的客觀采購依據,輔助管理層作出及時有效的決策,進而制定2016年的圖書采購原則,即“中醫類求精、西醫類求新、關注新增專業、滿足醫、理、文、工、管多學科發展要求”。
3 小結
應用數據挖掘技術從海量的借閱流通數據中預測采購經費比例,對照年度采購原則和計劃,將讀者亟需的圖書進行分類,按需求頻度進行排序,頻度相同、資金有限或數量已達上限的情況下,以優先滿足教學和科研圖書為采購原則。需要指出的是,采購決策應以實際數據為參考,同時也要避免唯數據論,對時效性強、借閱量大的教材、輔導類等圖書要控制其采購的種數和復本量,可通過購買電子書形式予以解決。在經費有限的情況下使投入產出收益達到最大化,真正做到“每位讀者有其書”和“每本書有其讀者”。
參考文獻
[1]程煥文.圖書館的價值與使命[J].圖書館雜志,2013(3):4-8.
[2]王春生.我國圖書館實施讀者主導式采購的策略[J].圖書情報工作,2013,57(5):71-75.
[3]杜友桃,伍曉光,宋宇.圖書館文獻采訪中讀者薦購工作探討[J].中國中醫藥圖書情報雜志,2014,38(2):51-54.
[4]袁芳.大數據環境下圖書館文獻資源建設模式的變革[J].圖書情報工作,2015,59(18):91-94.
(修回日期:2016-01-23;編輯:魏民)
Applicatin of Data Mining in the Literature Purchasing Decisions of Libraries of the Colleges and Universities - Taking Library of Heilongjiang University of Chinese Medicine as an Example
ZHANG Hong-wei,SHI Hui-yuan
(Heilongjiang University of Chinese Medicine,Harbin Heilongjiang 150040,China)
Abstract:In the literature purchasing process of libraries of the colleges and universities,applying data mining technology in the analysis of library historical data can predict the allocation proportion of book purchasing budget,purchase hotspot books according to readers’ reading demands,and supplement missing books and books with insufficient duplications,with a purpose to provide scientific and reasonable decision basis for literature purchasing.
Key words:libraries of the colleges and universities; literature purchasing; data mining
收稿日期:(2016-01-11)
基金項目:2015年度黑龍江省藝術科學規劃課題省級共建項目(2015D002)
中圖分類號:G253.1
文獻標識碼:A
文章編號:2095-5707(2016)02-0022-03
第一作者:張宏偉,館員,研究方向為數據挖掘、數據倉儲、數字圖書館建設。E-mail:dbt5@163.com