李小璽 李學(xué)
摘? ?要:順應(yīng)時(shí)代的發(fā)展,遵循高校改革方案,促進(jìn)高職院校圖書館的發(fā)展建設(shè)工作迫在眉睫。通過(guò)對(duì)數(shù)據(jù)的收集、整理和分析發(fā)現(xiàn),圖書使用率低、圖書資源浪費(fèi)是高職院校普遍存在的問(wèn)題。將數(shù)據(jù)挖掘技術(shù)和圖書館管理有效結(jié)合,從數(shù)據(jù)收集、整理、分析、處理、挖掘、實(shí)施等方面來(lái)解決這一難題。
關(guān)鍵詞:高職院校;圖書館;數(shù)據(jù)挖掘
相比于高等院校的智慧圖書館、移動(dòng)圖書館,高職院校圖書館的發(fā)展受到較大阻力。辦學(xué)性質(zhì)在某種程度上制約了圖書館的發(fā)展,在資金、設(shè)備、技術(shù)等方面尤為明顯。本次研究,無(wú)論設(shè)備支持還是技術(shù)支持幾乎都是零成本。基本上解決了圖書使用率低、圖書資源嚴(yán)重浪費(fèi)的問(wèn)題,使得圖書館這一典型的服務(wù)性場(chǎng)所能為廣大師生提供更優(yōu)質(zhì)的服務(wù)。
1? ? 高職院校圖書館現(xiàn)狀分析
通過(guò)對(duì)同類院校的走訪和調(diào)查以及網(wǎng)上開展的問(wèn)卷結(jié)果的分析,發(fā)現(xiàn)高職院校圖書館中普遍存在如下問(wèn)題:(1)圖書使用率低,圖書資源嚴(yán)重浪費(fèi)。一些冷門圖書甚至無(wú)人借閱。(2)圖書館藏書目標(biāo)不明確,經(jīng)常出現(xiàn)購(gòu)置新書無(wú)人借閱的情況。缺少對(duì)讀者的借閱需求分析,從而造成資金浪費(fèi)。(3)館藏分布不合理。很難找到甚至找不到讀者需要的圖書,導(dǎo)致地理分布邊緣化的圖書長(zhǎng)期無(wú)人借閱。(4)圖書管理人員的工作模式欠佳,嚴(yán)重影響工作效率。
2? ? 數(shù)據(jù)挖掘技術(shù)簡(jiǎn)介
數(shù)據(jù)挖掘,一般是指從大量的數(shù)據(jù)中自動(dòng)搜索隱藏于其中的、有特殊關(guān)系的信息的過(guò)程。數(shù)據(jù)挖掘技術(shù)幫助人們從數(shù)據(jù)的海洋中提煉出有價(jià)值的知識(shí)和規(guī)則,以從不同的角度、方面、側(cè)重點(diǎn)去研究和分析,使數(shù)據(jù)得到更為充分的利用。數(shù)據(jù)挖掘技術(shù)改變了原有的信息管理模式,不再局限于信息的采集、整理、存儲(chǔ)等工作,轉(zhuǎn)而升級(jí)為更高層次和更加復(fù)雜的信息整合、數(shù)據(jù)處理、知識(shí)提取等工作。
3? ? 數(shù)據(jù)挖掘在高職院校圖書館中的應(yīng)用
3.1? 研究設(shè)計(jì)
通過(guò)對(duì)數(shù)據(jù)挖掘技術(shù)的研究和使用,找到其在圖書館中的主要應(yīng)用方向。(1)數(shù)據(jù)分析:對(duì)讀者的借閱歷史記錄進(jìn)行分析與研究,挑選出數(shù)據(jù)挖掘工作所必要的數(shù)據(jù),進(jìn)行數(shù)據(jù)加工和處理,使之成為能夠進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)源。(2)數(shù)據(jù)挖掘:選擇聚類算法中的K-MEANS算法對(duì)讀者進(jìn)行數(shù)據(jù)分析。將讀者細(xì)化分為多個(gè)相似的讀者群。在群內(nèi)運(yùn)用關(guān)聯(lián)規(guī)則算法中的APRIORI算法對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘。然后分析結(jié)果,為向讀者推薦圖書做好準(zhǔn)備。(3)功能實(shí)現(xiàn):利用ASP,Java,SQL等技術(shù),在原有圖書管理系統(tǒng)中加入圖書薦購(gòu)功能模塊,方便收集用戶推薦書目。利用網(wǎng)頁(yè)的發(fā)布功能,將數(shù)據(jù)挖掘的結(jié)果(熱門圖書排行榜、關(guān)聯(lián)圖書一覽表、專家推薦功能書目單)公布在學(xué)校圖書館的網(wǎng)站上,方便廣大師生查閱圖書資料。(4)圖書分類:根據(jù)中圖法圖書分類,對(duì)圖書大類進(jìn)行關(guān)聯(lián)分析。對(duì)于讀者借閱的書目,根據(jù)中圖法分類提取大類的索書號(hào),然后通過(guò)關(guān)聯(lián)分析,找到隱藏在大類之間的關(guān)聯(lián)關(guān)系,根據(jù)關(guān)系來(lái)調(diào)整圖書的上架、排架、下架和采購(gòu)工作。
3.2? 過(guò)程實(shí)施
挖掘工具:數(shù)據(jù)挖掘?qū)儆诘湫偷拿嫦驍?shù)據(jù)的分析與管理技術(shù),能夠?yàn)闆Q策提供必要的數(shù)據(jù)支持。本次研究采用SPSS MODELER數(shù)據(jù)挖掘工具完成應(yīng)用開發(fā),其算法比較先進(jìn),具有過(guò)程直觀、功能強(qiáng)大的優(yōu)勢(shì),能夠充分滿足系統(tǒng)開發(fā)過(guò)程中用戶的個(gè)性化需求,并能夠顯著提升系統(tǒng)開發(fā)的效率并縮短開發(fā)周期。
數(shù)據(jù)選取:本次研究將本校圖書管理系統(tǒng)中的讀者借閱記錄信息作為數(shù)據(jù)源進(jìn)行數(shù)據(jù)挖掘,具體數(shù)據(jù)為2018年1月—2018年12月的讀者借還書記錄。進(jìn)入圖書管理系統(tǒng)后,選擇相應(yīng)的時(shí)間段進(jìn)行查詢,結(jié)果顯示近一年的讀者借閱記錄,通過(guò)系統(tǒng)自帶的導(dǎo)出功能將原始數(shù)據(jù)導(dǎo)出為Excel表格,方便后續(xù)使用。
數(shù)據(jù)預(yù)處理:空白數(shù)據(jù)會(huì)對(duì)數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性產(chǎn)生較大的影響,需要查找圖書數(shù)據(jù)庫(kù)將必要信息補(bǔ)全,或者通過(guò)將無(wú)法填充的數(shù)據(jù)刪除等方式來(lái)保證分析的準(zhǔn)確性。一天內(nèi)多次借還相同書目則會(huì)產(chǎn)生重復(fù)數(shù)據(jù),對(duì)挖掘結(jié)果造成不利影響。因此,在挖掘前要識(shí)別并刪除冗余、重復(fù)的數(shù)據(jù),減小數(shù)據(jù)規(guī)模,提高數(shù)據(jù)的清晰度。
挖掘分析:本次研究預(yù)計(jì)采用聚類分析和關(guān)聯(lián)規(guī)則分析進(jìn)行數(shù)據(jù)挖掘。通過(guò)聚類分析將讀者分成幾個(gè)群,同一群中讀者有相似的愛好。通過(guò)觀察相同讀者群內(nèi)讀者的節(jié)約行為,準(zhǔn)確了解讀者的閱讀喜好,從而有針對(duì)性地開展個(gè)性化服務(wù)。使用關(guān)聯(lián)規(guī)則挖掘的目的是分析用戶之間圖書借閱的內(nèi)在關(guān)聯(lián)關(guān)系,主要采用索書號(hào)和分類號(hào)開展研究工作。
4? ? 研究?jī)r(jià)值
(1)提供有效教育的功能。圖書館是學(xué)生獲取知識(shí)的最佳場(chǎng)所,可以運(yùn)用數(shù)據(jù)挖掘技術(shù)智能推薦讀者所需書籍。相比于以前讀者自己檢索或管理人員人工推薦的方法,更加準(zhǔn)確和高效。(2)優(yōu)化館藏建設(shè)的功能。通過(guò)關(guān)聯(lián)數(shù)據(jù)分析,發(fā)現(xiàn)圖書之間的潛在聯(lián)系,對(duì)圖書的排架、整理、上架等工作提出科學(xué)的指導(dǎo)意見。(3)推薦圖書購(gòu)置的功能。可以采用數(shù)據(jù)挖掘技術(shù)中的遺傳算法,利用種群進(jìn)化來(lái)主動(dòng)尋優(yōu),根據(jù)不同領(lǐng)域熱度給出不同的權(quán)重,為采購(gòu)方案的制定給出科學(xué)的指導(dǎo)意見,有效利用購(gòu)書經(jīng)費(fèi)。(4)新啟動(dòng)的功能。推薦系統(tǒng)的核心問(wèn)題在于新用戶啟動(dòng)和新書啟動(dòng)。解決新用戶啟動(dòng)的問(wèn)題:讀者登錄后,系統(tǒng)根據(jù)讀者的個(gè)人信息(系部、專業(yè)),顯示當(dāng)前圖書使用率排行榜,同時(shí)讀者可以查看一定時(shí)期內(nèi)的熱門圖書排行榜,有助于學(xué)生選擇圖書。解決新書啟動(dòng)的問(wèn)題:利用讀者的圖書薦購(gòu)信息對(duì)新書進(jìn)行關(guān)聯(lián)挖掘,找到新到圖書與讀者之間的關(guān)聯(lián)規(guī)則,然后向讀者進(jìn)行推薦。
5? ? 結(jié)語(yǔ)
圖書館作為我國(guó)的傳統(tǒng)服務(wù)行業(yè),不僅肩負(fù)著為廣大讀者提供信息資源的重要使命,還肩負(fù)著保護(hù)人類文化遺產(chǎn)的重要責(zé)任。高職院校圖書館要想更好地為廣大師生提供服務(wù),必須利用現(xiàn)代化的信息技術(shù),對(duì)服務(wù)管理工作進(jìn)行創(chuàng)新,加快圖書館資源的數(shù)字化建設(shè)。
[參考文獻(xiàn)]
[1]嚴(yán)春來(lái).大數(shù)據(jù)環(huán)境下數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2017(3):113.