◎ 晁陽
數據挖掘在高校圖書館的運用
◎ 晁陽
作為一種全新的信息分析輔助技術,數據挖掘在高校圖書館日常管理運營中有著十分廣泛的應用,不僅能夠有效提高圖書館的工作效率,還能為讀者用戶提供高品質的服務。本文簡單介紹了數據挖掘技術的相關概念,重點分析了在高校圖書館中運用數據挖掘的可行性,并進一步詳細地介紹了具體的應用,希望能夠為相關研究提供有價值的參考建議。
隨著網絡信息技術的迅速發展,涌現出了一大批新媒體技術,給人們傳統的閱讀方式帶來了巨大的變化。新形勢背景下,高校圖書館有必要及時改變自身的管理和服務理念,積極采用先進的工作方式為廣大讀者用戶提供更為便捷高效的服務,滿足不同用戶個性化的閱讀需求。就目前來看,我國高校圖書館在數據挖掘、信息分析、加工等各方面的能力還有所欠缺,要想適應當今信息市場的激烈競爭,必須通過數據挖掘來對圖書館數據間的關聯性進行深層次的歸納分析,從而準確得出不同讀者用戶的興趣愛好、閱讀習慣、借閱規律等信息,以便圖書館針對不同讀者需求提供多種人性化的服務,及時調整相應的管理和運營策略,不斷提升高校圖書館服務的質量水平。
所謂的數據挖掘是指一種從大量數據中獲取有價值的、新穎的、有用的、潛在性信息的數據分析技術。在海量數據庫中應用數據挖掘技術,能夠在查詢內容的同時總結出相應的搜索規律,幫助決策者快速分析歷史數據,并對未來狀況作出準確、科學的預測。因此,在高校圖書館中應用數據挖掘技術,對于圖書館自身的發展而言具有十分積極的意義。首先,我們可以通過數據挖掘技術對圖書館數據庫中的大量原始數據進行全方位的歸納整理,清除一些錯誤、冗長的數據,提煉出絕大多數讀者感興趣的閱讀數據,從而為下一步的數據挖掘工作做好準備;其次,基于圖書館數據庫對現有的服務模式和關聯規則進行評估分析,開展數據挖掘工作;最后,在用戶界面中呈現出最終的數據挖掘結果。
經濟層面分析。從經濟角度分析,數據挖掘技術的應用必然會增加相應的運行成本,包括購買功能軟件、硬件、升級系統或者購買第三方服務項目等費用,這些對于高校圖書館而言都是一筆不小的費用支出。然而,從長遠角度和全局利益來看,盡管數據挖掘導致圖書館的經濟成本上升,但同時也帶來了巨大的收益。例如,通過數據挖掘對圖書館的用戶群進行分類,根據不同讀者用戶的需求選擇采購紙質圖書或者電子資源,從而有效避免了采購圖書資源后卻無人問津的局面,有效降低了高校圖書館的采購成本。因此,在高校圖書館中應用數據挖掘,盡管短期內會導致圖書館成本增加,但是卻能夠有效提升圖書館的長期運營效益,故從經濟層面上來分析,應用數據挖掘技術是可行的。
技術層面分析。現階段,數據挖掘技術的應用已經遍布金融、零售、制造、通信等各個領域當中,取得了十分顯著的應用成果,并且從目前已有的宏觀數據來看,尚未出現因這門技術自身缺陷原因而給企業帶來損失的現象。因此,我們有理由相信,目前數據挖掘的技術研究已經處于較為成熟的階段,在高校圖書館的實際應用中存在的風險較小。此外,在當今社會大數據時代背景下,社會各界對于數據挖掘技術的發展都普遍較為重視,許多企業都能夠提供關于數據挖掘的服務項目,高校圖書館可以根據自身發展的實際情況選擇對外承包數據挖掘工作,從而有效規避技術層面上的風險。
運行層面分析。在高校圖書館中應用數據挖掘技術,能夠更加準確清晰地獲取讀者用戶的相關信息,以便圖書館制定出科學的決策信息。從本質上來看,數據挖掘對圖書館運行的影響主要體現在,在原有決策的基礎上增加了一些更加具有說服性和科學性的輔助材料,并不會對整個決策的宏觀局面和最終發展方向產生影響。為進一步保證數據挖掘的實施成果,高校圖書館有必要定期組織館員們參加培訓活動,學習最新的理論知識,同時,還應訓練他們掌握基本的操作技能,使其能夠迅速適應全新的圖書館管理和運營環境,靈活運用數據挖掘來開展日常工作,為讀者用戶們提供更高品質的服務。客觀而言,這些培訓活動的難度較小,在具體實施過程中,實際遇到的阻力較小,圖書館工作人員也相對地,都十分配合,所以在高校圖書館中應用數據挖掘技術是完全可行的。
數據挖掘準備階段
圖書館工作人員在平時的工作過程中利用數據挖掘技術能夠很輕松地獲取到廣大師生讀者的基本信息,具體包括用戶的年齡、性別、專業等,從而為圖書館管理層制定各項決策提供重要的參考依據。
記錄圖書的書目信息。在高校圖書館中,書目信息主要是指圖書的主題名稱、專業類別、作者、出版設、日期、排架號等綜合數據的集合體,是圖書館數據庫中的核心內容,也是我們利用數據挖掘技術促進圖書館高效管理運行的必要前提條件之一。
記錄圖書的借閱信息。圖書借閱信息是圖書館管理層制定圖書采購計劃的基本依據,內容主要包括圖書的書名、編號、排架號、借出時間、歸還時間、借出次數等,運用數據挖掘技術能夠系統化地對教師和學生借閱圖書的情況進行科學全面的統計分析,從而得出每本圖書的使用情況,并且對其將來的借閱狀況進行預測,制定相應的采購計劃,及時補充熱門圖書的館藏資源,以滿足師生們教學科研和工作學習的需求,從而有效實現圖書館借閱服務的集中化管理。
記錄圖書的檢索信息。根據大數據結果和實證研究表明,通過記錄各類圖書的歷史檢索信息,能夠較為客觀地分析得出讀者對這些圖書的需求情況,從而有利于管理者作出更加合理的政策調整。為此,高校圖書館有必要進一步規范和完善現有的圖書檢索機制,盡可能地保證檢索關鍵字、時間、讀者編號等信息的完整性。鑒于在圖書館檢索系統中,絕大多數情況下讀者用戶個人的標識信息都是以匿名方式出現,故在數據挖掘中可以用編號或地址來代替用戶。如果檢索關鍵字是較為規范的字段,則系統記錄下相應的檢索項、符號等數據信息,如果是一些短語或者句詞,系統還需對檢索信息先進行分詞處理,然后再進行統計分析,以保證最終得出結果的真實性和可靠性。
數據挖掘的分析階段
通過聚類分析法對圖書館信息管理系統中大量的借閱數據進行分析,能夠準確獲取讀者用戶們的借閱頻率和閱讀習慣,從而將不同層次水平的用戶區分開來,為其提供個性化的服務項目,以滿足廣大師生群體多樣化的借閱需求。具體地,高校圖書館在應用數據挖掘技術時可以按照以下步驟來有序進行:
數據清理。在高校圖書館中運用數據挖掘技術,首先需要對系統原有的數據信息進行清理,具體內容包括:清除已被注銷圖書的檢索信息和借閱信息、清除指定書籍在某一年限前的所有相關數據信息等、清除一些重復、冗長、多余的數據信息等。通過清理,可以使高校圖書館數據庫中的信息更加簡明清晰,有利于數據挖掘和分析工作的順利展開。
聚類分析。經過數據準備階段后,可以得出各類圖書被讀者用戶借閱的次數,在此基礎上對所獲得數據信息進行聚類分析,根據圖書借閱頻次的高低將讀者用戶群分為三個等級,分別為:不活躍讀者、一般讀者和活躍讀者,然而再根據不同類別讀者的閱讀習慣和興趣愛好,制定個性化的服務方案,以充分滿足他們的工作學習需求,同時最大程度地激發他們的閱讀興趣,培養教師和學生們對高校圖書館的忠誠度,進而有效促進圖書館自身的可持續發展。
結果分析。通過對數據挖掘結果的客觀分析,我們可以從圖書借閱次數間接分析得出讀者用戶的閱讀需求情況,衡量圖書館的服務質量,并進一步體現出教師和學生在某一方面的閱讀行為特征。針對活躍程度不同的讀者,圖書館可以制定不同的服務標準,以充分激發他們的閱讀興趣,例如,對于活躍群體,可以適當地增大他們借閱次數較多圖書的冊書,滿足這部分讀者大量的閱讀需求,主動為他們提供人性化的服務,從而有效提升高校圖書館的管理運營水平。
綜上所述,數據挖掘技術在高校圖書館中有著十分廣泛的應用,除了本研究中所提到的內容,還包括在資源建設、學科管理、信息咨詢、圖書采購等多個方面的運用,對于促進高校圖書館的現代化管理建設具有十分積極的意義。尤其是在未來數字化圖書館發展進程中,數據挖掘起著關鍵性的作用,圖書館應靈活運用數據挖掘對海量的數據信息進行分析、歸納,從中總結出有價值、有潛在性的信息,為讀者用戶提供高品質的個性化服務。此外,高校圖書館還應不斷完善和規范現有的管理工作,以進一步拓寬信息服務的內容,充分發揮數據挖掘在高校圖書館中的應用價值,從而有效促進高等教育事業的穩定發展。
陜西學前師范學院2016年度校級科研基金項目“數據挖掘在高校圖書館個性化推介服務中的應用研究”(項目編號:2016ZDKJ017)
陜西學前師范學院圖書館)