摘要:信息時代以及大數據時代的到來,改變了人們以往的工作和生活方式,公共圖書管理也逐漸轉變為數字化管理,這無疑便利了圖書館管理工作,使大量的圖書信息被完好且條理清晰地保存了下來。作為一種結合多領域技術開發而形成的一種現代化先進信息技術,數據挖掘在很大程度上推動著圖書館數字化建設的快速發展。本文對公共圖書館管理中的數據挖掘技術進行了系統分析,并討論了其功能以及在圖書館管理工作中的具體應用,希望能加快我國圖書館的數字化建設。
關鍵詞:公共圖書館;數據挖掘;管理;應用
一、 前言
科技的進步推動著我國網絡技術的迅猛發展,信息化、數字化潛移默化地改變著人們的工作和生活,也改變了傳統的公共圖書館管理方式。數據挖掘技術被廣泛應用于圖書館管理中,使得圖書館中海量、復雜的數據信息被完好、準確地保存,這不但節省了大量的勞動力,簡化了工作流程,提升了工作效率,更有利于在進行圖書館管理時做出科學決策。因此,現代圖書館加強數據挖掘技術的開發和應用十分必要。
二、 數據挖掘技術分析
(一) 數據挖掘技術概述
數據挖掘技術是在傳統的數據處理工具無法滿足信息提取需求的基礎上形成的一種新型的信息處理技術,它通過現代化科學技術,可以在大量模糊、隨機數據中提取出隱藏的有價值信息。數據挖掘技術為實現信息的分類管理、尋找數據隱藏規律等提供了諸多便利,從而幫助企業或個人對未來數據發展做出預測。和傳統的報表信息處理方式相比,數據挖掘技術更擅于在雜亂無章,甚至毫無關聯的數據中,提取出準確的具有關鍵作用的數據,從而幫助相關人員做出科學決策。
(二) 數據挖掘的基本流程
1. 數據準備
圖書館在利用數據挖掘進行信息管理時,要通過獲取用戶信息、借閱歷史、圖書檢索記錄、書籍信息四大板塊進行分析。首先是借閱書籍用戶的基本信息。普遍來講,用戶的基本信息包括姓名、性別、年齡、聯系電話、證件號等等,但在現代化圖書館中,數據挖掘還會獲取用戶的借閱等級、借閱信譽等。其次是獲取用戶的借閱歷史。收集和存儲借閱歷史信息是圖書館管理的重要工作,這類信息主要是指用戶編號、書籍編號、名稱、版本等,以及借閱和歸還的時間。圖書的實時使用情況就是通過對這些信息的整合分析呈現出來的。第三是獲取用戶的圖書檢索記錄。圖書檢索功能是現代化圖書館必不可少的一項重要功能,圖書館存書量巨大,用戶在借閱圖書前往往會通過檢索系統尋找自己的目標書籍,圖書管理員便可以通過用戶的檢索信息,獲取檢索內容、時間以及編號等信息,以此了解用戶的借閱需求。由于圖書館檢索系統的使用量巨大,檢索數據十分龐大,若要完好、準確地存儲這些信息,就必須有高水平的硬件設施加以輔助。最后一個方面就是獲取圖書館內的書籍信息。書籍信息是圖書館信息化數據系統需要處理的最基礎的信息,它主要包括書籍名稱、編號、位置、出版單位、作者等信息,這類信息的存儲一定要條理清晰,有相應規律。
2. 數據挖掘
數據挖掘首先要設置一個挖掘目標,之后確定數據挖掘假設,這種假設可以由用戶親自建立,也可以由系統提出。完成挖掘目標和挖掘假設的建立后,就是進行數據處理了,系統會選擇合適的處理工具,并利用工具在大量的信息中進行逐級搜索,進而尋找符合需求的模型。數據挖掘也可以加入人機交互,也就是由工作人員主動發問,利用系統工具逐級搜索,檢測假設是否正確。
3. 結果表述
完成以上一系列流程之后,系統會通過用戶的決策目標,進行相應檢索之后,將數據信息進行分析,并將最有價值最關鍵的信息呈現出來,交給決策者,這便是結果表述。
三、 數據挖掘技術的功能分析
(一) 預測未來趨勢及行為可能
數據挖掘可以在海量數據信息中提取出隱藏的關鍵信息,以此預測未來趨勢和行為可能,為決策提供可靠依據。以往需要大量勞動力進行數據分析的過程,如今被數據挖掘簡化,快速得出準確的結論。比如商家在進行商業決策前,會對市場進行分析預測,數據挖掘可以通過商家提供的過去收集來的相關促銷數據,檢索出在今后的投資中會收獲最大回報的用戶。
(二) 尋找復雜數據信息的關聯網
數據庫中往往存儲著海量的數據信息,在這些信息當中,如果兩個或兩個以上的數據信息之間具備某種規律,我們便稱之為“關聯”,數據挖掘便可以在大量復雜數據中挖掘出這種關聯。關聯可分為三種,簡單關聯、時序關聯和因果關聯。進行關聯分析就是為了在數據庫中找出這種隱藏的、不確定的、具有可信度的關聯網。
(三) 通過聚類進行偏差分析
將物理或抽象對象的集合分成由類似的對象組成的多個類的過程被稱為聚類。數據庫中具有繁雜的記錄存儲,數據挖掘可將其劃分為一系列聚類,這些聚類是可理解的、可用的,如此便可明晰并強化人們對這些記錄或者數據的認識。聚類是進行概念描述和分析數據偏差的基本要素。
(四) 進行概念描述
概念描述是對某一個對象的內涵或者定義進行客觀陳述,并總結出這類對象的特點。概念描述一般分為兩種類型,分別是特征性描述和區別性描述。不言而喻,特征性描述是對某類對象的特征進行描述,區別性描述恰恰相反,是描述不同類對象的差異性。
(五) 檢測數據庫中的偏差
數據庫中存在大量的數據信息,也常伴有某些異常記錄,數據挖掘可以從海量信息中檢測出這些偏差。這些偏差包括的內容很多,也包括大量的潛在有趣味性的知識,如觀測結果與期望之間的差異、分類中的反常實例、模式的例外等。
四、 數據挖掘技術在公共圖書館管理工作中的應用
(一) 實現多元化教育功能
當今社會,對于創新型人才的需求越來越大,因此,在人才培養方面,傳統的知識教育已無法滿足社會發展的需要,創造性思維和創新能力的培養逐漸占據人才教育的重要位置。為大力發展社會經濟,提升我國綜合實力,利用素質教育的優勢,培養大批既有良好的基礎知識,又具備創新能力的復合型人才勢在必行。對于學習者來說,學習的目的在每一個人生階段都會有所不同,比如對于學生而言,學習的主要目的是汲取專業知識,而對于職場達人來說,學習多是為了豐富知識儲備或者滿足考取某類證書的需要。公共圖書館中囊括各學科各領域的書籍,是汲取知識的最佳場所,如何滿足不同讀者多元化的閱讀需求,是圖書館工作人員的重點工作之一。endprint
數據挖掘技術可以通過相關數據檢索,了解讀者的職業、感興趣的學科以及對于圖書的需求,圖書館工作人員獲取這些信息之后,可以為書目采購、期刊訂閱等提供一些預測性指導。同時,這些數據也可以提供給教育部門用于相關研究。除此之外,數據挖掘對于讀者數據信息的分析,能夠幫助公共圖書館了解不同類型的讀者對于圖書的需求差異,以便制定與讀者需求相符的圖書決策表,優化館藏結構。
(二) 優化信息資源和信息架構
由于公共圖書館是由國家中央或地方政府管理、資助和支持的、免費為社會公眾服務的圖書館,而并非盈利性組織,因此它的采購費用是有限的,如何讓有限的采購費用發揮最大的價值,是關鍵問題。數據挖掘則可以通過優化信息架構,有效解決這個問題。首先,可以通過數據挖掘,檢索并分析用戶的借閱記錄以及館藏記錄,并以此檢索結果為依據,根據讀者需求調整書目的采購比例。其次,互聯網技術的日漸發達,使得網絡信息越來越豐富,公共圖書館可以通過數據挖掘,在網絡上篩選出優質內容,補充到圖書館信息資源庫當中,在減少經費使用率的情況下,豐富圖書館的電子信息資源。再次,數據挖掘技術對于圖書館電子文獻的管理發揮著重要作用。它可以高效地完成電子文獻的分類整理、資源查找等工作,既節省了人工成本,又提高了工作效率。
需要注意的是,公共圖書館在弘揚地方文化方面發揮著不可忽視的作用,這就要求圖書館不斷加強地方文獻數據館藏的建設力度,但由于經費有限,必須進行相應的取舍,才能保證地方文獻的采購經費充足。普遍來講,圖書館在進行書目采購時,常常采用優先選擇熱門書籍的方式,對于非熱門書的采購相對少了很多,這樣的策略會導致圖書館的館藏結構不均衡。數據挖掘則可以利用遺傳算法,通過分析各個領域的熱度,給出不同的權重,指導科學采購策略的形成,從而避免圖書館館藏結構不均衡的情況發生。
(三) 優化并完善信息服務功能
公共圖書館是面向全體社會成員和社會組織的公益性信息服務機構,也因此信息服務功能是公共圖書館的主要功能。使用數據挖掘,可以優化并完善圖書館的信息服務功能。依據上文提到的數據挖掘具有聚類功能,它可以將圖書館中的大量信息數據,依據不同的標準,進行多層次聚類分析。公共圖書館運用聚類分析時,不必對信息進行提前分類,只需根據圖書館的需求,選擇合適的門檻值,滿足門檻值要求的文獻信息就分為一類,依據不同的門檻值,可以將各種信息分為多個類別。這種聚類方式涉及全部文獻情報,也就打破了目前情報分類方法的局限。
此外,數據挖掘還可以為讀者提供個性化的信息服務。比如,通過數據挖掘獲取讀者的借閱信息以及經常訪問的網頁內容,并對獲取的數據進行分析,從而獲知讀者的興趣愛好、需求方向等,以便制定個性化服務主動為讀者提供符合其需求的相關文獻資料。除此之外,還可以通過總結讀者特征、整理讀者的反饋信息,建立用戶檔案,將潛在用戶轉變為實際用戶,使圖書館升級為一個能夠主動提供信息的智能主體。
五、 結語
圖書館是存儲人類文明的重要場所,是人類汲取知識的理想圣地。伴隨著科技的進步和信息時代的到來,信息化圖書館也日益發展壯大起來,這不但讓圖書館的館藏容量成倍增長,也極大地縮減了圖書館的建設和管理成本。數據挖掘是時代發展的必然產物,它的存在將公共圖書館繁雜的管理工作進行了有效簡化,促進了信息化圖書館的快速發展,并且為讀者提供了更加人性化、個性化、多元化的信息服務,未來也定將取得更大、更廣的發展前景。
參考文獻:
[1]時海燕.數據挖掘在公共圖書館管理工作中的作用分析[J].辦公室業務,2016(21):189-190.
[2]張黎.數據挖掘在公共圖書館管理決策中的應用[J].現代情報,2006(08):122-126.
[3]陳海軍.數據挖掘在公共圖書館管理工作中的應用[J].中國管理信息化,2016,(01):169-169.
[4]王真.數據挖掘及其在圖書館的應用[J].情報探索,2007,2007(12):60-62.
作者簡介:
張學梅,河南省新鄉市,新鄉市圖書館。endprint