喬瑋
摘要:受信息技術影響,現代圖書館為了展現自身價值都積極引入了相關信息技術,使得圖書館朝信息化方向發展,這時信息技術就涉及圖書館的管理系統中,能夠幫助管理員做好管理工作,有利于圖書館運維。數據挖掘技術就是圖書館管理信息系統中的常用技術,與信息系統作用及管理工作質量有密切關系,因此如何正確應用該項技術是現代圖書館需要思考的問題,本文也將展開研究,重點論述數據挖掘技術在圖書館管理信息系統中的運用方法。
關鍵詞:數據挖掘技術;圖書館;管理信息系統
目前,國內圖書館基本都構建了管理信息系統,但這些系統的功能性普遍比較淺薄,一般只能用于信息儲存、信息查找、信息展示等工作環節,由此系統雖然有利于圖書館管理工作,實際效用水平卻相對薄弱。而針對這一現象,數據挖掘技術能夠彌補當前圖書館管理信息系統的短板,進一步簡化圖書館管理工作,還能對工作質量做出更有力的保障,因此有必要對圖書館管理信息系統中數據挖掘技術的運用進行研究,此舉具有一定現實意義。
1 數據挖掘技術概念與管理作用
1.1技術概念
顧名思義,數據挖掘技術就是一種能夠不斷深入的挖掘大量數據的技術工具,該項技術在不斷發展中已經趨向成熟,具有數據處理能力強、挖掘深度優秀、性能全面等特點,因此可以投入實際應用。在基本作用上,該項技術面對種類繁多,且量級龐大的數據,能夠在短時間內提取所有數據的關鍵特征信息,這樣技術系統能對所有數據進行定義,隨后將任意數據進行組合,可得數據之間的關系,根據關系能對數據代表事項的發展趨勢進行判斷,而數據之間的關系是十分復雜的,屬于隱含信息,單純從數據表面上是無法看出的,這就是數據挖掘技術的挖掘作用體現。此外,人工自然也具備一定的數據挖掘能力,可以對數據關系進行分析,但人工必然存在能力上的限制,實際分析中如果數據量太大,首先無法保障分析效率,其次很有可能出現分析不全面、不準確等不良現象,因此有必要用數據挖掘技術來代替人工完成大量數據分析工作。
1.2管理作用
在圖書館管理工作基礎上,根據該項工作的當前要求,圖書館管理員除了要維系圖書館秩序以外,還要對圖書館用戶的各種需求來進行分析,而該項工作就比較困難,因為圖書館用戶的需求是不斷產生的,且種類繁多,還隨時會發生變化,同時很多用戶自己都不知道自己有什么需求,也不會主動向圖書館管理員提出,所以依靠管理員進行人工管理,只能做到維系圖書館秩序,難以分析用戶需求,這影響了現代圖書館的服務水平。但在數據挖掘技術上,首先該項技術會不斷搜集用戶在圖書館中的行為,并將這些行為以數據形式儲存,其次將對這些行為進行分析,通過分析可以從用戶綜合行為中得到用戶可能存在的需求,這樣就能提出準確的服務方向,有利于圖書館服務水平,另外技術的介入能在短時間內完成工作,可以應對不斷產生、隨時變化的數據,可見數據挖掘技術具有良好的管理作用,應用價值很高,值得推廣。
2 圖書館管理信息系統中數據挖掘技術的運用方法
圖書館管理信息系統是數據挖掘技術的運用基礎,但如何將該項技術融入系統中,并充分發揮技術作用就是一大難題,要解決難題就必須采用正確運用方法。為此,下文將提出技術在系統中的運用方法,以供參考。
2.1基本思路
數據挖掘技術在圖書館管理信息系統中運用的基本思路必須貼合管理需求,即現代圖書館管理工作希望了解用戶閱讀需求、購書需求、閱讀興趣、閱讀習慣等,以便于圖書館經營與服務。因此技術運用方法必須滿足這些需求,做到這一點就說明技術運用方法有效。本文技術運用思路中技術運用方法大體可分為四個步驟,分別為挖掘工具選擇、數據采集與處理、數據挖掘、數據挖掘成果總結。
2.2運用方法
根據基本思路中技術運用方法的四個步驟,下文將展開相關分析。
(1)挖掘工具選擇
在數據挖掘技術的發展中出現了很多中挖掘工具,其中部分工具的性能、適用條件比較狹窄,不符合現代圖書館管理信息系統需求,因此必須慎重選擇數據挖掘工具,這樣才能對技術運用效果做出保障。根據普遍數據挖掘工具的優劣、特點,本文主要選擇了SQL數據庫(SQL Server 2005)作為數據挖掘工具,該數據庫包含了大量數據挖掘方法,且相較于其他類似數據挖掘工具,SQL數據庫的優勢非常明顯,具備獨特的數據處理方式,在運作中可以先保存海量數據,同時提出關鍵詞來識別數據,最后依靠挖掘邏輯來進行數據分析,這樣就能得到數據深層信息??梢奡QL數據挖掘工具的應用不但簡便,還行之有效,建議在圖書館管理信息系統中推廣。
(2)數據采集與處理
SQL作為數據挖掘工具不可能憑空運作,因此必須在運作前需要進行數據采集與處理。具體方法可分為兩個步驟:①進入SQL服務器找到代表數據采集邏輯的表格,該表格在初始化階段包含的信息非常少,不滿足圖書館數據采集需求,因此必須進行完善,這里需要根據用戶閱讀需求、購書需求、閱讀興趣、閱讀習慣等相關數據特征來進行處理,由此得到完善的數據采集邏輯;②啟動SQL Server Management Shad io,這樣能根據系統提出對數據采集邏輯表格進行進一步處理,使表格更貼合管理工作流程。經過以上兩個步驟,就可以通過圖書館管理信息系統來進行數據采集,采集所得數據會被全部導入SQL的數據儲存空間中接受挖掘分析。
(3)數據挖掘
要保障SQL能準確挖掘出管理員想要的信息,在挖掘之前應當先設定好挖掘邏輯。以用戶閱讀需求為例,管理員應當先在SQL內設定數據分類項,即用戶閱讀需求為分類項總目,其下要根據用戶閱讀需求的特征進行細化分類,類如用戶翻閱記錄、用戶閱讀時長、用戶上次閱讀位置記錄等,這樣SQL就會根據分類項來進行數據挖掘,獲取相關信息后進行分析,這一步驟可以通過人工來完成,但如果條件允許,則建議引入智能邏輯來進行分析。此外,無論是人工分析還是技術分析,分析的基本流程是相同的,即根據相關分類項總目下細化分類的數據表現,推測用戶當前可能存在什么需求,如在用于閱讀需求分類項總目下,通過用戶翻閱記錄可知用戶可能對哪些類型的圖書有興趣,這樣就可以向用戶推送相關類型的圖書,或者根據用戶閱讀時長,可知用戶最感興趣的是哪些類型的圖書,可集中推送。