楊洋
摘 要: 數據挖掘技術在信息的利用和提取中發揮著日益重要的作用。本文介紹了數據挖掘技術的基本概念及功能,并對數據挖掘技術應用于圖書館的研究現狀進行了分析,在描述數據挖掘技術的基礎上,探討了數據挖掘在數字化圖書館中的應用,旨在為圖書館在數字資源的組織和管理、服務質量的提升和服務方式的拓展等提供技術支持。
關鍵詞: 圖書館 數據挖掘 數據信息
一、高校圖書館數據挖掘的概念及發展現狀
數據挖掘是指從大量數據中提取或挖掘隱含的信息或知識,可以在任何類型的信息載體或存儲中進行。數據挖掘過程可分為三個階段:數據準備、采掘操作、結果表達和解釋。目前,它已經在銀行業、工程技術、醫學和零售業等領域得到成功應用和空前發展,在這些領域的成功應用鼓舞著人們將數據挖掘技術應用到更多、更廣泛的領域中。其中,高校圖書館就是一個很好的例子,數字圖書館是計算機可處理的、有序組織的知識集合。
隨著網絡上的數字圖書館越來越多,數字圖書館的數據挖掘和知識發現研究具有較大的應用價值。數字圖書館可以突破文獻單元的局限,以知識單元為基準進行信息挖掘和知識發現,從而發現有規律的認識。它將提供和實現資源共享,分散于不同載體、不同地域的數字化信息資源以網絡化方式互相聯結。除此以外,數字圖書館是多方面高新技術支持的數字信息資源系統。其使用數字技術進行信息資源的組織和管理,能夠存儲海量信息,用戶可以通過網絡獲得信息服務,高效方便地查詢、檢索信息,并且其信息存儲和用戶訪問不受時間及地域的限制。
高校圖書館數據挖掘應用不是簡單的互聯網上的圖書館主頁,而是一整套面向對象的、分布式的、與平臺無關的數字化資源的集合。其過程通常是自動的,用戶不必提出確切的問題,從而更有利于發現隱藏的知識。我們還可以利用數據挖掘的研究成果提高信息檢索的精度和效率,改善檢索結果的表達,使信息檢索系統提高到一個新的水平。
二、高校圖書館數據挖掘的運用
數據挖掘在高校圖書館中的運用比較廣泛,以下將從資源建設、個性化服務、圖書管理等方面進行簡單論述。(1)數據挖掘在圖書館資源建設上的應用。使用模式挖掘、學科動態分析,結合現有館藏信息情況,采用合適挖掘算法及時發現信息資源的漏缺,做好文獻的收集訂購。對大量文檔集合內容進行摘要、分類、聚類、關聯分析,從大量的資源中抽取潛在的有用知識。采用各種數據挖掘技術與方法,評判數字圖書館文獻信息資源的利用率、有效率等,以便建設特色館藏。(2)數據挖掘在圖書館個性化信息服務中的應用。個性化信息服務不僅需要針對不同的用戶需求提供不同的服務,更重要的在于發現用戶的潛在需求進行主動的信息服務。數據挖掘技術為解決此問題開辟了一條道路。(3)數據挖掘在圖書館管理上的應用。數據挖掘作為一種深層次的數據分析方法,可以從大量的用戶數據中挖掘反映用戶屬性特征和信息行為特征的信息及規則,從而為圖書館用戶資源管理提供極大的幫助。
此外,數據挖掘在數字圖書館結構上的運用,主要是從網頁的組織結構和鏈接關系中獲取知識,在此基礎上對頁面進行分類和聚類,或對相關網頁進行分析,發現數字圖書館頁面的結構和結構模式,從而對網頁的質量進行評價,對檢索方式進行優化。通過鏈接分析和掌握學科發展狀況,指導網站的建設。
數據挖掘可以幫助決策者分析歷史數據及當前數據,從中發現隱藏的關系和模式,進而預測未來可能發生的行為。隨著數據挖掘研究的深入,需解決的問題和面臨的挑戰很多。如:在不同的層次上進行交互的數據挖掘;數據挖掘結果是否具有準確性和有用性;用不同形式表示數據挖掘的結果;從不能結構的數據源中挖掘信息;數據挖掘的方法和模式雖然多樣,卻沒有統一地對模型進行描述和定義,各數據之間缺乏聯系,造成各數據挖掘系統之間的封閉。
三、高校圖書館數據挖掘存在的問題及對策
作為圖書館的未來發展趨勢,數字圖書館擁有海量的數字資源,如何發揮其巨大作用、避免信息過量已經成為數字圖書館發展必然要面對的問題,而數據挖掘技術在數字圖書館應用面臨許多的挑戰。
隨著圖書館數字化程度與數字圖書館建設的不斷強化,大多數圖書館紛紛引進全文中外文大型數據庫,少則數個,多則數十個,提供的信息更多、更新、更廣泛、更復雜。然而,目前這些數字資源尚未有統一的制作和顯示規范,閱讀格式和檢索界面多種多樣,互不兼容,使得讀者需要安裝多個瀏覽器,并且對同一個主題反復檢索,效率低下。此外,圖書館的數據庫系統可以高效地發揮數據的錄入、查詢、統計等功能,但無法從大量數據中獲取數據背后隱藏的、內在的、有用的信息,發現數據中存在的關系和規則,以致無法為讀者提供更方便、快捷、高效的服務。
解決高校圖書館數據挖掘存在的問題,我們應該致力于找出解決問題的對策。為了避免陷入數據豐富,但信息貧乏的局面,圖書館有必要增強對信息的處理能力及對信息資源的組織能力,尤其是對海量信息的深層次的開發,提取表面上龐雜無序的信息的內在聯系供讀者使用。同時,采用數據挖掘技術對這些數據進行深入分析、研究對圖書館了解讀者的借閱興趣、圖書采購、信息咨詢等業務都有很強的指導作用,對提高讀者服務質量、資源利用率有很大的幫助。
參考文獻:
[1]譚觀音,李繼宏.高校圖書館期刊選訂的模糊決策[J].現代情報,2011(8).
[2]李朝葵,凌云.數據挖掘及其在圖書館中的應用[J].情報雜志,2011(6).
[3]趙宏波,孟雅玲.數據挖掘在電信客戶關系管理中的應用[J].電信技術,2011(2).