劉勇梅
(呂梁教育學院 山西 呂梁 033000)
在信息時代中,信息日益膨脹,圖書館訪問者檢索出的信息有所出入,無法有效利用圖書資源,在一定程度上影響了圖書資源管理與決策的科學性,不利于圖書館的發展。數據挖掘技術是數據庫、統計學、人工智能為一體的技術,可全面、深入分析大規模數據,并準確挖掘出潛在的、有價值的信息[1]。在圖書館管理中引入數據挖掘技術,可真正掌握讀者興趣與需求,積極整合圖書資源,科學調整圖書館藏書,以此來提高圖書服務質量。
數據挖掘實質上是一個發現知識的過程。一般而言,數據挖掘是統計、數據庫、模糊數學、神經網絡等學科為一體的技術,從不完善、模糊、大規模的隨機數據中準確識別有價值、有潛能的數據處理過程[2]。其主要特征表現為如下幾點。
數據的分類,則是細致、準確地分析數據庫中的各數據,并對不同類別進行準確描述,或者確定分類模型,或者對分類規則進行明確,然后根據分類規則分類與記錄其他類型。同時,積極預測已經分類的模型,并結合實際情況,深入剖析相關數據及相關特點,并基于這些所獲取的數據信息對新收集的數據進行深入分析[3]。
對于數據挖掘而言,關聯規則是重點技術[4]。在數據庫尋求的過程中,各數據項目中必然存在一定的關聯規則。對數據關聯進行分析,可找到大多數數據間的密切關系。挖掘頻繁出現的數據,以此來提升關聯規則挖掘的速度與質量。另外,數據管理分析的重點在于尋找到各數據中所隱藏的關聯情況,經過對消費者購買的不同商品,聯系分析出消費者購買習慣,進而為零售商營銷方案提供可靠數據。
對于數據分析而言,聚類是重要分析工具,綜合分析大規模的數據點,促使數據的類別之間盡量地相似,不同類別的數據則進行有效區分[5]。因此,數據的聚類過程是一種無監督分類,這便說明了聚類實質上是把某一個基于某相似性的特殊性進行類別劃分,然而聚類未如實記錄分類,也不了解具體分類情況,根據差異性的差別,對其分為獨特的積累,并合理確定本身實際歸屬。
預測,則是基于沒有個體對象自身屬性的觀察值,準確地預測對象屬性將來的素質。在各種較大數據庫中,數據挖掘能夠積極尋求信息。例如積極預測市場,數據挖掘以前的各種數據,對以后的投資提供可靠的數據支撐。
現代社會中,圖書收藏量持續增長,圖書館管理規模日益擴大,因此圖書管理中的數據呈現出如下特征:(1)信息隱晦性,也被叫做潛在性。圖書館在管理過程中出現了大規模的數據,應對這些信息進行有效組織,而且應挖掘其中所蘊含的價值,對此需借助一定的手段才可獲取有價值的數據信息。(2)關聯性:對于圖書而言,借閱與查詢是信息產生的主要環節,且相關信息之間存在千絲萬縷的關系。(3)海量性:隨著圖書館經營時間的增長及館藏量的增加,圖書管理過程中必然產生了大量的數據,海量趨勢日益明顯[6]。
近年來圖書館發展中推出了多項管理業務,然而服務上有一定的局限性,大多是簡單讓讀者獲得圖書方面的咨詢,并提供圖書的借閱與歸還等內容,根據信息實施管理,不具有主動性,也未為讀者提供個性化服務。所以,為了能夠實現智能化圖書管理,管理者應積極摒棄傳統服務理念,要提高對讀者實際需求的重視程度,從以前簡單的檢索信息方面進行創新,讓圖書館的服務更加多元化。從圖書日常管理中工作來看,檢索與借閱圖書的各個環節中產生大規模的數據。要想對讀者閱讀習慣及愛好等情況進行準確把握,只是分析這些信息還是不夠的的。針對這種情況,圖書管理業務的開展要與數據挖掘技術相結合,加大對數據的深層次挖掘力度,這樣圖書館才能全面掌握讀者的需求與愛好,便于有針對性地開展服務,讓讀者需求得到滿足。
3.2.1 借閱行為模式與讀者群分析
(1)孤立點分析:從讀者群實際情況出發,關注其借閱特點與個性化需求,對借閱歷史進行研究,評價圖書的受歡迎度[7];(2)聚類統計:從讀者情況、借閱記錄數據等出發,確定讀者借閱行為和群體特點,發揮聚類數據的作用,進一步挖掘其行為規則和模式。(3)敘述統計:對讀者、圖書借閱率等進行分析,準確劃分讀者群體,為推出相關業務服務創造條件。
3.2.2 個性化服務工作
(1)關聯規則分析:對相關信息之間的關聯進行深入分析,歸納總結出讀者借閱習慣,判斷讀者實際需求,有利于從各種讀者群體特點出發,保證圖書服務更具針對性[8]。(2)時間序列分析:全面掌握讀者各種圖書借閱的時間、順序等信息,這樣有利于了解其圖書借閱習慣,便于在適當時間精準推介相應圖書。此外,在時間分析后,也便于對圖書的安排更具科學合理。
3.2.3 文獻排架管理方面
為提高圖書管理水平,需要提高對文獻排架的重視程度。以數據挖掘技術為支撐,透過一系列數據了解圖書借閱、群體閱讀及受歡迎的圖書等情況,從而對圖書資源進行整和,確保圖書資源充分發揮自身價值。
立足于圖書管理過程中所產生的各種數據,確定挖掘對象為借閱行為分析、個性化服務分析和文獻排架分析,如圖1為圖書管理數據挖掘層次結構[9]。對于圖書管理而言,數據挖掘可分為三個層次結構:(1)第一層是數據預處理模塊層:以圖書管理數據庫為對象,開展轉換與集成處理各數據,在數據處理結束后必須盡快保存,豐富圖書管理數據挖掘庫;(2)第二層是管理規則挖掘算法模塊層:將數據庫確定下來,按照一定挖掘算法對圖書管理中形成的數據進行挖掘;(3)第三層是模型可視分析模塊層:圖書管理可視化操作界面,主要分為圖書借閱行為分析、圖書管理個性化服務分析和文獻排架分析等內容,需要采取深層次挖掘措施。將圖書管理挖掘任務的具體參數確定下來,挖掘結束后進行數據處理,在輸出過程中必須滿足科室模式規則的要求,如圖1。

圖1 圖書管理中數據挖掘的層次結構圖
在信息化時代中,數據挖掘技術在組織、分析、統計與深入挖掘信息數據等方面發揮著不可替代的作用。為了能夠積極適應信息時代背景,圖書館領導及職員應真正意識到數據挖掘技術的重要價值,主動學習與利用數據挖掘技術,盡快成長為信息管理專家,加快圖書館信息化建設進程,為廣大讀者提供個性化、優質的服務。