韓雷
(伊寧市圖書館,新疆 伊犁 839300)
當今圖書館的數字化、信息化、自動化是伴隨著信息通信技術和計算機網絡的高速發展。除為讀者提供豐富的知識庫外,圖書館還需要在浩如煙海的多種信息載體中,有選擇地向讀者提供科學的參考咨詢服務,在資源建設方面實施數據化的信息管理。面對數據豐富而信息匱乏的嚴峻困境,如何從海量的數據信息中挖掘適用于管理者決策的知識至關重要,數據挖掘技術將為圖書館的資源管理、組織和拓展服務范圍、提高服務質量提供科學合理的技術支持。
運用數據挖掘技術對用戶檢索和借閱的館藏文獻進行分析,可以為管理采訪計劃提供有效的決策,通過對客觀真實的數據進行分析,進而預測社會市場需求和未來采訪趨勢。運用數據挖掘技術,對文獻的需求狀況進行探討,最終結合傳統的管理方法,在減少借閱率低的情況下,對陳舊的圖書資源進行清理,科學地提高館藏的利用率,合理地指導圖書采訪任務,盡量減少因主觀因素造成的偏差問題,優化紙質圖書資源的結構。許多圖書館專業人員以數據挖掘技術為基礎,對個性化服務課題進行了深入探索,主要體現在個性化服務模型和軟件的構建上。智能化集成技術能為圖書館提供個性化服務,方便地獲取讀者用戶的愛好和興趣方向;結合知識管理、個性化參考咨詢服務和數據挖掘,形成一個全新的個性化參考服務咨詢模型。此外,在數字圖書館的應用方面,數據挖掘技術能促進數字資源統一管理的規范化,推動信息服務水平的提高,使圖書館數據管理系統分工明確,實現數字資源的集中處理。它可以優化數字資源的館藏結構,實現期刊館藏的合理布局,利用數據挖掘工具的分析和統計功能,使分散的數字資源得到大量實用的信息。利用該技術,還可以在電子數據庫和多媒體資源中挖掘出較為精確的數字資源使用情況,使用戶在獲取數字資源時能夠產生大量的交互信息,對信息檢索技術的應用有著特殊的意義。
圖書館管理工作非常復雜,涉及多方面的信息,面對的是社會各界讀者。所以圖書館的管理工作主要是在圖書館藏書與讀者之間進行。圖書管理包括圖書管理、用戶信息管理和圖書流通信息管理等內容。藏書信息管理主要是指圖書館借閱圖書及注銷、退書的相關信息。用戶信息管理是指圖書館添加、刪除、查詢、更改用戶信息,用戶信息包括用戶的個人信息、查詢信息、借閱信息等。圖書流通信息管理是圖書館的主要工作,主要是圖書的借出、歸還、補償等管理工作,還包括讀者登記管理、流通查詢等工作。這一信息管理模式存在很多問題。現有的信息管理模式都是死板的劃分,不能流暢高效地獲取和共享信息,很難完成信息服務建設。目前圖書館MIS 還缺乏對信息自動化的處理能力,目前的系統大多依靠人工操作,龐大的數據信息很難進行有效的整理和操作,缺乏自動化的處理手段,使得獲取的信息失去應有的實時效果。此外,在信息管理系統中還缺乏決策能力,現有的數據信息無法進行有效的信息分析和規劃未來發展,不能準確判斷信息,影響未來的發展規劃。
圖書館數字館藏資源不僅包含館藏信息,還包含著館藏資源與眾多館藏相關的在線資源,這些資源分布非常廣泛,內容豐富,給圖書館的信息存儲和分析工作帶來不便和困擾。面臨著巨大而繁復的數據信息量,圖書館必須對其存儲方式進行更新,對數據信息進行分類處理,在較高層次上統一描述,保證數據信息的完整性和一致性,符合信息資源管理的標準,以滿足信息服務的要求。數據挖掘技術是一種以信息處理為主的技術,它具有完善的聚類功能,可以將具有相似特征的數據信息歸類為同一類,在圖書館進行數據收集整理時,如果要提高數據的有效性,應合理地利用數據挖掘技術。
收集文獻是圖書館信息資源保障必不可少的一環。大多數傳統信息采購都是通過書店、出版社或期刊社的新書目錄渠道,由專業的館長或館員來決定,也可以由一小部分專家來決定。這兩種方式不能避免有強烈的主觀性和個人偏好,但每年圖書館的文獻購置經費都十分有限,如何利用有限的購買費用,合理地收集多個學科的專業數據信息,最大程度地發揮采集經費的效益。利用數據挖掘技術,通過對圖書館的借閱流通記錄和檢索請求分析,將頻繁借閱集與文獻柜閱集進行分類統計,實現信息采集的目的,補充和完善信息資源。它通過對海量信息資源進行智能服務的表現,為圖書館的讀者服務工作提供不可替代的技術支持,為文獻資源建設提供可靠的決策依據。
圖書咨詢服務工作從館員和讀者實際咨詢發展到數字化網絡虛擬咨詢模式。借助于網絡,讀者不僅可以從專家或咨詢管理人員那里獲取信息,而且可以進入知識資源庫享受自助式服務。構建知識資源庫需要運用數據挖掘技術對歷史數據進行分析,探索隱藏在其中的信息規律,創造出符合用戶需求的深層信息產品。另外,根據讀者的歷史閱覽和咨詢信息,推斷其研究興趣的方向,運用數據挖掘技術為每位讀者提供多種咨詢服務。也能方便咨詢管理人員從大量的信息中為讀者提煉答案,使主動咨詢成為信息服務的主流途徑。利用數學分析法記錄讀者的借閱歷史,從中獲得不同讀者的閱讀傾向,挖掘圖書館每一類書中潛在的讀者信息,然后根據自己的興趣愛好和主要研究領域和方向,逐步把它發展成為一個特定的、穩定的讀者群。
數據挖掘技術是有效的科學決策工具,可為圖書館管理決策提供合理、可靠的依據。綜上所述,在數據挖掘的基礎流程中,可見其以數據存儲技術為基本依托,實現更充足的信息集中。因為數據倉庫能把數字圖書館的所有信息進行匯總,并進行統一處理和加工整理,從而形成信息決策一體化,全面地分析和比較集成信息,從而不僅彌補了信息的缺陷和漏洞,而且可以明顯提高信息決策的可靠性和可行性。為此,將信息挖掘技術應用于圖書館管理,可以最大限度地提供決策支持。通過數據存儲和挖掘技術建立圖書情報機構,能夠形成強大的信息資源優勢,并具有較強的信息分析、濃縮和轉化功能,為信息服務決策提供支持。
圖書館能運用數據挖掘技術,自動處理數字化信息,實現特定場景下數據和信息的自動分類檢索。自動文摘是根據文本分類識別信息的一種方法,并將其分為若干種類型的主題;自動文摘使摘要信息以文本的形式呈現,其基本原理是依靠應用統計方法。怎樣合理、科學地利用圖書館期刊購置費來分配各學科期刊的數量,平衡不同文獻的種類和載體的采購,從而使經費得到充分、有效的使用,是需要慎重考慮的問題。通過數據挖掘技術收集網絡上大量的非結構化、雜亂的非結構化數據,并對其進行詳細的分類,能夠有效地實現期刊的豐富和多樣化。此外,為了提高期刊的流通量,合理滿足讀者和用戶的需要,運用數據挖掘技術分析讀者的借閱和流量狀況,可以優化期刊館藏結構。
運用數據挖掘技術,全面了解用戶的使用需求,根據實際情況制定出科學、規范的數據監護流程和制度,以保證數據監護工作的可持續發展。進行數據處理時,要對數據的價值進行審核,檢查數據的正確性和完整性,以保證最后輸入的信息的有效性。系統數據存儲與備份機制的優化,保證系統的兼容性。同時,圖書館也可以整合不同領域的專家,建立不同學科的數據標準,為數據共享奠定堅實的基礎。并可加大經費投入,針對收集到的資料資料,分析讀者的閱讀需求,根據所得結論加強圖書館建設,為用戶提供更好的閱讀環境。
在資源數字化方面的工作是圖書館必須予以重視的一個方面。推進圖書館數據庫建設,進行高效管理,能更好地滿足時代對圖書館的發展要求。圖書資料庫主要有數字化圖書、數字化期刊和數字化專業文獻。目前,這種數字化數據庫所包含的信息資源是傳統圖書館無法比擬的。通過對信息資源的數字化處理,并將其存入專門的服務器中,用戶可以通過網絡實現對此類信息資源的在線瀏覽。圖書資料庫建立的資料庫應當便于使用。為使用戶能夠更快速、準確地搜索到所需的信息,圖書館可以與供貨商合作,一起對數據庫進行改進,以獲得更加理想的檢索方式。與此同時數據庫也具有記錄功能,可以記錄用戶的搜索習慣和搜索內容,方便用戶的使用。
結束語:在信息化時代,數字圖書館是實現圖書信息共享和傳播的重要途徑和途徑,為大眾的信息需求構建了信息高度整合的有利場所,在信息保存、發布、傳遞、應用等功能上積累了豐富的數據資源,滿足了各類信息需求。在圖書館信息處理自動化任務中,數據挖掘技術占據著重要地位。伴隨著科學技術的日益成熟,鑒于數據挖掘技術的強大功能,圖書館必將展現出更長遠的發展潛力。我們相信,通過數據挖掘技術,能夠使圖書館信息服務的能力和效率實現跨越式的飛躍,進一步滿足社會大眾對信息服務多樣化的需求。