胡金艷

摘要:隨著數字化圖書館建設規模的不斷擴大,數字化圖書館在為讀者提供廣泛的數字信息資源的同時,也由于信息資源的無序性、開放性等特點增加讀者的搜索難度,因此基于數據倉庫技術的應用對提高數字圖書館資源整合、提高決策科學化具有重要的意義。本文以數據倉庫技術在數字化圖書館中應用的必要性作為切入點,闡述數據倉庫技術在圖書館應用設計的具體對策,以此提高數字化圖書館的資源價值。
關鍵詞:數據倉庫;圖書館;應用設計
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1007-9416(2017)05-0134-02
基于互聯網技術的不斷發展,高校數字化圖書館建設規模不斷提升,數字化圖書館為師生提供了廣泛的數字化信息資源,提高了信息資源的利用率,然而數字化圖書館信息資源龐大,而學生對于信息資源需求不同,因此容易形成異構數據,不利于資源的最大利用,因此本文基于數據倉庫技術,提出構建數據倉庫圖書館工作模式,以此提高數字資源的利用價值。
1 數據倉庫的概述
數據倉庫就是面向主題的、集成的,隨時間變化的,非易失性的數據集合,用于支持管理層的決策過程。數據倉庫技術的產生可以將分析決策所需要的大量數據從傳統的操作型環境分離出來,從而將分散的、難以訪問的數據轉化為統一、隨時可用的數據存儲環境。因此數據倉庫呈現以下特點:面向主題性,數據倉庫主要是從人們所關注的主題入手,將數據按照主題進行分類;集成性,數據進入數據倉庫之前需要對數據的一致性進行分析與判斷,保證數據倉庫內的信息完整一致;相對穩定性,一般數據倉庫的數據不會被修改,并且能夠得到長時間的保存。
由于數據倉庫的數據主要來源于多個數據庫平臺,因此需要根據用戶的需求對數據進行選擇處理,以此將處理好的數據存儲在已經建好的數據倉庫中,一般數據倉庫系統主要包括:數據來源、數據存儲與管理、數據分析工具以及用戶四個部分。
2 數據倉庫技術應用在數字化圖書館中的可行性
數字化圖書館信息服務具有高度集成特點,信息資源豐富,讀者需求差異明顯,因此如何將豐富的數字化資源準確的提供給讀者,滿足數字資源的高效利用是圖書館建設的重要技術問題,而數據倉庫擁有的信息處理能力和內在穩定性為數字化圖書館建設提供了技術支撐,因此將數字倉庫技術要應用到數字化圖書館建設中具有切實意義:
(1)數據倉庫技術具有面向主題的信息組織,能夠根據數字化圖書館將多樣的數據轉化為容易被讀者所理解的語義,以便更好地為讀者的檢索能夠便利。例如通過數據倉庫技術的處理,可以將不符合學生檢索需求的信息排除出去,提高學生檢索信息的效率,從而提高圖書館數據資源的最大利用,實現查詢結果的準確性。
(2)數字化圖書館建設的目的就是為讀者提供信息資源服務,而數據倉庫技術為數字化圖書館在提供信息服務時提供穩定的系統支撐。以數據倉庫技術的穩定性為例,由于數字化圖書系統需要涵蓋大量的信息資源,同時還需要不斷引入新的信息資源等,基于不同讀者的需求,要求系統要具有穩定的操作性,尤其是對于數據信息不能隨意的修改,而數據倉庫技術則有效的保護了數據資源的不被修改,從而為讀者提供了準確的數據信息。
(3)數據倉庫技術有助于提高數字化圖書館的戰略決策的科學性。信息化背景下,數字化圖書館不僅要注重數據信息資源,還必須要注重服務質量以及科研工作等,尤其是在信息資源傳播途徑不斷豐富的環境下,高校數字圖書館必須要在決策上、管理上創新,要利用完善的數據信息,對決策進行優化,提高服務質量。
將數據倉庫技術應用到數字化圖書館中需要解決好以下關鍵技術:聯機分析處理技術,元數據,數據挖掘技術。
3 數字化圖書館數據倉庫技術設計的策略
數據倉庫技術在數字化圖書館中的應用對提高數字圖書館資源利用率,實現圖書館服務具有重要的作用,因此基于數據倉庫技術的數字化圖書館設計主要包括以下方面:
3.1 數字化圖書館數據倉庫概念模型設計
圖書館書數據倉庫是按照主題進行數據組織的,因此在具體的設計中需要明確以下兩個方面:一是界定系統的邊界。系統邊界的界定主要是明確讀者的閱讀規律、文獻信息的閱讀狀況以及讀者信息資源閱讀的傾向,因此數據倉庫的構建需要以下數據:讀者的基本信息、數據信息的基本信息以及信息資源的瀏覽數據。數據倉庫具有主題性,因此數據倉庫的主題包括,讀者、文獻信息以及讀者借閱;二是明確系統的主題。根據上述說明,信息文獻是數字圖書館建設的基本要素,也是圖書館的基礎。讀者是數字圖書館參與的重要主體,尤其是在網絡環境下數字圖書館服務模式由以“文獻”為中心轉化為以“讀者”為中心。基于數據倉庫系統邊界及主題的確定,數字圖書館數據倉庫概念模型見圖1所示。
3.2 邏輯模型設計
邏輯模型是整個系統設計的基礎,在該模型的設計中需要對數據倉庫實體進行定義,這主要基于在設計的過程中每個維度實體之間存在一定的交錯現象,因此為了降低因為維度不同而造成的空間浪費現象,需要對實體進行統一的定義,以此達到系統的最優化設計。
3.3 物理模型設計
物理模型是數據倉庫最底層的數據模型,可以直接生成物理數據庫。它是邏輯模型在數據倉庫中的實現,包括數據的物理存儲方式、存儲結構、存儲位置和存儲分配等。
3.4 數據倉庫的實現
實現數據倉庫需要解決好以下流程:首先是解決數據倉庫與業務處理系統接口集成問題,實現數據倉庫系統的多元化問題;其次構建完善的數據倉庫體系結構,實現邏輯模型和物理模型的優化,保證構建的數據倉庫與設計方案相一致;三是對數據倉庫數據進行加載處理,實現了系統的最優化運行。
4 實現數字圖書館數據倉庫設計的注意事項
首先數字圖書館數據倉庫設計必須要獲得高校管理的支持,其次加強與讀者的溝通交流。數字圖書館的功能就是為讀者提供個性化的信息服務,如果圖書館所提供的信息資源不能滿足讀者的信息需求,數字圖書館就失去了存在的意義,因此在數據倉庫設計前必須要對讀者的信息需求以及服務模式等進行調查,加強與讀者的溝通。
總之,基于互聯網技術的發展,數字化圖書館在高校教學中的應用越來越重要,與此同時,數字資源的廣泛性也增加了圖書館服務功能的完善程度,尤其是對于數字圖書館數字資源的優化配置的影響,而數據倉庫技術則為數字化圖書館提供了基礎技術支撐,有效的對數字資源進行合理配置。
參考文獻
[1]張宏武.數據倉庫技術在高校圖書館中的應用研究[J].渭南師范學院學報,2011(12):80-84.
[2]李康.圖書館網絡綜合布線的理念與設計實施[J].新疆師范大學學報(自然科學版),2011,03:91-93.endprint