李玉瓏
【摘 要】在互聯網時代,圖書館信息資源快速增長,圖書館實現信息化管理成為必然趨勢。數據倉庫是一種能夠優化圖書館信息資源的技術,能夠為讀者提供更加個性化的服務。數據倉庫在圖書館信息資源中的關鍵技術包括聯機分析處理技術與大數據挖掘技術,能夠從不同角度、不同層面。不同緯度來實現對圖書館信息資源的高效管理,為讀者提供更加理想的服務。
【關鍵詞】數據倉庫;圖書館;信息資源
【中圖分類號】G250.73 【文獻標識碼】A 【文章編號】1674-0688(2018)07-0154-02
圖書館要為讀者提供更加完善的服務,就需要實現信息資源整合。圖書館信息資源整合是針對分散異構信息資源體系,在新信息交換與共享平臺上開發新的應用,從而實現信息資源利用的最大化。圖書館信息資源整合是將分散異構的非結構化數據、異構的結構化數據進行管理利用,將其集成為不同應用系統,為所有者提供更加高效的資源管理。而數據倉庫技術則可以為圖書館信息資源整合提供堅實的技術支持,為優化圖書館服務質量、提升圖書館資源利用率提供幫助。
1 數據倉庫與圖書館信息資源
1.1 數據倉庫
1991年,W.H.Inmon編著的《Building the Data Warehouse》中將數據倉庫進行了以下定義:一個用于更好支持組織決策分析的,面對需求的、綜合的、穩定的,伴隨時間不斷變化更新的數據集合,主要用于支持管理決策。數據倉庫的特點主要表現在以下幾個方面:第一,數據倉庫中的數據是有主題的,其是將數據在高層次上進行歸類后進行分析利用。數據被儲存在數據倉庫前需要進行一定的加工處理,將原始數據根據主題來進行轉變,以貼切主題需求。第二,集成性。數據倉庫中的數據將分散的不同系統中的數據進行選擇、轉換后進入數據倉庫,數據倉庫中的數據是源數據的綜合與統一。第三,更新性。數據倉庫會伴隨著時間段變化不斷更新數據和內容,長時間不用數據也會被刪除。第四,相對穩定性。數據倉庫雖然會伴隨著時間的推移更新數據,但是其卻具有相對穩定性。相對穩定性主要是供數據倉庫決策人做出決策所使用。相關決策人員可以利用數據倉庫進行數據查詢,通常不會對數據進行修改。當某類數據進入數據倉庫后會被長時間保留,在一段時間后該數據會被相關規則轉變為歷史數據,從數據倉庫轉移到存儲設備中。
1.2 圖書館信息資源
圖書館信息資源整合主要作用體現在以下幾個方面:第一,提供決策支持。在經過一系列的信息資源整合后,各類數據信息再也不是無邏輯的分散信息,而是通過系統的提取、歸類、轉化形成了網絡型關系信息。例如,通過綜合報表、定制信息等方式,為圖書館決策提供了全面而精準的決策依據。第二,改善當前信息系統效能。在經過系統的信息資源整合后能夠實現工作人員與應用系統之間的協同工作,利用當前信息資源,改善數據的利用率,為圖書館管理員個性化管理提供充足信息,從而提升了信息系統效能。
2 數據倉庫在圖書館信息資源中的運用
2.1 圖書館信息資源整合與數據倉庫應用的必要性
隨著互聯網時代的來臨及信息技術的廣泛應用,圖書館中的各類信息資源類別在持續增加。不僅紙質文件得到了快速的增加,磁帶、光盤、電子期刊、電子圖書、互聯網資源、網絡數據等各類媒介的圖書資源也在持續增加。同時,圖書館收藏的一些傳統文獻也添加了不同輔助信息為讀者提供該服務。例如,出版商在提供一般文獻的過程中還會適當提供相關題庫信息,為讀者提供更加豐富的服務。在信息資源建設方面為了獲得更加顯著的競爭優勢,有的圖書出版商推出了各類圖書資源特色服務項目,如新書推薦系統、教師選書系統等。這些圖書資源特色服務項目不僅大大提升了圖書館館藏建設,還使得圖書館的電子資源更加豐富。但是在圖書館電子資源的實際應用過程中,通常電子信息資源都處于相互獨立的狀態,檢索系統也相對獨立,這給讀者檢索帶來了一定的困難。讀者對圖書館中的數據資源分類不熟悉,為了找到既定文獻,讀者必須進行多次重復搜索,大大降低了圖書館信息資源使用效率。
基于這一現象,為了使得圖書館更好地服務讀者,可以將異構數據庫中的數據進行整合,對海量信息進行深層次開發,將信息資源進行整合,進一步強化信息資源組織處理能力。首先,可以利用數據倉庫技術,通過多層次、多渠道來進行數據的收集,將采購歷史數據、信息資源流通數據等進行整理收集,通過計算機互聯網分析處理及數據挖掘等數據倉庫技術,為圖書館信息資源的采購和整理提供更加高效的決策。其次,在數據倉庫技術的基礎上為讀者提供更加便捷、更加快速的檢索服務。對于讀者來說,圖書館所館藏的資源信息內容繁雜、類型眾多,不僅涵蓋了大量的紙質書籍,還涵蓋了互聯網中的海量信息。而數據倉庫運用聯機分析處理技術,直接面向主題,利用圖書館信息檢索服務,根據用戶的需求直接提供與主題相關數據,從而提高信息檢索服務效率。同時,利用數據倉庫技術還能夠為讀者提供個性化的服務,可以針對讀者的瀏覽歷史記錄進行分析,對讀者進行類別甄別,為讀者推送感興趣的、潛在的數據資源,為讀者提供個性化的服務。
2.2 數據倉庫在圖書館信息資源中的關鍵技術
數據倉庫在圖書館信息資源中的運用涉及多種類型的關鍵技術,不同技術可以為圖書館信息資源整合提供不同的幫助。
2.2.1 聯機分析處理技術
聯機分析處理技術是一種軟件技術,能夠使圖書館工作人員快速、多方面地獲取信息,從而達到深入理解數據的目的。獲得的信息數據都是從原始數據中處理得來的,以用戶最容易理解的形式來體現圖書館經營的真實情況。聯機分析處理技術中的絕大多數策略就是將數據進行多維存儲,以便進行聯機分析處理。這類多維數據庫主要是沿著不同維度方向來進行數據產出,能夠讓用戶按照事物發展的軸線有邏輯地對數據進行分析。聯機分析處理技術是數據分析技術的一種,其功能特點主要表現在以下幾個方面:第一,快速。用戶對聯機分析處理技術的反應速度有較高的需求,通常需要在很短時間內做出反應,滿足用戶需求。第二,可分析性。聯機分析處理技術能夠快速處理與邏輯分析、統計分析相關的事物。在聯機分析處理分析中,用戶不需要進行編程就可以重新計算,將其稱為分析的一部分,并以用戶的需求為準給出相關報告。第三,多維性。聯機分析處理技術中的多維性十分關鍵,能夠提供數據分析后的多維視圖及相關分析,是圖書館利用聯機分析處理技術的核心。第四,信息性。不論數據量多么龐大,也不論數據存儲在什么地方,聯機分析處理技術都可以快速獲取信息進行管理。在圖書館信息資源中,聯機分析處理技術的運用方式主要包括3種,分別為切片、鉆取及旋轉。其中,切片即在多維數據結構中根據用戶的需求進行二維切片或三維切塊,以獲得相關數據;鉆取即轉變數據報告方向,例如進行行列交換來獲取數據;旋轉就是轉變維度層次,通過上鉆取或下鉆取的方式來獲取數據。在圖書館信息資源應用中可以從時間維度及讀者類型維度2個方向對借閱量進行切片;也可以從時間維度、讀者類型維度、借出數據維度來對借閱量進行切塊。整體來說,聯機分析處理技術是數據倉庫應用在圖書館信息資源中的關鍵技術之一,能夠實現多維度訪問數據,多角度分析數據,往往在圖書館信息資源中與數據挖掘技術一同運用。
2.2.2 數據挖掘技術
數據挖掘技術即從海量數據中挖掘獲取有價值的信息,數據挖掘技術能夠對海量數據進行分析,從而獲取數據之間存在的隱藏聯系,為用戶決策提供依據。數據挖掘技術綜合運用了統計學、計算機學、數學等技術,可以通過一系列方法來實現。例如,傳統統計法運用數據挖掘技術進行抽樣分析,在用戶需求指導下進行合理抽樣,在獲得抽樣數據后進行多元統計分析或統計預測,利用因子分析、回歸分析、時間序列分析等方法進行。對于圖書館來說,數據挖掘技術能夠提高圖書利用率的相關問題。在讀者所處環境及圖書價值始終保持不變的情況下,對讀者以往的借閱歷史進行挖掘,以判斷讀者未來可能出現的借閱率,挖掘出各類讀者對不同類型圖書的需求,進而利用最終挖掘得出的數據結果來引導讀者選擇合適的圖書資料。
3 結語
圖書館信息資源整合中的數據倉庫技術能夠充分實現信息的挖掘與利用,還能夠與其他應用系統一同融合,實現圖書館數據庫的拓展。在未來的發展中,圖書館數據倉庫技術將會成為圖書館信息資源整合、自動信息化發展的必然趨勢。
參 考 文 獻
[1]韓璐.基于數據倉庫的數據挖掘技術在高校圖書館管理中的應用[J].科學家,2016(15):77-78.
[2]公立.數據倉庫和數據聯邦技術在信用信息資源存儲和共享上的比較[J].科技創新與應用,2017(5):97.
[3]呂欣.數據倉庫與數據挖掘在圖書館決策管理中的應用[J].數字技術與應用,2017(6):89.
[責任編輯:陳澤琦]