梁雪
摘要:大數據時代的到來,給圖書館的服務帶來了更大的挑戰和機遇。圖書館應該正確對待大數據時代帶來的這些機遇和挑戰,合理地進行圖書館海量文獻信息資料資源收集,改變圖書館的服務理念和服務方式、不斷完善圖書館的服務功能、拓寬圖書館服務的范圍、重視圖書館創新人才的培養。
關鍵詞:高校圖書館;大數據;數據庫
一、大數據環境下高校圖書館數據庫的建設方式
(一)數據庫的數據標簽建設
因為圖書數據庫所存儲的數據量過于龐大,當務之急就是如何能使學生們進行快速地查詢,主要的解決方法就是建設數據標簽,數據標簽是數據庫中最小最基本數據單位,但它的存在是不可或缺的,其主要有3種職能:第一,能對資源進行查詢;第二,將數據進行有效地定位與劃分;第三,幫助客戶得到自己想要的資源。不僅如此,還具有可覽性、普遍性、可檢性這三種主要功能。在設計數據標簽的過程中時,應該使其與數據庫的特征結合來考慮,而在標簽的內容中,需要包含與數據有關聯的類別、關鍵詞、內容簡介、出處、來源等信息。
(二)數據庫的子節點建設
在進行建設數據標簽后,還需要對子節點進行建設,子節點能使大數據庫更加充實,每一個高校圖書館即會被建設為一個子節點單位,即為子數據庫,然后將這眾多的子數據庫合并起來,就會由此而形成一個完整龐大的數據庫網絡。
(三)數據庫的系統建設
大數據庫有著以下眾多獨特的優點:容錯性、可伸縮性、可拓展性、高性能等等。在完成大數據庫的建設之后,會使其容納十分龐大的數據量。又因為數據結構不同,因此也會存在有一定的差異,又由于大數據兼容能力強,所以它能歸納眾多的各異的數據。除此之外,子節點、用戶、虛擬數據中心都是大數據庫系統的組成部分正是有了它們的存在,才能使大數據系統穩定地運行下去,而用戶的主體主要是高校學生。子節點如上文所述。
二、大數據下圖書館數據庫建設的作用
現代圖書館模式的變化歸根結底要歸結于信息技術的飛速發展。現代信息技術能夠支撐信息的高效整合,對信息的搜集、整理、加工、索引、調用等都能夠提供技術支撐,實現圖書館的自動化、智能化、網絡化等,使得現代圖書館能夠成為收集、傳播、共享各種載體文獻信息的機構,也成為社會信息交流的重要組成,這就是現代圖書館的作用所在。
數據庫對于現代圖書館而言不可或缺,是圖書館的關鍵所在。對圖書館而言,數字技術帶來技術支撐的同時,也帶來了讀者更為多樣與多層次的要求,挑戰與機遇并存。數據庫的建設能夠很好地滿足現代讀者的需求,數據庫實際上是呈現給讀者一個巨型的信息整合資源。通過數據庫,不僅可以查詢到單一的文獻,還可以通過知識點的聯系來實現信息鏈、信息模塊的文獻搜集,能夠高效滿足更多樣、更多層次的信息資源需求。
數據庫技術是整合信息的核心,通過文獻集合與關聯來實現文獻的信息流,使得分散雜亂的信息數據成為邏輯相關的文獻信息,能夠對數據進行有層次的、系統的、有序化的挖掘。用戶通過數據庫對信息流的調用,能夠呈現出與傳統圖書館眾多不同的服務,為讀者提供更多個性化的需求服務。數據庫是現代圖書館的核心支撐,不斷加強數據庫的建設及維護,對更多的數據實現數字化,并對信息數據深入挖掘,這是數據庫建設的核心。
三、我國現代圖書館數據庫建設的目前狀況與挑戰
(一)圖書館數據庫建設的目前狀況
至今,我國現代圖書館理念與數據庫建設歷經了30年,起步晚但發展快。從1985年起,我國走借鑒之路開始了數據庫的建設。歷經起步階段的學習借鑒、發展階段的自建和研究、成熟階段的快速發展,我國數據庫建設已經具有相當規模。1999年9月,我國網上信息資源和應用數據庫達到4,400多個,而據2005年2月中國互聯網信息中心的調查,我國在線數據庫已達30.6萬個。
圖書館數據庫建設不僅表現為規模擴大上,更表現為數據庫型更為深刻的飛躍。從最初的用戶只能查找到一定的信息發展到可以直接向用戶提供原始的資料和具體的數據,也就是完成了指南型到源數據庫類型的轉變,也是書目類型數據庫到全文、數據等類型數據庫的轉變。從數據載體形式來看,最初的數據庫以光盤為載體,現今均以網絡下的網絡型、多媒體型、甚至如今的鏡像型數據庫類型。從數據內容來看,學位論文數據庫、會議論文數據庫等各種專題數據庫與特色數據庫的深入建設,不僅極大地豐富了數據庫的內容,更為重要的是系統地完整地完善了圖書館數據庫系統。
(二)圖書館數據庫建設存在的問題與挑戰
首先,如上所述,我國的文獻服務數據庫類型分為高校圖書館系統、公共圖書館系統以及科技系統,三個服務群體鼎足而立。我國圖書館數據庫建設仍然處于建設時期,還沒有完全形成一個完備的體系。三大體系在建設過程中由于建設管理的不同,建設目的的偏差,造成溝通與協調不夠,在建設初期就沒有進行很好的整合規劃。在各自為政的數據庫建設后,我們就不難發現我國現有數據庫的一些弊端:規模小、內容少、結構單一、不成體系、專業涵蓋不夠。事實上,很多這樣的數據庫只能滿足自用,很難上網實現共建共享。宏觀政策的缺失與行業規范的缺乏,造成數據庫開發盲目進行、各自為政。但是,我們看到,互聯網的普及使得資源共享成為時代需求,數據庫的整合與三大系統的共享成為必定趨勢。
其次,數據庫缺乏規范,難以共享。要實現兩個數據庫的信息共享,需要內容存儲的格式與檢索標準這兩項最為基本內容的一致。但是我們看到,一方面,現行數據庫管理系統的多而雜、難以統一,基于數據庫管理系統的諸多子系統,諸如標引、檢索、操作等都是多種多樣,沒有統一的規范與表征。其分編、檢索點等也沒有統一的質量制約。另一方面,數據的錄入標準缺失直接造成了數據庫中原始數據格式、字段多樣,對于數據流的處理手段差別更大,顯現出不完備、不準確的漏洞。這就直接導致了數據庫之間難以兼容,限制了數據之間數據信息的共享。
參考文獻:
[1] 王捷.大數據時代下圖書館開展信息服務的對策[J].現代情報,2013(3)
[2] 朱靜薇.大數據時代下圖書館的挑戰及其應對策略[J].現代情報,2013(5)
[3] 姜山.大數據對圖書館的啟示[J].圖書館工作與研究,2013(4)