張大勇
(湖南城市學院圖書館,湖南 益陽 413000)
在云計算、物聯網等技術的推動下,世界已經進入了一個“大數據”時代。如何有效地利用大數據成為政府公共管理和企業界共同關注的問題,但這些數據集的規模往往超出數據處理者的能力。圖書館主要工作為實踐,研究和教育。以最大限度地利用人類的知識,促進專業的交流為責任。圖書館職業無法離開專業知識和信息,影響人類社會的可持續發展。數據是圖書館藏書的重要組成部分。數據作為原始類的產品,可以加工、整理、分析,最后提煉成人與人之間的生產和生活中發揮更大作用的信息和知識。因此,大數據主題是圖書館行業內應當研究的問題,展示了圖書館界在信息社會求生存,謀發展能力的提升。本文旨在討論大數據時代下,圖書館與大數據相關的研究內容、發展存在的問題以及總體發展趨勢。
圖書館已有的研究中有文獻計量學等和大數據有關。研究人員為了促進信息科學與社會科學的進步,通過大型網絡規模的收集獲得數據和分析數據得出相關結論來實現目標。由于大數據技術的應用,傳統的文獻計量學的研究從過去只有簡單的描述性研究擴展到評估和預測的研究。圖書館學研究人員參與了很多相關的項目,例如,新西蘭的奧塔哥大學的圖書館承擔了研究數據管理項目的任務,在麻省理工大學設立項目研究圖書館數據存儲、需求分析數據的管理,和傳播數據,并完成數據收集保存標準的制定工作。烏里韋和麥克唐納在認為數據監測工作將從傳統的信息技術受益。Huwe 建議采取政治手段,以促進圖書館和數據中心的發展,他認為高等教育機構應該認可圖書館對學術研究的支持。通過分析2008 非常流行的“數字化監控中心的生命周期模型”,希金斯提出,圖書館的“數據保留計劃”的生命周期可以被納入其數字機構庫文件管理實體。此外,美國學者對館員在大數據環境中的作用和專業知識進行了調查,他們一致認為圖書館可以在大數據時代承擔數據管理職責。謝菲爾德大學還安排了基礎的信息學專業課程。2011年6月倫敦國際監護教育論壇投入使用的,也給數字監控領域的發展提供了一個機會。
國內目前的相關研究課題還處于剛起步的狀態,CNKI 與該主題相關的文章也只有寥寥幾篇。相比之下,國內對“數據監護權”的關注度更高這,主要是針對大學圖書館在這個專業領域展開更多的研究。這方面的論文在2012年之后有一個井噴式的增長,但總體來說,國內相關文獻還相對較少,研究項目也幾乎沒有。
在數字化時代,數據處理更容易、更快。圖書館的數據資源種類多、數量大、形式多樣。截至2008年底,CALS 的文檔數據量達到180T,2010年底的國家圖書館數字資源總量達到480 T。目前,國家博物館進行維護之后,數字圖書館的非結構化數據的存儲容量將非常大。總數字資源工程也達到108TB。由此看來,圖書館的數字資源總量已聚集為一個大的數據集。再次,圖書館自動化服務水平已發展到了一個新的階段。此外,用戶服務信息每日激增,用戶對服務的要求越來越高,圖書館要根據用戶的服務信息,做出相應的調整。因此,根據各自限定的環境和條件,從大量的數據分析中挖掘出用戶當前和未來的需求都非常迫切。
目前,隨著科學技術的不斷發展,傳統的紙質圖書館向電子、數字圖書館的轉變,因此圖書館服務的性質已經發生了很大的變化。傳統圖書館是點對點的服務,而目前數字圖書館已經成為綜合性服務,服務的風格和方法等方面都發生了很大的變化。在服務理念上,數字圖書館是基于數據服務的基礎上,在大數據的基礎上,從數據采集,智能服務,提供綜合服務,創新了服務模式。在大數據時代,數據資源是豐富的,每個圖書館可以利用網絡來收集大量的數據資源,基于資源共享提供各種數據管理的資源之間的無縫連接。
在大數據時代背景下,競爭已經不再是一個簡單的數據資源所有權的競爭,而是在數據的結構以及類型上、數據的開發以及利用上的競爭。從圖書館的角度來看,它是在大數據背景下,為了避免自己被邊緣化,就必須分析數據,來進行相關的數據分析服務。分析數據庫業務有以下幾個方面:首先,圖書館需要建立自己的大數據分析,數據分析通常在現有的數據,如讀者愛好的書籍等。另外是對讀者的分析,這類似企業和其他客戶群體參考提供的數據分析、競爭情報分析,但也有很大的區別,不同之處在于數據分析對象、用于數據分析和數據分析的目的等。對于這樣的數據,可能不會被圖書館所擁有,所以它必然成為在這個行業發展的瓶頸限制,我們應該想辦法解決這些問題。
[1]劉瓊.大數據環境下圖書館面臨的影響與挑戰[J].理論觀察,2013(8):112-113.
[2]孫琳.大數據時代圖書館服務體系創新研究[J].理論觀察,2013(4):99-100.
[3]李立.大數據在數字圖書館中的應用分析[J].高校實驗室工作研究,2014(3):35-37.
[4]李白楊,張心源.數字圖書館建設中大數據問題初探[J].情報科學,2013,11:26-29.