何楊琦
摘 要:大數據現已影響到各行各業,它的到來對高校圖書館的數字化建設不只是機遇,還有挑戰。本文概述了大數據技術和高校圖書館之間存在的內在聯系,并分析了大數據背景下高校圖書館的數字化建設問題。
關鍵詞:大數據;高校圖書館;數字化
中圖分類號:G250.72 文獻標識碼:B
當下社會信息技術正在持續迅猛地發展,大數據時代已經到來,其明顯表現就是新型的數據不斷地涌現出來,數據量正呈現爆炸式增長。
高校圖書館是公共信息體系中的重要組成部分,也在緊隨時代的腳步進行數字化改革建設。
大數據對于高校圖書館進行數字化建設來說不只是挑戰,更是機遇。二者之間存在兩方面的內在聯系:首先, 大數據背景下的有關技術能為圖書館數字化建設提供必要的幫助;其次,圖書館的數字化建設可以為大數據的相關研究提供經驗和應用的空間。
一、大數據和高校圖書館數字化建設之間的內在聯系
到目前為止,作為一項逐漸顯現出強大功能的技術,我們還沒有對大數據做出一個準確的解釋,不過通過對不同概念進行分析,我們得出了一個共識——大數據技術就是從各種不同類型的數據中迅速地檢索到自己所需的有價值的信息的能力。
高校圖書館的主要作用是為高校教學以及師生的科研任務提供幫助,其是實現高效信息化的主要載體,在高校的發展進程中起著不可替代的作用。
高校圖書館要想為了使自己保持與信息社會發展同步,就必須開展數字化建設。
二、高校圖書館在大數據背景下數字化建設的建設思路
接下來,筆者將從技術發展、資源建設、服務升級三個方面論述高校圖書館在大數據背景下進行數字化建設的思路。
1.技術發展
(1)當今的數據量已經由TB級升級到了PB級,并還在迅猛增長。有調查顯示,2015年世界上最大的數據倉庫中存有的數據量已經將近100PB。但它對信息的存儲能力還不能滿足數據快速增長的要求,因此迫切需要開發一種新型的分布式數據庫。
(2)傳統意義上的圖書館中的數據均為結構化數據,在實現數字化之后,圖書館還擁有了非結構化數據,比如圖片、視頻等多媒體數據。非結構化數據的增長速度明顯高于結構化數據,截至2012年,非結構化數據已經占到了互聯網數據量的76%以上。在這種背景之下,關系數據庫已經不能滿足時代的需求。
(3)處理數據的快捷性。用戶在數字化圖書館中能夠得到即時服務,可以隨時閱讀或者下載信息。
而大數據技術要求的也是數據處理的快捷性,數據處理的時間顯著縮短,比如300GB的數據只需1秒鐘就可以處理完成。
(4)大數據時代下需要對數據進行精簡和挖掘,最近幾年數據挖掘、數據倉庫等技術的快速發展為高校圖書館的發展提供啟示,那就是著重發展對大數據的數據挖掘以及分析。高校圖書館只要能在大數據中發現潛在規律和價值,就能夠從根本上提升智能化服務水平。
2.資源建設
高校圖書館在實現數字化之后,不要只把資源建設當作自己的服務基礎,還要把它當作建設自身的核心所在。資源建設過程中需要大數據技術的強力支持,進而幫助能豐富數據資源的內容和種類,完善數據資源的結構,重點發展原生資源、領域資源以及特色資源,并積極實現資源的共享。
(1)發展原生資源——高校本身在平時的教學和科研過程中發表的各種類型的、各種用途的文獻。原生資源是高校學術水平的集中體現,它集中了學校老師的所有科研成果。原生資源的利用價值高,而建設成本低,因此在高校圖書館數字化建設中具有一定的優勢。
(2)建立自己的特色資源——這是高校圖書館保持本身特色的根本所在。在當今的大數據背景下,圖書館無需將所有館藏數據都進行數字化建設,而應該根據本館的館藏優勢及特色,重點對特色的學科進行數字化建設,因地制宜,才能做得更好。
(3)建立各圖書館之間的資源共享機制——只有保持合作共享,才能夠滿足用戶日益增長的數據需求,才能夠在數據爆炸的時代背景下不被淘汰。因此,各高校圖書館之間要建立互通有無的合作式發展關系。
3.服務升級
數字化圖書館的核心服務價值在于滿足客戶的以下要求:①用戶對高質量數據資源的需求;②用戶能夠迅速方便地檢索到所需信息;③對用戶關注的信息要持續跟蹤并推送給用戶。大數據技術的發展使得數字化圖書館能更好地解決以上三個問題,通過提供智能化服務和個性化服務,推動圖書館服務水平的提升。
三、圖書館數字化建設可行性建議
目前還處于大數據技術的初始階段,各項理論以及實踐技術有待完善。高校圖書館要想在大數據時代做好數字化建設,需要未雨綢繆,做好前期的準備工作。
1.建立數字資源的整合平臺
為了滿足新時期用戶快捷、方便的數據需求,摒棄以往復雜的檢索方法以及檢索界面給用戶帶來的諸多不便,高校圖書館首先要建立起一個統一檢索的數字資源平臺,為讀者用戶提供一站式的服務,并實現數據查閱的快速、聚類呈現、無重復以及多角度。
北京大學圖書館已經建立了一套“未名學術搜索”系統,這為建立整合平臺提供了探索經驗。
用戶通過使用該系統,能快速地檢索到本圖書館館藏中的所有藏書、論文資源、多媒體資源、電子書資源、期刊等各種數據資源,并向用戶提供所檢索資源的來源、館藏中的存放位置等重要信息。
2.加強整合原生的信息資源
不斷生成的原生數據是未來生活中大數據的重要來源,所以高校圖書館要加強整合原生資源并建立數據庫。
目前的各個數據庫之間普遍存在著知識關聯度低、內容交叉且重復的問題,因此在建立新的原生數據庫時,要做好統一協議,建立一個有利于大數據相互融合、操作性強的標準平臺。
3.建立精確、個性化的推薦系統
根據不同用戶在圖書館中不同的瀏覽網站、鏈接搜索、瀏覽次數以及停留時間,追蹤出用戶不同的興趣以及特征方向,基于此為用戶建立一套精確的個性化推薦系統。
這種系統在大數據時代可用于分析用戶的行為并預測相應的應對方式,其可以為建設大數據提供客觀、準確的參考依據。
高校圖書館是大數據的重要組成部分,也是大數據與人們之間聯系的橋梁。
因此,高校圖書館不能只安心做大數據時代的受益者,更應該在數字化建設中積極探索,作為一個參與者主動參與到大數據時代的發展進程當中。
參考文獻:
[1]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數據”[J].圖書館雜志,2012,(11).
[2]王天泥.知識咨詢:大數據成為信息科技關注新熱點[J].圖書與情報,2013,(2).
[3]朱開忠.圖書館轉型研究[M].北京:人民郵電出版社,2011.
[4]魏 欣,趙 雋,張 敬,等.高校圖書館數字化建設——淺論數字化特色資源的建設[J].圖書館工作與研究,2005,(4).
[5]董秀真,靳艷華.高校圖書館數字化建設[J].醫學信息學雜志,2007,(3).