摘 要:大數據時代圖書館信息量劇增,信息再加工難題未解,圖書館數據處理和服務方式將發生變化,需要圖書館制定一個以完善圖書館組織結構、變革組織文化,完善用戶關系管理,加強人力資源建設,引進先進的數據分析技術的應對方案。
關鍵詞:大數據 知識服務 數據分析
一、圖書館進入了大數據時代
1.什么是大數據
IBM公司把大數據的特征概括成三個“V”,也就是規模(Volume),快速(Velocity)和多樣(Variety)。這三個方面是觀察數據本質和軟件處理平臺的有用視角。第一,數據體量巨大。從TB級別,躍升到PB級別;第二,數據類型繁多。前文提到的網絡日志、視頻、圖片、地理位置信息等等。第三,處理速度快。1秒定律。物聯網、云計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,無一不是數據來源或者承載的方式
2.圖書館已進入了“大數據”時代
時代在變化,圖書館也在發生極大的變化。圖書館服務向信息資源數字化、信息傳遞網絡化、信息加工計算機化、信息服務系統化迅猛發展。集現代數字知識資源開發、利用和服務于一體的數字圖書館應運而生,成為全球文化科技競爭的焦點之一。
數字圖書館具有收藏數字化、操作電腦化、傳遞網絡化、信息存貯自由化、資源共享化和結構連接化的特征。自21世紀網絡信息爆炸時代的到來,圖書館中的信息資源總量日益龐大且每天迅速增長。至2008年底,CALIS文獻數據總量達到180TB,至2010年底,國家圖書館數據總量大480TB,全國文化共享工程的數字資源總量達108TB,雖然說每一所圖書館的數字資源總量并未達到PB級,但全國總的圖書館數字資源總量卻是一個龐大的數據集。
二、大數據時代對圖書館的影響
1.現有的信息服務模式不能適應大數據時代的發展
科技環境發生革命性變化,信息技術指數日新月異。隨著互聯網的飛速發展和網絡資源的不斷豐富和充實,圖書館用戶群轉變為數字原住民為主體,他們從出生開始就生活在有互聯網的一代人------在社交媒體的影響下長大,長時間在線,喜歡用手機拍照、看小說、看游戲電影、上微博。當用戶的生活離不開網絡,那圖書館的服務方式也應隨之而變。用戶在線的每一次點擊,每一次評論,每一個視頻點播,每1秒都產生大量的數據;而這些數據包括郵件、圖片、聊天記錄、視頻、音頻等。
信息資源全面實現數字化、網絡化和多媒體化,信息加工處理全面實現計算機化,信息提供全面實現過程化、網絡化,人類從來沒有今天這樣可以如此快捷、方便地訪問豐富多彩的信息資源。然而,在科研環境大變革,信息技術全新發展,人的信息需求開始轉向知識需求的形勢下,現有信息服務模式越來越暴露出它的弊端。以網絡信息為例,網絡信息的特點是無序、多媒體、多語種、多類型、多結構、多垃圾,用傳統的方法根本無法處理,以致“信息淹溺,知識饑荒”、“信息孤島”等問題日益深刻化。人們甚至認為,現代信息服務相對傳統圖書館信息服務而言,只是在速度、效率、數量等方面帶來變化,而人卻為此付出了失去應有的信息服務主角地位的代價。
2.信息的再加工難題未解
隨著數字圖書館的發展和網絡信息的海量增長,人們對信息服務的要求呈現出多樣化和專業化的趨勢。信息需求者迫切需要數字圖書館提供一種能夠滿足個體信息需求的服務,即以用戶為中心,根據用戶提出的明確要求,或通過其個性、使用習慣的分析從而主動提供可能需要的信息和服務。而現有信息服務通常是提供信息源的目錄、文摘或全文,主要是對數據和信息進行采集、數字化、存貯、分類、傳輸、檢索等。通過圖書館書目、聯機檢索、搜索引擎、網上瀏覽等提供信息。至于信息是否有用,則讓用戶用自己的大腦進行信息再加工、吸收提取或評價。現有的信息服務的信息內容加工和服務功能,基本上沒有超出傳統圖書館情報機構的框架。科技人員迫切需要信息服務部門對信息進行知識密集加工。然而,現有檢索方式只能解決1%的用戶“已知已有”信息和1%用戶“已知所缺”信息,而對98%用戶“不知所缺”信息很少能提供。
在眾多媒體信息中,現有信息服務模式主要局限于文本信息。在文本信息中,主要處理“淺海網”的信息。在“淺海網”的信息,也僅能覆蓋其中一小部分。奈斯比特說:“沒有經過整理的信息不是我們的朋友,甚至是我們的敵人,當然更不是財富和資源。”
三、對策:
1.加強圖書館人力資源能力建設
圖書館的所有館員不但應具有其崗位的專業知識和技能,也要掌握信息和網絡等輔助工作的技術,要實現這一點,注重館員技能持續發展的培訓體系是很重要的。
圖書館有必要建立一支大數據分析人才隊伍,他們區別于普通館員的最大差異在于,他們既具有圖書館業務知識技能熟悉圖書館的業務流程,又具有專業的數據分析能力使他們可以發現新的價值來源。要擁有這樣一支隊伍并非易事。圖書館應未雨綢繆,及早引進和培養相關人才。
2.變革組織結構
圖書館的組織結構需要更靈活的對環境做出反應,因此除了網絡時代的組織扁平化、網絡化趨勢外,向下授權、下級參與決策、有利于數據積累和分析等因素也需要在組織架構中得到考慮。
應對大數據時代環境的措施之一,圖書館還有必要建立專門的數據分析中心或信息處理和服務部門,以應對出庫處理的巨大壓力,更好的整合從資源采購到流通、用戶利用等全部數據,預測用戶可能需要的信息并推薦可用于決策支持、科學研究的個性化知識決策服務。
3.引進先進的數據分析技術
大數據需要先進的數據分析技術才能爆發巨大的魔力。傳統的基于歷史數據的預測以及標準化報告在未來將會被“數據可視化”、“應用于業務流程的技術分析”以及“先進的統計技術”等更有力的工具超越與代替。這些新工具能夠幫助圖書館更加直觀地觀察到用戶對信息的需求和利用,了解用戶的真實情況,洞察最佳的服務方案。
參考文獻:
[1]大數據時代的特點[EB/OL].[2012-05-20].http://www.5lian.cn/html/xueshu_0417/32237.html
[2]國家圖書館“十二五”規劃綱要[EB/OL].[2012-06-20].http://www.nle.gov.cn/dsb_footer/gygt/ghgy/