杜文娟++龐紅
摘要:大數據是繼“WEB2.0”、“云計算”、“移動互聯網”之后的又一次革命性變革。大數據時代讀者的信息需求與獲取方式、以及所期望得到的服務方式都發生了很大的改變,在此背景下,圖書館的發展也面臨著巨大的挑戰,同時也有著良好的發展機遇。如何利用好大數據技術更好地為讀者服務,尤為重要。本文從大數據的概念、特征以及圖書館現有大數據入手,分析了圖書館在大數據背景下面臨的機遇與挑戰,并對如何利用好大數據技術促進圖書館服務方式的轉變提出了個人的一些看法。
關鍵詞:圖書館,大數據,信息服務,大數據技術
中圖分類號 : G25 文獻標識碼:A 文章編號:1672-3791(2014)02(b)-0000-00
1大數據的概念與特征
大數據(bigdata),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。
大數據的4V特征,或者說特點有四個層面:業界將其歸納為4個“V”——Volume(數據體量大)、Variety(數據類型繁多)、Velocity(處理速度快)、Value(價值密度低)。首先是數據體量特別大,現在的數據計算單位,已經從GB到達了TB、PB,甚至是EB了;其次數據類型繁多,絕大多數大數據是非結構性的,其種類十分復雜,我們現在的技術手段還沒法對此進行處理;再次是處理速度快,數據產生和傳送的頻率非常快;最后是價值密度低,從大量的低質量、低價值的數據中獲取知識,猶如從大海中撈針,獲取數據成本很高,但有待挖掘價值大。
2圖書館擁有的大數據
圖書館經過多年的建設,自身就擁有數量龐大的數據資源,利用大數據技術進行數據分析,首先就要了解圖書館擁有那些大數據,在日常的工作中,圖書館管理者更應注重對數據的收集整理。圖書館的大數據主要有:
(1)圖書館的數字化資源
圖書館經過多年的建設,擁有大量的數據庫資源、電子書資源、紙質圖書期刊數字化形成的數字資源,此外,還有各類音頻、視頻資源、這一類數字資源總量巨大,且增長速度快,是圖書館大數據的一大組成部分。
(2)網絡時代出現的大量非結構化數據
伴隨著社交網絡、移動圖書館、物聯網等興起,今后讀者在利用圖書館的過程中,產生的各種信息將越來越多。我們將在讀者使用圖書館服務的過程中,收集讀者的地理位置、搜索歷史、搜索時間等信息。這些多是非結構化和半結構化的信息,雖然價值密度不高,但是只要全面收集就能夠更好地利用大數據技術,分析讀者的偏好,有針對性地為讀者提供有用的信息。
(3)讀者瀏覽歷史中的非結構化數據
隨時網絡時代的到來,我們將從手機、平板電腦等諸多設備中收集到讀者的個人信息、所處位置、瀏覽歷史等各類數據,填補了圖書館數據收集的空白,使圖書館數據庫資源更加完善,為大數據分析技術提供了資源保障。
3大數據背景下圖書館面臨的機遇與挑戰
大數據不僅挑戰了圖書館傳統的IT架構與數據獲取、存儲、處理的模式,而且對圖書館的數據管理及數據應用、數據服務等方面的挑戰將更為突出。但大數據技術的出現也為圖書館帶來了發展機遇。
數據量的增加為圖書館提供了精確掌握用戶群及個別用戶網絡行為模式的基礎,如果能夠充分利用大數據技術來分析這些數據,就可以探索個性化、精確化和智能化地進行推送服務,幫助用戶從海量的信息中迅速找到其所需的信息,提高圖書館服務水平,促進數字圖書館的發展。當前大數據主要面臨以下挑戰:
(1) 傳統的網絡架構不適應大數據時代
傳統的網絡結構設計是以用戶端向服務器發出請求,由服務器應答返回結果給用戶的垂直結構,而在大數據時代,這種垂直結構將越來越少,取而代之的是水平結構的橫向請求服務。“大數據”時代,大量的數據都存儲在分布廣泛、不同地域、各種類型的服務器中。當用戶發出一個查詢請求時,最多的運算是服務器之間的信息交換,最后將結果返回給用戶。新一代的網絡架構要適應WEB2.0時代的水平服務應用。
(2) 數據類型增多,數據量增長及復雜性的增強給現有的存儲能力及計算能力帶來巨大挑戰。
一是計算能力、存儲能力的增強遠落后于數據量的增長及數據復雜性的變化,二是物聯網、傳感網、云計算等信息技術的飛速發展,使得數據移動較之以前更為頻繁,為知識管理及信息服務模式提出了高要求。三是,高可靠性,高可擴展性的數據分析技術成為亟待解決的問題。四是讀者流失分析及價值分析促使圖書館不得不尋求新的解決方案。大數據技術不僅可以通過數據了解用戶的行為、信息需求、知識應用能力,更可以利用數據對用戶的科研創新合作過程及合作交互型知識服務過程將要發生什么進行分析和預測,從而應對圖書館未來所面對的生存危機。
(3) 對圖書館的人才隊伍、服務管理等方面帶來巨大挑戰。
大數據技術是一項具有很高難度的前沿技術,只有具備相關學科專業背景和知識基礎的人,才有可能勝任大數據分析的重擔,而目前圖書館員在信息技術的開發利用方面能力還相對欠缺。因此,大數據分析技術人才隊伍的培養、圖書館員技術能力的提高,服務方式的轉變都是圖書館急需解決的問題。
(4) 用戶隱私權的保護受到了極大挑戰。
圖書館的信息安全和隱私問題是圖書館需要解決的問題之一,大數據背景下,隨著對數據的獲取和分析能力的提升,大量分散的數據中隱含的有價值信息被開發利用。信息安全也從傳統的網絡安全、保密管理等可控安全管理向無法預知安全隱患的不可控安全管理轉變。數據的開放獲取與信息安全之間的矛盾越來越突出,大數據的開發使用使得用戶的隱私權保護遭遇了極大的挑戰。
4利用大數據技術促進圖書館服務方式的轉變
隨著大數據技術的不斷進步和讀者需求的不斷提高,將進一步促進圖書館的服務方式、途徑等發生翻天覆地的變化,圖書館應抓住機遇充分利用好大數據技術,從大數據中去捕捉、分析讀者的潛在需求,向讀者推送有潛在價值的數據,從而提高圖書館的核心競爭力,以應對圖書館未來可能面臨的挑戰。
(1)開展讀者研究工作
大數據背景下,圖書館要為用戶提供更好的服務,用戶的要求會更多,對服務的期望也將更高。圖書館員必須要能夠了解用戶的真實需求,建立可控的、高效率的數據處理流程,掌握多種數據的分析方法,能夠通過利用結構化數據來了解用戶需要什么樣的服務,還要能夠利用大量非結構化的數據、半結構化的數據,從用戶利用圖書館的微行為,來挖掘用戶現在的服務需求以及預測和分析將來會有什么樣的需求。
(2)開展準確的數據推送服務
數據推送服務是指圖書館收集讀者的需求,主動將讀者所需要的信息內容,通過個人圖書館、微博、電子郵件等方式推送給讀者。大數據環境下,對于讀者的利用圖書館服務過程中的各種行為,例如查詢書目、數據庫資料或者瀏覽網頁等,可以細化到某一篇文章,甚至某一個詞,將讀者的個人行為都匯集到數據庫中,然后對不同層次人群的興趣愛好進行詳細分析,進行有針對地、準確地推送服務,另外根據讀者的行為的熱點分析,大數據技術可以告訴我們圖書館讀者的興趣偏好的變化曲線,以便預測讀者需求,從而為圖書館的資源采集、資源更新等提拱依據,最終達到預知讀者需求、引導讀者需求行為的效果,可大大提高圖書館的服務效益。
(3)提供深度的參考咨詢服務
大數據時代,咨詢館員可以將符合大數據特征的咨詢課題融入到大數據系統,系統將根據咨詢的內容主題,利用大數據分析技術,可視化技術,瞬時以圖形方式展示查詢結果,從而縮短了咨詢館員獲取信息資源的時間,擴大了資源的獲取面,從而最大程度地滿足讀者的需求,提高參考咨詢的效率。
(4)提供特色化、個性化服務。
個性化服務是圖書館為讀者量身定做的服務,大數據時代圖書館將利用大數據技術,捕捉讀者動態的操作行為,細化到讀者利用圖書館服務過程中的每一次點擊,能結合學科分析,自動調用不同類別、不同層次的數據,智能地推送給目的讀者,為圖書館實現個性化服務提供了可能。
(5)為學科專業、科研發展提供知識服務
目前,越來越多的新型學科領域都是建立在大數據的基礎上的。但在大數據背景下,許多數據是零散的、復雜的、原始的,對這些巨量數據的加工、處理需要較強的技術來支持。當前,大數據技術主要包括可視化分析、數據挖掘算法、數據質量管理、語義引擎等,技術是解決大數據問題的關鍵,并將影響到大數據的研究。圖書館作為知識服務的平臺,必須要適應科學研究的要求,推動數字圖書館技術的進步。大數據背景下,圖書館可以充分發揮其資源、人力、技術等方面的優勢,加強對學校重點學科專業領域的各類型的數據資源,如論文、會議論文、學位論文、研究動態、學科前沿,甚至互聯網上相關學科領域專家學者的博客、論壇等數據進行收集,利用大數據分析技術,通過對所收集到的數據進行加工整理,數據建模,可以提高數據的價值密度,提升圖書館知識服務的學科化、專業化水平,發揮圖書館員在信息收集、整理、加工中的優勢,從而更好地為學科專業和科研服務。
(6)加強用戶隱私保護
隱私權是公民的一項重要權利,然而在網絡技術發達的時代,泄露隱私卻是幾乎每時每刻都在發生的事情。大數據時代,圖書館員必須提高職業修養,在搜集、分析用戶信息時,做好保密工作,捍衛用戶的隱私權。在圖書館服務提供過程中,還要重要讀者隱私權的保護。
參考文獻
[1]李鵬云.大數據與圖書館服務[J].農業圖書情報學刊,2013(9)
[2]樊偉紅,李晨暉等.圖書館需要怎么的"大數據"[J].圖書館雜志,2012(11).
[3]王捷.大數據時代下圖書館開展信息服務的對策[J].現代情報,2013(3)
[4]韓翠峰.大數據時代圖書館的服務創新與發展[J].圖書館,2013(1).
[5]朱靜薇,李紅艷.大數據時代下圖書館的挑戰及其應對策略[J].現代情報,2013(5).