郭育艷
(河南財經政法大學,河南 鄭州 450046)
大數據時代,尤其是電子商務、移動通信與社交網絡把人類社會帶入了一個以“PB”(1024TB)為單位的結構與非結構數據信息的新時代。在這一時代,以信息保存、開發、利用為己任的圖書館信息服務受到前所未有的挑戰。如何保存與分析大量的復雜數據,利用大數據技術對隱含在用戶行為中的結構化、半結構化數據信息進行挖掘、識別、組織與分析,以尋找其潛在的信息需求以及如何把握時代特征,掌握圖書館未來的服務趨勢,改進服務水平,拓寬服務領域,達到圖書館資源服務與用戶需求的雙向理想控制意義重大。本文在分析大數據帶給圖書館信息服務的影響與挑戰基礎上,重點探討大數據時代下圖書館信息服務的創新。
從硅谷到北京,大數據的話題正被廣泛傳播。半個世紀以來,隨著計算機技術全面融入社會生活,信息爆炸已經積累到了引發變革的程度。它不僅使世界充斥著比以往更多的信息,而且信息增長速度也在不斷加快。量變引發質變,最先經歷信息爆炸的學科——天文學和基因學,率先提出“大數據”的概念[1]。
眾所周知,生物體的大小影響著萬有引力所產生約束力的大小。同理,數據及信息的規模也對自身價值的發揮產生影響。谷歌之所以能超前世界疾控中心,實時地給出和基于大量真實病例信息所得到的流感情況一致的結果,Farecast之所以可以預測機票價格的波動,讓消費者真正獲利,他們成功的秘訣都在于能夠搜集由人們日常行為產生的數千億計數據項,并對這些非結構化數據進行分析、挖掘,預測未來趨勢。大數據的科學價值和社會價值正體現在這里。一方面,大數據可以轉化為經濟價值來源,另一方面,大數據已經撼動了如商業、科技、醫療、政府、教育、經濟、人文等各個領域。就像顯微鏡讓人類能夠觀測微生物,望遠鏡讓人類能夠感受宇宙一樣,大數據開啟了一次重大的時代轉型,它正在改變著人們的生活以及思維方式,成為新發明和新服務的源泉。
大數據,并非一個確切的概念,它最初誕生于技術領域。當信息量過大,已經超過了一般電腦在處理數據時所能承載的內存量時,新的處理數據技術應運而生,例如谷歌的MapReduce和Hadoop平臺(最初源于雅虎)。這些技術可以消除僵化的層次結構和一致性,令數據不需要借助傳統的數據庫表格來整齊地排列,大大增加了人們可以處理的數據量。
截至目前,學術界雖然并未對大數據形成一個統一的定義,但存在著這樣一個共識:大數據作為結構化數據、半結構化數據與非結構化數據的總和(由郵件、視頻、微博、帖子、頁面點擊等產生的),不是對數據量大小的定量描述,而是一種在種類繁多、數量龐大的多樣數據中進行的快速信息獲取[2]。大數據具有4V特點,即種類 (Variety) 多 、速度 (Velocity)快、容量(Volume)大、價值(value)大。這些內涵和特點預示著大數據將改變目前“IT”架構,將信息界變革的重點由“T”(技術)轉向“I”(信息),以形態多樣且富有價值的數據為主體,借助一定的技術,來發展數據處理、深層次分析與價值挖掘等信息業務。
如今,一個大規模生產、分享和應用數據的時代正在開啟。大數據使信息與社會發展結合的深度、廣度與力度都超過以往任何時代,信息成為比原材料、資本、勞動力和匯率更重要的因素。作為儲存信息知識、提供信息服務的信息中心——圖書館,勢必在大數據的浪潮下被賦予新的歷史使命,從社會的邊緣走向社會的前沿,從科技發展的“后勤保障部隊”變成“前沿戰斗部隊”,從“學術性的服務機構”變成“學術、服務、產業為一體的綜合性機構”。
信息服務是一個涉及眾多要素、諸多環節的復雜的心智活動和過程。通過對圖書館信息服務內涵與特征的分析,根據蘊含其中的信息序化程度、知識整理水平、信息挖掘程度、創新知識含量的不同,可將圖書館信息服務劃分為包括基礎層、過渡層和創新層的由低到高的三層金字塔式結構[3],見圖1。

圖1 信息服務的三層金字塔式結構
預測,是大數據的核心。圖書館信息服務方向和策略的制定依賴于對大數據的分析與預測。數據的擁有量以及對各類海量數據的挖掘與分析是大數據時代下圖書館提高服務水平,由基礎層轉向創新層的關鍵。大數據時代下,圖書館信息服務所面臨的機遇與挑戰共存。
1.圖書館將面對增長迅猛的海量復雜數據處理
大數據時代下數據的組成結構、類型格式、存在形態等都愈加復雜化,不僅包括數據庫、XML、門戶網站等同類型的結構化數據,而且包括大量的非結構化、半結構化數據,如讀者的借閱習慣、存儲信息行為、搜索方式、消費痕跡等,所有能為圖書館改進服務模式,提高服務水平提供支撐的大數據,都將成為圖書館的核心資產。如何解決圖書館自身海量數據的存儲及運算能力與大數據對存儲能力的高要求之間的矛盾,直接決定著圖書館在大數據時代能擁有多少數量、什么質量的數據。
2.信息服務將面臨以復雜數據為對象、以深度挖掘為要求的高標準挑戰
隨著大數據時代的到來,信息社會將逐步向知識社會轉變,虛擬、泛在圖書館將成為未來圖書館主要形態之一,其信息服務更加突出“無處不在、無時不在、無所不在”的特點,服務的核心在于解決用戶獲取信息服務的三大問題:一是提供高質量的數據資源,二是在海量數據中迅速找到有價值的信息,提供個性化服務,三是利用大量結構化、非結構化及半結構化的數據,分析挖掘圖書館—用戶的服務關系,預測用戶的信息需求[4]。
3.大數據為圖書館信息服務提供專業的數據技術支持
大數據所涵蓋領域主要有可視化分析、大規模并行處理數據庫、數據挖掘算法、分布式數據庫、云計算平臺、互聯網和可擴展的存儲系統[5]等,為海量的各種類型數據的捕獲、組織、分析及決策提供應用支撐。譬如云計算,在它產生之前對于如此龐大且不規則的“非結構數據”,傳統的計算機束手無策。基于云計算方法的數據存放、共享和發掘手段,能快速有效地將數量龐大、形式多變的終端數據存儲下來,并能隨時進行剖析與運算。因此大數據與云計算之間是問題與方法的關系。利用云計算對大數據進行預測分析,能夠提供更為精確的信息,并釋放出更多的數據隱藏價值[6]。
1.以用戶為中心,提高信息服務的智能化程度
用戶是圖書館信息服務工作的軸心,要利用大數據相關技術,進行高級的、自動的復雜數據的收集與處理,如自動抽取關鍵詞、智能抓取數據等,分析并預測出用戶的需求趨向,了解其需求動態,研究其需求規律,并結合其實際所需選擇搜集有效的信息,主動提供索引指南幫助用戶克服因信息分散而造成的檢索困難,提高服務的實效性和針對性。
智能化的信息服務可以促使用戶的潛在信息需求向現實信息需求的轉化,同時有助于隱性知識向顯性知識的轉化,促進知識的發現、挖掘與組織,便于用戶理解和吸收。這一方面使信息的價值得以實現,同時也使服務成為有價值的服務。
2.查找和形成解決方案,并貫穿用戶信息活動的始終
全媒體環境下基本消除了因信息資源地域分布不均衡而導致的信息獲取困難,傳統單一的檢索與傳遞等服務方式在用戶中的影響逐漸弱化,更受關注的是在海量的信息中如何查詢和捕獲所面臨問題的信息,并將這些信息整理形成相應的解決方案。
大數據時代的著力點恰恰是探究“是什么”,而不是“為什么”,大數據能夠利用新的分析工具和思路提供出新的視野和有效預測,尋找事物之間的相關關系。這與當下信息服務的目標——為用戶查找或形成解決方案相符合,而解決方案的形成又是一個對信息反復搜索、分析、整合的過程。用戶利用信息來解決問題的欲望需求受多重因素的影響。因此,信息服務要對用戶的不同信息需求加以分析研究,明確用戶信息目標。同時,信息服務要根據用戶信息需求目標的變化進行技術調整和重組信息,始終保證滿足用戶解決問題的信息需求。
3.根據用戶所求,向其進行服務內容的個性化推薦
人們在上網時經常會遇到這樣的提示語“猜您還喜歡”、“瀏覽了該商品的人還瀏覽了如下商品”,這就是各個網站分析了不同用戶的“行為軌跡”,即非結構化數據,總結其共性習慣而有針對性地提供推薦策略[7]。這就帶給圖書館信息服務新的思路,可以根據用戶長期的借閱記錄、檢索日志等事務型數據,分析挖掘其數據模式及特征,進而發掘某群體的興趣和行為規律,利用以用戶需求為中心的Web服務,進行動態頁面推薦和提供定制化的信息,如根據用戶的興趣度,向其推薦相關專題信息,以此有針對性地服務用戶,拓展圖書館的資源利用率。
這種個性化服務富有更大的創新空間,根據每一次信息服務的具體內容,做有針對性的篩選、分析相關信息,為用戶創設新的知識產品、服務方式,提供創新服務,因而具有更大的服務空間。個性化服務的宗旨不僅是向讀者用戶提供個性化信息,而且要通過服務幫助用戶利用信息來解決實際問題,以滿足不同用戶信息需求為要義。
4.面向知識內容,以增值和創新為目標,實現知識價值
大數據下的信息服務是面向知識內容的服務。這個時代下,大量顯性的、無序的數據信息對用戶深層次需求(如教科研)的作用并不大。因此,圖書館信息服務工作一方面需要深入到文獻知識的單元,對其進行有序整理、濃縮提取,開展深層次的信息加工,形成各種決策性的規范報告,滿足用戶需要;另一方面,圖書館應高度重視用戶所需信息中隱含的知識內容,根據其提出的問題和問題環境進行需求分析,從海量的數據中集中動態地篩選、收集信息,并分析其內部結構之間的隱含知識關系,進一步深層次地提取、重組出與需求相匹配的知識,最終形成解決問題的方案。這樣不僅使無序的信息變得有序,使固化的知識得以活化,實現知識本身的價值,也使檢索、分析、加工、重組知識的服務過程的價值得以實現。
參考文獻:
[1][6](英)邁爾·舍恩伯格,庫克耶.大數據時代[M]. 盛楊燕,周 濤,譯.杭州:浙江人民出版社,2013.
[2]韓翠峰.大數據帶給圖書館的影響與挑戰[J].圖書與情報,2012,(5):37-40.
[3]梁瑞華.高校圖書館知識服務體系研究[M]. 開封:河南大學出版社,2010,(6):97-98.
[4][7]石薇芬.大數據時代的圖書館信息服務[J].社科縱橫,2013,(6):269-270.
[5]百度百科[EB/OL].http:Mbaike. baidu. com/view/6954399.Htm2013-11-02.