大數據時代背景下高校圖書館的服務變革探析
鑒于圖書館界對“大數據”基本未作出應有反應的現狀,本研究就“大數據”概念與歷史發展及其由來、“大數據”戰略價值、“大數據”時代高校圖書館面臨的機遇與挑戰以及對策等作一探討,以冀引起業界對“大數據”的關注。
大數據;高校圖書館;服務變革
10.3969/j.issn.2095-5707.2014.03.003
近十年來,信息技術熱點的形成日益呈現出“加速”趨勢。目前,繼數字圖書館、移動圖書館、物聯網、云計算等熱點之后,“大數據”(Big Data)無疑已登居IT熱詞之榜首。盡管諸多學者已經或正在努力地描繪著“大數據”時代的嶄新圖景——“大數據”對世界的廣泛而深刻的變革,盡管以信息服務為核心職能的圖書館在這場變革中難以置身其外,但毋庸諱言,迄今為止還沒有引起圖書館界足夠的重視——圖書館界基本上還沒有作出反應。有鑒于此,本文試就“大數據”概念與歷史發展及其由來、“大數據”戰略價值、“大數據”時代高校圖書館面臨的機遇與挑戰以及對策等作一探討,以冀引起業界對“大數據”的關注。
一般認為,“大數據”作為一個相對成熟、相對定型、在核心內涵認識上達成共識的概念,見于美國信息存儲資訊科技公司(EMC)在2011年5月召開的“EMC World 2011”大會上,美國麥肯錫咨詢公司(Mckinsey & Company)在其所發布的研究報告《大數據:創新、競爭和生產力的下一個前沿》中用“大數據”這一概念表述“創新、競爭和生產力”的下一個前沿[1]。倘若著眼于一般用詞,其歷史則又可以回溯到上個世紀末,1998年,美國《科學》(Science)雜志在介紹某計算機軟件時就曾提及“大數據”一詞。與麥肯錫咨詢公司報告以及近年來所討論的“大數據”概念最為接近的文獻則出現在2008年英國《自然》(Nature)雜志推出的“大數據???。
國內外知名媒體對“大數據”的專題報道,盡管對概念的理解不盡相同,但在定義上又有著基本共識——數據數量的大小、通信及其便利并非“大數據”的本質,“大數據”的特質在于在海量數據中快速獲取所需信息、學到知識[2]。維克托?邁爾?舍恩伯格(Viktor Mayer-Sch?nberger)教授在其著作《大數據時代:生活、工作與思維的大變革》中認為,“大數據”并非一個明確的概念,“大數據是人們在大規模數據的基礎上可以做到的事情,而這些事情在小規模數據的基礎上是無法完成的;大數據是人們獲得新的認知、創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府與公民關系的方法?!盵3]
“大數據”衍生于信息數據數量上的持續“加速”增長。美國著名市場研究公司IDC研究顯示,全球信息數據量以年均50%的速率迅猛增長,2011年全球新增數據量高達1.8 ZB(1 ZB=10億TB)[4]。美國南加州大學的學者在《自然》雜志中撰文指出,人類信息儲存量每 18個月翻一番[5]。數字資源構成的變化乃信息數據數量劇增的最為根本的原因。隨著智能手機、穿戴式終端等移動終端的普及,以及社交網絡、移動互聯網、物聯網、信息化應用、傳感器、攝像頭等方面的快速發展,原生的(Born-digital resources)“非結構化數據”劇增,并成為“數據資源的主體”,目前,已占數據總量的80%以上[4]。海量的、雜亂無章的數據中蘊藏的巨大價值引發了對于數據處理、分析、挖掘的巨大需求,這樣便催生了“大數據”概念與相關技術。
“大數據的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,絕大部分都隱藏在表面之下?!盵3]“大數據”的價值有如浪里淘沙,卻又彌足珍貴,目前已經得到了西方發達國家國家戰略高度的重視,2012年3月29日,美國政府宣布推出“大數據研究和發展計劃”(Big Data Research Development Initiative),斥資兩億美元研發采集、組織和分析大數據的工具及技術[6]。
就高校圖書館而言,如何利用大數據技術服務于高校圖書館發展策略的制定、業務的轉型拓展與提升等,已經成為高校圖書館行業層面的戰略課題。
“大數據”最具顛覆性的影響在于其對思維范式的變革,即拋棄對樣本、精確性、因果關系的執迷,轉而接受整體、混沌、相關關系,更好地知覺當下以及正在發生的未來。對高校圖書館而言,提高對數據資源的重視程度,以大數據的思維看待數據,也許能更敏銳地覺察讀者的信息需求的變化,從而為其提供更優質的服務。
2.2.1 變樣本為總體 人類曾經長期習慣于抽樣、局部、片面數據,甚至僅憑經驗等主觀感受去探尋未知領域的規律,由于樣本量有限,獲得的認識難免不同程度存在著表面、膚淺、扭曲等問題。大數據時代,全數據分析模式將逐步取代樣本分析模式,進而深入探尋其內在規律,獲取新知。
2.2.2 變精確為混沌 “大數據”海量、多樣、實時變化的特性,使人類獲取數據信息的準確性降低,混沌因此而無法避免,這就意味著“小數據”時代的精確性思維向“大數據”時代的混沌性思維轉變。
2.2.3 變因果為相關 “社會需要在一定程度上拋掉對因果關系的執迷,代之以簡單的對應:不知道為什么,而知道是什么;這將推翻數百年的既定作法,挑戰我們對于如何決策、如何理解現實的最根本的認識”[3]。即人們只需通過相關性預測未來結果,從而做出相關決策,而無需去探究其因果關系。例如,超市只需知道暴風雨之前,手電筒和糕點銷量呈正相關,而做出將兩者放置在一起銷售的決定,無需去考慮其中的因果關系。
首先,大數據時代為高校圖書館數據采集提供了不竭的來源,成為新知識的主要來源。多樣性特征明顯的海量數據中所蘊藏的大量有價值的信息,為包括圖書館在內的各行各業拓展市場、深化服務提供了可能。以著名的“美國塔吉特(Target)超市嬰兒尿布事件”為例,塔吉特公司通過數據挖掘發現某高中女生在孕嬰用品頁面停留較長時間,準確地預測到該女生懷孕的事實,并向其發放母嬰用品優惠券。高校圖書館服務自然理無二致,高校圖書館亦可通過對讀者借閱信息的數據挖掘,精確推送其感興趣的圖書信息。
其次,大數據時代為高校圖書館提供了數據采集、分析及處理技術,如二維碼技術、無線射頻識別(RFID)技術等,高校圖書館應用這些技術采集、處理數據信息,深化拓展自身服務。
第三,尤為重要的是“大數據”為高校圖書館提供了分析問題的思想方法。如前文所述,思維模式的變革在于——變局部為整體,變精確為混沌,變因果聯系為相關性。這對高校圖書館如何敏銳發現讀者信息需求的變化尤為重要。
首先,大數據時代,媒體資源愈發讓人眼花繚亂,高校圖書館對讀者(尤其是自控能力較弱的年輕大學生)的吸引力在下降,讀者爭奪將更加激烈,高校圖書館讀者流失問題可能日益突出。
其次,數據分析處理服務日趨成為高校圖書館服務的主業,柜臺服務將日益減少,甚至退出歷史舞臺,這對高校圖書館的數據處理能力、服務品質提出了更高的要求。
第三,數據安全保護難度增大,大數據技術將“數字化生存”逐漸轉變為“透明化生存”,知識產權、商業利益、公共安全受損的可能性增大,高校圖書館的讀者隱私安全及數據知識產權等權益將更難保障,讀者隱私、知識產權被泄漏或濫用的風險在增大。
第四,大數據對高校圖書館工作人員的素質、能力提出了更高的要求,高校圖書館相關技術人才的缺乏問題將更突出。
大數據時代,數字資源日益豐富,但也存在著館藏資源趨于同質化的問題,因而高校圖書館從非結構化數據這一嶄新的角度出發,圍繞自身特色、優勢學科進行專題數據采集,打造特色館藏資源、核心館藏資源并實時更新變得十分重要。
大數據技術包括海量數據的采集、存儲、計算等。數據采集用ETL工具(Extraction Transformation Loading,數據提取、轉換和加載),包括OWB(Oracle Warehouse Builder,適用于Oracle數據庫的綜合工具)、ODI(Oracle Data Integrator,適用于Oracle數據庫的數據集成類工具)等;數據存儲包括云存儲、分布式文件系統等;數據計算包括Hadoop大數據分布式處理軟件框架(基于Java語言構建的分布式處理大數據平臺)、Map Reduce(適用于大規模數據集并行運算的編程模型)等。大數據技術的應用勢在必行,藉以提高工作效率、深化拓展服務、增強競爭力。
大數據時代,數據的重新組織、數據的再利用變得更有價值。高校圖書館積累了大量書目數據、讀者數據、流通數據、數字資源利用數據、文獻查詢數據、參考咨詢數據等等,對這些數據進行挖掘分析,對讀者行為進行有效分析,尤其應重視讀者交互數據研究,深入理解讀者行為特征,用科學數據說話,這對于高校圖書館改進資源建設、深化拓展服務(為用戶提供精確、高質、高效、持續的信息資源服務,尤其是個性化服務和精準推薦)、提高工作效率有著重要作用。
館藏資源日趨同質化的今天,讀者資源對高校圖書館的重要性日益明顯,因而擴大高校圖書館的讀者群、通過多渠道及時了解讀者需求,進而提升高校圖書館在高校教工、學生的科研工作及文化生活中的影響力日趨重要。而關注和融入微信、微博、博客、人人網、BBS(Bulletin Board System,電子公告板)等社交網站則是及時了解讀者需求的重要途徑。
在“透明化生存”環境下,高校圖書館切實保障讀者隱私、尊重和保護知識產權的任務更為艱巨,完善有關制度并嚴格執行顯得尤為重要。
“大數據”是高校圖書館未來發展無法逃避的發展趨勢[7],但目前國內高校圖書館對數據的重視程度不足,收集數據、挖掘數據意識不強,制約了高校圖書館信息服務的進一步發展。技術上的難題往往不難解決,思想上的輕視才是問題的關鍵。以信息服務工作為己任的高校圖書館,如何以“大數據”的思維重新認識高校圖書館的信息服務工作,如何利用大數據技術將已有的數據資源進行有序組織、深入挖掘與開發,如何敏銳覺察讀者信息需求與信息獲取習慣的變化,如何進一步推動數字圖書館、移動圖書館的發展,成為高校圖書館未來發展的關鍵。
[1]楊繹.基于文獻計量的“大數據”研究[J].圖書館雜志, 2012,31(9):29-32,37.
[2]韓翠峰.大數據帶給圖書館的影響與挑戰[J].圖書與情報,2012(5):37-40.
[3]維克托?邁爾-舍恩伯格,肯尼思?庫克耶.大數據時代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2012.
[4]余建斌,趙展慧.大數據崛起[N].人民日報,2013-02-22(020).
[5]Martin Hilbert1, Priscila López. The World’s Technological Capacity to Store, Communicate, and Compute Information[J]. Science,2001,332(6025):60-65.
[6]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,50(1):146-169.
[7]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數據”[J].圖書館雜志,2012,31(11):63-68,77.
鄭紅月,蔣麗平,李如輝
浙江中醫藥大學圖書館,浙江 杭州 310053
Analysis of University Library Service Reform in the Era of Big Data
Zheng Hongyue, Jiang Liping, Li Ruhui
(Library of Zhejiang Chinese Medical University, Hangzhou Zhejiang 310053, China)
Since library community basically has not yet made proper response to Big Data, this article elaborated the concept,the historical development, the origin, the strategic value of Big Data, and the opportunities and challenges university libraries encountered in the era of Big Data, in order to draw public attention.
Big Data; university library; service reform
浙江中醫藥大學校級課題(2012ZZ09)
鄭紅月,副研究館員,研究方向:期刊評價與研究。E-mail: 1074194096@qq.com
2014-03-03,編輯:魏民)