曲佳彬
(煙臺大學圖書館,山東 煙臺 264005)
大數據環境下高校圖書館服務轉型探析
曲佳彬
(煙臺大學圖書館,山東 煙臺 264005)
大數據的發展帶來了高校圖書館服務模式的變革,從云計算、物聯網、社交網絡方面分析大數據來“緣”,闡述大數據對高校圖書館的影響,最后探討了大數據驅動下高校圖書館服務轉型的方向。
大數據 圖書館服務 高校圖書館 數據挖掘
云計算方興未艾,“大數據”又悄然興起,在云計算、物聯網、移動互聯等技術的推動下,全球已步入了“大數據”時代。中國科學院院士鄭有炓指出,大數據帶來的信息風暴正在變革人類的生活、工作和思維,開啟了一次重大的時代轉型[1]。大數據時代,數據已經滲透到當今每一個行業,成為重要的生產要素,如何對海量資源加以高效利用并開發出其中的價值,已成為IT領域、企業界、科研工作者等普遍關注的問題。高校圖書館生命所在是服務學生和教師,使他們能夠快捷、有效地利用圖書館的文獻信息及其他各種電子資源進行學習和科研。在大數據環境下,高校圖書館要抓住機遇,迎接挑戰,提升服務質量,由以提供資料為主的服務轉變為以教師、學生需求為導向挖掘其隱性需求,統一監管、保存學校各院系、部門的科研數據形成更大的數據聯合庫,提高圖書館的智能化服務水平,樹立圖書館的知識形象,使圖書館真正成為廣大教師和學生求知創新的學習場所。
1.1 大數據時代到來
大數據讓人眼前一亮,也讓人捉摸不定。著名信息技術分析公司Gartner發布《2013年大數據普及程度背后的炒作》報告,指出2013年30%的企業已開始大數據研究工作,而另外34%的企業計劃在兩年內開始。但這些企業大多告訴調查者,不知道自己在做什么,也不知道為什么要做大數據工作[2]。盡管商界對大數據帶來的商機津津樂道,但一開始討論大數據時代的是科學家,生命與醫療、粒子物理、天氣預報、基因學、地震預報等已經是數據密集型應用了。在此背景下,《自然》雜志2008年的big data專輯推出大數據???,探討科研形態變化,大數據才成為未來的研究重點[3]。隨后2011年5月全球知名咨詢公司麥肯錫(Mckinsey and Company)發布了《大數據:創新、競爭和生產力的下一個前沿領域》報告,首次提出了“大數據”的概念,并在報告中對大數據的影響、關鍵技術和應用領域等進行了詳盡的分析[4]。2012年后,國內外知名IT企業加入大數據研究行列、奧巴馬政府宣布將“大數據戰略”上升為國家意志、大數據基金會的成立等種種跡象表明大數據時代的到來毋庸置疑。
大數據的發展席卷全球,通過Google趨勢工具同時搜索“cloud computing”和“big data”,發現在全球范圍內,從2011年以來“big data”搜索指數呈現急劇上升趨勢,其熱度和2011年左右的“cloud compting”相當,如圖1所示。
通過百度指數搜索“云計算”和“大數據”,可以得出2010~2012年為云計算之年,從2012年開始國內對大數據的關注度急劇上升,用戶和媒體對此都表現出了極大興趣,在不久的將來大數據很可能會成為時代的翹楚。

圖1 谷歌趨勢搜索“cloud computing”和“big data”

圖2 百度指數搜索“云計算”和“大數據”
1.2 大數據來“緣”及影響
筆者認為,大數據是生產、生活中人們對這個世界的不斷數據化,比方說谷歌搜索、Facebook的帖子和微博消息等使得人們的行為和情緒的細節化測量成為可能,而這些量化的信息不斷積累形成了大數據。在互聯網環境中,大數據就是互聯網發展到今天的一種表象或者特征,在云計算為代表的技術創新大幕的襯托下,原本很難收集和使用的數據開始容易被利用起來,比如說微博信息、網頁搜索習慣、購物習慣等,再如物聯網、射頻技術的發展,人和物的所有軌跡都可以被記錄下來。因此可以斷言,未來的移動互聯網中任何事物都可能被記錄并且保持下來,形成大的數據集合,通過各行各業的不斷創新,數據共享、交叉復用以獲得大數據的價值。大數據的來“緣”主要從以下幾個方面分析:①互聯網、信息技術的發展使得信息基礎設施持續完善,為大數據的存儲和傳播準備了物質基礎[5]。②Web2.0時代使得大數據的產生有了質的不同,Web2.0更加注重用戶的交互作用,催生了社交網絡,以微博、博客、facebook等為代表。加上智能終端、移動互聯網的發展,使得人們不受地域、空間限制產生了很多數據。③新技術的發展為大數據的分析、存儲提供了條件,云計算為大數據的集中管理和分布式訪問提供了必要的場所和分享渠道,大數據的出現使云計算落地了,云計算提供基礎架構平臺,而大數據應用運行在這個平臺之上。④當下物聯網、移動終端、傳感器等運轉在社會的每個角落,持續不斷地產生大量數據,并且數據類型豐富、內容鮮活,是大數據重要的來源。
當社交網絡興起,移動互聯網快速發展,數據傳感器的大量應用以及云計算帶來了新一輪的數據大集中,在這個時代“數據”出現了爆炸式的增長[6],并給各行各業帶來了根本性的變革。大數據幫助政府實現市場經濟調控、公共衛生安全防范、災難預警,幫助醫療機構建立患者的疾病風險跟蹤機制,幫助電子商務公司向用戶推薦商品和服務,甚至是社交網絡中好友的推薦等,總之,通過大數據分析能夠了解行業動向,并做出更加正確的決策以實現價值[7]。筆者認為大數據的魅力在于:通過對本行業大數據的收集、存儲、分析、研究,從中挖掘潛在的價值信息,預測行業未來的發展,實現持續的創新與成長。大數據時代引發的變革,主要有3個方面:大數據的思維方式、數據的重要性、大數據技術,這三者是相輔相成、環環相扣的。擁有數據固然重要,但同時也要有處理、分析大數據的技術,否則數據就會像一盤散沙,毫無意義。信息技術飛速發展的今天,已經有辦法去收集、處理大數據,比如云計算、虛擬化技術、分布式處理技術(Hadoop)等。因此,大數據時代如何發揮數據的價值取決于大數據思維,與其說是大數據創造了價值,不如說是大數據思維觸發了新的價值增長。如最近天貓的“雙十一”個性服務,基于交易大數據的“千人千面”服務正是有了大數據的思維,才打造了不同消費者的專屬會場[8]。
大數據是一把雙刃劍。大數據的整合讓數據從分散變得集中,讓數據變得很“大”,也就意味著比分布式要面臨更大的風險,一旦數據遭受入侵,損失也要大得多。因此在數據整合中,基礎架構的安全性是首要考慮的因素之一,這也是各個行業共同努力的一個方向。
2.1 海量數據
高校圖書館本身擁有很多紙本資源,隨著信息化建設的發展,大量的數字資源,如電子圖書、期刊、數據、網絡資源涌入高校圖書館。智能手機、平板電腦等移動終端的普及使讀者不受時空限制即可獲取知識,隨之而來的是高校圖書館的移動客戶端、wap網站、數字圖書館等如雨后春筍般涌現,使用戶的數據量爆發增長。筆者認為面對如此海量的數據,高校圖書館應主要分析、挖掘用戶的借閱記錄、查詢日志、社交活動、移動終端使用記錄等各類半結構化數據,因為這些數據中包含了很多隱性價值,對改善服務方案、提高服務效率、開展個性化服務有很大幫助。
2.2 讀者流失
隨著各種新信息技術的不斷發展,網上數據庫、網上書城以及公開免費的網上圖書資源充斥著互聯網,給傳統的高校圖書館帶來了壓力,讀者流失日益嚴重。而大數據為高校圖書館解決這一問題提供了新的思路。高校圖書館可以借助大數據技術對讀者需求數據(包括借閱記錄、咨詢記錄、薦購記錄等)進行分析,不僅可以了解讀者的信息行為、需求意愿及知識運用能力,還可以深度挖掘讀者在交互型知識服務過程中的潛在需求,從而有針對性地開展服務并吸引讀者,以應對生存危機,同時利用讀者不斷增長的信息需求促使高校圖書館的拓展服務持續延伸、完善。
2.3 大數據應用
高校圖書館的核心價值就是為學生、教師服務,教師的科研成果、學生的論文成果在某種程度上代表著高校的教學、科研水平。圖書館只有了解師生的需求,掌握其閱讀習慣,才能量體裁衣提供優質服務,進而提升整個學校的科研水平。高校圖書館要充分利用大數據技術和大數據思維,發現潛在價值信息,為師生提供高效、智慧的服務,這是未來高校圖書館發展必須做到的。
首先,高校圖書館應用大數據具有現實可行性。教師、學生在使用圖書館時會留下使用痕跡、用戶行為日志等,這就形成了很多有價值的數據。其次,高校作為科研重地,對新技術、新思想的敏感性很強,在高校圖書館中使用大數據技術并不是什么難題。此外,大數據技術不是一項具體的技術,而是數據采集、數據存取、數據處理、數據挖掘等技術的融合,這些技術相對來說已經很成熟。高校圖書館面對新技術、新思維的沖擊,要抓住發展契機,轉變服務模式,實現可持續發展。
2.4 隱私保護
大數據是一把“雙刃劍”,它涉及隱私問題,包括用戶姓名、郵箱、電話號碼等,具有關聯性和累計性,一旦信息泄露、濫用,將對用戶造成極大危害。高校圖書館中存在著大量的讀者數據,如用戶查詢記錄、用戶借閱數據及手機客戶端訪問日志等。圖書館為了改善服務方式,提供優質服務,需要對這些數據進行分析,通過數據挖掘、知識發現等技術,了解用戶閱讀行為。另外,這些數據除了用于記錄讀者的個人信息外,還隱藏著許多重要信息,如電話號碼、郵箱、行為記錄、社交網絡信息等。高校圖書館應高度重視讀者隱私,樹立高尚的職業操守,在正當、合法的范圍內使用讀者數據。
3.1 基于數據挖掘的圖書采購
高校圖書館的采訪工作是圖書館工作的重要組成部分,圖書采訪水平的高低,直接影響著館藏建設的數量和質量,更關系到圖書館提供科研服務和教學服務的水平[9]。圖書館有限的經費、文獻出版的混亂、文獻價格的逐年上漲給圖書館采訪人員帶來了巨大的挑戰,采訪人員的個人能力、信息素養有限,很難從全局觀念出發,采購既能滿足本校教學和科研需要又具有一定價值的文獻。大數據環境下,有效地分析讀者需求成為可能,在圖書館的OPAC系統中有大量的搜索記錄、借閱系統中有借閱記錄、讀者薦購系統中有薦購記錄,另外開通的官方微博、微信中有很多讀者潛在的需求數據,通過對這些數據進行挖掘、分析,能準確定位讀者需求,從而為其提供有價值的文獻資源而不是僅僅依靠圖書館的薦購系統或采訪人員的經驗去采購圖書。
以煙臺大學圖書館為例,圖書管理系統、OPAC系統都由本館自行開發完成,獲得讀者使用圖書館留下的數據變為可能,在圖書采訪工作上已經有了顯著的成效,大數據的收集、分析將是本館推出特色服務的開始,未來的工作重心也必會向以讀者為導向的服務發展。
3.2 大數據支持的虛擬參考咨詢服務
參考咨詢部門主要負責解答讀者在利用圖書館過程中產生的各種問題,在通訊技術和網絡技術普及應用的條件下,實時虛擬參考咨詢應運而生,咨詢員不再受地域、時間的限制,可在網上實時解答讀者問題。隨著技術的發展實時虛擬參考咨詢系統主要有國內的國家科技圖書文獻中心(NSTL)實時咨詢服務系統、CALIS分布式聯合虛擬參考咨詢系統[10]、商用及時通訊工具(QQ、MSN)、圖書館微博、微信。這些實時咨詢系統的共同點是參考館員必須實時在線,實時守候,參考館員的知識能力、非上班時間的時效性、工作量大等因素勢必影響參考咨詢的質量,降低圖書館的服務水平。
高校圖書館開展了多年的咨詢服務,在讀者咨詢的問題中,有很多都是相似的,咨詢員通過整理分析后形成了精選的FAQ,同時也積累了大量寶貴的咨詢記錄。這些數據日積月累形成了圖書館的大數據,對其進行挖掘、分析,能夠幫助圖書館提供優質、完善的咨詢服務。將人工智能運用到圖書館參考咨詢中,是一種新的嘗試,清華大學圖書館設計的“小圖”是一個很好的代表,另外還有重慶文理學院的AIMLBot智能機器人[11]?;谌斯ぶ悄艿膶崟r虛擬參考咨詢的成功嘗試離不開圖書館咨詢服務累積下來的數據支持,它們的核心語料庫都以咨詢服務累積的數據為基礎,實現了全天候、快速響應、個性化、準確性的咨詢服務,使傳統的參考咨詢服務有了質的飛躍。
3.3 高校科研數據的知識整合
大數據時代,握有數據同時具備大數據思維才能在未來的發展中占領先機。隨著數字化的發展,高校圖書館加快了數字化進程,紛紛購進電子圖書、網上數據庫,然而教師和學生通常都把圖書館當作提供免費資源的部門,只是檢索、下載所需的網上資源,忽視了圖書館的重要性。為了擺脫尷尬困境,高校圖書館應該積極行動起來。不但要提供文獻資源、電子資源、空間資源,更要加強對高校各個院系、校屬科研單位的實驗數據、科研成果、學術報告等進行收集、監管、整合以證明自己對學校、社會的價值,進而受到重視。通過對這些數據的分析,挖掘出高校科研前沿、教學新動向,提供定時上門服務、電話咨詢等方便靈活的借閱方式,為學校科研、教學的發展做出貢獻。另外,高校圖書館應長期監管保存高校院系、校屬科研單位的科研數據,構建特色資源庫,保持科研的延續性。
3.4 基于數據分析的嵌入式學科館員服務
學科館員制度逐漸成為高校圖書館提高競爭力的主要服務,反映了高校圖書館服務領域的變革和創新,表明高校圖書館工作已經形成了與學科、學者、讀者聯系起來的互動式服務。
隨著服務理念的深化以及用戶需求的變化,嵌入式學科館員應運而生。與傳統的學科館員不同,嵌入式學科館員將服務深入到用戶中,參與到用戶的學習、科研中,為用戶隨時隨地地提供個性化的、學科化、知識化、泛在化的服務;以用戶需求為中心,用戶需要什么圖書館就提供什么,深層次發掘用戶需求。這就要求學科館員以院系學科為導向,將院系用戶在圖書館檢索和瀏覽電子資源、文獻資源留下的行為數據進行數據分類,挖掘用戶瀏覽下載的文獻出處、關鍵詞、摘要等,歸納出用戶感興趣的主題,從而提供有針對性的增值服務。大數據環境給嵌入式學科館員服務提出了新的要求,通過對大數據的分析來提升嵌入式服務的水平,也是未來圖書館服務值得探討的方向。
[1]中國科學院.鄭有炓:大數據帶來信息風暴變革人類生活[EB/OL].[2013-12-02].http://www.cas.cn/xw/zjsd/201311/ t20131118_3980073.shtml.
[2]大數據時代:熱潮中切忌一哄而上[EB/OL].[2013-12-27]. http://datacenter.ctocio.com.cn/145/12787145.shtml.
[3]孟小峰.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013(50):146-169.
[4]Big data:The next frontier for innovation,competition and productivity[EB/OL].[2013-12-02].http//www.mckinsey.com/Insights/MGI/Research/Technology_and_Innova -tion/Big_data_The_next_frontier_for_innovation.
[5]趙國棟.大數據時代的歷史機遇——產業變革與數據科學[M].清華大學出版社,2013(7).
[6]大數據帶來IT大挑戰 安全整合是關鍵[EB/OL].[2013-11-12].http://server.chinabyte.com/376/12425376.shtml.
[7]大數據究竟是什么?一篇文章讓你認識并讀懂大數據[EB/OL].[2013-12-04].http://www.thebigdata.cn/YeJieDong Tai/7180.html.
[8]雙十一大數據打造“千人千面”個性服務[EB/OL].[2013-12-07].http://it.gmw.cn/2013-11/07/content_9414420.htm.
[9]資蕓,鐘叔玉,董毅明.高校圖書館圖書采訪決策模型研究[J].情報雜志,2007(6):145-147.
[10]姚飛,等.實時虛擬參考咨詢服務新嘗試——清華大學圖書館智能聊天機器人[J].現代圖書情報技術,2011(4):77-81.
[11]李文江,陳詩琴.AIMLBot智能機器人在實時虛擬參考咨詢中的應用[J].現代圖書情報技術,2012(7):127-132.
曲佳彬男,1986年生。碩士,助理館員。研究方向:數字圖書館、知識組織。
G250
2014-02-11;責編:王天泥。)