馮穎



摘 要:文章闡述了大數據給圖書館信息服務帶來的轉變,提出了大數據圖書館服務的發展方向,分析了基于大數據的圖書館信息服務模式和資源流程,并研究了大數據模式下的圖書館信息模式與個性化服務方式。
關鍵詞:大數據;主動服務;信息可視化;智能用戶分析
中圖分類號:G250 文獻標識碼:A 文章編號:1003-1588(2017)02-0093-03
近年來,隨著移動信息技術、大數據技術、數據處理技術的發展,圖書館的信息模式也在不斷地革新和優化。在圖書館信息服務中,各類跨行業、定制化、個性化的業務需求不斷增多,對圖書信息數據的抽取、挖掘和分析成為推動圖書館信息服務水平提升的關鍵。大數據技術的發展為圖書館信息模式的創新提供了良好契機,構建基于大數據的圖書館“數據—信息—知識—智慧”信息服務模式,能更好地推動圖書信息數據轉化為潛在知識服務,進而創新信息服務模式,提升數字化、智能化、個性化服務水平。
1 大數據帶動圖書館信息模式的轉變
根據維基百科的定義,大數據是一種數據集,能夠通過常用的軟件工具來獲取、存儲和管理,具有種類多、流量大、體量大、價值高的特點。此外,大數據的處理時間超過常規數據處理的可容忍時間,不僅數據量巨大,而且增長迅速。大數據是一種寶貴的信息資產,數據中蘊藏著豐富的信息內容,圖書館用戶在圖書信息網站、購物平臺、社交網絡等信息平臺,都會產生并留下大量的數據,這類大數據信息包含圖片、聲音、視頻等多媒體信息,最終形成海量的圖書館用戶大數據。大數據對圖書館信息模式的轉變有巨大的推動作用,具體如下。
1.1 從被動服務向主動服務轉變
傳統的圖書館服務以被動服務為主,管理員對圖書資源進行信息加工,經過信息資源的采集、存儲、集成、分享,形成信息產品推送給用戶。這個信息流是以管理員為中心的單向流動的過程,用戶處于一種被動接受的狀態,很難將自身需求傳遞回圖書館[1]。
大數據的出現有助于圖書館向主動式服務轉變,建立以用戶需求為中心的信息服務模式,為用戶提供個性化信息服務。如:圖書館根據對用戶評論、滿意度反饋調查等大數據的分析結果,提取出用戶的實際需求、閱讀習慣、閱讀頻次,并將之反饋給管理員,再由管理員進行信息資源的采集、存儲、集成和分享,形成符合用戶個性化需求的信息產品。
1.2 從內向型服務向外向型服務轉變
傳統的圖書館服務屬于內向型服務,服務載體以紙質書籍、報刊、檔案為主,知識傳播途徑較為單一。移動信息時代,圖書館的服務載體日益多元化,通過智能手機、電腦、電視等都可以進行圖書信息傳播,信息資源獲取途徑也不斷拓展,打破了傳統圖書服務模式的時空限制。
大數據模式下,圖書館信息途徑更加外向,信息受眾也更加寬泛,目前包括首都圖書館、廣州圖書館、上海圖書館等在內的圖書館都允許社會人員入館,開放式的大數據圖書館成為發展趨勢,傳統“讀萬卷書、行萬里路”的信息獲取方式已經過時,“秀才不出門,便知天下事”的大數據閱讀已成為現實。
2 基于大數據的圖書館信息服務模式研究
大數據是數字世界的智慧基因,來自圖書館用戶的使用數據、動態數據、關聯數據和社會網絡數據都能夠匯聚為大數據,圖書館自身即可被視為一個大的數據集,不同地區的圖書館可以聯合構建大數據圖書館,不同地區的圖書館數據之間存在數據交換和資源共享。圖書館通過對大數據的整合與分析,洞悉用戶的真實需求。圖1為圖書館大數據應用的支撐技術與實現方法。
圖1顯示,圖書館大數據應用主要基于分布式數據存儲、網絡分析挖掘、圖計算技術、可視化技術等,對各類源數據進行收集、整合、存儲和處理、分析,最終轉換為個性化服務。圖書館大數據結構復雜、種類眾多、容量巨大,對數據的處理過程是信息工作人員對信息的再次加工與分析的過程。
國外對移動圖書館和大數據應用的研究起步較早,由此衍生出的個性化服務也較多。目前,美國高校可以提供基于Windows Phone、Kindle、Blackberry等多個系統的圖書數據服務,很多高校都實現了數字圖書館服務。如:耶魯大學所有紙質圖書均印有二維碼,用戶可以通過掃碼直接鏈接圖書資源,還可以通過大數據收集提供多媒體資源的移動信息檢索;斯坦福大學圖書館用戶可以通過智能手機終端獲取各類移動信息,包括視頻、音頻、樂譜等。
在國內,清華大學、中國人民大學等高校的圖書館,以及國家圖書館、首都圖書館等技術先進的圖書館也在大數據應用方面展開了一系列探索,國內很多圖書館已經基本實現館藏數字化,并借助大數據提供了一系列特色服務[2]。如:國家圖書館的“掌上國圖”、杭州數字圖書館的“文瀾在線”等。大數據信息模式通過數據挖掘和分析最終得出用戶行為分析結果,從而為圖書館個性化服務提供支撐。
如圖2所示,圖書館大數據的信息架構可以分為四層,分別為大數據的采集、存儲、處理和應用。其中,圖書館大數據主要采集來自國內外數據庫的論文、著作以及社交網絡數據等,包括文字、圖片、影像、視頻等多種表現形式。圖書館數據浩如煙海,要想從數據中成功提取所需要的信息,需要借助Hadoop技術、Map Reduce技術、SQL(Structured Query Language,結構化查詢語言)技術等,將大數據存儲到云服務器,通過云計算技術對大量的圖書文件系統和元數據庫進行整合,實現多渠道、多類型、大異構的信息存儲服務[3]。
3 基于大數據的圖書館個性化服務研究
基于大數據的圖書館個性化服務能夠幫助用戶融入其中,構建充分適用于互聯網、移動終端、智能手機、本地用戶等多種接入方式的大數據知識共享平臺。大數據技術強大的數據處理和分析能力,不僅能夠幫助用戶克服時空局限,與信息管理員進行實時反饋與交流,還能夠幫助用戶借助大數據個性化服務方式,通過新媒體傳播、互動百科、學術論壇等方式來發布信息,實現圖書信息的閉環傳遞和反饋。
3.1 信息可視化服務
移動信息時代圖書信息資源日益多樣化,用戶對信息提供方式的要求日益提升,希望能夠實現反饋信息可視化。大數據信息量大、價值密度低、數據層次多,因此通過大數據挖掘提取出有用信息,并以可視化形式呈現,能夠大大提高圖書館用戶對圖書信息檢索的評價。常見的圖書可視化技術包括標簽云、歷史流、空間信息技術等,通過大數據的可視化輸出,能夠提高用戶的查準率。
清華大學圖書館將圖書館服務嵌入搜索引擎中,將購買的66,000多種電子期刊資源與Google Scholar等平臺進行關聯,并嵌入大數據的圖書可視化技術,將電子館藏大數據信息整合為XML文件并存儲在特定服務器,從而使Google Scholar等平臺能夠定期抓取。當用戶在相關搜索引擎進行搜索時,可以根據用戶的檢索自動連接到清華大學的館藏資源,并能夠可視化呈現,用戶通過標識性的文字就能夠獲取閱讀權限,從而極大地提升了資源的查準率和資源共享率[4]。
3.2 個性化圖書信息服務
要做好圖書館信息服務,應該充分利用大數據技術的優勢,并與云計算技術、無線通信技術、傳感和網絡技術相結合,實現圖書館數據從基礎設施架構到用戶服務模式的變革,進而幫助用戶克服閱讀時間、地點、內容、終端類型等條件的限制,結合移動圖書館、手機圖書館、云計算圖書館、泛在圖書館等新的服務形式,真正實現以用戶需求為中心的信息模式與個性化服務。
如表1所示,以國家圖書館的“掌上國圖”和杭州數字圖書館的“文瀾在線”為代表,國內一些技術先進的圖書館已經逐步對館藏進行數字化,并基于大數據技術對數字資源進行分析、存儲和整合,提供參考咨詢、圖書館微博、讀者薦購等服務。圖書館將海量的無序數據進行整合,通過開放鏈接和數據混搭的方式對其進行推送,對于來自互聯網、移動終端、本地等不同路徑的圖書館用戶,圖書館能夠基于大數據提供的海量資源,提供具備個性化參考咨詢的一站式檢索服務。在個性化知識發布方面,圖書館能夠通過學術博客、圖書館網站等來發布圖書信息;在個性化知識交流方面,讀者既能夠在知網空間發表心得,也能夠通過互動百科、學術論壇等方式參與知識交流。此外,互聯網用戶還能夠借助泛在網絡和虛擬社區來參與圖書信息交流,大數據的可視化技術也極大地提升了圖書館個性化服務的效率。
3.3 用戶智能化分析服務
數據挖掘即從大數據中提取出各類有價值信息,并將之應用于對圖書信息用戶閱讀習慣、信息行為、信息軌跡的分析上,同時借助這些分析來預測用戶需求,從而提供智能化推送服務[5]。此外,圖書館還能夠借助智能化分析服務,對現有資源進行綜合分析,預測未來有可能存在的系統故障、用戶需求響應障礙、信息安全等方面的問題。
圖3是大數據圖書館讀者閱讀行為分析判定流程圖。如圖3所示,大數據圖書館會全面而規范地搜集用戶行為數據,基于大量的存儲數據對用戶行為事件進行初步過濾,通過科學分類、智能分析、人工匹配等環節,結合信息管理人員的經驗,經過價值過濾和人工篩選后得出用戶行為定義,從而進行用戶行為判定,完成價值過濾和信息篩選過程。與此同時,圖書館還采集用戶行為事件并將之存入大數據庫,將用戶行為分析的結果與數據庫對比,進行用戶行為匹配,最終得出用戶的閱讀行為和興趣點,并據此進行個性化推送服務。
清華大學圖書館在新浪微博注冊了名為“清華樂推”的微博,并使用了大數據的用戶智能分析技術,通過對清華大學官方微博上的讀者咨詢、建議、投訴和表揚等方面數據的分析,篩選出重要的價值信息[6],并依據這些信息來提供相應的定制服務、培訓信息、圖書推送信息等。
4 結語
大數據是移動信息時代用戶閱讀需求快速變化的產物,也是信息技術發展的必然趨勢,大數據在圖書館的應用有利于打破傳統圖書館在時間和地點方面的限制。大數據已經成為保障圖書館信息系統和服務能力的重要因素,現代圖書館應該充分利用大數據資源,準確識別圖書館用戶的服務需求、閱讀行為、個性化特征,創新信息模式與個性化服務方法,不斷改善用戶的閱讀體驗,改善用戶關系,從而實現精準化、個性化、智能化的圖書信息服務。
參考文獻:
[1]胡越.圖書館服務的學科化與個性化[M].北京:首都師范大學出版社,2008:21.
[2]周虹,張蓓,竇天芳,等.清華大學圖書館OPAC書封服務的設計與實現[J].現代圖書情報技術,2008(8):84-87.
[3]施慧娟.可視化數據挖掘技術的研究與實現[D].上海:華東師范大學信息學院,2010.
[4]劉淑玲.網絡環境下高校圖書館的知識管理與知識服務[J].情報科學,2010(4):523-526.
[5]韓晶星.面向知識社區的數字參考咨詢服務平臺構建[J].情報雜志,2010(2):123-126.
[6]李靖.圖書館自助式服務的現狀與未來[J].上海高校圖書情報工作研究,2011(2): 6-8.
(編校:周雪芹)