顏琪媛

摘要:應用大數據技術,可以讓圖書館在新時期得到進一步地發展,可以讓信息服務水平得到提升。本文首先對大數據對圖書館帶來的影響進行分析,然后從信息服務的角度,對大數據在圖書館中的應用特點進行闡述,最后結合實例,提出幾點大數據在圖書館的應用策略。
關鍵詞:大數據技術;數字圖書館;信息服務
前言:
大數據是一種較為抽象的概念,主要指的是因為自身具有較大的容量、較快的增長速度、較為復雜的關系而需要新的處理模式才可以讓其決策力得到提升的海量信息資產。其本身具有規模大、結構多樣、價值密度低的特點,其流程可以概括為數據采集、數據分析與數據解釋三個環節。
一、大數據對圖書館帶來的影響
(一)借助大數據建立知識服務導航機制
在傳統圖書館中,讀者在帶有明確目的的情況下,按照類別去尋找自己所需的書籍往往存在很多困難,需要工作人員提供幫助。非但讀者不夠方便,工作人員的工作量也被加大了。借助大數據技術,可以建立起良好的知識服務導航機制,可以讓此問題得到徹底解決??梢岳靡苿討贸绦驅^內地圖和OPAC進行有機整合,讓讀者在找尋資料時可以明確位置。
(二)借助大數據完善新的知識服務方式
借助大數據技術,圖書館可以完成用戶數據信息的分析工作,不但可以明確用戶的信息行為,還能夠對用戶潛在需求數據予以深度挖掘。讀者的閱讀習慣、讀者的構成部分、讀者的潛在需求以及相關的借閱數據都是極具價值的信息,通過對這些信息的分析,可以對讀者展開針對性的服務。如某位讀者經常在圖書館內借閱文學類的圖書,那么在其登錄數字化借閱端口時,就會出現多種此類圖書,起到良好的推薦作用[1]。
(三)大數據讓圖書館數據存儲和計算面臨挑戰
在大數據時代,數據的數量與類型都在不斷增多,非結構化與結構化的數據信息會隨著用戶的網絡活動而不斷產生,這無疑會提高圖書館數據存儲、計算、分析的要求,存儲能力和運算能力的限制會讓圖書館數據在應用過程中出現困難,讓圖書館面臨挑戰。
二、大數據在圖書館的應用特點
從信息服務角度來看,大數據在圖書館進行應用的過程中,服務對象、服務技術和服務模式均有所改變?,F階段,智能手機已然成為了閱讀信息的主要載體,習慣使用智能手機的年輕人也隨之成為圖書館的主要服務對象;在服務技術方面,利用網絡化技術可以對傳統信息資源予以轉化,將其存儲于虛擬空間,對其進行處理的客觀技術在不斷更新,不斷轉變,而技術的轉變帶動了圖書館工作人員的轉變,要求工作人員需要掌握更多的服務技能;在服務模式方面,大數據在圖書館應用之后,可以不用親身到圖書館就可以完成信息的查找工作,信息服務模式發生了極大轉變,通過檢索功能,可以很快查找到所需信息,服務效率得到極大增強。同時,因為網絡通信技術的迅速崛起,如果圖書館建立起相應的APP,那么還可以通過軟件來為讀者提供個性化的信息推送服務[2]。
三、大數據在圖書館的應用策略
(一)選擇合理的大數據處理技術
隨著信息技術的發展,數據格式漸漸變得豐富多樣,如視頻、音頻都已成為常見格式。在對圖書館大量數據進行存儲時,可以利用聯網方便、速度很快的硬盤存儲方式。圖書館在數據處理時,涉及到的信息大部分為結構化數據信息,對有價值信息進行挖掘時具有很大的難度,圖書館應該對數據處理方式進行及時改變,對用戶的信息行為、借閱記錄等信息都需要予以深入分析,讓基礎設施得到改善,讓服務方案得到提升。就目前來看,圖書館可以選擇的數據處理方法主要可分為四種,第一種為Map Reduce技術,這種技術可以把復雜的運行在大規模集群上的并行計算過程轉化為兩個函數的映射與簡化,對于編程人員來說十分方便,其處理流程可以概括為,編號代碼、配置作業、提交作業、分配和執行Map任務、處理中間結果、分配和執行Reduce任務;第二種為No Only SQL數據庫,這種數據庫的模型較為簡單,元數據、應用數據為分開狀態,系統管理十分靈活;第三種為Hadoop技術,這種技術具有易用性與開源性,其主要模塊分為兩部分,即MapReduce與分布式系統,它們是處理核心,使用者能夠通過Hadoop完成計算機資源的組織工作,讓分布式計算平臺得以搭建;第四種為云計算技術,無論是硬件還是軟件都是信息資源,都可以利用互聯網提供給用戶,同時,它可以讓信息資源結構得到擴展,讓動態信息得到更新。
(二)解決圖書館信息資源組織問題
在應用大數據技術的過程中,信息資源組織面對的問題包含兩個方面,即信息特征的揭示困難和具體組織對象的選擇困難。為解決這兩大難點,需要著眼于流程設計和方法實施這兩個方面。
1.信息資源組織流程
信息人員利用多種信息技術可以完成分散、雜亂、大量的元數據選擇工作,對信息予以優化和處理可以形成一個整體流程,非結構化數據、結構化數據與半結構化數據是大數據的主要來源,對半結構化數據與結構化數據予以存儲,對非結構化數據與半結構化數據予以流處理,讓并行數據庫和關系數據庫經過批處理后可以完成數據的應用工作。
2.信息資源組織方法
在圖書館信息資源中,無論是網絡信息還是館藏信息都會在發展到一定程度后迅速增長,組成大數據,現階段,數據庫方式、主題樹方式、超媒體方式與文件方式不能讓信息的收集和分析足夠高效,不能給用戶提供良好的服務體驗。信息資源組織方式中的批處理和流處理可以對非結構化數據產生良好的信息資源組織效果。
(三)建立個性化、智能化的信息檢索系統
1.個性化搜索
如前文所說,在用戶信息收集基礎之上,建立起信息檢索系統,用戶信息包含了學習信息、個人信息與行為信息,利用這些信息可以讓圖書館清楚用戶需求,形成推薦目錄。為實現個性化搜索,必須要確保搜索引擎的智能化,根據用戶輸入的關鍵詞,按照相關度、瀏覽數量等順序來呈現給用戶,查全率和查準率都要有所保障。搜索引擎應該具有人機對話功能和相應的分析能力,需要針對用戶搜索做出快速反應。同時,圖書館需要對搜索引擎予以定期評估,建立起以用戶為中心的搜索機制。endprint
2.智能化搜索
為實現智能化搜索,需要做好三方面的工作。首先,圖書館應該在系統搜索引擎中建立起機器學習的功能;其次,圖書館應該利用此功能,讓搜索引擎得到擴展,除了文字檢索之外,還可以擴展到視頻檢索、圖片檢索等;最后,搜索引擎應該具有自動更新功能,數據數量與類型在不斷增長,搜索引擎對平臺中的海量數據需要做到實時更新,確保結果的全面與準確。除此之外,在更新搜索引擎時應該結合用戶對信息的進行搜索的習慣。
(四)設計圖書館公共數據庫
1.設計圖書館公共數據庫的重要性
圖書館資料建設分為三個階段,第一階段為藏書建設,第二階段為文獻資源建設,第三階段為圖書館信息資源建設。完善圖書館公共數據庫是第三階段的主要內容,公共資源建設包含三個方面,搜集制作資源、管理組織資源和資源服務體系,利用大數據技術可以完成資源的搜索、存儲與篩選工作,可以讓讀者需要得到滿足,并擴大圖書館自身的發展范圍。
2.設計圖書館公共數據庫的方法
以我國沈陽市圖書館為例,在公共數據庫結構功能設計中其主線為使用者,E-R模型圖如圖1所示。
如圖1所示,通過網絡信息采集器,圖書管理員可以完成社交網、公共信息網等方面的信息采集工作,讓其在公共數據庫中得到儲存。而在用戶登錄模塊,圖書管理員在輸入密碼與用戶名之后,可以進入后臺管理界面,在此界面,可操作項包含了期刊管理、典藏管理等內容。而在讀者檢索界面,可以進行圖書檢索、期刊檢索、模糊檢索和類別檢索。在公共數據庫管理框架的設計上,可分成三個步驟進行,首先需要使用網絡數據采集工具完成資源信息的采集工作,然后需要對采集的信息進行儲存和組織,最后需要對信息資源進行分析,結合當前情況,資源信息分析出現在移動終端設備與互聯網設備的情況較多。在網絡平臺公共信息數據存儲時,把組織之后的信息數據以列式存儲的方法存放在hbase數據庫里,一個存儲列對應一個頁鏈接。
(五)提高圖書館信息服務水平
1.學科知識服務
為提高圖書館信息服務水平,需要加強學科知識服務水平,需要為用戶提供具有個性化、科學化的圖書信息。無論是高校圖書館還是公共圖書館,這種學科知識服務都是必要的。在大數據的應用過程中,圖書館的信息服務內容會產生變化,信息服務模式也會隨之變化,學科知識在迅速增長,在不斷更新,已然組成了學科生態系統,在此基礎上,對這些數據信息進行采集與分析,利用處理工具與相關技術可以讓數據的潛在價值被挖掘出來,以學科為基礎,分析專業信息資源的檢索系統中的瀏覽下載頻率,可以找出不同時間段內用戶的興趣點,對數據信息進行統計和挖掘可以找到圖書、用戶與信息資源之間的網絡結構,進而完成網絡的構建工作。
2.一站式資源服務
在圖書館中應用大數據技術,需要提供給用戶一站式資源服務。在當前環境下,數字化的信息資源十分龐大,數據的類型繁多且結構相對復雜。在圖書館中,信息資源包含了兩個方面,即虛擬館藏資源與現實館藏資源。虛擬館藏資源包括了在線出版物、網絡數據庫和網絡動態信息,利用Hadoop、Map Reduce、云計算等技術可以讓用戶在復雜的數據中快速找到所需信息,將多種信息資源予以開放式存儲,可以讓用戶成為信息的主動發布者。同時,圖書館在數據信息整合的時候應該對重復數據予以去除,讓數據的可依賴性更高,利用大數據智能化檢索技術可以完成一站式資源服務的提供工作。
3.信息可視化服務
信息可視化程度和用戶面對信息的直觀性是緊密相關的。在大數據中,包含了大量信息,且這些信息的價值密度點不是很高,結合大數據分析技術可以將有價值信息予以找出,然后利用可視化技術(如歷史流、標簽云、空間信息)可以將此信息變得更為直觀。讓用戶的檢索、評價速度提升,進而使得圖書館對自身系統進行優化。同時,信息可視化技術可以與學科計量學方法相結合,生成學科知識地圖,讓作者、學科以及著作之間的關系得到直觀表現,讓學科知識的結構得到闡述,讓各個領域的發展動態得到反映。以上海市圖書館為例,該圖書館在應用大數據過程這能夠推出了手機APP,且使用了iBeacon技術,這種技術能夠將二維碼、位置定位等移動手段和圖書館的服務結合,在借紙質圖書時,利用手機APP還可以幫助讀者快速找到圖書所在位置,而在查詢圖書時,無論讀者身在何處,都可以對其進行查看。
4.智慧服務
在知識服務的基礎上,對其進行升華和創新可以形成智慧服務。瀏覽信息時產生的日志,借還書產生的數據,書目查詢時產生的檢索目錄共同形成了用戶的信息來源,在數字圖書館中應用大數據的挖掘技術,可以讓用戶對信息服務的滿意度得到提升,針對用戶的實際需求,可以為用戶提供具有主動性的定制化服務。以汕頭市圖書館為例,汕頭市圖書館在2017年6月份正式啟動了大數據服務平臺,并將圖書館入門處的智慧墻與之連接,智慧墻中顯示了每個小時的圖書館人次,圖書館的借還量、圖書借閱榜單以及新書的推薦等,就目前來看,在排行榜上,“東野圭吾”、“我的前半生”為熱門檢索詞,實現了智慧服務的目標。
結論:
綜上所述,通過選擇合理的大數據處理技術、解決圖書館信息資源組織問題、建立個性化智能化的信息檢索系統、設計圖書館公共數據庫和提高圖書館信息服務水平可以讓大數據技術在圖書館中得到良好的應用,進而推動圖書館的進一步發展,讓讀者獲得更為舒適的服務體驗。
參考文獻:
[1]高曉東,周建.高職院校圖書館大數據在學業預警中的應用[J].圖書館學刊,2015,3701:115-117.(2015-01-30)
[2]羅芳.大數據在圖書館的應用[J].科技廣場,2015,03:132-135.endprint