摘 要:本文對大數據時代高校圖書館的用戶行為進行分析,并對圖書館資源建設的優化進行了初步的探索。
關鍵詞:大數據時代;用戶行為分析;資源建設優化
1 大數據時代的特征及處理分析方法
大數據(Big Date)又稱為巨量資料,指需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。“大數據”概念最早由維克托·邁爾·金恩伯格和肯尼斯·庫克耶在編寫《大數據時代》中提出,指不用隨機分析法(抽樣調查)的捷徑,而是采用所有數據進行分析處理。大數據有5V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。大數據技術就是基于分析處理(移動)互聯網、信息領域日常運作中累積下來的海量數字信息資料,來發現和形成新的服務形式的技術。
大數據所處理的數據不僅僅是規模大,而且處理的數據不止是關系型數據。大數據處理的數據往往是半結構化數據和非結構化數據。大數據所需處理的信息是非常廣泛的,包括個人大數據(個人使用SNS網站或軟件產生的信息等)、科學大數據(科研數據、實驗數據、研究報告等)、業務流程大數據(各個機構在正常運作中業務流程產生的數據)、企業大數據(企業文化、人員組成、財務狀況等)和社會大數據(社會宏觀環境的數據)等內容。除此之外,最重要的是對大數據進行分析處理,只有通過分析才能獲取很多智能的,深入的,有價值的信息。那么越來越多的應用涉及到大數據,而這些大數據的屬性,包括數量,速度,多樣性等等都是呈現了大數據不斷增長的復雜性,所以大數據的分析方法在大數據領域就顯得尤為重要。大數據分析處理的方法有:
采集:是指利用多個數據庫來接收發自客戶端(Web、App或者傳感器形式等)的數據,并且用戶可以通過這些數據庫來進行簡單的查詢和處理工作。
導入/預處理:雖然采集端本身會有很多數據庫,但是如果要對這些海量數據進行有效的分析,還是應該將這些來自前端的數據導入到一個集中的大型分布式數據庫,或者分布式存儲集群,并且可以在導入基礎上做一些簡單的清洗和預處理工作。
統計/分析:主要利用分布式數據庫,或者分布式計算集群來對存儲于其內的海量數據進行普通的分析和分類匯總等,以滿足大多數常見的分析需求。
挖掘:與前面統計和分析過程不同的是,數據挖掘一般沒有什么預先設定好的主題,主要是在現有數據上面進行基于各種算法的計算,從而起到預測(Predict)的效果,從而實現一些高級別數據分析的需求。
大數據時代,“各類型數據急劇增長,正朝著海量數據方向發展,高校圖書館面臨著數字資源長期保存、資源整合、信息安全以及服務創新等多方面的挑戰。隨著讀者服務擴展至計算機、數字電視、手機、手持閱讀器、平板電腦、電子觸摸屏等多種服務終端,服務量的不斷增加,各業務系統每天都會產生大量的日志數據,其中包含了大量的用戶行為信息,進行數字資源整合必須結合大數據特點和資源現狀,以用戶需求為導向,博采眾長,突出特色,分階段、有計劃的實施。圖書館工作要順應大數據時代的發展,努力創新信息服務模式,開放網絡服務,不僅要關注師生的需求信息,并準確及時地提供相應的服務,還要分析挖掘相關的大數據,找出他們的潛在需求信息,進行個性化信息服務。大數據時代下的高校圖書館工作應在對傳統紙質文獻的搜集、整理與利用的基礎上,加強與開發大數據技術在圖書館工作中的應用,整合各種電子資源、文獻數據庫等館藏資源,跟蹤并記錄用戶的基本信息與信息行為,挖掘數據的應用價值,為高校師生提供高質量的信息服務。總之,高校圖書館要抓住歷史機遇,根據大數據的特點,充分運用大數據處理手段和技術,改變與提升高校圖書館的網絡服務模式,以人為本,優化資源建設,切實提高信息服務質量,為高校的事業發展作出應有的貢獻。
2 大數據環境下高校圖書館用戶需求的新特點
一般而言,大數據自身的特點及其作用構成了大數據環境,而圖書館用戶則會面臨著受到大數據環境對文獻資源獲取的影響,圖書館的資源組織與用戶服務需要必然要考慮大數據環境下對用戶行為的作用影響,以適應用戶新的需求。
1.全民社交性
大數據時代是一個知識共享、智慧共享、服務共享的時代,微博、微信、QQ等社交平臺初步構成了全民社交圈,每時每刻產生大量的數據信息。為順應這一發展趨勢,高校圖書館借助這一平臺,開展社交服務,將師生的討論、需求、閱讀興趣導向與館藏資源相結合,并在網絡環境中進行創新服務,時時互動,以符合全時段服務的時代特征要求。
2.信息獲取方式的多樣化
大數據時代下信息資源的獲取更加快捷與多樣化,傳統的閱讀方式發生了翻天覆地的變化,讀者可以借助計算機設備與現代化通信設備輕而易舉地獲取信息資源,對海量數據進行搜索,獲取有用的數據信息。新媒體下的數字化服務,帶來了閱讀的便捷與信息獲得的高效。
3.信息服務的交互性
大數據時代下,師生能夠隨時隨地的獲得所需的館藏信息,而圖書館服務系統則可以通過用戶的注冊、用戶的閱讀行為、用戶的學術研究方向等來獲取用戶的個性化信息。那么,雙方的交互使得師生可以根據自己的學習習慣、科研要求定制特色資源信息服務,而圖書館則可借助現代技術為師生用戶量身打造個性化服務,主動推送準確、及時的文獻信息。
3 圖書館資源建設優化
1、轉變管理思維
隨著數字圖書館發展進程的快速推進,高校圖書館資源建設已經經歷了由量變到質變的發展轉型階段,目前國內各高校圖書館的數字資源業務數據急劇增加,并已經超越了紙質業務數據。數字資源在建設、傳播、存取利用方面,具有傳統文獻無法比擬的優勢,已成為圖書館資源建設的核心內容。因此,高校圖書館應該著眼于數字資源的多樣化建設,除數據庫、電子圖書、電子期刊、電子學位論文等傳統形式外,還需要多加關注電子音樂、電子教參、數字圖片、電子藝術品等數字資源的建設。此外,智能終端等的采購應用也是實現數字資源多樣化建設的體現,它們基于網絡、流量、人機互動的信息傳播方式,讓閱讀行為更加多元,信息渠道更加豐富。endprint
大數據環境下,讀者習慣通過網絡獲取信息,希望更為方便地享受服務。所以在大數據環境下,高校圖書館需應更為關注讀者的個性化需求,而不應是圖書館的館藏資源等著讀者來使用。圖書館應實時動態地關注讀者的需求,積極主動地解決讀者潛在需求。總體而言,大數據環境下的圖書館管理思維應向敏銳抓取讀者的潛在閱讀需求并去滿足它的方向轉變。
2、適度調整各種資源的比重
一般圖書館的館藏資源包括印刷型文獻(以紙張為載體,如紙質書本)、縮微型文獻(以感光材料為載體,如縮微膠片)、聲像型文獻(以磁性材料為載體,如唱片)、計算機閱讀型文獻(電子期刊、電子圖書等)和網絡型文獻(以聯機方式為讀者服務)f=1。國內圖書館,特別是中小型圖書館往往注重印刷型文獻的館藏,而其他類型文獻的館藏很少。在大數據環境下,圖書館要轉變這種資源建設思維,要更為重視電子資源建設。隨著紙質圖書價格的上漲,從經濟角度考慮圖書館也應調整資源建設策略。所以高校圖書館應重視電子資源的建設,但電子資源采購經費比例則根據自身的實際情況講行把握。
3、注重非結構化數據的建設
現在中國圖書館提供的是基于結構化數據的服務,而半結構化數據和非結構化數據的增長速度遠遠大于結構化數據。據統計,2012年非結構化數據占有比例在互聯網達到7%,同時結構化數據和非結構化數據的年增長率分別為32%和63%。這意味著互聯網世界里非結構化數據的比例將不斷增大。在圖書館領域,每年結構化數據的增長是較為有限的,而與讀者有關的非結構化數據卻每天都在快速增長。所以高校圖書館應優化非結構化數據的收集與服務。高校圖書館應采用大數據技術,動態分析通過微信、微博、社交網絡等產生的與圖書館相關的讀者需求。這些需求是實時動態的,從而為讀者提供匹配的讀者需求。大數據環境下讀者閱讀特征是“3I" ;“交互式營銷(Interac-tivemarketing) " ,“即刻化傳播(Immediatelypropaga-tion } "與“買借同一性(Identicborrowandbuy ) "。所以大數據環境下的圖書館的資源建設過程中應注意與讀者的交互性和即刻性。
4、數據資源治理的轉型
高校圖書館的多樣化數字資源建設,帶來了海量的信息數據,各館普遍存在著重獲取輕管理、重數量輕質量、重使用輕安全的現象,因此高校圖書館界應樹立數據治理的理念,對數字資源的數據進行合理的分析、優化、重新整合,確保在使用過程信息數據的高質量性、安全性和可靠性。需要不斷擴大存儲容量,服務器采用新存儲技術和能力更強的大數據技術,轉向非結構化的存儲架構,構建存儲系統,在軟件、硬件上實現數據的系統化、信息化、標準化建設。以滿足對海量數據的分析處理、挖掘等運轉的要求,最大程度上實現信息資源的應有價值。
5、信息資源共享的轉型
在大數據的環境下,高校圖書館對數字資源的建設絕對不能只依靠自己的力量,要結合自身用戶需求以及自身學科優勢進行建設,并積極開展區域性的合作,實現館藏資源的共建共享,密切跟蹤開放獲取資源,聯合數據商研發可靠高效的信息資源存儲挖掘分析系統,來向讀者提供更經濟、更高效、更全面的館藏信息資源。
大數據環境下,面對信息“快速、簡單、準確”的要求,高校圖書館要全面提升服務能力。高校圖書館未來需加大資源的揭示力度,提供一站式服務,通過異構數字資源的融合、聚類和重組使資源從數據層的揭示與展現轉向信息層、知識層的深度服務;利用時間軸、地域軸等知識圖譜可視化展示方式將資源呈現給用戶;依托融合的物聯網、移動通信網以及互聯網絡進行傳播,最終實現為用戶提供電視、電腦、手機等多種終端的接收;加強用戶數據分析,實現個性服務;促進業界合作建設,實現共知共享。
參考文獻
[1]王詠梅.基于高校用戶網絡信息行為的高校圖書館信息資源建設[J].圖書館研究,2014(3)
[2]何建新.大數據時代高校圖書館的數字資源共享策略探討[J]現代情報,2014,34(9)
[3]熊健敏.大數據時代高校圖書館資源創新服務研究[J].浙江高校圖書情報工作,2014,(4)
[4]宋佳.大數據環境下圖書館資源建設與服務研究[J]圖書館學刊,2017,(5)
[5]史少凡等.基于大數據技術的高校數字圖書館資源建設研究[J].出版廣角,2016,(4)
作者簡介
梁逶,本科,副研究館員,貴州職業技術學院圖書館。endprint