關鍵詞:大數據;圖書館管理;應用
摘要:近年來,大數據技術的應用推進了圖書館的信息化進程,為傳統圖書館管理提供了新平臺、新思路。大數據技術有利于構建圖書“大”資源、有利于實現圖書“快”管理、有利于推行圖書“精”服務。文章分析了大數據技術為圖書館帶來的影響,并提出了大數據技術在圖書館管理中的應用途徑。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2015)04-0112-03
收稿日期:2015-03-26
作者簡介:劉彧菲(1979—),大連圖書館館員。2013年,文化部下發的《全國公共圖書館事業發展“十二五”規劃》指出:“要不斷增強網絡條件下公共圖書館的數字文化產品供給與服務能力,引入先進的數字技術,創設服務便捷、覆蓋全媒體的數字文化服務網絡,最終形成網絡條件下的新型圖書館服務業態?!苯陙恚髷祿夹g在圖書館管理中的廣泛應用,推進了圖書館的信息化進程,為傳統圖書館管理提供了新平臺、新思路。
1大數據技術解析
美國的麥肯錫公司最早提出了“大數據”的概念,美國計算機研究機構Gartner將“大數據”定義為:大數據(Big Data)是指以分布式、虛擬化的海量存儲技術為依托,實現信息的實時擷取、管理、處理的新型信息技術。數據統計分析與預測的前置性是大數據的重要特征。Gartner將大數據的特征概況為四個“V”,即:海量性(Volume)、多元性(Variety)、價值性(Value)、實時性(Velocit)。根據Gartner預測,到2020年,大數據將成為現代信息技術的主流,全世界的大數據容量將達到40ZB。大數據技術不但可以存儲處理關系型與結構型信息,還可以存儲非關系型與非結構型信息,且傳輸速度快、使用價值高。大數據是以信息存儲的海量化信息承載、多樣化信息存儲、價值性信息利用、高速性信息傳播為特征的新型信息處理方式[1]。大數據實現了數據的去中心化、去權威化與交互化、平等化。大數據技術在圖書館管理中的應用,能夠為用戶提供更加人性化、個性化、高度集成化的窗口,打造社會化媒體平臺(UGC),打破了傳統信息傳播界線[2]。
2大數據技術給圖書館帶來的影響
對于圖書館管理來說,大數據技術的應用,使得圖書的整理、分類、存儲、保管、利用的流程能夠做到優化,推進了情報、圖書與館藏的結合,通過一體化的運作,增強了圖書館管理的實效性。
2.1大數據有利于構建圖書“大”資源
大數據將云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術相結合,實現了圖書的海量存儲。無論是結構型數據、半結構化、非結構化原始數據資源還是碎片化數據(例如:視頻、音頻各類原始學術數據等)都可通過云服務器進行存儲,實現了原有數據資源采集處理模式的創新,推進了系統架構的重新優化配置,突破了傳統圖書管理的空間、時間與存儲器容量的限制?;谠朴嬎愕却髷祿幚砑夹g的圖書館管理更加高效快捷,將傳統的圖書館存儲“去邊界化”,真正實現了圖書管理以用戶需求為目標導向。
2.2有利于實現圖書“快”管理
紙張一直是傳統圖書館信息傳遞的主要載體和媒介。在紙質圖書時代,圖書的收集、整理、分類、存貯、統計、保管、檢索、匯編加工、開發利用等環節主要都是依靠手工來進行,即便是在傳統的計算機管理時代,圖書的“收集、整理、分類、存貯、統計、保管、檢索、匯編加工、開發利用”等各個環節也是互相脫節,而大數據技術的應用,可以為圖書館有針對性地開展個性化信息服務提供良好的條件,提高了數據分析與處理的能力,不但可以處理復雜的數據,還可以進行制作、加工、傳播、轉換和二次開發,依靠識別、組織、高智能、高速度的優勢,簡化圖書管理程序,推進各個環節的資源整合,大大提高圖書管理效能。
2.3有利于推行圖書“精”服務
在傳統的計算機管理時代,由于受功能、容量與速度的限制,計算機只是輔助的存儲工具,無法進行大容量數據的分析預測,大數據技術的應用,則實現了圖書管理的智能化。大數據技術的出現,使得圖書管理進入了“第四范式”,推進了數據價值的密集型館藏建設。以信息加工處理、分析預測、類化聚化能力見長的大數據技術,能在可視化、互動化的平臺上為用戶提供各項服務。它不但擁有海量的存儲功能,同時還具有數據整合、分析、挖掘與預測功能,形成圖書的智慧分析庫,能夠為更多公共圖書館用戶提供個性化、網絡化、智慧型、量身定制的服務。
3大數據時代圖書館管理推廣的途徑
3.1環節優化,推進“收集、整理、保存、利用”新鏈條
要不斷優化圖書“收集、整理、編目、儲藏、統計、保管、檢索、匯編加工、開發利用”的價值鏈條,利用大數據技術進行全流程控制[3]。在圖書的收集過程中,可利用大數據的Hadoop(高度可擴展的分布式批量處理系統)功能,利用分布式客戶端對數據進行收集,進一步提高收集的實效性,促進收集工作的精細化;在整理、分類、存儲、統計、保管過程中,利用DFS(分布式文件系統),將相關數據上傳到SaaS和SOA服務器中,不但實現了海量的資源存儲,保障了數據的安全性,同時也實現了“即用即取”;在開發利用階段,利用大數據的數據分析與預測功能RDBMS(關系型數據庫管理),通過關系型數據庫管理系統復合型的架構,來反映整個數據庫的數值變化趨勢。同時,還可對用戶的圖書利用情況進行數據挖掘,對用戶群進行精準細分,并通過深入挖掘這些數據來了解用戶需求,對每個用戶的圖書使用次數、頻率分布、圖書使用內容、特征、需求偏好等方面進行分析,使圖書館工作更貼近用戶需求。此外,還可將大數據與手機、網站等平臺相結合,為用戶提供終端,使圖書使用者能夠“隨時隨地”使用圖書資源。
劉彧菲:大數據技術在圖書館管理中的應用研究劉彧菲:大數據技術在圖書館管理中的應用研究3.2內容驅動,深化復雜數據分析技術新應用
在大數據時代,應將圖書館的內容作為重要的特色資源進行挖掘。作為特色資源,圖書館必須能夠為客戶帶來全新的體驗,增強客戶選擇圖書館進行閱讀的“砝碼”,并使圖書館形成品牌化優勢來吸引讀者。要利用大數據技術推進圖書館的“去中心化”“去權威化”“去官方化”,使之更加親民,更加能夠貼近讀者的需求。使用大數據技術能將更多的圖書作品展示給讀者。同時,還應善于利用大數據的挖掘與分析工具,進一步推進聚化、類化、可視化、數據融合與數據集成等技術的應用,要通過圖書日志,對讀者的閱讀行為、偏好、關鍵詞、主題、內容進行分析。當前,我國的一些圖書館在“結構化數據”方面做得較好,但是在“非結構化”數據方面做得明顯不夠,筆者認為當務之急,是在非結構化數據、半結構化數據等方面(如視頻影像、音頻、圖片)大力推進聚化、類化、可視化、數據融合與數據集成等技術,使得圖書館的內容與館藏、讀者的個性化需求進行無縫對接,建立起讀者閱讀日志與關聯規則、內容分類和用戶聚類之間的密切聯系。二要做好內容的分析。利用大數據技術與Saas云服務器建立聯系,要增強海量用戶行為信息的處理能力,推進圖書館業態的整合,從海量數據中篩選有用信息,對用戶的忠誠度、資源的有效性、圖書館的發展趨勢進行充分分析,將傳統的以“實體”為主導的圖書館真正轉變為以現代大數據技術為主導的圖書館。
3.3流程組合,搭建圖書服務新平臺
推進媒體的流程組合,搭建圖書服務新平臺。對于新時期的圖書館來說,在大數據理念下的發展是一項“系統工程”,只有探索更加有效的業務流程與圖書館管理鏈條,推進業務的“大循環”,打造行業優勢,才能夠在大數據的技術變革中獲得生存的一席之地。
3.3.1推進圖書館業務流程的“業務優化”。要利用大數據技術推進圖書館與數據供應商、出版社和企業的一體化,使得各類工作能夠與圖書管理實現聯動,拓展移動圖書館等信息資源增值服務,實現不同用戶群體的信息共享與利用。在圖書管理中,利用大數據,可更好地將圖書管理與數據供應商、出版社和企業進行職能劃分。樹立共同的目標導向,共同為讀者的閱讀需求服務。
3.3.2將讀者納入到圖書館業務中,擴大圖書資源總量。要發揮讀者在圖書館建設中的重要性,推廣DaaS(上傳與查詢服務)技術,為每個讀者發放數據終端上傳虛擬商品,將圖書的閱讀與資源的上傳相聯系。讀者通過上傳圖書資源,可以獲得相應的積分,然后通過積分又可以得到閱讀更多圖書資料的權限。這不僅能促使讀者及時、完整地將數據上傳到圖書收集服務器,還有利于實現“全民”參與圖書館建設。把每個用戶看作“自媒體人”,要營造開放、共享、鼓勵用戶進行個人創造的圖書館資源建設環境,滿足用戶的交流、共享、表達權利。在學術科研項目中,也可以利用大數據實現學術圖書與研究項目的互動,通過方差分析、判別分析、仿真模型、神經網絡分析、Web 挖掘等技術,為學術項目的進展提供“跟蹤式”“保姆式”服務,搭建圖書館學術研究的新平臺,使圖書資源成為學術科研的“知識百科”,使其可以隨時隨地調取資源,實現圖書與學術研究兩者的良性互動,形成一種新型的、分布式的和整合式的資源集成平臺。
3.3.3提升服務能力和運作效率,提高個性化知識服務的水平。目前,我國科技信息研究所啟動了“科技報告”項目,國家圖書館則啟動了“國家記憶”項目,這些項目都是建立在“科技研發-圖書館資源”一體化的基礎上的。同時,美國與歐洲的一些圖書館也在利用大數據技術不斷地加快新型圖書服務平臺的構建。歐洲啟動了“科學圖書”計劃。美國將圖書館建設與科技創新相結合,推出了“數字化圖書未來規劃”“大數據研究與發展計劃”,將圖書館平臺的建設上升為國家層面的戰略。規劃目標為到2020年,美國圖書館通過大數據的建設,館藏數量將達到800TB,并且90%以上屬于傳統技術難以處理的非結構化數據,如音視頻、圖片、網頁等。美國國會圖書館推出了“美國記憶”項目,通過云服務器平臺,讓美國全民參與到圖書館“美國記憶”資源建設中來,為廣大讀者分配用戶上傳終端,讀者可以將與“美國記憶”相關的圖書、視頻、音頻、文本等方面的資源通過終端上傳到云服務器。大數據新平臺的建設,不但豐富了館藏資源,同時也拓展了圖書館的服務途徑。
3.4平臺拓展,探索圖書營銷創新新手段
利用數據技術,圖書館有必要對傳統的“等客上門”的意識進行改進,真正地樹立“圖書營銷”意識,將圖書館提供圖書的行為作為一種營銷的方式。進一步推進圖書館平臺拓展,探索圖書館營銷創新的新手段[4]。
3.4.1充分利用圖書、情報工作環節的相似性,推進圖書營銷工作。2013年我國文獻信息資源共享會議中提出“要積極建立全國文獻信息資源共享協作網,明確組建圖書、情報工作的協調網絡。”在未來的發展中,要進一步利用“大數據”實現圖書、情報與圖書工作的有效銜接和整合,構建電子數據平臺,合理進行信息資源的布局,推進圖書館與圖書館間的館際互借,實現橫向聯合,體現大數據的“大價值”[5]。如北京大學圖書館利用大數據開發SOA大數據情報系統,為用戶提供統一的主題標引規則、元數據格式,以及統一的資源檢索途徑,實現圖書、情報聯合上網。同時,還收集了學生的“圖書”閱讀數據,并把這些數據作為圖書建設的有效依據,對圖書資源庫建設進行完善,使圖書資源更有效地滿足圖書使用者的需求。
3.4.2開展更加靈活的營銷方式。在互聯網思維風靡全球的今天,要利用大數據揚長避短、開拓創新,使營銷方式更加有效,拓展圖書館在大數據時代的生存與發展空間,要適應數據的豐富性與多樣性[6]。引入SoLoMo(社交、本土、移動)等營銷新模式,建設微資源體系。依托大數據、利用新一代互聯網技術,在微博、微信、易信、QQ空間、豆瓣等社交平臺上進行圖書館資源營銷的推廣;要突出圖書館建設的“本土”特色,與本土人文、經濟社會發展相結合,使之更好地服務于本土,使圖書館建設更加“接地氣”;要通過圖書館移動平臺建設與互聯網手機新技術的結合,建立圖書館“微資源體系”和“移動資源體系”,使之更好地滿足用戶需求。例如:北京大學圖書館在2013年啟動了紀念微電影《天堂圖書館》項目,該項目充分利用移動平臺與本土資源,將學生納入項目建設中,由大學生自編、自導、自演,使之作為北大圖書館營銷的重要利器。影片拍攝成功后,僅一天的網絡點擊量就達30萬次,大大提升了北大圖書館的知名度,達到了推廣的目標。
總之,大數據技術的應用將傳統圖書館的“信息貧乏”轉變為“信息過載”[7],改進了圖書館的管理方式,推進了圖書館的信息化進程,為傳統圖書館管理提供了新平臺、新思路。大數據技術有利于構建圖書“大”資源、有利于實現圖書“快”管理、有利于推行圖書“精”服務。在未來的發展中,通過實現四個“推進”——推進“收集、整理、保存、利用”新鏈條,推進內容驅動、深化復雜數據分析技術新應用,推進流程組合、搭建圖書服務新平臺,推進平臺拓展,探索圖書營銷創新手段,進而充分發揮大數據技術在圖書館管理中的價值。
參考文獻:
[1]來紅梅.大數據時代圖書館信息服務面臨的挑戰與對策[J].圖書館學刊,2014(3):30-31.
[2]楊海燕.大數據時代的圖書館服務淺析[J].圖書與情報,2012(8):15-17.
[3]陳臣.基于大數據的圖書館個性化服務安全體系構建研究[J].新世紀圖書館,2014(11):20-21.
[4]韓煒.大數據時代公共圖書館消除數據不平等的路徑選擇[J].圖書館論壇,2014(3):10-11.
[5]嚴浪.大數據在圖書館的應用與對策[J].圖書館學刊,2014(5):7-8.
[6]劉春穎.大數據在圖書館的應用研究與探討[J].農業圖書情報學刊,2014(10):21-23.
[7]江云,李鳳蘭.大數據在我國圖書館的應用及推進研究[J].圖書館工作與研究,2014(6):15-17.
(編校:周雪芹)