關鍵詞:大數據;高校圖書館;學科服務;服務創新
摘要:文章在厘清大數據內涵的基礎上,詳細地討論了大數據環境下高校圖書館學科服務面臨的挑戰,并以研究型用戶為例剖析大數據在高校圖書館學科服務創新的應用能力,以揭示大膽求新、深遠影響和卓越領導,應是大數據環境下高校圖書館學科服務創新品牌的內涵。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2014)12-0062-02
收稿日期:2014-11-25
作者簡介:寧耀莉(1964-),玉林師范學院圖書館副研究館員。1大數據
1.1大數據的概念
“大數據”是指用現有的一般技術難以管理的大量數據的集合。由于數據量的增大,導致對數據的查詢(Query)響應時間超出允許范圍的龐大數據。與過去的數據源相比,大數據的速度(數據傳輸和接收的速度)、復雜度以及多樣性都有所增加。大數據的威力體現在人們所做的分析和所采取的行動上,而不是體現在“大”或“數據”這兩個方面。大數據通常由某類機器自動地生成,而且其格式通常并不是用戶友好的。默認的做法是先收集所有能收集到的數據,然后再考慮其中哪些是重要的。大數據是下一波新的、更大的、推動當前極限的浪潮。
1.2大數據的應用類型
其類型有很多,主要的處理模式可以分為流處理和批處理兩種。批處理是先存儲后處理,而流處理則是直接處理。大數據價值的完整體現需要多種技術的協同。文件系統提供最底層存儲能力的支持。為了便于數據管理,需要在文件系統之上建立數據庫系統,通過索引等的構建,對外提供高效的數據查詢等常用功能,最終通過數據分析技術從數據庫中的大數據提取出有益的知識。
1.3大數據的技術手段
Hadoop是目前最為流行的大數據處理平臺。除了Hadoop,還有很多針對大數據的處理工具。這些工具有些是完整的處理平臺,有些則是專門針對特定的大數據處理應用。事實上,大部分數據甚至毫無價值。一篇網頁日志中會含有非常重要的數據,但其中也包含了很多根本沒有價值的數據。對其進行提煉,從而保留有價值的部分是非常必要的。在進行數據分析時,駕馭新的、突破了當前可擴展性極限的大數據源是永恒的主題。為了更有效地處理大數據流,需要將新的工具、方法、技術和傳統的分析工具結合起來。從原始大數據流中提煉出有用信息,需要開發復雜的過濾算法。同時,建模和預測流程也需要更新,需要將大數據輸入添加到現有數據中。所以,高校圖書館學科服務必須利用最新的技術和方法開發更多的分析技術和流程,從而更加有效地分析和處理大數據。
2大數據環境下高校圖書館學科服務面臨的挑戰
2.1科學研究對象的虛擬化
大數據環境下科學研究對象的虛擬化,導致研究型用戶擁有更強的數字化交互式的信息管理能力需求。互聯網傳播迅速產生的海量科學數據以及大量來自互聯網的數據和信息成為科學研究的主要組成對象,使得研究轉變成以互聯網為基礎的高度協作性活動,對海量虛擬化的數據和信息進行有效管理,成為研究型用戶必須面臨的問題。
2.2科學研究需求的知識化
大數據環境下科學研究需求的深度知識化,導致研究型用戶擁有海量數據實時的分析挖掘需求。以互聯網為基礎的數字信息資源改變了研究型用戶的研究行為,數據的獲取不是問題的關鍵,而關鍵在于數據背后的深度知識挖掘以及研究型用戶需求專深化的問題。
2.3科學研究交流方式的便利化和多樣化
大數據環境下科學研究交流方式的便利化和多樣化,導致研究型用戶擁有科學數據融匯和多學科協同的信息資源共享需求。在數據密集型的科學研究學術交流過程中,交流方式隨著信息技術的不斷深入,而愈加便捷,但是對于整合所有科學數據和文獻,形成一個具有全球開放獲取的互操作世界,仍有相當大的差距。
2.4科學數據的全面整合與共享的挑戰
大數據時代的到來,使科學研究正在被大量密集型的數據所淹沒,在數據的分級、歸檔、備份和保護的問題上對數據共享的性能提出了挑戰。同時,科學研究大數據涵蓋了各類學科、各類層次研究人員或團隊、各個研究階段以及各類來源的數據集合,這些數據集合的多樣性與復雜性對其整合提出了挑戰。
3大數據在高校圖書館學科服務創新中的應用能力
3.1構建學科知識共享服務體系
共享服務離不開技術力量的支持。高校圖書館學科服務創新需要充分利用云計算、大數據技術,構建學科知識共享服務體系。該體系具有統一的協調合作組織、完善的規則制度、充裕的專項資金、合理的人才配置、豐富的知識資源等構成,在虛擬空間或物理空間,不同的研究型用戶和學科館員所擁有的知識進行自由碰撞、識別、融合、吸收、重構,實現知識分享與交流。誠然,在大數據環境下,廣西高校圖書館積極地借鑒CALIS廣西中心文獻資源“共建、共知、共享”的組織協調和建設任務的實踐,充分利用大數據存儲與處理技術,搭建高校圖書館學科知識共享服務平臺,設置學術互動社區,突出以人為本,即人力資源的重要性,達到人才與新技術二者完美融合,實現高校圖書館學科服務資源共建共享。要使這些項目的高效運行,必須進行政策引導及管理創新、拓展服務的功能、合理的補償機制研究、強化后臺服務支持等。
3.2打造研究型用戶的一線服務
高校圖書館學科服務創新在某種意義上極大地滿足了在研究型用戶面對的數據量大、結構多樣化、生成速度快、價值密度低的研究問題的個性化服務需求。因此,學科服務創新過程將數據管理與信息服務融入到科研一線,以專業的學科館員為基礎,采用諸如云計算、語義網、大數據處理等技術,構建具有強大的知識資源整合能力、海量知識分析能力、大數據挖掘能力和多維度知識可視化能力的集成平臺,以研究型用戶需求環境和需求趨勢為導向,是一種面向用戶發現問題、分析問題、解決問題和提供解決問題決策的知識展示、交互和推送的服務模式。學科服務創新是基于中知網、萬方、重慶維普、清華同方等數據庫,圍繞不同學科,構成二維空間,面向科研、分析以及決策人員提供的科技創新輔助決策報告知識咨詢。
寧耀莉:大數據環境下的高校圖書館學科服務創新探微寧耀莉:大數據環境下的高校圖書館學科服務創新探微3.3開展深度的知識咨詢服務
3.3.1作者科研協作關系。在檢索原文的文章詳細信息頁展示了基于元數據揭示作者文獻產出統計,包括按照研究主題、研究方向、發文期刊的文獻統計;揭示同方向研究作者、揭示作者單位和簡介。
3.3.2主題知識脈絡分析。在檢索到文章的詳細信息頁面、點擊圖標瀏覽該主題詞的知識脈絡關系,可視化圖表,揭示主題詞相關領域近些年的發文量。
3.3.3高校圖書館學科服務創新流程構建。目標是建立一個“以人為本”,即以作者為中心來展示多學科中文文獻的集成數據庫系統。該系統能夠完整地展現一般學科領域的大數據處理的基本流程,即從異構數據源,抽取、集成、分析、管理,直到最后的結果解釋,實現一系列的展示。高校圖書館學科服務的內容強調圍繞著知識咨詢,發現、挖掘、捕獲有用的知識點、知識單元,凝聚各類智力、知識、專業、工具應用的優勢,提供深度專業、個性化知識咨詢的服務。
3.4注重大數據的隱私問題
高校圖書館學科服務創新屬于高端服務,主要服務對象為研究型用戶。這些研究型用戶的核心隱性知識的保護在大數據面前顯得力不從心,其隱私面臨著人力和技術兩個層面的雙重考驗,應該在不暴露用戶個人隱私的前提下進行有效的數據分析和數據挖掘,這樣才能確保信息的安全性和完整性。所以,面向大數據的高校圖書館學科服務創新必須堅持保護研究型用戶的個人隱私權,深刻認識到自我約束和法律約束都是必需的,做到研究型用戶的個人信息在合理、合法的范圍內有效傳播。
4結語
大膽求新、深遠影響和卓越領導是大數據環境下高校圖書館學科服務創新品牌的內涵。面對大數據環境,高校圖書館需要轉變思想觀念,大膽面對挑戰,積極地研究大數據與學科服務組織內外數據相關性,達到為我所用,進而解決用戶的實際問題。為此,筆者認為,高校圖書館學科服務需要用科學的發展觀看待大數據環境下高校圖書館學科服務項目運行,以“降本增效”為軸心,全面評估服務創新效益;強化跨領域戰略設計與合作;提升信息安全機制級別,開發數據密集型計算方法[9];重視相關大數據的人才隊伍建設以及構建多維高校圖書館學科服務形態等措施,提升大數據環境下高校圖書館學科服務創新績效的效果。
參考文獻:
[1](日)城田真琴,周自恒譯.大數據的沖擊[M].北京:人民郵電出版社,2013:3.
[2](美)弗蘭克斯;黃海等譯.駕馭大數據[M].北京:人民郵電出版社,2013:4.
[3]初景利.學科館員對嵌入式學科服務的認知與解析[J].圖書情報研究,2012,(3):1-8,33.
[4]鄧仲華,李立睿,陸穎雋.大數據環境下嵌入科研過程的信息服務模式研究[J].圖書與情報,2014(1):30-34,40.
[5]于曦,高潔.基于用戶需求的高校圖書館嵌入式學科服務策略研究[J].情報理論與實踐,2014(5):73-75,82.
[6]韓翠峰.大數據時代圖書館的服務創新與發展[J].圖書館,2013(1):121-122.
[7]崔慧紅.基于大數據的CDRS知識整合研究框架構建[J].圖書館學研究,2013(17):27-30.
[8]容春琳.公共圖書館應用大數據的策略研究[J].圖書館建設,2013(7):91-95.
[9]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013(1):146-169.
(編校:馬懷云)