孫慧


摘要:數(shù)字資源整合問題的研究起源于20世紀90年代后期,隨著計算機技術(shù)和大數(shù)據(jù)技術(shù)的發(fā)展,國內(nèi)外數(shù)字資源整合策略層出不窮,但仍不能滿足目前高校學科服務(wù)的需求。本文提出一種基于學科服務(wù)的圖書館數(shù)字資源整合策略,并對數(shù)字資源整合的數(shù)據(jù)源、處理技術(shù)、管理技術(shù)及個性化服務(wù)等方面進行了詳細的介紹。
關(guān)鍵詞:數(shù)字資源整合;大數(shù)據(jù);高校圖書館;學科服務(wù)
0引言
大數(shù)據(jù)時代的到來,使數(shù)字資源數(shù)量呈指數(shù)級增長。圖書館要想保證服務(wù)質(zhì)量,轉(zhuǎn)換服務(wù)模式,進行數(shù)字資源整合是一項重要舉措。利用大數(shù)據(jù)的技術(shù)不斷完善豐富電子資源結(jié)構(gòu)、豐富電子資源內(nèi)容,不斷提高以用戶為中心的個性化專業(yè)需求,進而提供更高層次的讀者服務(wù)。學科服務(wù)是讀者服務(wù)中最重要的一項內(nèi)容,依據(jù)學科服務(wù)實現(xiàn)數(shù)字資源的整合不僅可以實現(xiàn)數(shù)字資源的自動化,保證數(shù)字資源組織的完整性,同時也可以促進學科服務(wù)水平的進一步提升。
1 數(shù)字資源整合的發(fā)展
圖書館數(shù)字資源的整合起步較早,有很多學者進行了深刻的研究,主要經(jīng)歷了從理論研究、應(yīng)用研究、技術(shù)研究等三個主要發(fā)展階段,主要從數(shù)字資源整合方式、整合方法及整合技術(shù)等三個角度進行研究。目前流行的數(shù)字資源整合方式主要是基于導(dǎo)航系統(tǒng)的數(shù)字資源整合、基于OPAC系統(tǒng)的數(shù)字資源整合、基于鏈接系統(tǒng)的資源整合及基于跨庫系統(tǒng)的數(shù)字資源整合。
2 目前高校圖書館數(shù)字資源整合模式分析
目前國內(nèi)外高校圖書館數(shù)字資源整合已經(jīng)步入正軌,數(shù)字資源整合方法也不斷更新,每次資源整合模式的革新都會對圖書館的服務(wù)產(chǎn)生重要的影響。
2.1 基于OPAC系統(tǒng)的數(shù)字資源整合
基于OPAC系統(tǒng)的數(shù)字資源整合模式起步較早,使用范圍廣泛,是國內(nèi)圖書館最受歡迎的一種數(shù)字資源整合方式,這種數(shù)字資源整合模式的核心在于圖書資源的整合,并逐漸向其它形式的文獻類型進行延伸整合,基于OPAC系統(tǒng)的數(shù)字資源整合主要分為橫向和縱向整合兩種。其中橫向整合是通過館內(nèi)的OPAC系統(tǒng)界面,不僅可以查閱本館還可以查閱其它館的數(shù)字資源:縱向整合是通過本館的OPAC系統(tǒng)不僅可以查閱本館的圖書資源,還可以查閱本館的其它形式的數(shù)字資源。
目前國內(nèi)高校中橫向及縱向全部整合的數(shù)量較少,尤其縱向整合程度較低,而大多數(shù)圖書館的整合主要集中在整合數(shù)字資源的形式上,無法提供內(nèi)容層面的服務(wù)及為讀者提供個性化服務(wù)。
2.2 基于導(dǎo)航系統(tǒng)的數(shù)字資源整合
基于導(dǎo)航數(shù)字資源整合的方式是應(yīng)用相對成熟的整合方式,主要分為整體導(dǎo)航和部分導(dǎo)航。如:清華大學的電子資源/數(shù)據(jù)庫導(dǎo)航系統(tǒng),是按照學科分類、文獻類型及字母順序等提供的數(shù)字資源導(dǎo)航服務(wù),其最大的優(yōu)點是可以對龐大數(shù)字資源進行有效的排序和整理,方便讀者查閱和瀏覽。
基于導(dǎo)航的數(shù)字資源整合方式的缺點是只實現(xiàn)了資源形式層面的整合,不能深入到每種數(shù)字資源的內(nèi)容層面。
2.3 基于鏈接系統(tǒng)的數(shù)字資源整合
基于鏈接系統(tǒng)的數(shù)字資源整合的方式。就是將圖書館的各種類型資源通過參考引文將知識點鏈接起來,構(gòu)成強大的知識圖譜,該種整合方式可以提供用戶基于內(nèi)容層面的服務(wù),但整合過程較復(fù)雜。
2.4 基于跨庫檢索系統(tǒng)的數(shù)字資源整合
基于跨庫檢索系統(tǒng)的數(shù)字資源整合,是基于導(dǎo)航系統(tǒng)數(shù)字資源整合的擴展和延伸,改進基于導(dǎo)航系統(tǒng)不能實現(xiàn)數(shù)字資源內(nèi)容層面整合的不足,深入到整合系統(tǒng)的內(nèi)部。主要涉及第一層次的檢索界面和第二層次數(shù)字資源系統(tǒng)的分布式異構(gòu)跨庫整合檢索。
3 大數(shù)據(jù)環(huán)境下基于學科服務(wù)的圖書館數(shù)字資源整合模型
大數(shù)據(jù)時代,不斷革新的數(shù)字資源整合方式給圖書館帶來資源利用便捷的同時,也給圖書館資源與服務(wù)的提升帶來了強大的挑戰(zhàn)。傳統(tǒng)的數(shù)據(jù)處理方法已經(jīng)很難應(yīng)付龐大、種類繁多、結(jié)構(gòu)形式不統(tǒng)一且更新快速的數(shù)字資源。在重視資源利用的同時,更應(yīng)該對資源進行有效梳理,整理同類資源,歸納同學科資源,提高數(shù)字資源的利用率。本文提出一種基于學科的圖書館數(shù)字資源整合模型,不僅可以將大量的數(shù)據(jù)資源進行有效整合,同時可以為學科發(fā)展、文獻建設(shè)及科研建設(shè)助力。
本文吸取了各種圖書館數(shù)字資源整合模式的優(yōu)點,詳細分析了數(shù)字資源整合模式的過程,構(gòu)建了一個基于大數(shù)據(jù)環(huán)境下的四層學科服務(wù)數(shù)字資源整合模型,該四層框架如圖1所示。主要內(nèi)容為基于學科的數(shù)字資源搜集整理,進行基于學科服務(wù)的大數(shù)據(jù)的處理與分析,為學科發(fā)展、文獻資源建設(shè)和科研動向作為支持,最終實現(xiàn)個性化服務(wù)功能,這四層模式缺一不可,相互依賴。
在這種數(shù)字資源整合模型內(nèi),大數(shù)據(jù)環(huán)境下的學科資源數(shù)據(jù)是模型的基礎(chǔ)。實現(xiàn)個性化服務(wù)為最終目標,通過這種數(shù)字資源整合模型,不僅加強了讀者和數(shù)據(jù)信息的交流,而且從根本上定位了學科服務(wù)的基礎(chǔ)。
4 大數(shù)據(jù)環(huán)境下基于學科服務(wù)的圖書館數(shù)字資源整合體系
圖書館數(shù)字資源整合體系最重要的組成部分就是數(shù)據(jù),基于數(shù)據(jù)為讀者提供個性化的服務(wù),下面主要從數(shù)據(jù)源、數(shù)據(jù)管理以及數(shù)據(jù)的服務(wù)三個方面來介紹數(shù)字資源整合體系。
4.1 基于學科服務(wù)的數(shù)字資源整合數(shù)據(jù)源
基于學科服務(wù)的數(shù)字資源整合體系建設(shè)的關(guān)鍵是學科資源數(shù)據(jù)。學科數(shù)據(jù)的規(guī)范性和全面性是學科服務(wù)的基礎(chǔ)。學科資源數(shù)據(jù)包括學術(shù)數(shù)據(jù)、衍生數(shù)據(jù)、事實數(shù)據(jù)、用戶數(shù)據(jù)、行為數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù),具體信息見表1.
4.2 基于學科服務(wù)的數(shù)字資源處理技術(shù)
數(shù)字資源的整合處理技術(shù)主要包括數(shù)據(jù)獲取、數(shù)據(jù)存儲以及數(shù)據(jù)分析技術(shù)。其中數(shù)據(jù)獲取技術(shù)包括API數(shù)據(jù)的抓取、Excel清單數(shù)據(jù)、FTP下載數(shù)據(jù)、XML清單數(shù)據(jù)以及生成的MARC數(shù)據(jù):數(shù)據(jù)存儲技術(shù)主要包括結(jié)構(gòu)化數(shù)據(jù)存儲、半結(jié)構(gòu)化數(shù)據(jù)存儲、非結(jié)構(gòu)化數(shù)據(jù)存儲;數(shù)據(jù)分析技術(shù)主要有離線分析、準實時分析、實時分析、圖片識別、語音識別及機器學習等。
4.3 基于學科服務(wù)的數(shù)字資源管理技術(shù)
基于學科服務(wù)的數(shù)字資源整合管理技術(shù)主要有:基于學科的電子資源管理系統(tǒng)、數(shù)據(jù)查重及驗收管理、數(shù)據(jù)組織管理、元數(shù)據(jù)管理、數(shù)字資源運行管理和數(shù)據(jù)接口管理等技術(shù)手段。其中電子資源管理系統(tǒng)是以數(shù)據(jù)驅(qū)動為核心的學科數(shù)字資源采購管理系統(tǒng),優(yōu)化了學科數(shù)字資源的管理流程,提升管理效率、資源采購及使用的科學性:數(shù)據(jù)查重及驗收管理技術(shù)可針對指定數(shù)據(jù)庫元數(shù)據(jù)與資源庫進行文獻重復(fù)度分析,并出具詳細報告:數(shù)據(jù)組織管理技術(shù)是面對各學科的教學、科研、學科服務(wù)的數(shù)據(jù)資源匯編,提升各學科核心數(shù)字資源展示度和使用率:元數(shù)據(jù)管理技術(shù)可以根據(jù)數(shù)據(jù)廠商、數(shù)據(jù)類型、學科分類多個維度對元數(shù)據(jù)進行組織查看與分析,可以使圖書館擁有對大數(shù)據(jù)中心的統(tǒng)計、分析、調(diào)整等掌控能力:數(shù)字資源運行管理技術(shù)可以通過對平臺整體運行數(shù)據(jù)進行分析;數(shù)據(jù)接口管理技術(shù)支持以接口方式實現(xiàn)數(shù)據(jù)的流通與交換。
4.4 基于學科服務(wù)的圖書館數(shù)字資源個性化服務(wù)
目前各高校的資源建設(shè)評價系統(tǒng)尚不完善,還處于盲目建設(shè)資源的階段,不能精準的定位讀者需求。通過圖書館學科服務(wù)數(shù)字資源數(shù)據(jù)的獲取、處理及管理,可以協(xié)助圖書館更加精準的進行資源建設(shè)的同時為各學科專業(yè)的發(fā)展情況及教師的需求情況進行分析,為其提供更精細的服務(wù)。此外,通過文獻、讀者和科研分析報告等形式,圖書館可以更加準確地預(yù)測各學科的科研動向,為各學科科研人員提供更精準的個性化科研信息服務(wù)。
5 結(jié)束語
本文論述了圖書館數(shù)字資源整合的發(fā)展流程,分析了當前熱門的四種數(shù)字資源整合模式優(yōu)缺點,提出了一種基于學科服務(wù)的圖書館數(shù)字資源整合策略,并對數(shù)字資源整合體系進行了詳細地概述,為未來學科服務(wù)和資源建設(shè)的研究奠定了堅實的基礎(chǔ)。