徐芳

摘 要:在信息技術的推動下,傳統的文獻信息資源收藏和服務模式已經無法滿足用戶不斷提高的使用需求,圖書館資源共建、共享、共知成為必然的趨勢,聯合目錄應運而生。本文主要對浙江省高校數字圖書館(ZADL)聯合目錄的建設實踐進行了具體的介紹,包括工作原理、數據采集、內容與功能、管理與維護等幾個方面,并對ZADL聯合目錄的特色進行了總結。
關鍵詞:數字圖書館;ZADL;聯合目錄
隨著信息技術和互連網絡的迅速發展,圖書館的“館藏”內容不斷擴展, “讀者”數量迅速增加,傳統文獻信息資源收藏和服務模式遭受著嚴重的沖擊。任何一個組織機構想憑借一己之力收藏全部的文獻資源,都是不可能的。圖書館資源共建、共享、共知成為必然的趨勢,聯合目錄系統也在這種環境下應運而生。
聯合目錄通過反映各成員館的文獻收藏,揭示和報道多個文獻收藏單位的文獻目錄,使圖書館能夠得到準確的館藏分布信息,以便對資源進行有效的協調配置;使讀者能夠實現跨庫搜索定位資源,為資源利用和增殖服務奠定基礎。聯合目錄是其它資源共享的基礎,對于圖書館來說,聯合目錄的建設提供了充分發掘各個圖書館館藏文獻的機會,文獻保障體系從單個圖書館的保障逐步過渡到區域性保障甚至全國保障。
1 浙江省高校數字圖書館聯合目錄建設概況
浙江省高校數字圖書館(Zhejiang Academic Digital Library,簡稱ZADL),是在浙江省教育廳領導下,由全省各個高校圖書館共同參與建設,服務于全省高校的數字化文獻保障服務體系。ZADL聯合目錄是浙江省高校數字圖書館的核心部分,旨在建設浙江省高校圖書館文獻資源目錄數據庫和目錄導航,全面整合和揭示全省高校圖書圖實體印刷型書刊文獻和虛擬數字資源的收藏、建設狀況,提高全省書目數據標準化著錄水平,方便各館進行文獻交流和館際互借,最終實現全省高校文獻資源共建、共知、共享。
目前聯合目錄的整體框架建設已基本完成。截至2014年初,ZADL已經匯集了大量數據信息 ,圖書方面,匯集了浙江省50多家高校圖書館的127萬多種圖書的書目信息,其中大部分為本科院校,亦有少量高職院校;期刊方面,匯集了浙江省24所本科高校的161個期刊數據庫的 56701萬種期刊;數據庫方面,匯集了浙江省高校圖書館的547個數字資源庫,其中中文數據庫208個,外文數據庫257個。ZADL聯合目錄數據庫服務體系由1個省級服務中心和5個高教園區分中心組成,向浙江省高校廣大師生提供聯合目錄的導航和檢索服務。
2 ZADL聯合目錄的工作原理
ZADL聯合目錄平臺以CERNET為依托,各高校圖書館通過對CERNET的連接來實現互連互通。省中心網絡通過千兆鏈路與校園網的主干相連,分中心以百兆上連到CERNET,采用TCP/IP網絡協議和星型拓撲結構,確保數字資源共享帶寬。為保證各中心的共享數字化資源服和能夠為各高校合法用戶使用,訪問權限可以用軟硬件通過IP地址控制來實現,省中心負責向CERNET申請IP地址,用于各中心資源服務器的對外服務,并通過硬件防火墻將數據中心分隔,根據相應的安全策略來控制數據訪問,防止非法訪問。關鍵的核心設備組網冗余連接,關鍵部件冗余配置,核心設備的配置能夠實現如組播、IPv6等多樣化的業務,網絡設備及網絡環境實行智能管理和監控。各分中心為ZADL在當地高教園區的統一匯集點以及信息資源的分發點。
在這樣的網絡技術保障下,ZADL聯合目錄采用集中管理的模式,即來自各成員館的數據匯集在一個數據庫中。基于z39.50協議或HTTP協議,成員館將各自的數據庫中的數據轉換成OAI(Open Archive Initiative)元數據,并通過Web方式進行發布,數據中心利用元數據收割機(Metadata Harvester)獲取這些數據,整合建庫,加工清理之后提供服務。采用自動收割的方式有效地解決了集中式聯合目錄不能動態反映各成員館的館藏情況的難題,基本保證了中心庫和各成員館數據庫之間的數據同步。
3 ZADL聯合目錄數據的采集
ZADL聯合目錄數據的采集分為三個部分,即圖書書目數據的采集,期刊數據的采集和數據庫數據的采集。
3.1 圖書書目數據的采集和處理
圖書聯合目錄采用兩種格式;即ISO格式和MARC格式。中文采用CNMARC格,西文采用CNMARC格式和USMARC格式或LCMARC格式。書目數據著錄標準與規范采用CALIS推薦的《中文文獻著錄原則》和《西文文獻著錄原則》,或國家圖書館推薦的中西文著錄規則。
3.1.1 OPAC書目數據的采集和處理
ZADL聯合目錄對OPAC數據采用自動采集的方式,由系統對OPAC中的數據進行自動收割。OPAC數據的采集功能支持支持aleph,innopac,ilas,匯文,金盤,圖創, 北郵等各類浙江高校圖書館自動化系統。
OPAC數據的采集:對于具有Z39.5開發接口的opac系統或具有查詢接口的opac系統,可以直接自動采集;對于無接口無直接讀取權限的opac系統,則可以采用頁面分析法,監控opac系統的最新更新榜單,實現自動采集;對于具有MARC數據庫讀取權限的系統,可以通過自動采集程序直接將MARC數據導出;自動采集程序可以設定每日實施采集更新的時間,一般設置在凌晨1:00-5:00之間,以避開系統訪問的高峰期。
OPAC數據的處理:通過導出程序得到的MARC數據首先要進行解碼,通過接口采集的數據無需解碼,解碼后的數據先進入到預處理數據庫;通過對預處理數據庫進行過濾和清洗工作,去除多余信息和編碼錯誤信息;與圖書書目總庫進行合并篩查處理,對于來源于不同圖書館相同版本的圖書書目進行合并根據書目總庫的圖書價值評分系統對圖書進行權重標識,按照分詞建立搜索索引。endprint