程羅德 郭顯久 盧笑明 張仕春



摘要:本文首先對高校數(shù)字化圖書網(wǎng)絡(luò)資源平臺環(huán)境的建設(shè)、應(yīng)用、發(fā)展及特點進行具體闡釋,為了解決讀者對數(shù)字資源索取和互動的服務(wù)需求,對資源數(shù)據(jù)的集成、加工和交互訪問進行了設(shè)計。采用LAMPWEB技術(shù)框架搭建通用、跨平臺、高性能Web Server平臺,構(gòu)建集成數(shù)據(jù)、多元服務(wù)、快速響應(yīng)的應(yīng)用環(huán)境。在平臺環(huán)境設(shè)計建設(shè)過程中注重功能性、便捷性、繼承性等因素,對數(shù)字化校園建設(shè)環(huán)境下的數(shù)字圖書網(wǎng)絡(luò)資源平臺進行了設(shè)計、文獻資源庫建設(shè)、服務(wù)與管理等方面深入探討。詳實介紹了數(shù)字網(wǎng)絡(luò)資源平臺和環(huán)境建設(shè)設(shè)計原則、模式、策略、關(guān)鍵技術(shù)、功能模塊設(shè)計等,并給出具體配置和應(yīng)用。
關(guān)鍵詞:數(shù)字;虛擬化;集成;協(xié)議
中圖分類號:G250 文獻標(biāo)識碼:A 文章編號:1671-1580(2017)08-0165-04
一、引言
本文以大連海洋大學(xué)讀者為服務(wù)對象,根據(jù)我校數(shù)字化校園URP建設(shè)及管理需求,基于校園網(wǎng)龐大而豐富的資源優(yōu)勢,進行整合與利用,提供一個數(shù)字資源個性化互動、共享型服務(wù)平臺。計算機信息技術(shù)在圖書館領(lǐng)域的快速應(yīng)用和發(fā)展,促使高校圖書館資源存在及服務(wù)模式發(fā)生很大的改變,出現(xiàn)了讀者對數(shù)字圖書資源需求的維度化、時空化、個性化等趨勢和特點。高校圖書資源需求應(yīng)用中讀者不同數(shù)字資源需求、個性化定制索取、高效管理服務(wù)及其在應(yīng)用過程中訪問角色優(yōu)化設(shè)計,已成為URP建設(shè)項目應(yīng)用過程中的重要研究內(nèi)容。本文在傳統(tǒng)圖書資源建設(shè)及服務(wù)讀者模式的基礎(chǔ)上,構(gòu)建新型圖書數(shù)字資源建設(shè)及服務(wù)管理平臺,并提出了數(shù)字資源供應(yīng)鏈管理模式,采用數(shù)據(jù)共享中心集成技術(shù),設(shè)計讀者與虛擬平臺點對面、點對點互動資源利用的友好型環(huán)境,真正做到圖書資源平臺應(yīng)用的虛擬化、數(shù)字化和個性化服務(wù)。
二、高校圖書資源建設(shè)發(fā)展現(xiàn)狀及特點
圖書資源建設(shè)在不斷發(fā)展和變化,其大致經(jīng)歷了現(xiàn)場采訪最基本的信息源采集——藏書補充一定程度上的規(guī)模化——藏書建設(shè)出入互逆的動態(tài)性——文獻資源建設(shè)協(xié)調(diào)與共享——今天數(shù)字化資源建設(shè)的過程。信息技術(shù)的發(fā)展與應(yīng)用,促使圖書館文獻資源載體多樣化的種類出現(xiàn),傳統(tǒng)的單一紙質(zhì)文獻資源向多元化趨勢發(fā)展,形成了傳統(tǒng)實體與當(dāng)前網(wǎng)絡(luò)虛擬館藏資源共存的應(yīng)用局面。共享、便捷、多元、個性等特點已成為圖書資源建設(shè)的重要組成要素,建設(shè)一個可靠性高、持續(xù)性強、內(nèi)涵豐富的圖書資源環(huán)境,打破信息化所產(chǎn)生的“數(shù)字鴻溝和信息孤島”,使讀者在技術(shù)成熟的信息環(huán)境下對資源所需即所得,已成為數(shù)字化校園建設(shè)的重要組成部分。
三、圖書館數(shù)字資源建設(shè)原則模式及關(guān)鍵技術(shù)
(一)數(shù)字資源建設(shè)原則
高校數(shù)字圖書資源環(huán)境平臺的設(shè)計和建設(shè)主要以校內(nèi)、校際之間師生讀者為使用和服務(wù)對象,面對在量和型的龐大規(guī)模的對象群體、豐富和龐雜的網(wǎng)絡(luò)信息資源進行數(shù)字化的建設(shè),在設(shè)計時必須考慮到針對性和目的性原則,對各類型信息資源進行有的放矢的規(guī)劃和建設(shè)。在虛擬數(shù)字化館藏資源平臺建設(shè)中,緊扣學(xué)校特色,充分利用和發(fā)揮信息技術(shù)優(yōu)勢,形成自己的館藏資源特色,凸顯特色化原則,建成具有特殊意義的現(xiàn)代圖書館。遵循資源共享原則,在資源數(shù)量龐大、類型多樣的網(wǎng)絡(luò)信息環(huán)境下,如果分工不協(xié)調(diào),獨立開發(fā),必將增大建設(shè)成本投入的重復(fù)性。結(jié)合自身學(xué)校圖書資源建設(shè)實際情況,尤其是面對多個校區(qū)單館或多館的文獻資源體系,必須全局考慮、統(tǒng)籌規(guī)劃,形成一個合作、依存、共享的數(shù)字文獻體系,使資源平臺環(huán)境在應(yīng)用和服務(wù)過程中充分體現(xiàn)出知識與對象的結(jié)合度和共享性。
在圖書館數(shù)字資源建設(shè)過程中,遵循標(biāo)準(zhǔn)化和規(guī)范化原則也很重要,從整個信息源來看,圖書館及提供內(nèi)容都不再是一個獨立的信息節(jié)點,而是源中的一個節(jié)點,那么節(jié)點之間信息數(shù)據(jù)的交互與訪問、共享等,必須在統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范下才具有時效性、通用性和安全性。以資源最大化利用為目的的建設(shè),不能忽視使用對象、讀者層次、不同需求、需求的變化等方面的因素,以便及時調(diào)整資源結(jié)構(gòu),以提高數(shù)字圖書網(wǎng)絡(luò)資源的使用效率。
(二)數(shù)字資源建設(shè)模式與策略
供應(yīng)鏈模式的宗旨在于創(chuàng)造并保持整個鏈條中的競爭優(yōu)勢和價值,使整個體系達到最優(yōu)狀態(tài)。它通過信息流、物流、資金流將鏈中的各個節(jié)點連成一個整體的功能網(wǎng)鏈結(jié)構(gòu)模式。在數(shù)字圖書資源設(shè)計與建設(shè)中,我們提出并應(yīng)用了“即時即控、并聯(lián)結(jié)合”模式,突破圖書館內(nèi)部各信息資源節(jié)點,將節(jié)點擴展到館外單位和部門信息節(jié)點,將節(jié)點匯成資源池,融合成一條價值鏈,采用“線下溝通、線上控制”的數(shù)據(jù)信息審核控制及訪問策略,實現(xiàn)數(shù)字圖書資源的有效管理。運用SWOT態(tài)勢分析法從節(jié)點環(huán)境和集群因素同時進行分析,制定數(shù)字文獻資源計劃,集成校內(nèi)外的數(shù)字資源,形成數(shù)據(jù)集成與共享中心,使各個節(jié)點協(xié)調(diào)相互之間的關(guān)系,發(fā)揮大數(shù)據(jù)資源池的最大化作用。
改變紙質(zhì)文獻資源規(guī)模體現(xiàn)的觀念,面對挑戰(zhàn),將館藏建設(shè)轉(zhuǎn)向信息資源建設(shè),以讀者信息需求為導(dǎo)向,在供應(yīng)鏈模式內(nèi)部的節(jié)點采集、加工、組織、存儲、網(wǎng)絡(luò)訪問、開發(fā)利用等方面,下大功夫做好文章。
在大數(shù)據(jù)背景下,對數(shù)字資源的設(shè)計和建設(shè)必須整體規(guī)劃,建立多級保障體系,實現(xiàn)數(shù)據(jù)的集成共享,這是圖書館發(fā)展的趨勢和方向。如果做不到整體規(guī)劃和標(biāo)準(zhǔn)規(guī)范,就無法實現(xiàn)數(shù)字文獻資源的共建、共享和共知,更無法建立多層次、相對集中、多級互連的數(shù)字化文獻資源保障體系。無論是信息節(jié)點還是信息群,都要從整體進行協(xié)調(diào),建設(shè)一個合作、共享、互利的文獻資源保障鏈條,對減少重復(fù)建設(shè)、提高資源利用率具有重要作用。
(三)資源數(shù)據(jù)整合與共享技術(shù)
目前,較為流行的數(shù)字資源整合協(xié)議有Z39.50、SOAP、OAI、OpenURL等,Z39.50協(xié)議主要應(yīng)用于圖書館聯(lián)機書目檢索服務(wù),能夠?qū)崿F(xiàn)跨多庫數(shù)據(jù)檢索,格式規(guī)范,過程簡化,同時能實現(xiàn)異構(gòu)數(shù)據(jù)或系統(tǒng)之間的通信。開放文檔先導(dǎo)OAI協(xié)議從元數(shù)據(jù)收獲的層次上,定義了開放文檔元數(shù)據(jù)集OAMS,實現(xiàn)了圖書館館際之間的文獻資源互操作,促進了網(wǎng)絡(luò)信息資源的開發(fā)和共享。開放式鏈接框架OpenURL協(xié)議是在信息資源和服務(wù)組件之間實現(xiàn)互操作,它能夠把信息源、服務(wù)和終端用戶有機地整合,提供上下文關(guān)聯(lián)的繼承傳遞式服務(wù)。SOAP簡單對象訪問協(xié)議在分布式交換信息環(huán)境中應(yīng)用較為廣泛。endprint
根據(jù)學(xué)校圖書館資源建設(shè)聯(lián)機檢索、跨庫查詢、異構(gòu)通信等實際需求,在資源建設(shè)整合設(shè)計及應(yīng)用過程中,我們采用了Z39.50協(xié)議。由于圖書數(shù)字網(wǎng)絡(luò)資源存在的格式不同,當(dāng)應(yīng)用服務(wù)請求接口讀取這些互異數(shù)據(jù)時,首先必須對這些異構(gòu)資源數(shù)據(jù)進行整合,使之成為資源大數(shù)據(jù)共享中心,把不同來源、格式、特點、性質(zhì)的數(shù)據(jù)在邏輯上或是物理上有機地集中,消除資源數(shù)據(jù)孤島。基于Z39.50協(xié)議的圖書數(shù)字資源整合框架圖如圖1所示:
Z39.50搜索引擎作為Z39.50連接器的人口與中間組件,由WebService來進行實現(xiàn),接收上層檢索引擎請求模塊,將請求數(shù)據(jù)提交給平臺控制層,全局?jǐn)?shù)據(jù)庫將提交數(shù)據(jù),通過數(shù)據(jù)轉(zhuǎn)換模塊中數(shù)據(jù)轉(zhuǎn)換組件完成異構(gòu)數(shù)據(jù)之間的格式轉(zhuǎn)換,使之成為Z39.50協(xié)議支持的查詢數(shù)據(jù)格式,再通過數(shù)據(jù)連接和操作模塊,與局部數(shù)據(jù)進行連接、讀取及查詢操作,最后由元數(shù)據(jù)格式轉(zhuǎn)換器將MARC格式轉(zhuǎn)換為DC格式的元數(shù)據(jù),返回上層協(xié)議連接器引擎,對結(jié)果進行處理并以統(tǒng)一形式響應(yīng)返回給用戶。
四、數(shù)字圖書網(wǎng)絡(luò)資源整合平臺設(shè)計及構(gòu)建
(一)數(shù)字網(wǎng)絡(luò)資源整合模型設(shè)計
在進行資源整合模型設(shè)計中,我們充分考慮到多樣化類型的資源數(shù)據(jù)(如紙質(zhì)資源、電子資源、網(wǎng)絡(luò)資源、媒體資源、期刊論文等),在進行數(shù)據(jù)資源整合時,把握好設(shè)計管理界面、信息過濾機制、角色權(quán)限管理等問題,因為我們的目標(biāo)是為讀者提供最優(yōu)質(zhì)化的服務(wù)。數(shù)字資源整合模型圖如圖2所示:
基礎(chǔ)層提供各種網(wǎng)絡(luò)和硬件等方面的基礎(chǔ)設(shè)施環(huán)境;數(shù)據(jù)層是整合的主要對象和內(nèi)容,包括結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等方面的數(shù)據(jù);服務(wù)層為整個資源整合的中間層,它將收到的用戶請求通過轉(zhuǎn)換器組件把異構(gòu)數(shù)據(jù)轉(zhuǎn)換為Z39.50協(xié)議支持的數(shù)據(jù)格式,將結(jié)果返回給請求用戶;最上層應(yīng)用層是數(shù)字資源整合的目標(biāo)層,通過信息門戶為終端用戶提供相應(yīng)展示服務(wù)。
(二)數(shù)字網(wǎng)絡(luò)資源整合平臺架構(gòu)設(shè)計
資源整合平臺設(shè)計提出了異構(gòu)數(shù)據(jù)集成與共享方案,采用模塊、分層設(shè)計,用戶從統(tǒng)一集成管理界面提交請求,請求通過中間引擎來進行調(diào)度作業(yè),然后作業(yè)任務(wù)通過適配器引擎被分發(fā)給數(shù)據(jù)庫連接器,并對連接器返回的結(jié)果進行處理,最后返回給請求用戶,從而實現(xiàn)資源的整合與統(tǒng)一檢索。數(shù)字資源整合平臺架構(gòu)如圖3所示:
平臺架構(gòu)大致可以分為四個層次:用戶層、信息集成處理層、適配器層和數(shù)據(jù)源層。用戶層主要用來實現(xiàn)終端數(shù)據(jù)信息的交互輸入,并獲得請求響應(yīng)結(jié)果;信息集成處理層接收、處理請求內(nèi)容,并將作業(yè)任務(wù)傳遞給適配器層,同時調(diào)適配器層的Web服務(wù),整合數(shù)據(jù)信息,返回上層結(jié)果;適配器層處理不同類型數(shù)據(jù)源任務(wù);數(shù)據(jù)源層提供基礎(chǔ)數(shù)據(jù)服務(wù)。信息集成平臺在與數(shù)據(jù)源接口間進行數(shù)據(jù)傳輸時,信息格式采用XML格式。
(三)數(shù)字化圖書網(wǎng)絡(luò)資源平臺環(huán)境應(yīng)用
針對數(shù)字資源異構(gòu)特點,在設(shè)計中,我們結(jié)合高效安全數(shù)據(jù)存儲,充分利用校內(nèi)高速局域網(wǎng)絡(luò)優(yōu)勢,采用雙機集群并行機制,通過負載均衡動態(tài)分配策略,實現(xiàn)數(shù)字圖書網(wǎng)絡(luò)資源的快速交互和安全存放。在項目部署應(yīng)用中,利用axis2 1.0實現(xiàn)WebService,兩個Tomcat+Apache服務(wù)器進行集成,由其來共同運行servlevJsp組件的任務(wù),共同為讀者提供優(yōu)質(zhì)的數(shù)字資源服務(wù)。數(shù)字圖書網(wǎng)絡(luò)資源平臺集成環(huán)境部署架構(gòu)圖如圖4所示:
通過public String getHtmlContentAsString(StringUrl)方法利用HttpClient類實現(xiàn)Web content獲取,把獲取內(nèi)容信息存儲到數(shù)據(jù)庫中。關(guān)于服務(wù)的部署,我們采用基于Linux操作系統(tǒng)上的Tomcat+Apache作為WEB容器,Axis2作為SOAP容器,并對基礎(chǔ)服務(wù)services、standard和conf等文件做相應(yīng)的配置及應(yīng)用。
五、結(jié)語
隨著知識經(jīng)濟的快速發(fā)展,數(shù)字圖書館成為新型網(wǎng)絡(luò)虛擬資源組織模式,為滿足信息資源數(shù)字化、傳遞網(wǎng)絡(luò)化、利用集成共享化、提供知識化、實體虛擬化,在資源平臺設(shè)計及構(gòu)建中采用了信息虛擬供應(yīng)鏈管理創(chuàng)新模式與數(shù)據(jù)整合技術(shù),在管理應(yīng)用中,增強了角色權(quán)限細粒度化的程度,大大提高了數(shù)據(jù)有效利用率。雙機集群應(yīng)用模式實現(xiàn)了負載均衡動態(tài)資源調(diào)配,針對資源內(nèi)容差異性,利用Z39.50協(xié)議進行格式轉(zhuǎn)化和整合,實現(xiàn)了資源共享的最終目的。
[責(zé)任編輯:劉愛華]endprint