文 / 徐延華
云計算作為一種基于互聯(lián)網(wǎng)的基礎服務共享架構新方法,可以實現(xiàn)資源共享和海量存儲。近年來,這一技術在多個行業(yè)得到廣泛應用。隨著人們對于數(shù)字信息資源需求的不斷增加,開展數(shù)字圖書館資源整合、滿足用戶的信息需求已經(jīng)成為數(shù)字圖書館發(fā)展的必然要求。因此,如何充分利用云計算在信息資源整合方面的優(yōu)勢進一步提升圖書館信息服務能力,是數(shù)字圖書館開展信息資源建設的關鍵。
隨著信息技術的快速發(fā)展,以傳統(tǒng)圖書和文獻資料為主要載體的圖書館信息資源已經(jīng)難以滿足用戶的個性化需求,數(shù)字化圖書館逐步成為信息時代文獻資源建設和服務的發(fā)展方向。但是數(shù)字資源體量大、種類多、內(nèi)容參差不齊,給用戶的檢索帶來了諸多不便。因此,從用戶需求出發(fā),以數(shù)字資源的集中管理、快捷檢索為目標,將分散、無序的信息資源整合起來,組建一個統(tǒng)一、有機的集成化系統(tǒng),實現(xiàn)不同資源之間的無縫鏈接和用戶的透明訪問,實現(xiàn)數(shù)字資源整合,是數(shù)字圖書館建設的關鍵。
但是隨著信息資源量劇增以及人們對于知識獲取需求的日益增加,數(shù)字圖書館面臨的海量信息資源整合的難題,已經(jīng)成為制約數(shù)字圖書館資源建設的瓶頸。云計算作為一種新的IT資源服務模式,可以將分布式計算、并行計算、互聯(lián)網(wǎng)技術有效地結合起來[1-2],通過網(wǎng)絡技術將成本較低的計算實體集成為具有強大計算功能的系統(tǒng),通過SaaS、PaaS、IaaS等模式對外提供服務,為終端用戶減少處理負擔。與傳統(tǒng)計算相比,云計算將計算功能和存儲功能抽象化,以服務的形式分布到終端用戶中,可以便捷地實現(xiàn)用戶間的資源共享和計算效率的提升。
數(shù)字圖書館資源整合中應用云計算技術,可以大幅度提升檢索速度,滿足用戶的多元化、個性化檢索需求,實現(xiàn)數(shù)字資源一體化建設[3-4]。云計算環(huán)境下,各個數(shù)字圖書館借助網(wǎng)絡服務整合為分布式的網(wǎng)絡圖書館,通過動態(tài)適應性的信息資源整合,為用戶提供優(yōu)質(zhì)的信息服務,既可以在一定程度上消除信息孤島,促進信息資源共享,避免資源重復建設,節(jié)約建設成本;又可以重構信息資源體系,加強信息資源之間的內(nèi)在聯(lián)系,提高信息關聯(lián)度和完整性,實現(xiàn)不同資源之間的鏈接和溝通。云計算作為一種資源的有效匯聚和全新管理機制,有助于數(shù)字圖書館提升信息服務水平和能力[5-6]。在硬件設施方面,云服務的硬件服務體系可以為虛擬數(shù)據(jù)提供良好的硬件支撐,進而節(jié)約硬件設備和人力投入,方便數(shù)字圖書館日常管理;在軟件服務方面,云計算可以按需制定軟件服務行為,打破圖書館單一的集成管理系統(tǒng),幫助經(jīng)濟實力不強的中小圖書館實現(xiàn)信息化建設;在存儲方面,云計算基于互聯(lián)網(wǎng)和集群應用技術,將數(shù)據(jù)存儲在服務提供商的服務器中,既能為用戶提供快捷的數(shù)據(jù)存儲支持,又能有效降低圖書館數(shù)據(jù)存儲、維護等成本投入。
信息資源整合的核心在于實現(xiàn)不用類型、不同格式信息資源之間的無縫連接和全面共享,形成跨平臺、跨數(shù)據(jù)庫、跨內(nèi)容的新型信息資源體系結構。云環(huán)境下的信息資源整合涵蓋數(shù)據(jù)庫、系統(tǒng)、檢索方式、技術、協(xié)議標準等多方面內(nèi)容。其中數(shù)據(jù)庫的整合是對分散異構數(shù)據(jù)進行無縫鏈接、整合分析,摒除多個數(shù)據(jù)庫中的重復信息,建立新的虛擬數(shù)字資源體系;系統(tǒng)整合是通過分解和重組等方式對應用系統(tǒng)、數(shù)字資源進行整合,使其在組織結構和表達方式等方面趨于共性并形成統(tǒng)一的管理平臺;檢索方式整合是以組合檢索等方式為用戶提供全方位的檢索服務,方便用戶準確定位具體信息;技術整合是將多種資源整合技術合并以解決信息孤島難題;協(xié)議標準整合則是采用合適的技術手段,實現(xiàn)基于不同訪問協(xié)議和數(shù)據(jù)庫標準的數(shù)據(jù)庫在同一界面的統(tǒng)一檢索。
數(shù)字資源作為圖書館領域研究的熱點和難點,在整合機制的選擇上需要綜合考慮整合內(nèi)容和云計算的特征。目前數(shù)字資源整合的實現(xiàn)機制包括數(shù)據(jù)倉庫整合機制、中介器封裝器整合機制、代理整合機制等。其中數(shù)據(jù)倉庫整合機制是一種物理集成方式,可以滿足不同服務器之間資源一致性存儲的需求,為用戶提供復雜的信息檢索服務,使信息資源的類型與范圍更加廣泛,數(shù)字圖書館可以在此基礎上整合多種資源,建立全方位的OPAC資源管理系統(tǒng);中介器封裝器整合機制作為一種虛擬的整合方式,應用中介器解決用戶提問和檢索結果的整合,應用封裝器解決信息源的連接和具體查詢,不需要在本地存儲大量的數(shù)字資源,能適應云計算環(huán)境下信息資源數(shù)量多、更新快等特點,是目前數(shù)字資源整合的主流方式;代理整合機制作為近年來新興的一種整合機制,通過合理利用用戶Agent、資源Agent、代理方Agent來提高系統(tǒng)的整合效率,能夠主動適應網(wǎng)絡環(huán)境的變化,增強了系統(tǒng)的靈活性。
1.云計算服務模式。根據(jù)服務類型,云計算可以為數(shù)字圖書館提供三種服務模式:SaaS(Software as a Service,軟件即服務)、PaaS(Platform as a Service,平臺即服務)、IaaS(Infrastructure as a Service,基礎設施即服務)。
SaaS是21世紀發(fā)展起來的基于互聯(lián)網(wǎng)的軟件應用模式,代表軟件科技發(fā)展的最新趨勢,是目前應用最廣泛的一種云計算模式。在數(shù)字圖書館建設的過程中,提供商負責搭建基礎網(wǎng)絡設施和運作平臺,并負責系統(tǒng)的升級維護,數(shù)字圖書館只需購買相應的軟件即可為用戶提供服務。以SaaS為基礎的資源整合是一站式的資源整合,云端資源基于SaaS技術可以將不同數(shù)字圖書館的異構資源集成到統(tǒng)一的Web站點,并為用戶提供統(tǒng)一的檢索接口,能夠有效提高資源利用率和館間資源互補能力。其中比較有代表性的是谷歌公司在“云”概念的范疇下,將世界范圍內(nèi)的圖書館學術資源進行整合,推出了谷歌學術搜索(Google Scholar),具有便捷、全面、功能強大的特點,大大縮短了讀者檢索文獻的過程。
PaaS模式將服務器平臺作為一種可以提供的服務。基于PaaS的資源整合是通過構建云服務平臺的方式,實現(xiàn)數(shù)字資源的最大集約化,進而最大程度地消除信息孤島。數(shù)字圖書館通過PaaS的中間平臺建立資源索引庫,對圖書館資源進行描述,將分散的數(shù)字圖書館館資源融合在一起,構建一個統(tǒng)一可控的云資源整合中心。通過該平臺,云圖書管理員可以快速整合多個數(shù)字圖書館的資源,并及時向云端用戶提供相應的檢索查詢服務。
IaaS模式下,用戶可以從完備的計算機基礎設施中獲取服務,服務內(nèi)容包括處理、存儲、網(wǎng)絡等基本的計算資源以及操作系統(tǒng)、應用程序等任意軟件的部署和運行。在服務運行的過程中,圖書館無需管理云計算基礎設施,但是可以控制相關程序的應用。當前信息資源量激增,如何降低設備購置成本、提高資源保障水平,是數(shù)字圖書館亟待解決的問題。因此,數(shù)字圖書館基于IaaS的基礎設施共建共享模式構建數(shù)字圖書館虛擬環(huán)境,可以實現(xiàn)基礎設施資源優(yōu)化整合并滿足用戶全方位的需求。

圖1 基于云計算的圖書館資源整合架構
2.云計算服務架構。在云計算服務模式的基礎上,構建了如圖1所示的圖書館資源整合體系架構。(1)SaaS讀者服務層主要為PC登錄、移動終端登錄等用戶登錄界面,用戶通過注冊賬號進入云桌面選擇所需要的服務;(2)PaaS后臺管理層主要包括主服務控制機群和云監(jiān)控模塊等。主服務控制機群接收到用戶的信息請求后,通過對用戶身份進行合法性驗證和應用請求類型的實時分析,動態(tài)分配合適的服務資源,在這個過程中,云監(jiān)控模塊對服務的執(zhí)行過程進行全程實時監(jiān)控,并對服務器進行管理操作;(3)IaaS基礎設施層中,存儲節(jié)點機群具有海量的存儲功能,可以滿足數(shù)字資源的存取需求。應用節(jié)點機群是具有不同業(yè)務處理能力的應用系統(tǒng),可以處理各種復雜的應用請求。計算節(jié)點機群由多組云計算機群組成,可以滿足超大運算量的計算需求。云計算架構的優(yōu)劣程度直接影響著數(shù)字圖書館信息資源服務的高效性和一致性,因此,以云計算圖書館架構為基礎,設計標準的管理流程,優(yōu)化管理模式,開展統(tǒng)一管理,可以最大化地提高資源利用效率。
云計算將眾多的計算機聯(lián)合起來,為圖書館提供強大的計算能力,可以完成單一計算機無法完成的計算任務。因此,云計算模式可以滿足用戶大規(guī)模同時在線檢索的服務需求,大幅提升圖書館的檢索效率。在本地云構建的過程中,應用數(shù)據(jù)庫技術、數(shù)據(jù)挖掘技術,可以在實現(xiàn)資源整合的基礎上實現(xiàn)信息的智能化搜索,系統(tǒng)通過自動搜索并對搜索的信息進行權衡評價,幫助用戶獲取所需的信息。此外,用戶可以使用電腦、手機等設備的信息檢索平臺,通過統(tǒng)一的認證和檢索操作,隨時隨地獲取所需的信息資源,保證了用戶登錄檢索的便捷性,實現(xiàn)了用戶信息檢索服務的智能化、一體化。
基于大量系統(tǒng)連接而成的基礎設施,不同圖書館之間可以共享館際信息資源,而不必更新相關硬件設備,在降低投入、節(jié)約能耗、加快綠色數(shù)據(jù)計算的同時,大大提高了數(shù)字資源的利用率。因此,云計算的應用會推動數(shù)字圖書館信息資源的整合共享,有利于促進圖書館之間的合作尤其是圖書館聯(lián)盟的構建。
動態(tài)分配資源是云計算的重要特征之一。當出現(xiàn)大量用戶同時檢索、訪問量過大的情況時,云計算會采取“按需索取”的服務方式進行動態(tài)分配,保證數(shù)字圖書館獲取最優(yōu)的運算能力和服務器等設備的正常運轉(zhuǎn),最大化地滿足用戶需求;在計算需求較少時會歸還多余的運算能力,保證資源的優(yōu)化配置,減少資源的浪費。此外,傳統(tǒng)圖書館服務器常面臨黑客攻擊的風險,數(shù)據(jù)容易被破壞,云計算憑借先進的技術,可以提供安全可靠的數(shù)據(jù)存儲保障,為數(shù)字圖書館提供持續(xù)的安全服務。
數(shù)字圖書館只需要花費少量費用租用云服務商的相關服務,就可以依托云計算供應商的平臺、存儲和較強的計算能力來處理業(yè)務,大大降低數(shù)字圖書館資源建設方面的投入成本,節(jié)約設備維護、管理等方面的開銷。在此基礎上,數(shù)字圖書館可以合理規(guī)劃開支,將有限的資金應用于核心業(yè)務的發(fā)展中。
云計算的發(fā)展為數(shù)字圖書館資源整合帶來了新的機遇。云計算在服務模式、環(huán)境建設等方面的進步,有助于傳統(tǒng)圖書館突破信息傳遞、信息存儲等方面的限制,為用戶提供優(yōu)質(zhì)的信息資源服務。但是機遇與挑戰(zhàn)并存,云計算在數(shù)字圖書館資源整合方面也面臨著標準化、穩(wěn)定性、安全性、版權等方面的問題,需要云計算服務商與數(shù)字圖書館積極合作,采取相關措施,充分發(fā)揮云計算的最大功效,不斷提升數(shù)字圖書館的服務能力。