范敏
〔摘 要〕云計算技術作為一門新興技術已經(jīng)強勢進入了圖書館領域,為圖書館的發(fā)展迎來了下一個春天。文章歸納了云計算在圖書館中的應用現(xiàn)狀,并且從云計算的含義、特點、服務類型出發(fā),討論了云計算在數(shù)字圖書館中的主要應用,指出了數(shù)字圖書館應用云計算要考慮的一些瓶頸問題。
〔關鍵詞〕云計算;數(shù)字圖書館;云計算應用
DOI:10.3969/j.issn.1008-0821.2012.02.037
〔中圖分類號〕G250.252 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)02-0147-04
The Application of Cloud Computing on Digital Library
and Its Bottleneck ProblemsFan Min
(Faculty of Computer and Information Science,Southwest University,Chongqing 400715,China)
〔Abstract〕As a new techology, cloud computing has strongly entered into the library field and has welcomed the next spring of the library餾 development.This paper summarized the cloud computing餾 present situation of the application on the library field,and then from the cloud computing餾 meaning,features and service type,discussed its main applications on digital library,pointed out some bottleneck problems on its application.
〔Key words〕cloud computing;digital library;cloud computing applications
1 引 言
1.1 研究背景
“云計算”這個概念自2007年正式提出來以后,一直受到IT界的廣泛討論,其來勢之猛烈大有席卷全球的趨勢,因此很多企業(yè)都將自己的業(yè)務與其聯(lián)系起來,紛紛掛著一個“云”的稱號。Google、亞馬遜、IBM、甲骨文、微軟等IT巨頭都加入了云計算的行列,推出了一些云計算服務,如亞馬遜的網(wǎng)絡服務、Google的幫企業(yè)托管服務、微軟的軟件加服務、IBM的藍云計劃。數(shù)字圖書館與IT技術的發(fā)展有直接的聯(lián)系,而云計算技術作為IT界的一種新興技術,它在圖書館行業(yè)的發(fā)展現(xiàn)狀是怎樣的呢?它是怎樣應用于數(shù)字圖書館的建設中的呢?圖書館應用云計算技術又存在著怎樣的限制問題呢?伴隨著云計算的發(fā)展,這些問題也逐漸受到了圖書情報界學者的廣泛關注,引起了學術界的另一次研究熱潮。
1.2 國內(nèi)外研究現(xiàn)狀
基于云計算的服務是從2009年正式引入了圖書館的,目前,國外已經(jīng)有很多圖書館在使用云計算技術進行圖書館管理與服務。
2009年,邁克爾·斯蒂芬對云計算在圖書館的應用做了初步展望,不久又將云計算列入2009年圖情十大技術之首[1];2009年4月23日,世界最大的聯(lián)機圖書館服務供應商OCLC宣布即將推出基于WorldCat書目數(shù)據(jù)的“Web 級協(xié)作型圖書館管理服務”,被公認為是一項云計算服務,其目標是取代各類型圖書館的集成管理系統(tǒng)[2];俄亥俄州圖書館與信息合作網(wǎng)正在使用亞馬遜的云計算服務托管一小部分數(shù)字公共資源;哥倫比亞區(qū)公共圖書館正在使用亞馬遜的彈性計算云服務托管它們的網(wǎng)站,并且還在使用亞馬遜的S3服務備份圖書館集成系統(tǒng)。
在國內(nèi)方面,對于云計算在數(shù)字圖書館中的研究還處于起步階段,但也有一些理論研究成果和應用實例,并且受到了學術界的重視。從云計算引入到圖書館以來,“云書館”、“云館員”、“云服務”這樣的術語就紛紛出現(xiàn)了。2009年,在華中科技大學舉行了第六屆數(shù)字環(huán)境下圖書館前沿問題研討會,對云計算給予了高度關注;CALIS(中國高等教育文獻保障系統(tǒng))基于“十五”成果和三期建設目標,結(jié)合云計算、SaaS、Web2.0、SOA等技術,提出了CALIS云戰(zhàn)略和相應的數(shù)字圖書館云服務平臺模型[3]。
在發(fā)表論文數(shù)量方面,筆者以CNKI為數(shù)據(jù)源,以“云計算”和“圖書館”為關鍵詞,共檢索出相關文獻176篇,時間跨度為2009-2011年。其中,2009年只檢索出1篇文獻,其它均分布在2010年和2011年。可見,從2009年圖書館引進云計算的思想以來,云計算受到圖書館界的廣泛關注。
1.3 研究意義
云計算作為信息時代的產(chǎn)物,是IT行業(yè)的新趨勢,受到各行各業(yè)的關注。云計算的誕生給IT界帶來了一次新的技術革命,同時也成功地引入到了圖書館界。云計算能夠解決數(shù)字圖書館的建設過程中的許多問題,如海量信息的存儲問題、數(shù)字資源建設和共享問題。本文主要是從云計算的概念和特點出發(fā),對云計算在數(shù)字圖書館中的應用進行歸納,找出數(shù)字圖書館應用云計算過程中遇到的問題。
2 云計算概述
2.1 云計算的概念
云計算出現(xiàn)的時間還不長,其定義到目前尚未統(tǒng)一,Matrix已經(jīng)總結(jié)了云計算的20個定義。李開復將云計算定義為:以公開的標準和服務為基礎,以互聯(lián)網(wǎng)為中心,提供安全、快速、便捷的數(shù)據(jù)存儲和網(wǎng)絡計算服務,讓互聯(lián)網(wǎng)這片‘云成為每一個網(wǎng)民的數(shù)據(jù)中心和計算中心[1]。維基百科將云計算(Cloud Computing)定義為:云計算是一種基于互聯(lián)網(wǎng)的計算方式,通過這種方式,共享的軟硬件資源和信息可以按需提供給計算機和其他設備[4]。
目前比較普遍的定義是,云計算是并行計算、分布式計算和風格計算的發(fā)展,或者說是這些計算機科學概念的商業(yè)實現(xiàn),是虛擬化、效用計算、基礎設施即服務、平臺即服務、軟件即服務等概念混合演進并躍升的結(jié)果[5]。在圖書情報界一般引用這個概念。
2012年2月第32卷第2期云計算在數(shù)字圖書館中的應用與瓶頸問題Feb.,2.2 云計算的特點
云計算的特點可以歸納為以下幾個方面:①硬件和軟件都是資源,即把所有IT資源均當成服務來提供,包括應用程序、存儲空間、計算能力、編程與運行環(huán)境、網(wǎng)絡通信設施、協(xié)作工具平臺等,可以認為這是SOA(以服務為導向)的高級階段和具體實施(大多數(shù)SOA還只體現(xiàn)在設計階段)[6];②云計算使用了數(shù)據(jù)多副本容錯、計算節(jié)點同構(gòu)可互換等措施來保障服務,存儲數(shù)據(jù)安全可靠;③用戶可以根據(jù)自己的需求定制或刪減相應的服務,按實際使用量付費,并且用戶可以使用各種終端獲取應用服務;④云計算的資源可以根據(jù)應用和用戶規(guī)模增長的需要隨時進行動態(tài)擴展和配置,具有動態(tài)性;⑤云計算支持數(shù)據(jù)共享,符合權(quán)限的用戶只要利用自己的電子設備連接上網(wǎng),便可同時訪問和使用同一份數(shù)據(jù);⑤性價比很高[7]。
2.3 云計算的服務類型
云計算的服務有3個層次:應用層、平臺層和基礎設施層。根據(jù)不同的服務層次,可將云計算服務分為3類,即軟件即服務(SaaS)、平臺即服務(PaaS)、基礎設施即服務(IaaS)[8]。
2.3.1 軟件即服務(SaaS)
軟件即服務,即把軟件當作一種服務。用戶無需購買和安裝軟件,而是通過瀏覽器將用戶請求的軟件傳給用戶。這樣,用戶就可以節(jié)省大量購買軟件的成本,而服務器提供商也只需維護一個程序,降低了維護成本。應用的主要領域有人力資源管理程序和ERP等。
2.3.2 平臺即服務(PaaS)
平臺即服務,即將開發(fā)環(huán)境的平臺作為一種服務,包括應用設計、應用開發(fā)、應用測試和應用托管,提供給用戶。用戶就可以在此基礎上,開發(fā)自己所需要的應用服務。這種服務實際上是SaaS的一個變種,因此也具有SaaS節(jié)約成本和便于維護的優(yōu)點。目前典型的實例有微軟的Windows Azure平臺、Google AppEngine等。
2.3.3 基礎設施即服務(IaaS)
基礎設施即服務,即是將IT的基礎設施(虛擬服務器、存儲、網(wǎng)絡、㊣/O設備整合成的虛擬資源池)作為一種服務,用戶就可以從這些基礎設施中獲得應用所需要的存儲和計算能力,而無需支付這些基礎設施所付出的相應的原始成本。
典型的實例是Amazon的AWS服務,包括Elastic Compute Cloud(EC2)提供的虛擬機租用服務,Simple Storage Service(S3)提供的存儲租用服務等[9]。
3 云計算技術在數(shù)字圖書館中的應用
3.1 數(shù)字資源存儲
數(shù)字圖書館往往面對的是海量的信息,而對這些海量信息進行存儲是數(shù)字圖書館必須要解決的一個問題。傳統(tǒng)的數(shù)字圖書館常用的海量信息存儲設備主要是光盤塔、磁帶庫、磁盤陣列,網(wǎng)絡附加存儲設備主要有DAS、NAS、SAN,而這些設備的壽命都是有限的,而且會花費大量的圖書館經(jīng)費。從數(shù)字圖書館的角度來看,云計算為用戶提供的基礎設施即服務有望為數(shù)字圖書館解決海量信息存儲和數(shù)字資源長期保存問題。
云計算的虛擬存儲技術能夠把圖書館使用的DAS、NAS、SAN存儲設備匯集成一個“虛擬存儲池”,數(shù)字圖書館的音頻、視頻、圖片、文字等各種格式的數(shù)據(jù)存放在這個“虛擬存儲池”中,所有基于網(wǎng)絡的RAID、分布式㊣/O、數(shù)據(jù)冗余、硬盤組、邏輯卷、動態(tài)的多個路徑、分層存儲、在線的高速備份等有關的問題都由虛擬存儲管理系統(tǒng)來處理,實現(xiàn)了無縫的存儲和數(shù)據(jù)管理[10]。有了這樣的存儲系統(tǒng)為保障,就可以實現(xiàn)數(shù)據(jù)的安全存儲,防止因系統(tǒng)故障而引起的數(shù)據(jù)損壞與丟失等現(xiàn)象。
另外,還有一些學者從其它的角度對云計算在數(shù)字資源存儲的應用進行了闡述。一些學者認為,各個機構(gòu)獨立開展數(shù)字資源保存研究和平臺建設,往往會面臨系統(tǒng)間互操作性差、異構(gòu)應用的平臺、缺乏共同的標準、非彈性計算能力等問題,而云計算所提供的服務,則有助于使各個圖書館共同協(xié)作努力,促使數(shù)字資源的保存形成必要的、節(jié)約型的數(shù)字管理經(jīng)濟規(guī)模[11]。
3.2 數(shù)字資源建設
我國的數(shù)字圖書館在資源建設方面還存在著諸多問題,如同一圖書館中數(shù)字資源不能和紙質(zhì)資源進行相互補充,不同圖書館之間的數(shù)字資源相互獨立、重復建設概率高[12]。部分數(shù)字圖書館下的成員館內(nèi)部缺乏統(tǒng)一的標準,系統(tǒng)兼容性差,一些成員館則各自為政,對數(shù)字信息的建設和處理缺乏協(xié)調(diào)和合作,從而導致數(shù)字資源重復建設,造成了資源建設成本和維護成本的浪費。
云計算技術的出現(xiàn)使數(shù)字圖書館在網(wǎng)絡中以“信息超市”的形式出現(xiàn)。每個圖書館所有的數(shù)字化信息部分或者全部上傳到云空間,由云來統(tǒng)一調(diào)度、組織這些海量數(shù)據(jù),實現(xiàn)一種標準模式下的互補鏈接,使得整合后的信息更加有序[13]。這樣就既可以巧妙地避免各個圖書館各自為政,造成數(shù)字資源的重復建設,又可以解決館內(nèi)缺乏統(tǒng)一標準而造成系統(tǒng)兼容性差的問題。另外,云計算技術使各個圖書館在數(shù)字信息資源建設上實現(xiàn)有效分工,節(jié)約出大量的人力、財力,從而可以提升數(shù)字圖書館的服務效益,使圖書館能夠集中精力處理核心業(yè)務。
3.3 資源共享
3.3.1 硬件環(huán)境共享
傳統(tǒng)數(shù)字圖書館的硬件環(huán)境建設需要購置性能強勁且價格昂貴的大型機,并且需要一定區(qū)域內(nèi)數(shù)字圖書館的各個成員館重復購置硬件,這在一定的程度上會增加區(qū)域圖書館硬件資源環(huán)境建設的經(jīng)濟負擔。而云計算提供的基礎設施即服務,可以實現(xiàn)區(qū)域范圍內(nèi)的數(shù)字圖書館共享其提供的虛擬服務器、存儲、網(wǎng)絡等虛擬資源,即一定區(qū)域的數(shù)字圖書館通過采用大規(guī)模分布式任務處理技術和虛擬化技術,將地理位置不相鄰的多個功能相同的設備虛擬化成一個個塊服務器,多個塊服務器構(gòu)成一個邏輯上的服務器集群,對外提供簡潔統(tǒng)一的資源服務訪問方式。這種基于云計算的數(shù)字圖書館硬件共享方式可以使區(qū)域范圍內(nèi)的成員圖書館通過區(qū)域數(shù)字圖書館的主服務器來請求資源的調(diào)用,來實現(xiàn)硬件資源的共享。
基于云計算的區(qū)域數(shù)字圖書館硬件環(huán)境建設具有以下的一些優(yōu)點:①對硬件的性能要求低,它可以架構(gòu)在大規(guī)模的廉價服務器集群之上;②支持硬件建設的共建共享,云計算支持數(shù)字圖書館對所需購置的硬件進行統(tǒng)一規(guī)劃、共同搭建、統(tǒng)一管理,從而為系統(tǒng)內(nèi)部提供可靠的IaaS服務;③減少資源閑置,提高了硬件服務的并發(fā)數(shù)量和可靠性;④硬件設備在邏輯上高度集中,方便了系統(tǒng)管理人員對硬件設備的使用和服務管理[14]。
3.3.2 信息資源共享
傳統(tǒng)的數(shù)字圖書館的共享機制需要借助于文獻傳遞來進行,這在一定的程度上會產(chǎn)生一定的延遲,給用戶帶來了諸多不便。在云計算的模式下,各個數(shù)字圖書館可以將自己的資源上傳至云中的服務器,構(gòu)建一個巨大的共享信息庫。因此,各個數(shù)字圖書館既可以通過網(wǎng)絡共享其它數(shù)字圖書館的信息,而不用管這個數(shù)字圖書館的具體位置,同時也可以同時獲取許多網(wǎng)絡中本身存在的大量有用信息,極大程度上滿足了用戶的信息需求。在這種情況下,用戶只需要明確自己的信息需求,通過一個簡單的網(wǎng)頁搜索就可以獲取所有加入云中的數(shù)字圖書館的信息,讓用戶感覺到好像只使用了一個數(shù)字圖書館。這種基于云計算的數(shù)字圖書館將異構(gòu)分布環(huán)境下不同來源的海量數(shù)據(jù)資源進行統(tǒng)一整合,實現(xiàn)信息資源的智能共享,極大地提高數(shù)字圖書館資源的利用效率[15]。
3.4 個性化信息服務
云計算本身也就是一種服務,前面提到的幾種云計算在數(shù)字圖書館中的應用實際上也就是云計算提供的各種服務。除了這些基礎服務以外,云計算還能為用戶提供個性化的信息服務。個性化的服務是一種用戶驅(qū)動的、可定制的信息服務,它是根據(jù)用戶的知識結(jié)構(gòu)、信息需求、行為方式和心理傾向等,有的放矢地為具體用戶創(chuàng)造符合個性需求和服務環(huán)境,為其提供定向化的預定信息與服務[16]。
云計算的出現(xiàn)豐富了數(shù)字圖書館用戶的個性化服務方式,真正可以實現(xiàn)“用戶主導型”的服務,主要表現(xiàn)在以下幾個方面:在終端的選擇上,傳統(tǒng)的數(shù)字圖書館只能通過計算機訪問圖書館的資源,而云計算技術支持各種手持式設備,如掌上電腦、智能手機等終端訪問圖書館,真正讓用戶感覺得到“圖書館無處不在”的體驗;用戶交互上,云計算能提供即時通訊和在線幫助或智能數(shù)字圖書館機器人的交互,同時可以開放多種Web2.0的服務方式,如維基百科、用戶博客、威客等[17];可以采用多維數(shù)據(jù)分析挖掘技術,分析用戶的信息行為,挖掘出用戶感興趣的話題,并主動向用戶推送符合用戶需求的信息資源,如RSS技術在圖書館中的應用,可以幫助讀者訂閱自己感興趣的資源,并將這些信息的更新動態(tài)即時推送給讀者。
4 數(shù)字圖書館應用云計算的瓶頸問題
云計算的理念和服務技術的快速發(fā)展,已經(jīng)被用戶廣泛所接受,并且成為了數(shù)字圖書館發(fā)展的現(xiàn)實需要。然而,云計算還處于初級使用階段,存在著許多的問題亟待解決。因此,在數(shù)字圖書館的建設過程中,圖書館員在利用云計算的便利的同時,還得從圖書館自身角度來考慮云計算的使用將會帶來的瓶頸問題,如信息安全問題、資源的選擇性整合問題、知識產(chǎn)權(quán)問題等。
4.1 信息安全問題
數(shù)字資源是數(shù)字圖書館的靈魂,因而這些數(shù)字信息的安全對于數(shù)字圖書館來說是至關重要的。每一個數(shù)字圖書館的用戶對數(shù)字圖書館信息的完整性、可用性、真實性有較高的要求。雖然云計算提供了很強的數(shù)據(jù)備份能力,能夠保證數(shù)字圖書館信息的物理形態(tài)的安全性,但對于信息的內(nèi)容安全性方面還不能保證,仍存在著一些安全性問題:非法用戶利用系統(tǒng)的漏洞得到一些信息后,會對數(shù)字圖書館中的其他用戶的個人隱私、重要機密信息等造成威脅;一些非法的操作,可能導致數(shù)字資源的丟失;數(shù)字圖書館對本館數(shù)據(jù)的存儲位置并不明確,因而不知道如何對不同用戶的私有數(shù)據(jù)進行有效隔離、保密,使得數(shù)字圖書館用戶不能確定托管于云服務提供商的數(shù)據(jù)擁有的完全權(quán)限;對于涉密信息,如果得不到嚴格加密,數(shù)據(jù)丟失將會造成嚴重的損失[5,18]。因而對于數(shù)字圖書館來說,必須考慮到這些安全性因素,對于一些重要的信息最好能夠利用自己的設備進行備份。
4.2 資源選擇性整合問題
數(shù)字圖書館在將數(shù)字資源上傳至云中構(gòu)建云計算資源時,還得考慮數(shù)字資源的選擇性整合問題,例如,是否將全部數(shù)字資源都上傳至云服務器?如果不是全部上傳,那又應該將哪些資源上傳?在理論上,數(shù)字圖書館將資源上傳至云中,可通過本地互聯(lián)網(wǎng)進行使用。而實際上,數(shù)字圖書館往往不會將全部資源放在云中,而是將一些重要的私密性資源保存在本地計算機,或者在本地進行備份。這樣,當云中服務器出現(xiàn)故障時,能夠繼續(xù)在本地處理事務和數(shù)據(jù)[19]。因此,云計算模式并不會完全推翻數(shù)字圖書館現(xiàn)在有部署模式,而是在保留原有模式的基礎上,使現(xiàn)有的部署模式與云計算模式進行融合,作為現(xiàn)有部署模式的有效補充[20]。
4.3 知識產(chǎn)權(quán)問題
云計算加大了數(shù)字圖書館的信息共享的程度,同時也帶來了版權(quán)糾紛問題。如OCLC在2008年11月推出“WordCat”記錄使用與傳遞政策,試圖取代20年前的“OCLC衍生記錄使用與傳遞指南”時,受到很大的質(zhì)疑,最終不得不在2009年5月宣布撤銷,推倒重來[21]。
數(shù)字圖書館要運用云計算技術,必須保證在將自己的資源交給云托管后,完全擁有被托管資源的知識產(chǎn)權(quán),能夠自主管理和控制這些資源,同時其它的用戶沒有權(quán)限對這些資源進行管理。然而,云計算企業(yè)往往會利用這些數(shù)據(jù),并以數(shù)據(jù)整合、數(shù)據(jù)挖掘、知識服務的名義努力使用戶數(shù)據(jù)利用合法化。因此,數(shù)字圖書館想要將云計算技術運用自如,就得針對這些版權(quán)糾紛,制定出切實可行的方案,完善相關的法律體系,從根本上解決版權(quán)問題。
5 結(jié) 論
綜上所述,云計算技術作為IT行業(yè)的新興發(fā)展領域,目前已經(jīng)成功地引入到了圖書館領域,并且能夠為數(shù)字圖書館解決一些現(xiàn)實問題和提供新的服務理念,如幫助數(shù)字圖書館解決海量信息的長期保存、信息資源建設等問題,同時能讓數(shù)字圖書館共享云中的硬件環(huán)境,加大數(shù)字圖書館信息資源共享的程度,豐富數(shù)字圖書館的個性化用戶服務方式。然而,數(shù)字圖書館在利用云計算的過程中,還有一些問題是不得不考慮的,如信息安全問題、資源選擇性整合問題、知識產(chǎn)權(quán)問題等。雖然目前云計算技術在數(shù)字圖書館的應用還處于探索的階段,相信隨著云計算在其它領域發(fā)展的逐漸成熟,將來一定會為圖書館帶來一次偉大的變革。
參考文獻
[1]范并思.云計算與圖書館:為云計算研究辯護[J].圖書情報工作,2009,(53):5-9.
[2]吳雷,張淑芬,劉建生.云時代與數(shù)字圖書館.重慶圖情研究[J],2010,(3):45-48.
[3]王文清,陳凌.CALIS數(shù)字圖書館云服務平臺模型[J].大學圖書館學報,2009,(4):13-18.
[4]http:∥zh.wikipedia.org/wiki/%E4%BA%91%E8%AE%A1%E7%AE%97[EB].
[5]史慶艷.云計算對數(shù)字圖書館的影響[J].情報探索,2010,(8):19-21.
[6]劉煒.圖書館需要一朵怎樣的“云”[J].大學圖書館學報,2009,(4):2-6.
[7]高曉燕.云計算在圖書館中的應用研究[J].大學圖書情報學刊,2010,(28):60-62.
[8]張鵬程,許曉魯.云計算策略、服務與解決方案[J].軟件產(chǎn)業(yè)與工程,2011,(2):40-45.
[9]Amazon Web Services[EB].http:∥aws.amazon.corn/.
[10]康健明.虛擬存儲技術及其在數(shù)字圖書館中的應用[J].圖書館論壇,2007,(27):92-94.
[11]陶新權(quán),孫青,王亞,等.云計算在圖書館中的應用[J].大學圖書館學報,2010,(2):54-57.
[12]盧曉娟.云計算與未來圖書館數(shù)字信息資源建設[J].四川圖書館學報,2009,(2):23-24.
[13]王長宇.云計算環(huán)境下的數(shù)字圖書館信息資源建設的理性思考[J].中國科技信息,2010,(17):163-165.
[14]汪曉囡.基于云計算的區(qū)域數(shù)字圖書館研究[J].數(shù)字圖書館論壇,2010,(11):63-70.
[15]王平.云計算關鍵技術在數(shù)字圖書館中的應用研究[J].情報資料工作,2010,(5):52-56.
[16]李惠琴.基于“云計算”的數(shù)字圖書館服務模式[J].圖書館論壇,2010,(31):209-210.
[17]周舒,張嵐嵐.云計算改善數(shù)字圖書館用戶體驗初探[J].圖書館學研究,2009,(4):28-30.
[18]孫文乾.淺析云計算的安全策略[J].電腦知識與技術,2010,(9):2145-2146.
[19]饒少陽.向“云”計算靠攏[J].電信之窗,2008,(7):5-10.
[20]蔡炳育,陳慧賢.云計算與數(shù)字資源存儲問題分析[J].巢湖學院學報,2009,(6):27-30.
[21]胡小菁,范并思.云計算給圖書館管理帶來挑戰(zhàn)[J].大學圖書館學報,2009,(4):7-12.