陳勁松
陳勁松 靖江市圖書館采編部主任。江蘇靖江,214500。
2013年,福布斯成功預言云將成為科技話題的NO.1,并預測2014年云端市場可達1590億美元[1]。公有云、私有云和混合云等技術的涌現標志著云端時代的全面開啟,引發了人類社會工作方式和商業模式的根本性轉變,云計算也越來越成為經濟發展過程中的一種必然選擇和趨勢。根據PEW調查機構的調查結果顯示,美國人中69%使用云服務[2];英國CIF(Cloud Industry Forum,云產業論壇)2014年 6月公布數據顯示,超過四分之三(78%)的機構正在使用至少一項云端服務,2010年到2014年期間,英國的云計算實現了61.5%的增長[3]。國內方面,公有云市場向全球的敞開,國外云巨頭的進駐及與國內運營商的合作共贏,將吸引更多行業和客戶接納云計算,從而激發國內云市場活力。國內外政府部門及企事業單位應用實踐表明,云計算能夠切實解決系統利用率低下,資源無法合理有效利用,數據共享及安全性、兼容性問題,大大提升機構運行效率和服務水平。
隨著技術應用的日益成熟,云計算也開始加速在圖書情報領域中應用,使得圖書館IT構架、業務流程、管理方式、服務方式發生質的變化,如OCLC WorldCat Local云計劃、歐盟數字圖書館Europeana Cloud云計劃。Europeana Could寄期望通過一個集合資源云、服務云、技術云為一體的最佳實踐網絡平臺的打造,為用戶提供更為高效資源訪問、數據管理及科研平臺服務。本文將針對該計劃展開探索及研究。
歐盟數字圖書館于2008年11月20日在布魯塞爾正式啟動,用戶可通過其門戶網站http://www.europeana.eu訪問來自歐盟27國的書籍、手稿、音樂、繪畫、地圖、照片和電影等豐富多彩的信息和資料。歐盟數字圖書館的云計劃正是依據其門戶網站域名被命名為Europeana Cloud。在云計算與外界各行業業務應用迅速融合的同時,歐盟數字圖書館面臨著來自用戶及其自身發展的多方需求沖擊:(1)整個歐盟信息產業領域的內容提供商和集成商迫切需要一種更能節約成本、可持續化的基礎設施,支持其元數據存儲及內容存儲;(2)歐盟科研人員需要一個全新的數字化空間,以便其展開革新性數字化內容分析和探索;(3)來自歐盟數字圖書館遠景目標的挑戰,至2015年,歐盟數字圖書館擁有的資源數量需達到3000萬條。這一系列需求唯有通過云計算服務在其基礎設施、資源共享和信息服務領域的全新應用才能滿足。2013年1月,歐盟數字圖書館Europeana Cloud計劃正式開啟。
Europeana Cloud計劃目標包括6個維度:(1)提供統一的數據訪問端口,訪問內容包括新增的110萬條元數據記錄,以及對歐洲高校、圖書館、數據中心和出版社資源整合形成的500萬條科研數據;(2)為內容提供商、集成商等利益相關機構構建一個云技術基礎架構,以便其在整個歐洲范圍提供成本節約、優質高效的元數據及內容存儲服務;(3)深入了解并歸納云技術基礎系統中,文化遺產機構或域名聚合平臺涉及信息及內容的法律性、戰略性和經濟性問題;(4)達成全歐洲范圍內,內容集成商與科研網絡機構就云技術解決方案優勢的廣泛共識;(5)打造Europeana科研數字化平臺,促進科研數據信息的探索、應用和發現;(6)通過云平臺為科研人員提供更多的科研工具和服務,促進Europeana數字化內容的開發及科研創新[4]。
Work Breakdown Structure(工作分解結構,以下簡稱WBS),是項目管理常用規劃設計工具之一,該方法以可交付成果為導向,分組項目要素,歸納和定義每下一層級的項目工作范圍,將項目成果和項目工作分解成更為微觀、易于管理的組成部分,其中,Work Package(工作包,以下簡稱WP)是WBS中最低層元素,包含一系列的微觀可交付成果。通過WBS分解,Europeana Cloud計劃被分解為如圖1所示的7項WP。(1)評估云環境中科研人員需求狀況,確保相關利益團體對Europeana Cloud項目的參與;(2)構建歐盟數字圖書館的云計算基礎設施;(3)開創云服務平臺中的科研服務新工具及新模式;(4)豐富Europeana Cloud平臺中的內容創建和元數據創建;(5)解決云計算環境涉及的法律性、戰略性、經濟性問題,實現云計劃的可持續化發展;(6)云計劃的內容推廣、信息交流傳播及溝通性網絡建設;(7)整個Europeana Cloud的項目管理[5]。

圖1 Europeana Cloud計劃WBS-WP分解圖
List of Deliverables(可交付成果列表,以下簡稱LoD)是項目管理中的階段性及最終交付物的集合,也是WP的進一步細分,其在很大程度上反映了項目目標的要求,一切項目活動和資源都圍繞LoD的有效完成而產生。European Cloud計劃中的7項WP共被細化為39項可交付成果。交付成果既可以是有形的實物,也可以是無形、抽象的環境、服務,以WP2和WP3為例,WP2被細分為7項可交付成果:(1)有利于云計算基礎設施發展的環境;(2)云計算基礎設施結構設計文件初始版本;(3)元數據的云計算數據模型;(4)內容云的云計算數據模型;(5)元數據云計算數據模型中的核心服務;(6)元數據云和內容云的傳遞;(7)元數據及經分析處理內容的遷移和上傳。
WP3被細分為4項交付成果:(1)用戶人物角色分析、服務計劃方案、使用案例相關數據檔案;(2)服務應用工具及服務;(3)工具及服務評估報告;(4)Europeana科研門戶網站[6]。
Work Package Description(工作包說明書,以下簡稱WPD),顧名思義,是對工作包中項目目標、工作內容及職責的詳盡化說明。Milestone(里程碑事件,以下簡稱MS)是WP實施過程中取得的階段性重大成果,標志著項目的實質性進展。相較于LoD,WPD更為詳盡和具體地闡述了取得各項可交付成果的過程和方法,MS則突出了各項交付成果量化積累導致的質變成果。以WP2為例,圖2展示了云基礎設施建設的分解化工作內容和里程碑事件。

圖2 Europeana Cloud計劃客戶端角度系統架構圖[7]
Europeana Cloud的功能設計必須能夠滿足其潛在用戶的各項需求,WP2階段,歐盟云計劃項目組深入了解了Europeana、TEL(歐洲圖書館)等元數據集成方、終端用戶、內容提供商、科研人員的各項需求,并按需求程度及提及頻率歸納總結出Europeana Cloud的14項功能性標準:(1)支持數據更新的標識符分配功能,云端標志符/本地標識符的映射功能;(2)多種數據格式(如基于文本格式和二進制格式)和不同版本數據的存儲和訪問功能;(3)數據記錄能夠分組至數據供應商或數據集;(4)存儲數據相關鏈接能夠被有效驗證;(5)顯示數據記錄的提供方、數據及數據格式、許可證等相關內容,確保對數據訪問的有效控制;(6)對云端記錄更改的追蹤功能;(7)按特定數據集、特定格式或特定信息提供商進行數據訪問或下載功能;(8)數據記錄的自動轉換、處理功能;(9)建立數據間某特征下的聯系;(10)數據處理及映射前后相關聯系的追蹤功能;(11)當前內容快速掃描功能;(12)開放文件格式自動轉換功能;(13)能夠對自己在云端存儲文件的充分讀寫、訪問功能;(14)對不同版本數據記錄的鏈接支持功能[6]。
項目組進一步對14項功能需求進行分析和整合,規劃出Europeana Cloud系統開發的4步驟:(1)eCloud Alpha初始系統,實現第 1、2、3、6、13 項需求功能;(2)eCloud Beta測試系統,在初始系統功能基礎上,實現第 5、7、8、4、10 項需求功能;(3)eCloud 1.0正式版本,在測試系統功能基礎上,實現第9、11項需求功能;(4)系統完善階段,增加第 14、12項及其他個別性需求功能。
基于云用戶的需求分析及功能設計,Europeana Cloud計劃形成如圖2的云系統架構。從客戶端來看,整個系統可被視為一個相似于其他網絡服務的軟件即服務云;從eCloud存儲性相關系統功能來看,整個系統可被視為一個基礎設施即服務云。Europeana Cloud客戶端的各項服務分別有各自的API(Application Programming Interface,應用程序編程接口),同時,為確保云服務的縱向可拓展性,Europeana Cloud系統采用了REST(Representational State Transfer,含狀態傳輸)軟件構架風格。
具體來說,Europeana系統設計有兩種類型的云,計算云(虛擬服務器)和存儲云(NoSQL數據庫,分布式文件系統)。(1)計算云:計算云由前后端兩層服務層構成,前端服務層按照系統功能性標準,為用戶提供各項數據信息服務,因此又被稱為功能性服務層,其包含的每個功能化模塊都提供兩種形式的API,客戶端API及管理端API,前者是用戶服務使用的端口,后者為服務管理端口。后端服務層不直接服務于最終用戶,主要滿足系統管理及其他非功能性服務需求,后端服務層功能一般可通過系統外組件實現,各功能模塊同樣提供客戶端和管理端兩種形式API。(2)存儲云:為計算云中的各項功能性服務提供相應的存儲性服務。
長期以來,圖書館乃至整個信息服務產業都遭受著基礎設施構建、信息系統集成、信息資源管理、多元化服務領域中多種問題的困擾。以傳統的數據聚合模型為例,單向的數據傳遞模式及非統一規范性的集成管理信息系統勢必會帶來高額的信息運行和維護成本。除了高額的運營成本,較低的信息資源使用率、用戶未能滿足的信息化需求等問題亟待解決,云技術為這些長期困擾圖書館問題的解決提供了新的思路。以數據集成為例,Europeana Cloud通過統一技術支持框架的提供實現了數據的循環流通,元數據每經歷一次豐富完善將有效地傳遞給系統內的其他組織[8]。國內圖書館及信息服務機構應充分認識到云技術帶來的發展機遇,實現云技術與基礎設施建設、信息集成、信息管理及服務領域的充分融合,著重從以下3方面實施技術應用:(1)構建可持續發展的云計算基礎設施,提供高效的信息存儲、共享、訪問服務;(2)不斷豐富和擴大云平臺的元數據存儲及內容存儲;(3)為用戶提供行之有效的云技術服務項目和服務工具。
云技術服務平臺的構建牽涉到多方利益相關者,如信息集成商、內容提供商、終端用戶、科研高校及圖書館等,終端用戶的需求信息可以作為云平臺功能化標準的設計依據,而數據管理機構在長期的數據集成、管理過程中累積的豐富技術管理經驗則能夠為項目開發提供一定的人力資源和技術資源。Europeana Cloud正是在多方力量(包括高校、圖書館、基金會等的35個合作單位)集聚的基礎上開發其云技術服務平臺。國內云平臺的開發應在國家權威性政府機構或科研機構的號召下形成項目的廣泛參與,組建強大技術團隊,為開發功能完備、運作高效、成本節約的云服務平臺奠定基礎。功能完備的云平臺通常具備以下功能性標準:(1)標識符服務;(2)元數據及內容服務;(3)告知服務;(4)數據注釋服務;(5)數據處理服務;(6)許可、授權服務;(7)異步消息傳遞;(8)日志管理[9]。
Europeana Cloud計劃實施和管理中大量運用了項目管理的先進方法,如采用WBS方法將項目工作分解為一系列可交付成果,并從LoD/WPD/MS角度對每個WP進行詳細闡述及深入說明。國內云計劃或其他數據項目實施過程中,同樣可以大膽借鑒項目管理領域的先進理念和方法,從如下方面保障項目的有效管理和順利推進:(1)設立項目執行董事會、聯合會、督導組、協調小組、評估小組等項目執行、管理機構,建立云計劃項目實施的組織保障;(2)采用項目工作包管理方法,明確項目職責與權力劃分,制定項目期計劃,有效監控項目進度;(3)建立項目階段性報告制度,開展項目定期評估;(4)開展有效的項目質量控制管理和風險控制管理[10]。
云計算在各個領域得到廣泛運用,促進社會相關產業日新月異發展的同時,也帶來了諸如云計算環境和計算過程的安全性、云計算相關法律法規和標準化等系列問題。當數據、信息存儲于物理位置不確定的云端,服務安全、數據安全如何保障,隨著云技術與社會各產業領域的融合,如何從戰略高度對云計算的發展進行合理規劃等等,這些法律性、戰略性問題的解決直接關系到云技術未來的發展方向和發展態勢。Europeana Cloud計劃將云環境中法律性、戰略性及經濟性問題的解決單獨列為一個WP,顯示項目對其的高度重視性。國內云技術的應用及發展應從我國國情出發,制定相關的法律法規及政策,創造良好的產業環境,正確引導行業發展,通過技術保障和管理保障體系的構建切實解決各種法律性、戰略性問題,實現云計算在國內的可持續化發展。
歐盟數字圖書館Europeana Cloud利用云技術為終端用戶提供了統一的數據訪問端口、完備的服務功能和先進的云應用工具,為內容提供商、集成商構建了統一的云基礎架構,為科研人員打造了統一的科研數字化平臺,實現了計算云和存儲云的有機結合。云技術的應用有利于基礎設施成本的降低、數據集成和數據管理效率的提升及用戶多元化需求的滿足。國內圖書館及信息產業機構應在深入了解云用戶需求動態的基礎上,集聚多方力量,開發功能完備的云技術服務平臺,同時重視云發展環境中的法律性、戰略性問題,推進云技術應用的可持續化發展。
[1]云端服務:福布斯語言2013年云將成為科技話題NO.1[EB/OL].(2013-10-14)[2014-07-07].http://www.yixieshi.com/it/14626.html.
[2]Source“Cloud computing gains in currency”,Pew Research,May 2008.[EB/OL].(2008-09-12)[2014-07-07].http://www.pewinternet.org/2008/09/12/use-of-cloud-computing-applications-and-services/.
[3]調查:英國云計算應用率持續走高[EB/OL].(2014-07-15)[2014-07-27].http://cio.chinabyte.com/126/13 017626.shtml.
[4]Europeana Cloud will change the way that data is sent to Europeana,and will give researchers new tools to enrich and use that data[EB/OL].(2014-06-21)[2014-07-27].http://pro.europeana.eu/web/europeanacloud/home;jsessionid=17A8F7F50B551C44F231B1D 8113A73C4.
[5]Our project encompasses over 30 partners.[EB/OL].(2014-06-24)[2014-07-27].http://www.pro.europeana.eu/web/europeana-cloud/project-partners.
[6]CIP competitiveness and innovation framework programme 2007-2013[EB/OL].(2014-06-24)[2014-06-25].http://pro.europeana.eu/web/europeana-cloud/results/-/document_library_display/p6BV/view/1861926.
[7]D2.2:Europeana Cloud Architectural Design[EB/OL].(2014-06-24)[2014-06-28].http://www.pro.europeana.eu/web/europeana-cloud/results/-/document_library_display/p6BV/view/1861920.
[8]Europeana Cloud:a factsheet for aggregators[EB/OL].(2014-06-24)[2014-07-27].http://www.slideshare.net/Europeana/europeana-cloud-factsheet-final.
[9]Europeana Cloud High Level Principles[EB/OL].(2014-06-03)[2014-07-25].http://pro.europeana.eu/web/europeana-cloud/blog/-/blogs/europeana-cloud%3A-establishing-the-high-level-principles.
[10]Europeana Cloud Poster at LIBER 2014[EB/OL].(2014-06-04)[2014-07-25].http://www.pro.europeana.eu/web/europeana-cloud/blog.