楊 毅
(四川護理職業學院,四川成都,610100)
云計算技術具有很多優點,如虛擬化、規模超大、可擴展性高、易用性、價格低廉價、按需服務等,因此,在數字圖書館服務共享平臺建設中應用云計算技術,可以提高資源的利用率和共享度。
在數字圖書館建設中應用云計算技術可以實現以用戶為中心,顯著提高用戶的服務體驗,并且對用戶的終端設備要求不高,使用簡單,用戶通過簡單的操作即可獲得服務平臺中的服務和信息。由于云計算的應用性較強,因此,為圖書館今后的發展方向提供了全方位的指導。圖書館中存儲了大量的數據信息,因此可以利用強大的互聯網無線功能和當前的服務器資源開展全天候24小時無限制的信息服務,在最大程度上提高圖書館信息的利用率和開放存取。因為全球的數字圖書館都可以通過圖書館云服務平臺整合每個圖書管的特色館藏資源,形成一個超大的綜合信息庫,最大限度的提高信息資源共享度,因此,圖書館的“云”時代即將到來。當前,我國進行數字圖書館建設的單位主要是高校,其側重點在于學術資源共享,而對于平臺的天文信號分析和數據挖掘等方面的研究。
云計算的服務模式主要包括3種服務模式,分別為IaaS(基礎設施即服務)、SaaS(軟件即服務)、PaaS(平臺即服務)。
(1)IaaS:“云端”基礎設施是由多臺服務器集群組成,用戶可以通過互聯網按量獲取服務。它提供的服務主要包括虛擬化服務器和存儲資源等,商家提供硬件設施,用戶付費即可使用,這種服務被稱為托管式的硬件服務。其實質就是出租基礎設施服務,具有代表性的此種類型的云服務為IBM的“藍云”服務和Amazon Web服務。
(2)PaaS:這種服務模式是將提供的服務是軟件開發環境和研發平臺,將這些設施提供給客戶,客戶自行開發應用程序,然后這些程序通過互聯網共享使用。從實質上來講,PaaS和SaaS為用戶提供服務的模式一樣。但是,PaaS提供的服務是軟件開發平臺,SaaS提供的服務是應用軟件。具有代表性的PaaS有Google App Engine(Google公司)和Salesforce的force.com平臺。
(3)SaaS:此種服務模式為用戶提供的服務是應用軟件。服務提供商將自己提供的應用服務統一放置在自己的“云端”服務器上,通過互聯網將這些信息提供給用戶,用戶根據自身需求付費進行訂購,此種服務使用簡單,通過瀏覽器即可。具有代表性的這類服務包括Zoho Office、Google Apps、Google Doc等。

圖1 基于云計算的數字圖書館系統的整體結構
云計算的系統結構主要包括3部分,分別為主服務器節點、子服務器節點、客戶端。
主服務器節點的主要功能包括檢測容錯、負載均衡、數據映射及任務調度等,并對子服務器節點進行調度和管理。子服務器節點的主要功能為高度并行的數據存儲和計算處理,所有數據資源匯集到此進行處理,形成一個工作資源池,它和客戶端直接進行數據交換,采用虛擬技術使資源利用率不斷提高,達到最大化。由圖1可知,“云”服務器包括子服務器節點和主服務器節點,向客戶端提供Paas、IaaS、SaaS三種類型的服務。云計算Hadoop構架主要包括MapReduce編程、HDFS、HBase等。MapReduce編程主要包括一些算法,對數據進行并行處理,而HDFS、HBase則是對數據進行讀取和存儲。用戶登錄之后,通過客戶端可以使用云計算的相關服務,向應用層提出相關的請求,請求結果也通過客戶端傳遞給用戶,此外,客戶端除了登錄之外,用戶還可以進行注冊或者是定制某些服務。
云計算技術是在計算機技術和網絡技術的基礎之上發展而來,揚長避短,充分結合了二者的優勢,其技術實質是將IT軟硬件資源如服務器、應用軟件等虛擬化,其主要關鍵技術主要包括以下4方面。①虛擬化技術。這種技術主要是通過新增的虛擬中間層截獲上層軟件對底層接口的調用,并重新對該調用做出處理和解釋,這樣可以在異構環境中實現資源的協同、管理和共享,同時還能夠實現應用的運行維護、遷移和部署。②海量數據管理技術,該技術提出了基于Map.Reduce的編程模型,提高數據處理的速度,并獲得可靠的數據處理結果。③分布式數據存儲技術,這種技術使用多臺機器的存儲空間,將這些不同機器的存儲空間虛擬成一個存儲設備進行存儲,抽象表示存儲資源,并對它們進行統一管理,確保存儲資源的讀寫操作安全。④分布式計算和并行計算。分布式計算研究的是怎樣將一個十分復雜,需要巨大計算能力才能解決的問題分成許多小的部分,然后把這些部分分配給一個計算機集群進行處理,然后收集問題處理結果,最終得到大問題的處理結果。并行計算(Parallel Computing)是指同時使用多種計算資源解決計算問題的過程。強調的側重點是時間同步。當前比較成熟的并行模式主要包括3類,分別為分布存儲模式、共享存儲模式、共享存儲與分布存儲混合模式,其相應的程序設計也可以分為3類,分別為基于消息傳遞程序設計,典型代表為PVM和MPI;共享程序設計,典型代表為OpenMP;混合編程模式,典型代表為MPI+OpenMP。
基于云計算的數字圖書館云服務平臺集合了很多優質的知識資源,是知識中心,使用十分方便、無時間和空間限制,可以實現智能檢索和跨庫無縫鏈接。為了降低平臺的構建成本,實現多媒體信息的無障礙傳播,一定要解決以下幾個問題:一是,建設的平臺具有通用性,能夠滿足多種類型的數字圖書館建設項目的共性需求,并能夠抽象成最小的獨立功能單元;二是,對數字圖書館平臺運行機制進行研究,如資源表現方式、資源瀏覽方式、資源元數據信息的描述和資源編輯方式等等;三是,能夠適應不同的環境,滿足不同用戶的特殊要求,通過某種機制定制平臺的特征以適應實際情況;四是,平臺構建的數字圖書館不是孤立存在的,是相互聯系的,通過一定的通訊機制相互瀏覽和獲取信息,提供系統擴展需要的應用接口,實現系統的統一登錄入口。
基于云計算技術構建的數字圖書館云服務平臺是一種對用戶透明的服務平臺,該平臺可以為不同的終端用戶提供不同的服務界面,存在相應的接口支持本平臺的應用程序開發。不同的用戶平臺的訪問使用方式不同,普通用戶可以直接通過用戶界面訪問該平臺,專業用戶可以通過調用平臺的開放應用接口使用多樣的單元服務。用戶在使用平臺時,不需要了解其運行機制和功能的實現,只需要根據自己相應的功能需求選擇功能單元即可,并將功能需求通過任務的形式提交給平臺,平臺自動執行,實現用戶的功能需求。
數字圖書館平臺內部功能模塊主要是通過開放應用接口和用戶界面兩種形式為用戶提供服務。為了提高平臺的數據信息安全性,開放應用接口提供的服務為透明服務,但是對于一些機密信息,如系統管理等系統安全權限等,只能通過平臺的用戶界面進行調用,用戶界面也可以通過調用應用接口對能夠調用的外部程序進行調用。基于云計算的數字圖書館系統的整體結構如圖1所示。
數字圖書館服務平臺的建設主要包括計算資源、數字信息資源、應用系統、存儲空間及操作界面等。平臺從上到下包括用戶層(客戶端)、服務層、數據處理層、虛擬化層和物理資源層。
(1)物理資源層
物理資源層處于平臺的最底層,主要包括CPU資源、網絡資源、計算資源、存儲資源、I/O資源等。
物理資源的結構和規模是一種固定的形式,不能隨意對其進行更改,因此,需要采用虛擬化技術整合相關的資源,這樣才能更好的為上層服務。
(2)虛擬化資源層
該層主要是利用虛擬化技術對物理資源層進行整合,將CPU、服務器、存儲、網絡、I/O等進行抽象、轉換,將它們轉換成虛擬化資源,使云計算平臺的資源調配更加靈活,用戶能夠更好的應用這些資源。虛擬化資源層包括應用虛擬化、存儲虛擬化、計算虛擬化、網絡虛擬化、服務器虛擬化等。存儲虛擬化依靠分布式存儲技術和網絡文件系統技術實現。計算資源包括CPU資源和內存資源,因此其虛擬化包括前述兩部分的虛擬化。網絡虛擬化是讓一個物理網絡能夠支持多個邏輯網絡,虛擬化保留了網絡設計中原有的層次結構、數據通道和所能提供的服務,使得最終用戶的體驗和獨享物理網絡一樣,同時網絡虛擬化技術還可以高效的利用網絡資源如空間、能源、設備容量等。基礎設施層由虛擬化資源層和物理資源層共同組成,為了降低平臺的建設成本,該層可以使用開源技術進行構建。可以選擇OpenStack構建基礎設施層,因為它的功能十分強大,商用評估較好,虛擬化技術支持程度較高,兼容性、擴展性和靈活性較好,采用分布式和異步體系結構,支持多種虛擬機鏡像和iSCSI存儲容器管理等,使用戶更加快速的構建云基礎設施。
(3)數據處理層
數據處理層主要是對各種數據進行處理,包括數據庫訪問模塊和各種異構數據庫。在云計算的環境下,構建的數字圖書館服務平臺利于最大程度的實現資源共享,該層即為應用服務層提供支撐,又對基礎設施層進行抽象封裝。該層基于云計算的PaaS來實現和部署,提出了數據處理接口,它是數字圖書館提供個性化信息的核心層,并對資源進行合理的調度和優化處理,最終提供給用戶使用。用戶向數字圖書館提出服務請求,數據處理模塊對用戶需求進行分析和細化,資源調度模塊根據細化后的需求動態的調度合適的資源給用戶[70]。
(4)服務層
服務層包括用戶管理服務、郵件管理服務、門戶網站服務、搜索引擎服務、圖書管理服務、安全管理服務、借閱管理服務、信息發布服務。用戶管理服務主要是對用戶進行管理,包括查詢用戶、增加用戶、刪除用戶、修改用戶,并且不同用戶的管理權限也不相同。借閱管理服務主要是管理相關的紙質圖書資料。安全管理服務主要是驗證用戶的身份,確保平臺中的資料安全,角色不同其訪問權限也不相同。搜索引擎服務主要是檢索學術資源,并對其進行下載,信息發布服務可以進行書刊,并發布相關的圖書信息,進行專題訂閱等。資源管理服務主要對相關資源如網絡資源、存儲資源、計算資源進行回收、調度、配置和動態部署等進行管理。服務層可以通過J2EE平臺實現,該平臺可伸縮性較強,能夠支持異構環境,能夠對J2EE平臺進行快速構建。
(5)用戶層(客戶端)
用戶通過相應的門戶可以訪問云服務,比如手機、計算機、平板電腦等,因此需要對內外部服務進行匯總,定制個性化服務,針對的門戶設計不同的顯示界面。用戶顯示界面的設計和設置可以應用JSF(Java Server Faces)技術實現。采用JSF技術構建用戶界面的開發模式選擇組件模式和事件驅動模式,并以組件為中心,使Java Web應用程序的開發變得比較簡單,提高了Web應用程序的構建速度,使開發的程序更具有業務邏輯性。
根據數字圖書館的功能需求,其功能模塊主要設計為以下四個:數圖構建模塊、電子書借閱模塊、電子書閱讀模塊、后臺管理模塊。數圖構建模塊包括:創建機構館子模塊、圖書分類子模塊、數據同步子模塊、站點鏡像發布子模塊;電子書借閱模塊:U盤借閱子模塊、借閱流程子模塊及移動硬盤借閱子模塊;電子書閱讀模塊:在線閱讀子模塊和離線閱讀子模塊;后臺管理模塊:用戶身份管理子模塊、電子書管理子模塊、權限管理子模塊、副本數管理子模塊。
用戶通過客戶端向云服務平臺發出請求,以WEB形式提供服務,用戶可以隨時在網絡條件下對數字圖書館進行訪問,同時也和Web云上的用戶共享流量和計算能力。用戶發送動態請求驅動云服務平臺,云服務平臺接收請求之后,采用描述語言對其進行描述。
描述信息資源時,可以在數字圖書館節點平臺所提供的信息資源云中通過信息資源發布和信息資源發現兩種方法尋找匹配的信息資源。在進行資源匹配時,云服務平臺通過虛擬技術對虛擬硬件的存儲和計算能力進行動態部署,為了確保數據信息的完整性,部署的同時優化多功能負載。
因為數字圖書館節點中存儲的資源都進行統一設置,因此,只要輸入需要資源的信息名稱即可進行行信息資源預置。信息資源預置和記錄器的作用相差不多,能夠將記錄用戶所需要的所有信息資源,能夠實現多個信息資源的并發存取和對信息資源的保證存取,保證用戶所需要的安排執行應用全部信息資源。
數字圖書館云服務平臺對用戶需求的匹配信息資源進行狀態估計,也就是使用當前的歷史數據庫和信息資源的狀態信息提供任務調度信息。按照云服務平臺的控制任務要求,在“云”中運行的資源云集群提供用戶需要的資源。

圖2 數字圖書館云服務平臺運行機制
綜上所述可知,數字圖書館云服務平臺的主要服務流程為信息資源描述、匹配、調度、發布。
數字圖書館云服務平臺提供了數字資源的采集機制。由于每個節點平臺中都存儲數字資源,因此需要采用按需檢索的方法對信息進行采集,但是,對于一些沒有進行統一管理的分散資源則沒有必要集中。用戶檢索時,只能看到統一的平臺檢索界面。用戶使用云服務平臺,提交查詢請求之后,云服務平臺動態的將這些請求分配到每個節點的云平臺之中,然后對信息資源進行采集和調度,再根據用戶需求進行選擇、集成和整合。這樣的采集方式,先對信息進行篩選,將重復信息刪除,這樣不會出現重復存儲的現象浪費存儲空間,用戶也能夠更好的利用數字圖書館提供的服務。
數字資源組織與管理在數字圖書館云服務平臺的運行中非常重要,處于核心地位。在部署數字圖書館云服務平臺時,應用的核心軟件較多,比如數據庫虛擬化技術,它將應用程序組件和信息源、磁盤、計算機等單個資源根據類型集中在一起,云服務平臺的子節點服務器系統也需要構建一個從屬的平臺或者是運行一個模型,使用時更加協調。對于云服務平臺子節點平臺中的異構數據資源則由主節點平臺進行集中管理和調度。為了確保各個節點平臺的數據資源共享并提高云服務平臺的信息搜索效率,需要對節點平臺的數據資源進行管理,重新利用元數據收割技術建立表單。云服務平臺通過對節點平臺的數據資源進行有效調度和管理,數據經過優化整合之后,進行共享、查詢、保存、解析、關聯、管理等一系列過程,這樣可以滿足用戶的個性化需求。數字資源組織管理機制主要有兩方面的作用,一是,自動分配工作負載,高效利用閑余計算容量;二是,隨時增加計算容量。
數字圖書館云服務平臺的組成主要包括兩部分,分別為提供服務必須的應用程序和軟硬件基礎設施。利于虛擬化技術,云服務平臺可以為用戶提供統一的操作系統和相應的應用軟件程序服務。用戶提交服務請求信息,云服務平臺對用戶請求進行解析和規范化處理,同時將其發布到節點服務平臺,節點服務平臺根據任務調度,查找子平臺中的匹配信息,查找之后匯總、信息,云平臺對反饋回來的數據信息進行整理,如分類、提取等,信息整理好之后,發布給用戶。
數字圖書館云服務平臺的運行機制包括以上三部分,這三種機制之間是相應作用和聯系的,缺一不可。它們之間的相互作用機制如圖2所示。由圖2可知,數字資源采集機制先采集到用戶需要的信息,然后數字資源組織和管理機制對這些信息進行管理,任務調度和分配管理,最后通過用戶服務機制將這些信息發送給用戶。信息采集是基礎,信息組織和管理是核心,數字資源組織和管理機制除了對信息進行管理之外,還要對用戶進行管理,并且確保信息資源的安全性。用戶服務機制主要功能是對用戶進行服務,發送用戶的請求,展示用戶需要的數據信息,這些信息通過WEB界面提交給用戶。數字圖書館云服務平臺的運行機制之間相互協調與配合,一個機制出現問題會引起關聯反應,導致云服務平臺不能正常運行。
本文主要對數字圖書館云服務平臺的構建進行了闡述。隨著科學技術的發展,云計算系統變得更加成熟,其應用也越來越廣泛,數字圖書館也將會向著云服務的建設方向發展,并且得到了重視。圖書館作為一個信息資源的集合機構,含有大量信息,其信息化程度越高,越能為用戶提供優質服務。云計算正是一種將海量信息有效集合在一起的技術,將圖書館和云計算機優勢完美結合,通過互聯網規整各個圖書館的零散信息,對其進行統一,實現數字圖書館的資源融合和信息利用率,不斷探索,適應時代的發展需要,增加自身競爭力,為用戶提供個性化的優質服務。
參考文獻
[1]喻昕,王敬一.基于云計算技術的數字圖書館云服務平臺架構研究[J].情報科學,2011,29(7):1049-1053.
[2]裴紅羅,王運圣,江洪濤,等.基于云計算的數字圖書館平臺架構設計[J].中國農業科技導報,2010,12(6):126-129.
[3]陳宮,牛秦洲.基于云計算的數字圖書館信息服務平臺[J].情報科學,2012,30(5):684-687.