周明 劉 翔 唐華旺 胡朝明
(浙江理工大學圖書館,浙江 杭州 310018)
在信息社會中,人們的各種觀念習慣都在改變,已不再滿足于各種條件限制,都想充分利用現有資源,更多、更好、更準確、更及時地獲得有用信息。如果數字圖書館能把全球的數字化資源連結,形成一個巨大的圖書館,就能實現信息資源共享。
我國高等院校在科研方面正在積極努力趕超世界先進水平,新技術和交叉學科的不斷涌現,使得很多前沿研究需要海量的計算資源、存儲資源和信息資源,但目前的網絡無法滿足高校師生科學研究的迫切需要。如果數字圖書館能把科研所需的各高校乃至全球的計算資源、存儲資源和信息資源調度協作無疑將是對科學研究的貢獻。
因此,組建一個基于網格的數字圖書館信息服務平臺,代表一個時代的進步,具有實現信息資源共享的劃時代意義。
數字圖書館現有的模塊結構屬于局部自治系統,沒有標準數據訪問接口,不能做到訪問異地數據資源如同訪問本地數據庫,數字圖書館模塊結構上需要提供標準數據訪問接口,建立統一的邏輯資源視圖,以滿足用戶的更高要求。
元數據是專門用來描述數據和屬性、提供與信息資源有關的結構數據,能夠有效地促進Internet信息資源的組織和發現。數字圖書館信息服務需要做到在更廣泛的網格信息中縮小搜索范圍,提供并行檢索,提高信息檢索的準確率和效率。
用戶通過Web、身份認證、網格應用代理進行網格連接,根據用戶提交的檢索任務,通過數據管理節點完成信息知識的發現與存儲,檢索結果數據傳輸返回用戶,基于網格的數字圖書館模塊采用可靠的信息安全控制機制,建立元數據目錄服務,提高資源檢索與利用率。在網格資源環境下,提供元數據目錄的生成、更新、存儲與服務。

圖1 基于網格的數字圖書館服務原理
數字圖書館建設應遵循CALIS行業標準,CALIS具有系統的可擴展性、標準和架構3層體制,資源建設上實現數字資源的共享、資源的互補、數字資源的規范和標準化。CALIS能把數字圖書館的標準和網格標準很好地結合起來,使數字圖書館在網格環境下更好地發揮作用。

圖2 基于網格的數字圖書館模塊結構
基于網格的數字圖書館模塊結構如圖2所示。模塊結構主要由信息服務模塊、作業管理模塊、信息管理模塊、數據管理模塊、服務管理模塊、安全管理模塊組成[1]。
4.2.1 信息服務模塊
數字圖書館網格服務的注冊、發布、元數據管理、服務檢索與服務匹配以及資源收集,是信息服務模塊提供的,它實現了服務的跨域檢索和信息服務的存儲。信息服務模塊包括超級服務管理、網格服務管理、拓撲結構管理、資源管理、分配調度管理、域間信息共享、服務元數據描述。
它的主要功能是:軟硬件資源信息組織、資源和服務信息注冊、資源信息更新監控以及資源發現與查詢服務。
超級服務管理為網格服務提供了統一的訪問接口,描述任務的功能需求,由系統自動根據用戶的資源要求選擇當前可用的網格服務。超級服務管理支持動態的資源接入和退出、支持超級服務的注冊、更新、查詢、按分類瀏覽、按域瀏覽。
網格服務管理提供對服務的注冊、查詢、瀏覽、發現和監控,支持對網格服務的語義和網格服務動態元數據描述。
域間拓撲結構管理維護所有域之間的拓撲結構關系,提供從任何一個域出發獲得整個網格域的功能。
資源管理的功能是在動態查詢時提供滿足條件的計算節點資源,這個資源可以是計算節點上的各種軟件和硬件,也可以是科學儀器設備。
分配調度管理是分配調度接口,根據用戶的查詢請求,返回滿足條件的接口,對網格服務進行統一調度。
域間信息共享能滿足多個域之間信息共享和統一訪問,用戶可以訪問所有域中已授權的所有資源和服務。
4.2.2 作業管理模塊
用戶提交的各類作業請求、服務選取、調度并對作業過程進行控制是通過作業管理模塊完成的。它包括作業提交、作業調度、服務支持管理、作業狀態監控。
作業管理模塊主要功能:負責接收用戶執行作業的請求,并按照作業的定義解釋執行作業,把作業執行的結果和監控等信息返回給作業請求者。
作業提交是提供作業請求的提交入口,用戶在Web頁面填寫、提交作業請求。
作業調度提供作業執行過程中所需要其他服務參與的調度以及作業執行中涉及的資源調度。
作業狀態監控提供作業狀態的監視和控制,定期檢查遠程執行狀態。
4.2.3 信息管理模塊
信息管理模塊包括信息分類、檢索技術、信息元數據采集、信息管理。它是基于網格環境下數字圖書館完成信息分類、檢索以及信息元數據采集、處理、調度的模塊。
4.2.4 數據管理模塊
數據管理模塊管理網格中的存儲資源和用戶數據,向用戶提供數據服務。其作用是通過統一的數據傳輸協議,為用戶提供統一的存儲資源訪問方式,通過元數據服務器提供數據服務,使用戶對數據進行透明訪問。
4.2.5 服務管理模塊
基本的Web服務、遠程連接、節點資源監控、提交服務、運行管理和服務狀態監控是通過服務管理模塊完成的。服務管理模塊結構有資源屬性、節點資源監控、提交服務、運行管理、服務狀態監控、通知。
4.2.6 安全管理模塊
安全管理模塊為數字圖書館提供安全保護,包括身份認證、認證中心(CA)、代理證書管理、服務安全管理、資源訪問控制。
身份認證包括用戶運行CA客戶端軟件生成私鑰文件和證書請求文件,存儲于用戶本地文件夾中,登錄證書發布網站,將證書請求上傳,審核通過后產生證書,用戶登錄證書發布網站下載證書文件供交互時進行相互驗證。
服務安全管理保證用戶提交的服務申請為合法有效,是為服務之間提供安全傳遞設置的。每個服務端點都必須進行入侵檢測、反病毒、身份認證、訪問控制、不可抵賴、授權,并用密鑰管理來保證消息傳輸的安全性。
通過上述功能模塊的組建提供了一個網格信息服務平臺,能夠擴展數字圖書館的Web服務,擴大資源共享的節點范圍,實現安全、可靠、方便的網格服務,滿足師生科學研究需要海量的計算資源、存儲資源、信息資源的需要。
基于網格技術的跨庫檢索可以通過引擎集成各類接口,封裝成WebServices部件后,發布到UDDI注冊中心,并通過接口加以調用。集成應用平臺由集成服務、監控服務、信息服務3部分組成。
當多種數據庫需要集成時,首先調用集成平臺接口,將SOAP路由器消息發布到UDDI注冊中心。WebServices接口訪問數據庫如圖3所示。
SOAP路由器是實現用戶調用WebServices的關鍵部件,以實現SOAP路由器消息的傳遞。
WebServices接口是集成引擎的核心,也是跨庫整合的關鍵,由應用接口、連接控制邏輯、數據轉換器、消息路由器等組成。

圖3 WebServices接口訪問數據庫
在網格環境下數字圖書館元數據并行采集可以通過采集調度模塊進行,經過數字資源處理后進行元數據處理與存儲,并返回給用戶。
元數據采集方法:采集模塊通過采集調度模塊分配地址,進行元數據采集,在采集完成后將元數據傳輸至元數據處理模塊;元數據處理模塊對元數據進行處理后傳至元數據存儲模塊分布存儲;應用模塊在采集元數據的基礎上為用戶提供檢索服務。
①采集調度模塊和采集模塊:負責采集節點之間的負載均衡,提供面向網格環境的一個接口,用戶可以訪問遠程機器上的資源,可以及時監視作業的遠程執行情況。
②元數據處理和存儲模塊:收集元數據并傳輸至存儲模塊進行分布存儲,建立分類索引。索引要用元數據進行描述,對分布存儲的元數據庫進行邏輯集中管理。這樣的存儲方式進一步縮小了搜索的范圍,提供了并行檢索的功能,整體上提高了信息檢索的準確度和效率。
③元數據訪問服務:組織因特網信息資源并促進因特網資源的發現是元數據的基本功能。元數據訪問服務把用戶對數據的描述生成多條元數據,然后在元數據目錄中查詢與之相符的記錄,最后把記錄中對應的文件返回用戶。
下沙高教園區數字圖書館信息服務平臺包括:
①數字圖書館任務管理平臺:該平臺對用戶進行身份認證后由用戶向網格提交任務,對任務進行元數據描述后,進行服務分配選擇,建立庫函數,對任務進行管理。
②數字圖書館數據處理平臺:該平臺通過統一的數據傳輸協議,為用戶提供統一的存儲資源訪問方式,通過元數據服務器提供數據服務使用戶對數據進行透明訪問。
③分布式知識存儲平臺與檢索平臺:知識網格中的各種數據庫可以集中存儲在互聯網的某一點,也可以分散存儲在若干點,用戶可將網絡資源數據庫視為知識網格站點,利用知識網格技術進行知識發現、知識挖掘、知識融合,最后形成新的知識服務于用戶。

圖4 信息服務平臺功能模塊
④知識服務平臺:知識服務平臺應用軟件為圖書館提供了高質量的知識服務,該平臺利用網格軟件實現信息檢索、信息發現、信息組織、知識生產、知識存儲、知識傳遞,以提供用戶需要的各種知識服務。
信息服務平臺功能模塊分為3層:高教園區數字圖書館門戶層、資源應用層及資源層。如圖4所示。
①高教園區數字圖書館門戶層是軟件子模塊的整合,完成一站登錄。
②資源應用層包括資源管理、資源服務、資源加工3個子模塊。資源管理模塊:統一檢索、資源調度、資源服務及版權保護;資源服務模塊:數據庫檢索、館際互借、參考咨詢;資源加工模塊:教科資源、聯合資源、網絡導航。
③資源層主要包括電子期刊、自建數據庫、資源倉庫等。
下沙高教園區數字圖書館是根據浙江省教育廳《浙江省高等教育數字圖書館(ZADL)數字圖書館服務體系建設項目實施方案》實施的,目標是以系統化、數字化的學術信息資源為基礎,以先進的數字圖書館技術為手段,構建面向整個高教園區的數字化文獻信息保障服務體系,形成具有國內先進水平、功能齊全、資源豐富、機制穩定、運行高效的數字化圖書館。
基于網格的數字圖書館信息服務平臺能夠整合多樣的、異構的資源,提供高性能和高效率的檢索服務;為師生提供科研所需的海量計算資源和存儲資源,最終實現虛擬環境下資源共享;代表著一個時代的進步,終將打破現有的各高校間局部自制系統,提高科研資源的調度協同能力。隨著人類對網格技術研究的不斷深入,數字圖書館將連結全球的數字化資源,形成一個巨大的圖書館,實現和提高資源共享和快速響應能力。我們相信基于網格的數字圖書館信息服務平臺的建設定會愈加完善。
[1]中國教育科研網絡公共支撐平臺工作組.中國教育科研網絡公共支撐平臺設計規范.北京:清華大學出版社,2004.
[2] 張付志,韓菁華,王斐.網格環境下的元數據并行采集框架研究與改進.現代情報技術,2008(8):88-90.