摘 要:針對空間信息資源的特點,列舉了OGC注冊模型語義化問題、OGC注冊模型語義匹配問題、OGC注冊模型與網格MCS數據模型轉換問題等。在此基礎上,將上述研究結合起來,提出了一種空間資源注冊框架,并給出了主要模塊和注冊實現過程。
關鍵詞:注冊;網格元數據目錄服務;ebRIM;空間資源
中圖分類號:TP311.52 文獻標志碼:A
文章編號:1001-3695(2008)07-1967-04
Geospatial resource registry frame research
CHAI Sheng1,2,ZHOU Yunxuan1,3,WANG Shengsheng2
(1.College of Geoexploration Science Technology, Jilin University, Changchun 130012, China;2.College of Computer Science Technology, Jilin University, Changchun 130026, China;3.State Key Laboratory of Estuarine Coastal Research, East China Nomal University, Shanghai 200062, China)
Abstract:Specifically for geospatial information resources characteristic,the paper listed the ebRIM semantic problem, the ebRIM semantic matching problem,the transition problem between ebRIM and grid MCS data model. Based above,the paper put forward geospatial resource registration frame and also introduced the main module and process.
Key words:registion;MCS;ebRIM;geospatial resource
網格計算是當前分布式計算技術的一個研究熱點。而開放式網格服務架構(open grid service architecture,OGSA)的提出為網格技術的實用化指明了一條道路。OGSA通過網格服務這一標準形式,為地理上分散的資源共享、管理、發現和利用提供了一個統一的途徑。在地理科學領域,許多項目已經采用網格技術來組織、管理相關服務和數據,如ESG、IPG等項目。OGC是一個國際組織,它致力于分布式環境下地理資源和服務互操作以及共享的標準研究與開發工作。OGC提出的相關規范已經廣泛應用,一部分成為ISO的相關標準。
1 網格目錄
1.1 MCAT和MCS
網格中所有元數據構成元數據目錄,它采用統一的結構來描述元數據。元數據目錄應當是一種層次和分布式目錄結構系統。目錄服務是網格的重要組成部分,它通過元數據目錄對網格中的資源進行有效組織和管理,為數據訪問、用戶身份認證、數據定位、訪問控制、復制管理等其他服務提供支持。另外,它為用戶提供訪問API,實現對元數據的插入、更新、刪除、查詢、過濾、授權等基本功能。針對網格環境下的地理空間資源特點(如異構、數據量大等),更需要強大的網格目錄服務來支持各種空間和非空間資源的發布、檢索。目錄服務設計的關鍵內容包括:定義元數據信息、存儲資源、文件、用戶等信息;系統提供基于用戶的資源存儲視圖,實現邏輯文件名與物理文件位置的分離及映射功能;元數據信息的檢索、擴展以及服務器性能的優化等。目前許多科研機構已經對目錄服務展開了各種深入的研究,目錄服務技術得到了學術界和工業界的廣泛關注。下面主要介紹MCAT[1]和MCS[2]。
SRB(storage resource broker)是一個客戶/服務器的中間件系統,提供了為在網格環境中實現異構數據管理而設計的一個統一訪問接口。SRB 被劃分成三個邏輯層:客戶機、metadata catalog (MCAT) 以及 SRB 代理。SRB 的核心部分是 MCAT。MCAT 是一個用來跟蹤名稱空間和數據對象到聯邦中存儲資源的映像系統。可以使用 MCAT 來確定將給定數據對象所加載的地方、文件屬性、元數據、訪問控制列表、存儲資源屬性和用戶數據。通過查詢 MCAT,客戶機可以簡單地查找分布的數據對象,對數據進行復制、傳輸或同步,執行復雜的查詢請求,以及實現其他功能。在利用網格解決地理數據和服務的共享和管理過程中,如何發布和發現地理數據和服務是非常關鍵的技術。首先必須抽象出地理數據和服務的元數據信息,如服務提供者、數據描述、接口描述等;然后通過某種機制將元數據信息發布出去,以便地理數據和服務的使用者查詢。網格元數據目錄服務(MCS)作為網格的一個核心組件,就是解決上述問題的。MCS(metadata catalogue service)是網格環境下的元數據目錄服務中間件,負責存儲和檢索邏輯元數據信息項,它是GriPhyN和NVO項目的一部分。下面是MCS的體系結構(圖1)以及主要流程:
a)客戶端系統向MCS提供需要查詢的資源屬性即資源元數據;
b)MCS根據這些元數據在MCS數據庫中獲取相應數據項并以邏輯資源信息返回;
c)客戶端系統根據這些邏輯資源信息向RLS服務提交查詢請求;
d)RLS根據邏輯資源信息檢索網格環境內相應物理資源并返回給客戶端系統;
e)客戶端系統根據物理資源信息訪問相應物理存儲系統;
f)返回物理資源。
MCAT是作為SRB項目的一個部分來實現的,與SRB項目結合非常緊密,很難將MCAT作為一個獨立的中間件來使用;而MCS是作為網格架構中的一個單獨的中間件來實現的,與其它系統耦合小,比較方便使用[1]。因此,本文選擇MCS作為網格環境下的目錄服務。MCS提供了網格環境下元數據的目錄存儲和訪問機制,但是目前MCS表達地理對象有它的局限性。(1)MCS表達復雜的元數據模型和它們之間的關系比較困難,尤其是地理科學領域,一個地理對象經常使用GML或者其它的一些二進制編碼格式;(2)MCS提供的服務接口不支持地理數據對象的處理和檢索[6]。
1.2 MCS數據模型
網格元數據目錄服務(MCS)的數據模型主要包括[3]:
a)邏輯文件元數據,包括邏輯文件名稱、版本號、創建者信息和數據最后修改情況等;
b)邏輯集合元數據,包括集合名稱、組成集合的文件集、創建者和修改者信息、集合層次信息等;
c)邏輯視圖元數據,包括視圖名稱、視圖屬性、視圖創建者/修改者、邏輯文件、集合、子視圖;
d)授權元數據,包括對邏輯文件或者集合的訪問權限;
e)元數據,描述作者聯系方式等的元數據;
f)審計元數據,包括記錄元數據服務行為等的動作元數據;
g)用戶自定義元數據,包括邏輯文件、邏輯集合、邏輯視圖等的屬性;
h)注釋元數據,包括邏輯文件、邏輯集合、邏輯視圖等的描述元數據;
i)歷史元數據,包括邏輯文件的創建、修改等歷史記錄元數據;
j)外部目錄訪問元數據,包括外部元數據目錄的元數據信息。
文獻[3]中詳細列舉了上述10種元數據的相關數據模型。下面針對第一種即邏輯文件元數據進行介紹,其他參見文獻[3]。表1中列舉了邏輯文件的主要屬性。
2 OGC資源注冊
2.1 資源注冊服務
OGC是一個國際組織,它致力于分布式環境下地理資源和服務互操作以及共享的標準研究與開發工作。OGC提出的相關規范已經廣泛應用,一部分成為ISO的相關標準。OGC Web服務可以無縫地訪問分布式環境下的地理空間數據,這些數據可能具有不同的格式和存儲位置。OGC主要的服務包括Web coverage services (WCS)、Web feature services(WFS)、Web map services(WMS)、catalogue service for Web (CSW)和Web registry service(WRS)。WCS、WFS和WMS定義了訪問分布式地理數據的各種接口;CSW定義了地理數據、服務的訪問規范接口;WRS定義了地理資源的注冊和發現接口。但是目前OGC已經將早期的WRS服務作廢,而正在討論新的資源注冊服務標準。
在分布式的網絡環境中,資源注冊服務是非常關鍵的技術。通過注冊服務,資源提供者可以將他們擁有的資源注冊并發布出去;而資源使用者可以通過目錄服務中提交相應檢索條件來檢索相應的資源。針對地理信息資源的注冊服務,ebXML注冊服務和協議(ebXML registry services and protocols)[4]已經成為事實上的標準,它提供了一套基于ebRIM數據模型的資源分類、注冊、描述接口。其中OGC使用的注冊信息模型(OGCRIM)就是以ebRIM數據模型為基礎進行擴展而來,提供了表達地理資源元數據和它們的關系、約束等的相關結構。另外OGCRIM還提供了注冊對象的組織和解釋方法。
目前,國外LAITS實驗室[5](Laboratory for Advanced Information Technology and Standards)的Di Liping教授帶領的工作小組正在從事網格技術和OGC技術結合的應用研究。他們認為,OGC使用的注冊信息模型和網格MCS使用的數據模型是互補的,可以通過建立相應的本體來進行轉換。在概念層次上,可以利用OGCRIM來表達地理資源元數據;然后利用MCS作為具體的元數據存儲和訪問的實現機制。針對異構、分布式的地理資源,可以將兩者結合起來提供一個地理資源發布和發現的目錄服務[2]。
2.2 OGC注冊模型
OGC目錄服務注冊模型建立在ebRIM[7]模型基礎上,并進行了相應的擴展以更好地適應空間資源信息的描述。ebRIM模型主要定義了一系列規范,這些規范提出了對相應領域的對象如何進行組織、約束和解釋的標準。圖2是ebRIM3.0的主要類關系視圖。
RegistryObject類是一個抽象基類,類圖中大多數類都繼承這個類。它包含了注冊對象應該具備的最小元數據集合,如名稱、對象類型和惟一標志符等。Association類繼承RegistryObject類,用來表示信息模型中對象間的多對多關系。ClassficationScheme類定義了一個樹狀結構,節點由ClassficationNode類組成,用來表示各個注冊對象的分類。Slot實例可以提供一種向注冊對象中動態加入屬性的方式。其他類參見文獻[7]。
OGC在ebRIM基礎上進行擴展,將ebRIM模型和ISO191115、ISO19119標準結合,形成了OGC注冊模型,用來準確地表達與空間資源相關的對象。其中:ISO191115是空間數據元數據標準;ISO19119是空間服務元數據標準。ebRIM模型與ISO191115、ISO19119標準結合的具體方法參見文獻[8]。
2.3 ebRIM數據模型的語義化
為了實現空間信息資源共享與互操作,資源提供者必須在注冊時同時描述該資源的語法信息和語義信息。語法信息即通常的元數據,如資源提供者、時間、關鍵字等;語義信息即詳細說明該資源的分類、約束條件、與其他資源的關系等信息。
OGC所采用的ebRIM數據模型在設計之初并沒有考慮語義信息的表示和存儲問題。文獻[3]中詳細描述了在ebRIM數據模型中加入語義信息的方法和過程。
OWL是當前Web上最有發展前景的本體表示語言。上述文獻首先描述了OWL和ebRIM的數據模型;然后具體解釋了兩者各個元素的轉換方法,說明在ebRIM數據模型中加入語義是完全可行的。
舉例來說[9],OWL類層次中使用rdfs:subClassOf屬性并且允許多重繼承關系,而ebXML類層次是一個樹狀結構,不能表達多重繼承關系。可以在ebXML模型中新定義一個subClassOf關聯關系,利用這個關系將需要多重繼承的類進行關聯。
2.4 OGC注冊模型和MCS數據模型轉換
基于網格的元數據目錄服務MCS不能夠完整地表達空間資源對象,所以只能解決非空間資源(包括數據、服務等)在網格環境下的注冊、發布和檢索問題。LAITS實驗室的網格項目認為將OGC注冊模型和網格MCS數據模型進行轉換能很好地解決這個問題。
文獻[6]認為,OGC 注冊模型和Grid MCS數據模型之間可以通過語義轉換進行映射。a)建立OGC注冊模型和MCS數據模型的本體庫,在本體庫中建立兩個數據模型的映射關系。b)構造兩個數據模型間的轉換引擎系統,轉換引擎系統接受其他模塊的調用,如接收注冊服務的數據模型對象;然后讀取本體庫,根據映射關系將OGC注冊模型對象轉換成MCS數據模型對象。
Grid MCS數據模型認為數據基本單位是邏輯文件,模型中用MCS_LOGICAL_FILE來代表邏輯文件,具體結構參見1.2節。ebXML數據模型認為數據基本單位是注冊對象(RegistryObject),注冊對象可以是數據文件、服務、對象關系等。實際上,1.2節MCS_LOGICAL_FILE表可以存儲RegistryObject所代表的所有內容。因此,MCS_LOGICAL_FILE和RegistryObject實際上是等價的。使用OWL本體語言來表達就是
〈owl:Class rdf:ID=\"MCS_LOGICAL_FILE\"〉
〈owl:equivalentClass rdf:resource=\"RegistryObject\"/〉
〈/owl:Class〉
MCS_LOGICAL_FILE和RegistryObject內部各個屬性之間也可以建立這樣的映射關系:
〈owl:DatatypeProperty rdf:ID=\"Logical_name\"〉
〈rdfs:domain rdf:resource=\"#MCS_LOGICAL_FILE\"/〉
〈owl:equivalentProperty rdf:resource=\"#value\"/〉
〈/owl:DatatypeProperty〉
〈owl:DatatypeProperty rdf:ID=\"Data_type\"〉
〈rdfs:domain rdf:resource=\"#MCS_LOGICAL_FILE\"/〉
〈owl:equivalentProperty rdf:resource=\"#ObjectType\"/〉
〈/owl:DatatypeProperty〉
OGC WRS數據模型和Grid MCS數據模型其他元素的詳細映射關系參見文獻[6]。
3 基于語義的空間資源注冊框架
3.1 框架結構設計
基于語義的空間資源注冊要比一般的資源注冊復雜得多,它不但包括了傳統的元數據注冊、大量的與空間和時間相關的信息注冊,而且要詳細說明注冊資源的語義。這使得基于語義的空間資源注冊服務構建比普通資源注冊服務的構建困難。為了給網格環境下多源異構空間資源的共享打下基礎,實現復雜的基于語義的空間資源注冊服務,下面在OGC空間信息服務架構和Globus網格架構基礎上,給出了一個基于語義的空間資源注冊框架。如圖3所示,上端為客戶端,中間是OGC的服務和本文新定義的服務與組件,下端為基于互聯網格的基礎框架。
圖3的框架已經考慮分布式的網格環境。中間層的服務系統可以分布在多個網格節點上,一般這樣的節點是指空間資源共享門戶;訪問中間層的客戶端可以是網絡上的任意客戶端;注冊后的空間資源元數據的存儲是分布式的,可以分布在不同的網格節點上。
1)客戶端
從調用方式上,可以將注冊資源的客戶端分為三種,分別是Web客戶端、應用系統客戶端和API級別客戶端。Web客戶端即使用瀏覽器訪問中間層服務;應用系統客戶端即桌面的C/S架構應用軟件訪問中間層服務;API級別客戶端即在其它客戶端系統中使用程序直接調用中間層服務。
從分布式網絡的角度,又可以將注冊資源的客戶端分為網格客戶端和非網格客戶端。網格客戶端即其他網格系統訪問中間層服務;非網格客戶端即普通客戶端訪問中間層服務。一般情況下,針對網格客戶端,中間層服務以grid service的方式實現;而針對非網格客戶端,中間層服務以Web service方式實現。本文框架的中間層服務同時支持grid service和Web service兩種方式。
2)中間層
發現服務和獲取服務是在OGC目錄服務[4]中有詳細的規范和定義。注冊服務是該框架的核心,提供對各種空間資源元數據的注冊服務,以便于資源的發現和共享。該服務是在實現ebXML Registry服務和協議基礎上進行擴展,增加了三個組件,分別是OGC注冊模型語義化組件、語義匹配組件和模型轉換組件。
OGC注冊模型語義化組件負責OWL和OGC注冊模型的轉換工作。客戶端訪問注冊服務,提交OWL格式的請求。該組件負責解析OWL并進行轉換,形成OGC注冊模型對象。轉換包括普通格式的信息和語義信息兩方面。
OGC注冊模型語義匹配組件負責檢查注冊資源的語義信息是否與現有系統中語義信息沖突或者匹配,包括語義一致性檢查和概念包含檢查等(本文提出注冊資源的語義匹配概念。關于語義匹配方面的技術,可以參考文獻[11])。該組件根據語義匹配算法,在基于本體的推理機協作下進行未注冊資源語義和已經注冊資源語義間的匹配性檢查。
OGC注冊模型與網格MCS數據模型轉換組件負責兩個數據模型間的雙向格式轉換工作,即OGC注冊模型轉換為網格MCS數據模型,或者網格MCS數據模型轉換為OGC注冊模型。
ebXML Registry[4]服務接口主要包括LifecycleManager和QueryManager兩部分。LifecycleManager接口提供了幾個操作來完成注冊資源的元數據和內容的注冊、更新、修改、刪除功能;QueryManager接口提供了發現和獲取注冊資源元數據和內容的功能。其中,元數據(包括普通元數據和語義元數據)主要注冊在數據庫中,具體實現方式可以采用LDAP目錄數據庫或者關系型數據庫;注冊資源的內容根據應用的需要可以注冊在文件系統或者數據庫中。一般來說,注冊資源內容包括空間信息服務和空間數據兩部分。較大的圖像類型空間數據經常注冊在文件系統中,而其他的空間數據經常注冊在數據庫中;對于空間信息服務,它經常由資源提供者維護,注冊中心一般只維護空間信息服務的元數據信息。
3)網格層
MCS是存儲和訪問邏輯數據項元數據的目錄服務。目前,它已經發展到第三版本,使用 OGSADAI3.1版作為中間件,可以與Globus RLS(網格副本位置服務)整合在一起使用。MCS主要包括MCS服務和MCS數據庫。其中MCS服務接受其他客戶端的調用;MCS數據庫主要存儲MCS數據模型,主要包括經過轉換的OGC注冊模型數據。注冊資源內容可以存儲在網格范圍內節點的文件系統或者數據庫系統中,對注冊資源內容的訪問主要通過RLS所表達的邏輯資源與物理資源的映射來進行。
RLS維護并提供邏輯文件名或邏輯集合與保存在物理存儲系統中物理文件之間的映射關系。RLS是由Globus項目小組以及DataGrid項目小組共同開發的。其目的是代替Globus2.x中的復制管理服務。與之相比較,RLS提供了更高的性能和可靠性。
該框架的基礎由Globus網格構件組成,主要完成網格范圍內的資源分配管理、安全結構、通信、文件傳輸等基礎性任務。
3.2 注冊實現過程(圖4)
實現空間資源注冊的前提是領域專家根據應用情況和系統要求建立領域本體知識庫。系統管理人員將上述領域本體知識庫維護到系統的MCS數據庫中。
基于語義的空間資源注冊框架內,實現一個空間信息服務的注冊步驟如下:
a)空間服務提供者通過客戶端訪問空間資源共享門戶,根據系統的領域本體庫選擇所提供服務的類別,并對所提供服務進行描述,包括普通元數據和語義元數據;然后提出注冊請求。
b)OGC注冊模型語義化組件將資源提供者的OWL注冊請求轉換為OGC注冊模型。
c)OGC注冊模型語義匹配組件獲取上述OGC注冊模型,并與系統中領域本體知識庫進行沖突性檢查。如果沒有沖突,則允許進一步注冊;否則停止注冊資源。
d)轉換組件將上述OGC注冊模型轉換為網格數據模型。
e)注冊服務訪問MCS服務器,將網格數據模型注冊到MCS數據庫中。
基于語義的空間資源注冊框架內,實現一個空間數據的注冊步驟如下:
a)空間數據提供者通過客戶端訪問空間資源共享門戶,根據系統的領域本體庫選擇所提供數據類別,并對所提供數據(普通元數據和語義元數據)進行描述;然后提出注冊請求。
b)OGC注冊模型語義化組件將資源提供者的OWL注冊請求轉換為OGC注冊模型。
c)OGC注冊模型語義匹配組件獲取上述OGC注冊模型,并與系統中領域本體知識庫進行沖突性檢查。如果沒有沖突,則允許進一步注冊;否則停止注冊資源。
d)轉換組件將上述OGC注冊模型轉換為網格數據模型。
e)注冊服務訪問MCS服務器,將網格數據模型注冊到MCS數據庫中。
f)空間數據提供者提供自己的數據資源,訪問注冊服務。
g)注冊服務訪問網格grid ftp服務,將數據資源上傳到網格節點的文件系統或者數據庫中。網格RLS服務將邏輯資源與物理資源進行關聯。
4 結束語
本文針對空間信息資源的特點,分析了國外的相關研究情況,包括OGC注冊模型語義化問題、OGC注冊模型與網格MCS數據模型轉換問題等。在此基礎上,本文將上述研究結合起來,提出了一種空間資源注冊的框架,并給出了主要模塊和注冊實現過程。
參考文獻:
[1]
MCAT[EB/OL].(2007).http://www.sdsc.edu/srb/index.php/Main_Page.
[2]MCS[EB/OL].(2007).http://www.isi.edu/~deelman/MCS/.
[3]SINGH G.A metadata catalog service for data intensive applications[C]//Proc of ACM/IEEE Conference on Supercomputing.2003.
[4]ebXML registry services and protocols version 3.0[EB/OL].http://docs.oasisopen.org/regreprs/v3.0/.
[5]Laboratory for Advanced Information Technology and Standards[EB/OL].http://laits.gmu.edu.
[6]ZHAO Peisheng,CHEN Aijun,LIU Yang,et al.Grid metadata catalog servicebased OGC Web registry service[C]//Proc ofACM International Symposium on Advances in Geographic Information System (ACMGIS)’04.New York:ACM Press,2004:22-30.
[7]ebXML registry information model version 3.0[EB/OL].http://docs.oasisopen.org/regreprim/v3.0/.
[8]OpenGIS catalogue service specifications 2.0ISO19115/ISO19119 application profile for CSW2.0[S].Open Geospatial Consortium Inc,2004.
[9]DOGAC A,KABAK Y,LALECI G B.Enriching ebXML registries with OWL ontologies for efficient service discovery[EB/OL].(2004-01-08)[200510-09].http://www.srdc.metu.edu.tr/webpage/projects/satine/publications/Dogac_A_Enriching.pdf/20040108.html.
[10]OpenGIS catalogue services specification [EB/OL].http://www.opengeospatial.org/.
[11]KLIEN E,EINSPANIER U,LUTZ M,et al.An architecturefor ontologybased discovery and retrieval ofgeographic information [EB/OL].(20041110).http://ifgi.Unimuenster.de/lutzm/wsmai04_probstlutz.pdf.
注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。”