孫玉梅 邊占新 高立友
(石家莊鐵路職業技術學院 河北石家莊 050014)
云GIS環境下分布式空間數據集成技術研究
孫玉梅 邊占新 高立友
(石家莊鐵路職業技術學院 河北石家莊050014)
云GIS環境下,利用空間數據的首要問題是解決分布式多源異構空間數據的集成問題。云計算環境下,空間數據通過Web Service的形式實現標準化、同構化,為進一步集成應用奠定基礎,而OGC Web Service(OWS)的空間數據服務規范被廣泛認可和使用。首先研究了基于OWS空間數據服務規范的空間數據源模式;然后設計并實現了基于OWS空間數據服務規范的空間數據集成,包括WFS空間數據服務的集成模式設計、集成數據分片條件判斷、集成模式構建以及集成算法的實現;最后以河北省某市2個縣的土地利用數據為例實現了云計算環境下基于OWS服務的分布式空間數據區域集成和專題集成。
云GI OGC OWS 分布 集成
空間數據的來源非常豐富,包括各種類型的空間數據,如遙感影像數據、測量數據、矢量數據和各種屬性數據等;不同的GIS軟件如ArcGIS、MapGIS、Supermap、MapInfo等造成形式各異的數據格式;再者由于體制、技術等多方面的原因,存放大量空間數據的節點之間相互隔離,無法共享數據,形成了空間數據多源、異構和分布的特點。而隨著社會經濟發展,全球氣候變化、資源調查、抗震減災等跨地域、跨部門、跨系統空間數據的集成應用需求越來越迫切,空間數據的多源、異構、分布的特性與其集成化應用之間的矛盾不斷加大。
隨著基于Web 應用的互聯網技術的不斷豐富,并行計算、分布式計算[1]、虛擬化等技術的成熟與廣泛應用,云計算技術已經成為IT 技術發展的一個重要趨勢[2]。云GIS環境下,利用空間數據的首要問題是解決分布式多源異構空間數據的集成問題[3]。目前被廣泛認可的一種方法就是采用基于OGC Web Service(OWS)的空間數據服務規范實現異構空間數據的集成。OWS空間數據服務規范主要從兩個方面解決了空間數據的異構問題[4]:一是基于XML的空間數據統一描述模型語言GML;二是基于SP(Service Provider)的空間數據查詢統一接口。OWS空間數據服務規范主要包括網絡要素服務規范(Web Feature Service,WFS)[5]和網絡覆蓋服務規范(Web Coverage Service,WCS)[6],經過多年的實踐和改進,已經得到了GIS領域軟件和服務提供商的廣泛支持,并成為事實上的空間數據Web發布標準[7]。如何利用OWS規范具體實現分布式空間數據集成是需要重點解決的問題。
云計算環境下分布式空間數據集成的核心是在將分布在網絡上不同節點的空間數據以邏輯上一致的全局數據視圖提供給用戶。這些本地網絡節點上的空間數據是數據源,其數據構成和邏輯結構是數據集成系統的數據源模式;對應地,在集成網絡節點上的邏輯一致的全局數據視圖是集成模式??臻g數據集成機制研究的目標就是如何將各個網絡節點上具有不同邏輯和物理結構的本地空間數據以邏輯統一的模式呈現給用戶。
對于空間數據文件或空間數據庫通??梢灾苯荧@得空間數據的邏輯結構和物理結構信息,而對于空間數據服務則需要在了解其數據查詢接口、操作支持和參數含義的基礎上才能獲得其提供的空間數據源模式。
OGC規范規定每個OWS(OGC Web Service)都必須具備通過GetCapabilities操作返回描述其自身服務元數據的能力,所以通過GetCapabilities操作獲取WFS的Capabilities文檔,解析得到空間數據服務的服務信息和空間數據信息。
Capability文檔只是提供了空間數據服務所提供的空間數據的基本元數據信息,而要構造數據源模式還必須獲取其數據結構的信息,通過DescribeFeatureType操作獲取WFS 提供的FeatureTypeDescription XML文檔,解析后可獲得FeatureType空間數據的屬性結構信息。能力文檔Capabilites文檔給出了對應WFS服務的元數據信息和其提供的數據的元數據信息,其主要內容見圖1。

圖1 WFS能力文檔
云GIS環境下基于OWS規范空間數據服務集成模式由各個符合OWS規范的空間數據服務數據源模式集成所得,從用戶或者應用程序的角度來看,集成空間數據服務與一個單獨的空間數據服務沒有什么區別,即完全可以用調用單個空間數據服務的方法來調用集成空間數據服務。
由數據源模式構造集成模式的關鍵技術問題是解決模式沖突,即如何將分布式空間數據服務的數據源模式采用統一集成模式表示。
3.1WFS空間數據服務的集成模式設計
由于WFS空間數據集成模式可能存在區域分片,也可能存在專題分片,或者既有區域分片也有專題分片。因此,集成模式需要對這兩種分片進行準確描述,另外WFS的集成模式同數據源模式一樣,也要符合WFS規范,根據以上約束條件,設計了WFS空間數據服務的集成模式。其主要由四個關系組成:集成WFS的服務信息R(Integ_WFS_ServiceInfo),集成WFS的FeatureType要素信息R(Integ_WFS_FeatureTypesList)、集成WFS的FeatureType數據結構信息R(Integ_WFS_FeatureTypeElements)和集成數據分片信息R(Integ_WFS_ _Fragements)。各關系結構及相互關系如圖2所示:
從圖2可以看出,WFS集成模式的R(Integ_WFS_ ServiceInfo)和R(Integ_WFS_ FeatureTypeList)集成WFS的Capability文檔內容,相應GetCapabilities操作;R(Integ_WFS_ FeatureTypeList_Elements)描述了集成FeatureType的數據結構內容,相應集成WFS服務的DescribeFeatureType操作;R(Integ_ WFS_ Fragments)記錄了構成集成FeatureType的數據分片的信息,包括數據分片的入口調用地址SubURL和其對應子圖層名稱SubTypeName。

圖2 集成WFS模式設計
3.2WFS集成數據分片條件判斷和集成模式構建
(1)WFS集成數據分片條件判斷
設F為需要進行邏輯集成的FeatureType類型數據,F.TypeName為F的要素圖層名,F.FeatureType.Elements為F的屬性結構表,設F由n個WFS提供的FeatureType構成,即F={Fi, 1≤i≤n}由多個Fi邏輯集成 F過程中首先需要根據集成要求對Fi進行集成分片條件判斷。
1)區域分片集成條件判斷
設F由{Fi}由區域分片集成構成,若Fi同時滿足下列條件,則Fi為集成F的區域分片集成片段:
①TypeName和F相同
Fi.TypeName=F.TypeName∧
Fi.ElementNames=F.ElementNames∧
Fi.ElementTypes=F.ElementTypes∧
②空間參考系統滿足集成條件要求
(Fi.DefaultSRS=F.DefaultSRS∨∫(Fi.DefaultSRS)=F.DefaultSRS)
③比例尺相同
④數據采集時間相同
⑤滿足區域分片條件:
Fi.BBOX∈(F.BBOX)
2)專題分層集成條件判斷
設F由{Fj}專題分層集成構成,A為F的主健屬性,則若Fj滿足下列垂直分片條件,則Fj為F的垂直片段:
①空間數據范圍相同
Fj.BBOX=F.BBOX
②空間參考系統滿足集成要求
(Fi.DefaultSRS=F.DefaultSRS∨∫(Fi.DefaultSRS)=F.DefaultSRS)
③比例尺和數據采集時間相同
④包含主健屬性A
A∈Fj.ElementName
⑤要素圖層名包含在需要集成的圖層名稱集合內
Fj.TypeName∈{F.TypeNamesi,1≤i≤n}
(2)WFS空間數據全局集成模式的構建

圖3 WFS集成算法
如圖2所示,WFS數據集成模式由集成空間數據的服務信息關系表Integ_WFSServiceInfo、集成空間數據FeatureType的元數據信息關系表Integ_WFS_FeatureTypeLists、集成空間數據FeatureType的數據結構信息關系表Integ_WFS_FeatureType_Elments、集成空間數據FeatureType的分片模式關系表Integ_WFS_Fragments,其中前三個表由集成數據服務WFS根據需要進行設置,而集成數據的分片模式關系表則由區域集成片段和專題集成片段填充。
若Fi滿足區域集成條件,為集成數據F的區域分片,則填充F對應的Integ_WFS_Fragments關系表,將提供Fi的WFS服務地址和其滿足的分片條件圖層分別填充到Integ_WFS_ Fragments關系表中對應的SubURL和SubTypeName字段中。
若Fj為滿足專題集成條件,為集成數據F的專題分片,則填充F對應的Integ_WFS_
FeatureType_Elments和Integ_WFS_Fragments關系表,將提供Fi的WFS服務地址和其滿足分片條件的Feature圖層的TypeName填充到Integ_WFS_ Fragments關系表中對應的SubURL和SubTypeName字段中;將其SubTypeName圖層的數據結構信息ElmentName、ElmentType值填充到Integ_WFS_ FeatureType_Elments關系表中。
3.3WFS空間數據服務的集成模式算法
根據集成服務的設計模式和集成條件,設計了WFS空間數據服務的集成模式算法,主要包括區域分片集成算法WFSHorFragIntegAlgorithm(見圖3)和專題圖層集成算法WFSVerFragIntegAlgorithm。
WFS專題分片集成算法WFSVerFragIntegAlgorithm與區域分片集成算法類似,不再贅述。

圖4 2個Geoserver服務器節點上的空間數據服務
根據上述云計算環境下基于OWS標準的分布式空間數據集成機制的理論體系和實現方法,以河北省某市兩個縣的土地利用數據為例,包括地類圖斑、線狀要素、零星地物、行政界限、地類界限等矢量數據,在2臺Geoserver服務器和1臺客戶端上進行的驗證,實現目標:
一、建立基于OGC標準的并滿足《土地利用空間數據庫》標準的土地利用空間數據服務,見圖4;
二、在區域上,實現“市-縣”各區域土地利用空間數據的邏輯無縫集成,見圖5;
三、在專題上,實現同一的空間范圍內保證各類型專題數據能夠實現空間上的疊加和套合,見圖6;

圖5 Integ_WFS空間數據服務區域集成

圖6 Integ_WFS空間數據服務專題集成
云GIS環境下利用空間數據的首要問題是解決分布式多源異構空間數據的集成問題。采用基于OGC Web Service(OWS)的空間數據服務規范實現云GIS環境下異構空間數據的集成是被廣泛認可的一種方法。在以往的研究工作中,分布式空間數據集成對象主要是分布的空間數據文件、異構的空間數據庫系統等。但基于OWS規范的空間數據服務在數據訪問方法、查詢接口和應用模式等方面與空間數據文件和空間數據系統存在很大的不同,因此,其集成模式的構建也必然存在較大的區別。
通過對OWS空間數據服務的數據源模式提取方法分析和“Capablility”能力文檔的解析,設計了基于OWS空間數據服務規范WFS的空間數據集成模式,包括WFS空間數據服務的集成模式設計、集成數據分片條件判斷、集成模式構建以及集成算法的實現,給出了云GIS環境下基于OWS空間數據服務的分布式空間數據集成的具體實現方法,并以河北省某市2個縣的土地利用數據為例實現了云計算環境下基于OWS服務的分布式空間數據區域集成和專題集成。
[1]Thain D,Tannenbaum T,Livny M.Distributed computing in prac-tice: The condor experience [J].Concurrency and
[2]Weiss A.Computing in clouds[J].NetWorker,2007,11(4):16-25.
[3]吳邊、吳信才.Cloud GIS關鍵技術研究[J],計算機工程與設計,011(32):1342-1345.
[4]孫玉梅,網格環境下基于OGC規范的分布式空間數據集成機制研究[D],北京:北京大學遙感所,2010.
[5]http://www.opengeospatial.org/standards/wcs
[6]http://www.opengeospatial.org/standards/wfs
[7]宋亞超,闖國年,張宏.基于Web Service的Internet GIS集成與應用.地球信息科學[J],2004,16(1):44-48.
On Integration Technology of Distributed Geospatial Data in Cloud GIS
SUN Yu-mei BIAN Zhan-xin GAO Li-you
(Shijiazhuang Institute of Railway Technology ShijiazhuangHebei050041China)
Considering the multi-source heterogenous and distributed features of geospatial data, the integration technology of distributed geospatial data based on Cloud GIS is proposed according to the current major GIS development trends. Through the research on the geospatial data source schema based on OWS geospatial data service standards in Cloud GIS, the geospatial data integration schema based on OWS geospatial data service standards in Cloud GIS is designed. Then the geospatial data integration schema is constructed through the decision whether the data source fragment satisfies the integration conditions. And at last the construction algorithm of integration schema in Cloud GIS is provided.
Cloud GIS the OGC the OWS distributed integration
TP301
A
1673-1816(2016)03-0047-07
2016-05-18
孫玉梅(1075-),女,博士,副教授,研究方向為空間數據分布式計算。
河北省教育廳青年基金項目(2011134)