999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

地理本體高效轉換和查詢效率

2018-03-19 05:54:55李曉林徐雅琴
計算機工程與設計 2018年3期
關鍵詞:數據庫效率方法

李曉林,嚴 柯+,陳 燈,徐雅琴

(1.武漢工程大學 計算機科學與工程學院,湖北 武漢 430205;2.武漢工程大學 智能機器人湖北省重點實驗室,湖北 武漢 430205)

0 引 言

基礎地理信息文件數據庫Geodatabase[1](GDB)中存儲著行政區劃、水系等海量基礎地理數據,地理信息豐富,但GDB中的數據不包含語義信息,難以實現海量數據中隱含信息推理和快速查詢,數據利用率低。地理本體[2]具有充分語義信息,易于實現基礎地理數據查詢和推理,是目前公認解決空間數據語義異構[3]和屬性匹配[4]、融合[5,6]等問題比較好的辦法。因此,如何實現GDB向地理本體高效轉換以及大規模地理本體高效查詢是需要解決的問題。

地理本體主要有基于內存、文件、數據庫[7,8]等存儲模式。而內存模式不能存儲大規模地理本體,文件模式不能實現高效查詢。基于地理語義的空間索引[9]可以有效提高查詢效率,本地高性能三元組存儲器TDB是Jena提供可以存儲在目錄文件系統中的數據庫,在存儲地理本體時會自動構建索引,因此本文采用TDB存儲大規模資源描述框架(resource description framework)RDF[10,11]數據來提高地理本體語義查詢效率。針對基礎地理要素信息的特點,本文從GDB中提取屬性和空間信息到地理本體,并提出3種自定義轉換方法,有效提高了轉換效率。本文提出的轉換方法適用于大規模地理本體自動構建,并為基礎地理數據庫的知識化和智能化提供了有效技術途徑。

1 基本模型及其映射

1.1 Geodatabase空間數據模型

Geodatabase體系基于面向對象技術構建。Geodatabase將具有相同坐標系統和幾何特征的要素集合稱為要素類或圖層,根據幾何特征不同,圖層可劃分為點圖層、線圖層和面圖層。要素由幾何特征和描述幾何特征屬性組成。

通過對比《基礎地理信息要素分類與編碼》,對Geodatabase數據結構進行了相關實驗研究,得出GDB在GDAL提供接口情況下數據結構,如圖1所示。

圖1 Geodatabase結構

1.2 地理本體模型

地理本體定義請參見文獻[2]。在本文構建的地理本體模型中,主要分為圖層類、屬性類、要素類和幾何類等。其中,圖層類子類包括行政區劃、水系等;屬性類子類包括國標分類碼GB、要素唯一編碼ONTOID等;幾何類子類包括點、線、面等。地理本體結構如圖2所示。

圖2 地理本體結構

Geodatabase空間數據模型與地理本體模型之間存在一定的聯系和區別。兩者都為地理數據賦予了結構,且地理本體模型結構是參照Geodatabase空間數據模型結構構建的。區別是地理本體對基礎地理信息的描述是基于語義的,而GDB則不是。

1.3 GDB到地理本體的映射

根據Geodatabase空間數據模型和地理本體模型,建立從GDB到地理本體轉換映射規則:

(1)在地理本體中,所有要素實例采用【圖幅名+“_”+圖層名+“_”+ID_Feature】命名。

(2)所有屬性實例采用【圖幅名+“_”+圖層名+“_”+ID_FieldValue】命名。

(3)所有幾何體實例采用【圖幅名+“_”+圖層名+“_”+ID_Geometry】命名。

(4)在地理本體中,使用自定義的命名空間及名稱。

(5)在地理本體中,所有地理要素的屬性字段類型及名稱均依據GDB數據庫中的屬性字段類型及名稱。

(6)在地理本體中,所有要素的幾何體空間坐標類型采用字符串類型表示。

2 數據轉換方法

實現GDB向地理本體數據轉換主要包括GDB解析,數據轉換器和地理本體構建三大步驟。

(1)GDB解析。將GDB作為源格式文件,通過第三方組件構建GDB解析器,根據Geodatabase空間數據模型進行處理,直到GDB解析完成。

(2)數據轉換器。數據轉換器通過解譯構建的轉換模型,同解析GDB得到的地理要素進行映射,返回轉換結果。

(3)地理本體構建。解譯地理本體模型,通過映射將轉換結果構建到地理本體中,形成地理本體庫。

如圖3所示,針對轉換計算模型,本文提出了3種方法,即AEXTrans(ArcGIS engine XSLT transformation)、GXTrans(GDAL XSLT transformation)和GJTrans(GDAL Jena transformation)來實現地理本體的直接數據轉換。AEXTrans和GXTrans方法采用文件存儲地理本體,GJTrans方法采用TDB存儲地理本體。

圖3 總框架結構

2.1 AEXTrans方法

AEXTrans:采用ArcGIS提供的第三方數據文件訪問工具ArcGIS Engine解析GDB并轉換為XML格式數據,解譯XSLT構建的XML到地理本體元模型,通過元模型映射,將XML格式數據構建到地理本體中,實現地理本體的轉換,AEXtrans在實驗過程中,通過AxMapControl組件對GDB中地圖進行可視化,但在解析并讀取GDB時,轉換效率很慢;為解決該問題,該方法采用多線程技術。在GDB中,標簽數據源類型包含兩種,一種是文件地理數據庫要素類,另一種是文件地理數據庫柵格目錄,而文件地理數據庫柵格目錄為空。因此,在轉換過程中,需對GDB中標簽數據源類型進行判斷,否則容易出現線程為空現象。經過改進的AEXtrans方法,轉換效率有了提高,但效果不是太理想。因此,本文提出了第二種轉換方法GXTrans。

2.2 GXTrans方法

GXTrans:在進行空間坐標轉換時,ArcGIS Engine提供的接口不能直接讀取空間坐標,需要進行多次訪問,嚴重影響轉換效率,因此該方法采用開源柵格空間數據轉換庫GDAL(geospatial data abstraction library)解析GDB并轉換為XML格式數據,最后,解譯XSLT構建的XML到地理本體元模型,通過元模型映射,將XML格式數據構建到地理本體中實現轉換。

GXTrans不能實現GDB中地圖的可視化,但該方法轉換效率明顯高于AEXTrans。該方法采用XSLT構建映射模板,要求地理本體中概念的命名不發生改變,否則需要重新構建映射模板。因此,本文提出了第三種轉換方法GJTrans。

2.3 GJTrans方法

GJTrans:采用GDAL解析GDB,通過解譯Jena構建的地理本體模型,通過地理本體模型映射,Jena直接將轉換解析得到的數據存儲到地理本體中,實現轉換。

GJTrans方法在GXTrans基礎上,使用Jena提供的Ontology API構建地理本體,不需要借助中間文件,實現了GDB與地理本體直接轉換。該方法解決了GXTrans需要多次重建模板的問題,同時,該方法采用Jena提供的數據庫TDB,將轉換得到的RDF數據以Model方式存放到TDB中,可以實現大規模地理信息存儲及查詢。

3 實驗分析

本文從轉換效率進行實驗,實驗數據是海南省基礎地理信息數據庫GDB,實驗平臺為一臺Windows Server 2008 R2 Enterprise的服務器,主頻3.10 GHz的Intel Xeon處理器,內存為64 G。

AEXTrans、GXTrans和GJTrans分別對轉換單位、屬性單位和坐標點數進行對比實驗。其中,AEXTrans和GXTrans采用文件模式存儲地理本體,GJTrans采用TDB數據庫存儲地理本體。

3.1 轉換效率對比

在數據轉換過程中,將圖層中地理要素屬性元組和空間坐標點元組分別映射為地理本體中實例。本文主要對屬性單位K、坐標點數T和轉換單位Z進行轉換實驗,其中,K、T和Z的計算公式如下

其中,K表示GDB中所有非空圖層地理要素屬性單位的總和;T表示GDB中所有非空圖層地理要素空間對象坐標點數的總和;Z表示轉換單位,是屬性單位和坐標點數的總和;xij表示一個空間對象的屬性個數;yij表示一個空間對象坐標點數。

3種方法轉換效率和速度見表1和表2。在屬性單位轉換時,AEXTrans采用多線程方式,因此AEXTrans轉換速度比GXTrans快,但是AXETrans在轉換過程中,需要解析XSLT構建的模板,因此轉換速度比GJTRans慢。在坐標點數轉換時,AEXTrans采用的 ArcGIS Engine一次只能讀取一個坐標點,隨著空間坐標點數的指數上升,多線程也不適用了,因此AEXTrans轉換速度遠遠低于GXTrans和GJTrans,且容易出現內存溢出情況。GXTrans在轉換過程中,需要解析XSLT構建的模板,因此GXTrans轉換速度低于GJTrans。表1和表2中空格部分表示該種方法在運行中出現內存溢出情況。

表1 不同轉換方法效率

表2 不同轉換方法速度

轉換效率對比如圖4~圖7所示。由于3種轉換方法轉換效率差別太大,因此圖4~圖7中縱坐標是以10的對數取值。AEXTrans采用多線程方式進行轉換,隨著GDB庫中要素數量增加,出現了內存溢出情況,并且該種方案轉換耗時最長。GXTrans和GJTrans隨著GDB中要素數量增加,GJTrans比GXTrans耗時少。

圖4 屬性單位效率對比

圖4為屬性單位轉換效率對比情況。從圖4可以看出,當屬性單位少于5.43萬時,AEXTrans、GXTrans和GJTran轉換效率相差不大,用戶可選擇其一進行屬性單位轉換;當屬性單位介于5.43萬和252.81萬時,AEXTrans和GJTrans效率明顯高于GXTRans,用戶可選擇GXTrans和GJTrans之一進行轉換。當屬性單位超過252.81萬時,GXTRans效率明顯高于GJTrans,用戶可選擇GJTrans進行轉換。

圖5為坐標點數轉換效率對比情況,當坐標點數少于92.96萬時,AEXTrans、GXTrans和GJTrans轉換效率相差不大,用戶可選擇其一進行轉換;當坐標點數介于92.96萬和153.51萬時,AEXTrans轉換效率遠低于GXTrans和GJTran,用戶可選擇GXTrans和GJTrans之一進行轉換;當坐標點數超過153.51萬時,GJTrans轉換效率高于GXTrans,用戶可選擇GJTrans進行轉換。

圖5 坐標點數效率對比

圖6 轉換單位效率對比

圖7 轉換速度對比

圖6為轉換單位轉換效率對比情況。當轉換單位少于98.39萬時,AEXTrans、GXTrans和GJTrans轉換效率相差不大,用戶可選擇其一進行轉換;當轉換單位介于98.39萬與156.04萬之間時,AEXTrans轉換效率遠低于GXTrans和GJTrans,用戶可選擇GXTrans和GJTrans之一進行轉換;當轉換單位超過156.04萬時,GJTrans轉換效率高于GXTrans,用戶可選擇GJTrans進行轉換。

圖7是總轉換速率對比。通過對比實驗,AEXTrans方法不適用于坐標點數較多的轉換。當轉換單位介于4.65萬和98.39萬時,GXTrans和GJTrans的轉換效率增長最快;當轉換單位介于98.39萬和156.04萬時,GXTrans和GJTrans的轉換效率增長變慢;當轉換單位大于98.39萬時,GXTrans和GJTrans的轉換效率趨于平緩。因此,GXTrans和GJTrans既可以用于小型地理本體的轉換,也適用于大規模地理本體的轉換。

3.2 地理本體查詢效率比較

為了實現大規模RDF存儲和查詢,本文通過GJTrans方法將得到的本體數據以RDF形式存儲到TDB和文件中,并進行了3種方法的查詢對比實驗。Mem-XPath和Mem-SPARQL方法分別使用XPath和SPARQL對基于文件的RDF進行查詢,TDB-SPARQL方法使用SPARQL對TDB進行查詢。實驗采用3組不同大小的數據集進行測試,采用Mem-XPath、Mem-SPARQL和TDB-SPARQL方法分別對不同數據集測試3種查詢,查詢響應時間見表3,時間單位為秒(s)。

表3 查詢時間

其中,Q1是查詢某個具體要素的所有屬性信息。Q1的SPARQL查詢語句為:

PREFIXMap: Select ?a ?b Where

{Map:MAP50000_LRDL_10000_Feature ?a ?b.}

Q2是自定義一個外包矩形,查詢所有在這個外包矩形范圍內的要素,該查詢通過推理計算得到查詢結果集。Q2的SPARQL查詢語句為:

PREFIXMap: Select ?a Where

{?a Map:minx ?b.?a Map:minY ?c.?a Map:maxX ?d.?a Map:maxY ?e.

Q3是查詢所有要素名稱。Q3的SPARQL查詢語句為:

PREFIXMap: Select ?a ?b

Where {?a Map:NAME ?b.}

X1、X2、X3是根據XPath構建的查詢語句,Q1、Q2、Q3是根據SPARQL構建的查詢語句。X1、X2和X3與Q1、Q2、Q3的查詢語句不同,但是X1與Q1,X2與Q2,X3和Q3的查詢結果集是一樣的。

圖8~圖10是X1和Q1、X2和Q2、X3和Q3的查詢時間對比情況。Q1是語句與變量較少且具有較高選擇性的查詢,Q2是查詢語句和變量較多且有關系計算的查詢,Q3是語句與變量雖少但選擇性較低的查詢。對大規模RDF數據的查詢,從圖8~圖10可以看出,TDB-SPARQL方法的查詢時間明顯要比Mem-Xpath和Mem-SPARQL要少。Mem-XPath和Mem-XSPARQL方法在進行查詢時,需要將地理本體加載到內存中,耗時時間長,且容易出現內存溢出現象;而TDB-SAPRQL方法中所使用的TDB數據庫,在轉換和存儲過程中,TDB在存儲RDF數據信息的同時也構建了RDF數據信息的索引表、三元組節點表以及前綴表,因此在查詢中,只需TDB目錄文件地址,即可進行快速且有效的查詢。

圖8 X1和Q1查詢時間對比

圖9 X2和Q2查詢時間對比

圖10 X3和Q3查詢時間對比

4 結束語

針對空間數據庫到地理本體要素信息轉換不完整及本體規模小問題,AEXTrans、GXTrans和GJTrans這3種自定義的方法實現了空間數據庫中地理要素的屬性和空間信息到地理本體的直接轉換,完成了大規模地理本體的構建,突破了地理信息共享和互操作的語義瓶頸;最后基于大規模RDF語義查詢的應用,驗證了TDB的高效存儲和查詢。針對不同的本體結構,GJTrans可構建不同本體模型完成數據轉換;GXTrans方法對地理本體結構的穩定性有較高要求,需進一步完善。對轉換后的地理本體進行空間關系的計算和推理需做進一步研究。

[1]GENG Jijun,LIU Rong,WU Congcong,et al.A method of data conversion between data and GIS data[J].Science of Surveying and Mapping,2016,41(8):134-137(in Chinese).[耿繼軍,劉榮,吳聰聰,等.一種計算機輔助設計數據與GIS數據轉換方法[J].測繪科學,2016,41(8):134-137.]

[2]LI Bin,LIU Bin,LIU Jiping,et al.The research progress review and prospect on geo-ontology[J].Science of Surveying and Mapping,2015,40(4):53-57(in Chinese).[栗斌,劉斌,劉紀平,等.地理本體研究進展綜述與展望[J].測繪科學,2015,40(4):53-57.]

[3]ZHAO Hongwei,ZHU Yunqiang,YANG Hongwei,et al.The semantic relevancy computation model on essential features of geospatial data[J].Geographical Research,2016,35(1):58-70(in Chinese).[趙紅偉,諸云強,楊宏偉,等.地理空間數據本質特征語義相關度計算模型[J].地理研究,2016,35(1):58-70.]

[4]GUO Xiaoju,CHEN Junjie.Research on inentical entity matching based on GIS ontology[J].Computer Applications and Software,2015,32(2):66-68(in Chinese).[郭小菊,陳俊杰.基于地理本體的同名實體匹配技術研究[J].計算機應用與軟件,2015,32(2):66-68.]

[5]LI Junli,HE Zongyi,KE Dongliang,et al.An approach for insight into geo-ontology merging based on description logics[J].Geomatics and Information Science of Wuhan University,2014,39(3):317-321(in Chinese).[李軍利,何宗宜,柯棟梁,等.一種描述邏輯的地理本體融合方法[J].武漢大學學報·信息科學版,2014,39(3):317-321.]

[6]LI Junli,HE Zongyi,ZHU Qiaoli,et al.A geographic onto-logy fusion method based on granular theory[J].Geomatics and Information Science of Wuhan University,2013,38(4):489-492(in Chinese).[李軍利,何宗宜,朱喬利,等.一種粒化理論的地理本體融合方法[J].武漢大學學報·信息科學版,2013,38(4):489-492.]

[7]TONG Qiang,ZHANG Fu,CHENG Jingwei,et al.Research on storage of RDF in relational database[J].Journal of Northeastern University(Natural Science),2015,36(3):346-349(in Chinese).[佟強,張富,程經緯,等.RDF在關系數據庫中的存儲研究[J].東北大學學報(自然科學版),2015,36(3):346-349.]

[8]HU Tiantian,CAO Min.New storage model based on theory of ontology in relational database[J].Computer Engineering and Design,2014,35(9):3075-3079(in Chinese).[胡甜甜,曹旻.基于本體理論的關系數據庫存儲模式[J].計算機工程與設計,2014,35(9):3075-3079.]

[9]DUAN Hongwei,MENG Lingkui,HUANG Changqing,et al.A method for geo semantic spatial index on SPARQL query[J].Acta Geodaetica et Cartographica Sinica,2014,43(2):193-199(in Chinese).[段紅偉,孟令奎,黃長青,等.面向SPARQL查詢的地理語義框架索引構建方法[J].測繪學報,2014,43(2):193-199.]

[10]ZHENG Zhiyun,LI Qing,ZHANG Xingjin,et al.Skyline query optimization for RDF data[J].Computer Engineering and Design,2016,37(4):933-937(in Chinese).[鄭志蘊,李青,張行進,等.RDF數據的Skyline優化查詢[J].計算機工程與設計,2016,37(4):933-937.]

[11]HE Shaopeng,LI Jianhui,SHEN Zhihong,et al.Overview of the sorage technology for large-scale RDF data[J].Network New Media,2013,2(1):8-16(in Chinese).[何少鵬,黎建輝,沈志宏,等.大規模的RDF數據存儲技術綜述[J].網絡新媒體技術,2013,2(1):8-16.]

猜你喜歡
數據庫效率方法
提升朗讀教學效率的幾點思考
甘肅教育(2020年14期)2020-09-11 07:57:42
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
跟蹤導練(一)2
“錢”、“事”脫節效率低
中國衛生(2014年11期)2014-11-12 13:11:32
主站蜘蛛池模板: 永久毛片在线播| 国产午夜不卡| 欧美日韩va| 波多野结衣无码AV在线| 国产激情影院| 国产午夜精品鲁丝片| 高清不卡毛片| 免费高清自慰一区二区三区| 国产a网站| 国产成人亚洲毛片| 久久semm亚洲国产| 成人毛片在线播放| 色AV色 综合网站| 精品国产自在在线在线观看| 久草视频中文| 91精品亚洲| 在线视频一区二区三区不卡| 一级成人a做片免费| 亚洲综合狠狠| 九色在线观看视频| 欧美色99| 在线网站18禁| 免费欧美一级| 中文字幕 91| 黄色a一级视频| 九九久久精品免费观看| 亚洲性影院| 亚洲精品在线观看91| 乱系列中文字幕在线视频| 国产成人精品免费av| 亚洲国产欧美国产综合久久 | 午夜福利在线观看成人| 免费毛片a| 亚洲第一在线播放| 亚洲综合第一区| 亚洲天堂777| 日韩高清欧美| 九色在线观看视频| 国产精品不卡片视频免费观看| 精品一区二区无码av| 制服丝袜亚洲| 亚洲精品免费网站| 看看一级毛片| 亚洲第一视频免费在线| 亚洲无码视频喷水| 婷婷综合缴情亚洲五月伊| 亚洲国产理论片在线播放| 91视频免费观看网站| 国产AV毛片| 一级看片免费视频| 91精品久久久久久无码人妻| 日日噜噜夜夜狠狠视频| 欧美成人aⅴ| 人妻21p大胆| 午夜日本永久乱码免费播放片| 精品一区二区三区波多野结衣| 无码专区国产精品一区| 青草娱乐极品免费视频| 一级毛片高清| 丁香婷婷在线视频| 国产一区二区三区精品欧美日韩| 久久99国产精品成人欧美| 国产三级成人| 欧美一级大片在线观看| 色噜噜综合网| 韩国自拍偷自拍亚洲精品| 国产在线观看精品| 东京热一区二区三区无码视频| 日韩精品毛片人妻AV不卡| 欧美一区二区人人喊爽| 精品欧美一区二区三区久久久| 伊人久久久久久久| 亚洲熟妇AV日韩熟妇在线| 99热这里只有精品久久免费| 亚洲Aⅴ无码专区在线观看q| 色婷婷国产精品视频| 一级毛片免费的| 四虎AV麻豆| 亚洲成人高清无码| 亚洲精品视频免费观看| 91福利在线观看视频| 日本www色视频|