999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種顧及語義的時空數據定位搜索引擎

2018-11-23 07:35:36段紅偉鄭麗娜
地理空間信息 2018年11期
關鍵詞:信息模型

段紅偉,鄭麗娜,張 娜

(1.湖北省基礎地理信息中心(湖北省北斗衛星導航應用技術研究院),湖北 武漢 430073)

隨著GPS技術、移動通信技術、互聯網技術的飛速發展,地理信息位置服務及其產業化正在飛速發展。國家測繪地理信息局在《國家地理信息產業發展規劃(2014~2020)》中明確指出,要大力發展地理信息服務,加快推進地理信息與北斗衛星導航定位的融合。

定位搜索是地理信息位置服務重要的研究和應用方向,主要面向地理實體數據、地名地址數據等地理對象,根據地理對象的名稱、地址、空間位置、時間等相關信息對其進行定位。傳統的搜索引擎通常是基于地名詞典和地名數據庫開展地名地址的定位搜索服務,即采用地理編碼和反地理編碼技術實現空間位置定位。該方法通過文本搜索與地理約束相結合的方式提供檢索服務,強調空間位置信息,卻忽略了事件主題信息和時間信息,時空信息與事件主題的語義關聯不足,因此只能實現靜態的空間信息查詢。同時,傳統定位搜索的索引結構一般采用正排索引、倒排索引或簽名文件索引,均以磁盤為介質存儲索引文件,當面對規模較大的查詢請求時,將產生大量I/O請求操作,導致整個系統的性能較低。

大數據時代的到來使得地理對象的時空特性愈加明顯和重要。時空數據的時間性和事件關聯性在定位查詢中扮演的角色也越來越重要。國家測繪地理信息局《智慧城市時空大數據與云平臺建設技術大綱(2017版)》中明確要求,傳統的地理數據需通過添加時空標識來實現傳統地理數據向時空數據的升級轉換,注入時間、空間和屬性“三域”標志。因此,根據時空數據的特點和存儲方式,在定位搜索中對時空數據的空間性、時間性、事件關聯性進行一致性表達,實現時空信息的快速查詢,對于時空大數據的應用和服務具有重要意義。

語義和自然語言處理技術的發展為時空數據的定位搜索提供了一種可行的解決方案。分詞策略[1-2]、全文檢索策略[3-4]、基于規則策略[5-6]是定位搜索中進行地址要素匹配的主要手段。考慮到地理數據的語義特點,有些學者通過研究本體構建[7-8]、本體事件推理[9-10]、語義相似度[10-12]來實現基于地理本體的語義地址匹配和定位搜索。本文首先分析了時空數據特征,并結合時空數據定位搜索特點確定了主要的時空搜索表達模式,從而明確時空定位搜索適用的主要應用場景;然后根據時空數據的時間、事件特性,并結合地理本體模型建立了時空數據模型;最后基于時空數據模型實現了對應數據庫、數據索引的建設和原型系統。

1 時空數據特征和定位搜索表達

1.1 時空數據特征

在時空定位搜索中,時空數據的特征為:

1)具有名稱標識。時空定位搜索引擎在進行對象定位時必須依賴一個具名的定位網絡,該網絡的建設基于各類名稱標識,因此時空對象必須是具名的,即具有名稱標識。

2)包含點、線、面狀幾何類型。作為時空定位搜索引擎的處理對象,時空對象不僅包含點狀對象實體,同時包含線狀、面狀對象實體,這將加大定位搜索范圍,優化查詢內容。

3)時間特征是重要特征。時間特征是時空對象的重要信息內容,在時空定位搜索時應充分考慮時間特性的查詢因素。

4)時空對象的關聯性變得更加重要。時空定位搜索引擎不僅要支持地名地址、POI等顯性時空對象的查詢,還需支持與地名地址關聯的事件、案件等隱性時空對象的查詢。

5)數據源的結構具有廣泛性。時空對象的數據源可以是shape的空間數據,也可以是數據庫,還可以是Excel格式的數據內容。時空定位搜索引擎對上述數據進行數據重組,得到支持時空定位搜索的數據結構。

1.2 時空數據定位搜索表達

由于數據類型多樣、結構多樣、已查詢內容多樣,時空數據查詢時要考慮時空對象的空間信息、時間信息、關聯信息和位置屬性信息。①考慮空間信息:支持點、線、面空間信息的存儲和查詢;②考慮時間信息:支持對時間點、時間段信息的存儲和查詢;③考慮關聯信息:支持對關聯內容的存儲和查詢;④考慮位置屬性信息:不可或缺的信息是時空對象定位搜索的關鍵元素。

時空數據的特性以及對數據關聯融合的要求使得時空定位搜索在查詢內容和表達方式上有其特定要求,具體要求見表1。

表1 時空定位搜索的查詢內容及其表達模板

2 時空數據定位搜索對象模型

2.1 事件本體模型

本體是共享概念模型明確的形式化規范說明[13],其目的是以通用、標準化的方式定義領域知識,并提供領域知識的共同理解。目前,本體己在智能信息集成、基于知識的系統、自然語言處理和信息檢索等方面獲得應用。

事件本體[14]定義了一個事件知識模型,認為事件應包括一個事件、一個位置、推動行為、影響因素和產生的結果。如圖1所示,把圍繞事件的實體分為6類:事件(Event)/子事件(sub_event)、代理(foaf:Agent)、因子(factor)、產品(producce)、空間事物(geo:SpatialThing)和時間實體(time:TemporalEntity),其中agent指起作用者(通常是人,但也可能是物,如計算機),factor指除agent外的其他參與因素(如使用的工具、抽象的起因等)。

圖1 事件本體模型

2.2 基于事件本體的時空數據對象模型

為了充分利用現實中各類關系數據庫存儲的時空數據,本文基于事件本體建立了時空數據對象模型(圖2),指導數據融合和數據庫建庫。建設的時空數據庫可利用D2RQ和Dump工具實現數據庫與本體的數據交互,進而可利用Jena進行語義推理。

時空數據對象模型包括時空對象、時空實時狀態、事件和時空對象聚合。該模型能描述時空對象的一個瞬態,可對時空對象的連續變化進行分析,進而預測未來的發展趨勢。

圖2 時空數據對象模型

1)時空對象是對一段時間內某個時空對象序列化狀態的抽象表達,包括時空對象的靜態屬性、動態屬性和事件機制。

2)時空實時狀態表示實時狀態信息,與某個地理時空對象StObject相關聯,其變化表示時空對象的某個屬性發生了變化。

3)事件包含了事件類型,各事件類型與事件源、處理事件目標類型相關聯,包括子事件以及事件產生的原因和結果。

4)時空對象聚合由一系列相互作用的同類型時空對象負責接收和轉發時空對象(同層或不同層的)產生的事件。

3 時空數據定位搜索引擎設計

3.1 數據庫設計

根據時空數據對象模型,本文設計的時空數據庫如圖3所示?!笆录庇涗浟伺c事件有關的事件/子事件、代理、因子、結果、空間事物和時間實體;“時空狀態”記錄了時空數據的時空動態信息;“時空現勢狀態”記錄了時空數據的狀態性信息,其標志性信息記錄在“時空標志信息”中;“時空標志信息”為點狀信息,如地名地址、POI數據;“時空對象信息”描述了時空對象的信息結構,由時空現勢狀態信息、時空標志信息和屬性信息組成;“時空元”是時空對象的元信息,包括對象類型、對象的時間范圍、空間范圍等。

圖3 時空數據庫設計

3.2 時空索引結構

為了快速定位,時空數據必須建立索引文件,并依托索引文件進行定位搜索。由于在時空定位搜索中,需構建的索引包括時間信息、空間信息和屬性信息,因此本文采用文件索引(四叉樹[13]、B樹[14])和內存索引的混合結構來構建索引結構(圖4)。

3.3 基于Sorl引擎的時空擴展

本文基于Sorl 4.6引擎,通過擴展其索引器和檢索器來實現對時間、空間信息的定位搜索。

3.3.1 索引器擴展

1)定義一個IndexWriter,將索引寫進Sorl引擎的數據庫。

2)定義一個Document。Document 相當于二維表中的一行數據,包含Field 字段,其對應了時間、空間和屬性信息。

3)根據索引結構,分別對不同Field字段建立索引,同時需考慮索引優化、合并以及更新問題。

圖4 時空定位搜索的索引結構

3.3.2 檢索器擴展

1)定義一個新方法IndexSearch,從Index目錄讀取索引。

2)根據IndexReader 創建對應的檢索器Searcher,解析檢索的關鍵字,包含查詢內容、查詢字段、分析器等。先解析時空對象類型,其決定了查詢的索引文件和范圍。

3.4 基于Jena引擎的推理

推理使用Jena推理機,通過將既定的規則以邏輯的形式進行描述,建立推理所需的對準[15](Alignment),從而進行邏輯推理。本文基于“is-a”和“has-a”的基礎邏輯,利用Jena建立的推理算法框架為:

‘關聯模型

1 Model mapingShcema=Model Factory.create Ontology Model();

2 Model orignalModel==ModelFactory.create Ontology Model();

‘關聯模型填充

3 maping Shcema.add(EventOWL);‘添加GML應用模式轉換的地理OWL

4 maping Shcema.add(AligemtOWL);‘添加自動對準和手工對準信息

‘原始數據模型填充

5 Instance=D2RQ(Db)‘得到數據庫實例,并轉為RDF

6 orignalModel.add(Instance);‘加載GML應用實例準換后的地理本體實例

‘推理

7 Resoner resoner=ResonerRegistry.getOWLResoner();

8 resoner=resoner.bindSchema(mapingShcema);

4 原型系統的實現

4.1 系統界面

本文基于Sorl架構建立了一個時空對象定位搜索引擎的原型系統(圖5),能對郵編、道路、地名地址等點、線、面進行基本查詢、時間擴展查詢以及事件擴展查詢。

圖5 原型系統

4.2 查詢性能

本文在一臺 Core? i7-3770 CPU、4G內存的臺式計算機上,根據表1的查詢方式進行系統性能測試,使用數據包括湖北省地名地址數據、行政區劃數據、道路數據和郵編數據,數據集大小約為100萬條。在查詢耗時方面,一元要素查詢時間約為15 ms;二元要素查詢時間約為58 ms;三元要素查詢時間在130~246 ms(平均188 ms);查準率達到85%以上,查全率達到90%以上。

圖6 不同查詢的查詢耗時統計

5 結 語

本文通過定義時空數據對象模型,建立了該模型所對應的數據庫、時空索引和引擎,從而實現了時空數據定位搜索的一體化結構設計。該方法可統一集成點、線、面各類時空數據,并建立統一的索引文件,是對傳統定位搜索的一種有效擴展。原型系統測試表明,該方法查詢效率較好,具有實際應用價值。本文還對時空語義推理進行了嘗試和實踐,構建了“is-a”和“has-a”的基礎邏輯以及邏輯算法框架,下一步將細化時空計算邏輯,優化時空語義推理。

猜你喜歡
信息模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
一個相似模型的應用
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 国产在线第二页| 久青草国产高清在线视频| 精品无码专区亚洲| 国产一区二区免费播放| 中文国产成人久久精品小说| 欧洲成人免费视频| 亚洲中文字幕国产av| 欧美精品一区在线看| 日韩毛片免费视频| 91精品国产一区自在线拍| 内射人妻无码色AV天堂| 最新国产精品第1页| 精品一区二区三区视频免费观看| 免费一级毛片| 青草国产在线视频| 69av在线| 国产人成网线在线播放va| 真实国产精品vr专区| 国产福利小视频在线播放观看| 欧美综合一区二区三区| 91国内在线观看| 久久亚洲美女精品国产精品| AV无码无在线观看免费| 国产又爽又黄无遮挡免费观看| 91亚洲精选| 无码精品一区二区久久久| 亚洲精品视频免费| 一本大道香蕉中文日本不卡高清二区| 欧美色香蕉| 精品国产成人高清在线| 亚洲色精品国产一区二区三区| 精品视频一区在线观看| 国产综合另类小说色区色噜噜| 亚洲91精品视频| 永久免费无码成人网站| 日本亚洲成高清一区二区三区| 97久久精品人人做人人爽| 99久久国产综合精品女同| 亚洲天堂.com| 天堂在线www网亚洲| 谁有在线观看日韩亚洲最新视频 | 免费欧美一级| 99九九成人免费视频精品| 欧美一区二区人人喊爽| 91探花在线观看国产最新| 国产区91| 九九九久久国产精品| 国产三级国产精品国产普男人| 在线观看91香蕉国产免费| 中文字幕在线免费看| 国产呦视频免费视频在线观看| 亚洲精品不卡午夜精品| 久久这里只有精品2| 精品综合久久久久久97| 精品午夜国产福利观看| 91亚洲国产视频| 国产中文在线亚洲精品官网| 日韩欧美一区在线观看| 国产成人综合网| 亚洲成a人片77777在线播放| 国产成人1024精品下载| 精品无码国产自产野外拍在线| a网站在线观看| 欧洲高清无码在线| av大片在线无码免费| 欧美综合区自拍亚洲综合天堂| 亚洲香蕉在线| 国产精品2| 在线免费观看AV| 亚洲成a人片| 色综合久久88| 毛片在线播放a| 国产又黄又硬又粗| 国产97色在线| 51国产偷自视频区视频手机观看| 欧美色99| 内射人妻无码色AV天堂| 嫩草国产在线| 国产成人免费高清AⅤ| 一级毛片免费观看久| 丝袜亚洲综合| 波多野结衣中文字幕一区二区|