劉建東 戚利娜
摘要:提高時(shí)空信息的查詢效率可有效提高時(shí)空信息的價(jià)值。已有的時(shí)空查詢方法在構(gòu)造本體時(shí)只構(gòu)造了時(shí)間本體,忽略了時(shí)間區(qū)間本體的構(gòu)造,因此導(dǎo)致該方法在查詢某段時(shí)間的時(shí)空信息時(shí)效率有待提高,該文在該方法的基礎(chǔ)上,增加時(shí)間區(qū)間本體的構(gòu)造過程,通過對(duì)比可知該文方法在一定程度上減少查詢次數(shù),從而提高查詢效率。
關(guān)鍵詞: 本體;查詢;時(shí)空
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)28-0006-02
1 引言
時(shí)空信息是結(jié)合時(shí)間屬性、空間屬性的數(shù)據(jù),主要用于記錄地理等實(shí)體的位置屬性隨著時(shí)間變化的動(dòng)態(tài)軌跡,為方便研究其變化規(guī)律提供數(shù)據(jù)基礎(chǔ)。目前存儲(chǔ)時(shí)空數(shù)據(jù)的主要以時(shí)空數(shù)據(jù)庫存儲(chǔ)為主,但是該類數(shù)據(jù)庫雖然保存有大量的時(shí)空信息,卻由于存儲(chǔ)結(jié)構(gòu)等原因不利于時(shí)空信息的查詢,至少為時(shí)空查詢需耗費(fèi)較大的精力。比如,時(shí)空信息查詢涉及時(shí)間、空間等屬性,作為用戶不僅需要懂得基本的數(shù)據(jù)庫查詢語言,而且對(duì)于多維度查詢也需有一定了解,這在一定程度上降低了時(shí)空信息的價(jià)值。因此,有必要改善時(shí)空信息查詢不便的情況。
2 相關(guān)研究
目前,有較多學(xué)者對(duì)提高時(shí)空信息查詢效率進(jìn)行了研究,大致可以分成以下幾類:第一類是基于地理信息系統(tǒng)(即GIS)進(jìn)行查詢,但是這類方法要求用戶掌握基本的有關(guān)GIS的概念和知識(shí),可能致使該類方法無法得到普及;第二類是基于數(shù)據(jù)或者基于元數(shù)據(jù)進(jìn)行查詢,但該方法的存在與第一類類似的缺點(diǎn)[1];第三類即基于空間的知識(shí)查詢[2],一方面該方法具有語義相關(guān)性,查詢具有較高的智能,但是另一方面該類方法實(shí)現(xiàn)較為困難,也就是說實(shí)施難度較高[3];第四類是基于本體的時(shí)空信息查詢[3],這類方法只需要用戶輸入非形式化的查詢語言即可實(shí)現(xiàn)時(shí)空信息的查詢,但是該類方法對(duì)于適合某個(gè)時(shí)間點(diǎn)的時(shí)空信息查詢,而對(duì)于某個(gè)時(shí)間段的時(shí)空信息查詢效率不太高。本文在第四類時(shí)空信息查詢方法的基礎(chǔ)上進(jìn)行加工以達(dá)到能支持時(shí)空段的時(shí)空信息查詢的目的。
3 基于本體的時(shí)空信息查詢方法
本節(jié)將引用吳孟泉提出的本體驅(qū)動(dòng)的時(shí)空數(shù)據(jù)查詢方法[3],以便說明該方法對(duì)于時(shí)間段時(shí)空信息查詢的不便之處。
時(shí)空信息查詢的方法的基本步驟是首先通過國(guó)家頒布的規(guī)范文件,構(gòu)造與用戶查詢相關(guān)的語義本體,如用戶查詢農(nóng)業(yè)時(shí)空信息,該方法參考相關(guān)的文件,構(gòu)造農(nóng)業(yè)時(shí)空信息本體;構(gòu)造的本體結(jié)合保存有大量時(shí)空信息的時(shí)空數(shù)據(jù)庫進(jìn)行改造,從而利用時(shí)空數(shù)據(jù)庫的實(shí)際數(shù)據(jù)豐富構(gòu)造的本體屬性以及相關(guān)實(shí)例;通過語法解析用戶輸入的查詢語句,識(shí)別出關(guān)鍵的類、屬性、實(shí)例;利用本體的語義相關(guān)性對(duì)用戶輸入的類進(jìn)行擴(kuò)展,查到符合用戶輸入條件的屬性和實(shí)例保存到預(yù)先設(shè)計(jì)好的結(jié)構(gòu)化表中,最終以結(jié)構(gòu)表中的數(shù)據(jù)為基礎(chǔ),以分解后的查詢語句為條件,查詢時(shí)空信息。該方法即利用了本體的語義相關(guān)性,又具有結(jié)構(gòu)化數(shù)據(jù)查詢的高效性。但是該方法適合某個(gè)時(shí)間點(diǎn)的時(shí)空查詢,對(duì)于時(shí)間段查詢的效率有待改進(jìn)。以文獻(xiàn)[3]中提出的案例為例進(jìn)行說明。
在案例中,用戶需要查詢曲靖市在2005年種植煙草型號(hào)為k236的地塊[3]。根據(jù)之前提到的步驟,首先構(gòu)造了農(nóng)業(yè)時(shí)空信息本體與種植本體,再利用該市的時(shí)空數(shù)據(jù)庫豐富了本體內(nèi)容,從已經(jīng)構(gòu)造的本體利用語義相關(guān)搜索符合2005年、k236等相符的類、屬性和實(shí)例后存入結(jié)構(gòu)表中,關(guān)鍵的結(jié)構(gòu)表如表1、表2、表3所示:
以案例中的查詢?yōu)槔摲椒ㄗ罱K首先通過根據(jù)“曲靖市”查詢到所在區(qū)域X,然后根據(jù)種植年份以及種植類型查詢到區(qū)域a,將兩個(gè)區(qū)域取交集即可得到查詢結(jié)果R。具體如圖1所示:
然而如果用戶不是以“2005年”為時(shí)間查詢條件,而是以“2005年-2012年”為時(shí)間段查詢,那么根據(jù)前面的步驟可知,最終用戶要想查詢到符合要求的區(qū)域,必須分別以2005年、2006年、2007年...2012年為條件查詢8次,得到八個(gè)每年符合種植類型的小區(qū)域,最終還要將這八個(gè)小區(qū)域與曲靖市的地理空間取交集從而得到結(jié)果。具體如圖2所示:
4 支持時(shí)間段查詢的時(shí)空信息查詢方法
從以上的討論可知,文獻(xiàn)[3]的時(shí)空信息查詢方法對(duì)于時(shí)間段的查詢條件需要分解多次,執(zhí)行多次交集運(yùn)算,因此效率有待提高,為改善上述不足,本節(jié)在文獻(xiàn)[3]提出的構(gòu)造的農(nóng)業(yè)信息本體基礎(chǔ)上,對(duì)時(shí)間本體增加時(shí)間區(qū)間本體,以開始時(shí)間和結(jié)束時(shí)間來表示,具體如圖3所示:
由于對(duì)時(shí)間本體進(jìn)行了改造,因此對(duì)于保存在最終結(jié)構(gòu)表中的數(shù)據(jù)中應(yīng)該會(huì)包含開始時(shí)間和結(jié)束時(shí)間的兩個(gè)字段,具體如表4所示:
由表4可知,種植地塊會(huì)根據(jù)種植類型保存開始時(shí)間和結(jié)束時(shí)間。因此如果還是以“2005年-2012年”為時(shí)間查詢條件,則可先通過“曲靖市”查詢?cè)撌械目臻g,然后分別以開始時(shí)間和結(jié)束時(shí)間、種植類型查詢符合條件的區(qū)域,最終取交集得到結(jié)果,形式化的查詢語句如下:
Bound_1 =Select 空間區(qū)域 where 名字=“曲靖市”;
Bound_2 = Select 空間 where 種植類型=“K236” and 開始時(shí)間<=2005 and 結(jié)束時(shí)間>=2012;
Result= Select 空間 where Intersection(Bound_1,Bound_2)=1。
由查詢條件可知,該時(shí)間段的查詢也只查詢?nèi)危h(yuǎn)遠(yuǎn)低于之前的方法的查詢次數(shù)。
參考文獻(xiàn):
[1] 杜云艷,周成虎.海岸帶及近海科學(xué)數(shù)據(jù)集成與共享研究[M].北京:海洋出版社,2005.
[2] 王敬貴,蘇奮振.基于Ontology的空間知識(shí)查詢方法及其應(yīng)用[J].地理信息科學(xué),2004,6(4):93-98.
[3] 吳孟泉,崔偉宏.本體驅(qū)動(dòng)的時(shí)空數(shù)據(jù)查詢方法研究[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(11):154-157.
[4] 劉大有,胡鶴.時(shí)空推理研究進(jìn)展[J].軟件學(xué)報(bào),2004,15(8):1141-1149.
[5] 李霖,王紅.基于形式化本體的基礎(chǔ)地理信息分類[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2006,31(6).
[6] 虞為,曹加恒,陳俊鵬.基于地理空間語義網(wǎng)的異構(gòu)地理信息查詢[J].計(jì)算機(jī)工程與應(yīng)用,2006,42(30):6-9.
【通聯(lián)編輯:代影】