999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

語義知識(shí)庫存儲(chǔ)方案研究

2012-02-28 05:10:38殷浪
關(guān)鍵詞:語義模型

殷浪

(武漢理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,湖北 武漢 430063)

隨著網(wǎng)絡(luò)的發(fā)展,當(dāng)今社會(huì)已經(jīng)步入了信息時(shí)代。網(wǎng)絡(luò)資源呈指數(shù)增長(zhǎng),互聯(lián)網(wǎng)己成為一個(gè)巨大的信息源,如何提高檢索質(zhì)量,尋求令人滿意的檢索模式和技術(shù)已經(jīng)是全球的研究重點(diǎn)。當(dāng)前基于關(guān)鍵詞的信息檢索由于數(shù)據(jù)缺乏語義信息及其查詢處理缺乏語義支持,只能查找出與用戶在語法層上匹配的信息,而無法給出與其在語義層上具有相關(guān)性的其他信息,從而導(dǎo)致信息查詢結(jié)果質(zhì)量低下。Tim Berners-Lee提出了語義網(wǎng),使網(wǎng)上信息提供具有計(jì)算機(jī)可以理解的語義,它的發(fā)展和成熟使得高效、高質(zhì)的語義檢索成為可能,以克服基于關(guān)鍵詞的信息檢索技術(shù)的缺陷。但是基于知識(shí)庫的語義查詢通常比較緩慢。本文研究了語義知識(shí)庫的相關(guān)存儲(chǔ)方案,并采用LUBM測(cè)試集從查詢時(shí)間和存儲(chǔ)空間這兩個(gè)方面比較幾種不同的存儲(chǔ)方案[1-3]。

1 語義檢索技術(shù)

1.1 Protégé

Protégé是一款基于Java的圖形界面本體工具,是由美國(guó)斯坦福大學(xué)開發(fā)的免費(fèi)開源平臺(tái)。它為用戶提供了一系列的工具支持構(gòu)建領(lǐng)域本體模型和基于本體的知識(shí)庫應(yīng)用,常用于定義本體模式。

1.2 Jena

Jena是惠普實(shí)驗(yàn)室提供的針對(duì)語義Web應(yīng)用的開源Java開發(fā)包[4]。它支持應(yīng)用程序調(diào)用Jena提供的接口操作本體數(shù)據(jù);支持主流的本體描述語言,如RDF、RDFS和OWL;支持多種本體的存儲(chǔ)模型,如內(nèi)存模型和數(shù)據(jù)庫模型等。Jena常用于定義實(shí)例并對(duì)本體數(shù)據(jù)進(jìn)行查詢維護(hù)等。本文將使用Jena API進(jìn)行相關(guān)查詢分析。

1.3 Sparql

Sparql(Simple Protocol and RDF Query Language)是為RDF開發(fā)的一種查詢語言和數(shù)據(jù)獲取協(xié)議,它為W3C所開發(fā)的RDF數(shù)據(jù)模型所定義,但是能用于任何可以用RDF來表示的信息資源[5]。RDF的三元模式構(gòu)成了圖形模式,而Sparql的查詢解決方案試圖將每個(gè)圖形模式變量的綁定與查詢模型節(jié)點(diǎn)進(jìn)行匹配。

Sparql協(xié)議和 RDF查詢語言(Sparql)目前是 W3C的工作草案或推薦標(biāo)準(zhǔn),還在討論中。Sparql構(gòu)建在以前的 RDF查詢語言(例如 rdfDB、RDQL和 SeRQL)之上,擁有一些有價(jià)值的新特性。

2 本體知識(shí)庫存儲(chǔ)方案

2.1 文件系統(tǒng)

Jena可以在文件系統(tǒng)中持久化本體知識(shí)庫,即基于文件系統(tǒng)的存儲(chǔ)。該方式實(shí)現(xiàn)起來比較簡(jiǎn)單,很多本體相關(guān)工具都支持對(duì)文件格式的本體進(jìn)行存取。但是,這種方法不僅效率低,而且很難適應(yīng)數(shù)據(jù)量較大的情況。基于文件系統(tǒng)的存儲(chǔ)方式一般只適用于規(guī)模較小的本體。

早期的本體數(shù)據(jù)管理工作是基于文件系統(tǒng)實(shí)現(xiàn)的,它們用簡(jiǎn)單的文件格式存儲(chǔ)本體數(shù)據(jù)并支持一些基本的操作。這類工作主要用來編輯和建立本體,并不是為大規(guī)模本體數(shù)據(jù)的存儲(chǔ)和查詢管理服務(wù)的,如Protégé。

2.2 關(guān)系數(shù)據(jù)庫

由于關(guān)系數(shù)據(jù)庫技術(shù)發(fā)展成熟,大多數(shù)現(xiàn)有的本體數(shù)據(jù)管理工作使用關(guān)系或?qū)ο?關(guān)系數(shù)據(jù)庫管理系統(tǒng)作為后臺(tái)存儲(chǔ)。Jena就可以在關(guān)系數(shù)據(jù)庫(Relational Database)中持久化本體知識(shí)庫。當(dāng)前支持的數(shù)據(jù)庫引擎有 Oracle、PostgreSQL和 MySQL。 以 MySQL為例,下面的代碼說明了如何將OWL文件導(dǎo)入到MySQL持久化模型。

在持久化到數(shù)據(jù)庫后,可以通過ModelMaker.openModel(modelName)來訪問該模型。

2.3 TDB

TDB是Jena的一個(gè)組件,可大規(guī)模地存儲(chǔ)和查詢RDF數(shù)據(jù)集,且支持Sparql查詢[6]。TDB是一個(gè)具有高性能、非事務(wù)性的RDF數(shù)據(jù)存儲(chǔ)器,可以通過命令腳本和Jena API來訪問和管理TDB存儲(chǔ)。以下代碼是說明如何將OWL文件存儲(chǔ)為TDB的。

DatasetGraphTDB graph =TDBFactory.createDatasetGraph(TDBlocation);

TDBLoader.load(graph, "file:///"+owlfile);

3 實(shí)驗(yàn)設(shè)計(jì)和性能評(píng)估

3.1 實(shí)驗(yàn)設(shè)計(jì)

3.1.1 硬件環(huán)境

本實(shí)驗(yàn)測(cè)試是在個(gè)人電腦上進(jìn)行的。具體環(huán)境是:2.20 GHz Intel(R)Core(TM)2 Duo CPU T6600,2 GB 內(nèi)存,250 GB的硬盤,WindowsXP操作系統(tǒng),JavaSDK 1.6.1。

3.1.2 測(cè)試數(shù)據(jù)集

LUBM是Lehigh大學(xué)提出的語義Web數(shù)據(jù)測(cè)試集。它基于大學(xué)這個(gè)領(lǐng)域,采用機(jī)器自動(dòng)生成的數(shù)據(jù)作為測(cè)試數(shù)據(jù),提供14個(gè)測(cè)試查詢和一套性能指標(biāo)[7]。它可以根據(jù)用戶指定的參數(shù)產(chǎn)生不同規(guī)模的數(shù)據(jù),由此測(cè)試在不同規(guī)模的環(huán)境下,系統(tǒng)的實(shí)例查詢性能。LUBM測(cè)試集是目前最流行的語義Web測(cè)試集。它生成的數(shù)據(jù)滿足本體層的規(guī)范,因此,也可以作為推理系統(tǒng)的測(cè)試數(shù)據(jù)集。但是LUBM測(cè)試結(jié)果也存在一個(gè)問題,即生成的數(shù)據(jù)中屬性的個(gè)數(shù)是固定的,僅有64個(gè)。隨著數(shù)據(jù)量的增加,數(shù)據(jù)會(huì)失去語義Web的一大特點(diǎn)——稀疏性,導(dǎo)致測(cè)試的結(jié)果不能反映實(shí)際應(yīng)用的效果。

這14個(gè)測(cè)試查詢,有的涉及推理機(jī),由于篇幅有限,只做了部分測(cè)試。以下是3個(gè)測(cè)試查詢語句。

3.2 實(shí)驗(yàn)結(jié)果對(duì)比

庫容量和轉(zhuǎn)載時(shí)間的比較如表1所示。其中,庫容量是指各種不同的存儲(chǔ)方式所占用的磁盤空間的大小;轉(zhuǎn)載時(shí)間是指從文件形式的知識(shí)庫轉(zhuǎn)換到其他存儲(chǔ)方式所需要的時(shí)間。

由于關(guān)系型數(shù)據(jù)庫會(huì)保存知識(shí)庫中所有的三元關(guān)系,因此耗時(shí)會(huì)比較多。對(duì)于1個(gè)50 MB左右的OWL文件,就已經(jīng)耗時(shí)4個(gè)多小時(shí)。因此,如果是較大的本體知識(shí)庫,想借關(guān)系數(shù)據(jù)庫來改善檢索效率的話,其可行性需要斟酌。相對(duì)于關(guān)系數(shù)據(jù)庫,TDB所用時(shí)間要少很多,值得借鑒。

表1 庫容量和轉(zhuǎn)載時(shí)間比較

對(duì)于上面提到的3個(gè)Sparql查詢語句,在用文件系統(tǒng)、關(guān)系數(shù)據(jù)庫和TDB這3種不同的存儲(chǔ)方式存儲(chǔ)時(shí),查詢所消耗的時(shí)間和查詢結(jié)果如表2所示。

表2 查詢測(cè)試結(jié)果

由表2可知,TDB在查詢方面要比文件系統(tǒng)和關(guān)系數(shù)據(jù)庫的效率高。

針對(duì)目前語義檢索領(lǐng)域中基于文件或者關(guān)系數(shù)據(jù)庫存儲(chǔ)方案下檢索效率慢的問題,本文分析了這幾種存儲(chǔ)方案在查詢響應(yīng)時(shí)間和存儲(chǔ)空間上的區(qū)別,并提出了基于TDB的知識(shí)庫存儲(chǔ)方案。實(shí)驗(yàn)證明,該方法能較大程度上提高用戶檢索效率,并且能降低存儲(chǔ)所需空間。基于本體的語義檢索的知識(shí)中,推理機(jī)還沒有涉及。如果添加了推理機(jī),語義檢索的速度將會(huì)更慢,因不屬于本文研究?jī)?nèi)容,故沒有作比較。

本體知識(shí)庫的存儲(chǔ)方案其實(shí)還有很多方式,如4store、BigData和BigOwlim等。由于能力有限,無法對(duì)每種方式進(jìn)行比較,只對(duì)研究項(xiàng)目所用到的存儲(chǔ)方式比較。這些將是以后研究工作中的重點(diǎn)。

[1]JARRAR M,MEERSMAN R.Ontologyengineering-the DOGMA approach[C].AdvancesinWebSemanticsI.Lecture Notes in Computer Science, 2009,4891:7-34.

[2] MILLER E. Semantic web applications[J]. INTAP Interoperability Technology Association for Information Processing, 2003(34):210-212.

[3] GRUBER T R. A translation approach to portable ontologies[J].Knowledge Acquisition, 1993,5(2):199-220.

[4]欒艷,丁二玉,駱斌.基于Ontology的語義檢索技術(shù)[J].計(jì)算機(jī)工程與應(yīng)用,2005,28(41):156-159.

[5]于水明.基于本體的語義檢索的應(yīng)用研究[D].大連:大連海事大學(xué),2007.

[6]謝圣獻(xiàn),謝光.語義檢索在電子商務(wù)中的應(yīng)用研究 [J].微計(jì)算機(jī)信息,2008,24(12):50-56.

[7]Gao Yuanbo, Pan Zhengxiang, HEFLN J.An evaluation ofknowledge base systems for large owl datasets[C].Third International Semantic Web Conference,2004:6-7.

猜你喜歡
語義模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
語言與語義
3D打印中的模型分割與打包
“上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
認(rèn)知范疇模糊與語義模糊
“深+N季”組配的認(rèn)知語義分析
語義分析與漢俄副名組合
主站蜘蛛池模板: 欧美日本视频在线观看| 国产原创第一页在线观看| 一级在线毛片| 日本亚洲欧美在线| 色综合激情网| 91小视频在线观看| 亚洲a级在线观看| 国产最新无码专区在线| 国产69精品久久久久孕妇大杂乱| 国产欧美日韩另类| 精品成人一区二区三区电影 | 无码不卡的中文字幕视频| 中文字幕日韩丝袜一区| 久久国产成人精品国产成人亚洲| 欧美午夜视频| 日本亚洲国产一区二区三区| 国产精品视频白浆免费视频| 国产精品久久自在自线观看| 成人免费午夜视频| 久无码久无码av无码| 综合成人国产| 亚洲欧洲日产国产无码AV| 国产精品浪潮Av| 日韩专区第一页| 精品国产免费观看一区| 国产人人乐人人爱| 亚洲国产综合自在线另类| 99爱视频精品免视看| 色网站在线视频| 91网址在线播放| 香蕉eeww99国产在线观看| 国产精品极品美女自在线看免费一区二区| 国产拍揄自揄精品视频网站| 国产精品永久久久久| 在线观看国产网址你懂的| 日本午夜网站| 一本无码在线观看| 99视频在线免费| 在线精品欧美日韩| 久久熟女AV| 国产女人在线观看| 最新亚洲人成无码网站欣赏网| 亚洲一区二区三区中文字幕5566| 欧美日韩午夜| 欧美午夜在线播放| 国产成人91精品免费网址在线| 亚洲妓女综合网995久久| 手机成人午夜在线视频| 亚洲区第一页| 中国一级特黄视频| 亚洲精品国产精品乱码不卞| 国产在线专区| 天天操天天噜| 无码综合天天久久综合网| 这里只有精品在线播放| 国产小视频网站| 亚洲h视频在线| 亚洲国产一区在线观看| 欧美亚洲国产视频| 最新国产成人剧情在线播放| 久无码久无码av无码| julia中文字幕久久亚洲| 黄色在线网| 狠狠综合久久| 色首页AV在线| 亚洲国产综合自在线另类| 中文无码日韩精品| 青青极品在线| 午夜在线不卡| 亚洲成年网站在线观看| 国产成人精品一区二区三区| 91福利在线看| 亚洲专区一区二区在线观看| 国产成人综合在线观看| 欧美一级视频免费| 欧美自慰一级看片免费| 一级高清毛片免费a级高清毛片| 国产精品香蕉在线| 国产特级毛片| 99国产在线视频| 91美女视频在线| 久久婷婷五月综合色一区二区|