999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一個(gè)基于枸杞病蟲害領(lǐng)域本體的語義檢索模型

2017-09-19 07:16:50李貫峰李衛(wèi)軍
關(guān)鍵詞:語義規(guī)則概念

李貫峰,李衛(wèi)軍

(1.寧夏大學(xué) 信息工程學(xué)院,寧夏 銀川 750021;2.北方民族大學(xué) 網(wǎng)絡(luò)信息技術(shù)中心,寧夏 銀川 750021)

一個(gè)基于枸杞病蟲害領(lǐng)域本體的語義檢索模型

李貫峰1,李衛(wèi)軍2

(1.寧夏大學(xué) 信息工程學(xué)院,寧夏 銀川 750021;2.北方民族大學(xué) 網(wǎng)絡(luò)信息技術(shù)中心,寧夏 銀川 750021)

由于缺少信息在語義上的處理和表示,傳統(tǒng)的以關(guān)鍵字和主題詞為檢索途徑的信息檢索方法會導(dǎo)致檢索結(jié)果不全面和不準(zhǔn)確,無法完全滿足用戶的檢索要求。為了提升檢索系統(tǒng)的檢索質(zhì)量,將本體引入至語義檢索過程中,提出了一種基于枸杞病蟲害領(lǐng)域本體的語義檢索模型,并對模型涉及的一些關(guān)鍵技術(shù)進(jìn)行了研究。該模型構(gòu)建了枸杞病蟲害領(lǐng)域本體,并修復(fù)了本體不一致問題,確保領(lǐng)域知識能準(zhǔn)確的組織和表示,利用本體固有的樹形結(jié)構(gòu),結(jié)合語義距離、上下位概念重合度及概念節(jié)點(diǎn)層次深度等影響語義相似度計(jì)算的因素,提出了一個(gè)概念相似度算法,結(jié)合所建立的語義推理規(guī)則,構(gòu)建了基于枸杞病蟲害領(lǐng)域本體的查詢與檢索模型。實(shí)驗(yàn)結(jié)果表明,該語義檢索模型能較好地彌補(bǔ)傳統(tǒng)檢索方式的不足,提高信息檢索的查全率和查準(zhǔn)率。

本體;枸杞病蟲害;不一致性檢測;語義相似度;語義檢索

0 引 言

寧夏枸杞自古享譽(yù)中外,是寧夏最具潛力的優(yōu)勢特色產(chǎn)業(yè)之一。目前,寧夏枸杞種植面積85萬畝,枸杞干果總量達(dá)到13萬噸,約占全國總產(chǎn)量的55%,年綜合產(chǎn)值超過80億元,是寧夏第一大出口農(nóng)產(chǎn)品。在枸杞栽植和生產(chǎn)過程中,枸杞病蟲害問題一直是寧夏枸杞產(chǎn)業(yè)發(fā)展的主要問題。隨著信息技術(shù)與互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,如何準(zhǔn)確全面地獲取枸杞病蟲害信息資源,是目前枸杞產(chǎn)業(yè)信息服務(wù)中一個(gè)亟待解決的問題。傳統(tǒng)以關(guān)鍵字、主題詞等字符串匹配原理為核心的信息資源檢索方法由于缺少在語義層面上的處理和表示,用戶輸入的檢索內(nèi)容與信息資源庫中的目標(biāo)內(nèi)容不相匹配,不能從根本上解決用戶查詢意圖與檢索資源之間的語義匹配問題,造成了檢索結(jié)果的不全面、不準(zhǔn)確,甚至系統(tǒng)無法返回符合用戶需要的檢索結(jié)果,從而影響檢索結(jié)果的客觀性。

本體(Ontology)是一種描述概念以及概念間關(guān)系的知識建模工具。本體具有良好的概念層次結(jié)構(gòu)和對邏輯推理的支持,因而將本體引入信息檢索系統(tǒng)中,能夠?yàn)楦倪M(jìn)信息檢索性能提供組織形式和語義上的保證[1]。一方面本體提供了對概念的語義支持,保留了概念之間的語義關(guān)系,從而實(shí)現(xiàn)基于語義理解的智能檢索;另一方面引入了推理機(jī)制,本體通過屬性和公理描述概念之間的邏輯關(guān)系和設(shè)計(jì)的推理規(guī)則實(shí)現(xiàn)推理,從而實(shí)現(xiàn)隱含知識的發(fā)現(xiàn)。

近年來,以本體為知識模型的語義檢索技術(shù)已成為一個(gè)研究熱點(diǎn),國內(nèi)外學(xué)者開展了大量的研究工作[2]。文獻(xiàn)[3]為提高多式信息檢索系統(tǒng)的性能,利用醫(yī)學(xué)本體擴(kuò)展了用戶檢索關(guān)鍵詞;文獻(xiàn)[4]提出了一種基于領(lǐng)域本體的混合查詢方法,利用查詢重寫和推理的方法處理動態(tài)和靜態(tài)的知識,實(shí)現(xiàn)了有效的知識檢索;文獻(xiàn)[5]提出了面向領(lǐng)域本體的查詢擴(kuò)展模型,總結(jié)出了5種應(yīng)用于語義檢索系統(tǒng)中的查詢擴(kuò)展方法;文獻(xiàn)[6]借助所建立的新聞?lì)I(lǐng)域本體和啟發(fā)式規(guī)則,提出了一種語義檢索方法,獲得了較高的查準(zhǔn)率;文獻(xiàn)[7-8]主要研究了基于距離、內(nèi)容和屬性的相似度計(jì)算方法,用于計(jì)算領(lǐng)域本體的概念相似度。

雖然基于本體的語義檢索方法取得了一定的進(jìn)展,但是大多數(shù)方法是利用本體進(jìn)行關(guān)鍵字的語義擴(kuò)展查詢,忽略了屬性和實(shí)例等語義關(guān)系及應(yīng)用程序?qū)用娴谋倔w建立。此外,沒有充分利用本體的推理功能,以發(fā)現(xiàn)本體中概念和實(shí)例之間隱含的語義關(guān)聯(lián),弱化了檢索效果。針對上述問題,需要在基于本體的語義檢索中建立新的語義檢索模型,并通過引入推理來發(fā)現(xiàn)隱含的語義關(guān)聯(lián)。為此,利用農(nóng)業(yè)領(lǐng)域本體中概念之間的語義聯(lián)系和結(jié)構(gòu)差異,結(jié)合語義推理和語義相似度,提出了一種基于本體的農(nóng)業(yè)領(lǐng)域語義查詢模型,是對傳統(tǒng)的語義檢索的補(bǔ)充和提升。

1 本體的構(gòu)建及一致性檢測

1.1本體的構(gòu)建

農(nóng)業(yè)本體是農(nóng)業(yè)領(lǐng)域中概念、概念間的相互關(guān)系以機(jī)器能理解的形式化語言表示和組織農(nóng)業(yè)知識的模型。從本質(zhì)上說,本體是一個(gè)客觀事實(shí)的集合,而這些集合是實(shí)現(xiàn)語義信息檢索的基礎(chǔ)。本體的構(gòu)建是一項(xiàng)復(fù)雜的系統(tǒng)工程,目前沒有統(tǒng)一的本體構(gòu)建的方法和規(guī)則。Gruber提出本體構(gòu)建的5個(gè)原則,即本體的定義具備清晰性、完整性、一致性、最大單向可擴(kuò)展性和最小編碼相關(guān)性[9]。對于領(lǐng)域本體的構(gòu)建,還應(yīng)遵循標(biāo)準(zhǔn)化建設(shè)原則、本體的復(fù)用原則、協(xié)作原則和評建結(jié)合的原則。借鑒相關(guān)構(gòu)建本體的方法[10],依據(jù)農(nóng)業(yè)領(lǐng)域知識的特點(diǎn),給出農(nóng)業(yè)本體構(gòu)建流程,如圖1所示。

圖1 農(nóng)業(yè)領(lǐng)域本體構(gòu)建方法流程

根據(jù)上述的構(gòu)建步驟,在學(xué)習(xí)了很多相關(guān)枸杞病蟲害書籍和大量文獻(xiàn)資料的基礎(chǔ)上,結(jié)合枸杞病蟲害領(lǐng)域?qū)<医ㄗh,以寧夏地區(qū)常見的枸杞蚜蟲、枸杞紅癭蚊、枸杞癭螨等51種枸杞害蟲和根腐病、炭疽病、白粉病等15種枸杞病害為研究對象,以診斷和防治為研究目標(biāo),抽取領(lǐng)域中的重要概念、屬性及實(shí)例,用Protégé工具構(gòu)建了一個(gè)枸杞病蟲害本體。本體的類結(jié)構(gòu)如圖2所示,共計(jì)37個(gè)本體類,基本涵蓋了實(shí)際生產(chǎn)中主要的枸杞病蟲害種類。該本體中有7個(gè)數(shù)據(jù)屬性和12個(gè)一級對象屬性用于描述枸杞病蟲害的基本信息,包括51個(gè)害蟲實(shí)例,15個(gè)病害實(shí)例及其他類的實(shí)例。

圖2 枸杞病蟲害本體類關(guān)系模型

1.2本體一致性檢測推理

本體構(gòu)建后手動添加本體或本體合并難免會出現(xiàn)本體不一致,當(dāng)概念相似度的計(jì)算基于本體的一致性時(shí),語義檢索才有意義。因此研究如何處理本體的不一致很有必要[11]。推理是計(jì)算機(jī)對本體知識理解的一種重要表現(xiàn),利用本體推理可以獲取更準(zhǔn)確的語義關(guān)系。基于規(guī)則的推理(rule-based reasoning)是一種將領(lǐng)域?qū)<业膶I(yè)知識和經(jīng)驗(yàn)抽象成為推理規(guī)則的基于謂詞邏輯的產(chǎn)生式系統(tǒng)。該推理方法比較直觀,推理過程簡單,同時(shí)推理效率比較高,因此采用基于本體的規(guī)則推理方法來實(shí)現(xiàn)農(nóng)業(yè)本體推理。推理思路是首先要詳細(xì)分析一下領(lǐng)域本體的語義關(guān)系,接下來在本體知識庫中進(jìn)行本體推理規(guī)則設(shè)計(jì),制定規(guī)則庫,然后依靠推理機(jī)按照一定的推理算法從既有事實(shí)推理出隱含知識,并用于語義檢索。推理規(guī)則是實(shí)現(xiàn)語義檢索的關(guān)鍵技術(shù)之一,利用領(lǐng)域本體中的語義關(guān)系和語義性質(zhì),如互逆性、傳遞性等的邏輯特點(diǎn),設(shè)計(jì)出有效的推理規(guī)則,以應(yīng)用于推理過程。推理規(guī)則語法:

RuleName:T1,T2,…,Tn→P

其中,RuleName為規(guī)則名;Ti(i=1,2,…,n)為已經(jīng)存在的三元組知識;P為可以推導(dǎo)出的三元組知識。

在推理規(guī)則中,如果左邊前提知識為真,則可以得到右邊的結(jié)論知識。將本體的推理規(guī)則分為兩類:通用規(guī)則和領(lǐng)域規(guī)則。通用規(guī)則是指與領(lǐng)域無關(guān)的推理規(guī)則,即所有本體都要用到的規(guī)則。例如用于確定多概念間的父子關(guān)系的傳遞性規(guī)則定義如下:

(?c1,rdfs: subClassOf, ?p),(?p, rdfs: subClassOf, ?c2)→(?c1, rdfs:subClassOf,?c2)。

確定通用規(guī)則后,還需要考慮概念屬性的具體語義,將通用規(guī)則具體化,形成領(lǐng)域規(guī)則。領(lǐng)域規(guī)則是指與領(lǐng)域相關(guān)的規(guī)則,實(shí)例之間的關(guān)系類型取決于其所在領(lǐng)域,需要領(lǐng)域?qū)<覅⑴c確定,是對通用規(guī)則的補(bǔ)充。例如,枸杞根腐病的癥狀為:枸杞病株葉片泛黃、萎垂;剖檢病株根、莖部,能夠看到患部變褐至黑褐色,部分皮層腐爛、脫落,露出木質(zhì)部,構(gòu)建了相應(yīng)的診斷推理規(guī)則,格式如下:

(?x,rdf:type, Wolfberry),(?y, rdf:type, Disease),(?z, rdf:type, Roots),(?y, harmsOn, ?z),(?z, hasColor,black brown),(?z, hasDS, rot),(?u, rdf:type, Leaf),(?y, harmsOn, ?u),(?u, hasColor, yellow),(?u, hasDS, sag),(?v, rdf:type, Branches),(?y, harmsOn, ?v),(?v, hasColor, brown),(?v, hasDS, Cortex fall off)→(?y, rdf:type, Ceitocybe bescens)。

其中,x、y、z、u、v分別為類Wolfberry(枸杞)、Disease(病害)、Roots(根部)、Leaf(葉片)、Branches(莖)的實(shí)例;harmsOn、hasColor、hasDS等為屬性關(guān)系。

目前,利用領(lǐng)域本體語義關(guān)系進(jìn)行的推理主要是使用一些推理機(jī)來完成的,通過推理引擎去解析本體庫中的知識概念,運(yùn)用推理機(jī)根據(jù)相應(yīng)的概念和推理規(guī)則進(jìn)行規(guī)則匹配,從而獲得新的知識概念。語義推理可分為前向鏈推理和后向鏈推理兩種方法[12],使用前向鏈推理算法,采用Jena作為推理機(jī)進(jìn)行推理,利用其提供的DIG接口實(shí)現(xiàn)推理,推理過程如下:

(1)構(gòu)建領(lǐng)域本體概念集合以及推理規(guī)則集合。

(2)從已知概念展開,根據(jù)需要來選擇用到的推理規(guī)則。

(3)若無規(guī)則匹配-觸發(fā)時(shí),則推理終止;若出現(xiàn)多條推理規(guī)則,利用相關(guān)策略進(jìn)行選擇。

(4)當(dāng)有規(guī)則被觸發(fā)時(shí),進(jìn)行推理,并將新事實(shí)添加到概念集中。

(5)重復(fù)第(2)步。

2 概念相似度計(jì)算方法

在語義檢索過程中,為了獲取準(zhǔn)確和全面的檢索結(jié)果,通常使用本體中的術(shù)語來表達(dá)用戶的檢索需求,判斷本體中的術(shù)語與用戶檢索條件在語義上的匹配程度,即需要計(jì)算術(shù)語間的相似度。語義相似度[13]是指兩個(gè)或兩個(gè)以上的不同概念間具有相近的特征。若有本體中的兩個(gè)概念ci和cj,它們之間的相似度用函數(shù)sim(ci,cj):S×S→[0,1]表示。目前的語義相似度計(jì)算方法主要是基于本體的概念,沒有綜合考慮影響術(shù)語間語義相似度的因素和充分利用本體結(jié)構(gòu)知識的問題,不能滿足本體庫中語義相似度計(jì)算的需要。利用本體固有的樹形結(jié)構(gòu),結(jié)合語義距離、上下位概念重合度、概念節(jié)點(diǎn)層次深度等影響語義相似度計(jì)算的因素,建立一種新的基于本體的語義相似度計(jì)算模型,使之能夠滿足本體知識庫中語義相似度計(jì)算的需要。

(1)基于概念語義距離的語義相似度。

語義距離是度量本體中兩個(gè)概念在語義上的近義程度的方法,在本體樹結(jié)構(gòu)中,通過計(jì)算兩個(gè)概念節(jié)點(diǎn)間的最短路徑來衡量語義距離。語義距離與語義相似度之間是一種簡單的反比關(guān)系。對于詞匯ci和cj,如果dis(ci,cj)為其語義距離,則語義相似度為:

(1)

其中,dis(ci,cj)=Sd(ci,LCA(ci,cj))+Sd(cj,LCA(ci,cj)),Sd(ci,cj)為概念節(jié)點(diǎn)ci和cj在本體樹中的最短距離,LCA(ci,cj)為ci和cj的最小共同祖先節(jié)點(diǎn);α為一個(gè)可調(diào)節(jié)的參數(shù)。

(2)基于上位概念重合度的語義相似度。

上位概念重合度度量領(lǐng)域本體中兩個(gè)概念之間在語義上的重合程度,它指兩個(gè)概念相同的上位概念數(shù)量與所有的上位概念數(shù)量間的比率,顯示了兩個(gè)概念的祖先節(jié)點(diǎn)的相似度。上位概念重合度與語義相似度呈正比,兩個(gè)概念的上位概念越多,重合度就越大,相應(yīng)的語義相似度越大,反之亦然。對于兩個(gè)概念ci和cj,N(ci)和N(cj)分別為概念ci和cj的上位概念集合,集合中元素的數(shù)量與本體樹結(jié)構(gòu)中節(jié)點(diǎn)ci和cj與根節(jié)點(diǎn)“Thing”的最短路徑中所包含的節(jié)點(diǎn)數(shù)相等。N(ci)∩N(cj)表示ci和cj相同的上位概念集合,N(ci)∪N(cj)表示ci和cj所有的上位概念集合。由于在信息論中采用非線性函數(shù)來評估語義相似性更好,因此,利用對數(shù)函數(shù)計(jì)算概念ci和cj之間的上位概念重合度,公式如下:

(2)

(3)基于概念層次深度的語義相似度。

利用概念的層次結(jié)構(gòu)可以計(jì)算概念之間的語義相似度。一般來說,本體樹結(jié)構(gòu)中處于同一層次的兩個(gè)概念所含的信息量相似,當(dāng)兩個(gè)概念間層次和增加,語義相似度會變大,反之,當(dāng)兩個(gè)概念所在層次差增加,其語義相似度會減小。對于兩個(gè)詞匯ci和cj,利用概念層次結(jié)構(gòu)計(jì)算語義相似度的公式如下:

(3)

其中,L(ci)和L(cj)分別為概念ci和cj的層次;dmax為本體樹的深度。

綜合考慮本體結(jié)構(gòu)樹中各個(gè)因素的影響,結(jié)合上述語義相似度計(jì)算方法,最終的語義相似度計(jì)算方法如下:

sim(ci,cj)=

(4)

其中,α、β、γ為調(diào)節(jié)系數(shù),取值范圍均為(0,1],且α+β+γ=1。

3 基于本體的語義檢索模型

3.1語義檢索模型

建立基于領(lǐng)域本體的語義檢索模型,首先根據(jù)枸杞病蟲害領(lǐng)域具體的知識結(jié)構(gòu),構(gòu)建了領(lǐng)域本體。然后采集枸杞病蟲害領(lǐng)域文檔,通過預(yù)處理將文檔進(jìn)行標(biāo)注,建立枸杞病蟲害知識資源庫。利用枸杞病蟲害領(lǐng)域本體中概念之間的語義聯(lián)系和結(jié)構(gòu)差異,結(jié)合語義推理和概念相似度建立語義檢索模型。該模型主要由系統(tǒng)界面、本體庫、知識資源庫、語義擴(kuò)展和推理、語義檢索等模塊組成,如圖3所示。

(1)用戶界面:該功能主要實(shí)現(xiàn)查詢用戶和語義檢索系統(tǒng)的信息交互,用戶利用檢索界面輸入相應(yīng)的查詢關(guān)鍵詞,系統(tǒng)處理后返回查詢結(jié)果。

(2)本體庫:本體是語義檢索的核心,對于原查詢詞的語義擴(kuò)展和資源庫語義信息的標(biāo)注至關(guān)重要。為了使用戶能夠?qū)︻I(lǐng)域知識理解一致,實(shí)現(xiàn)知識的共享和本體的重用,通過從相關(guān)書籍、領(lǐng)域?qū)<液捅倔w學(xué)習(xí)等途徑獲取本體信息,構(gòu)建本體。本體庫定義了農(nóng)業(yè)領(lǐng)域中的概念、關(guān)系以及實(shí)體和屬性集合。

圖3 基于本體的語義檢索模型

(3)知識資源庫:該模塊提供了可供語義檢索的信息資源。利用網(wǎng)絡(luò)爬蟲在Web上爬取網(wǎng)頁文檔,然后在頁面中找出本體中的實(shí)體,包括本體中的概念、屬性和實(shí)例等,進(jìn)行相應(yīng)的語義標(biāo)注,用領(lǐng)域本體中各種概念的語義關(guān)系來描述文檔的語義,為資源文檔建立基于本體的索引,以便對信息資源進(jìn)行語義檢索。

(4)查詢擴(kuò)展處理:對用戶輸入的查詢詞進(jìn)行分詞等預(yù)處理后,該功能模塊根據(jù)領(lǐng)域本體庫信息,把原查詢詞與本體的內(nèi)容進(jìn)行映射,進(jìn)行語義相似度計(jì)算和查詢語義擴(kuò)展。與此同時(shí),利用本體中的各種語義關(guān)系,設(shè)計(jì)推理規(guī)則,進(jìn)行知識推理,得到新的更能反映用戶檢索意圖的檢索式,從而提高了檢索精度[14]。

(5)語義檢索模塊:按新的檢索式對知識資源庫進(jìn)行檢索,根據(jù)查詢實(shí)例與文檔的相關(guān)度和相似度進(jìn)行排序,并將排好序的查詢結(jié)果返回給用戶。

3.2語義檢索過程

根據(jù)用戶的檢索要求進(jìn)行語義檢索,過程如下:

(1)對輸入的用戶檢索請求進(jìn)行分詞處理;

(2)利用分詞后的結(jié)果,判斷檢索詞是否為本體庫中的概念和實(shí)例,如果是則進(jìn)行知識檢索,如果不是,則根據(jù)農(nóng)業(yè)領(lǐng)域本體中存在的語義關(guān)系和設(shè)計(jì)的推理規(guī)則,結(jié)合語義相似度計(jì)算方法對用戶檢索詞進(jìn)行語義擴(kuò)展;

(3)語義擴(kuò)展后,用得到的檢索詞進(jìn)行檢索操作。語義檢索引擎根據(jù)和原檢索詞相近或相似的新的檢索詞進(jìn)行語義檢索;

(4)按相似度從大到小排序后輸出檢索結(jié)果,并將結(jié)果列表輸出到用戶頁面。

4 實(shí)驗(yàn)及結(jié)果分析

為了對提出的模型進(jìn)行實(shí)驗(yàn)驗(yàn)證,從http://www.nyyy.cc/、http://wolfberry.forestry.gov.cn/和http://www.qhgq.org/三個(gè)大型的枸杞農(nóng)業(yè)網(wǎng)站中獲取相關(guān)網(wǎng)頁,以這些Web頁面作為信息資源庫。實(shí)驗(yàn)前對資源進(jìn)行了相應(yīng)的語義標(biāo)注,使其能滿足語義檢索的要求。實(shí)驗(yàn)使用傳統(tǒng)的基于關(guān)鍵字的檢索方法(M1)和基于本體的語義檢索方法(M2)分別對語料庫進(jìn)行檢索,以對比兩種檢索方法的性能。與傳統(tǒng)的信息檢索系統(tǒng)一樣,基于本體的語義檢索模型的目標(biāo)也是在資源耗費(fèi)較少的前提下快速檢索到準(zhǔn)確而全面的結(jié)果,因此對檢索系統(tǒng)的評價(jià)也從效果和效率方面進(jìn)行。效果方面采用的評價(jià)指標(biāo)包括查準(zhǔn)率、查全率和F值。其中,查準(zhǔn)率是檢出的正確結(jié)果總量與檢出的結(jié)果總量的比率,查全率是檢出結(jié)果的總量與系統(tǒng)中相關(guān)結(jié)果總量的比率,F(xiàn)反映了查準(zhǔn)率和查全率的平衡的綜合評價(jià)指標(biāo),通常與檢索系統(tǒng)性能呈正比關(guān)系[15]。效率方面主要對時(shí)間開銷和響應(yīng)速度進(jìn)行測試比較。

從表1中可以看出,基于本體的語義檢索方法不論查全率還是查準(zhǔn)率,均優(yōu)于基于關(guān)鍵字的檢索方法,因?yàn)榛陉P(guān)鍵字匹配的檢索技術(shù)僅僅是關(guān)鍵字字型的匹配,不提供語義支持和規(guī)則推理,無法獲取語義關(guān)聯(lián)的結(jié)果和隱含的知識。而提出的方法主要實(shí)現(xiàn)了關(guān)鍵字語義層面上的匹配和推理,可以檢索出與關(guān)鍵字語義相關(guān)的知識,因此各個(gè)評價(jià)指標(biāo)總體上比基于關(guān)鍵字的檢索方法要高。

表1 語義檢索實(shí)驗(yàn)結(jié)果 %

隨著本體中的類和實(shí)例等數(shù)量(本體樹結(jié)構(gòu)中節(jié)點(diǎn)數(shù))的增加,需要耗費(fèi)更多的時(shí)間來遍歷本體樹結(jié)構(gòu),因此整個(gè)語義檢索系統(tǒng)耗時(shí)就增加了,時(shí)間開銷曲線如圖4所示。

圖4 語義檢索方法時(shí)間開銷

5 結(jié)束語

傳統(tǒng)的信息檢索模型是基于字符串匹配,缺乏語義,極大限制了檢索的查準(zhǔn)率和查全率。為此,利用本體的語義結(jié)構(gòu)和語義推理的能力,在研究基于枸杞病蟲害領(lǐng)域本體的語義檢索系統(tǒng)模型及其關(guān)鍵技術(shù)的基礎(chǔ)上,提出了一種基于枸杞病蟲害領(lǐng)域本體的語義檢索模型。其主要工作包括:構(gòu)建了領(lǐng)域本體庫并使用語義規(guī)則和推理引擎對本體進(jìn)行一致性檢測,改進(jìn)了語義相似度計(jì)算方法并實(shí)現(xiàn)了基于領(lǐng)域本體的語義檢索模型。實(shí)驗(yàn)結(jié)果表明,與基于關(guān)鍵字的檢索模型相比,該模型有效可行,是完善知識檢索方法的一種嘗試,為農(nóng)業(yè)科技知識服務(wù)平臺提供了一種有效的檢索方法。隨著本體應(yīng)用的不斷深入,還需要對現(xiàn)有檢索模型進(jìn)行進(jìn)一步優(yōu)化,以提高檢索的整體效率。

[1] 楊月華,杜軍平,平 源.基于本體的智能信息檢索系統(tǒng)[J].軟件學(xué)報(bào),2015,26(7):1675-1687.

[2] Zammali S,Arour K,Bouzeghoub A.Using ontologies to build testbed for peer-to-peer information retrieval systems[C]//27th international conference on advanced information networking and applications.[s.l.]:IEEE,2013:1033-1040.

[3] Díaz-Galiano M C,Martín-Valdivia M T,Urea-López L A.Query expansion with a medical ontology to improve a multimodal information retrieval system[J].Computers in Biology & Medicine,2009,39(4):396-403.

[4] Yoo D.Hybrid query processing for personalized information retrieval on the semantic web[J].Knowledge-Based Systems,2012,27(3):211-218.

[5] Liu Z Y,Chen J X,Li X,et al.Design and application for the model of semantic query expansion based on domain ontology[J].International Journal of Modelling,Identification and Control,2012,16(3):277-284.

[6] Kallipolitis L,Karpis V,Karali I.Semantic search in the world news domain using automatically extracted metadata files[J].Knowledge-Based Systems,2012,27(3):38-50.

[7] Batet M,Sánchez D,Valls A.An ontology-based measure to compute semantic similarity in biomedicine[J].Journal of Biomedical Informatics,2011,44(1):118-125.

[8] 王旭陽,萬 里.信息檢索中語義相似度算法研究[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(10):124-127.

[9] Studer R,Benjamins V R,Fensel D.Knowledge engineering,principles and methods[J].Data and Knowledge Engineering,1998,25(2):161-197.

[10] 鄭業(yè)魯,何綺云,錢 平,等.基于本體的農(nóng)業(yè)知識管理系統(tǒng)構(gòu)建方法[J].中國科學(xué):信息科學(xué),2010,40(S):196-204.

[11] Huang Z,Harmelen F V.Using semantic distances for reasoning with inconsistent ontologies[C]//International conference on the semantic web.[s.l.]:Springer-Verlag,2008:178-194.

[12] 李貫峰,李衛(wèi)軍.基于SWRL的枸杞病蟲害本體知識推理研究[J].江蘇農(nóng)業(yè)科學(xué),2016,44(11):399-402.

[13] 劉宏哲,須 德.基于本體的語義相似度和相關(guān)度計(jì)算研究綜述[J].計(jì)算機(jī)科學(xué),2012,39(2):8-13.

[14] 蘇依拉,吉亞圖,竇葆媛.基于蒙古語課程領(lǐng)域語義Web的推理與檢索方法的研究[J].計(jì)算機(jī)工程與科學(xué),2016,38(2):376-385.

[15] 張乃靜,鞠洪波,紀(jì) 平.基于本體的林業(yè)領(lǐng)域語義查詢擴(kuò)展模型[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2016,25(3):151-156.

A Semantic Retrieval Model with Domain Ontology Based on Wolfberry Disease and Pests

LI Guan-feng1,LI Wei-jun2

(1.School of Information Engineering,Ningxia University,Yinchuan 750021,China; 2.Network Information & Technology Center,Beifang University of Nationalities,Yinchuan 750021,China)

The traditional information retrieval methods based on keywords and subject are lack of processing and presentation on the semantic level and thus lead to incomplete and inaccurate retrieval results,which cannot meet the user’s retrieval needs totally.In order to improve the quality of retrieval system,a model of semantic retrieval based on ontology for wolfberry disease and pests domain has been presented and its key technologies have been investigated in the processing of the introduction of ontology into semantic retrieving.It constructs the domain ontology of wolfberry diseases and pests,and modifies its inconsistent problem to ensure consistency and accuracy of wolfberry diseases and pests knowledge.Under the guidance of hierarchical tree structure of the domain ontology,a concept similarity method considering semantic distance,superior concepts coincidence degree and depth of concept nodes is proposed.Combined with the semantic inference rules a semantic retrieval model based on domain ontology of wolfberry disease and pests is realized.The experimental results demonstrate that the semantic retrieval model has well overcome the deficiency of the traditional retrieval method and effectively improved the recall and precision of information retrieval.

ontology;wolfberry disease and pests;inconsistency detection;semantic similarity;semantic retrieval

2016-10-13

:2017-01-18 < class="emphasis_bold">網(wǎng)絡(luò)出版時(shí)間

時(shí)間:2017-07-11

寧夏自治區(qū)高校科研基金資助項(xiàng)目(NGY2014009)

李貫峰(1979-),男,碩士,副教授,研究方向?yàn)橹R工程。

http://kns.cnki.net/kcms/detail/61.1450.TP.20170711.1455.056.html

TP391

:A

:1673-629X(2017)09-0048-05

10.3969/j.issn.1673-629X.2017.09.011

猜你喜歡
語義規(guī)則概念
Birdie Cup Coffee豐盛里概念店
撐竿跳規(guī)則的制定
數(shù)獨(dú)的規(guī)則和演變
語言與語義
幾樣概念店
學(xué)習(xí)集合概念『四步走』
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
聚焦集合的概念及應(yīng)用
TPP反腐敗規(guī)則對我國的啟示
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
主站蜘蛛池模板: 在线观看亚洲精品福利片| 国产免费a级片| 亚洲国产成人综合精品2020 | 日韩AV无码一区| 亚洲最大福利视频网| 久久精品国产一区二区小说| 亚洲视频二| 国产女人综合久久精品视| 免费A级毛片无码无遮挡| 天天操天天噜| 欧美中文字幕在线视频| 九色视频一区| 亚洲无码视频一区二区三区| 国产呦精品一区二区三区下载| 黄片在线永久| 青草视频网站在线观看| 无码日韩视频| 日本一区高清| 中国一级毛片免费观看| 不卡无码网| 国产女人喷水视频| 一级毛片免费观看不卡视频| 国内精品自在欧美一区| 在线欧美日韩国产| 欧美一级特黄aaaaaa在线看片| 夜夜高潮夜夜爽国产伦精品| 中文国产成人精品久久一| 天天综合网色中文字幕| 亚洲中文精品久久久久久不卡| 亚洲日本中文综合在线| 午夜少妇精品视频小电影| 免费毛片在线| 成人小视频在线观看免费| 欧美一区二区三区国产精品| 日韩在线1| 91黄视频在线观看| 色综合久久88| 农村乱人伦一区二区| 成人免费一级片| 99这里精品| 亚洲综合精品香蕉久久网| 欧美日韩一区二区三区在线视频| 伊人激情久久综合中文字幕| 热这里只有精品国产热门精品| 麻豆精品在线| av午夜福利一片免费看| 在线毛片免费| 日韩精品一区二区三区中文无码| 亚洲国产亚洲综合在线尤物| 久久久久无码国产精品不卡 | 久久一本精品久久久ー99| 无码日韩精品91超碰| 亚洲日本在线免费观看| 亚洲专区一区二区在线观看| 97青草最新免费精品视频| 欧美成人免费一区在线播放| 欧美日一级片| 四虎影视8848永久精品| 亚洲欧美成人综合| 欧美精品高清| 91福利一区二区三区| 精品少妇人妻无码久久| 日韩av资源在线| 日韩欧美国产三级| 国产成人精品无码一区二| 欧美午夜在线播放| 日韩欧美网址| 欧美一级高清片欧美国产欧美| 国产成+人+综合+亚洲欧美| 国产人人干| 亚州AV秘 一区二区三区| 久久久久国产一级毛片高清板| 亚洲h视频在线| 国产视频自拍一区| 欧美午夜网| 中文字幕无线码一区| 亚洲欧美成人| 免费一级成人毛片| 国产麻豆精品手机在线观看| 网久久综合| 欧美日本激情| 中文字幕不卡免费高清视频|