999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種改進的本體相似度計算方法

2011-05-11 11:58:40朱珍元
網絡安全與數據管理 2011年1期
關鍵詞:實驗信息

朱珍元,鄭 誠

(安徽大學 計算智能與信號處理教育部重點實驗室,安徽 合肥 230039)

本體是共享概念化的明確具體規范,隨著語義網的發展,本體的應用越來越多。用RDF[1]或 OWL[2]書寫的Web本體在語義網的出現和應用方面起到了很大作用,本體的數量也與日俱增。

Web的分布式特點使得大量的本體由不同組織開發,并且在很大程度上覆蓋相同或者相交的領域,因此Web本體之間存在一定的相似性,但相關領域的不同本體之間也存在很大的異構性。

解決本體異構問題的最好方法是本體映射。本體映射的目的是架起異構本體之間的橋梁,在使用不同本體的Web應用之間建立互操作,從而實現語義網環境下數據的集成與管理。而本體映射的關鍵技術是本體的相似度計算,即計算兩個不同本體中實體之間的相似度,當相似度值大于某個給定的閾值時,可以認為這兩個實體之間存在著一定的語義關系。

目前,關于本體相似度計算方法的自動化程度不高,而且不能充分利用本體的各種描述信息。已有的VDoc技術能夠較好地解決這兩方面的問題,但也存在一些不足。

基于虛擬文檔的本體相似度計算方法V-Doc[3]將本體看成一個有向圖,圖中的每個節點對應本體中的一個實體,為每個實體自動建立虛擬文檔,充分利用了節點自身和鄰接節點的描述信息。但該方法也存在不足:節點的特征不僅與鄰接節點有關,而且還與鄰接節點的鄰接節點信息有關,即實體的描述信息還應該考慮節點的第二層鄰接節點的信息。針對其不足,本文提出一種新的基于虛擬文檔的本體相似度計算方法NV-Doc。

1 V-Doc簡介

1.1 虛擬文檔的構建

虛擬文檔是為了描述概念特點而建立起來的文檔,為每一個節點構建虛擬文檔,充分利用節點自身和鄰接節點的描述信息。

定義 1(URIrefs描述):假設 e是一個 URIref,對 e的描述通過與其有關的名字、標簽、注釋和其他自然語言描述信息組成,其定義[3]為:

其中 α1、α2、α3、α4是在區間[0,1]內固定的實數,分別表示名字、標簽、注釋和其他自然語言描述信息在對e描述中的權重,其具體值可以通過實驗確定。

定義 2 (虛擬文檔):假設 e是一個 URIref,e的虛擬文檔VD(e)定義為:

其中,sn(e)代表關于實體 e的子概念集合,on(e)代表關于實體 e 的父概念集合,γ1、γ2是在[0,1]內固定的實數,其具體值需要通過實驗確定。

1.2 相似度計算

本體中每一個實體(節點)的描述信息(語言學特征)通過該節點的虛擬文檔表示。因此,兩個本體中實體的相似度可通過計算與之對應的兩虛擬文檔之間的相似度而得到,即虛擬文檔之間的相似度就是實體之間的相似度。虛擬文檔之間的相似度通過在信息檢索領域應用廣泛的向量空間模型VSM(Vector Space Model)[4]方法計算。將兩個待匹配的虛擬文檔用向量空間中的一個向量表示,當然在相似度計算之前還要對文檔進行預處理,如分詞、去除停用詞、提取詞干等。向量空間模型中,關鍵詞的權重使用TF/IDF技術[5]表示。由此可以得到一個N×W的矩陣X,其中N是虛擬文檔的個數,W表示所有虛擬文檔中token的總數。可以通過矩陣與其倒置矩陣的積得到虛擬文檔之間的相似矩陣,最后規范化相似矩陣,使相似度值在[0,1]區間內。規范化后所得矩陣即為虛擬文檔之間的相似度矩陣,每個值也代表了兩個虛擬文檔之間的相似度,從而得到與之對應的兩實體之間的相似度。

2 NV-Doc

2.1 改進的虛擬文檔

為RDF圖中每一個節點構建虛擬文檔,不僅用到節點自身以及相鄰第一層的鄰居節點信息,還用到節點第二層的鄰接節點信息。

定義 3(改進的虛擬文檔):假設 e是一個 URIref,e的虛擬文檔NVD(e)的表示方程為:

其中,γ1、γ2、γ3、γ4是在[0,1]內固定的實數,其具體值需要通過實驗確定。

2.2 簡單示例

假設一個簡單的本體片段模型如圖1所示。

按照式(3)得到節點A的虛擬文檔為:

圖1 本體片段模型

3 實驗結果及分析

3.1 實驗數據

實驗數據選用基于KAON2的開源資源Framework forOntologyAlignmentandMapping中所提供的Test Ontologies and Alignments。從中選用本體規模較小的russia1.owl和russia2.owl作為數據源,其中russia1中共有49個節點,russia2中共有51個節點。進一步的實驗選用數據集OAEI 2005 benchmark tests中的五組規模稍大的本體作為數據源。 本文兩次實驗中各參數的取值不變:α1、α2、α3、α4的值分別為 1.0、0.5、0.25、0.25, 參數γ1、γ2、γ3、γ4的值分別取 0.1、0.1、0.05、0.05。 各參數的取值借鑒Falcon-OA[6]系統在程序中所給的參數值。對于實體的描述,第一層鄰接節點一般比第二層鄰接節點更有影響力,所以 γ3、γ4分別取 0.05、0.05,比 γ1、γ2的值 0.1、0.1 都小是有道理的。

本文采用查準率和查全率的綜合評估函數以及運行時間作為評價標準對實驗結果進行評估。

3.2 實驗結果及分析

本文主要的改進之處是提出新的算法來構建本體中實體的虛擬文檔,虛擬文檔間的相似度計算也是通過描述的方法實現,初步實驗結果如表1所示。

表1 初步實驗結果

初步實驗結果:表明改進的算法雖然在運行時間上有所延長,但查準率和查全率都有所提高,而且這種時間消耗不是很大。

其次,為了再一次驗證NV-Doc較V-Doc的可行性,對數據集OAEI 2005 benchmark tests中的五組本體進行實驗,最后得到的實驗結果如圖2、圖3所示。

圖2 綜合評估對比

圖3 運行時間對比

再次實驗結果表明,NV-Doc能夠取得比V-Doc更好的查全率和查準率,雖然在效率方面不及V-Doc,但從整體上來看,效率上的部分損失換來更好的查準率和查全率也是值得的。

本文針對計算本體中實體相似度存在的問題提出改進方法,充分利用實體自身和實體的第一層及第二層鄰接節點的描述信息(即實體的語言學上的特征)。實驗結果分析表明,改進后的算法在查準率和查全率方面優于原先的算法。下一步的研究工作是:一方面將此方法和其他計算本體相似度的方法有效結合,從而更有效地實現本體映射;另一方面是減少運行時間,提高效率。最后還要充分利用本體其他的描述信息,如本體的屬性、關系、實例等。

[1]KLYNE G,CARROLL J J.Resource description framework(RDF):concepts and abstract syntax.//W3C Recommendation 10 February 2004.Latest version is available at http://www.w3.org/TR/rdf-concepts/.

[2]Patel-Schneider P F, HAYES P, HORROCKS I.OWL web ontology language semantics and abstract syntax.W3C Recommendation 10 February 2004. Latest version is available at http://www.w3.org/TR/owl-semantics/.

[3]QU Yuzhong, HU Wei, CHENG Gong.Constructing virtual documents for ontology matching[C]//Proceedings of the 15th International Conference on W orld W ide W eb.Edinburgh,Scotland: [S.n.],2006.

[4]VIJAY V,RAGHAVAN S K,WONG M.A critical analysis ofvectorspace modelforinformation retrieval.JASIS,1986: 37(5), 279-287.

[5]SALTON G,MCGILL M.Introduction to modern information retrieval[M].McGraw-Hill Book Company,1984.

[6]Hu Wei, Qu Yuzhong.Falcon-AO: a practical ontology matching system[C].Web Semantics: Science, Services and Agents on theWorldWideWeb, 2008: 237-239.

猜你喜歡
實驗信息
記一次有趣的實驗
微型實驗里看“燃燒”
做個怪怪長實驗
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
《實驗流體力學》征稿簡則
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: jizz国产视频| 国产成人区在线观看视频| 亚洲一级无毛片无码在线免费视频| 欧美性久久久久| 亚洲愉拍一区二区精品| 中文字幕亚洲专区第19页| 免费全部高H视频无码无遮掩| 亚洲成肉网| 免费国产不卡午夜福在线观看| 欧美精品H在线播放| 2022精品国偷自产免费观看| 国产精品综合久久久| 久久semm亚洲国产| 国内精品自在自线视频香蕉| 国产精品毛片一区视频播| 六月婷婷综合| 四虎永久在线视频| 成人蜜桃网| 免费99精品国产自在现线| 亚洲六月丁香六月婷婷蜜芽| 18禁黄无遮挡网站| 波多野结衣一区二区三区AV| 狂欢视频在线观看不卡| 国产99久久亚洲综合精品西瓜tv| 黄色一级视频欧美| 日韩专区欧美| 女人18毛片一级毛片在线 | 国产成人精品亚洲日本对白优播| a级毛片免费看| 国产精品成人一区二区不卡| 中文纯内无码H| 国产菊爆视频在线观看| 精品久久香蕉国产线看观看gif| 国产黑丝视频在线观看| 国产福利免费观看| 伊人成人在线视频| 亚洲毛片一级带毛片基地| 国产不卡国语在线| 国产黄色片在线看| 永久免费精品视频| 国产成人免费观看在线视频| 国产在线视频欧美亚综合| 亚洲性视频网站| 久久精品丝袜| 好紧好深好大乳无码中文字幕| www.youjizz.com久久| 欧美激情,国产精品| 久久国产精品77777| 国产特级毛片aaaaaaa高清| 91视频国产高清| 在线观看国产精美视频| 久久免费成人| 日韩欧美中文字幕一本| 男女男免费视频网站国产| 最新日本中文字幕| 国内a级毛片| 国产成人免费| 亚洲va在线∨a天堂va欧美va| 老司机久久精品视频| 大陆精大陆国产国语精品1024| 第九色区aⅴ天堂久久香| www.99在线观看| 成年人国产视频| 亚洲欧洲综合| 亚洲欧美日韩中文字幕在线一区| 国产成人艳妇AA视频在线| 国产精品私拍在线爆乳| 全部免费毛片免费播放| 国产aⅴ无码专区亚洲av综合网| 不卡无码h在线观看| 蜜臀AVWWW国产天堂| 中国国产一级毛片| 国产精品自在自线免费观看| 欧美一级99在线观看国产| 国产福利免费观看| 日本人妻一区二区三区不卡影院| 国产尤物在线播放| 伊人久久大线影院首页| 欧洲熟妇精品视频| 依依成人精品无v国产| 特黄日韩免费一区二区三区| 精品福利视频网|