999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于人工免疫的本體匹配算法

2016-01-08 05:31:31董濟德,謝強,丁秋林
計算機工程與科學 2015年6期

一種基于人工免疫的本體匹配算法*

董濟德,謝強,丁秋林

(南京航空航天大學計算機科學與技術(shù)學院,江蘇 南京 210016)

摘要:針對目前本體匹配算法存在運行效率低和匹配準確度不高等問題,提出一種基于人工免疫的動態(tài)本體匹配算法,用來快速地從現(xiàn)有本體中篩選出用戶所需的子本體。該算法根據(jù)用戶行為信息構(gòu)建抗原本體模型,利用情景匹配確定其領域上下文環(huán)境,然后通過結(jié)構(gòu)匹配獲得匹配度最高的本體,最后對本體執(zhí)行語義匹配得到最終需要的子本體。實驗表明,該算法提高了本體匹配的準確度和效率。

關(guān)鍵詞:本體匹配;抗原本體;情景匹配;結(jié)構(gòu)匹配;語義匹配

通信地址:210016 江蘇省南京市秦淮區(qū)御道街29號南京航空航天大學計算機科學與技術(shù)學院

Address:College of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,29 Yudao Rd,Qinhuai District,Nanjing 210016,Jiangsu,P.R.China

An ontology matching algorithm based on artificial immunity

DONG Ji-de,XIE Qiang,DING Qiu-lin

(College of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China)

Abstract:Because of the low efficiency and low accuracy existing in the traditional ontology matching algorithms, we introduce an automatic ontology matching algorithm based on artificial immunity to rapidly get the required sub-ontology from the existing ontology pool. The algorithm constructs an antigen ontology model according to the information of users’ behaviors, determines its domain context by matching the context, obtains the ontology with the highest matching degree via structure matching, and finally gets the right ontology through semantic matching. The experimental results show that the algorithm can improve the precision and the efficiency of ontology matching.

Key words:ontology matching;antigen ontology;context matching;structure matching;semantic matching

1引言

本體作為一種語義和知識層面上的概念共享模型[1],可作為用戶和計算機以及計算機與計算機之間的知識載體,從而實現(xiàn)語義網(wǎng)中知識的統(tǒng)一化表示。從知識工程領域上解釋,本體是一種表述語義知識的方法[2],并包含了對術(shù)語以及關(guān)鍵詞語的語義解釋。本體定義了一個統(tǒng)一化表述語義的數(shù)據(jù)視圖,并且可以用來對同一框架內(nèi)的異構(gòu)數(shù)據(jù)源進行建模。另外,本體可為不同數(shù)據(jù)源模型之間提供相互溝通交流的能力,并對模型內(nèi)蘊含的信息進行集成。

雖然本體在語義和知識層次上得到了廣泛的應用,但基于本體的知識表示方法在一定程度上并沒有充分解決本體的互操作以及相互通信的問題。相同或者相似領域間的本體亟需一種方法建立聯(lián)系,因此,本體匹配被人們提出,用來解決本體之間的協(xié)調(diào)與通信問題。本體匹配作為一種打破本體與本體之間的獨立性的方法,是一種用來查找本體之間或本體內(nèi)部元素之間相似程度的關(guān)鍵技術(shù),能夠解決不同領域內(nèi)或者相同領域內(nèi)本體異構(gòu)的問題,被一致認為是解決人機交互、機機交互時語義異構(gòu)問題的有效方法。而且,本體匹配對于本體映射與集成、本體的檢索以及本體重用、本體知識集成、語義Web服務的匹配,以及基于本體的軟件需求工程等是不可缺少的重要環(huán)節(jié)[3]。

本體匹配目前是一個活躍的研究領域,研究人員對此提出了眾多解決方案。在生物醫(yī)學和生物信息學的知識領域,本體匹配發(fā)展得益于對詞匯和本體的主動研究和應用。統(tǒng)一醫(yī)學語言系統(tǒng)UMLS(Unified Medical Language System)正是一個由國家醫(yī)學圖書館事業(yè)創(chuàng)建的規(guī)模浩大的醫(yī)學和生物術(shù)語單一存儲庫[2]。目前,對本體匹配的研究主要圍繞語義或者結(jié)構(gòu)方法展開。黃濤等人[1]提出的基于虛擬路徑的本體匹配算法OMA-VP(Ontology Matching Approach based on Virtual Path)對本體結(jié)構(gòu)匹配進行改進,提出了虛擬路徑的概念,一定程度上提高了本體匹配的準確度。但是,該算法僅是對本體匹配局部性的改進,并沒有在全局上降低本體匹配效率,而且匹配準確度不確定。OLA(OWL-Lite Alignment)[2]采用加權(quán)平均值沿多個本體特征之間的匹配,并引入了一種基于數(shù)值分析的實體集的相似性計算機制,使得本體匹配準確度有所提高,但算法的匹配效率較低。ASMOV算法[2]對OLA進行了一系列的改進,以圖形化本體的表示方法描述本體之間的關(guān)聯(lián),根據(jù)術(shù)語關(guān)鍵詞、結(jié)構(gòu)以及實體三個層次分別計算出術(shù)語相似性、結(jié)構(gòu)相似性和實體相似性的大小;然后對計算結(jié)果進行參數(shù)校準,從而得到最終本體匹配值。但是,該算法沒有考慮用戶的上下文語境,因此本體匹配的準確度并不理想。Falcon-AO(Finding,aligning and learning ontologies,ultimately for capturing knowledge via ontology-driven approaches)是由東南大學瞿裕忠教授和胡偉博士等人[1]開發(fā)的本體對齊工具,它利用一個語言匹配器并結(jié)合了一種以二部圖結(jié)構(gòu)表示的待匹配本體結(jié)構(gòu)的方法,通過計算概念之間語義相似系數(shù)進行了相似性分析,但大量的冗余計算降低了算法的執(zhí)行效率。H-Match是由意大利米蘭大學Castano S等人提出的面向分布式的本體的動態(tài)匹配方法,通過輸入兩個待比較本體得到兩個本體中具有語義相似性的元素對[1],來確定兩個本體之間的相似度。但是,該算法沒有充分解決因本體異構(gòu)而引發(fā)的匹配問題,同時該算法也沒有解決本體情景不匹配的情況下出現(xiàn)的匹配問題。蓋克[3]提出了一種基于概念上下文的本體匹配算法CBOMA(Context-Based Ontology-Matching Algorithm),通過構(gòu)建概念結(jié)構(gòu)層次樹來實現(xiàn)對本體自上而下的匹配,提高了本體匹配的準確度,但無法解決不同領域內(nèi)本體匹配相似度高的問題。王曉云等人[4]將改進的蟻群算法應用到本體匹配算法中,通過構(gòu)建距離矩陣、能量損耗矩陣和信息素矩陣來對本體匹配算法流程的進行優(yōu)化,其匹配精確度雖然得到提高,但大量的冗余計算降低了算法執(zhí)行效率。針對目前本體匹配算法中存在的問題,本文提出了一種基于人工免疫的動態(tài)本體匹配算法AOMA-AI(Automated Ontology Matching Algorithm based on AI)。人工免疫算法既能夠提供噪聲忍耐、無監(jiān)督學習、自組織以及記憶等學習機理,又結(jié)合了神經(jīng)網(wǎng)絡和機器推理等系統(tǒng)的一些優(yōu)點,因此能夠提供解決新問題方法的潛力[5,6]。AOMA-AI算法核心思想是根據(jù)用戶行為信息構(gòu)建抗原本體模型,利用情景匹配確定其領域上下文環(huán)境,然后通過結(jié)構(gòu)匹配獲得匹配度最高的本體,最后對本體執(zhí)行語義匹配得到最終需要的子本體。AOMA-AI基于人工免疫算法,對待匹配的本體賦予一定的生存期限,在匹配過程時不斷更新本體集合,這是其他本體匹配算法中所不具有的。所以,利用人工免疫算法的收斂快、耗時低等優(yōu)點,AOMA-AI算法在進行本體匹配時可進一步提高本體匹配準確度和效率。

2AOMA-AI算法框架

本體匹配的過程是對抗原本體的系統(tǒng)解讀,即將外界的本體通過匹配算法與系統(tǒng)中既定義的流程本體對應。所謂抗原本體,是對用戶行為信息進行本體化描述而得到計算機可識別的本體。本體匹配圖如圖1所示。

Figure1 Ontology matching process 圖1 本體匹配過程圖

圖2給出了AOMA-AI算法的組成框架,其大致可以分為四步:(1)根據(jù)用戶行為信息構(gòu)建抗原本體模型;(2)利用情景匹配確定其領域上下文環(huán)境;(3)通過結(jié)構(gòu)匹配獲得匹配度最高的子本體;(4)對本體執(zhí)行語義匹配,得到最終的子本體并輸出。

Figure 2 Structure of AOMA-AI 圖2 AOMA-AI算法框架圖

3基于人工免疫的本體匹配算法

3.1本體相關(guān)定義

傳統(tǒng)本體按照分類法來組織,包含了四個基本的建模語言,即概念類(Concept)、實體類(Instances)、屬性(Property)和公理(Axioms)[3,7]。概念采用框架結(jié)構(gòu),包括概念的名稱以及用自然語言對概念的描述[7];實體類是指屬于某概念的基本元素,即該概念類對應的具體實體;公理主要是用來描述屬性與屬性之間的包含關(guān)系以及類與類之間的從屬關(guān)系,同時公理也用來表示取值限制。

定義1本體可以用一個五元組表示:O={C,R,Hc,A,I},其中,C稱為本體中的概念集;R代表了領域中概念之間的相互關(guān)系,形式上定義為n維的笛卡爾積的子集,其基本關(guān)系可表示為part-of、kind-of、instant-of和attribute-of四種;Hc是本體概念的層次關(guān)系,其中Hc?C×C,Hc(C1,C2)表示C1是C2的子類;A為公理集合,是定義在概念和屬性上的限定和規(guī)則;I為C概念類對應的實例[7]。

關(guān)鍵詞定義2抗原本體,也稱為任務本體,是從用戶輸入信息中獲取來實現(xiàn)對信息的標準化、本體化描述而得到的計算機可識別的本體。

定義3記憶本體是這樣一類本體,即經(jīng)過抗原本體的多次刺激后,本體集合中的某一個或某一些本體多次被選中而轉(zhuǎn)化形成的本體。

本體表示是本體匹配過程中的一個重要環(huán)節(jié)。文獻[8]中提供了一種本體結(jié)構(gòu)圖OSG(Ontology Structure Graph)的表示方法,該方法能夠形式化表示出本體以及本體內(nèi)實體的從屬關(guān)系。鑒于本體結(jié)構(gòu)圖能夠充分表示本體結(jié)構(gòu),以及本體內(nèi)實體與實體之間、實體與屬性之間的從屬關(guān)系,本文也采用本體結(jié)構(gòu)圖表示本體,并且形式化地表示出本體之間匹配的過程。另外,由于本體在加入情景感知的特性后使本體具有了對象化、情景化的可分辨性的特征[9],本文進行本體匹配時能夠根據(jù)本體情景減少匹配次數(shù),從而提高效率。

3.2AOMA-AI算法設計

根據(jù)用戶輸入信息,首先利用程序構(gòu)建出抗原本體O;然后構(gòu)建出本體內(nèi)的實體E;最后在本體內(nèi)插入屬性值。上述過程結(jié)束后,提取用戶輸入信息關(guān)鍵詞W,然后進入算法本體匹配過程。

AOMA-AI從本體集群中匹配最優(yōu)本體的計算方法如公式(1)表示:

(1)

其中,Sim函數(shù)是本體匹配函數(shù);Si為本體群中第i個本體子群;S′為待匹配本體;δ為設定的閾值;O則為本體子群Si中的某一個本體。

接下來將介紹本體匹配函數(shù)的詳細過程。

本文本體匹配分為初始匹配、外匹配和內(nèi)匹配三個過程,分別對應于情景匹配、結(jié)構(gòu)匹配和語義匹配三個部分,詳細匹配過程如下:

(1)初始匹配,即為情景匹配。在基于語義Web的知識查找系統(tǒng)中,領域匹配是本體匹配中很重要的一步。在特定領域確定的情況下,對后續(xù)的本體進行結(jié)構(gòu)和語義匹配能夠提高匹配的查準率和查全率[1],此處的領域匹配是對各領域內(nèi)關(guān)鍵詞的匹配過程。

(2)外匹配,即為結(jié)構(gòu)匹配,對于兩個待比較本體,如果其結(jié)構(gòu)上差異程度非常大,那么后續(xù)的語義匹配就顯得沒有意義,所以,對本體的結(jié)構(gòu)匹配非常重要,能夠在一定程度上減少迭代次數(shù),降低時間復雜度。

(3)內(nèi)匹配,即為語義匹配,是這次匹配過程的主要組成部分,該匹配包含了貪婪實體匹配和屬性匹配兩個過程。

設F={C,H,E}為計算相似度值的操作集,分別對應于上述的三種匹配過程,C為本體的上下文概念集,H為層次結(jié)構(gòu),E為本體內(nèi)實體。對于目標本體O和待匹配本體集S中的任意本體O′,那么,相似度匹配計算結(jié)果可用公式(2)表示:

(2)

其中α、β、γ分別為控制參數(shù),而且α、β、γ滿足以下條件:

AOMA-AI算法的流程過程可用以下八個步驟描述,其中(1)~(3)為情景匹配部分,(4)~(6)為結(jié)構(gòu)匹配部分,(7)為語義匹配部分,(8)為算法流程輸出部分。AOMA-AI算法的具體描述如下:

關(guān)鍵詞(1)獲取抗原本體O的描述W,并確定本體O′集中每個功能描述關(guān)鍵詞Mi(i=1,2,3,…,n),即首先考察每個本體是否存在與抗原本體關(guān)鍵詞W相關(guān)聯(lián)的概念(例如同義概念、父子概念、包含或者被包含概念等)[10];同時,設定一個匹配閾值θ來保證情景匹配結(jié)果的準確性,閾值θ初始值為θ0,并隨著匹配迭代過程不斷更新。

(2)通過詞語相似性公式(3),計算抗原和本體集內(nèi)各本體的領域相似度[11]:

SimC(O,O′)=Comm(W,Mi)-

Diff(W,Mi)+Winkler(W,Mi)

(3)

關(guān)鍵詞其中,Comm表示兩個最大匹配字串所占比例,Diff表示未匹配比例,Winkler函數(shù)的返回值表示修正參數(shù)[12],其相應的計算公式如公式(4)~(6)所示:

(4)

Diff(W,Mi)=

(5)

Winkler(W,Mi)=

WinkerImpro(W,Mi,Comm(W,Mi))

(6)

WinkerImpro(W,Mi,comm)=

CPL*0.1*(1-comm)

關(guān)鍵詞其中,CPL(Common Prefix Length)為待比較W和Mi相同前綴的長度值;p為調(diào)節(jié)系數(shù),根據(jù)文獻[3]取p=0.6。

中圖分類號:TP391 文獻標志碼:A

doi:10.3969/j.issn.1007-130X.2015.06.014

收稿日期:*2014-06-17;修回日期:2014-09-18

基金項目:江蘇省產(chǎn)學研聯(lián)合創(chuàng)新資金資助項目(SBY201320423)

作者簡介:

(3)利用公式(3)得出領域相似度最大的本體并進行判斷。如果SimC(O,O′)≥θ,則可以確定該本體領域即可作為抗原的領域,可直接進入本體結(jié)構(gòu)和語義匹配來計算Sim(O,O′)值的大小。如果比較本體為記憶本體,并且Sim(O,O′) ≥δ,則輸出匹配的記憶本體,否則將遍歷本體集合,查找與之匹配的子本體。

(4)情景匹配結(jié)束后,接下來是結(jié)構(gòu)匹配和語義匹配的過程。首先,利用本體的概念關(guān)系計算本體結(jié)構(gòu)匹配度大小值SimH(O,O′);其次,構(gòu)建本體的實體相似度矩陣,計算本體語義匹配度的大小SimE(O,O′)。請注意,本文在結(jié)構(gòu)匹配中也需要設定一個閾值,只有當SimH(O,O′)大于閾值時才能繼續(xù)執(zhí)行語義匹配過程(為降低算法復雜性,該閾值暫設為一定值)。

(5)本體結(jié)構(gòu)匹配主要包括實體的結(jié)構(gòu)匹配,下面將詳細介紹匹配過程。首先,實體結(jié)構(gòu)匹配主要是對本體內(nèi)實體與實體之間關(guān)系的匹配,其中本文對實體與實體的關(guān)系界定是父子、兄弟和不相關(guān)三種。假設待匹配本體O和O′中的實體e和e′,且兩實體對應的父實體為u和u′,對應的子實體分別為v和v′,對應的實體結(jié)構(gòu)圖如圖3所示。

Figure 3 Ontology structure matching 圖3 本體結(jié)構(gòu)匹配圖

(6)本體結(jié)構(gòu)匹配的計算公式描述如(7)所示:

SimH(O,O′)=WpSimEp(u,u′)+

WeSimEe(e,e′)+WdSimEd(v,v′)

(7)

而且,對應的約束條件為:

Wp+We+Wd=1

其中,shortcut為實體e和e′之間最短路徑長度,Path(e,e′)表示實體e和e′之間最短路徑的方向改變次數(shù);≡表示對等關(guān)系,≤表示從屬關(guān)系,∈表示部分整體關(guān)系;Cbase(e,e′)是對實體e和e′的邏輯關(guān)系的表示方法;C為對關(guān)系的單位表示[1];Wp表示前驅(qū)元素及其屬性的語義相似性分配的權(quán)重比例,We表示實體的獨立性語義相似性分批的權(quán)重,Wd表示實體與后驅(qū)元素的相似性比例[1]。

(7)本體實體的語義相似度計算過程。

首先,構(gòu)建相似度實體矩陣S,具體形式如下所示[13]:

其次,定義基于相似度矩陣S的關(guān)聯(lián)集合AS,獲取AS的方法如下公式所示:

此處對el、et的取值限制如公式(8)所示:

(8)

第三,實體內(nèi)部的相似度主要是屬性相似度計算(有關(guān)詞語相似度則是根據(jù)公式(3)進行計算),其相應的計算公式如(9)所示:

(9)

最后,計算實體的相似度,具體的計算方法如公式(10)所示:

(10)

(8)根據(jù)公式(1)和公式(2),從本體集合中檢索出與抗原本體匹配度值最高的本體O′并輸出,得到用戶所需的本體。

4實驗結(jié)果及分析

4.1評估標準

為了測試本體匹配算法的有效性,本文從質(zhì)量和性能兩個方面對AOMA-AI算法進行效率評價[1]。在質(zhì)量評價測試中,最著名的標準是來源于信息檢索領域的查準率(Precision)和查全率(Recall)兩個指標[1]。查準率表示算法匹配過程中匹配正確次數(shù)的數(shù)量占所有匹配次數(shù)的百分比;查全率表示的是運用匹配算法得到的正確匹配次數(shù)占所有計算正確結(jié)果的數(shù)量的比例[1],在理想情況下,Precision= Recall=1。

但是,在實際評價中,單獨使用查準率或查全率都不能準確地評價算法的質(zhì)量。查全率和查準率結(jié)果之間會出現(xiàn)很大的誤差,如果僅靠這個標準并不能完全判定評價算法的質(zhì)量[1]。文獻[1]采用了另外兩種評估變量F-Measure和OverAll來調(diào)整查準率和查全率的綜合測量結(jié)果。本文也采用這兩個評估指標來評價算法的效率。

(11)

(12)

4.2算法分析

從算法流程上講,AOMA-AI算法是對OMA-VP算法[1]和ASMOV算法[2]的改進。ASMOV算法的本體匹配過程包含術(shù)語匹配、結(jié)構(gòu)匹配和實體匹配三個過程,OMA-VP算法的本體匹配過程包括結(jié)構(gòu)匹配和語義相似匹配,結(jié)合上述兩種匹配算法的優(yōu)點,AOMA-AI的本體匹配過程除了包括結(jié)構(gòu)匹配和語義匹配兩個過程之外,新增了情景上下文匹配過程用來減少本體匹配的迭代次數(shù),從而降低匹配時間,提高本體匹配效率。

設本體集合S,且|S|=n,平均每個本體中包含x個實體;由于三種算法中本體與本體之間匹配過程包括了結(jié)構(gòu)和實體匹配過程,不妨設任意兩個本體O1與O2之間匹配的平均時間為T(O1,O2),結(jié)構(gòu)匹配平均時間為T(Hc),實體匹配平均時間為T(E)。T(O1,O2)與T(Hc)和T(E)的關(guān)系為T(O1,O2)=T(Hc)+T(E)。

設記憶本體集合M長度|M|=l,此處l為常數(shù)值。

本體匹配算法時間復雜度分析過程如下:

首先,AOMA-AI算法時間復雜度分析。AOMA-AI采用了分治策略,即將本體集合S集合逐次分解子本體集合,然后遞歸調(diào)用。具體過程描述為:首先,通過情景匹配初步分解為m個子本體Si(1≤i≤m,m≤n),選擇滿足條件的子本體集;然后,通過情景匹配遞歸調(diào)用子本體集,從中獲取符合條件的子本體Sij(1≤j≤r,r≤m)。因此,AOMA-AI算法的平均時間復雜度可表示為O(logn)(T(O1,O2));AOMA-AI算法的最差時間復雜度為O(n)(T(O1,O2))。由于記憶本體集合M的存在,使得AOMA-AI算法時間復雜度最優(yōu)可表示為O(1)( T(O1,O2))。

其次 ,OMP-VP、CBOMA和ASMOV算法的時間復雜度分析。OMP-VP、CBOMA和ASMOV算法是對本體集合S中的所有本體遍歷,其時間復雜度直接表示為O(n)(T(O1,O2)),并不存在最優(yōu)時間復雜度的情況。

因此,通過比較AOMA-AI、OMP-VP、CBOMA和ASMOV算法的時間復雜度可以看出,ASMOV算法在進行本體匹配過程時,利用對本體集合的預操作減少了本體匹配的迭代次數(shù),相對其他本體匹配算法而言,匹配效率有所提高。

本體匹配算法準確性分析如下:AOMA-AI算法是對OMA-VP算法的改進,新增情景匹配過程用來保證本體O1和O2的結(jié)構(gòu)和語義匹配過程是在領域上下文相似的前提下進行的,這樣可以對相似詞語進行過濾,提高本體匹配的準確度;AOMA-AI算法與ASMOV算法相比,除了情景匹配的優(yōu)點外,還明顯簡化了本體比較的過程,減少冗余計算,從而提高了算法效率;AOMA-AI算法和CBOMA算法相比,相同點是對實體匹配都是對術(shù)語和屬性匹配,而AOMA-AI算法通過情景匹配獲取用戶情景上下文來確定本體領域提高匹配準確度,并且引入了記憶本體集來提高本體匹配效率。

4.3實驗結(jié)果

本次實驗硬件環(huán)境為E7500 2.93 GHz的CPU,2 GB內(nèi)存,軟件環(huán)境為Eclipse-SDK-3.7。根據(jù)第3節(jié)本體匹配過程,設計出其中某一本體的實體結(jié)構(gòu)圖,該圖中沒有標記處實體內(nèi)屬性,匹配過程如圖4所示。

圖4中本體O為根據(jù)用戶信息構(gòu)建出的抗原本體,而本體O′則是本體集合中的本體。圖4表示出本體匹配時實體匹配過程假設抗原本體O和本體O1中均包含四個實體,那么本體匹配過程是通過比較時實體相似度構(gòu)建出相應的本體相似度矩陣。

Figure 4 Internal entity comparison of ontologies 圖4 本體內(nèi)部實體比較

AOMA-AI算法閾值δ、θ的確定,對于δ值的選取如圖5所示。

Figure 5 Result of δ 圖5 δ值結(jié)果

選取δ值太大,將會使得記憶本體集成為虛設,而δ值過小,則將會受制于記憶本體集合而對匹配的準確性產(chǎn)生影響,因此本文對δ值設定了最大可能區(qū)間δ∈[0.5,0.8]。圖5a中顯示了δ值從0.5到0.8的變化結(jié)果,且當δ=0.7時其匹配度能滿足條件,且匹配效率高。

對于θ的初始化值θ0的選取將影響本體匹配結(jié)果,由于θ的大小是隨迭代過程變化的,所以對于θ0值初始化值設定為θ0∈[0.3,0.7]。圖5b顯示了θ0值從0.3到0.7變動時本體匹配的變化結(jié)果(θ0不妨取0.4)。設θ值變化公式為:θ=θ0+[logmn]*m/n(m

對于參數(shù)α、β、γ值的選取對實驗結(jié)果的影響,如圖6所示。

Figure 6 Results of parameter selection 圖6 參數(shù)選擇結(jié)果

當α取值太大時,本體匹配將會受限于本體上下文領域而忽視了本體結(jié)構(gòu)和語義匹配結(jié)果;當α取值太小,則會對匹配結(jié)果值造成很大的影響。從圖6顯示結(jié)果可以看出,當α∈[0.4,0.5]時,本體匹配平均值最大,為了使得算法容易控制,本文中將參數(shù)α和β值暫時定為0.4和0.3。

本文根據(jù)OAEI 2014測試數(shù)據(jù)集來測試AOMA-AI算法的運行效果。對于OAEI 2014數(shù)據(jù)集,本文選取#101、#102、#103、#104、#301、#302、#303和#304數(shù)據(jù)作為本文算法的測試數(shù)據(jù)集。AOMA-AI算法對傳統(tǒng)本體匹配算法的改進主要有兩點:第一,融入人工免疫算法,以提高本體匹配效率;第二,加入情景匹配,以提高本體匹配的準確度。所以,這次實驗過程主要是結(jié)合以上兩點展開的。

(1)算法效率比較。由于某特定的抗原本體對數(shù)據(jù)集多次刺激后生成了相應的記憶抗體,這時通過對傳統(tǒng)本體匹配算法ASMOV[2]、基于人工免疫的本體匹配算法AOMA-AI以及無人工免疫的本體匹配算法AOMA(AOMA算法是AOMA-AI算法的一部分,是在不考慮記憶本體集合時執(zhí)行全本體匹配的算法,即進行本體匹配過程時跳過記憶本體集合直接執(zhí)行情景匹配、結(jié)構(gòu)匹配和語義匹配的過程)的運行時間進行對比,得到三種算法運行時間,如圖7所示。

Figure 7 Running time of the algorithms 圖7 算法運行時間

從圖7可以看出,當同一抗原本體要求多次與測試數(shù)據(jù)集合進行匹配時,基于人工免疫的本體匹配算法的耗時明顯地低于原本體匹配算法的耗時,而且人工免疫算法還對本體設置了生存期,對于超過生存期的本體進行隱藏。所以,隨著匹配次數(shù)的增加,基于人工免疫本體匹配算法提高了本體匹配的效率。

(2)算法準確度比較。對于本體匹配準確度的評估,本文參照文獻[1]的標準,即用F-Measure和OverAll來比較原本體匹配算法和AOMA-AI算法的匹配準確度的差異。評價指標F-Measure和OverAll的比較結(jié)果分別如圖8和圖9所示。

Figure 8 Result of F-Measure 圖8 F-Measure結(jié)果

Figure 9 Result of OverAll 圖9 OverAll結(jié)果

從圖8和圖9結(jié)果中可以看出,相對ASMOV算法而言,AOMA-AI算法確實提高了本體匹配的準確度。分析其中原因,可以看出當在數(shù)據(jù)集中的本體加入情景屬性時,抗原本體與數(shù)據(jù)集中的本體要首先進行情景匹配,而只有抗原本體和數(shù)據(jù)集本體的語境相似度值大于或等于閾值θ的時候,才能進行后續(xù)的結(jié)構(gòu)和語義匹配過程,這樣既能排除不同領域內(nèi)的本體匹配結(jié)果的干擾,也能減少本體內(nèi)部的冗余計算量。

5結(jié)束語

本文利用人工免疫算法的收斂快、耗時低的特性,AOMA-AI算法將人工免疫算法融入到本體匹配算法中,有效地提高了本體匹配度和匹配效率,為后續(xù)中根據(jù)匹配本體為用戶推薦相應的知識提供基礎。然而,當用戶情景上下文不明確時,該算法將進行本體模糊匹配,這時由于對用戶行為信息不明確,仍會存在計算量冗余的問題。后續(xù)將進一步研究如何在用戶上下文不明確時,根據(jù)用戶歷史信息以及其他相同用戶的行為信息,盡最大可能為該用戶提供情景支持。

參考文獻:

[1]Huang Tao,Cui Hong-yang,Liu Qing-tang,et al. Ontology matching approach based on virtual path[J].Computer Science,2009,37(11):207-209.(in Chinese)

[2]Jean-Mary Y R,Shironoshita E P,Kabuka M R. Ontology matching with semantic verification[J].Web Semantics Science,Services and Agents on the World Wide Web,2009,7(3):235-244.

[3]Gai Ke. A Research on context-based ontology-matching algorithm[D]. Harbin:Harbin Institute of Technology,2010.(in Chinese)

[4]Wang Xiao-yun, Xu Qi-yu. An improved ant colony optimization for ontology matching[C]//Proc of International Conference on Computer Research & Development,2011:235-238.

[5]Han Xu-ming,Wang Li-min. Improved artificial immune algorithms and their applications[M].Beijing: Publishing House of Electronics Industry,2013.(in Chinese)

[6]Yang Gu-gang. An improved artificial immune algorithm [C]//Proc of the 6th International Conference on Natural Compuation,2010:2837-2841.

[7]Dai Wei-min. Technology and method of sematic web information organization[M]. Shanghai:Xuelin Press,2009.(in Chinese)

[8]Sun Cheng-zhu, Xu Xiao-fei, Deng Sheng-chun. Ontology representation method for virtual enterprise model[J].Computer Integrated Manufacturing Systems,2009,151(2):277-286.(in Chinese)

[9]Xu Jian-feng,Wang Dong. Object-oriented and ontology context-aware modeling based on XML[C]//Proc of International Conference on Computer Science and Network Technology,2012:1795-1797.

[10]Guan Dong,Cai Zi-xing,Kong Zhi-zhong. Research on grid service matching based on ontology[J].Journal of Chinese Computer Systems,2009,30(8):1640-1641.(in Chinese)

[11]Stoilos G,Stamou G,Kollias S. A string metric for ontology alignment[C]//Proc of the 4th International Semantic Web Conference,2005:625-628.

[12]Freckleton R E. Freckleton scaling ontology alignment[D]. Colorado:University of Colorado,2013.

[13]Hu Wei,Qu Yu-zhong. A practical ontology matching system[J].Web Semantics Services & Agents on the World Wide Web,2008,6(3):237-238.

參考文獻:附中文

[1]黃濤,崔弘揚,劉清堂,等.一種基于虛擬路徑的本體匹配算法[J]. 計算機科學,2009,37(11):207-209.

[3]蓋克.基于概念上下文的本體匹配算法研究[D] .哈爾濱:哈爾濱工業(yè)大學,2010.

[5]韓旭明,王麗敏. 人工免疫算法改進及其應用[M]. 北京:電子工業(yè)出版社,2013.

[7]戴維民. 語義網(wǎng)信息組織技術(shù)與方法[M]. 上海:學林出版社,2009.

[8]孫成柱,徐曉飛,鄧勝春.面向虛擬企業(yè)模型的本體表示方法[J].計算機集成制造系統(tǒng),2009,15(2):277-286.

[10]管東,蔡自興,孔志周.網(wǎng)格服務本體匹配算法研究[J]. 小型微型計算機系統(tǒng),2009,30(8):1640-1641.

董濟德(1986-),男,山東日照人,碩士,研究方向為信息推送和人機交互。E-mail:jidedong2008@126.com

DONG Ji-de,born in 1986,MS,his research interests include information pushing,and human-computer interaction.

謝強(1974-),男,四川瀘州人,博士,副教授,研究方向為信息安全和人機交互。E-mail:xieqiang@126.com

XIE Qiang,born in 1974,PhD,associate professor,his research interests include information security,and human-computer interaction.

丁秋林(1935-),男,江西撫州人,博士,教授,研究方向為企業(yè)信息化和信息系統(tǒng)集成。E-mail:qlding@nuaa.edu.cn

DING Qiu-lin,born in 1935,PhD,professor,his research interests include enterprise informationization, and information system integration.

主站蜘蛛池模板: 超碰91免费人妻| 十八禁美女裸体网站| 精品国产免费观看| 99精品一区二区免费视频| 国产女人综合久久精品视| 91小视频在线| 18禁黄无遮挡网站| 国产精品亚洲а∨天堂免下载| 热这里只有精品国产热门精品| 另类欧美日韩| 扒开粉嫩的小缝隙喷白浆视频| 久久久久亚洲AV成人人电影软件 | 免费人欧美成又黄又爽的视频| 欧美日韩国产综合视频在线观看| 真实国产精品vr专区| 亚洲无码一区在线观看| 国产h视频免费观看| 综合色天天| 免费A级毛片无码免费视频| 国产剧情一区二区| 欧美精品色视频| 日韩中文无码av超清| 国产91小视频在线观看| 国产综合另类小说色区色噜噜| 久久96热在精品国产高清| 欧美、日韩、国产综合一区| 亚洲黄色高清| 波多野结衣二区| 亚洲视频免| 在线观看国产精品第一区免费| 热这里只有精品国产热门精品| 欧美亚洲欧美| 亚洲有无码中文网| 久久精品国产在热久久2019 | 日本午夜影院| 亚洲精选无码久久久| 亚洲视频一区| 欧美视频二区| 国产成人高清精品免费5388| 国内精品一区二区在线观看| 黄色污网站在线观看| 日日拍夜夜嗷嗷叫国产| 成年人福利视频| 色九九视频| 91福利免费视频| 亚洲综合婷婷激情| 国产一区在线视频观看| 亚洲一道AV无码午夜福利| 91福利免费视频| 亚洲男人天堂网址| 国产成人精品亚洲日本对白优播| 亚洲性日韩精品一区二区| 伊人久久青草青青综合| 国产精品9| 成人福利视频网| 自慰高潮喷白浆在线观看| 69视频国产| 日本精品影院| 欧美啪啪一区| 亚洲无卡视频| 无码一区二区三区视频在线播放| 国产精女同一区二区三区久| 制服丝袜国产精品| lhav亚洲精品| 国模极品一区二区三区| 国产精品手机视频一区二区| 国产欧美日韩视频一区二区三区| 免费人成黄页在线观看国产| 无码aaa视频| 久久国产精品娇妻素人| 色悠久久综合| 亚洲成a人片在线观看88| 欧美亚洲激情| 中文字幕自拍偷拍| 国产v精品成人免费视频71pao| 欧美色视频日本| 人妻精品久久无码区| 99ri精品视频在线观看播放| 亚洲综合国产一区二区三区| 五月激激激综合网色播免费| 日韩中文无码av超清| 国内精品久久久久久久久久影视 |