999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

P2P網絡中基于本體的語義信息交互機制

2009-01-01 00:00:00唐九陽湯大權肖衛東
計算機應用研究 2009年5期

(國防科學技術大學 信息系統與管理學院 長沙 410073)

摘 要:為提高P2P信息共享系統中的語義信息交互能力,提出了節點資源元數據本體模型,對資源元數據的共性進行建模,增加了資源元數據描述的清晰度和資源元數據間的語義聯系。在此基礎上,考慮豐富的語義和上下文信息,提出了一種基于本體匹配的語義信息交互機制,節點通過自主處理、理解和解釋語義層次的信息,支持語義豐富的分布式信息共享。

關鍵詞:對等網;本體;語義;信息交互

中圖分類號:TP393文獻標志碼:A

文章編號:1001-3695(2009)05-1852-03

Mechanism of semantic information interaction based on ontology in P2P network

TANG Jiuyang,TANG Daquan,XIAO Weidong

(School of Information System Management National University of Defense Technology Changsha 410073 China)

Abstract:This paper first introduced ontologybased resource metadata model of peers in P2P network. Based on ontological descriptions of the metadata characterizing the peer resources to be shared it proposed the mechanism of semantic information interaction by ontology matching among peers allowing for dynamically and flexibly comparing ontological resource descriptions against a target resource request. Finally it discussed and evaluated the semantic information interaction mechanism.

Key words:P2P(peertopeer); ontology; semantic; information interaction

有效的信息交互是P2P信息共享的基礎。一方面由于節點的自治,節點采用不同的方式存儲資源,導致網絡資源的異構,引發了互操作問題[1,2];另一方面P2P中不存在集中控制的特點,對每個節點獨立進行信息處理的能力提出了更高的要求。因此,P2P環境下的信息交互不僅要求對交互雙方信息具有充分完全的訪問能力,而且能自主處理、理解和解釋異構信息,基于語義層次的信息交互備受關注。

基于語義的方式即交互雙方對交互信息達成知識共識,這種共識使雙方機器具備了對語義化信息的理解,從而可以半自動化或自動化地處理這些信息。因此為實現語義層次的對等信息交互,需要解決兩方面的問題:a)單個節點的信息表示,即信息建模問題;b)節點信息模型之間的映射,即信息互操作問題。

本文首先通過建立節點資源元數據本體模型表征資源的基本特性和內容,解決廣域環境下的資源異構問題。在此基礎上,提出了一種P2P網絡環境下的語義信息交互機制,實現節點間的信息互操作。

1 相關工作

本體映射是語義信息交互的重要內容之一,針對本體映射的具體匹配算法,業界已有不少相關研究。

Cupid[3]是一種基于元素級匹配與結構級匹配的混合方法。其思想是如果兩個概念的子概念是相似的,那么這兩個概念就趨向于相似;如果兩個概念具有相似的祖先,那么它們也趨于相似。

SF[4]的思想是基于相鄰概念節點之間的相似傳遞性,也就是說如果兩個概念節點的鄰近節點是相似的,那么它們趨向于相似。SF是一種綜合使用了名稱匹配與結構匹配的混合方法。但是該方法并沒有使用詞典,沒有利用術語之間語言學上的語法關系。

GLUE[5]系統用機器學習的方法來完成不同本體之間的匹配任務,其思想是多策略學習。它代表了一種自動合并不同匹配器(learner)匹配結果的組合方法,除了名稱匹配器之外,它還需要用到幾個在預處理階段經過訓練的實例級匹配器。該方法的局限性主要是面向實例,需要大量的實例進行訓練達到提高匹配效果的目的。

文獻[6]給出WordNet[7]上基于層次的名詞性概念的相似度算法;文獻[8]使用上下位關系、整體部分關系計算匹配相似度;文獻[9]基于詞語相似其上下文也相似的思想給出概念間相似度。綜合來看,文獻[6~9]本質都是計算層次關系上節點間的距離,但上述工作孤立地考慮概念名稱和上下文,與之相區別的是本文將這兩者有機地結合在一起。

文獻[10]中以兩本體概念的并集與其交集的商作為相似度,該方法簡單易行,但在匹配精確性上有所欠缺。文獻[11]和Edamok[12]借助邏輯描述資源概念及上下文,通過邏輯推理實現語義匹配。然而邏輯表示和邏輯推理都具有很高的計算復雜性,實用性不強。

2 資源元數據本體模型

資源元數據本體MO(metadata ontology)定義為六元組(V,f,g,C,P,sr)。其中:V為一組詞匯集;C為節點中資源元數據的概念集合;P為概念集C的屬性集合,對任一屬性p∈P,存在c∈C使得p(c)成立;f為一個參照函數f:2V|→2C,將一個詞匯集{Vi}V映射到一個概念集C,通常來說,多個詞匯可以映射到一個概念,而一個詞匯也可以映射到多個概念;g也為一個參照函數g:2V|→2P,將一個詞匯集{Vi}V映射到一個屬性集P;sr表示概念間的語義關系,有dom(sr)={equals,similarto,partof,includes,overlays}。

設c1,c2∈C是兩個概念:a)equals(c1,c2)表示c1,c2之間的語義相等關系,即c1和c2是現實世界中語義相同的兩個概念,如equals(father,dad);b)similarto(c1,c2)表示c1和c2之間的語義相似關系,即c1,c2的語義相似,如similarto(book,volume);c)partof(c1,c2)表示c1和c2之間存在partof關系,即概念的組成關系,表示c1是c2的組成部分,如partof(tyre,car);d)includes(c1,c2)表示c1和c2之間存在includes關系,即概念的包含關系,表示c1在語義上包含c2,如includes(document,article);e)overlays(c1,c2)表示c1和c2之間存在overlays關系,即概念的重疊關系,表示c1與c2有語義重疊的部分,如overlays(journal,book)。

目前,各行業的領域本體庫正在構建過程中,距其完備并成為該領域的工業標準還需要很長時間。而且,即使形成比較完備的領域本體庫,庫中的概念實體也難以覆蓋資源元數據本體定義中所有出現的信息。而WordNet、HowNet、EuroWordNet等詞匯庫比領域本體庫相對成熟完備一些。根據文獻[13]中的方法,可以基于WordNet中的詞匯創建資源元數據標準詞匯表,即對應資源元數據本體MO中的詞匯集V。

將本體作為高層的抽象數據模型,可以屏蔽信息源語義級的異構,通過本體中概念間關系的描述,還可實現信息語義的連通。基于P2P的信息共享環境中,借助本體的支撐描述單個節點的資源元數據,能夠基本表達出節點共享資源的語義信息,這樣上層的應用對這些有良好定義的信息就可以進行有效的操作。

3 節點系統結構

每個節點通過節點通信管理器與其他節點進行通信,并通過用戶界面與用戶進行交互,包括接收用戶的查詢請求、對用戶的輸入作預處理、完成概念的標準化、顯示查詢結果以及提供一部分節點管理功能的可視化顯示。每個節點配備一個本地信息存儲庫和本體管理器,用于管理本地信息資源的元數據。節點系統結構的核心是四個模塊,即本體管理器、查詢處理器、通信管理器以及語義匹配模塊。下面詳細介紹這些模塊的功能和接口。

圖1中的資源元數據本體是存儲節點資源元數據本體信息的倉儲,存儲了標準元數據的概念、屬性和關系。資源數據是真正資源存儲的地方。本體管理器為本地節點信息資源的元數據提供本體描述,并提供本體編輯工具。

通信管理器負責節點間的通信。具體來說,通信管理器負責與其他(直接鄰居)節點的資源交換、查詢和資源的路由以及網絡信息的搜集。節點在查詢過程中,需要用到通信管理器的路由信息進行消息路由。

查詢管理器執行查詢處理和結果整合。當查詢管理器接收到其他節點的查詢請求時,首先進行解析,抽取出目標概念的本體描述,將查詢請求的每個關鍵字抽象到本體中的一個概念,并利用本體中這些概念的關系來進行查詢分解,交給語義匹配模塊,根據相應的語義匹配算法[14],得到本地節點語義匹配概念,返回相應的數據,流程如圖中標注的數字次序。圖中的虛箭頭則描述了本地提交查詢請求的處理過程。用戶通過用戶接口提交查詢請求,查詢管理器分兩步處理。一方面在本體管理器的元數據庫中直接查找;另一方面通過通信管理器向網絡中的其他節點發出查詢請求,最后對返回的所有結果進行整合。

語義匹配模塊根據語義資源匹配算法尋找與資源請求中的本體概念語義相似度最大的本地節點本體概念。

4 信息交互機制

通過構建資源元數據本體MO給出了一致的信息語義化表示,并基于WordNet中的詞匯創建了MO中的標準詞匯V,因此要想完成不同節點間信息的交互只需在元數據本體之間架起語義映射的橋梁。語義映射即假設兩個本體A和B,用另一種方式來映射本體A中的每個概念,使其能在本體B中找到相應的相同或類似的概念;反之亦然??梢越柚Z義匹配自動或半自動地完成這種映射過程。實際上,語義匹配既是語義映射的手段,又是資源搜索的重要步驟,即針對資源請求中的目標概念,在各節點資源元數據本體中尋找具有語義關聯的概念。

首先給出本體概念間的語義相似度度量的方式[14]如下:

a)詞匯名稱相似度la(t,t′)。使用WordNet語義網絡,計算詞語間的距離,詞語間的距離通過詞匯在語義網絡中詞匯t和t′之間的最大語義關聯強度度量。

b)語義相似度sa(c1,c2)。給出本體概念的相似程度,綜合詞匯名稱相似度和上下文相似度進行度量。

定義1 元數據本體間的相似度。

根據定義1,對于任意給定的一個用本體表達的搜索請求q和節點的任意一個資源元數據本體mo1,它們之間的語義相關程度可以用元數據本體相似度來表示,即sim(q,mo1)。

為了支持語義信息交互,系統中每個節點的信息資源元數據均用本體模型表示。用戶接口允許用戶通過圖示化界面點擊、選擇生成一個查詢請求,查詢項由節點元數據本體中的概念和屬性構成,為了精簡查詢,用戶可以給出屬性的約束條件。具體的查詢模板如下:

SEARCH c1,c2,…,cn;WITH p1,p2,…,pm;WHERE conditions

其中:ci是資源元數據本體中的概念;pi是本體概念中相應的屬性;conditions對屬性值的范圍進行限定。

用戶提交的查詢首先由本地節點解析后以并行的方式進行處理:如果本地可能有答案,則搜索本地元數據本體庫(否則不查本地元數據本體庫),同時根據通信模塊的路由信息把該查詢發送到相關節點,并在這些節點進行類似的處理。

一旦接收到網絡上的查詢請求,節點的查詢處理器負責查詢的解析,分離出結果所需的本體概念,即SEARCH后的c1,c2,…,cn,本體概念的屬性,即WITH后的項p1,p2,…,pm,查詢條件,即WHERE后的conditions。在解析了查詢以后,查詢處理器需要調用本地語義匹配模塊進行語義匹配。節點將最終結果返回給查詢節點。返回結果模板如下:

RETURN mc1,mc2,…,mcn;WITH mp1,mp2,…,mpm;MATCHING {〈c1,max(sa(c1,mck)〉,…,〈cn,max(sa(cn,mcl)〉}

其中:mci是查詢接收節點匹配的概念;mpi是匹配概念中相應的屬性;MATCHING中是關于〈ci,max(sa(ci,mcj))〉的元組集合;sa(ci,mcj)是本體概念ci和mcj間的語義相似度函數,mci取與ci語義相似度最大的匹配概念。

如上所述,P2P信息共享網絡中的每個節點既是信息提供者又是信息消費者,因此在信息交互過程中也扮演雙重角色,具體的信息交互過程如圖2所示。

5 實驗分析

本文收集了來自中國期刊網、維普期刊數據庫中包括數學、物理、歷史、管理學、計算機五個類別的3 500篇文檔的元數據作為實驗數據集,建立了包含200個概念的元數據本體,并進行標注、存儲。

采用查準率和查全率作為信息交互性能的指標。查準率定義為查詢返回符合查詢條件的文檔數量與查詢結果包含的文檔總數的比率;查全率定義為查詢結果中的相關文檔數與測試集中的相關文檔總數的比率。

經過仿真性能測試,發現基于關鍵詞匹配的信息交互方法和本文中提到的基于元數據本體語義相似度的信息交互方法的平均查全率為21.4%、89.8%,平均查準率為18.4%、93.4%。具體測試結果如圖3、4所示。

實驗結果表明,基于關鍵詞匹配的信息交互方法的查準率和查全率都比較低,基于本體語義相似度計算的信息交互方法的查準率和查全率均達85%以上,性能有較大提高。查準率的提高是因為元數據本體的標注使文檔含義與用戶理解建立在統一的語義基礎之上,通過語義相似度的計算能夠有效提高查詢的準確率。查全率的提高是由于基于本體的信息交互方法利用本體對查詢概念進行了優化擴展,相對于簡單、單一的關鍵詞可以更加全面地描述用戶的查詢需求。

6 結束語

針對P2P信息共享網絡上異構信息的交互問題,本文提出了資源元數據本體模型對資源元數據的共性進行建模,增加了資源元數據描述的清晰度和資源元數據間的語義聯系,有效支持語義層次的信息共享。在此基礎上提出的語義信息交互機制通過節點自主處理、理解和解釋語義層次的信息進行語義異構消解,支持廣域、動態環境下的分布式信息共享。

參考文獻:

[1]EUZENAT J. An infrastructure for formally ensuring interoperability in a heterogeneous semantic Web[C]//Proc of the 1st Semantic Web Working Symposium.2001:345360.

[2]SERAFINI L BOUQUET P MAGNINI B,et al.Matching techniques for resource discovery in distributed systems using heterogeneous ontology descriptions[C]//Proc of International Conference on Coding and Computing (ITCC2004).2004:360366.

[3]MADHAVAN J BERNSTEIN P RAHM E.Generic schema matching with cupid[C]//Proc of the 27th International Conferences on Very Large Databases(VLDB).2001:4958.

[4]MELNIK S GARCIAMOLINA H RAHM E.Similarity flooding:a versatile graph matching algorithm[C]//Proc of the 18th International Conference on Data Engineering (ICDE’02).2002:117128.

[5]DOAN A MADHAVAN J DOMINGOS P,et al.Learning to map between ontologies on the semantic Web[C]//Proc of the 11th International WWW Conference.2002.

[6]AGIRRE E ALFONSECA E,DeLACALLE L O.Approximating hierarchybased similarity for WordNet nominal synsets using topic signatures[C]//Proc of the 2nd Global WordNet Conference.2004:1522.

[7]MILLER A G.WordNet:a lexical database for English[J].Communications of the ACM,1995,38(11):3941.

[8]LORD P W STEVENS R D BRASS A,et al.Investigating semantic similarity measures across the gene ontology:the relationship between sequence and annotation[J].Bioinformatics,2002,19(10):12751283.

[9]李涓子.漢語詞義排歧方法研究[D].北京:清華大學,1999.

[10]DOAN A MADHAVAN J DOMINGOS P,et al.Ontology matching:a machine learning approach[M]//Handbook on ontologies in information systems.[S.l.]:SpringerVerlag,2003:397416.

[11]TANGMUNARUNKIT H DECKER S KESSELMAN C. Ontologybased resource matching in the gridthe grid meets the semantic Web[C]//Proc of International Semantic Web Conference.2003:706721.

[12]CHAKRABORTY D PERICH F AVANCHA S,et al.An algorithm for matching contextualized schemas via SAT,technical report 030106 [R].Trento:DIT University,2003.

[13]BENATALLAH B HACID M S PAIK H,et al.Towards semanticdriven flexible and scalable framework for peering and querying eCatalog communities[J].Journal of Information Systems,2006,31(4):266294.

[14]唐九陽,張維明,肖衛東,等.面向虛擬組織資源發現的語義模糊匹配[J].計算機科學,2006,33(10):172175.

主站蜘蛛池模板: 亚洲国产午夜精华无码福利| 五月婷婷综合在线视频| 91精品国产综合久久不国产大片| 国产丝袜无码精品| 国产麻豆精品在线观看| 国产麻豆91网在线看| 国产永久在线视频| 欧美中文字幕在线二区| 本亚洲精品网站| 日韩高清一区 | 国产美女一级毛片| a毛片在线免费观看| 免费看a毛片| 婷婷久久综合九色综合88| swag国产精品| 国产91线观看| 大陆精大陆国产国语精品1024| 高清亚洲欧美在线看| 素人激情视频福利| 亚洲精品视频免费| 激情网址在线观看| 亚洲一道AV无码午夜福利| 亚洲国产天堂久久综合| 91美女在线| 久操中文在线| www.亚洲色图.com| 亚洲中久无码永久在线观看软件| 国产精品第| 在线99视频| 日本爱爱精品一区二区| 三级毛片在线播放| 中文字幕在线观| 国产成人精彩在线视频50| 香蕉精品在线| 偷拍久久网| 波多野一区| 亚洲AⅤ永久无码精品毛片| 日韩少妇激情一区二区| 精品国产一二三区| 亚洲一欧洲中文字幕在线| 国产无码高清视频不卡| 日韩精品高清自在线| P尤物久久99国产综合精品| 69av在线| 国产av一码二码三码无码| 亚洲色无码专线精品观看| 天天综合网色中文字幕| 国产制服丝袜无码视频| 伊人久综合| 欧美日在线观看| 欧美va亚洲va香蕉在线| 欧美一道本| 99热国产这里只有精品无卡顿"| 国内精品小视频在线| 无码福利视频| 国产女人综合久久精品视| 国产毛片一区| 日韩第九页| 亚洲AⅤ无码日韩AV无码网站| 国产超薄肉色丝袜网站| 国产黄色免费看| 国产不卡网| 国产XXXX做受性欧美88| 亚洲欧洲自拍拍偷午夜色| 免费中文字幕一级毛片| 日韩中文字幕免费在线观看| 日本精品影院| 国产成人亚洲无码淙合青草| 国产一级无码不卡视频| 精品99在线观看| 一本久道久久综合多人| 亚洲侵犯无码网址在线观看| 亚洲精品777| 国内熟女少妇一线天| 色欲国产一区二区日韩欧美| 色综合五月婷婷| 成年看免费观看视频拍拍| 噜噜噜综合亚洲| 国产成人亚洲毛片| 国产视频a| 久久香蕉国产线看观| 国产精品页|