999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

制造資源本體的語義相似度計算方法研究

2016-10-17 02:19:11羅俊麗
現代計算機 2016年22期
關鍵詞:語義概念資源

羅俊麗

(許昌學院信息工程學院,許昌 461000)

制造資源本體的語義相似度計算方法研究

羅俊麗

(許昌學院信息工程學院,許昌461000)

0 引言

制造行業市場競爭日趨激烈,市場不斷細化,企業需要進一步深化合作和資源共享,提高部門之間、企業之間、地區之間制造資源的共享。而制造資源本身呈現異構性、多樣性,分布性、海量性等特點,這給企業在檢索和匹配制造資源時帶來困難。本體是一種共享概念的形式化的清晰的規范描述,它使用概念及概念間的關系來表示信息,使用本體來描述統一制造資源可以幫助達到制造資源共享,具體過程是將制造資源封裝成本體,然后計算它們之間的語義相似度,從而完成制造資源的匹配,其中本體相似度計算是制造資源檢索和匹配的中的重要環節[1]。本文主要研究制造資源概念的語義相似度計算方法。

1 本體

目前被學者廣泛接受的本體定義是Studer的“本體是共享概念模型的明確的形式化說明”,此定義包括下面幾層含義[2]:(1)共享:本體不是面向整體,其是共同認可的概念,是公認的知識的集合。(2)明確:本體中明確定義了使用的概念和概念的約束。(3)概念化:本體中的概念模型是客觀世界抽象出來的,其與具體環境沒有關系。(4)形式化:本體是計算機方便處理的。

2 常用的語義相似度計算方法

概念相似度指的是本體在語義上的相似程度,目前常用的語義相似度計算方法有:基于屬性的計算方法,基于信息內容的計算方法,基于距離的方法。用S(ci,cj)表示兩個本體概念的相似度,其需要滿足以下幾個原則[4]:(1)相似度是一個取值范圍在[0,1]間的實數,數值越大表示相似度越大,反之亦然。相似度為1表示兩個概念完全相等,相似度為0表示兩個概念完全不相關。(2)滿足對稱性S(ci,cj)=S(cj,ci)。(3)相似度計算方法應綜合考慮制造資源間的各種影響因素,而計算公式本身應該簡潔,易于計算。

2.1基于距離的概念語義相似度計算

基于距離的計算方法是使用本體樹形模型中的兩個概念的最短路徑長度來衡量概念之間的語義相似度。距離越近,相似度越大;距離越大,相似度越小。該方法計算簡單,復雜性小,但是缺點也比較明顯。因為該方法已經假設本體樹形圖中所有邊的重要程度是一致的,即所有邊的權重相同。而事實上,樹形模型中邊的重要程度與其位置、類型等多種因素都有關系,所以這種假設是不成立的。文獻[5]根據概念在本體模型中的位置設置權重,對兩個概念詞匯的路徑中帶權值的邊求和,進而得到兩個概念詞匯的距離,用這個距離表示兩個概念的相似度,計算方法如下[5]:

2.2基于信息內容的概念語義相似度計算

該方法使用兩個概念詞匯間共享信息的多少來表示語義相似度。如果概念詞之間共享信息越少,則它們相似度越小;如果它們之間共享信息越多,則相似度越大。Lord使用樹形圖中概念詞的最近公共父節點概念詞包含信息量的多少來表示概念詞間的語義相似度[5-6]。

2.3基于屬性的相似度計算

其中,c1a和c2a分別是本體概念詞c1和c2的屬性集合;c1和c2的屬性集交集c1a∩c2a表示它們之間相同屬性集合;c1a-c2a為c1和c2屬性集的差集,即包含在c1a中的屬性但是沒有包含在c2a中的屬性的集合,同理,c2a-c1a表示包含在c2a中的屬性但是沒有包含在c1a中的屬性的集合。

基于屬性的相似度計算基于這樣的思想:若兩個概念詞有非常多相同的屬性,則認為這兩個概念相似度高,反之亦然。Tversky在文獻[7]中給出了計算方法:

3 基于制造資源本體的語義相似度計算

上述幾類方法從不同角度出發,給出了相似度計算方法,但是這些方法沒有將本體距離、節點密度、屬性、信息內容等影響因素綜合考慮。下面我們用一個實例來說明。

如圖1所示,以帶權重的距離計算方法,圖中的“c8鍛壓設備”和“c9焊接設備”兩個概念,與“c10傳動件”和“c11連接件”兩個概念的帶權重距離相等,這是因為c8和c9的深度為4,有共同的父節點c4;而c10與c11也有共同的父節點c7,且他們的深度也為4,另外這4個節點有共同的祖先節點c0,所以,他們的帶權重的距離也是相等的。但是直觀上我們認為“c8加工鍛壓設備”與“c9焊接設備”的相似度比“c10傳動件”和“c11連接件”的相似度要小。所以,使用距離等單一的計算方法不能精確地反映概念間的相似度,還需綜合考慮其他因素,下面我們來分析影響概念語義相似度的各個因素。

圖1 制造資源本體圖

其中P(ci)是概念ci在資料中的出現頻率統計,使用上面兩個公式,我們可以得到兩個概念間的相似度計算方法:

(1)制造資源本體概念信息量

由信息理論得知,概念包含的信息量與該概念出現的頻率相關,概念的信息量計算公式為[2]:

其中,IC(Anc.(c1,c2)表示概念c1和c2最近公共祖先的信息量。

(2)制造資源本體概念節點密度

通常一個概念節點的密度反映了該概念的具體化程度,若兩個概念節點密度都比較大,則這兩個概念的語義相似度通常會比較大。

其中wid.(c1)表示概念節點c1的兄弟節點個數,以此來表示該節點的密度,max(wid.(T))是本體樹形圖中最大節點密度的值[4]。

其中,Attr.(c1)∩Attr.(c2)表示表示概念c1和c2各自屬性集合的交集,Attr.(c1)∪Attr.(c2)表示概念c1和c2各自屬性集合的并集。Count.()是集合中數量的統計函數,公式(7)描述了語義相似度與概念共享屬性的關系。

(4)影響因素的系數

上面分析了概念信息量、概念節點密度及概念共享屬性對概念之間的語義相似度的影響,綜合考慮這些情況,我們定義概念間的語義相似度計算方法為:

(3)制造資源本體概念屬性

在前面基于屬性的相似度方法中已經指出,兩個概念共享的屬性數量與它們的相似度成正比。據此,我們可以得出下面公式:

其中,α、β、γ、λ分別是概念節點間的距離、概率節點密度、概念節點信息量及概念節點共享屬性程度這幾個影響因素的系數[2]。令這四個系數之和為1,即α+ β+γ+λ=1,通常α的值比其他三個大很多,說明基于語義節點距離對概念間相似度值影響還是最大的。這幾個系數的值可以由領域專家設定,也可以由研究者在具體實驗環境中通過測試集訓練得出。

4 實驗

4.1數據集和評估方法

Miller和Charles在實驗中證明人工判斷語義相似度具有很高的可信度,因而研究者通常使用帶人工判斷結果的數據集來驗證算法的有效性。從設備資源和國家標準件本體數據集中分別選擇一部分概念詞匯作為實驗中的兩個數據集,這兩個數據集分別包含詞匯30對和35對。通常使用皮爾森相關系數來計算人工判斷和計算機算法得到的語義相似度的關聯度,關聯度越高表示人工判斷和計算機算法結果越接近,也就表示該算法效果好[8]。例如有X1和X2兩個變量,則它們之間的皮爾森相關系數為:

4.2實驗結果與分析

實驗采用文獻[2,6,7]中分別介紹的基于距離的方法、基于信息內容量的方法、基于共享屬性的方法和我們的方法進行測試,表1和表2分別是這幾種方法在4.1中提到的兩個數據集上計算皮爾森相關系數的結果:

表1 部分設備資源數據集相關系數比較

表2 部分國家標準件數據集相關系數比較

從上面的是實驗結果可以看出,本文的方法因為綜合考慮了距離、信息內容量、共享屬性數量等多個因素,因而所得效果明顯要比前三種方法好。

5 結語

本文結合制造資源的例子分析了語義相似度計算的幾種方法,指出影響概念相似度的因素有多個,單純一種方法不能到達滿意結果,進而提出一種綜合各個影響因素的制造資源本體概念相似度的計算方法,最后用實驗驗證了該方法的有效性。

[1]劉文劍,郭寧,金天國.制造資源本體的相似度計算模型[J].計算機集成制造系統,2010,16(11):2468-2474.

[2]魏軍英.基于Web服務的中小企業制造資源共享關鍵技術研究[D].山東科技大學,2011.

[3]袁慶霓.基于網絡化制造環境的制造資源共享服務語義關鍵技術研究[D].西南交通大學,2010.

[4]黨亞洲.基于本體的機械零件資源庫語義檢索研究與應用[D].新疆大學,2015.

[5]劉宏哲.文本語義相似度計算方法研究[D].北京交通大學,2012.

[6]Shi B,Yan J Z,Wang P,et al.Ontology-based Measure of Semantic Similarity Between Concepts[C].Wri World Congress on Software Engineering.IEEE Computer Society,2009:109-112.

[7]Tversky A.Features of Similarity[J].Readings in Cognitive Science,1988,84(4):290-302.

[8]羅俊麗,王亞,路凱.基于模糊語義的本體概念相似度計算算法[J].微電子學與計算機,2013(7):128-132.

Manufacturing Resources;Semantic Similarity;Concept;Ontology;Distance

Research on Semantic Similarity Calculating Method for Manufacturing Resource Ontology

LUO Jun-li
(College of Information Engineering,Xuchang University,Xuchang 461000)

1007-1423(2016)22-0024-04DOI:10.3969/j.issn.1007-1423.2016.22.005

羅俊麗(1986-),女,河南周口人,碩士,講師,研究方向為數據挖掘、語義信息處理

2016-07-05

2016-07-30

企業對制造資源的描述是不完全相同的,為了實現企業之間的制造資源共享,需要建立一個能夠有效匹配制造企業資源的模型。通過分析現有語義相似度計算的主流方法,提出一種計算制造資源概念語義相似度的新方法。該方法綜合考慮距離、共享屬性、信息內容量和節點密度等因素,能夠明顯提高概念的語義相似度準確度。實驗結果驗證該方法效果要優于傳統的語義相似度計算方法。

制造資源;語義相似度;概念;本體

許昌學院科研項目(No.2015090)

The description of manufacturing resources for different enterprises is not same,in order to achieve sharing manufacturing resources among enterprises,need to build an effective model for matching concept of manufacturing resources.Through analyzing the current semantic similarity computation of ontology,proposes a new method for computing the concept semantic similarity.This method synthetically considers different impact factors which include distance,shared property,content information and density of node.By this means,the accuracy of the concept semantic similarity is improved obviously.Experimental result shows that this method outperforms traditional similarity measures.

猜你喜歡
語義概念資源
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
基礎教育資源展示
一樣的資源,不一樣的收獲
語言與語義
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
資源回收
學習集合概念『四步走』
聚焦集合的概念及應用
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
主站蜘蛛池模板: 在线看片免费人成视久网下载| 全部免费特黄特色大片视频| 国产91在线|日本| 亚洲中文字幕国产av| 91精品专区国产盗摄| 美女一级毛片无遮挡内谢| 高清无码手机在线观看| 欧美日韩午夜视频在线观看| 91福利在线看| 欧美一区二区精品久久久| 亚洲经典在线中文字幕| 亚洲成人高清在线观看| 97国产精品视频自在拍| 国产真实乱人视频| 久久黄色小视频| 欧美激情成人网| 中国毛片网| 无码aⅴ精品一区二区三区| 免费啪啪网址| 99久久精品免费看国产电影| 91美女视频在线| 99免费视频观看| 国产自产视频一区二区三区| 激情午夜婷婷| 国产人人干| 亚洲人网站| 国产综合另类小说色区色噜噜 | 国产福利一区二区在线观看| 亚洲视频影院| 色综合天天娱乐综合网| 亚洲无码高清一区二区| 日本欧美视频在线观看| 亚洲bt欧美bt精品| 又大又硬又爽免费视频| 亚洲AV无码久久精品色欲 | 国产综合在线观看视频| 真实国产乱子伦高清| 亚洲Aⅴ无码专区在线观看q| аv天堂最新中文在线| 91青青视频| 精品中文字幕一区在线| 欧美一区二区三区欧美日韩亚洲 | 玖玖精品视频在线观看| 日韩免费成人| 久久综合伊人 六十路| 久夜色精品国产噜噜| 日本久久网站| 国产SUV精品一区二区6| 88av在线| 中文字幕无码av专区久久| 日本久久免费| 久久免费视频6| 91麻豆精品国产91久久久久| 中国成人在线视频| 午夜少妇精品视频小电影| 国产在线拍偷自揄观看视频网站| 在线观看亚洲天堂| 免费一级毛片完整版在线看| 亚洲视频免费播放| 国产成人高清在线精品| 久久综合一个色综合网| 国产乱人伦精品一区二区| 亚洲欧美在线综合一区二区三区| 久久综合九色综合97婷婷| 国产日本欧美在线观看| 婷婷中文在线| a毛片在线播放| 国产一区二区三区免费| 国产一线在线| 午夜激情婷婷| 欧美精品综合视频一区二区| 精品一区二区三区无码视频无码| 精品国产自在现线看久久| 精品国产www| 又大又硬又爽免费视频| 亚洲人成网7777777国产| 国产精品无码AⅤ在线观看播放| 亚洲色图欧美在线| 亚洲国产精品美女| 亚洲最黄视频| 亚洲成人www| 伊人久久久久久久|