999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

引文相似性測量模型

2017-09-05 07:49:40陳衛玲袁乖寧王華
大陸橋視野·下 2017年6期
關鍵詞:語義文本測量

陳衛玲 袁乖寧 王華

【摘 要】CSLN 是引文語義鏈網絡。傳統相似度計算不能準確的測量CSLN中引文間的相似性。本文在對引文的特征進行分析后,提出了引文相似性測量模型,該模型能夠提高引文相似性測量的準確性。

【關鍵詞】引文;CSLN;相似性

1.引言

引文網絡是指被引文獻與引用文獻之間因引用關系而形成的一種網絡。語義鏈網絡(SLN)是一個用于管理Web資源的語義數據模型[1]。一個典型的語義鏈網絡包含語義節點,語義鏈以及語義鏈推理規則。其中,語義節點可以是任意類型的資源、抽象概念或者是另外一個語義鏈網絡。語義鏈是對超鏈接的擴展,并為之添加語義關系。語義鏈繼承了超鏈接的易用性,使之具有推理能力,并且具有語義自組織性:任意節點可以連接到其他語義相關的節點。利用語義鏈推理規則可以推導出更多的語義鏈[2]。

在這篇文章中,我們首先介紹了傳統相似度計算模型,接著對引文的特征進行深入的分析后,最后提出引文相似性測量模型,該模型能夠提高引文相似性測量的準確性。

2.傳統相似度計算模型

當我們進行引文相似度計算時,最常用的方法是采用數學工具把引文表示成一個數學模型,然后在這個模型上進行引文相似度運算。傳統的相似度計算模型有向量空間模型和集合運算模型等。

2. 1向量空間模型

向量空間模型VSM是六十年代末由Salton等人提出來的。VSM是一種代數的模型,目前已經被廣泛的應用于信息檢索等領域而且已經取得了很好的效果。VSM的表示方法是它最與眾不同的優點,VSM是通過把文本以向量的形式定義到實數域來對自然語言的文本進行表示。這種對自然語言文本的表示方法極大的提高了文本的可操作性和可計算性。而模式識別和其它領域中的計算方法也采用了VSM這種對文本的表示方法[3]。

向量空間模型VSM的基本思想是:我們用向量來表示文檔,并且假設詞與詞之間是不相關的,這樣就可以簡化文檔中關鍵詞之間的復雜關系,從而使得向量空間模型VSM具備了可計算性。而在向量空間模型VSM中,把文檔看成是由相互獨立的詞條組 (T1,T2,T3,……,Tn) 所構成,并且對于每一個詞條Ti根據這個詞條在文檔中的重要程度賦以該詞條一定的權值Wi。如果將這些相互獨立的詞條組(T1,T2,T3,……,Tn)看作是一個n維坐標系中的坐標軸,那么這些詞條的權重(W1 ,W2,W3,……,Wn)就這些坐標軸所對應的坐標值。所以由這些詞條組(T1,T2,T3,……,Tn) 分解得到的正交詞條矢量組就構成了一個文檔向量空間。

2. 2集合運算模型

3.引文相似性測量模型

一篇引文是由標題、關鍵字、正文等多個部分組成。因為引文的各個部分的重要程度不一樣,所以在計算兩個引文之間的相似性時我們應當把引文的各個部分分開當作多個對象來分析,而不能把一篇引文當作一個對象來分析。例如,引文的正文部分有大量的文字而且關鍵詞很分散,所以我們應當采用統計詞頻的方法來計算兩個引文之間的相似程度。而對于標題和關鍵字,因為關鍵字是整個文章中非常重要的一部分,所占權重也非常大,因此這一部分我們必須要重點考慮。所以我們在計算引文相似性時應該對關鍵字這一部分進行單獨處理。

通過上述分析,本文提出了引文相似性測量模型,我們首先把一篇引文的各個部分分開來進行相似性測量,然后再把各個部分綜合起來以此來計算兩篇引文之間的相似性。

4.總結

計算兩個引文之間的相似性有多種方法,因為CSLN中的引文是許多對象的集合。單個對象的相似度計算顯然不能準確的測量引文間的相似性。因此,有必要針對引文的不同部分使用不同的相似度計算方法。本文首先介紹了傳統相似度計算模型,然后在對引文各部分的特點進行深入分析后,提出了引文相似性測量模型,該模型能夠提高引文相似性測量的準確性。

參考文獻:

[1]H. Zhuge, Y. Sun, and J. Zhang, “Schema theory for semantic link network,” in Proc. Fourth Int. Conf. Semantics, Knowledge and Grid SKG 08, 2008, pp. 189-196.

[2]H. Zhuge, “Communities and emerging semantics in semantic link network: Discovery and learning,” IEEE Trans. Knowl. Data Eng., vol. 21, no. 6, pp. 785-799, 2009.

[3]侯海燕. 基于知識圖譜的科學計量學進展研究[博士學位論文].大連:大連理工大學,2006.

猜你喜歡
語義文本測量
語言與語義
把握四個“三” 測量變簡單
在808DA上文本顯示的改善
滑動摩擦力的測量和計算
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
滑動摩擦力的測量與計算
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
測量
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
認知范疇模糊與語義模糊
主站蜘蛛池模板: 国产香蕉国产精品偷在线观看| 大陆国产精品视频| 免费激情网址| 99热这里只有精品免费| 美女高潮全身流白浆福利区| 亚洲国产成人超福利久久精品| 亚洲日韩国产精品无码专区| 国产SUV精品一区二区6| 国产免费一级精品视频| 欧美精品另类| 国产精品美女在线| 国产日韩欧美在线播放| 麻豆精品久久久久久久99蜜桃| 欧美劲爆第一页| 91国内外精品自在线播放| 三区在线视频| 亚洲成a人片| 久久久久亚洲Av片无码观看| 国产福利免费视频| a亚洲天堂| 亚洲第一黄色网| 久久香蕉国产线| 国产成人AV综合久久| 亚洲国语自产一区第二页| 免费Aⅴ片在线观看蜜芽Tⅴ| 99九九成人免费视频精品| 国产区成人精品视频| 97久久人人超碰国产精品| 看你懂的巨臀中文字幕一区二区| 国产精品自在在线午夜| 欧美伊人色综合久久天天| 91精品专区国产盗摄| 亚洲经典在线中文字幕| 欧美黄色a| 色悠久久综合| 国产成人综合网| 欧美精品v欧洲精品| 欧亚日韩Av| 好紧太爽了视频免费无码| 精品91在线| 中文字幕波多野不卡一区| 国产成人免费| 国内精品手机在线观看视频| 国产产在线精品亚洲aavv| 无码内射在线| 国产免费网址| 亚洲成人黄色网址| 成人日韩精品| 亚洲色欲色欲www网| 一区二区日韩国产精久久| 国产精品久久久久久久久久98| 亚洲欧洲日韩国产综合在线二区| 高清久久精品亚洲日韩Av| 国产区网址| 制服无码网站| 国产永久无码观看在线| 日韩av手机在线| 亚洲AV人人澡人人双人| 看av免费毛片手机播放| 婷婷亚洲视频| 妇女自拍偷自拍亚洲精品| 色噜噜综合网| 国产精品永久不卡免费视频| 日韩国产欧美精品在线| 亚洲不卡无码av中文字幕| 91精品在线视频观看| 91综合色区亚洲熟妇p| 亚洲精品动漫| 国产精品久久国产精麻豆99网站| 一本大道东京热无码av| 欧美成人区| 毛片基地美国正在播放亚洲 | 欧美三级视频网站| 精品第一国产综合精品Aⅴ| 美女被操黄色视频网站| 在线观看的黄网| 69国产精品视频免费| 亚洲成a人片77777在线播放| 国产精品播放| 久久久久国产精品熟女影院| 天天综合色网| 女人av社区男人的天堂|