999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義規(guī)則的詞義消歧方法的研究

2017-03-28 09:40:54張婷婷遼寧錦州渤海大學信息科學與技術學院
數(shù)碼世界 2017年3期
關鍵詞:語義定義規(guī)則

張婷婷 遼寧錦州渤海大學信息科學與技術學院

基于語義規(guī)則的詞義消歧方法的研究

張婷婷 遼寧錦州渤海大學信息科學與技術學院

本文基于WordNet現(xiàn)存的詞義結構以及詞義對用的上下文語義關系,詞義消歧之后通過語義選擇完成消歧工作。本文最后使用Senseval-3中的全英文文段作為該算法的實驗測試集,詞義消歧算法使得測試集中的選擇多義詞最佳語義結果較好,本文的消歧方法經過與其他詞義消歧算法進行數(shù)據(jù)比對分析,能夠有效完成全英文文段單詞的詞義消歧任務。

WordNet 語義規(guī)則 多義詞 詞義消歧 Senseval-3

1 引言

WordNet作為最常用的英文知識庫,在WordNet知識庫中,在單詞與單詞之間、詞語與語義之間存在一定的關聯(lián)規(guī)則,它作為可以計算英文知識庫,在英文知識庫中將單詞或者詞語分為五大類:名詞或者短語(n)、動詞或者短語(v)、介詞或者短語、形容詞(adj)和副詞。WordNet知識庫中單詞與單詞之間的語義關系和詞匯關系。

2 詞義消歧算法

目前,存在多種比較優(yōu)秀的詞義消歧方法,詞義消歧方法優(yōu)先選擇基于知識結構的詞義消歧方法。釋義重疊法在文獻中是查找多義詞詞義重疊釋義,選擇重疊詞義數(shù)最多的幾個釋義作為多義詞具體語義。基于WordNet的語義關系對多義詞上下文的釋義進行擴展,針對多義詞的詞義消歧準確率由20.1%上升到35.2%。在文獻中提出基于語義相似度的五種詞義消歧方法,通過語義相似度的詞義消歧算法獲取消歧結果比較明顯,但是,獲取的詞匯分類數(shù)據(jù)非常有限,詞匯的分類數(shù)據(jù)受限必定會影響詞義消歧效果。文獻提出了基于WordNet構建語義關系圖實現(xiàn)多義詞的詞義消歧,在此文獻中提出基于無監(jiān)督的詞義消歧方法。

3 基于語義規(guī)則的詞義消歧方法

3.1 詞義消歧的語義規(guī)則

根據(jù)WordNet知識庫中多義詞的語義關系和詞的結構,再根據(jù)多義詞所在文段的前后的語境關系,判斷多義詞的詞性再選擇正確的語義關系,可以實現(xiàn)基于語義規(guī)則的詞義消歧方法。

3.1.1 語義關系中的謂詞定義

在WordNet英文知識庫中,在詞與詞之間、詞語與語義之間存在一定的規(guī)則,它是可計算英文知識庫,本文將給出單詞與單詞之間的語義關系定義,假定存在兩種互不相同的語義關系為X和Y,并且X和Y的語義關系不等價,X和Y的語義之間的關系包括下面幾種:

①部分與整體語義關系Part Of Whole(X,Y):存在X∈Y的語義關系,稱為語義X和Y是部分整體關系;

②全同語義關系Same Of Whole(X,Y):存在X=Y的語義關系,稱為語義X和Y是全同關系;

③并列語義關系And Of Whole(X,Y):當幾種語義關系完全獨立的關系,稱為語義X和Y是并列關系;

④繼承語義關系Extend Of Whole(X,Y):當幾種語義關系為子類繼承父類的屬性或者方法,稱為語義X和Y是繼承語義關系;

⑤相似語義關系Similarity Of Whole(X,Y):當幾種語義關系相似度值在[0-1.0]之間小數(shù)部分,稱為語義X和Y是相似的語義關系;

⑥屬性與值的語義關系Attribute Of Whole(X,Y):存在XY兩種語義關系屬性與鍵值一一對應的關系,稱為語義X和Y是屬性與值的語義關系;

⑦交叉語義關系Intersection Of Whole(X,Y):存在XY有共同數(shù)值,稱為語義X和Y是交叉的語義關系;

3.1.2 詞義消歧的語義規(guī)則定義

定義多義詞消歧的語義規(guī)則,根據(jù)本文提供詞義消歧的語義規(guī)則,詞義消需要將名詞、動詞、副詞、形容詞進行語義規(guī)則定義,假定存在多義詞Si,該多義詞的詞義消歧如下:

①名詞的詞義消歧的語義規(guī)則定義如下:

Part OF Whole(Si,Si(WordNet))→Si(w);Same Of Whole(Si,Si(WordNet))→Si(w);

Extend OF Whole(Si,Si(WordNet))→Si(w);Attribute OF Whole(Si,Si(WordNet))→Si(w);

②形容詞的詞義消歧需要定義的語義規(guī)則定義如下:

Attribute OF Whole(Si,Si(WordNet))→Si(w);Similarity OF Whole(Si,Si(WordNet))→Si(w);

③動詞的詞義消歧需要定義的語義規(guī)則定義如下:

Intersection OF Whole(Si,Si(WordNet))→Si(w);And Of Whole(Si,Si(WordNet))→Si(w);

其中,該多義詞的詞義消歧語義規(guī)則中,Si表示歧義詞,Si(WordNet)表示W(wǎng)ordNet中的對應的多種語義關系。

3.2 基于語義規(guī)則的詞義消歧方法描述

根據(jù)前文所述,該算法的具體思路是根據(jù)多義詞在WordNet知識庫中的語義關系,判斷該多義詞屬于哪種定義語義消岐規(guī)則,該算法描述的詞義消歧算法步驟如下所示:

①存在有限文檔數(shù)據(jù)集合,該文檔數(shù)據(jù)集合表示為D,對文檔數(shù)據(jù)集合D進行預處理操作;

②識別多義詞的詞性類別,判斷多義詞的詞義是否在WordNet中,如果存在唯一的一個詞性的語義,則直接返回該多義詞在WordNet中的語義,否則跳轉到4;

③多義詞的詞性消歧處理,詞性判斷為多義詞消歧的重要處理過程,詞性識別是下一步語義規(guī)則選擇的重要依據(jù),判斷該多義詞是否具有唯一的詞性,是否需要進行詞性標注操作,如果不需要跳轉到4;

④根據(jù)多義詞在本文中定義的語義規(guī)則和詞性規(guī)則進行判斷,將該語義關系定義語義消岐規(guī)則;

⑤確定屬于哪種語義規(guī)則進行語義判斷,根據(jù)該多義詞在本文段中的語境進行語義選擇,選擇符合語境的最佳語義,并輸出多義詞的語義。

3.3 本文算法的詞義消歧實現(xiàn)過程

結合上文的詞義消歧的步驟:算法A描述是如何獲取多義詞所在WordNet中的多種語義關系,算法B是如何根據(jù)已經定義的語義消歧規(guī)則。基于語義規(guī)則的詞義消歧方法的實現(xiàn)如下描述所示,其中算法A是獲取多義詞的詞性和在WordNet中關聯(lián)數(shù)據(jù)的偽代碼片段,其中:Wi表示在文段中第i個多義詞,pos表示該多義詞的詞性(名詞、動詞或者形容詞等),算法A的描述如下。

?

算法B將多義詞實現(xiàn)詞義消歧方法,算法中輸入?yún)?shù)為:Wi是多義詞,pos表示該詞的詞性,C表示該多義詞在WordNet中的語義關系,算法2的作用根據(jù)語義規(guī)則的進行詞義消歧,然后在WordNet中選擇符合語境多義詞的語義輸出。

?

4 實驗結果及分析

4.1 試驗測試數(shù)據(jù)

本文提出基于語義規(guī)則的詞義消歧方法的研究,本文詞義消歧數(shù)據(jù)集采用Senseval-3中全英文文段作為語義規(guī)則的詞義消歧算法的實驗測試集,實驗過程中識別文段中的多義詞,通過詞義消歧算法實驗結果數(shù)據(jù)進行比較分析結論。

4.2 試驗結果分析

在本文中使用的詞義消歧評價指標包括:覆蓋率C、準確率A和召回率R評估基于語義規(guī)則的詞義消歧算法性能,本文提出方法與其他的詞義消歧算法進行比較,表1不同算法實驗數(shù)據(jù)處理結果。

表1 不同算法實驗數(shù)據(jù)處理結果

由表1實驗消歧數(shù)據(jù)處理結果可知,不同算法實驗數(shù)據(jù)處理結果分析可見,通過表1的實驗數(shù)據(jù)比對結果很明顯,該算法在實驗數(shù)據(jù)集上測試的效果獲取的數(shù)據(jù)準確率有所提高。

5 結論與未來研究方向

針對于文章中出現(xiàn)的一詞多義現(xiàn)象很多,詞義模糊使得文章語義不清,對文章的理解造成困難。WordNet作為最常用的英文知識庫,在WordNet知識庫中,在詞與詞之間、詞語與語義之間存在一定的規(guī)則,它是可計算英文知識庫,通過上文的實驗結果驗證。

[1]王瑞琴,孔繁勝,潘俊.基于WordNet的無導詞義消歧方法[J].浙江大學學報(Journal of Zhejiang University (Engineering Science)),2010,44(4):1068-1073

[2]車超,知識自動獲取的詞義消歧義方法[D].博士學位論文,大連理工大學,2010

[3]S.Dongen.Graph clustering by flow simulation[D:Ph. D.].Utreeht,The Netherlands:Unlversity of Utrecht,2000

[4]J.Veonis.HyPerlex:lexical cartography for information retrieval[J].Computer Speeeh&Language,2004,18(3):223-252

猜你喜歡
語義定義規(guī)則
撐竿跳規(guī)則的制定
數(shù)獨的規(guī)則和演變
語言與語義
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
TPP反腐敗規(guī)則對我國的啟示
“上”與“下”語義的不對稱性及其認知闡釋
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
認知范疇模糊與語義模糊
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
山的定義
公務員文萃(2013年5期)2013-03-11 16:08:37
主站蜘蛛池模板: 亚洲av日韩综合一区尤物| 国产高清免费午夜在线视频| 99久视频| 日韩区欧美区| 午夜激情福利视频| 国产亚洲欧美日韩在线一区| 成人欧美日韩| 在线观看91精品国产剧情免费| 青草国产在线视频| 亚洲系列无码专区偷窥无码| 午夜免费视频网站| 91视频青青草| 无码免费视频| 亚洲日本在线免费观看| 国模私拍一区二区| 精品精品国产高清A毛片| 国产毛片高清一级国语| 无码久看视频| 女人18毛片一级毛片在线 | 好久久免费视频高清| 欧美日韩免费| 国产夜色视频| 国产精品.com| 香蕉在线视频网站| 高清国产va日韩亚洲免费午夜电影| 中文字幕色站| 国产老女人精品免费视频| 欧美日本激情| 国产丝袜无码精品| 久久久久亚洲精品成人网| 国产无码在线调教| 国产成人免费| 少妇高潮惨叫久久久久久| 久久久久久尹人网香蕉| 2024av在线无码中文最新| 四虎永久免费网站| 麻豆精品国产自产在线| 亚洲黄色片免费看| 日本国产在线| 伊人精品视频免费在线| 91啦中文字幕| 伊人色天堂| 亚洲精品动漫| 久久夜色精品| 欧美成人精品一级在线观看| 亚洲swag精品自拍一区| 国产肉感大码AV无码| 一级毛片免费的| 成人午夜免费观看| 午夜福利无码一区二区| 色国产视频| 亚洲精品无码高潮喷水A| 男女精品视频| 四虎国产永久在线观看| 日本亚洲欧美在线| 伊人久久大香线蕉综合影视| 国产理论一区| 国产精品久久久久久久久久98| 亚洲精品成人7777在线观看| 99精品视频在线观看免费播放| 国产一二三区在线| 国产精品片在线观看手机版| 国产丝袜第一页| 精品国产Ⅴ无码大片在线观看81| 毛片a级毛片免费观看免下载| 麻豆精品国产自产在线| 欧美五月婷婷| 在线无码九区| 亚洲av片在线免费观看| 亚洲欧美成人| 欧美亚洲国产精品第一页| 亚洲一区波多野结衣二区三区| 在线毛片网站| 第一区免费在线观看| 在线免费看片a| 人妻一本久道久久综合久久鬼色| 九九久久精品国产av片囯产区| 伊人婷婷色香五月综合缴缴情| 亚洲精品色AV无码看| 亚洲中文字幕97久久精品少妇| 97se亚洲| 国产成人三级|