999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

文本相似度計算方法發展

2018-03-21 15:41:47曾云澤
數字通信世界 2018年10期
關鍵詞:語義文本信息

曾云澤

(中國民航大學,天津 300300)

1 引言

在信息爆炸時代,人們迫切希望從海量信息中獲取與自身需要和興趣吻合度高的內容。為了滿足此需求,出現了多種應用,如搜索引擎、自動問答系統、文檔分類與聚類、文獻查重、文獻精準推送等,而這些應用場景的關鍵技術之一就是文本相似度計算技術[1]。例如給定兩個句子:“今天天氣很糟糕,已經開始下雨了。”、“今天風雨交加、電閃雷鳴。”,盡管兩個句子描述的都是今天天氣很糟糕,但是使用不同的句子相似度計算算法得出的結論會大相徑庭。下文將從傳統方法開始,詳細描述句子相似度計算技術的發展狀況。

2 基于詞匹配的方法

基于詞匹配的方法是自然語言處理任務中最經典、最直觀的方法。給定兩個存在多個用詞相同的文本,通過相同詞語的出現頻率來度量該兩個文本間的相似度。但是這種方法有個致命的缺點,如果兩個文本存在多個相似詞語但不存在多個相同詞語,則該方法計算的結果為這兩個文本不相似。這種方法不能正確理解到詞語的語義信息,例如“高興”進而“開心”語義上是相同的,但是用詞不同。因此為了解決這個問題,提出了基于分布式詞向量方法。

3 基于詞向量的方法

分布式詞向量的概念最早由Hinton提出,首先將每個詞映射為一個固定長度的向量,每個詞向量可以視為高緯詞向量空間的一個點,則詞匯間的相似性可以由向量間的距離進行度量[2]。通過word2vec中的CBOW和Skip-Gram模型[3],語義相似但用詞不同的詞語對應的詞向量距離非常相近,反之語義不相似的詞向量距離較遠。常用的向量距離度量方式有余弦相似度、歐幾里得距離、馬氏距離等。但是基于詞向量的方法也有其不足,例如“我購買不了這項服務”和“我要開通服務”,由于這兩個句子存在相似的詞語“購買”-“開通”,且存在相同用詞“服務”,因此基于詞向量的方法判斷這兩個句子相似度極高。但是這兩個句子明顯語義不同,造成這種荒謬的結果的原因在于該方法沒有結合兩個句子間的上下文信息,不同綜合考慮兩個句子的語言環境信息,為了解決這個問題,提出了神經網絡的方法。

4 基于神經網絡的方法

現在主流的神經網絡結構主要有卷積神經網絡CNN、循環神經網絡RNN[4]。基于神經網絡的方法最大的優點就是可以在考慮兩個文本之間的上下文信息,充分考慮在不同語言環境下,相同或相似用詞實際的語義信息[4]。例如上文提及的兩個句子:“今天天氣很糟糕,已經開始下雨了”、“今天風雨交加、電閃雷鳴”,使用基于神經網絡的方法,可以很容易地得到這兩個句子語義相同的結果。而且基于神經網絡的方法拓展性、泛化能力可以簡單地通過增加隱藏層的數量得到逐步提高,因此基于神經網絡的方法是現在文本相似度計算的主流研究方向。

猜你喜歡
語義文本信息
語言與語義
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
認知范疇模糊與語義模糊
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
主站蜘蛛池模板: 精品一区二区三区无码视频无码| 国产美女免费| 亚洲一级毛片免费看| 色哟哟国产精品| 手机永久AV在线播放| 婷婷六月激情综合一区| 亚欧成人无码AV在线播放| 中文字幕亚洲专区第19页| 一本色道久久88| 国产在线小视频| 一级看片免费视频| 亚洲中文精品人人永久免费| 亚洲日韩第九十九页| 国产日韩欧美在线视频免费观看| 97成人在线视频| www.精品国产| 国产欧美日韩18| 91在线一9|永久视频在线| 成年av福利永久免费观看| 欧美日韩国产在线人成app| 亚洲欧美日韩中文字幕一区二区三区 | 国产对白刺激真实精品91| 精品成人一区二区三区电影| 国产精品成人一区二区不卡| 亚洲精品va| 最新日韩AV网址在线观看| 国产精品私拍在线爆乳| 青青草一区| 露脸国产精品自产在线播| 久青草国产高清在线视频| 欧美日韩国产一级| 国产在线精品人成导航| 精品国产成人国产在线| 国产一级在线观看www色 | 国内精品视频区在线2021| 香蕉精品在线| 午夜精品福利影院| 欧美成人精品在线| 国产精品妖精视频| 四虎国产在线观看| …亚洲 欧洲 另类 春色| 国产精品一老牛影视频| 2021国产乱人伦在线播放| 特级毛片免费视频| 大香网伊人久久综合网2020| 91视频青青草| 欧亚日韩Av| 在线欧美a| 欧美va亚洲va香蕉在线| 91美女视频在线| 亚洲国产日韩一区| 国产91精品久久| 五月天综合网亚洲综合天堂网| 高清久久精品亚洲日韩Av| 欧美国产在线精品17p| 曰韩人妻一区二区三区| 国产中文一区二区苍井空| 久久频这里精品99香蕉久网址| 国产小视频a在线观看| 久久这里只有精品国产99| 最新亚洲人成网站在线观看| 日韩精品欧美国产在线| 国产91久久久久久| 国产黄在线观看| 国产第一页第二页| 免费国产小视频在线观看| 国产成人欧美| 久久五月天国产自| 丁香六月综合网| 欧美成人精品一区二区| 日韩成人在线视频| 女同国产精品一区二区| 欧美激情一区二区三区成人| 91在线激情在线观看| 天天做天天爱天天爽综合区| 99久久精品国产麻豆婷婷| 伊人久久综在合线亚洲2019| 亚洲精品爱草草视频在线| 91免费在线看| 99久久国产综合精品2020| аv天堂最新中文在线| 国产91在线免费视频|