999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

AI不會斷句?中文分詞新模型幫它進步

2021-04-28 00:42:40
中國科學探險 2021年1期
關鍵詞:句法模型

人工智能經常“看不懂”中文句子,讓人哭笑不得。在2020年7月舉行的自然語言處理領域(NLP)頂級學術會議ACL 2020上,來自創新工場大灣區人工智能研究院的兩篇論文入選。這兩篇論文均聚焦自然語言處理中文分詞領域。

據研究人員介紹,分詞及詞性標注是中文自然語言處理的基本任務,但當前沒有比較好的一體化解決方案,而且中文分詞普遍存在歧義和未登錄詞的難題。

基于此,兩篇論文各自提出了鍵-值記憶神經網絡的中文分詞模型和基于雙通道注意力機制的分詞及詞性標注模型,將外部知識(信息)融入分詞及詞性標注模型,剔除了分詞“噪音”誤導,提升了分詞及詞性標注效果。

中文分詞主要面臨歧義和未登錄詞兩大難點

據介紹,中文分詞的目的是在中文的字序列中插入分隔符,將其切分為詞。例如,“我喜歡音樂”將被切分為“我/喜歡/音樂”。

創新工場大灣區人工智能研究院執行院長宋彥分析,中文語言因其特殊性,在分詞時面臨著兩個普遍的主要難點。

一是歧義問題,由于中文存在大量歧義,一般的分詞工具在切分句子時可能會出錯。例如,“部分居民生活水平”,其正確的切分應為“部分/居民/生活/水平”,但存在“分居”“民生”等歧義詞。

二是未登錄詞問題。未登錄詞指的是不在詞表,或者是模型在訓練的過程中沒有遇見過的詞。這類問題在跨領域分詞任務中尤其明顯。宋彥介紹,這些未登錄詞,會非常影響分詞和詞性標注模型和系統的性能。

利用記憶神經網絡提升中文分詞性能

對此,其中一篇論文提出了基于鍵-值記憶神經網絡的中文分詞模型。

宋彥介紹,該模型利用n元組(即一個由連續n個字組成的序列,比如“居民”是一個2元組,“生活水平”是一個4元組)提供的每個字的構詞能力,通過加(降)權重實現特定語境下的歧義消解。并通過非監督方法構建詞表,實現對特定領域的未標注文本的利用,進而提升對未登錄詞的識別。

把可能成詞的組合全部找到以后,加入到該分詞模型中。然后通過神經網絡,學習哪些詞對于最后完整表達句意的幫助更大,進而分配不同的權重。例如,在“部分居民生活水平”這句話中,“部分”“居民”“生活”“水平”這些詞會被突出,而“分居”“民生”會被降權處理,從而預測出正確的結果。

據介紹,為了檢驗該模型的分詞效果,論文進行了嚴格的標準實驗和跨領域實驗。“我們在5個經常使用的標準中文分詞數據集(MSR、PKU、AS、CityU、CTB6)上面,都達到了最好的效果,在這五個數據集上的分數都刷到了歷史新高。” 宋彥說。

雙通道注意力機制剔除“噪音”誤導

第二篇論文則提出了一種基于雙通道注意力機制的分詞及詞性標注模型。

據介紹,中文分詞和詞性標注是兩個不同的任務。詞性標注是在已經切分好的文本中,給每一個詞標注其所屬的詞類,例如動詞、名詞、代詞、形容詞。詞性標注對后續的句子理解有重要的作用。

“‘他馬上功夫很好這句話,在使用外部的句法知識的時候,可能會存在‘馬上這個詞被分錯的情況。正確的結果應該是‘馬和‘上分開,但是這兒如果被分成一個詞,就會被識別為一個副詞。” 宋彥舉例說。

研究人員介紹,針對這一問題,該論文提出的模型將中文分詞和詞性標注視作聯合任務,可一體化完成。模型分別對自動獲取的上下文特征和句法知識加權,預測每個字的分詞和詞性標簽,不同的上下文特征和句法知識在各自所屬的注意力通道內進行比較、加權,從而識別特定語境下不同上下文特征和句法知識的貢獻。

為了測試該模型的性能,論文在一般領域和跨領域分別進行了實驗。宋彥介紹,一般領域實驗結果顯示,該模型在5個數據集(CTB5,CTB6,CTB7,CTB9,Universal Dependencies)的表現(F值)均超過前人的工作。

猜你喜歡
句法模型
一半模型
句法與句意(外一篇)
中華詩詞(2021年3期)2021-12-31 08:07:22
述謂結構與英語句法配置
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
句法二題
中華詩詞(2018年3期)2018-08-01 06:40:40
詩詞聯句句法梳理
中華詩詞(2018年11期)2018-03-26 06:41:32
3D打印中的模型分割與打包
疑問詞“怎么”句法功能的演變及其動因
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 99久久国产综合精品2020| 四虎永久在线| 毛片网站观看| 国产主播福利在线观看| 亚洲综合色婷婷| 五月激情婷婷综合| 欧美国产在线看| 国产一级α片| 无码AV动漫| 午夜小视频在线| 亚洲第一区在线| a级毛片一区二区免费视频| 欧美精品色视频| 国产欧美日韩在线在线不卡视频| 不卡视频国产| 欧美日韩在线亚洲国产人| 99视频全部免费| 中字无码精油按摩中出视频| 波多野结衣无码AV在线| 激情综合网址| 国产浮力第一页永久地址| 亚洲永久精品ww47国产| 日本欧美成人免费| 国产成人高清在线精品| 最新日韩AV网址在线观看| 国产白浆一区二区三区视频在线| 激情爆乳一区二区| 日本高清免费一本在线观看| 亚洲欧美另类中文字幕| 国产精品无码在线看| 丰满少妇αⅴ无码区| 老司国产精品视频91| 91人妻日韩人妻无码专区精品| 美女无遮挡免费视频网站| 欧美人人干| 欧美三級片黃色三級片黃色1| 91午夜福利在线观看精品| 欧美日韩国产在线播放| 亚洲天堂视频网站| 天堂岛国av无码免费无禁网站| 91无码视频在线观看| 亚洲视频三级| 国产一区二区三区免费观看| 国产真实乱人视频| 天天色天天操综合网| 69精品在线观看| 久久网欧美| 欧美精品高清| 国产99热| 亚洲国产综合精品一区| 国产综合日韩另类一区二区| 精品国产电影久久九九| 成人福利一区二区视频在线| 日韩国产高清无码| 国产成人做受免费视频| 最新亚洲人成无码网站欣赏网 | 欧美精品伊人久久| 无码中文字幕乱码免费2| 国产爽爽视频| 免费国产福利| 午夜一级做a爰片久久毛片| 国产XXXX做受性欧美88| 久久综合亚洲鲁鲁九月天| 久久精品国产精品青草app| 国产成人无码AV在线播放动漫| 精品伊人久久久久7777人| 欧美www在线观看| 第一区免费在线观看| 喷潮白浆直流在线播放| 成人在线天堂| 欧美亚洲激情| 一本大道无码高清| 91区国产福利在线观看午夜| 久久视精品| 日本三级欧美三级| 亚洲无码精彩视频在线观看| 亚洲愉拍一区二区精品| 狠狠色成人综合首页| 日本久久网站| 成人欧美在线观看| 老司机精品久久| 四虎在线观看视频高清无码|