999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

AI不會斷句?中文分詞新模型幫它進步

2021-04-28 00:42:40
中國科學探險 2021年1期
關鍵詞:句法模型

人工智能經常“看不懂”中文句子,讓人哭笑不得。在2020年7月舉行的自然語言處理領域(NLP)頂級學術會議ACL 2020上,來自創新工場大灣區人工智能研究院的兩篇論文入選。這兩篇論文均聚焦自然語言處理中文分詞領域。

據研究人員介紹,分詞及詞性標注是中文自然語言處理的基本任務,但當前沒有比較好的一體化解決方案,而且中文分詞普遍存在歧義和未登錄詞的難題。

基于此,兩篇論文各自提出了鍵-值記憶神經網絡的中文分詞模型和基于雙通道注意力機制的分詞及詞性標注模型,將外部知識(信息)融入分詞及詞性標注模型,剔除了分詞“噪音”誤導,提升了分詞及詞性標注效果。

中文分詞主要面臨歧義和未登錄詞兩大難點

據介紹,中文分詞的目的是在中文的字序列中插入分隔符,將其切分為詞。例如,“我喜歡音樂”將被切分為“我/喜歡/音樂”。

創新工場大灣區人工智能研究院執行院長宋彥分析,中文語言因其特殊性,在分詞時面臨著兩個普遍的主要難點。

一是歧義問題,由于中文存在大量歧義,一般的分詞工具在切分句子時可能會出錯。例如,“部分居民生活水平”,其正確的切分應為“部分/居民/生活/水平”,但存在“分居”“民生”等歧義詞。

二是未登錄詞問題。未登錄詞指的是不在詞表,或者是模型在訓練的過程中沒有遇見過的詞。這類問題在跨領域分詞任務中尤其明顯。宋彥介紹,這些未登錄詞,會非常影響分詞和詞性標注模型和系統的性能。

利用記憶神經網絡提升中文分詞性能

對此,其中一篇論文提出了基于鍵-值記憶神經網絡的中文分詞模型。

宋彥介紹,該模型利用n元組(即一個由連續n個字組成的序列,比如“居民”是一個2元組,“生活水平”是一個4元組)提供的每個字的構詞能力,通過加(降)權重實現特定語境下的歧義消解。并通過非監督方法構建詞表,實現對特定領域的未標注文本的利用,進而提升對未登錄詞的識別。

把可能成詞的組合全部找到以后,加入到該分詞模型中。然后通過神經網絡,學習哪些詞對于最后完整表達句意的幫助更大,進而分配不同的權重。例如,在“部分居民生活水平”這句話中,“部分”“居民”“生活”“水平”這些詞會被突出,而“分居”“民生”會被降權處理,從而預測出正確的結果。

據介紹,為了檢驗該模型的分詞效果,論文進行了嚴格的標準實驗和跨領域實驗。“我們在5個經常使用的標準中文分詞數據集(MSR、PKU、AS、CityU、CTB6)上面,都達到了最好的效果,在這五個數據集上的分數都刷到了歷史新高。” 宋彥說。

雙通道注意力機制剔除“噪音”誤導

第二篇論文則提出了一種基于雙通道注意力機制的分詞及詞性標注模型。

據介紹,中文分詞和詞性標注是兩個不同的任務。詞性標注是在已經切分好的文本中,給每一個詞標注其所屬的詞類,例如動詞、名詞、代詞、形容詞。詞性標注對后續的句子理解有重要的作用。

“‘他馬上功夫很好這句話,在使用外部的句法知識的時候,可能會存在‘馬上這個詞被分錯的情況。正確的結果應該是‘馬和‘上分開,但是這兒如果被分成一個詞,就會被識別為一個副詞。” 宋彥舉例說。

研究人員介紹,針對這一問題,該論文提出的模型將中文分詞和詞性標注視作聯合任務,可一體化完成。模型分別對自動獲取的上下文特征和句法知識加權,預測每個字的分詞和詞性標簽,不同的上下文特征和句法知識在各自所屬的注意力通道內進行比較、加權,從而識別特定語境下不同上下文特征和句法知識的貢獻。

為了測試該模型的性能,論文在一般領域和跨領域分別進行了實驗。宋彥介紹,一般領域實驗結果顯示,該模型在5個數據集(CTB5,CTB6,CTB7,CTB9,Universal Dependencies)的表現(F值)均超過前人的工作。

猜你喜歡
句法模型
一半模型
句法與句意(外一篇)
中華詩詞(2021年3期)2021-12-31 08:07:22
述謂結構與英語句法配置
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
句法二題
中華詩詞(2018年3期)2018-08-01 06:40:40
詩詞聯句句法梳理
中華詩詞(2018年11期)2018-03-26 06:41:32
3D打印中的模型分割與打包
疑問詞“怎么”句法功能的演變及其動因
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产色婷婷| 熟妇丰满人妻| 美女一区二区在线观看| 国产综合另类小说色区色噜噜| 欧美一区日韩一区中文字幕页| 中文字幕久久亚洲一区| 国产一区二区免费播放| 免费高清a毛片| 色综合久久无码网| 国产午夜福利在线小视频| 99在线视频精品| 国产精品视频观看裸模| 蜜桃臀无码内射一区二区三区| 国内精品91| 午夜在线不卡| 人人91人人澡人人妻人人爽| 亚洲黄色成人| 欧美精品xx| 国产精品密蕾丝视频| 日韩av无码DVD| 国产乱人伦AV在线A| 日本午夜网站| 欧美人与牲动交a欧美精品 | 国产黑丝一区| 99国产在线视频| 国产女人在线| 国产手机在线ΑⅤ片无码观看| 国内精品久久久久鸭| 日本在线免费网站| 国产毛片基地| 国产成人亚洲精品无码电影| 国产成人精品日本亚洲77美色| 欧美怡红院视频一区二区三区| 久久综合亚洲鲁鲁九月天| 国产成人亚洲无码淙合青草| 国产精品女同一区三区五区| 思思99思思久久最新精品| 97无码免费人妻超级碰碰碰| 国产无码高清视频不卡| 欧美在线网| 国产精品成人啪精品视频| 波多野一区| 亚洲午夜国产片在线观看| 日韩少妇激情一区二区| 免费观看精品视频999| 亚洲swag精品自拍一区| 欧美成人a∨视频免费观看| 久久国产高潮流白浆免费观看| 亚洲精品人成网线在线| 精品撒尿视频一区二区三区| 欧美福利在线| 久久黄色免费电影| 日本欧美精品| 999精品色在线观看| 精品一區二區久久久久久久網站| 色妺妺在线视频喷水| 福利一区在线| a级毛片一区二区免费视频| 欧美在线观看不卡| 中文字幕在线不卡视频| 国产成本人片免费a∨短片| 国产精品自拍露脸视频| 久久精品电影| 香蕉久人久人青草青草| 成色7777精品在线| 婷婷六月综合网| 亚洲av日韩综合一区尤物| 欧美精品综合视频一区二区| 手机永久AV在线播放| 国产不卡网| 福利一区三区| 欧美一级大片在线观看| 中文字幕1区2区| 国产成人无码Av在线播放无广告| 国产噜噜在线视频观看| 国产性生大片免费观看性欧美| 亚洲一区二区精品无码久久久| 欧美视频免费一区二区三区| a毛片在线免费观看| 又黄又湿又爽的视频| 人人妻人人澡人人爽欧美一区| 亚洲精品视频免费观看|