999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

自然語言處理綜述

2019-03-26 07:08:52
福建質量管理 2019年9期
關鍵詞:規則文本情感

(西南大學榮昌校區商貿學院 重慶 400000)

一、概述

自然語言處理(Natural Language Processing,NLP)是數據科學里的一個分支,它的主要覆蓋的內容是:以一種智能與高效的方式,對文本數據進行系統化分析、理解與信息提取的過程。通過使用NLP以及它的組件,我們可以管理非常大塊的文本數據,或者執行大量的自動化任務,并且解決各式各樣的問題,如自動摘要,機器翻譯,命名實體識別,關系提取,情感分析,語音識別,以及主題分割等等。

二、自然語言處理的應用

鑒于深度學習日漸成熟,它的無監督學習與深度挖掘深層次特征的能力使得自然語言處理能夠應用于實踐來解決現實問題。下面將從詞性標注,句法分析,情感分析,機器翻譯等幾個方面對近幾年的應用技術進行綜述。

(一)詞性標注

詞性標注(Part-of-Speech tagging 或POS tagging),又稱詞類標注或者簡稱標注,是指為分詞結果中的每個單詞標注一個正確的詞性的程序,也即確定每個詞是名詞、動詞、形容詞或其他詞性的過程。

2018年Elaheh S,Deyuan G等使用最先進的加速器,自動處理器和FPGA,提出了一種高效的POS標記方法,得出更多樣化的目標那幾和語料庫越大,POS標記的準確性就會越高,而增加規則的數量只會增加較小的計算開銷。

(二)句法分析

Cereda P R M,Miura N K2018年提出一種基于規則的自然語言句子改寫系統[1],利用一種主動技術對自然語言句子進行策略分析。將句子的依賴結構分解為一個語法樹。引入重寫系統和基于層次重寫的句法分析方法,將分析本身化成成若干抽象層次,以層次結構的方式處理。該方法較好地解決了句子的句法敏感性問題,減少了語言處理中相互依賴結構的可能性。同年,Faiza Qanber Ali通過實驗得出[2],對象是一個實體或參與者,它經歷了行為執行者所做的動作。從句法上講,阿拉伯語的賓語可以是同源的,使役的或伴隨的,而英語的并于可以是直接賓語,間接賓語或補語。這個結論在結合英語自然語言處理經驗中,促進了對阿拉伯語的自然語言處理的發展。

(三)情感分析

情感分析(Sentiment Analysis,SA)又稱傾向性分析。2018年,Ravishankar,N.,Shriram等提出了一個基于語法規則的推文情感分類的n-gram模型[3],并運用TF-IDF,否定規則和形容詞規則對情緒進行分類[9]。根據他們的報告結果,形容詞規則比TF-IDF和否定規則產生更好的準確率,高達64.72%。Leila Arras,Gregoire Montavon等提出一種特殊的傳播規則[4],將分層關聯傳播(LRP)的應用擴展到遞歸神經網絡。該項技術被實驗證明比之前流行的基于梯度的相關方法有更好的結果。

(四)機器翻譯

2017年,Melvin Johnson,Mike Schuster等與谷歌翻譯團隊合作提出了一種利用單神經機器翻譯(NMT)支持使用單一模型的多語言NMT系統[5]。該模型使用單編譯碼器來驗證真正多語言翻譯的使用,而將該模型投入生產的產品將是自然語言處理史上第一部論證零數據翻譯可能性的作品。同年,Zhaopeng Tu,Yang Liu等人在波束搜索策略中發現非常大的光束產生的效果更差[6],波束搜索中應存在一個最佳光束寬度的“最佳點”,認為進一步研究超參數在波束搜索中的魯棒性對NMT的研究具有重要意義。

三、問題與展望

(一)難點與問題

1.指代消歧

即句子中的指代詞還原,因為語料庫中的語料并不足夠,此外,盡管消歧問題被多方研究,但目前仍沒有較高正確率的模型。

2.二義性

有些句子,往往有多種理解方式,其中以兩種理解方式的最為常見,稱二義性。這涉及情感句模問題。而因為個體表達差異,所以語言表達的句子沒有規范的模型,也即情感句模庫即使已經包含大量句模仍不能保證句子斷句準確性。

3.OOV問題

隨著詞嵌入技術大熱后,使用預訓練的詞向量似乎成為了一個主流。但文本數據中的詞很可能不在預訓練好的詞表里面,此即OOV(out of vocabulary)。目前主流方法是要么當做UNK處理,要么生成隨機向量或零向量處理,當然都存在一定的弊端。更合理的是用subword和char-CNN。

4.文本生成的評價指標

目前文本生成的評價指標多用BLEU或者ROUGE,但這兩個指標都是基于n-gram的,也就是說會判斷生成的句子與標簽句子詞粒度上的相似度。這用在文本摘要和對話生成中會有很大的問題。

(二)中文自然語言處理問題

因為目前先進的,前沿的研究都是由國外學者領導主持,所以大多數自然語言處理的研究成果可以說是對英語的自然語言處理。對于國內而言,自然語言處理方面的研究沒有突破性地發展,而且存在研究數據不足,研究實力較國外學者還有較大差距問題,除此之外,我國是一個多民族國家,這就意味著我們不但要考慮到普通話的處理,還有少數民族的語言處理。

四、結束語

自然語言處理作為人機交互的關鍵性技術,雖然已經隨著深度學習的發展而得到飛躍進步,但這些進步幾乎都是以英語為處理對象。而中文比之英語,又將會有更多的新問題。因此中文自然語言處理的研究主力只可能是以中文為母語的國內學者。因此國內學者能否解決好中文自然語言處理中的實體歧義,情感分析,句模庫,語料庫等問題很大程度地決定了中文自然語言處理的研究進度快慢。

猜你喜歡
規則文本情感
撐竿跳規則的制定
數獨的規則和演變
如何在情感中自我成長,保持獨立
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨立
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 精久久久久无码区中文字幕| 色视频国产| 国产欧美成人不卡视频| 欧美一区二区三区不卡免费| 久久久精品国产亚洲AV日韩| 97国产精品视频自在拍| 亚洲男人的天堂久久香蕉网| 97久久免费视频| 99热亚洲精品6码| 波多野结衣视频一区二区| 99视频国产精品| 久久成人国产精品免费软件| 午夜色综合| 欧美日韩在线亚洲国产人| 在线播放91| 亚洲无线观看| 99在线免费播放| 日本影院一区| 久久精品人人做人人综合试看| 欧美五月婷婷| 狠狠色噜噜狠狠狠狠色综合久 | 一级爱做片免费观看久久 | 青青青国产免费线在| 亚洲精品无码日韩国产不卡| A级全黄试看30分钟小视频| 熟妇丰满人妻av无码区| 1769国产精品视频免费观看| 国产精品视频第一专区| 午夜毛片福利| 人与鲁专区| 国产乱视频网站| 人妻中文久热无码丝袜| 91亚洲精选| 白浆视频在线观看| 日韩区欧美国产区在线观看| 久久婷婷色综合老司机| 午夜福利在线观看成人| 欧美日本不卡| 高h视频在线| 久久国产精品影院| 在线观看亚洲天堂| 久久99蜜桃精品久久久久小说| 一级黄色片网| 亚洲三级影院| 欧美成人综合在线| 日韩A级毛片一区二区三区| 中文字幕天无码久久精品视频免费| 欧美激情视频在线观看一区| 日韩精品亚洲一区中文字幕| 18禁高潮出水呻吟娇喘蜜芽| 伊人精品视频免费在线| 亚洲成aⅴ人在线观看| 欧美色99| 国产大全韩国亚洲一区二区三区| 114级毛片免费观看| 青青青草国产| 亚洲V日韩V无码一区二区| 亚洲天堂免费在线视频| 亚洲69视频| 国产精品成人免费视频99| 91精品福利自产拍在线观看| 欧美天堂久久| 少妇精品在线| 婷婷综合缴情亚洲五月伊| 国产97视频在线| 亚洲中文字幕久久无码精品A| 国产h视频免费观看| 亚洲自拍另类| 久久无码av三级| 毛片在线播放网址| 国产嫩草在线观看| 奇米影视狠狠精品7777| 国产一区在线视频观看| 最新亚洲人成无码网站欣赏网| 国产色伊人| 99在线视频免费观看| 国内精品久久久久鸭| 国产十八禁在线观看免费| 美美女高清毛片视频免费观看| 婷婷综合在线观看丁香| 欧美一级夜夜爽www| 亚洲国产日韩在线观看|