999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于膠囊模型的短文本細粒度情感分類

2023-03-30 08:52:40
現代計算機 2023年2期
關鍵詞:語義分類文本

邵 輝

(廣東科學技術職業學院計算機工程技術學院,珠海 519090)

0 引言

情感分析(sentiment analysis)是指人們對各種服務、產品,包括其屬性的情感、評價和觀點等的分析研究,又被稱為觀點挖掘[1]。傳統的文本情感分析[2?4]重在對句子、文檔級別進行分析,得出文本中主要觀點所表達的情感傾向,通常分為積極、中立以及消極這三種。但互聯網普及之前,情感分析的相關研究成果很少,一是因為收集情感文本語料存在困難,很難獲取所需要的文本語料。二是文本處理、分析方法達不到應用要求。進入新世紀后,互聯網迎來爆發式增長,基于此,各種海量的文本信息在互聯網上不斷出現,特別是社交領域和電商平臺,促使情感分析研究快速發展。

在社交領域和電商平臺等,篇幅短小的短文本是互聯網用戶經常使用的。短文本文字有限,但往往包含明確的觀點,特別是在社交軟件中,更是經常出現帶有用戶直接偏好的短文本,這些都非常有利于情感分析領域的研究。當前,情感分析研究已經發展到涉及社會的方方面面,互聯網上每天都有無數的短文本產生,對短文本的情感分析工作可以讓政府掌握輿情,及時掌握社會大眾的訴求,以便于保證社會的穩定和諧;可以讓企業和單位了解用戶對服務和產品的意見,以便于做出更好的服務和產品。由此可見,短文本情感分析工作是十分有意義的。本文以短文本為研究對象,從目標級的情感分類角度提出了一種基于膠囊模型的方法。

1 相關研究

目標級的情感分類(aspect?based sentiment classification,ABSC)與情感分析(SA)不同[5],其重在發現文本中實體方面有關的情感。例如對于評論文本,就不同于以往對整句做出情感分析,而是根據句中不同的實體分別做出不同的情感分析,如此一個短文本評論就可能有多個情感極性。比如,“今天一位朋友請我們吃飯,飯菜的味道還可以,但是人太多了,我們等了很久才吃上,而且價格也不便宜。”從這個例子可以看出來,此評價帶有三個實體方面的情感傾向:一是餐廳的味道還可以,這是積極的情感傾向;二是等待的時間太久,這是負面的情感傾向;三是價格太貴,這也是消極的情感傾向。如果是情感分析(SA)任務,那就不會有這么多情感極性分析,可能就這個文檔或整句給出一個情感極性,那就會忽略其它包含在文檔或整句中的情感,只有目標級的情感分類才能做到更細粒度的要求。

目前ABSC 相關研究中,卷積神經網絡[6]、循環神經網絡[7]和循環自編碼模型[8]等神經網絡模型已經取得了很好的效果,但是目前存在數據集標注成本高昂、有時需要附加的語言知識輔助等問題。膠囊網絡出現后,對解決上述問題起到了很好的作用。膠囊網絡由一組神經元構成,是基于動態路由的結構[9]。膠囊利用動態路由算法完成參數互相傳遞,每個類別的語義由高層膠囊的輸出向量來表示;每個實體的實例化參數由激活向量來表示;每個情感極性的預測概率則由向量長度來表示。文本分類中應用膠囊網絡是Zhao 等[10]第一次實現,發現膠囊網絡不僅能保持靈活的表達能力,同時提高了編碼的有效性;Chen 等[11]提出了一種遷移膠囊網絡模型,用于將文檔級別的知識遷移到面向目標的情感分類。

在前面工作的基礎上,本文設計的膠囊模型第一利用BERT預訓練模型充分挖掘文本蘊含的情感語義信息,使模型具有更加豐富的情感語義表達;第二利用多頭注意力機制讓各類特征進行交互,抽象更深層次的上下文內部語義關聯;第三采用膠囊網絡生成最終的文本表征,從而實現了更好的短文本細粒度情感分類。

2 膠囊網絡模型

給定上下文嵌入[12],其由n個詞構成上下文序列s={w1,w2,…,wn}。再給定目標嵌入,其由k個目標構成目標序列,t={a1,a2,…,an},很顯然,a是s的一個子序列。由此本文的目標可以表示為pol=fpol(s,ai),其中fpol是非線性變換函數。本文設計的膠囊模型如圖1所示,分為詞嵌入層、特征提取層、注意力編碼層和膠囊層,共四層。

圖1 膠囊模型各層

在詞嵌入層使用BERT預訓練模型,將包含n個詞的上下文序列轉換成s={v1,v2,…,vn},其中vi表示上下文序列第i個詞的d維向量,句子的輸入詞向量矩陣則是S;同理,目標實例則轉換為T={vα,vα+1,…,vα+m-1},其包含m個詞,形成目標詞嵌入序列。其中vi表示目標實例第i個詞的d維向量。

在特征提取層,對于上下文序列形成的詞向量矩陣,其中的每個詞的依賴關系利用LSTM 進行建模,充分在BERT 預訓練模型的基礎上對隱含語義進行挖掘,得到隱藏狀態序列Lh={l1,l2,…,lk},形成上下文序列的高階特征;對于目標詞序列,其中屬性實例的各詞依賴關系也利用LSTM 進行建模,同理充分對隱含語義進行挖掘,得到隱藏狀態序列Th={t1,t2,…,tm},最后也形成目標詞序列的高階特征。

在注意力編碼層,上下文序列、目標詞序列均采用多頭注意力完成注意力編碼。多頭注意力機制可以簡單有效地對上下文依賴關系進行抽象,并捕獲句法和語義特征。本層繼續對上層輸入表示做進一步挖掘,并生成兩類輸出特征。

最后在膠囊層,對兩個多頭注意力的輸出Ok和Om進行封裝加工,最后轉換為矢量膠囊集合。膠囊網絡確定彼此關系是依據動態路由協議,利用反復迭代的方式直到收斂成功。在注意力編碼層,因其輸出只能表達局部特性,無法對句子級別進行全局語義表示,因此本層在水平方向對注意力編碼層的輸入采用全局最大池化進行壓縮,使得輸出特征在各子空間內聚合。同時利用squash 函數將膠囊向量的模長壓縮到1以內,用來表示該特征存在的概率。最后最終情感分類輸出層由多類膠囊構成,完成每個情感極性分類。

3 實驗

本文評測標準數據集采用semeval2014 的餐廳評論數據集,對于不同的目標實體,分成三類情感極性:積極,中性和消極。此數據集中有極少量數據標記為沖突,將其予以刪除。數據集的情況如表1所示。

表1 餐廳評論數據集 單位:個

本模型采用預訓練BERT,其維度設置為768。為保證性能,學習率設為2e-5,動態路由迭代次數設置為7,多頭注意力頭數設置為8。模型最后利用分類精度和F1值來評價模型性能,并同兩個基線模型RAM、TransCap 進行比較,結果如表2 所示。從表2 可知,膠囊模型的分類精度和F1值均高于RAM和TransCap。

表2 對比結果

4 結語

從實驗結果看,本文采用的膠囊模型,其網絡深度的有效增加提升了模型性能;采用預訓練模型BERT也提高了分類精度,并且對參數微調能可繼續提高模型性能;采用膠囊模型則不僅有效提高了分類精度,而且F1值也得到了不小的提升,這說明本文模型對短文本的細粒度情感分類是有效的。

猜你喜歡
語義分類文本
分類算一算
語言與語義
在808DA上文本顯示的改善
分類討論求坐標
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
數據分析中的分類討論
教你一招:數的分類
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
認知范疇模糊與語義模糊
主站蜘蛛池模板: 97久久超碰极品视觉盛宴| 在线国产91| 人妻丰满熟妇αv无码| 亚洲福利一区二区三区| 男人天堂伊人网| 亚洲一区二区三区麻豆| 亚洲综合欧美在线一区在线播放| 婷婷丁香色| 国产伦精品一区二区三区视频优播| 91日本在线观看亚洲精品| 国产在线视频导航| 91精品啪在线观看国产91| 天天色天天综合| www.youjizz.com久久| 国产一区二区三区在线无码| 久草网视频在线| 欧美日韩国产精品va| 国产成人AV男人的天堂| 婷婷久久综合九色综合88| 免费人成视频在线观看网站| 香蕉蕉亚亚洲aav综合| 无码内射在线| 国产成人精品18| 欧美第九页| 福利在线不卡| 国产91精品调教在线播放| 欧美不卡视频一区发布| 国产剧情国内精品原创| 国产精品亚洲专区一区| 欧美人与动牲交a欧美精品| 婷婷午夜影院| 亚洲嫩模喷白浆| 中国一级特黄视频| 波多野结衣久久高清免费| 国产凹凸一区在线观看视频| 日韩一区二区在线电影| 久久久久亚洲av成人网人人软件| 国产va在线观看| 国产主播在线一区| 青青草欧美| 国产精品成人免费视频99| 国模极品一区二区三区| 亚洲AⅤ综合在线欧美一区| 国产在线八区| 亚洲另类国产欧美一区二区| 亚洲愉拍一区二区精品| 试看120秒男女啪啪免费| 黄色网址免费在线| 日韩色图区| 欧美成人精品欧美一级乱黄| 精品1区2区3区| 欧美va亚洲va香蕉在线| 潮喷在线无码白浆| 97国产在线播放| 亚洲高清免费在线观看| 中美日韩在线网免费毛片视频| 亚洲精品成人片在线观看| 亚洲中文字幕无码mv| 在线视频亚洲欧美| 99在线视频免费观看| 青青草原国产av福利网站| 超碰免费91| 国产精品微拍| 在线视频97| 亚洲无码高清一区二区| 国产成人高清亚洲一区久久| 亚洲国产日韩欧美在线| 国产成人精品男人的天堂| 久久精品女人天堂aaa| 久久综合色视频| 国产一二三区视频| 亚洲人成电影在线播放| 国产自在线播放| 国产美女免费网站| 欧洲免费精品视频在线| 亚洲V日韩V无码一区二区| 欧美亚洲香蕉| 99视频在线观看免费| 国产av色站网站| 欧美精品v日韩精品v国产精品| 亚洲人在线| 无码日韩人妻精品久久蜜桃|