999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文本的情感分析方法論述*

2023-01-03 13:36:32魏嵬孫雪松李林峰張云翔西安理工大學計算機科學與工程學院陜西省網絡計算與安全技術重點實驗室中博聯智庫深圳科技有限公司
數字技術與應用 2022年12期
關鍵詞:分類深度文本

魏嵬 孫雪松 李林峰 張云翔 1.西安理工大學計算機科學與工程學院;2.陜西省網絡計算與安全技術重點實驗室;.中博聯智庫(深圳)科技有限公司

情感分類是情感計算的一部分,從文本數據中分析情緒有助于多領域的發展。本文系統的綜述了文本情感分析的發展現狀和新興方向,深入梳理了文本情感分析的基于情感詞典的方法、基于機器學習的方法和基于深度學習的方法,并且進行了國內外研究進展的分別論述和分析。應積極推動深度學習的研究方法,結合傳統方法,并深入研究文本情感多分類、細粒度情感分析以及情感強度分析是未來的研究趨勢。

文本情感分析是自然語言處理的主要研究內容,主要應用于用戶情感信息獲取、輿情控制、產品推薦等方面。機器在獲取到一條文本信息后進行情感分析,給出具體的情感標簽,基于這種“讀懂”感情的條件下,做出一系列的反應,達到情感分析效果。就情感分類來看,情感分析任務分為3種:二分類問題、三分類問題以及多分類問題。目前大多數項目都專注于三分類問題的分析[1]。

本文將從文本情感分析的傳統研究方法和深度學習研究方法兩個研究方法進行綜述。其中,傳統研究方法有涉及基于詞典的方法、基于機器學習的方法。深度學習方法涉及多個神經網絡模型方法。文章內容框架如圖1所示。下面分別從這兩方面對文本情感分析進行介紹[2]。

圖1 本文內容框架Fig.1 Content framework of this paper

1 國內研究現狀

1.1 基于詞典的研究方法

利用情感詞典的情感分析是運用現有的情感詞典、情感常識庫等第三方情感資源,基于情感詞典的情感分類關注文本中的情感詞、程度副詞、否定詞之間的關聯[3]。其中情感詞分為積極情感詞和消極情感詞,可以用于情感二分類和情感三分類研究實驗。基于情感詞典的情感分類方法無法識別網絡爆梗“yyds”“你是我的神”等詞語,因此情感詞典需要不斷地進行人為擴充,費時費力。另一方面情感詞典中的同一個情感詞在不同語句可能表達不同的含義。而且在分類時,往往考慮不到上下文的語義關系,因此情感詞典在跨域和跨語言中的效果不是很理想。具體如圖2所示。

圖2 基于詞典和文本分類的情感分析算法流程圖Fig.2 Flowchart of sentiment analysis algorithm based on dictionary and text classification

1.2 基于機器學習的研究方法

機器學習是一種通過給定的數據研究算法的學科,基于算法和數據構建模型,最終進行結果預測。機器學習可以分為3類:有監督、半監督和無監督的方法。在有監督方法中,通過給定帶有情緒極性的樣本集,可以分類得到不同的情感類別。有監督的方法對數據樣本的依賴程度較高,對數據樣本進行一定的處理,然后對數據的分類進行人工標記。在半監督方法中,通過對未標記的文本進行特征提取可以有效地改善文本情感分類結果,這種方法可以有效解決帶有標記的數據集稀缺的問題。在無監督方法中,根據文本間的相似性對未標記的文本進行分類,這種方法在情感分析中使用較少[4]。

1.3 基于深度學習的研究方法

基于深度學習的情感分析方法是使用神經網絡來進行的,從輸入層獲取數據特征,然后經過層層的神經網絡隱藏層的加權計算,最終得到輸出層結果。隨著計算機硬件的發展,2018年由GoogleAI研究院推出的預訓練模型BERT模型。BERT的本質上是通過在海量的語料的基礎上運行自監督學習方法為單詞學習提供一個好的特征表示,供其他任務遷移學習的模型,該模型可以根據任務微調或者固定之后作為特征提取器[5]。BERT的網絡架構使用的是多層Transformer結構,有效的解決了NLP中棘手的長期依賴問題,BERT還使用更強大的機器訓練更大規模的數據,使BERT的結果達到了全新的高度,并且Google開源了訓練好的多語言BERT模型代碼,用戶可以直接使用BERT作為Word2Vec的轉換矩陣并高效地將其應用到自己的任務中,如圖3所示為BERT模型結構。

圖3 Bert模型框架Fig.3 Bert model framework

深度學習模型循環神經網絡模型(RNN)正是在原有的基礎上,加入了自注意力機制,變成了長短記憶神經網絡模型(LSTM),解決了RNN容易產生梯度消失和梯度爆炸的缺陷,如圖4所示是RNN的結構圖。自此,自注意力機制也被廣泛應用于其他神經網絡模型當中。

圖4 RNN結構圖Fig.4 RNN structure diagram

2 國外研究現狀

2.1 基于詞典的研究方法

國外因為發展的較早,基于詞典的研究方法更加成熟,所以近些年來在基于詞典的方法研究相較于機器學習和深度學習的方法較少。例如,Haripriya等人提出了一個熱門事件的情緒分析模型,從抓取熱門話題,再到選擇話題、收集推文、數據處理,然后通過情感詞典進行分析,最后獲取結果。Rajib等人通過與機器學習分類器比較,可以看出他們系統的效率和性能都好很多,這得益于他們自己建立的情感詞詞典[6]。但是詞典不進行定期的擴充整理,那么它的效果還是會逐漸下降。

2.2 基于機器學習的研究方法

K.S等人提出了文本表示、詞頻逆文檔頻率、Keras嵌入以及用于情感分類的機器學習和深度學習算法。其中,當隨著特征的增加而以有限的數量獲取特征時,基于Logistic和支持向量機(SVM)機器學習的方法表現良好[7]。Shivangi等人針對多類文本情感分類問題提出了一種基于集成分類器的方法。該集成是使用4個不同的分類器創建的,包括樸素貝葉斯、多類 SVM、邏輯回歸和SGD在Bagging、Boosting和Voting三種算法下,以構成一個結合了基分類器優點的有前途的模型[8]。實驗設計是將數據通過情感分類算法進行處理,然后放入訓練集和測試集,再經過4種分類器和3種算法進行分類,最后進行結果比較。最終證明了集成學習方法提供了相當大的性能提升,因此在情緒分類研究中具有潛在的適用性。

2.3 基于深度學習的研究方法

Mounika等人研究了基于深度學習的長短期記憶機制在文本情感識別中的有效性。該研究是在具有6個情緒組的“情緒分類”數據集上進行的。實驗結果證明,與現有的學習方法相比,基于LSTM的文本情感分類提供了相對更高的準確度[9]。Mansur研究了三種不同的深度學習架構,包括人工神經網絡(ANN)、卷積神經網絡(CNN)和具有長短期記憶(LSTM)的循環神經網絡(RNN)。其中ANN對情緒的結果判斷中效果最差,而CNN是最好的。

基于文本的情感識別是情感識別專注于從文本中提取細粒度的情感,識別合適的嵌入技術以提取長期依賴文本和文本序列并行處理之間的關系的挑戰長期以來一直阻礙著獲得最先進結果的步伐。來自Transformers (BERT)的雙向編碼器表示在文本分類等下游任務中取得了顯著成果,為解決這些限制提供了突破。Achea等人分析了BERT、RoBERTa、DistilBERT和XLNet預訓練的Transformer模型在識別文本情感方面的功效。準確率、召回率和F1分數進一步證明了RoBERTa在識別ISEAR數據集上的情緒方面優于其他候選模型的功效[10]。

3 國內外研究分析

目前國內外都有學者運用基于詞典方法為機器學習或深度學習方法作為鋪墊,提供數據預處理等階段的工作。大部分學者現在都選擇運用機器學習和深度學習的方法來進行實驗研究,這對于文本情感分析的發展更加有利有效。但是相較于國外,國內在文本情感分析這一塊的研究還是較少,且多數的訓練集還停留在二分類、三分類階段,對于情感的多分類和細粒度判斷上,所做的工作還是少之又少,國內大部分還是基于已有的模型和算法進行改進和完善,并未取得實質性和創新性的突破。

4 相關數據集介紹

基于語義計算的情感詞構建,核心是如何構建基礎情感詞,然后由目標詞與這些基礎情感詞做語義相似度計算。情感詞典需要人工為其進行精細的標注,國內一般可以使用的公開數據集有知網(HowNet)、臺灣大學 NTUSD、大連理工大學的中文情感詞匯本體庫等。知網(HowNet)中有12個文件,分為中文英文的語料各6個,分別從程度級別詞語、負面評價詞語、負面情感詞語、正面評價詞語、正面情感詞語和主張詞語進行歸納整理,其數據集內容示例如圖5所示。

圖5 知網(HowNet)數據集Fig.5 HowNet dataset

知網(HowNet)數據集收錄豐富但無法滿足對文本情感分類的眾多任務要求。該資源從不同角度描述一個中文詞匯或者短語,包括詞語詞性種類、情感類別、情感強度及極性等信息,如表1所示。其中,一個情感詞可能對應多個情感,情感分類用于刻畫情感詞的主要情感分類,輔助情感為該情感詞在具有主要情感分類的同時含有的其他情感分類。情感分類按照論文《情感詞匯本體的構造》所述,情感分為7大類21小類。情感強度分為1,3,5,7,9五檔,9表示強度最大,1為強度最小。中文情感本體以Excel的格式進行存儲,含有情感詞共計27466個。

表1 情感詞匯本體格式舉例Tab.1 Examples of emotional vocabulary ontology format

5 結語

本文系統綜述了文本情感分析的發展現狀,針對當前的研究進展現狀提出展望:將文本情感分析技術以情緒解析為核心,明確以讓機器讀懂文字為目標,擴大基

…………于深度學習的研究方法在大數據時代下的優勢,充分發揮豐富的網絡數據和模型自我學習、遷移學習的能力。未來可以從文本情感分析的情感多分類問題、細粒度情感分析以及情感強度分析等領域繼續探索。

引用

[1]紀佳昕.基于詞典的微博評論情感分析研究[J].信息與電腦(理論版),2021,33(11):33-35.

[2]尚永敏,趙榆琴.基于機器學習的在線評論情感分析與實現[J].大理大學學報,2021,6(12):80-86.

[3]戚天梅,過弋,王吉祥,等.基于機器學習的外匯新聞情感分析[J].計算機工程與設計,2020,41(6):1742-1748.

[4]JIN X F,XU Y.Research on the Sentiment Analysis Based on Machine Learning and Feature Extraction Algorithm[C]//2019 IEEE 10th International Conference on Software Engineering and Service Science (ICSESS),2019:366-369.

[5]CHEN Y L,ZHANG Z.Research on Text Sentiment Analysis Based on CNNs and SVM[C]//2018 13th IEEE Conference on Industrial Electronics and Applications (ICIEA),2018:2731-2734.

[6]趙虹杰.中文情感詞匯本體的擴充及應用[D].大連:大連理工大學,2016.

[7]DEY R C,SARKER O.Sentiment Analysis on Bengali Text using Lexicon Based Approach[C]//2019 22nd International Conference on Computer and Information Technology (ICCIT), 2019:1-5.

[8]KARNA M,JULIET D S,JOY R C.Deep learning based Text Emotion Recognition for Chatbot applications[C]//2020 4th International Conference on Trends in Electronics and Informatics (ICOEI)(48184),2020:988-993.

[9]DENG S Y,SINHA A P,ZHAO H M.Adapting Sentiment Lexicons to Domain-Specific Social Media Texts[J].Decision Support Systems, 2017,94:65-76.

[10]HARIPRIYA A,KUMARI S.Real Time Analysis of Top Trending Event on Twitter:Lexicon Based Approach[C]//2017 8th International Conference on Computing,Communication and Networking Technologies (ICCCNT),2017:1-4.

猜你喜歡
分類深度文本
分類算一算
深度理解一元一次方程
在808DA上文本顯示的改善
分類討論求坐標
深度觀察
深度觀察
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
深度觀察
數據分析中的分類討論
教你一招:數的分類
主站蜘蛛池模板: 亚洲天堂首页| 久久免费精品琪琪| 久久久91人妻无码精品蜜桃HD| 热伊人99re久久精品最新地| 日本草草视频在线观看| 日本三区视频| 香蕉eeww99国产精选播放| 国产美女视频黄a视频全免费网站| 白浆视频在线观看| 亚洲成人在线免费| 久久国产精品影院| 亚洲无码免费黄色网址| 国产在线精品香蕉麻豆| 日韩第九页| 欧美啪啪一区| 国产精品私拍99pans大尺度| 日韩在线视频网| 国产精品私拍在线爆乳| 国产精品永久不卡免费视频| 54pao国产成人免费视频 | 亚洲欧洲免费视频| 国产成人成人一区二区| 在线色国产| www亚洲天堂| 99热这里只有精品免费| www精品久久| 婷婷色在线视频| 日日碰狠狠添天天爽| 亚洲精品无码专区在线观看| 久久精品免费国产大片| 国产乱视频网站| 动漫精品啪啪一区二区三区| 国产免费观看av大片的网站| 91丨九色丨首页在线播放| 曰AV在线无码| 无码福利视频| 色综合天天综合| 在线视频一区二区三区不卡| 国产精品毛片一区视频播 | 国产sm重味一区二区三区| 亚洲无码视频一区二区三区| 亚洲国产一区在线观看| 欧美成人国产| 亚洲欧美不卡中文字幕| 亚洲高清国产拍精品26u| 青草91视频免费观看| 黄色免费在线网址| 手机精品视频在线观看免费| 青草国产在线视频| 黄色一级视频欧美| 国产成人精品视频一区二区电影 | 激情无码字幕综合| 日本一区二区三区精品视频| 亚州AV秘 一区二区三区| 色香蕉影院| 精品福利视频导航| 国产91av在线| 麻豆国产原创视频在线播放 | 国产精品内射视频| 亚洲欧美激情另类| 亚洲欧美成人| 亚洲欧洲自拍拍偷午夜色| 在线播放精品一区二区啪视频| 欧美一区二区三区欧美日韩亚洲| 色偷偷一区二区三区| 无码专区第一页| 久久亚洲国产视频| 亚洲人成亚洲精品| 在线不卡免费视频| 免费毛片全部不收费的| 欧美性天天| 在线观看国产精美视频| 欧美精品色视频| 亚洲91在线精品| 国产91特黄特色A级毛片| 99re经典视频在线| 免费黄色国产视频| 都市激情亚洲综合久久| 欧美日韩国产在线人成app| 国产成人精品在线1区| 国产男女免费视频| 国产喷水视频|