999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CsBiLSTM的中文影評情感分析

2023-04-06 14:04:10趙賽仙張元琴周順江覃勇孫大旭龔維印
電腦知識與技術 2023年5期

趙賽仙 張元琴 周順江 覃勇 孫大旭 龔維印

關鍵詞:CBiLSTM;影評;情感分析

近年來,隨著多媒體技術的飛速發展和智能設備的普及,每天都會產生源源不斷的互聯網數據,很多用戶會在社交平臺上發布大量的影視作品評論[1-2]。比如購物評價、QQ音樂、短視頻評論等。許多帶有用戶情感的文本將作為研究用戶情感、立場和觀點的依據?,F在很多用戶一邊觀看一邊進行綜合評分,一些用戶在影視下方發出的評論常常被忽略,這種現象達不到一個很好的參考價值。影視投資人不僅要知道用戶評價的情感走向,還應當將用戶的情感變化和諸多影響用戶評價的因素考慮到其中[3]。

情感分析旨在對帶有情感色彩的主觀性文本進行分析、處理、歸納、推理的過程,其常應用于消費決策、輿情分析、電子商務等領域,具有較高的商業應用價值[4]。本文由情感分類算法為切入點介紹了當前流行的情感分析方法,進而提出了基于CsBiLSTM的情感分類方法。采用情感分析方法,可以通過主觀描述來自動判斷自然語言文本的積極和消極的情緒傾向,并得出相應的結論。

1 相關工作

1.1 數據預處理

首先通過爬蟲技術獲取實驗數據;然后獲取數據中的星級和具體的評論內容,將三星級的內容去除,將一、二星級標注為-1,四、五星級標注為1作為實驗數據的標簽;最后利用正則表達式去除評論中存在的西文字體,再采用Jieba分詞工具進行分詞處理。

1.2 詞嵌入向量

文本信息無法直接輸入進行特征提取,需要將文本轉換為具體的向量進行表示,從而方便計算機的處理[5]。早期使用的one-hot編碼方式中,詞與詞之間相互獨立,忽略了詞與詞之間的邏輯性以及無法區分詞的相似性。為了較好地克服傳統詞向量存的不足,本文使用分布式進行連續性表示,將文本中的詞從高維空間映射到低維空間。本文詞向量使用Word2Vec訓練詞向量。

開源詞向量工具包Word2Vec于2013被Google推出[6]。Mikolov團隊因神經網絡模型采用兩個非線性變換,網絡參數較多,訓練速度延遲且不利用于大語料的特點而簡化了它,并實現了Word2Vec詞向量模型。它具有簡易、卓效的優點,從而十分適用于從龐大及巨型語料中獲取高精度的詞向量表示。Word2Vec 主要包含CBOW 和Skip-gram 組成[7],具體如圖1所示。

CBOW模型用一個隱層預測中心詞t,即通過中心詞附近的n 個詞預測中心詞t的概率。如“我”“很”“喜歡”“這部”“電影”,就是通過周圍詞“我”“很”“這部”“電影”預測中心詞“喜歡”;Skip-gram模型用一個隱含層預測周圍詞,即通過中心詞t預測周圍n 個詞的概率,如“這部”“電影”“演員”“演技”“不行”,就是通過中心詞“演員”預測周圍詞“這部”“電影”“演技”“不行”。本文使用Skip-gram模型訓練維度為50的詞向量。

2 模型介紹

本文的實驗模型包括輸入層、嵌入層、卷積神經網絡、雙向長短期記憶網絡、K-最近鄰,具體的模型如圖2所示。

2.1 卷積神經網絡

卷積神經網絡主要用于圖像識別、語音識別、自然語言處理等領域[8]。Kim于2014年首次將卷積神經網絡用于自然語言處理[9]。卷積神經網絡(Convolu?tional Neural Network,CNN) 是具有深度結構的前饋神經網絡,主要包括卷積計算,其網絡模型基本結構有輸入層、卷積層、池化層、全連接層和輸出層[10]。CNN模型的架構圖如圖3所示。

輸入層:在圖像處理領域,為0~255之間具體的像素。在本文中將句子或者文本表示成向量矩陣。

卷積層:通過局部連接和權值共享完成卷積運算。在深度神經網絡中,卷積層中每個單元都有一個獨立的權值,因此需要對整個網絡進行控制以實現最優的網絡結構。本文通過不同尺寸的卷積核進行卷積,提取輸入數據中深層次的特征。

池化層:主要對卷積層輸出的結果進一步提取特征,在保留最大特征的同時,降低特征的維度。

全連接層:主要根據概率值對所提取的特征進行分類,然后輸出最終的情感分析結果。

2.2 LSTM 和BiLSTM

LSTM 是循環神經網絡的變形。循環神經網絡(Recurrent Neural Network,RNN) 對具有序列特性的數據非常有效,能夠挖掘數據中的時序信息以及語義信息,能夠利用之前的信息影響后面信息的輸出,但是RNN 存在無法記憶長距離的信息、梯度消失等問題[11]。為解決以上問題,在RNN基礎上添加了“門控裝置”,即輸入門、遺忘門和輸出門,形成LSTM。

為進一步充分利用上下文的內容,將具有正向序列學習特征的LSTM模型進行變形,通過正反向序列提取上下文信息,綜合考慮上下文內容,得到雙向長短期記憶網絡模型BiLSTM,由此判斷每個樣本評論的情感傾向[12],具體如圖4所示。

BiLSTM模型具體的學習流程如下:

1) xt - 1,xt,xt + 1 是輸入的具體的詞,經過詞嵌入將輸入的詞轉換為固定維度的詞向量。

2) 輸入的詞經過詞嵌入后轉換為固定維度的詞向量,然后輸入BiLSTM模型,經過正向傳播和反向傳播訓練得到詞向量,將正向傳播獲取的特征和反向傳播獲取的特征進行融合,有效地提取數據的特征。

3) 將獲取的數據特征通過分類器進行預測分類,判斷影評數據的情感傾向,即該影評的情感是積極還是消極。

3 實驗方案和結果

3.1 實驗數據

本文通過網絡爬蟲技術獲取豆瓣網站共計50部電影影評作為實驗數據,經過處理共獲取影評數據共3萬條,其中訓練數據2.4萬條,測試數據0.6萬條。按照星級將實驗數據歸為積極和消極兩類,積極類用1表示,消極類用-1表示。

3.2 評價指標

本實驗評價分類結果的好壞用準確率(Accu?racy) 、精確率、召回率和F1 作為指標。Positive表示積極評論,Negative表示消極評論,影評分析混淆矩陣如表1所示。

其中,準確率表示影評分析中被分對的樣本與所有樣本的數的比;精確率表示影評分析中被識別為積極類的樣本中,確實為積極類別的比例;召回率表示在所有積極類別樣本中,被正確識別為積極類別的比例;F1表示通過精確率和召回率對影評的綜合分析。

3.3 實驗設置

本實驗在Windows10上,使用Python編程語言,基于Anaconda環境,利用深度學習框架TensorFlow2.0完成整個實驗代買的編寫。通過Word2Vec中skipgram訓練維度為50的詞向量進行詞嵌入。在CsBiL?STM中,具體的實驗參數設置如下:首先使用卷積層中使用32個卷積核,尺寸大小為2,3,4的窗口進行卷積;其次使用窗口大小為3,移動步長為1的最大池化方式進行池化;再其次將多尺寸卷積核獲取的特征進行融合;最后將融合的特征使用雙向LSTM進一步提取影評數據特征。

3.4 實驗結果及分析

為了證明本實驗模型的有效性,將CsBiLSTM模型與CNN、LSTM、BiLSTM進行對比實驗,輸出層使用sigmoid進行分析,通過準確率進行評價,實驗結果如表2所示。

通過CsBiLSTM模型提取影評數據特征,輸出層使用K-最近鄰算法進行影評分析,為保證實驗結果的有效性,將實驗數據進行5折交叉驗證,同時通過網格搜索尋找最佳參數,并與CNN、LSTM、BiLSTM進行對比,最后通過準確率、精確率、召回率和F1 進行評價,實驗結果如表3所示。

從表2和表3可以分析得出,CsBiLSTM融合模型在特征提取方面優于單一的CNN、LSTM、BiLSTM。輸出層使用sigmoid和K-最近鄰進行情感分析,其K-最近鄰整體優于sigmoid。同時也能得到BiLSTM能夠充分利用前向和后向的特征進行分類,充分體現出其網絡在時序信息方面具有的獨特性。

4 結束語

融合多尺寸CNN 和BiLSTM 得到的模型CsBiL?STM模型用于中文影評分析優于單一的網絡模型,如CNN、LSTM、BiLSTM;同時也能夠解決CNN無法充分利用上下文信息的問題。但是在實驗的過程中,也體現出實驗存在的問題:第一,模型訓練時間長。盡管單一模型在準確率上低于CsBiLSTM,但是在消耗的時間上優于CsBiLSTM;第二,數據量偏少。實驗過程中使用的數據量少,模型訓練過程中存在學習不夠充分。在今后的工作中,除了解決以上兩個問題外,還需進一步加強算法模型優化以及數據預處理的研究。

主站蜘蛛池模板: 999在线免费视频| 四虎亚洲精品| 亚洲天堂久久新| 国产亚洲现在一区二区中文| 久久99精品久久久大学生| 欧美亚洲另类在线观看| 日韩黄色在线| 国产又粗又猛又爽视频| 成人福利在线视频| 日韩免费成人| 国产精品自在在线午夜| 国产簧片免费在线播放| 亚洲日韩在线满18点击进入| 2022国产无码在线| 美女被操黄色视频网站| 亚洲愉拍一区二区精品| 中文字幕永久在线看| 国产一级α片| 国内黄色精品| 五月婷婷亚洲综合| 亚洲无限乱码| 日本国产精品| 亚洲色精品国产一区二区三区| 美女免费精品高清毛片在线视| 久久综合干| 日韩欧美国产精品| 性视频久久| 最近最新中文字幕在线第一页| 国产真实自在自线免费精品| 亚洲一区第一页| 一级香蕉人体视频| 日本欧美一二三区色视频| 欧美精品在线观看视频| 国产精品3p视频| 综合人妻久久一区二区精品 | 国产精品高清国产三级囯产AV| 久久精品国产亚洲AV忘忧草18| 人妻一本久道久久综合久久鬼色| 国产真实乱了在线播放| 3344在线观看无码| 国产视频入口| 久久久久久久久18禁秘| 毛片免费网址| 老汉色老汉首页a亚洲| 9丨情侣偷在线精品国产| 天天躁夜夜躁狠狠躁图片| 无码区日韩专区免费系列| 欧美中文一区| 欧美精品在线视频观看| 色天堂无毒不卡| 久久亚洲精少妇毛片午夜无码| 制服丝袜一区| 日韩欧美国产中文| 国产美女91视频| 免费看美女自慰的网站| 成人毛片在线播放| 老司机久久精品视频| 精品国产免费观看| 香蕉国产精品视频| 亚洲手机在线| 国内精品自在自线视频香蕉 | 19国产精品麻豆免费观看| 91在线日韩在线播放| 色综合天天综合| 无码专区在线观看| 国产一区成人| 九色在线观看视频| 亚洲精品在线影院| 亚洲福利一区二区三区| 91极品美女高潮叫床在线观看| 亚洲综合在线最大成人| 亚洲视频影院| 国产日本欧美在线观看| 欧美另类视频一区二区三区| 国产导航在线| 精品综合久久久久久97超人| 人人看人人鲁狠狠高清| 国产18在线| 国产一区免费在线观看| 欧美国产在线看| 丝袜亚洲综合| 免费av一区二区三区在线|