999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CsBiLSTM的中文影評情感分析

2023-04-06 14:04:10趙賽仙張元琴周順江覃勇孫大旭龔維印
電腦知識與技術 2023年5期

趙賽仙 張元琴 周順江 覃勇 孫大旭 龔維印

關鍵詞:CBiLSTM;影評;情感分析

近年來,隨著多媒體技術的飛速發展和智能設備的普及,每天都會產生源源不斷的互聯網數據,很多用戶會在社交平臺上發布大量的影視作品評論[1-2]。比如購物評價、QQ音樂、短視頻評論等。許多帶有用戶情感的文本將作為研究用戶情感、立場和觀點的依據?,F在很多用戶一邊觀看一邊進行綜合評分,一些用戶在影視下方發出的評論常常被忽略,這種現象達不到一個很好的參考價值。影視投資人不僅要知道用戶評價的情感走向,還應當將用戶的情感變化和諸多影響用戶評價的因素考慮到其中[3]。

情感分析旨在對帶有情感色彩的主觀性文本進行分析、處理、歸納、推理的過程,其常應用于消費決策、輿情分析、電子商務等領域,具有較高的商業應用價值[4]。本文由情感分類算法為切入點介紹了當前流行的情感分析方法,進而提出了基于CsBiLSTM的情感分類方法。采用情感分析方法,可以通過主觀描述來自動判斷自然語言文本的積極和消極的情緒傾向,并得出相應的結論。

1 相關工作

1.1 數據預處理

首先通過爬蟲技術獲取實驗數據;然后獲取數據中的星級和具體的評論內容,將三星級的內容去除,將一、二星級標注為-1,四、五星級標注為1作為實驗數據的標簽;最后利用正則表達式去除評論中存在的西文字體,再采用Jieba分詞工具進行分詞處理。

1.2 詞嵌入向量

文本信息無法直接輸入進行特征提取,需要將文本轉換為具體的向量進行表示,從而方便計算機的處理[5]。早期使用的one-hot編碼方式中,詞與詞之間相互獨立,忽略了詞與詞之間的邏輯性以及無法區分詞的相似性。為了較好地克服傳統詞向量存的不足,本文使用分布式進行連續性表示,將文本中的詞從高維空間映射到低維空間。本文詞向量使用Word2Vec訓練詞向量。

開源詞向量工具包Word2Vec于2013被Google推出[6]。Mikolov團隊因神經網絡模型采用兩個非線性變換,網絡參數較多,訓練速度延遲且不利用于大語料的特點而簡化了它,并實現了Word2Vec詞向量模型。它具有簡易、卓效的優點,從而十分適用于從龐大及巨型語料中獲取高精度的詞向量表示。Word2Vec 主要包含CBOW 和Skip-gram 組成[7],具體如圖1所示。

CBOW模型用一個隱層預測中心詞t,即通過中心詞附近的n 個詞預測中心詞t的概率。如“我”“很”“喜歡”“這部”“電影”,就是通過周圍詞“我”“很”“這部”“電影”預測中心詞“喜歡”;Skip-gram模型用一個隱含層預測周圍詞,即通過中心詞t預測周圍n 個詞的概率,如“這部”“電影”“演員”“演技”“不行”,就是通過中心詞“演員”預測周圍詞“這部”“電影”“演技”“不行”。本文使用Skip-gram模型訓練維度為50的詞向量。

2 模型介紹

本文的實驗模型包括輸入層、嵌入層、卷積神經網絡、雙向長短期記憶網絡、K-最近鄰,具體的模型如圖2所示。

2.1 卷積神經網絡

卷積神經網絡主要用于圖像識別、語音識別、自然語言處理等領域[8]。Kim于2014年首次將卷積神經網絡用于自然語言處理[9]。卷積神經網絡(Convolu?tional Neural Network,CNN) 是具有深度結構的前饋神經網絡,主要包括卷積計算,其網絡模型基本結構有輸入層、卷積層、池化層、全連接層和輸出層[10]。CNN模型的架構圖如圖3所示。

輸入層:在圖像處理領域,為0~255之間具體的像素。在本文中將句子或者文本表示成向量矩陣。

卷積層:通過局部連接和權值共享完成卷積運算。在深度神經網絡中,卷積層中每個單元都有一個獨立的權值,因此需要對整個網絡進行控制以實現最優的網絡結構。本文通過不同尺寸的卷積核進行卷積,提取輸入數據中深層次的特征。

池化層:主要對卷積層輸出的結果進一步提取特征,在保留最大特征的同時,降低特征的維度。

全連接層:主要根據概率值對所提取的特征進行分類,然后輸出最終的情感分析結果。

2.2 LSTM 和BiLSTM

LSTM 是循環神經網絡的變形。循環神經網絡(Recurrent Neural Network,RNN) 對具有序列特性的數據非常有效,能夠挖掘數據中的時序信息以及語義信息,能夠利用之前的信息影響后面信息的輸出,但是RNN 存在無法記憶長距離的信息、梯度消失等問題[11]。為解決以上問題,在RNN基礎上添加了“門控裝置”,即輸入門、遺忘門和輸出門,形成LSTM。

為進一步充分利用上下文的內容,將具有正向序列學習特征的LSTM模型進行變形,通過正反向序列提取上下文信息,綜合考慮上下文內容,得到雙向長短期記憶網絡模型BiLSTM,由此判斷每個樣本評論的情感傾向[12],具體如圖4所示。

BiLSTM模型具體的學習流程如下:

1) xt - 1,xt,xt + 1 是輸入的具體的詞,經過詞嵌入將輸入的詞轉換為固定維度的詞向量。

2) 輸入的詞經過詞嵌入后轉換為固定維度的詞向量,然后輸入BiLSTM模型,經過正向傳播和反向傳播訓練得到詞向量,將正向傳播獲取的特征和反向傳播獲取的特征進行融合,有效地提取數據的特征。

3) 將獲取的數據特征通過分類器進行預測分類,判斷影評數據的情感傾向,即該影評的情感是積極還是消極。

3 實驗方案和結果

3.1 實驗數據

本文通過網絡爬蟲技術獲取豆瓣網站共計50部電影影評作為實驗數據,經過處理共獲取影評數據共3萬條,其中訓練數據2.4萬條,測試數據0.6萬條。按照星級將實驗數據歸為積極和消極兩類,積極類用1表示,消極類用-1表示。

3.2 評價指標

本實驗評價分類結果的好壞用準確率(Accu?racy) 、精確率、召回率和F1 作為指標。Positive表示積極評論,Negative表示消極評論,影評分析混淆矩陣如表1所示。

其中,準確率表示影評分析中被分對的樣本與所有樣本的數的比;精確率表示影評分析中被識別為積極類的樣本中,確實為積極類別的比例;召回率表示在所有積極類別樣本中,被正確識別為積極類別的比例;F1表示通過精確率和召回率對影評的綜合分析。

3.3 實驗設置

本實驗在Windows10上,使用Python編程語言,基于Anaconda環境,利用深度學習框架TensorFlow2.0完成整個實驗代買的編寫。通過Word2Vec中skipgram訓練維度為50的詞向量進行詞嵌入。在CsBiL?STM中,具體的實驗參數設置如下:首先使用卷積層中使用32個卷積核,尺寸大小為2,3,4的窗口進行卷積;其次使用窗口大小為3,移動步長為1的最大池化方式進行池化;再其次將多尺寸卷積核獲取的特征進行融合;最后將融合的特征使用雙向LSTM進一步提取影評數據特征。

3.4 實驗結果及分析

為了證明本實驗模型的有效性,將CsBiLSTM模型與CNN、LSTM、BiLSTM進行對比實驗,輸出層使用sigmoid進行分析,通過準確率進行評價,實驗結果如表2所示。

通過CsBiLSTM模型提取影評數據特征,輸出層使用K-最近鄰算法進行影評分析,為保證實驗結果的有效性,將實驗數據進行5折交叉驗證,同時通過網格搜索尋找最佳參數,并與CNN、LSTM、BiLSTM進行對比,最后通過準確率、精確率、召回率和F1 進行評價,實驗結果如表3所示。

從表2和表3可以分析得出,CsBiLSTM融合模型在特征提取方面優于單一的CNN、LSTM、BiLSTM。輸出層使用sigmoid和K-最近鄰進行情感分析,其K-最近鄰整體優于sigmoid。同時也能得到BiLSTM能夠充分利用前向和后向的特征進行分類,充分體現出其網絡在時序信息方面具有的獨特性。

4 結束語

融合多尺寸CNN 和BiLSTM 得到的模型CsBiL?STM模型用于中文影評分析優于單一的網絡模型,如CNN、LSTM、BiLSTM;同時也能夠解決CNN無法充分利用上下文信息的問題。但是在實驗的過程中,也體現出實驗存在的問題:第一,模型訓練時間長。盡管單一模型在準確率上低于CsBiLSTM,但是在消耗的時間上優于CsBiLSTM;第二,數據量偏少。實驗過程中使用的數據量少,模型訓練過程中存在學習不夠充分。在今后的工作中,除了解決以上兩個問題外,還需進一步加強算法模型優化以及數據預處理的研究。

主站蜘蛛池模板: 国产精品欧美激情| 亚洲国产一成久久精品国产成人综合| 国产精品.com| 99久久精彩视频| 国产精品香蕉| v天堂中文在线| 久久精品丝袜| 亚洲av片在线免费观看| 午夜在线不卡| 亚洲AV无码精品无码久久蜜桃| 国产精品99久久久久久董美香| 一本大道视频精品人妻| 国产欧美日韩另类精彩视频| 国内精自视频品线一二区| 亚洲日本一本dvd高清| 99久久精品国产自免费| 毛片视频网址| 91探花国产综合在线精品| 国产成人乱无码视频| 国产91蝌蚪窝| 精品国产成人av免费| 婷婷激情亚洲| 伊人无码视屏| 99久久性生片| 亚洲日韩每日更新| 国产美女在线免费观看| 亚洲美女视频一区| 欧美劲爆第一页| 在线观看欧美国产| 欧美色99| 国内精自线i品一区202| 麻豆精品在线视频| 国产欧美日韩一区二区视频在线| 新SSS无码手机在线观看| 婷婷色中文网| 天天躁日日躁狠狠躁中文字幕| 亚洲国产精品一区二区高清无码久久| 四虎成人精品在永久免费| 精品久久国产综合精麻豆| 色综合热无码热国产| 天堂网亚洲系列亚洲系列| 日本在线国产| 视频一本大道香蕉久在线播放| 污视频日本| 99青青青精品视频在线| 五月天在线网站| 国产一级在线播放| 亚洲swag精品自拍一区| 尤物在线观看乱码| 免费av一区二区三区在线| 国产麻豆福利av在线播放| 992tv国产人成在线观看| 国产屁屁影院| 91九色最新地址| 麻豆精品视频在线原创| AV色爱天堂网| 亚洲成A人V欧美综合| 国产真实二区一区在线亚洲| 中文字幕av一区二区三区欲色| 久久久久免费看成人影片| 99久久99这里只有免费的精品| 美女国产在线| 久久久波多野结衣av一区二区| 亚洲精品桃花岛av在线| 国产精品人莉莉成在线播放| 欧美精品1区| 国产精品视频a| 亚洲国产天堂久久综合| 女人天堂av免费| 在线欧美一区| 免费福利视频网站| 国产精品一区在线麻豆| 伊人91在线| 日韩a级片视频| 国产午夜小视频| 在线无码av一区二区三区| 久久一级电影| 国产欧美精品午夜在线播放| 午夜啪啪网| 国产精品不卡片视频免费观看| 日韩欧美在线观看| 99久视频|