999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的動漫影評特征挖掘與應用

2020-08-04 11:23:18張煦渤張莉
數碼世界 2020年7期
關鍵詞:深度學習

張煦渤 張莉

摘要:隨著互聯網的發展和近年來中國電影的崛起,中國用戶越來越習慣于在豆瓣、貓眼一類的影評論壇或平臺上發布自己的觀影感受,并對電影進行打分。這些評論中隱藏著大量的用戶偏好等信息。而若想對這些隱含信息進行獲取,需要對影評特征進行進一步分析。基于此,本文通過Python對貓眼網站中“動漫電影”分類下面的影評及其得分等數據進行爬取,并將所得文本數據進行整理,通過jieba分詞和word2vec等方法對影評特征進行分析;之后,根據影評的主體內容,側重于其情感特征進行挖掘,將清洗過后的結構化數據帶入基于RNN的深度學習模型中,以用戶評分作為其影評情感特征的體現;然后,通過隨機游走對模型進行優化,再進行模型效用對比,得到動漫影評情感特征的預測模型,并對其應用場景予以分析。

關鍵詞:深度學習? 動漫影評? 特征挖掘

1 引言

隨著我國經濟的不斷發展和人們生活水平的日益提高,電影作為一種娛樂消費品,已成為國人生活中不可或缺的一部分,觀眾在養成觀影習慣的同時,越來越熱衷于將自己的觀影感受和想法分享到互聯網上,國內的豆瓣、貓眼等影評匯總平臺也由此越來越受人們的關注。而在眾多電影分類中,動漫電影作為電影行業中的一個重要成員,從其誕生以來,許多動漫角色深入人心,其影評中亦包含著大量潛在信息,包括電影的口碑、用戶的的觀影偏好等等。若想對這部分潛在信息進行獲取,就不得不對其影評的特征進行針對性的分析。

2 基于RNN深度學習的動漫影評特征分析

2.1 數據獲取及預處理

本文以貓眼移動端網頁版影評為數據源,選取其動漫電影分類中所有可見平均得分的電影影評為實驗對象,同時考慮了影評評論時間的篩選。

首先在Chrome開發者模式下可以通過對網絡請求的查詢獲取貓眼數據的API,其接口結構為:

在具體抓取某一部電影的影評時,只需將其中的movieId替換對對應的電影編號即可。同時,還需注意影評列表的開始時間等參數。

將獲取的json文件進行解析,即可得到對應影評的用戶ID、打分、地理位置、評論內容等有效信息。之后,將解析后的無效信息予以剔除,共計63條,有效信息214424條。

將評論按照用戶地域進行分組,通過pyecharts可視化后可得到樣本數據用戶地域分布如下圖。

從圖中不難看出,樣本用戶主要分布于東南沿海一帶和華北地區,其次是東北地區,少量位于西北內陸。這主要是因為東南沿海和華北一些地區經濟相對發達,城市人口基數龐大,極多的熒幕數量和座位、極高密度的排片場次,讓觀眾便捷觀影,活躍的觀眾評論也多,自然也就成為票房的主要貢獻者。

我們整理了樣本數據中影評數量排名前20的城市,分別為北京、上海、武漢、南京、成都、深圳、西安、廣州、天津、重慶、鄭州、杭州、沈陽、無錫、合肥、昆明、哈爾濱、常州、長沙、蘇州。這些城市都是經濟相對發達的城市,從某種角度來講,這也側面反映了城市的購買力和城市GDP,說明其消費水平較高,也印證了用戶分布圖中所得出的結論。

2.2 word2vec提取詞向量

為了在深度學習模型中更好的表示影評的文本數據,需將影評文本進行詞向量化表示,基于此本文選擇python中的gensim模塊訓練詞向量。由于所抓取的貓眼影評數據為中文影評,所以需要一個符合中文語料庫的word2vec模型,以完成對影評數據的詞向量獲取。因此,為了更好地描述影評詞語特征,本文直接選取貓眼影評作為訓練數據,采用Skip-Gram模型進行訓練。訓練參數如下表所示,訓練維度為64,迭代次數為5次。

在對抓取的影評數據進行表情符號剔除和去停用詞等操作之后,將其輸入word2vec進行訓練,得到模型測試結果如下表,由于訓練數據為影評數據,語料庫有限,所以在詞語的相似度上有一定的誤差,但就總體影評效果來看,符合影評總體語言風格。

同時,模型還生成了對應的詞向量表和對應的字典。在詞向量表中每一個詞語都是通過一個64維的行向量所表示的,而詞向量字典是后文中將影評分詞數據轉化為RNN模型可輸入數據的基礎。

2.3 基于LSTM的RNN模型搭建

通過tensorboard生成的模型結構如下圖所示,其中模型整體包括輸入層、隱層和輸出層,而在隱層中又包含了內部隱層和LSTM細胞狀態層。隱層中神經元個數為128,而LSTM細胞狀態中又含有四個子層。

其中,模型的關鍵運算過程位于LSTM_cell模塊中,其中包括了細胞狀態、RNN的內部神經元結構,以及激活函數等。

2.4 實驗結果及分析

在構建好RNN模型后,將清洗過的數據帶入模型。模型以用戶打分為預測變量,從0到10共分為十一個等級,輸入變量為用戶評論分詞轉化而來的向量矩陣,由此在經過多次迭代訓練后可以得到模型預測的準確率與成本函數。我們可以得出,隨著迭代次數的不斷增加,模型預測的平均成本逐漸減少,準確率不斷上升,約在12000次后準確率趨于穩定狀態,最終預測準確率可達93.75%,說明模型對于影評的用戶評分有著很好的預測效果。

而從模型的準確率曲線圖來看,模型在訓練的迭代前期準確率提升幅度較快,后期趨于平緩,最后逐漸穩定在90%以上水平。

2.5 基于隨機游走的改進RNN影評分析模型

由于隨機游走詞向量多用于做半監督分類模型,所以本節分別選取每種評分的500條數據作為標注數據,共計5500條標注數據,其余數據視為未標注數據。以標注數據為隨機游走圖中的已知點,對未標注的數據進行隨機游走,之后將數據帶入RNN模型中進行訓練,模型運行結果如下表。

由上表可以看出,模型的平均成本函數以及準確率的變化趨勢與上節中RNN模型是一致的;而在準確率上,在迭代前期準確率略低于隨機游走改進前RNN模型,而在趨于穩定狀態,相比于原模型,預測準確度約提高0.5%。

從上圖來看,經過隨機游走優化的RNN模型在穩定狀態略有提高,雖然隨機游走算法對于模型的預測準確率提高不顯著,這可能是由于原模型準確率已經很高,導致其提高水平不夠顯著造成的,但總體來講,本文實驗結果說明,隨機游走模型對應預測準確率的提高是有意義的。

3 結論

本文基于深度學習模型,通過對貓眼動漫影評進行數據抓取,完成了對動漫影評的自然語言處理處理和用戶評分預測。首先通過分析貓眼影評API,利用python中的requests等庫對影評數據進行爬取,再通過jieba模塊對評論進行分詞得到影評的語料庫,之后利用gensim中的word2vec模塊得到影評詞向量矩陣,在將影評數據轉換為嵌入式矩陣后,完成了對數據的預處理工作。接下來搭建基于LSTM的RNN深度學習模型,并將影評詞向量矩陣和用戶評分帶入模型,完成迭代訓練,最后得到評分預測模型。

參考文獻

[1]伍宏偉.基于隱馬爾可夫模型的交通流預測研究[D].蘭州交通大學,2019.

[2]鄭嘯,王義真,袁志祥,秦鋒.基于卷積記憶神經網絡的微博短文本情感分析[J].電子測量與儀器學報,2018,32(03):195-200.

[3]劉娜.文本自動摘要和信息抽取方法及其應用研究[D].大連海事大學,2012.

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 精品福利网| 2021国产精品自产拍在线观看 | 中文纯内无码H| 97av视频在线观看| 国内精品久久九九国产精品| 欧美日韩在线成人| 色偷偷综合网| 99在线观看国产| 国产麻豆精品在线观看| 一级毛片在线播放| 亚洲码一区二区三区| 久久久四虎成人永久免费网站| 欧美视频二区| aaa国产一级毛片| 本亚洲精品网站| 国产欧美视频在线| 91久久夜色精品国产网站| 国产亚洲精品97AA片在线播放| 熟妇丰满人妻av无码区| 真人高潮娇喘嗯啊在线观看| 一级黄色网站在线免费看| 99手机在线视频| 男女男免费视频网站国产| 国产青青操| 亚洲精品你懂的| 最新加勒比隔壁人妻| AV天堂资源福利在线观看| 蜜芽国产尤物av尤物在线看| 亚洲欧洲日产国码无码av喷潮| 日本不卡在线| 最近最新中文字幕在线第一页| 91色在线观看| 狠狠v日韩v欧美v| 亚洲精品少妇熟女| 熟女视频91| 亚洲美女视频一区| 亚洲AV成人一区国产精品| 国产区人妖精品人妖精品视频| 先锋资源久久| 中文字幕无线码一区| 国产福利一区二区在线观看| 人禽伦免费交视频网页播放| 伊人福利视频| 国产精品无码作爱| 免费一级成人毛片| 欧美19综合中文字幕| 波多野结衣一二三| 久久这里只精品国产99热8| 国产欧美日韩资源在线观看| 中文字幕人妻av一区二区| 免费看av在线网站网址| 国产精品太粉嫩高中在线观看| 美女扒开下面流白浆在线试听| 丁香五月激情图片| 久久www视频| 99re视频在线| 中文字幕人妻无码系列第三区| 日本高清在线看免费观看| 国产福利微拍精品一区二区| 国内嫩模私拍精品视频| 99久久精品国产自免费| 精品一区二区三区自慰喷水| 激情视频综合网| 精品1区2区3区| 精品少妇人妻无码久久| 国产一区二区三区精品久久呦| 国产精品无码影视久久久久久久 | 四虎国产精品永久在线网址| 亚洲精品自产拍在线观看APP| 成人福利在线免费观看| 国产a网站| 国产在线观看人成激情视频| 亚洲日韩AV无码精品| 人妻无码中文字幕第一区| 乱色熟女综合一区二区| 综合久久五月天| 99这里精品| 亚洲成aⅴ人在线观看| 婷婷综合在线观看丁香| 亚洲av无码久久无遮挡| 91日本在线观看亚洲精品| 网久久综合|