999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

IMDb電影影評之單類神經網絡與改良型CNN模型準確率差異性研究

2021-07-25 16:24:27張逸方吳佩芬
電影評介 2021年7期
關鍵詞:實驗模型研究

張逸方 吳佩芬

文字探勘(Text Mining)是自然語言處理(Natural Language Progressing,簡稱NLP)領域的研究重點,也是AI人工智能與語言學的學習分支。伴隨著網絡時代的來臨,越來越多的人在網絡上發表自己的觀影意見,有許多學者運用文字探勘方法,搜集網絡上的影評數據,進行文本情感分析。

配合網絡與社交平臺的快速發展,電影的評分網站也成為在線參考電影信息和表達影評意見的重要平臺,電影評分網站中,又以IMDb(Internet Movie Database)在全球最具代表性與影響力。IMDb成立于1990年,囊括了全球幾乎所有電影及演員、導演、劇情、影評等訊息,共計約四百多萬條作品數據。

文本情感分析的方法眾多,主要途徑可分為兩種[1],一種是“詞匯法”[2][3],另一種是“機器學習法”(machine learning method)[4],“詞匯法”從語言學的角度出發,以專家分類的情緒詞為基礎,分析文本情感傾向[5];“機器學習法”則將大量人為判斷的訓練數據,進行特征選取與模型的建立,利用機器自動判斷數據意見傾向。在多年的發展下,兩類研究方法不斷地互相影響,累積了諸多的資源、模型與數據庫。

配合深度學習技術的演變,學術界也開始使用神經網絡的概念進行文本分析,并大量運用在電影影評分析領域。本研究以IMDb的影評評論為文本對象,提出一種改良型卷積神經網絡(Convolutional Neural Network,CNN)的模型架構,比較不同神經網絡架構、層數以及參數是否會影響到模型的準確率。

一、相關研究

(一)應用WEKA于電影評論之機器學習演算

2014年學者藉由數據探勘工具WEKA進行數據探勘,進行電影評論分類準確性實驗[6],考慮算法及各自參數均會大幅影響最后成效,各個不同算法與參數的組合數量讓人難以選擇,WEKA工具利用貝氏優化(Bayesian optimization)的創新做法,為一種完全自動化的方案,實驗結果發現,其模型準確率約為80%,如圖1所示。

(二)類神經網絡原理

類神經網絡(Artificial Neural Network, ANN)為基于腦以及神經網絡基礎而發展的信息處理技術,為人工智能的延伸應用。類神經網絡因為具有推理、記憶、容錯等特性,也可以說是一種特殊技術的統計應用,它不需要關于數據的分布假設,具有建構復雜非線性與連續函數映對問題能力等特色[7],能處理許多過去統計方法無法處理的非規則性問題,不局限在影像、文字、語音等領域,在商業領域也有很大的作用。[8]

類神經網絡是模仿人類神經元結構之概念,其神經元反應的基本邏輯,包含輸入層(a1~ai)、權重(w1~wi),輸入乘上權重之后加總(∑w*a),便可得到神經元的刺激強度,接著經過函數(f)轉換以及調節刺激強度的閥值(b),即可得到輸出的神經元刺激強度,數學公式如圖2。研究者基于神經元操作模式,發展出單層神經網絡,模型概念如圖3。[9]

多層模型中如圖4,隱藏層的神經元個數和層數可以由研究者自行決定,一般而言,當隱藏層及神經元越多,處理非線性的問題能力越強。[10]

(三)類神經網絡在電影預測之應用

過去類神經網絡模型在電影產業的應用很多,Ramesh and Dursun[11]曾運用統計方法與類神經網絡,創建電影票房預測的模型并進行比較,發現類神經網絡的模型較佳;鄭堅等人[12]提出一種基于回饋神經網絡的電影票房預測模型。發現針對神經網絡波動性的特點,對預測模型的輸出結果進行改進之后,輸出結果既能更可靠地反映電影在上映期間的票房收入,又能指出電影票房的波動范圍;陳增艷[13]為了緩解卷積神經網絡在計算和網絡訓練過程中出現的“過擬合”現象,尋找合適的Dropout值降低過擬合問題,在一定程度上參照了協同過濾算法中的相似度計算,發現研究評分預測的準確度被大大提高;王錠等人[14]提出一種基于卷積神經網絡的電影評論情感分類模型,將卷積神經網絡與詞向量相結合,并與SVM等傳統機器學習方法進行對比實驗。實驗結果表明,基于卷積神經網絡的文本情感分析模型有較高的準確率。

綜觀以上研究方法,目前相關研究中,多數基于神經網絡模型結構進行微調改進后,進而以改良模型預測電影票房及評論;本研究將借由建構改良型CNN模型,建構IMDb影評分析系統,和以往研究不同的是,本研究考慮模型結構全連接層層數以及神經元多寡對準確性的影響,經由各種神經網絡組合實驗,找到準確性優化研究,提升模型應用之效益。

二、研究設計

(一)卷積神經網絡之模型概念

卷積神經網絡(Convolutional Neural Networks,CNN)為神經網絡的分支之一,核心為沿用了多層感知器(Multilayer Perceptron,MLP)的結構,由輸入層(Input)、卷積層(Convolutional Layer)、池化層(pooling)、全連接層(Fully-connected Layer)組成。由Kim[15]提出的CNN短文本分類模型結構如圖5所示。

本研究將建立TensorFlow的訓練環境,使用Keras作為架設模塊的基礎,以Keras建立神經網絡進行深度學習訓練。

(二)研究數據與步驟

本研究采用IMDb電影評論情感分類數據庫中共25000份電影評論作為分析數據[16],本研究實驗分為兩個部分,第一部分為多層模型實驗,第二部分為神經元數實驗。其中多層模型實驗主要目的為比較全連階層數對單一類神經網絡與改良型神經網絡準確性差異分析,而神經元數實驗目的為了解模型參數的改變對準確度的影響,針對模型參數,如卷積層、濾波器、卷積核大小等,了解不同模型參數設定對準確度的影響。研究步驟如圖6所示。

(三)研究參數

研究參數直接影響最后的模型結果,表1表2列出本研究單類神經網絡模型與改良型CNN模型中,欲研究之參數與對應的參數值。

三、研究結果

為了了解本研究提出之單類神經網絡與CNN改良型模型的準確率與模型性能,分別將進行兩模型之對比實驗。

本研究首先針對多層模型實驗的準確率進行比較,兩模型準確率變化如圖7所示。改良型CNN模型中,整體模型穩定性較單類神經網絡模型高,而卷積層數的改變則對模型準確率的改變不明顯。

另外針對神經元實驗的兩類模型準確率,不同神經元數對模型準確率變化比較如圖8。改良型CNN模型中,濾波器數的改變對準確率有明顯變化,而改良型CNN模型中,其卷積核大小的改變則對準確率的改變不明顯。

結語

本研究以IMDb電影評論為數據,基于過去WEKA對電影評論算法的模型準確度評估,提出以類神經網絡為基礎的單類神經網絡與改良型CNN模型,由此實驗了解如何改變關鍵參數,找到可信賴模型的準確度區間,避免未來研究者在選擇參數時造成過高或過低的準確率。研究發現,單類神經網絡在參數較少時,其模型準確率較高,而改良型CNN模型層與層之間為局部連接的特性,模型可承受較多的參數設定,如多神經元數與多層數,其模型穩定性及準確性均較高,且基于文字探勘的特性,可發現CNN之濾波器并不需要過多的濾波器數,即可達到不錯的準確率。

自然語言學習中的文字情感分析的研究仍存在許多問題,需進一步討論,但本研究發現,文字情感分析可用不同的類神經網絡模型進行評估,可提高可信賴度的準確率,后續將再透過不同的類神經網絡模型進行模型架構之適用性比較。

參考文獻:

[1]Serrano-Guerrero,J.,Olivas,J.A.,Romero,F.P.,&Herrera-Viedma,E.Sentiment analysis:A review and comparative analysis of Web services[ J ].Information Sciences,2015,311:18-38.

[2]Taboada,M.,Brooke,J.,Tofiloski,M.,Voll,K.,& Stede,M.Lexicon based methods for sentiment analysis[ J ]. Computational Linguistics,2011,37;267-307.

[3]Turney P,Littman M.Measuring praise and criticism:inference of semantic orientation from association[ J ].ACM Transactionson Information Systems,2003,21(4):315-346.

[4]Boiy,E.,& Moens,M.-F.A machine learning approach to sentiment analysis in multilingual Web texts[ J ]. Information Retrieval,2009,12(5):526-558.

[5]Xu R.F,Wong K.F,Xia Y.Coarse-Fine opinion mining-WIA in NTCIR-7 MOAT task[C]//Proceedings of NTCIR 2008:307-313.

[6]A data mining experiment:movie reviews classification using WEKA.[EB/OL].[2019-11-15]https://www.stefanoscerra.it/movie-reviews-classification-weka-data-mining/.

[7]Tan S.,Zhang J. An empirical study of sentiment analysis for Chinese documents[ J ].Expert Systems with Applications,2008,34(4):2622-2629.

[8]Vellido,A.,Lisboa,P.J.G.and Vaughan,J.Neural Networks in Business:A Survey of Applications(1992-1998)[ J ]. Expert Systems with Applications,1999,17:51-70.

[9]葉怡成.應用類神經網絡[M].臺北:儒林圖書公司,2001.

[10]Hearn,D.,&Baker,M.P.Computer graphics[M].Englewood Cliffs,NJ:Prentice-Hall,1986.

[11]Sharda,Ramesh and Delen,Dursun.Predicting box-office success of motion pictures with neural networks[ J ]. Expert Systems with Applications.2006,30(2):243-254.

[12]鄭堅,周尚波.基于神經網絡的電影票房預測建模[ J ].計算機應用,2014,34(3):742-748.

[13]陳增艷.基于卷積神經網絡的電影推薦模型研究[D].大連:大連海事大學,2018.

[14]王錠,杜紅等人.基于深度神經網絡的電影評論情感分類研究[ J ].電腦與信息技術,2019(4).

[15]KIM Y.Convolutional neural networks for sentence classification[C]//Proceedings of Conferenceon Empirical Methods in Natural Language Processing.Doha:[s.n.]p.1746-1751,2014.

[16]林大貴.TensorFlow+Keras深度學習人工智能實務應用[M].臺北:博碩文化,2017.

猜你喜歡
實驗模型研究
一半模型
記一次有趣的實驗
FMS與YBT相關性的實證研究
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
做個怪怪長實驗
EMA伺服控制系統研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产v精品成人免费视频71pao| 重口调教一区二区视频| 欧美一级视频免费| 国产成人免费| 精品久久综合1区2区3区激情| 久热这里只有精品6| 久久久久夜色精品波多野结衣| 久久婷婷国产综合尤物精品| 国产女人在线观看| 97超爽成人免费视频在线播放| 99热国产这里只有精品无卡顿"| 欧美在线视频不卡第一页| 性视频久久| 老熟妇喷水一区二区三区| 日本精品影院| 中国美女**毛片录像在线| 精品日韩亚洲欧美高清a| 国产一区二区三区免费| 欧美乱妇高清无乱码免费| 欧洲熟妇精品视频| 国产手机在线观看| 手机永久AV在线播放| 亚洲色大成网站www国产| 在线观看视频一区二区| 亚洲无线视频| 男人天堂亚洲天堂| 日本午夜视频在线观看| 色久综合在线| 免费看av在线网站网址| 国产美女一级毛片| 3344在线观看无码| 日韩av高清无码一区二区三区| 亚洲欧美在线看片AI| 国产精品无码一区二区桃花视频| 视频二区亚洲精品| 亚洲综合中文字幕国产精品欧美| 久久网欧美| 欧美成人手机在线视频| 午夜欧美理论2019理论| 无码内射在线| 国产午夜不卡| 国产香蕉一区二区在线网站| 亚洲人成在线精品| 亚洲欧美人成电影在线观看| 欧美成一级| 国产精品一区在线麻豆| www成人国产在线观看网站| 四虎永久免费地址在线网站| 4虎影视国产在线观看精品| 国产成人91精品免费网址在线| 91丝袜美腿高跟国产极品老师| 亚洲色欲色欲www在线观看| 在线观看国产黄色| 一区二区午夜| 在线播放真实国产乱子伦| 54pao国产成人免费视频| 国产高潮视频在线观看| 波多野结衣一区二区三区AV| www.亚洲国产| 日韩在线永久免费播放| 天天摸天天操免费播放小视频| 婷婷激情五月网| 伊人福利视频| 婷婷99视频精品全部在线观看| 亚洲欧美综合另类图片小说区| 国产人在线成免费视频| 中文字幕在线视频免费| 成人精品亚洲| 六月婷婷精品视频在线观看| 欧美视频在线不卡| 日本少妇又色又爽又高潮| 免费在线一区| 久久一本精品久久久ー99| 国产精品嫩草影院视频| 2022国产无码在线| 久久无码av三级| a级免费视频| 综合色天天| 午夜久久影院| 午夜国产小视频| 欧美日韩免费观看| 免费日韩在线视频|