999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

IMDb電影影評之單類神經網絡與改良型CNN模型準確率差異性研究

2021-07-25 16:24:27張逸方吳佩芬
電影評介 2021年7期
關鍵詞:實驗模型研究

張逸方 吳佩芬

文字探勘(Text Mining)是自然語言處理(Natural Language Progressing,簡稱NLP)領域的研究重點,也是AI人工智能與語言學的學習分支。伴隨著網絡時代的來臨,越來越多的人在網絡上發表自己的觀影意見,有許多學者運用文字探勘方法,搜集網絡上的影評數據,進行文本情感分析。

配合網絡與社交平臺的快速發展,電影的評分網站也成為在線參考電影信息和表達影評意見的重要平臺,電影評分網站中,又以IMDb(Internet Movie Database)在全球最具代表性與影響力。IMDb成立于1990年,囊括了全球幾乎所有電影及演員、導演、劇情、影評等訊息,共計約四百多萬條作品數據。

文本情感分析的方法眾多,主要途徑可分為兩種[1],一種是“詞匯法”[2][3],另一種是“機器學習法”(machine learning method)[4],“詞匯法”從語言學的角度出發,以專家分類的情緒詞為基礎,分析文本情感傾向[5];“機器學習法”則將大量人為判斷的訓練數據,進行特征選取與模型的建立,利用機器自動判斷數據意見傾向。在多年的發展下,兩類研究方法不斷地互相影響,累積了諸多的資源、模型與數據庫。

配合深度學習技術的演變,學術界也開始使用神經網絡的概念進行文本分析,并大量運用在電影影評分析領域。本研究以IMDb的影評評論為文本對象,提出一種改良型卷積神經網絡(Convolutional Neural Network,CNN)的模型架構,比較不同神經網絡架構、層數以及參數是否會影響到模型的準確率。

一、相關研究

(一)應用WEKA于電影評論之機器學習演算

2014年學者藉由數據探勘工具WEKA進行數據探勘,進行電影評論分類準確性實驗[6],考慮算法及各自參數均會大幅影響最后成效,各個不同算法與參數的組合數量讓人難以選擇,WEKA工具利用貝氏優化(Bayesian optimization)的創新做法,為一種完全自動化的方案,實驗結果發現,其模型準確率約為80%,如圖1所示。

(二)類神經網絡原理

類神經網絡(Artificial Neural Network, ANN)為基于腦以及神經網絡基礎而發展的信息處理技術,為人工智能的延伸應用。類神經網絡因為具有推理、記憶、容錯等特性,也可以說是一種特殊技術的統計應用,它不需要關于數據的分布假設,具有建構復雜非線性與連續函數映對問題能力等特色[7],能處理許多過去統計方法無法處理的非規則性問題,不局限在影像、文字、語音等領域,在商業領域也有很大的作用。[8]

類神經網絡是模仿人類神經元結構之概念,其神經元反應的基本邏輯,包含輸入層(a1~ai)、權重(w1~wi),輸入乘上權重之后加總(∑w*a),便可得到神經元的刺激強度,接著經過函數(f)轉換以及調節刺激強度的閥值(b),即可得到輸出的神經元刺激強度,數學公式如圖2。研究者基于神經元操作模式,發展出單層神經網絡,模型概念如圖3。[9]

多層模型中如圖4,隱藏層的神經元個數和層數可以由研究者自行決定,一般而言,當隱藏層及神經元越多,處理非線性的問題能力越強。[10]

(三)類神經網絡在電影預測之應用

過去類神經網絡模型在電影產業的應用很多,Ramesh and Dursun[11]曾運用統計方法與類神經網絡,創建電影票房預測的模型并進行比較,發現類神經網絡的模型較佳;鄭堅等人[12]提出一種基于回饋神經網絡的電影票房預測模型。發現針對神經網絡波動性的特點,對預測模型的輸出結果進行改進之后,輸出結果既能更可靠地反映電影在上映期間的票房收入,又能指出電影票房的波動范圍;陳增艷[13]為了緩解卷積神經網絡在計算和網絡訓練過程中出現的“過擬合”現象,尋找合適的Dropout值降低過擬合問題,在一定程度上參照了協同過濾算法中的相似度計算,發現研究評分預測的準確度被大大提高;王錠等人[14]提出一種基于卷積神經網絡的電影評論情感分類模型,將卷積神經網絡與詞向量相結合,并與SVM等傳統機器學習方法進行對比實驗。實驗結果表明,基于卷積神經網絡的文本情感分析模型有較高的準確率。

綜觀以上研究方法,目前相關研究中,多數基于神經網絡模型結構進行微調改進后,進而以改良模型預測電影票房及評論;本研究將借由建構改良型CNN模型,建構IMDb影評分析系統,和以往研究不同的是,本研究考慮模型結構全連接層層數以及神經元多寡對準確性的影響,經由各種神經網絡組合實驗,找到準確性優化研究,提升模型應用之效益。

二、研究設計

(一)卷積神經網絡之模型概念

卷積神經網絡(Convolutional Neural Networks,CNN)為神經網絡的分支之一,核心為沿用了多層感知器(Multilayer Perceptron,MLP)的結構,由輸入層(Input)、卷積層(Convolutional Layer)、池化層(pooling)、全連接層(Fully-connected Layer)組成。由Kim[15]提出的CNN短文本分類模型結構如圖5所示。

本研究將建立TensorFlow的訓練環境,使用Keras作為架設模塊的基礎,以Keras建立神經網絡進行深度學習訓練。

(二)研究數據與步驟

本研究采用IMDb電影評論情感分類數據庫中共25000份電影評論作為分析數據[16],本研究實驗分為兩個部分,第一部分為多層模型實驗,第二部分為神經元數實驗。其中多層模型實驗主要目的為比較全連階層數對單一類神經網絡與改良型神經網絡準確性差異分析,而神經元數實驗目的為了解模型參數的改變對準確度的影響,針對模型參數,如卷積層、濾波器、卷積核大小等,了解不同模型參數設定對準確度的影響。研究步驟如圖6所示。

(三)研究參數

研究參數直接影響最后的模型結果,表1表2列出本研究單類神經網絡模型與改良型CNN模型中,欲研究之參數與對應的參數值。

三、研究結果

為了了解本研究提出之單類神經網絡與CNN改良型模型的準確率與模型性能,分別將進行兩模型之對比實驗。

本研究首先針對多層模型實驗的準確率進行比較,兩模型準確率變化如圖7所示。改良型CNN模型中,整體模型穩定性較單類神經網絡模型高,而卷積層數的改變則對模型準確率的改變不明顯。

另外針對神經元實驗的兩類模型準確率,不同神經元數對模型準確率變化比較如圖8。改良型CNN模型中,濾波器數的改變對準確率有明顯變化,而改良型CNN模型中,其卷積核大小的改變則對準確率的改變不明顯。

結語

本研究以IMDb電影評論為數據,基于過去WEKA對電影評論算法的模型準確度評估,提出以類神經網絡為基礎的單類神經網絡與改良型CNN模型,由此實驗了解如何改變關鍵參數,找到可信賴模型的準確度區間,避免未來研究者在選擇參數時造成過高或過低的準確率。研究發現,單類神經網絡在參數較少時,其模型準確率較高,而改良型CNN模型層與層之間為局部連接的特性,模型可承受較多的參數設定,如多神經元數與多層數,其模型穩定性及準確性均較高,且基于文字探勘的特性,可發現CNN之濾波器并不需要過多的濾波器數,即可達到不錯的準確率。

自然語言學習中的文字情感分析的研究仍存在許多問題,需進一步討論,但本研究發現,文字情感分析可用不同的類神經網絡模型進行評估,可提高可信賴度的準確率,后續將再透過不同的類神經網絡模型進行模型架構之適用性比較。

參考文獻:

[1]Serrano-Guerrero,J.,Olivas,J.A.,Romero,F.P.,&Herrera-Viedma,E.Sentiment analysis:A review and comparative analysis of Web services[ J ].Information Sciences,2015,311:18-38.

[2]Taboada,M.,Brooke,J.,Tofiloski,M.,Voll,K.,& Stede,M.Lexicon based methods for sentiment analysis[ J ]. Computational Linguistics,2011,37;267-307.

[3]Turney P,Littman M.Measuring praise and criticism:inference of semantic orientation from association[ J ].ACM Transactionson Information Systems,2003,21(4):315-346.

[4]Boiy,E.,& Moens,M.-F.A machine learning approach to sentiment analysis in multilingual Web texts[ J ]. Information Retrieval,2009,12(5):526-558.

[5]Xu R.F,Wong K.F,Xia Y.Coarse-Fine opinion mining-WIA in NTCIR-7 MOAT task[C]//Proceedings of NTCIR 2008:307-313.

[6]A data mining experiment:movie reviews classification using WEKA.[EB/OL].[2019-11-15]https://www.stefanoscerra.it/movie-reviews-classification-weka-data-mining/.

[7]Tan S.,Zhang J. An empirical study of sentiment analysis for Chinese documents[ J ].Expert Systems with Applications,2008,34(4):2622-2629.

[8]Vellido,A.,Lisboa,P.J.G.and Vaughan,J.Neural Networks in Business:A Survey of Applications(1992-1998)[ J ]. Expert Systems with Applications,1999,17:51-70.

[9]葉怡成.應用類神經網絡[M].臺北:儒林圖書公司,2001.

[10]Hearn,D.,&Baker,M.P.Computer graphics[M].Englewood Cliffs,NJ:Prentice-Hall,1986.

[11]Sharda,Ramesh and Delen,Dursun.Predicting box-office success of motion pictures with neural networks[ J ]. Expert Systems with Applications.2006,30(2):243-254.

[12]鄭堅,周尚波.基于神經網絡的電影票房預測建模[ J ].計算機應用,2014,34(3):742-748.

[13]陳增艷.基于卷積神經網絡的電影推薦模型研究[D].大連:大連海事大學,2018.

[14]王錠,杜紅等人.基于深度神經網絡的電影評論情感分類研究[ J ].電腦與信息技術,2019(4).

[15]KIM Y.Convolutional neural networks for sentence classification[C]//Proceedings of Conferenceon Empirical Methods in Natural Language Processing.Doha:[s.n.]p.1746-1751,2014.

[16]林大貴.TensorFlow+Keras深度學習人工智能實務應用[M].臺北:博碩文化,2017.

猜你喜歡
實驗模型研究
一半模型
記一次有趣的實驗
FMS與YBT相關性的實證研究
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
做個怪怪長實驗
EMA伺服控制系統研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 四虎永久免费地址在线网站| 亚洲日韩AV无码精品| yjizz国产在线视频网| 99精品久久精品| 97久久精品人人做人人爽| 亚洲bt欧美bt精品| 天堂网亚洲系列亚洲系列| 欧美日韩在线国产| 亚洲国产一成久久精品国产成人综合| 久久综合五月婷婷| 免费看a级毛片| 性激烈欧美三级在线播放| jizz亚洲高清在线观看| 伊人久久大线影院首页| 国产真实乱了在线播放| 91免费观看视频| 欧美在线国产| 国产免费久久精品99re不卡| 成人在线天堂| 亚洲日韩在线满18点击进入| 久久久久久高潮白浆| 亚洲一区二区日韩欧美gif| 亚洲开心婷婷中文字幕| 成人韩免费网站| 天天干天天色综合网| 国产剧情一区二区| 欧美国产视频| 波多野结衣在线一区二区| 无码内射在线| 国产精品分类视频分类一区| 日本妇乱子伦视频| 91国内在线观看| 曰韩人妻一区二区三区| 亚洲天堂2014| 黄色网在线免费观看| 日韩毛片免费| 亚洲欧美国产高清va在线播放| 日韩国产亚洲一区二区在线观看| 98超碰在线观看| 澳门av无码| 九色视频一区| 欧美精品在线免费| 午夜爽爽视频| 538国产视频| 这里只有精品在线| 亚洲最大情网站在线观看| 国产jizz| a在线亚洲男人的天堂试看| 久久精品丝袜| 国产精品欧美亚洲韩国日本不卡| 国产精品手机视频| 成人欧美日韩| 91久久国产综合精品女同我| 日韩黄色大片免费看| 九九久久精品国产av片囯产区| 99成人在线观看| 在线欧美日韩国产| 日本人又色又爽的视频| 91精品国产综合久久香蕉922 | 亚洲日本中文字幕乱码中文 | 91小视频在线观看免费版高清| 久久中文无码精品| 性视频一区| 亚洲国产精品久久久久秋霞影院| 国产麻豆永久视频| 欧美日韩国产在线人成app| 国产精欧美一区二区三区| 噜噜噜久久| 亚洲a级在线观看| 极品私人尤物在线精品首页 | 午夜视频免费试看| 找国产毛片看| 国产精品丝袜在线| 国产精品一区二区国产主播| 蜜桃视频一区| 成人精品免费视频| 麻豆精品在线视频| 久一在线视频| 亚洲人成网址| 91综合色区亚洲熟妇p| 午夜视频免费一区二区在线看| 亚洲AV无码久久精品色欲 |