IMDb電影影評之單類神經網絡與改良型CNN模型準確率差異性研究

2021-07-25 16:24:27張逸方吳佩芬

電影評介 2021年7期

張逸方　吳佩芬

文字探勘（Text Mining）是自然語言處理（Natural Language Progressing，簡稱NLP）領域的研究重點，也是AI人工智能與語言學的學習分支。伴隨著網絡時代的來臨，越來越多的人在網絡上發表自己的觀影意見，有許多學者運用文字探勘方法，搜集網絡上的影評數據，進行文本情感分析。

配合網絡與社交平臺的快速發展，電影的評分網站也成為在線參考電影信息和表達影評意見的重要平臺，電影評分網站中，又以IMDb（Internet Movie Database）在全球最具代表性與影響力。IMDb成立于1990年，囊括了全球幾乎所有電影及演員、導演、劇情、影評等訊息，共計約四百多萬條作品數據。

文本情感分析的方法眾多，主要途徑可分為兩種[1]，一種是“詞匯法”[2][3]，另一種是“機器學習法”（machine learning method）[4]，“詞匯法”從語言學的角度出發，以專家分類的情緒詞為基礎，分析文本情感傾向[5];“機器學習法”則將大量人為判斷的訓練數據，進行特征選取與模型的建立，利用機器自動判斷數據意見傾向。在多年的發展下，兩類研究方法不斷地互相影響，累積了諸多的資源、模型與數據庫。

配合深度學習技術的演變，學術界也開始使用神經網絡的概念進行文本分析，并大量運用在電影影評分析領域。本研究以IMDb的影評評論為文本對象，提出一種改良型卷積神經網絡（Convolutional Neural Network，CNN）的模型架構，比較不同神經網絡架構、層數以及參數是否會影響到模型的準確率。

一、相關研究

（一）應用WEKA于電影評論之機器學習演算

2014年學者藉由數據探勘工具WEKA進行數據探勘，進行電影評論分類準確性實驗[6]，考慮算法及各自參數均會大幅影響最后成效，各個不同算法與參數的組合數量讓人難以選擇，WEKA工具利用貝氏優化（Bayesian optimization）的創新做法，為一種完全自動化的方案，實驗結果發現，其模型準確率約為80%，如圖1所示。

（二）類神經網絡原理

類神經網絡（Artificial Neural Network， ANN）為基于腦以及神經網絡基礎而發展的信息處理技術，為人工智能的延伸應用。類神經網絡因為具有推理、記憶、容錯等特性，也可以說是一種特殊技術的統計應用，它不需要關于數據的分布假設，具有建構復雜非線性與連續函數映對問題能力等特色[7]，能處理許多過去統計方法無法處理的非規則性問題，不局限在影像、文字、語音等領域，在商業領域也有很大的作用。[8]

類神經網絡是模仿人類神經元結構之概念，其神經元反應的基本邏輯，包含輸入層（a1～ai）、權重（w1～wi），輸入乘上權重之后加總（∑w*a），便可得到神經元的刺激強度，接著經過函數（f）轉換以及調節刺激強度的閥值（b），即可得到輸出的神經元刺激強度，數學公式如圖2。研究者基于神經元操作模式，發展出單層神經網絡，模型概念如圖3。[9]

多層模型中如圖4，隱藏層的神經元個數和層數可以由研究者自行決定，一般而言，當隱藏層及神經元越多，處理非線性的問題能力越強。[10]

（三）類神經網絡在電影預測之應用

過去類神經網絡模型在電影產業的應用很多，Ramesh and Dursun[11]曾運用統計方法與類神經網絡，創建電影票房預測的模型并進行比較，發現類神經網絡的模型較佳;鄭堅等人[12]提出一種基于回饋神經網絡的電影票房預測模型。發現針對神經網絡波動性的特點，對預測模型的輸出結果進行改進之后，輸出結果既能更可靠地反映電影在上映期間的票房收入，又能指出電影票房的波動范圍;陳增艷[13]為了緩解卷積神經網絡在計算和網絡訓練過程中出現的“過擬合”現象，尋找合適的Dropout值降低過擬合問題，在一定程度上參照了協同過濾算法中的相似度計算，發現研究評分預測的準確度被大大提高;王錠等人[14]提出一種基于卷積神經網絡的電影評論情感分類模型，將卷積神經網絡與詞向量相結合，并與SVM等傳統機器學習方法進行對比實驗。實驗結果表明，基于卷積神經網絡的文本情感分析模型有較高的準確率。

綜觀以上研究方法，目前相關研究中，多數基于神經網絡模型結構進行微調改進后，進而以改良模型預測電影票房及評論;本研究將借由建構改良型CNN模型，建構IMDb影評分析系統，和以往研究不同的是，本研究考慮模型結構全連接層層數以及神經元多寡對準確性的影響，經由各種神經網絡組合實驗，找到準確性優化研究，提升模型應用之效益。

二、研究設計

（一）卷積神經網絡之模型概念

卷積神經網絡（Convolutional Neural Networks，CNN）為神經網絡的分支之一，核心為沿用了多層感知器（Multilayer Perceptron，MLP）的結構，由輸入層（Input）、卷積層（Convolutional Layer）、池化層（pooling）、全連接層（Fully-connected Layer）組成。由Kim[15]提出的CNN短文本分類模型結構如圖5所示。

本研究將建立TensorFlow的訓練環境，使用Keras作為架設模塊的基礎，以Keras建立神經網絡進行深度學習訓練。

（二）研究數據與步驟

本研究采用IMDb電影評論情感分類數據庫中共25000份電影評論作為分析數據[16]，本研究實驗分為兩個部分，第一部分為多層模型實驗，第二部分為神經元數實驗。其中多層模型實驗主要目的為比較全連階層數對單一類神經網絡與改良型神經網絡準確性差異分析，而神經元數實驗目的為了解模型參數的改變對準確度的影響，針對模型參數，如卷積層、濾波器、卷積核大小等，了解不同模型參數設定對準確度的影響。研究步驟如圖6所示。

（三）研究參數

研究參數直接影響最后的模型結果，表1表2列出本研究單類神經網絡模型與改良型CNN模型中，欲研究之參數與對應的參數值。

三、研究結果

為了了解本研究提出之單類神經網絡與CNN改良型模型的準確率與模型性能，分別將進行兩模型之對比實驗。

本研究首先針對多層模型實驗的準確率進行比較，兩模型準確率變化如圖7所示。改良型CNN模型中，整體模型穩定性較單類神經網絡模型高，而卷積層數的改變則對模型準確率的改變不明顯。

另外針對神經元實驗的兩類模型準確率，不同神經元數對模型準確率變化比較如圖8。改良型CNN模型中，濾波器數的改變對準確率有明顯變化，而改良型CNN模型中，其卷積核大小的改變則對準確率的改變不明顯。

結語

本研究以IMDb電影評論為數據，基于過去WEKA對電影評論算法的模型準確度評估，提出以類神經網絡為基礎的單類神經網絡與改良型CNN模型，由此實驗了解如何改變關鍵參數，找到可信賴模型的準確度區間，避免未來研究者在選擇參數時造成過高或過低的準確率。研究發現，單類神經網絡在參數較少時，其模型準確率較高，而改良型CNN模型層與層之間為局部連接的特性，模型可承受較多的參數設定，如多神經元數與多層數，其模型穩定性及準確性均較高，且基于文字探勘的特性，可發現CNN之濾波器并不需要過多的濾波器數，即可達到不錯的準確率。

自然語言學習中的文字情感分析的研究仍存在許多問題，需進一步討論，但本研究發現，文字情感分析可用不同的類神經網絡模型進行評估，可提高可信賴度的準確率，后續將再透過不同的類神經網絡模型進行模型架構之適用性比較。

參考文獻：

[1]Serrano-Guerrero，J.，Olivas，J.A.，Romero，F.P.，&Herrera-Viedma，E.Sentiment analysis：A review and comparative analysis of Web services[ J ].Information Sciences，2015，311：18-38.

[2]Taboada，M.，Brooke，J.，Tofiloski，M.，Voll，K.，& Stede，M.Lexicon based methods for sentiment analysis[ J ]. Computational Linguistics，2011，37;267-307.

[3]Turney P，Littman M.Measuring praise and criticism：inference of semantic orientation from association[ J ].ACM Transactionson Information Systems，2003，21（4）：315-346.

[4]Boiy，E.，& Moens，M.-F.A machine learning approach to sentiment analysis in multilingual Web texts[ J ]. Information Retrieval，2009，12（5）：526-558.

[5]Xu R.F，Wong K.F，Xia Y.Coarse-Fine opinion mining-WIA in NTCIR-7 MOAT task[C]//Proceedings of NTCIR 2008：307-313.

[6]A data mining experiment：movie reviews classification using WEKA.[EB/OL].[2019-11-15]https：//www.stefanoscerra.it/movie-reviews-classification-weka-data-mining/.

[7]Tan S.，Zhang J. An empirical study of sentiment analysis for Chinese documents[ J ].Expert Systems with Applications，2008，34（4）：2622-2629.

[8]Vellido，A.，Lisboa，P.J.G.and Vaughan，J.Neural Networks in Business：A Survey of Applications（1992-1998）[ J ]. Expert Systems with Applications，1999，17：51-70.

[9]葉怡成.應用類神經網絡[M].臺北：儒林圖書公司，2001.

[10]Hearn，D.，&Baker，M.P.Computer graphics[M].Englewood Cliffs，NJ：Prentice-Hall，1986.

[11]Sharda，Ramesh and Delen，Dursun.Predicting box-office success of motion pictures with neural networks[ J ]. Expert Systems with Applications.2006，30（2）：243-254.

[12]鄭堅，周尚波.基于神經網絡的電影票房預測建模[ J ].計算機應用，2014，34（3）：742-748.

[13]陳增艷.基于卷積神經網絡的電影推薦模型研究[D].大連：大連海事大學，2018.

[14]王錠，杜紅等人.基于深度神經網絡的電影評論情感分類研究[ J ].電腦與信息技術，2019（4）.

[15]KIM Y.Convolutional neural networks for sentence classification[C]//Proceedings of Conferenceon Empirical Methods in Natural Language Processing.Doha：[s.n.]p.1746-1751，2014.

[16]林大貴.TensorFlow+Keras深度學習人工智能實務應用[M].臺北：博碩文化，2017.