伍婷



21世紀以來,“移動互聯網的應用普及,令中國電影產業鏈體系完善并朝向數字化方向發展”[1]。電影評論主陣地也由紙質媒介轉移至網絡媒介,自出機杼的專業化影評不再獨領風騷,眾聲喧嘩的大眾化點評風起云涌,“電影評論功能與觀眾的聯系更加緊密,具備參與性、互動性和大眾性特征,不再局限于藝術層面的分析”[2]。面對成千上萬條沒有形成整合意見的評論,動畫成功與失敗的因素到底有哪些無從知曉,更無法短時間內對大數據進行分析整合,因而對動畫電影用戶評論數據的典型意見挖掘(Opinion Mining)就顯得十分必要。
本文基于電影網站平臺,對用戶評論數據進行典型意見提取。用數據做支撐,結合用戶評論數據與專業影評,進行科學與藝術層面的綜合分析。從動畫電影內容共創的視角,對大數據時代動畫電影用戶評論進行典型意見挖掘分析。
一、動畫電影評論典型意見挖掘
(一)典型意見挖掘的必要性
如果從1941年中國第一部動畫電影長片《鐵扇公主》算起,“20世紀后60年間中國僅生產了13部長片”[3]。以往形成的創作模式和經驗在面臨市場檢驗時弊端顯露,雖開始了艱難的技術探索,卻忽視了廣大受眾的需要和訴求,由此導致眾多商業大片折戟沉沙,票房慘敗。
長期以來,紙媒上的專業影評幾乎成為觀眾觀影與否的依據,同時也反作用于動畫電影的創作,對中國動畫的發展和繁榮居功至偉。但毋庸諱言,專業影評也有其局限性。專業影評屬個案分析,具有個人傾向性和主觀臆斷性,對意欲了解影片質量的普通觀眾而言,有可能存在誤導。而互聯網的普及和大數據的發展,使越來越多的用戶習慣于將自己的觀影意見發表在網上,形成海量的用戶評論數據,對意欲觀影者具有一定的參考價值和導向作用。
《西游記之大圣歸來》(以下簡稱《大圣歸來》,2015)和《哪吒之魔童降世》(以下簡稱《哪吒》,2019)代表了中國動畫電影的發展趨勢,也是傳統題材現代演繹的代表作品。兩部作品無論在形式還是內容上都有相似之處,具有樣本分析的價值。因而很多學者從專業角度對兩部影片給出了評價:認為《大圣歸來》的成功得益于“題材創新、故事去低幼化、表現普世化”[4];“故事打動人心,角色塑造鮮明、具有人性情懷,但尚未能全面解決影片的統一性和風格化問題”[5]等;認為《哪吒》的成功在于“內容制作精良、人物形象及作品精神內涵符合受眾審美心理需求”[6]等。雖然專業影評具有一定的影響力,但因其傳播范圍有限,普通觀眾更傾向于參考豆瓣、貓眼電影等平臺的用戶的綜合評分及評論。另外,專業評論多呈現出評論者的主觀判斷,是針對個案的分析,難以代表普通觀眾的觀感,且缺少科學依據。
數量龐大的受眾意見對于投資人和創作者而言舉足輕重,這是動畫電影的商業屬性所決定的。而互聯網電影評論網站中用戶的評論數據,是大數據時代賦予動畫電影研究者的重要信息。科學地運用大數據,對數以萬計的用戶評論進行典型意見挖掘,是研究受眾的重要方法之一。
典型意見挖掘可在短時間內使用戶快速了解產品或服務的優劣,從而做出消費決策。還可為生產者反饋用戶意見信息,進一步優化產品。在內容為王的“互聯網+”時代,對比相關性推薦和精準營銷,“用戶更在乎同類用戶的親身體驗及反饋,例如看過同一部電影用戶的評價、評分”[7]。因此,無論是點評網站、電商平臺還是各大論壇都出現了針對產品或服務的性能、功能及質量等客戶評論[8],并且隨著大數據研究的興起,有關評論數據挖掘的研究逐漸成為熱點。“產品特征詞提取、用戶情感傾向分析、數據挖掘算法、評論挖掘應用等研究層出不窮,主要集中在產品評論文本挖掘技術、方法及應用”[9]等方面。在動畫電影評論中,用戶除了會對影片總體評價外,通常也會針對其構成因素發表觀點,如人物設計、場景設計等細粒度信息。而這些信息同樣受到重點關注,值得研究者挖掘分析。因每個觀眾對動畫電影的喜好度會有偏差,需要對海量的評論數據進行全方面的挖掘,分析評論中的意見內容,才能使用戶更快速、直觀、準確的發現評論中有價值的信息,而不是背本趨末。
(二)典型意見挖掘的方法
動畫電影評論數據的典型意見挖掘是通過計算機技術對互聯網上眾多用戶的評論數據進行清洗、分詞、歸類、聚合典型意見的過程。典型意見挖掘早在1997年由學者哈齊瓦斯洛(Hatzivassiloglou)等人提出,隨著互聯網發展及對文本分析需求的不斷增加,典型意見挖掘逐漸成為數據挖掘中的重要研究領域,成為UGC(User Generated Content:用戶原創內容)應用中的重要組成內容。典型意見挖掘是在分詞的基礎上,將詞匯通過預訓練的詞向量模型轉化為能被神經網絡理解的向量。在此基礎上,通過K-means聚類算法和依存文法分析,呈現出聚類后的典型意見。這些典型意見以標簽短句的形式出現,包含了多個語義相近但表述不同的評論語句,直觀地展現出評論者的具體意見。
通常,對典型意見挖掘的第一步是提取評論標簽,即從評論中提取核心關鍵詞,也是對評論數據分層拆解的核心環節。這種關鍵詞語的提取,可以通過有監督學習和無監督學習兩大機器學習類別去實現。基于監督學習的方法需要大量的人工標注,一般商品類的評論都傾向于對商品的某種特征做出評價。而動畫電影屬于文化藝術產品,不同的人感受不一,對不同類型的電影考量因素也不同,很難利用標注好的語料,對各種模型進行預測。而對于無監督學習而言,大部分基于統計學原理,采用TF-IDF方法,對大量文本中出現的重要詞匯進行重要度打分,從而得到批量文本中的關鍵詞語。動畫電影評論的典型意見挖掘,主要包括數據獲取及清洗、中文文本分詞、提取關鍵詞等技術。利用結巴(jieba)分詞進行中文文本分詞、TF-IDF提取關鍵詞、word2vec淺層神經網絡獲得詞向量;通過文法分析和一定的抽取規則,獲取備選的典型意見的集合;再通過K-means聚類算法,將語義相同但表達不同的典型評論意見歸集并計算其聚類中心,返回與聚類中心最近的一條評論,從而形成最終的典型意見。
(三)動畫電影評論維度的獨特性
與其他領域評論數據相比,動畫電影評論在典型意見挖掘的方法上沒有顯著差異。它在評論維度中區別于其他產品,不但具有分析的樣本價值,且具有自身的獨特屬性。隨著數字技術發展,動畫制作介質產生了巨變。紙質制作工藝被計算機技術代替,動畫與電影的界限也逐漸模糊,但依然有本質區別。“動畫”是以造型手段為載體逐個拍攝而成的影像作品[10],是重構素材與異質化物質的過程;而“電影”在現實基礎上,按照攝影機每秒鐘運行24格的速度準確記錄發生的全部動作,由活動照相術和幻燈放映術結合發展起來的一種連續的影像畫面。另外,從觀眾視覺和心理接受角度來看,動畫夸張、變形的本體特征區別于電影的逼真、寫實性特征。[11]因此,動畫電影與一般電影的區別也使動畫電影和一般電影的評論維度產生區別。動畫電影角色設計的夸張和趣味,場景設計的幻想性和吸引力,動作設計的夸張、變形,畫面的唯美與夢幻等與一般電影呈現有顯著差異。因此,單獨對動畫電影評論進行典型意見挖掘的分析,具有一定的實踐應用價值和必要性。
目前,對用戶評論典型意見的挖掘技術在電影評論網站中還未得到廣泛應用。只有個別學者針對影評數據,進行電影輿情與風險監控研究[12]及電影推薦“算法”分析研究[13]等。大眾點評和美團根據用戶不同的評價維度,提取的典型意見標簽值得電影評論網站借鑒參考。動畫電影與一般產品、服務行業不同,其評論不僅包括作品創作過程,還包括相關創作人員身份要素。因此,借鑒大眾點評及美團網用戶評論典型意見挖掘內容,綜合觀眾對動畫電影的普遍關注點,以及個別觀眾的個性化需求,結合動畫自身屬性,可將用戶評論分為創作者維度、作品維度和主觀維度等三個宏觀維度。在此基礎上,每個宏觀維度可細分出多個具體維度。
如圖1所示,創作者維度包括導演、編劇等;作品維度包括形式和內容兩個層面,形式包括畫面風格、角色設計、場景設計、視覺效果、特效設計等,內容包括角色性格、角色行為、故事情節、音樂、臺詞等;主觀維度是用戶評論中最具個性化的維度,包括是否推薦、滿意程度等標簽。動畫電影評論作為一種特殊的內容文本,從自然語言處理的角度來看,它是專業影評和短評的綜合體。由于專業影評相對復雜,且目前技術存在局限,本文主要針對短評文本進行典型意見挖掘分析。
二、影評網站電影評論典型意見挖掘
(一)影評網站用戶評論分析
隨著互聯網的迅速發展促使電影評論網站在國內外盛行,比較有影響力的電影評論網站有Rotten tomatoes、IMDb、豆瓣電影、貓眼電影、時光網等。雖然國外的電影評論網站早于中國,且評分機制相對成熟,但因語言、政治、經濟等差異,導致用戶使用呈現顯著區別。由于《大圣歸來》和《哪吒》在Rotten tomatoes和IMDb上的評論人數過少,無法代表海外觀眾的整體意見,因而不在本次研究范圍之內。
豆瓣網、時光網和貓眼電影是國內較有代表性的電影網站。貓眼電影對《大圣歸來》的用戶評論約111.3萬人,評分高達9.3分;《哪吒》的用戶評論約340萬人,評分高達9.6分。時光網中《大圣歸來》的用戶評論數約2.7萬人,評分為8.1分;《哪吒》的用戶評論數共約7193人,評分為8.3分。豆瓣電影中《大圣歸來》的用戶評論數約53萬人,評分為8.3分;《哪吒》的用戶評論數約124萬人,評分為8.5分。①
通過上述可知,兩部影片在國內影評網站中的總體評分較高,在音樂、畫面、導演、故事等各方面表現優異。但很難在短時間內從龐大的評論數據中獲取用戶評論意見傾向和需求,需通過典型意見挖掘動畫電影存在的具體優缺點和用戶需求點。貓眼電影和時光網主要以打造網絡購票系統和在線播放來獲取盈利為目的,電影評分與評論的真實性相對較弱。特別是時光網評論數據樣本量明顯不足。因此,本文以豆瓣電影的用戶評論數據進行典型意見挖掘分析。
(二)豆瓣電影用戶評論典型意見挖掘方法
豆瓣電影用戶評論具有典型代表性,但對數據公開展示數量有一定限制,無法抓取全部評論數據。獲取《大圣歸來》和《哪吒》兩部影片的用戶評論數據源,主要通過以下步驟實現(如圖2所示)。
如圖2所示,本文首先采用了爬蟲工具爬取豆瓣影評數據。用數據爬蟲工具抓取評論數據主要有兩個指標:一是用戶的電影評論數據;二是每條評論的星級評分。數據爬取后用ROSTCM6對數據進行一般性處理工作,將爬蟲后的數據進行清洗,清除數字、英文字符和一些空值文。數據清洗后利用結巴分詞模塊將獲取到的文本進行中文分詞(Chinese Word Segmentation)。對評論數據分詞后,需要進行評論關鍵詞提取。關鍵詞提取往往可以通過幾個關鍵詞窺探整個文本的主題思想。本文主要運用結巴分詞中基于TF-IDF算法的關鍵詞抽取;接著采用word2vec給定的語料庫,通過優化后的訓練模型快速有效地將一個詞語表達成向量形式。得到詞向量后,通過依存文法分析一定的抽取規則,獲取備選的典型意見集合;最后利用k-means算法進行聚類,將備選的典型意見集合成不同的類。盡可能使語義相同但表達不同的典型意見歸集在一起,并計算其聚類中心,返回與聚類中心最近的一條評論,從而形成數條典型意見。
(三)典型意見挖掘結果
通過對《大圣歸來》和《哪吒》的用戶評論數據進行典型意見挖掘運行結果可知,《大圣歸來》共挖掘221組典型意見,《哪吒》共挖掘305組典型意見。①兩部影片由于敘事題材、影片類型、敘事模式等具有高度相似性,用戶評論的典型意見也存在相似之處。對比兩部影片數據挖掘結果可知,觀眾相較于《大圣歸來》更喜愛《哪吒》,通過《哪吒》對國產動畫信心倍增。
如表1所示,動畫電影評論相比一般電影,對創作者評論維度關注度較低,沒有形成典型意見。主要典型意見集中在作品維度和主觀維度。在作品維度分析中,兩部影片的鏡頭語言、畫面風格、場景設計、視覺特效等制作精致,受到觀眾一致好評;在人物設定方面,“大圣”“江流兒”“哪吒”“敖丙”“太乙真人”等人物創意超出了大眾預期;作品內容上兩部影片呈現出微妙差異。從主觀維度分析,受眾對兩部影片整體滿意,會推薦其他觀眾觀看。一方面說明受眾對經典IP改編動畫電影的支持和期待;另一方面表現了受眾對經典故事和形象的深厚情懷,說明中國商業動畫電影制作技術已基本滿足大眾審美預期。
其一,兩部影片都根植于中國經典IP進行創意改編。無論是角色塑造還是劇情的顛覆性改編,都得到觀眾的認可。被認為是用好萊塢故事模式講述中國版超級英雄故事,融合了中西方敘事語言和文化,講述了英雄自我救贖和成長的故事。兩部影片都從現代人的視角映射了普通人的生活現狀、內心需求和行為方式。通過江流兒的執著、大圣的自我救贖,使觀眾跳出了原型故事的束縛,表現了現代人與命運積極抗爭的奮斗精神,引發觀眾的共鳴。
其二,打破了以往傳統式英雄主義“高大全”式的人物形象。英雄不再是剛直不阿、不畏權貴、一心為民、沒有私欲的臉譜化形象,而是能夠真正深入大眾內心的“有血有肉”、充滿人性的“接地氣”英雄形象。將神話傳說人物“普通化”“大眾化”“世俗化”,用現代人的說話方式、口音、行為習慣、表演動作、思維方式去表現動畫角色,無疑與現代觀眾的生活緊密貼合,使觀眾實現移情并沉浸于故事中。
其三,國產動畫電影重新進入觀眾視野,被受眾認同并予以期待。傳統經典IP故事改編的動畫被稱為“國產良心之作”。因而,對經典IP的創意改編深受觀眾的認可和推薦。同時,“制作精良”“國漫崛起”已然表現了中國觀眾對國產動畫良性發展趨勢的渴望與信任。《哪吒》在主題表現上形成了“我命由我不由天”的精神內核,相比單純的英雄救贖主題更有敘事側重點。
其四,兩部影片贊譽多過詆毀,但現實問題仍然多而顯著。《大圣歸來》和《哪吒》均存在劇情薄弱的問題,特別在故事情節上略顯生硬,無法擺脫影片“笑點低俗”“刻意”等現實問題。這也是中國動畫電影敘事重整體而忽視理性分析的表現之一;另外,“虛高的口碑”也是受眾從眾心理的表現之一。人云亦云地評價不在少數,需要觀眾冷靜地對影片做客觀評價。過高的評分、評價不利于國產動畫電影的長遠發展,應該引起重視。
(四)動畫電影評論典型意見挖掘的局限
傳統的專業影評強調評論者個人的主觀判斷,而典型意見挖掘技術對動畫電影評論大數據進行挖掘,可辨偽去妄、客觀地了解受眾審美心理需求、觀影習慣和偏好,也可彌補專業影評個案分析和主觀判斷的缺陷。因此,用數據說話,從受眾的視角分析影片實際問題,對動畫產業創作具有重要應用價值和指導意義。本文對豆瓣電影中具有代表性的動畫電影《大圣歸來》和《哪吒》進行典型意見挖掘,得出了與專業影評不同的分析結果。但典型意見挖掘結果不是萬能的,也存在一定的局限和誤差,不能替代專業影評的重要位置。
第一,互聯網用戶群體龐大,評論信息紛繁復雜,具有一定的隨意性和模糊性。典型意見挖掘通過互聯網用戶評論的文本數據分析受眾的審美心理需求,具有一定的客觀依據和數據支撐。但也存在用戶評論業余,受群體心理趨勢影響盲目跟風等現實問題。而專業影評是從專業角度對影片進行分析,雖然有主觀臆斷的成分,但分析具有一定的專業說服力和權威性,從側面補充了受眾典型意見專業性不足和從眾心理的問題。
第二,用戶評論數據典型意見的準確性有待進一步提高。首先,由于典型意見挖掘技術的局限性,目前中文分詞的準確性以及詞向量的效果對典型意見挖掘結果存在一定的影響。網絡流行詞庫的更新遲緩,也會導致典型意見挖掘準確性降低;其次,電影評論網站對用戶數據獲取有一定的限制,普通研究者難以將網站上所有的用戶評論數據全部獲取。因而存在樣本數不足,分析結果不具有普適性等現實問題;再次,長篇評論相較于短片評論更豐富且專業性更強,但目前的計算機技術難以對長篇文本進行快速有效的提取,典型意見挖掘難以應用于大批量長篇用戶評論數據中。
結語
綜上所述,動畫電影典型意見挖掘確實可以彌補專業影評的缺陷,這種技術從受眾的視角來看充分展現動畫電影的優劣并作出了相對客觀、真實的評價。但目前對動畫電影評論的典型意見挖掘技術,包括評論本身都存在一定的局限,無法挖掘出完美的結果。只有在充分利用計算機技術、掌握大數據的基礎上,不斷對動畫電影用戶評論數據進行典型意見挖掘技術的探索、改進,才能更好地體現典型意見挖掘在動畫產業中的重要應用價值。而用戶評論的典型意見挖掘是從受眾的視角對影片進行分析,難以取代專業影評的重要地位。因此,在充分掌握科學依據的基礎上,綜合主觀層面分析動畫電影的藝術要素,才能相對準確的分析影片的優劣。就此而言,更需要將東方思維的感性頓悟與西方思維的理性分析相融合,才能得出相對全面的評價結論,為中國動畫電影的創作和發展助力。
參考文獻:
[1]艾媒報告.2019全球及中國電影市場運行大數據與產業布局策略研究報告[EB/OL].(2019-08-16)[2020-01-19] https://www.iimedia.cn/c400/65754.html.
[2]王宜文,李璠玎.電影評論的多維度變革與重構[ J ].浙江傳媒學院學報,2010(04):66-71.
[3]楊曉林,張語洋.新中國動畫70年的敘事策略嬗變論略[ J ].民族藝術研究,2019(06):28-37.
[4]蒲劍.用普世的手法講好中國故事——《西游記之大圣歸來》的啟示[ J ].當代電影,2015(09):44-45.
[5]陳可紅.《西游記之大圣歸來》:敘事回歸與人性情懷[ J ].電影藝術,2015(06):59-61.
[6]王子鑒.從《哪吒·魔童降世》看國產動畫電影的發展[ J ].傳媒,2019(21):41-43.
[7]美團算法團隊.美團機器學習實踐[M].北京:人民郵電出版社,2018:104.
[8]宋君,戰洪飛,余軍合.基于網絡評論數據的產品設計綜合評價模型的構建[ J ].計算機應用與軟件,2019(01):88-93,110.
[9]韓忠明,李夢琪,劉雯,張夢玫,段大高,于重重.網絡評論方面級觀點挖掘方法研究綜述[ J ].軟件學報,2018(02):417-441.
[10]聶欣如.“動畫”的概念[ J ].文藝研究,2017(08):109-116.
[11]張乃迪,鐘遠波.數字技術背景下動畫與電影界限的探索[ J ].當代電影,2018(07):161-164.
[12]倪萬.基于大數據的電影輿情數據挖掘與風險監控研究[ J ].當代電影,2016(02):71-76.
[13]王曉通.大數據背景下電影智能推送的“算法”實現及其潛在問題[ J ].當代電影,2019(05):64-70.