【摘要】電影網絡評分、評價在互聯網時代成為電影行業發展的重要組成部分。為了提升電影創作、市場需求與觀眾偏好三者之間的契合度,本文運用大數據采集、數據圖表分析和LDA主題模型對2021年國產電影數據進行分析研究。對豆瓣電影的評分、短評以及影評內容的研究,有利于進一步提升電影制作、市場需求與觀眾偏好三者之間的契合度,提高電影的質量和口碑。
【關鍵詞】豆瓣電影 可視化 數據分析 網絡評價
2021年豆瓣年度電影榜單于2021年12月24日發布,全球電影票房1376億元,恢復至疫情前的51%,其中中國電影票房456. 7億元,占全球票房33%,位居世界首位[1]。相較于國家電影局公布的2020年中國電影總票房204. 17億元, 2021年雖然受到疫情反復的影響,但電影票房同比仍增長了一倍[2]。
隨著互聯網的發展,電影批評從傳播機制到文本形態、批評功能都發生了前所未有的變化,涌現出多種影評形態[3]。其中豆瓣電影平臺受到了廣泛的關注,成為中國目前覆蓋面較廣、參與度較高的網絡電影評分平臺,它以去專家化的“大眾評審團”為評分用戶,采用“一人僅一票”的評分形式,設定“非正常打分”系統評判機制,防止水軍和刷分,保證了評分最大的公平性和真實性[4]。
本研究基于豆瓣大數據平臺,對豆瓣電影欄目中2021年國產電影數據進行統計分析,探討電影類型、豆瓣評分、短評、影評之間的關系,從消費者角度出發,希望能用大眾評價數據反哺電影行業的發展。
(一)研究對象
本文研究對象為符合以下五個標準的2021年國產電影:制片國家為中國,上映地點為中國,上映時間為2021年1月1日至2021年12月24日,豆瓣電影上已有評分,電影在院線上映(不含僅在網絡上映的電影)。其中將上映地點設定為中國大陸,不含港澳臺地區單獨上映的院線電影,主要原因為豆瓣電影在港澳臺地區使用頻率不高,評分數據樣本不足;上映時間限定為2021年1月1日至2021年12月24日,其一是截止日當天是《豆瓣2021年度電影榜單》發布的日期,其二是2021年12月24日至2021年12月31日上映的電影存在評分和評價的滯后性,在2022年1月其豆瓣電影評分和影評數據樣本才能達到可研究量;另外首映年份非2021年,但在2021年重映的電影不納入其中,如高分動畫電影《天書奇譚》(豆瓣評分9. 2),由于重映電影數據樣本涵蓋了自首映至重映期間的所有數據,因此不納入2021年數據研究中。根據以上標準,統計符合標準的樣本為73部影片,本文研究樣本即下文中所稱的2021年國產電影,均為這73部電影。

(二)研究思路
本研究以豆瓣電影數據為基礎,先從上映時間、電影類型、評分分布三個維度對2021年國產電影的概況進行分析,然后對電影評分與短評數量關系、電影評分與電影類型的關系進一步分析,研究其相關性,最后通過影評關鍵詞詞頻分析觀眾對電影的集中關注點。
具體過程:第一步,通過數據統計2021年國產電影上映時間的分布、電影類型分布、評分分布,從中分析得到電影上映時間的偏好及影響因素、電影類型偏好、年度電影平均得分。第二步,假設電影評分越高,影片受到的關注度越大,參與短評的人數也會越多。通過樣本電影的評分數據圖和短評數量數據圖的比對,尋找相關性。第三步,假設電影類型與觀眾的喜好相關,影響觀眾的評分,同時電影類型代表著投資商和出品方對市場和觀眾傾向的把握,因此評分高低和電影類型的數量應該趨于相同。通過樣本電影的評分數據圖和電影類型數據圖進行比對,尋找相關性。第四步,統計分析樣本電影中最受歡迎、認可度最高的前40條影評中的高頻詞匯,挖掘觀眾在觀影中的集中關注點。
在研究方法上,主要運用了大數據采集、數據圖表分析和LDA主題模型進行數據內容的分析,采用了列表、柱狀圖、折線圖、餅狀圖、詞云圖來幫助呈現數據結果。
(一) 2021年國產電影概況
1.上映時間分布
2021年國產電影上映時間全年相對平均,其中5、6、7、9月出現上映小高峰,分別占了全年國產電影的10%以上。首先,節假日仍然是電影上映時間的重要影響因素。2月份的5部電影全部貢獻在春節檔,于2月15日大年初一上映, 5月份有6部電影在5月1日勞動節假期上映, 9月份有7部電影集中在中秋節假期和國慶節假期前夕上映,而7月份則因慶祝建黨百年和暑假,電影上映率達到全年最高。其次,電影上映時間還受到了疫情的影響。8月份作為暑期檔電影經常選擇的上映時間點,在2021年卻只有1部國產電影上映,主要源于江蘇、河南、湖南、云南、四川、湖北等地受到了新冠疫情的反撲,多地政府發布了暫停電影院等密封性娛樂場所營業的通知,影響了電影上映時間的選擇。

此外,從“表1”可以看出上映時間與電影類型也有一定的關系。春節檔上映的電影《你好,李煥英》《新神榜:哪吒重生》《刺殺小說家》《侍神令》《唐人街探案3》都屬于喜劇、奇幻類型,適合春節假期合家歡一起觀看。7月1日慶祝建黨百年上映的兩部電影為紅色題材主旋律電影《革命者》和《1921》。而動畫類型的電影主要選擇在假期或者周五上映,《新神榜:哪吒重生》為大年初一,《西游記之再世妖王》為清明假期,《白蛇2:青蛇劫起》《貝肯熊2:金牌特工》為暑假期間的周五,《皮皮魯與魯西西之罐頭人》《大耳朵圖圖之霸王龍在行動》為國慶節假期,《雄獅少年》為周五。動畫類型電影的主要觀看人群為青少年,因此上映時間會同時考慮到青少年及其父母的休閑時間。
2.電影類型分布
電影類型的分類方式是依據豆瓣電影中的“類型”信息,每部電影的簡介會對其類型進行具體標注,一部電影的類型標簽不限于一種。2021年國產電影的類型主要集中為喜劇、奇幻、歷史、動作、懸疑、愛情、動畫、家庭、驚悚、科幻、紀錄片、冒險、犯罪,共13種類型。其中喜劇類型電影占比最大,達到了21%,其余超過10%的電影類型有愛情、懸疑、奇幻,其中動畫、動作、犯罪各占8%。由此可以看出,對于電影投資和出品方而言,更傾向于投資和制作喜劇類型的電影,最不傾向于紀錄片類型的電影。

3.評分區間分布
2021年國產電影的評分可按照0-1、1-2、2-3、3-4、4-5、5-6、6-7、7-8、8-9、9-10間隔1分的區間來進行統計。電影評分分布圖呈現正三角形狀,其中有30. 14%的電影集中在6-7分的區間,分別有19. 18%的電影在7-8和4-5的區間,而5 - 6分有13. 7%, 3 - 4分則有10. 96%, 8-9分和2-3分的電影均在10%以下,沒有電影在9-10、1-2、0-1分數區間。由此可見,觀眾對2021年國產電影質量的評判為大部分影片中規中矩,沒有特別出色的電影,也不存在低至0-2分的電影。

(二)電影評分與短評數量
電影評分代表觀眾對電影質量的評判,因此評分高的影片代表著高質量,高質量的影片往往會受到更多的關注,可能會吸引更多觀眾參與到電影的評分和評價中,形成一個正循環。但是通過2021年國產電影的樣本評分和短評數量數據關聯圖顯示,電影的評分高低與電影短評數量的多少沒有必然的聯系,也不具備相關性。從圖表可知,樣本1-73的豆瓣評分是呈下降趨勢的,而電影短評數量并沒有明顯的上升或下降趨勢,反而持續有幾個小高峰。根據Pearson相關系數( Pearson Correlation Coefficient)的計算方式,電影評分與電影短評數量之間的相關性為0. 353,屬于弱相關(相關強度的取值范圍: 0. 8-1. 8極強相關, 0. 4-0. 6中等程度相關, 0. 2-0. 4弱相關, 0. 0-0. 2極弱相關或無相關)。圖表中短評數量多的電影,豆瓣評分為5-6分,豆瓣評分最高的電影,其短評數量將近50000,與短評數量最多的電影相差9倍之多。因此影片的質量對觀眾參與豆瓣電影短評的數量沒有明顯相關性。

(三)電影類型與豆瓣評分的關系
觀眾對于某些電影類型會表現出一定的偏好,在評分中也會成為影響因素之一。電影類型同時代表著投資和出品方的偏好以及對市場傾向的把握,市場傾向中消費者的喜好占了很重要的地位,因此豆瓣評分高的電影,大多數應該落在占比最高的電影類型中。根據2021年國產電影類型與豆瓣評分數據圖的比對,電影類型與豆瓣評分在上升、下降趨勢上無正相關或負相關,因此兩者之間沒有必然聯系。喜劇類型占比最高,但是最高豆瓣評分并非從喜劇電影中產生,而紀錄片類型電影評分最高,在2021年的電影數量僅為1部,意味著喜劇類型電影雖然在電影市場上產出較多,但是觀眾對其滿意度不足,并未與其產出量形成正向關系。而歷史、奇幻、家庭三種類型的均分都達到了7分,但是市場產出量相對較少,尤其是歷史與家庭類型僅占6. 85%。由此說明,電影市場的某一類型影片的數量與觀眾的期待視野之間沒有形成很好的契合。

(四)從影評的關鍵詞看觀眾對電影的關注點
從每部電影的影評按“最受歡迎”進行排序,選取排序前40的影評進行關鍵詞詞頻分析。其中部分電影總影評數量不足40篇,按實際影評篇數計算,最終獲取有效影評總數量為2819篇。運用LAD主題模型對影評內容進行分析,獲得高頻詞云圖如圖所示,其中“故事”“形式”“劇情”“導演”“情感”“版權”“人物”“觀眾”“角色”“編劇”等詞占了較大的篇幅,是影評樣本中詞頻最高的一組詞。
從“熱門影評高頻詞分布”表格中的詞頻數量,可見詞頻前十的關鍵詞為“故事”“導演”“觀眾”“形式”“人物”“感覺”“版權”“劇情”“角色”和“希望”。首先,在影片內容上,劇情的故事性、人物角色、表現形式是觀眾最為關注的點,也是在影評中提及最多的方面。其次,從觀眾角度而言,更注重觀影感受和情感共鳴,同時觀眾對影片有著更多的期望并且在影評中將具體期望的內容表達出來。再者,影評中對版權問題也很重視,諸如《陽光姐妹淘》等翻拍電影,對其版權問題以及與原作比較的問題關注度較大。此外,詞頻比例超過50%的關鍵詞還包括了“鏡頭”“演員”“演技”“編劇”“形象”“臺詞”“現實”等,表明了觀眾對于影片的關注還集中在演員的演技和臺詞、特寫鏡頭、編劇劇本、與現實的關聯等。

由以上的數據分析可總結出以下三個結論:
1.院線電影上映時間的選擇涉及到多方面的因素。大部分的電影優先選擇節假日作為上映日期,主要是考慮到觀眾的休閑時間;其次是節日與電影主題的契合度,喜劇、動畫等類型的合家歡電影會選擇在春節和國慶假期上映,而紅色題材主旋律電影會選擇七·一、國慶節等有特殊意義的時間節點上映;再次,政策和突發事件也是影響電影上映時間的重要因素,疫情、政策指導都有可能導致電影提前或推遲上映。
2.豆瓣電影上的評分與短評數量沒有明顯的相關性。這意味著觀眾參與豆瓣電影短評的熱情度除了受到電影質量的影響外,還受到了觀眾的觀影偏好以及影片本身的熱度,而影片本身的熱度有可能是由電影質量極好或極差,甚至是主演、導演所帶來的。電影類型對于電影的評分同樣不存在明顯的相關性,電影市場的某一類型影片的數量與觀眾的期待視野之間沒有形成很好的契合。因此,投資和出品方在進行電影類型選擇的時候應該更多關注到觀眾的期待視野。
3.從豆瓣電影影評的關鍵詞詞頻可以看出,觀眾在觀影中尤為關注電影故事性體現,人物角色的表現力,影片表現形式,這些是影響豆瓣評分和電影評價的最重要因素。觀眾在影評中指出電影的優缺點時,也傾向于提出自己的期望以及電影可改進的地方。
電影行業的繁榮發展除了政策指導和出品方的制作以外,還有賴于觀眾的有效參與。互聯網的興盛,為大眾參與電影評價提供了極大的便利和平臺。豆瓣電影作為大眾電影的網站,可以看出一部電影從制作、上映到評價的每一步,可以為以后的電影制作提供觀眾的觀影感受和偏向的數據參考,帶來觀眾評分、評論之間互相傳播以及產生互相影響的作用。研究豆瓣電影的評分、短評以及影評內容,有利于進一步提升電影制作、市場需求與觀眾偏好三者之間的契合度,提高電影的質量和口碑。
注釋
[1]豆瓣電影.《豆瓣2021年度電影榜單》[EB/ OL].(2021-12-24) [2021-12-28]. https: / / movie. douban. com/ annual/2021? source=movie_ navigation
[2] 2020年內地電影市場票房總結:“一片慘淡中的一枝獨秀”_ TOM娛樂 https: / / ent. tom. com/202101/ 1811401609. html
[3]周旭.網絡影評的傳播機制、文化表征與價值反思[J].中國編輯, 2020 (07): 80-84.
[4]豆瓣日志.《豆瓣電影評分八問》[EB/ OL]. (2015-12 - 18) [2021 - 12 - 28] https: / / blog. douban. com/ douban/2015/12/18/3060/