石春讓 鄧林
(1.西安外國語大學 英語實驗基地,陜西 西安 710128;2.西安外國語大學 英文學院,陜西 西安 710128)
當前,在中國文學對外傳播過程中,全球化的電子商務是重要的一個傳播渠道。西方的普通消費者可以通過電商平臺購買中國文學譯介讀本,并通過電商平臺的商品評論機制反饋閱讀感受。此類消費者在一定程度上代表著廣大的讀者群體。他們不同于專業書評人,他們的評論反映了中國文學譯介讀本的真正消費者的意見。歸納總結這類讀者的網絡評論能更真實地反映出西方普通消費者對中國文學譯介讀本的接受特點(張璐,2019:81)。通過應用計算機情感分析(Sentiment Analysis)技術,可以突破人工分析的局限性,能夠高效率的批量處理大量評論數據,并進行分析歸納,因此網絡平臺的用戶評論擁有更高的研究價值(李涵昱 等,2017:51)。本研究選取近年來具有重大國際影響力的中國傳統文學作家莫言的小說為例,對葛浩文翻譯的11部莫言小說英譯本在西方電商平臺的所有購買評論進行情感分析,歸納出西方讀者群體的代表性評論,進而評判莫言小說在西方國家普通讀者群體中的接受態度與特點。
情感分析(Sentiment Analysis),又稱意見挖掘(Opinion Mining),是指能夠對文本觀點、情感以及主觀性進行計算分析的計算機信息技術。作為自然語言處理中的一條重要分支,情感分析可以在不同的文本層級上完成相應的自然語言處理任務(Pang et al., 2004:271)。應用情感分析技術,可以識別和理解他人的觀點態度,使得人們能夠積極應對網絡信息資源帶來的機遇與挑戰(Pang et al., 2008:5)。根據文本的不同層級,文本情感分析可細分為針對詞匯、句子以及篇章三個層面的情感信息識別與分類。由于本研究中的文本研究對象為用戶評論,屬于篇章層面,因此本文主要討論篇章層面情感分析的方法及原理。總體而言,針對篇章的情感分析綜合了詞匯以及句子的情感分析模式,并且在輸出結果的準確性上也大程度上依賴于詞匯以及句子的情感分析結果信度,此外,篇章情感分析還需考慮到文本上下文語境,因此篇章情感分析在方法原理上更為復雜(楊立公 等,2013:1574-1575)。
目前,針對篇章的情感分析主要有兩種方法,分別是基于情感詞典的分析方法和基于統計機器學習的分析方法(李涵昱 等,2017:52)。兩種方法各有優劣,針對不同屬性的目標文本具有不同的適用性。其中基于情感詞典的文本情感分析主要依賴預設的情感詞典來計算目標文本的情感極性并進行情感分類。一般來說,情感詞典由已標注情感值的情感詞匯單元或詞匯組合單元構成。在進行情感分析時,情感詞典可以識別和提取目標文本中的情感詞,并根據詞典數據匹配相應的單個情感詞的情感值,通過求和或加權平均等算法計算出目標文本總體的情感值,進而判斷目標文本的情感傾向。可以直接使用現有的較為權威的情感詞典,如General Inquirer lexicon,Sentiment lexicon等(楊立公 等,2013:1576)。也可以根據研究對象的特殊性構建專用的情感詞典,以保證情感計算和分類的準確性。基于情感詞典的文本情感分析方法可以快速準確地識別并計算詞典收錄詞及相應的情感值,整體操作難度也相對較低。然而,其局限性在于不能準確地計算詞典非收錄詞的情感值(楊立公 等,2013:1575)。
基于統計機器學習的文本情感分析方法主要依賴于使用機器學習模型,將已標注的文本作為訓練集訓練出文本情感分類器,并基于此分類器對新的目標文本進行情感分析。通常用于訓練文本情感分類器的機器學習模型有K近鄰算法、最大熵模型、支持向量機和樸素貝葉斯模型(李涵昱,2017:52)。其中,支持向量機與樸素貝葉斯模型在訓練文本分類器時被多數相關研究證明具有較好的效果(楊立公 等,2013:1576)。基于統計機器學習的文本情感分析方法,可以對任意詞語情感預測,但仍然不能準確有效的處理含有復雜情感的文本以及特殊領域的文本,重新訓練適配的分類器需要收集大量數據,操作難度也相對較大。因此,針對特殊文本,根據此方法是一種相對較為簡便,省時且準確的方法。
目前,情感分析主要被應用在產品評論分析,輿情分析以及信息預測三個方面(趙妍妍 等,2010:1843-1844),并已獲得較好的研究成果。
近年來,中國文化“走出去”成為中國重要的國策和主要文化潮流。在中國文化“走出去”的過程中,中國當代文學的譯介及評價是重要的工作之一。評價中國當代譯介文學的傳播質量,可以找出目前工作中的問題和不足,制定更加合適的中國文化對外傳播策略。
本文收集了英國和美國亞馬遜網站上11部莫言小說的葛浩文英譯本的所有讀者評論,基于情感分析技術,量化普通在線消費者群體對于莫言小說的情感取向,并以此作為參考,總結莫言小說在西方英語讀者群體中的接受現狀和特點。
本研究以葛浩文所翻譯的11部莫言小說的英譯本的亞馬遜英語讀者的書評作為研究對象,通過TextBlob的情感極性分析功能,將每一條書評所包含的情感態度量化,用定量分析法在宏觀層面上說明莫言小說的英譯本在英語讀者群體中的總體接受程度。基于情感分類后的讀者評論,可以篩選出讀者的共同偏好和觀點,進而反映出莫言小說在西方讀者群體中的宏觀接受特點。
本研究使用的輔助工具為TextBlob,它是由Steven Loria帶領團隊基于Python語言開發的第三方程序庫,庫中整合了Pattern與NLTK工具包,可以完成一些常見的自然語言處理(NLP)任務,如詞性標注、文本分類、名詞短語抽取、情感分析等。
1)獲取原始分析文本并進行預處理。分別從美國亞馬遜和英國亞馬遜網站上收集《紅高粱》《天堂蒜薹之歌》《酒國》《四十一炮》《豐乳肥臀》《生死疲勞》《檀香刑》《變》《蛙》《透明的紅蘿卜》《師傅越來越幽默》十一部葛浩文英譯本的讀者評論,以文檔形式分別保存,截至2019年11月5日共收集評論536條。隨后對文檔中的評論文本進行人工檢查,即替換或刪除原評論文本中無法被Python識別的字符,修正原評論文本中存在的錯誤拼寫以及重復輸入。通過以上程序可以達到人工文本降噪的效果,使得最終數據分析結果更加準確可靠。
2)TextBlob情感分析。從Python中加載TextBlob程序庫,并調用其情感分析功能。如前文所提到的,TextBlob整合了Pattern和NLTK工具包,因此它具有兩種不同的情感分析器,分別為PatternAnalyzer和NaiveBayesAnalyzer。經過實際運用發現,針對本次研究的研究對象而言,讀者評論篇幅長短不一,基于機器學習的NaiveBayesAnalyzer常常不能有效地分析長文本,對于篇幅較長的單條評論來說,容易得出完全積極或完全消極的情感值,進而以偏概全地影響最終結果。而基于情感詞典的PatternAnalyzer則不會受到目標文本篇幅長短的影響,它通過將內置情感詞典中被預先賦予情感值的詞匯與目標文本中的詞匯進行匹配,再根據加權平均的算法得出目標文本情感極性值,計算結果不會出現極端值,因此本研究選擇使用PatternAnalyzer。通過PatternAnalyzer可以得出的情感極性值的范圍在-1到1之間,1和-1為情感值的上限和下限,分別為絕對積極情感和絕對消極情感。當極性值處于0到1之間時,當前評論被視為正向/積極評論;當極性值處于-1到0之間時,當前評論被視為負向/消極評論;當極性值為0時,當前評論被視為中性評論。將經過情感分析的讀者評論以積極/消極評論為單位,歸納出兩類評論中普遍出現的觀點,可總結莫言小說在西方讀者群體中的總體印象。
通過對搜集到的536條讀者評論進行情感極性分析后,經過統計可得出表1數據。

表1 各類型評論的數量,占比以及均值
在所有評論中,正向的積極情感評論共410條,占比76.50%;中性情感評論共25條,占比4.66%;負向的消極評論共101條,占比18.84%。其中,正向的積極情感評論的情感極性均值為0.25,負向的消極評論的情感極性均值為-0.19。從情感分析得出的數據可看出,莫言小說英譯本在西方普通讀者群體中的接受情況較好,多數讀者對其作品持有積極評價。
根據分類后的讀者評論,可歸納出西方讀者針對莫言小說較為突出的正向和負向評價共同點,如表2所示,其中中性情感評論無實質內容和突出觀點,此處忽略不計。

表2 西方讀者評論中突出的正、負向觀點
通過對所有情感極性值大于0的積極正面評價進行匯總歸納,,可以總結出讀者對莫言小說的共同偏好(即在各部作品評論中均提及的積極評論),以及讀者對莫言小說持有的普遍觀點。通過歸納分析,可總結出以下幾點。
3.2.1莫言的小說讓西方讀者了解近代中國的歷史,社會,政治,文化等多元化信息
74%的正向讀者評論反映了這一觀點。從以20世紀初清政府時期為故事背景的《檀香刑》到以20世紀末新中國農村改革為故事背景的《四十一炮》,11部莫言小說反映了20世紀中國不同時期的社會現實,向西方讀者提供了一個了解近代中國歷史發展變遷的媒介。同時,莫言小說多以中國農村為故事舞臺,更加突出了近代中國動蕩變遷的歷史對普通勞動人民的影響。因此,有讀者將莫言的作品稱為“極其絕妙的卻又樸實接地氣的中國近代史詩”(Guilford, 2012)。針對小說的歷史背景,一些讀者評論中提到,莫言是一位創作型作家,將歷史事件和政治事件描寫得淋漓盡致,讓西方讀者了解到了義和團運動、日本侵華等20世紀中國具有代表性的歷史事件(Whipple, 2004),也讓西方讀者了解到了計劃生育和改革開放等中國具有代表性的社會政策(Biblioteca, 2015)。因此也有讀者認為,莫言通過小說介紹了不為西方人所知的中國農村日常生活(Thuringer, 2014)。從整體來看,莫言的小說很好的對外傳播了近代中國的人文發展歷程。
3.2.2莫言小說普遍具有幻覺現實主義色彩
21%的讀者在正向評論中共同提到莫言小說普遍具有幻覺現實主義色彩。多數讀者評論將莫言與拉丁美洲及其他地區的魔幻現實主義文學作者進行橫向對比,如加西亞·馬爾克斯、若澤·薩拉馬戈、薩爾曼·魯西迪、君特·格拉斯以及威廉·福克納等。有讀者稱“莫言是中國的加西亞·馬爾克斯”(Snaporaz, 2016)。有讀者表示《生死疲勞》通過魔幻現實主義手法講述一個村鎮在半個多世紀中的人民生死,婚姻和人際關系的變遷容易使人聯想到《百年孤獨》中布恩迪亞家族七代人的百年傳奇故事(Profane,2012)。而《豐乳肥臀》中對上官魯氏和她八個女兒將近一個世紀的命運描寫與《百年孤獨》在敘事對象上也存在共同點(Clara,2013)。同時,也有讀者提到薩爾曼·魯西迪的《午夜的孩子》,將其與《生死疲勞》作對比,認為兩部作品在描述社會歷時變遷上具有相似性(Emilsson, 2014)。在《四十一炮》的評論中,有讀者表示《四十一炮》是對君特·格拉斯《鐵皮鼓》的致敬,兩部作品均通過超現實的手法描繪了一個精神心理不愿成熟的主人公所感知到的成人世界(Eustathios,2014),以此揭露成人世界中復雜的矛盾沖突。由此可見,莫言獨特的寫作風格引起了多數西方讀者對于魔幻現實主義的共鳴。總體而言,西方讀者對于莫言小說的寫作風格持欣賞接納的態度。
3.2.3莫言和他的作品因2012年諾貝爾文學獎在西方獲得了廣泛的知名度和影響力
28%的讀者都在正向評論中提到,他們是通過諾貝爾文學獎得知莫言,并以此為契機開始接觸莫言的小說。誠如一些讀者所說,在2012年諾貝爾文學獎頒發之前,并不知道莫言這位中國作家(Brunyate, 2012),此后才開始購買和閱讀莫言的英譯小說。在西方讀者群體中,比起近現代中國大陸本土作家,外籍華裔作家歷來受到的關注度和流行程度更高,如譚恩美、鄺麗莎等,西方讀者從書籍中了解到的“中國元素”大多來自這些作家的作品(cotlar, 2012)。毫無疑問,諾貝爾文學獎對于莫言小說對外傳播的推進作用是巨大的,不僅使得莫言的小說加速進入了西方書籍市場,而且也讓西方讀者有機會了解到一位中國大陸作家帶給他們的與以前不一樣的閱讀體驗和原汁原味的中國故事。
相比于正面積極評論,負面消極評論數量較少,僅占不到兩成。匯總所有情感極性值小于0的負向消積評論,可以發現讀者對莫言小說普遍持有的批評觀點有以下幾點。
3.3.1小說中的人物名字難記
44%的負向評論中指出,小說中的人物名字難以記住,常常無法將出場人物與名字對應起來,因此造成了一定程度上的閱讀困難。一位讀者說,對于非中文母語的西方人來說,難以跟進每一個人物在曲折故事情節中的走向,閱讀體驗欠佳(Roth, 2013)。
3.3.2小說存在多處繁復的描述
11%的負向評論中指出,小說中有時對人物和場景存在過度描寫,對某些事物存在重復描寫,這使得故事稍微顯得冗長。有讀者在評論中表示,《紅高粱》中有非常多對于“紅高粱”的描寫,即使已經明白了這一個意象所包含的象征意義,因此閱讀時會有冗長和頻繁重復的感覺(Stauffer,2013)。在《豐乳肥臀》中,對主角迷戀乳汁這一現象有不斷重復的描寫,使部分讀者感到乏味(BlueDog,2013)。
3.3.3小說中太過殘酷的故事情節
40%的負向評論中指出,小說中一些場景和情節充滿了荒蠻和暴力,其中對人性太過現實的刻畫令讀者感到壓抑,甚至難以接受。部分讀者在評論中稱,《四十一炮》中刻畫出的貧窮,貪婪和腐敗令人難以繼續閱讀下去(Woodside, 2013)。《豐乳肥臀》中的一些描寫性詞語令讀者感到不快(Margo, 2014),甚至部分讀者認為這樣的詞語選擇有損女性的形象,是對女性的詆毀(Kline ,2014)。《紅高粱》中一個接一個的血淋淋的畫面難以讓人感到放松,即使這樣的描寫確實幫助讀者體會到了當時中國受到日本侵略時人民的苦痛(pripollg ,2012)。
本研究表明,經過情感分析后的西方電商平臺讀者評論顯示,莫言的11部英譯作品在西方普通英語讀者群體中的接受情況較好,約八成讀者對其持積極的接受態度。原因在于,一方面,莫言小說內容多數以中國近代歷史為基礎,介紹了不少西方讀者相對較為陌生的中國近代大事件,因此激發了西方讀者的閱讀興趣。另一方面,莫言小說的寫作風格類似于西方讀者所熟知的魔幻現實主義風格,給西方讀者帶來了一種熟悉卻又新穎的閱讀體驗。經過情感分析后的西方電商平臺讀者評論還表明,約二成讀者對其持消極的接受態度。原因在于,莫言小說中包含的民族性或地域性的文化成為西方讀者的閱讀障礙之一,具體表現在難記的人名、繁復的人物和場景描述風格、太過殘酷的故事情節等。本研究也表明,情感分析技術可以為中國文學作品的譯作在西方受眾接受效果分析研究提供可靠的客觀量化標準。因此,將計算機自然語言處理技術應用到譯介文學書籍西方受眾接受效果分析的研究中是具有一定的可行性,尤其為中國知名鄉土作家(如賈平凹、阿來)作品的對外譯介提供借鑒。