馬換娜
(鄭州大學 外語學院,河南 鄭州 450001)
“走出去”文化戰略下中國網絡小說英譯本的語料庫檢索分析
馬換娜
(鄭州大學 外語學院,河南 鄭州 450001)
“走出去”文化戰略下,學術研究者一直致力于把中國文學作品推向世界。近年來網絡小說也開始英譯,深受國外讀者喜愛。基于此,試圖分析網絡小說英譯本,并將其與英語原生文本進行對比。從武俠世界選取《七殺手》英譯本,運用AntConc 3.2.3等語料庫檢索分析工具,從詞匯密度、主題詞表、詞圖、平均詞長句長、易讀性等方面考察該譯本的語言特征、故事發展模式、可讀性等。與Crown語料庫小說部分對比后,發現該譯本在詞匯密度等方面非常接近美國英語原生文本,在一定程度上解釋了其受歡迎的原因。
“走出去”文化戰略;網絡小說英譯;語料庫
近年來中國網絡文學也開始外譯,從另一方面促使了“走出去”文化戰略的務實推進。武俠世界(www.wuxiaworld.com)是當今最受國外讀者歡迎的中國網絡小說英譯站。該網站由RWX于2014年12月創立,網站共有幾十部作品,其中完結作品有7部,至今總點擊量超過5億,每天的點擊量高達300多萬次,其中以美國、加拿大、菲律賓的讀者最多。網站翻譯人員多為美國、新加坡、臺灣、香港等地的中國武俠小說迷,他們以武俠小說中的人物稱呼自己,創始人RWX取名于金庸武俠小說《笑傲江湖》中的任我行,其實他是美籍華人賴靜平,曾是美國外交官。由他翻譯的網絡小說《盤龍》(Coiling Dragon)是第一部成功的譯作,為中國網絡小說在世界流行文化中爭得一席之地。《盤龍》全書共300多萬字,文本過大,因此從該網站選取了文本量相對較小的《七殺手》(7 Killers),它由Deathblade翻譯完成。
語料庫是基于計算機用來儲存大量語言信息材料的資料庫。20世紀70年代末80年代初“語料庫語言學”這一名稱真正得到使用,贏得語言學界的尊重[1]。語料庫語言學作為一種新的研究方法,能夠提取、利用自然真實的語料,是收集數據的重要手段。“語料庫語言學作為一種研究方法,今天沒有人懷疑,事實上眾多研究領域已經離不開基于語料庫的研究方法,比如社會語言學、語用學、會話分析、語體分析、兒童語言發展研究等等”[2]。隨著語料庫語言學的興起,眾多免費綠色分析統計工具的開發,學者在研究中國文學作品及其英譯本時,也引入了基于語料庫的研究方法。但是目前研究的對象多數是《紅樓夢》等國學典籍,更多的是中國著名作家的文學作品,如魯迅、莫言等的作品,很少有學者注意到網絡文學。基于此,本研究擬運用語料庫研究方法,分析中國網絡武俠小說《七殺手》英譯本的語言特征、故事情節以及可讀性等,解釋其受國外讀者歡迎的原因,以期為今后網絡小說英譯提供幫助,為傳播中國文化貢獻出綿薄之力。
研究文本《七殺手》選取于中國網絡小說英譯網站武俠世界,原作者為中國武俠小說家古龍先生,由Deathblade翻譯完成,已在武俠世界連載完結。從武俠世界選取文本后,保存為純文本文檔,然后利用Editplus 3.0.1對該語料庫文本進行清潔整理,主要是刪除文本中多余的空格空行,整理標點符號,修正亂碼等等。之后進行人工復查,保證文本干凈整潔,增加以后統計分析結果的可信度。
Crown語料庫是第三代布朗家族語料庫,由北京外國語大學中國外語教育研究中心的許家金和梁茂成,組織國內107所高校近150位教師及研究生,于2012年建成。其取樣標準及規模與其他布朗家族語料庫完全一致,庫容均達到百萬詞,分為小說、通用、學術和新聞四個子語料庫。Crown語料庫共包含700個文本文檔,80.86%的文本選自2009年間美國出版的讀物,其中127個(K-R)文本屬于小說文本[3]。本研究選取Crown語料庫小說部分為參照語料庫,運用AntConc 3.2.3、Readability Analyzer 1.0等語料庫檢索分析工具,對網絡小說《七殺手》英譯本進行直觀而深入的分析。
利用日本早稻田大學Laurence Anthony編寫的文本檢索軟件AntConc 3.2.3,獲取《七殺手》英譯本中的形符數、類符數、詞圖、關鍵詞表等等。利用TreeTagger for Windows 3.0對文本進行自動詞性標注,然后利用AntConc 3.2.3檢索功能檢索文本中不同詞性詞的總數。Readability Analyzer 1.0是由北京外國語大學語料庫團隊成員開發,利用該軟件計算文本的易讀性(Flesch Reading Ease)、困難程度(Text Difficulty)、平均句長(Average Sentence Length)、平均詞長(Average Word Length)等進而測量文本的可讀性。
(一)基于詞匯密度的語言特征分析
1. 類符/形符比
類符(Type)指文本中任何一個獨立的、不同于其他詞的詞。形符(Token)是一個語言單位,指文本中所有出現的詞,即文本中有多少詞就有多少形符。類符/形符比(Type/Token Ratio, TTR)是衡量語料庫文本中詞匯密度的常用方法,可輔助說明文本的詞匯難度,也可以用來衡量語篇的信息量[4] (P69)。運用AntConc 3.2.3統計《七殺手》英譯本的類符數為5 008,形符數為55 892,類符/形符比8.96%。當目標文本較長時,為了使類符/形符比更準確,會使用標準化的類符/形符比。以每千詞為統計基礎,《七殺手》英譯本的標準類符/形符比為47.17%,參照語料庫的標準類符/形符比為46.65%。Baker(1993)指出類符/形符比比值的高低與寫作者詞匯使用的豐富度和多樣性成正比,可以在一定程度上反應文本作者使用的詞匯量大小和遣詞的變化性[5]。通常比值越小,詞匯應用就越簡單;比值越高,作者用詞的變化性越大。《七殺手》英譯本的標準類符/形符比與Crown語料庫小說部分的標準類符/形符比很接近,說明該小說英譯本的用詞變化性和詞匯豐富程度已經達到美國原生文本的水平,故此可以吸引母語為英語的海外讀者。
使用最小二乘法求解對數距離路徑損耗模型中的參數時,式中的L是由觀測數據中的信號強度值組成的向量,已知數據中的讀卡器至標簽的距離為di,將d0=1代入,則:
2. 實詞/總詞數之比
另一個測量詞匯密度的方法是統計實詞形符數在總形符數中的比例,該方法是文本信息量大小的一個衡量標準。根據Biber et al(1999)的論述,英語實詞主要包括名詞、實義動詞、形容詞和副詞四類[4] (P71)。所下載的Crown語料庫小說部分中含有已經標注過的文本,所以只需利用TreeTagger for Windows 3.0對《七殺手》英譯本進行詞性標注。然后利用PatternBuilder獲取表示任意名詞、任意實義動詞、任意形容詞和任意副詞的正則表達式,運用這些正則表達式在AntConc 3.2.3中檢索所有的名詞、實義動詞、形容詞和副詞數目,并計算實詞/總詞數之比。統計結果如表1:

表1 實詞/總詞數之比
表1數據顯示,《七殺手》英譯本實詞/總詞數之比與Crown參照語料庫詞匯密度相似。據武俠世界網站介紹,譯者Deathblade出生并成長于美國加利福尼亞州。譯者必是熟悉美國英語文本特征,所以在翻譯過程中有意豐富小說內容,增加實詞使用率,使譯文貼近英語原生文本的表達習慣,美國、加拿大、菲律賓等以英語為官方語言的國家的讀者,在閱讀過程中就不會產生空洞乏味之感,這也在無形中抓住了更多海外讀者。
(二)基于主題詞表和詞圖的故事情節分析
把握行文脈絡和故事情節是理解小說精髓的關鍵。《七殺手》主人公是捕快柳長街,為調查京城附近的332件巨案的主謀,接近當地巨霸龍五,試圖找出龍五作案的證據。為得到龍五的信任,柳長街以超凡的智慧與絕世的武功為龍五從其前妻相思夫人處取得治療龍五絕癥的解藥。查案過程中,柳長街愛上已退休神捕胡力的女兒胡月兒。爾虞我詐中,柳長街秉持天網恢恢,疏而不漏的查案風格,最終與龍五合力揭穿神捕胡力和女兒胡月兒的真面目,證明胡力是真正的巨案元兇,萬惡的相思夫人則是胡月兒假扮的。基于此,下面利用AntConc 3.2.3等語料庫檢索統計工具,提取《七殺手》英譯本的主題詞和相關主題詞詞圖,進一步考察故事的情節推進,剖析海外讀者沉迷中國武俠小說的原因。
1. 主題詞表

表2 《七殺手》英譯本前20位主題詞
從表2可以看出,Liu Changjie(柳長街),Dragon Fifth(龍五),Hu Yue’er(胡月兒),Power of Hu(胡力),Du Qi(杜七),Meng Fei(孟飛),Lan Tianmeng(藍天猛),Tang Qing(唐青),Kong Lanjun(孔蘭君)等表示名字的名詞是指小說中重要人物,其中Liu Changjie,Dragon Fifth,Hu Yue’er和Power of Hu等名字出現的頻率較高,主題性較大,故是小說中的主要人物,其余的次要人物。人稱代詞“you/You”的使用說明了小說人物間對話頻繁,小說內容豐富,增加了讀者帶入感。在AntConc 3.2.3中獲取動詞“laughed”索引行,發現它主要表示“笑著說”,“笑道”等漢語意思,但是并不都是表示開心的笑,而是包含各種復雜情感,說明小說情節曲折,出人意料。武俠小說中人物大多身懷絕技,武打動作頻繁,故主題詞中出現了“suddenly”,“definitely”,“really”,“very”等修飾動詞的副詞,滿足了外國讀者對中國武俠的好奇心。酒是中國武俠小說中的必備品,更是武俠人物奔放豪爽的代表,所以“wine”主題性較大。名詞“face”用來表示小說人物的面部表情,說明人物經歷坎坷、情緒多變。由此可見,這部武俠小說人物關系復雜,人物履歷豐富,武俠情節濃厚,故事曲折出人意料,能夠吸引熱愛中國武俠文化的海外讀者。
2. 主題詞詞圖
詞圖是根據主題詞表,得出各個主題詞在語篇中的位置分布。將文本的主題詞表和主題詞詞圖統計結合起來分析,小說的故事情節脈絡就基本清晰了。因此,本研究利用AntConc 3.2.3獲取《七殺手》英譯本中主要人物Liu Changjie,Dragon Fifth,Hu Yue’er和Power of Hu在小說中的詞圖分布,結果如圖1:

圖1 《七殺手》英譯本主要人物詞圖分布
觀察以上詞圖,可以直觀明了地看出Liu Changjie這一名字在小說中出現的次數明顯高于其他三個人物,可見Liu Changjie是小說主人公。這個名字從出現就一直貫穿整個小說,說明他是推動小說情節發展的關鍵人物,小說中所發生的故事都與他相關。Dragon Fifth幾乎和Liu Changjie同時出現,雖然出現的次數較少,但一直持續故事結束,解釋了柳長街和龍五似敵似友的關系。Power of Hu在故事開始時很少出現,在故事快結束時頻繁出現,說明他的元兇身份正在被一步步地揭露,最后名字的消失說明元兇被緝拿歸案,處以死刑。Hu Yue’er集中出現在故事中間,以后卻很少出現,這也間接證明了她的雙重身份。開始以神捕女兒的身份騙取感情,后來又假扮相思夫人為非作歹。
(三)基于詞長句長的可讀性分析
平均句長是語料庫文本中句子的平均長度。平均詞長指的是在語料庫文本中的類符平均長度。平均句子和平均詞長可以表示文本中句子和詞匯的難易程度。利用軟件Readability Analyzer 1.0計算《七殺手》英譯本的平均句長和平均詞長。統計結果顯示,《七殺手》英譯本的平均句長為10.7個單詞,Crown語料庫小說部分平均句長為12.23個單詞,可見《七殺手》英譯本句子較短。另外統計結果顯示該譯本的平均詞長為4.4個字母。由此可見,《七殺手》英譯本句子結構簡單,復雜詞匯較少,降低了讀者閱讀困難。
為了更加科學地測量《七殺手》英譯本的可讀性,本研究利用專門計算文本易讀性(Reading Ease)和困難程度(Text Difficulty)的軟件Readability Analyzer 1.0測量該文本的難易程度。結果如表3:

表3 《七殺手》英譯本可讀性分析
根據Readability Analyzer 1.0軟件自帶的使用說明手冊可以得知,易讀性為79.00的文本處于相對容易(Fairly Easy)水平,文本困難程度為21.00的文本處于非常容易(Very Easy)水平。從表3還可以看出該譯本適合美國大約五年級的學生閱讀。由此可見,《七殺手》英譯本不會給國外讀者帶來閱讀壓力,反而使閱讀很輕松,因此該武俠小說會成為眾多海外讀者休閑娛樂的讀物。
“走出去”文化戰略激勵著學者將中國優秀文學作品翻譯到國外,向世界傳播中國文化。武俠是中國特有的文化內涵,武俠小說中陰陽、五行等元素屬中國色彩。由武俠世界等中國網絡小說英譯網站翻譯的中國網絡小說,在美國、加拿大、菲律賓等國深受喜愛。本研究從武俠世界獲取了武俠小說《七殺手》英譯本,運用基于語料庫的研究方法分析了其語言特征、故事發展模式、可讀性等等,發現其類符/形符比、實詞比等均非常接近美國英語原生文本。這樣的翻譯文本不會海外讀者讓產生陌生感,而是被其中的中國元素吸引。另外,《七殺手》英譯本句長較短,詞匯簡單,易讀性高,閱讀起來很輕松,由此吸引了更多海外讀者。本研究只是對比了小說譯本和英語原生文本,在某種程度上忽視了漢語原文本。鑒于武俠世界網站譯者以美籍華人、外國人居多,他們英語水平高,漢語水平相對較低,未來研究應該考察譯本是否忠實有效地傳達了漢語原文內容以及其中蘊含的中國文化。
[1] 李文中. 語料庫語言學的研究視野[J]. 解放軍外國語學院學報,2010,(2):37~40.
[2] 楊惠中. 語料庫語言學與中國外語教學[J]. 現代外語(季刊),2010,(4):421~422.
[3] Jiajin Xu and Maocheng Liang. A tale of two C’s: Comparing English varieties with Crown and CLOB (the 2009 Brown family corpora)[J]. ICAME Journal, 2013,(37):175~183.
[4] 牛桂玲. 中外學術論文中英文摘要語料庫的創建及應用[M]. 北京:知識產權出版社,2013.
[5] Baker, Mona. Corpus Linguistics and Translation Studies: Implications and Applications[C]. Amsterdam: John Benjamins Publishing Company, 1993.
[6] 楊惠中. 語料庫語言學導論[M]. 上海:上海外語教育出版社,2002.
責任編輯:彭茜珍
H059
:A
提取的方法是將要考察的完整連續文本同一個更大的參照語料庫進行比較,把語篇中詞頻差異顯著的詞語提取出來,生成主題詞表[6]。本研究以Crown語料庫小說部分為參照語料庫,利用AntConc 3.2.3提取了《七殺手》英譯本的主題詞表。按照主題性大小,選取了排在前20位的主題詞,如表2所示:
2095-4654(2017)04-0074-04
2017-03-20