張 燕,陳建生
(天津科技大學 外國語學院,天津 300222)
語料庫語言學是上世紀五十年代后期發展起來的全新研究領域,近幾十年來,基于語料庫的語言研究取得了長足發展,與之相關的語言研究方法也得到了學術界的廣泛認同。語料庫不僅為語言研究提供了廣泛的言語素材,而且使傳統語言研究由內省式的抽樣方法轉變為客觀的數據調查和分析,材料真實可靠。利用語料庫進行翻譯研究是新時期翻譯學研究的有效手段,語料庫語言學的研究方法為描述式的翻譯研究提供了一種定量分析的數據,翻譯研究者可以依據這些數據做進一步深入的定性分析。這樣就保證了翻譯研究成果的科學性。此外,翻譯語料庫檢索軟件支持多方面和多層次的檢索,使翻譯研究者有可能進行深入和細化的翻譯研究。將語料庫運用于翻譯研究始于Mona Baker,1995年,她籌建了翻譯英語語料庫(Translational English Corpus),對翻譯的性質和特征進行描述。Baker等人在這一領域的開拓性研究取得了令翻譯界矚目的成就(陳偉,2007)。
風格是某一內容與形式在其表現或外化時所反映、流露和依賴的某種特殊的風味與方式。風格所指的部位時而貼近內容,例如當它反映某種風情格調神態氣度時,又時而和更多的時候貼近于更實際的形式因素,比如聲調、節奏、詞匯、句法等等,而不停地游離于兩者之間更是常事(高健,1995)。以往對文學翻譯作品的研究涉及文體風格的不多,而且主要是對某一作家作品中的某些篇章或句子的翻譯風格的描述性分析,然而這種傳統的經驗式和內省式的研究方法并不能對整個翻譯作品的風格進行客觀和全面的研究。
Biber(1994)指出,語料庫能提供大量真實自然的語料,研究者可以對語言中真正起作用的結構用法進行分析,使研究建立在對自然語言結構及模式的分析基礎上,而非僅憑研究者的直覺或感受。語料庫方法的優勢在于可提供數據以及研究結果的可觀測性和可驗證性。Baker(2000)從類符/形符比、平均句長和敘述結構三方面利用附碼后的雙語語料庫來描述和分析兩位譯者的文體風格。用語料庫研究翻譯作品的文體風格是一種新的手段和方法,而且基于語料庫的文體和文本研究可以與其他語言學方法、統計方法和翻譯理論相結合,幫助讀者全面的了解文本中的詞匯、語篇、風格等多方面的特點。本文根據由《霍小玉傳》的兩個不同英譯本建立的小型語料庫以及英語本族語對比語料庫中得出的數據,以定量和定性相結合的研究方法,從詞匯和語篇的角度考察這兩個英譯本的翻譯風格。
本研究選用的語料是由外文出版社2003年出版的《中國古代短篇小說選》和《唐代傳奇選》中《霍小玉傳》的兩個英譯文,譯者分別為顏惠慶(以下簡稱為顏譯)和楊憲益、戴乃迭(以下簡稱為楊譯)。兩個英譯本分別在句子水平上與原文對齊。在選擇本族語參照語料庫時,考慮到文體的一致性,本研究選用了英語本族語語料庫BROWN、LOB、FROWN和FLOB中的Category P: Romance and love story部分作為參照語料庫(以下簡稱參照庫),共計234 533詞。為了對文本做詞匯密度和名詞化方面的研究,需要對三個語料庫進行詞性附碼。本研究采用的是CLAWS詞性附碼器和分類詳細的CLAWS7詞性附碼集[注]CLAWS詞性附碼器和CLAWS7詞性附碼集的詳細情況見以下網址:http://ucrel.lancs.ac.uk/claws7tags.html 和http://ucrel.lancs.ac.uk/claws/trial.html。
本研究使用語料庫檢索和分析工具WordSmith 4.0對語料庫中的語料進行比較和分析。通過(標準化)類符/形符比、平均句長、平均詞長等方面的統計數據,并結合相關的統計學方法來分析兩個不同譯本與英語本族語語料庫之間存在差異以及兩個譯本文之間的異同,得出《霍小玉傳》兩個英譯文的風格特征。
1.詞頻概況
一個文本的形符數是指該文本中所有的詞數。相同的形符稱為類符,即文本中不同的詞形的總數。類符/形符比(type/token ratio)可以反映語料中用用詞的變化情況。比值越大,說明該文本所使用的詞匯越豐富。一般情況下,如果一個文本的形符數超過1 000時,需要使用標準化類符/形符比,以減少長文本中功能詞詞頻過高造成的誤差。平均詞長是指文本中詞(即形符)的平均長度,以字母數為單位。平均詞長較長說明文本中用的長詞較多,一般文本的平均詞長為4個字母左右。詞長反映了用詞的復雜程度。詞長標準差反映出文本中各單詞長度與文本平均詞長的差異,標準差越大,文本中各單詞詞長之間的差異就越大。

表1 三個語料庫中的詞頻概況對比
根據表1的數據可知:兩個譯本的詞頻概況與參照語料庫的詞頻概況略有差異。與參照語料庫相比,顏譯的標準化類符/形符比略高,而楊譯略低。這反映出顏譯中用的類符更多。在平均詞長和詞長標準差方面,顏譯高出參照語料庫,而楊譯則低于參照語料庫。兩者的平均詞長分別與參照語料庫中的平均詞長做獨立樣本t檢驗,結果表明其差異都具有不同程度的顯著性。這說明顏譯中(t=2.1319, p<0.0330)長詞較多,用詞比較復雜,甚至超過參照語料庫。而楊譯(t=5.8792, p<0.0001)則很少使用長詞。

表2 三個語料庫中每1 000詞中6個字母以上的長詞數量比較
這一情況在詞長表中也能體現。常見的文本中分別由2~6個字母組成的單詞居多。所以表2中僅列出6字母以上的詞長表。WordSmith軟件在進行詞頻統計時,會自動統計出各長度詞在語料庫中的使用頻率。但如果語料庫的容量不一樣,語料庫的實際詞長出現次數就不具可比性。所以采用每千詞不同長度的單詞在語料庫中出現的次數統計。這種方法可以更客觀地對各長度單詞在不同語料庫中的分布情況做出比較。
從表2的數據可以看出,除了10個字母的詞以外,顏譯中6個字母以上的詞的出現次數均大于楊譯以及參照庫。這也說明了顏譯在詞的使用上比較偏重復雜的長詞。對比兩個譯文可知:
原文1:因謂生曰:“素聞十郎才調風流,今又見儀容雅秀,名下固無虛士?!?/p>
顏譯:“I have heard a great deal of your scholarly attainments and romantic personality,” she declared cordially, “and now I perceive that you are also very handsome-indeed, you do not belie your reputation.”
楊譯:“We have heard of your brilliance as a scholar,” she said to Li, “and now that I see what a handsome young man you are too, I am sure your fame is well deserved.
例句中顏譯中用到的6字母以上的單詞有7個,楊譯中只有3個。另外,就文體而言,《霍小玉傳》屬于唐代傳奇,作為中國風格的小說形式,雖然篇幅較短,但通過作者有意識的主觀創作,已經作為一種獨立的文學體裁形成獨特鮮明的風格特色。唐以前的文學作品大都用詞華美,句式工整對仗,寫景狀物、記人敘事力求完美。但唐傳奇作家開始追求生活化、個性化的語言,用詞簡潔凝練,表現力強,顯然在顏譯中長詞的大量使用是與唐傳奇的語言特點相悖的。
2.詞匯密度
近年來,國內外一些學者使用詞項密度研究語篇問題,但大都停留在對寫作或口筆語語體特征的研究層面上,用詞項密度研究翻譯風格還為數不多。Halliday(1985)將句子中的詞語分為語法和詞匯兩大類。詞匯類指的是實義詞,包括名詞、動詞、形容詞、大部分副詞等。語法類是指功能詞,或虛詞,包括冠詞、代詞、大部分介詞、連詞、某些副詞、助動詞等。詞匯密度可以反映句子中實詞的比例。在句中通常實詞比虛詞傳達的信息要多,虛詞主要起語法和文本的連接作用。一句話中的詞匯密度越高,說明該句中的實詞數越多,該句所承載的信息量也越大。
通常用于計算詞匯密度的公式有兩種,分別由Ure(1971)和Halliday(1985)提出。Ure計算的公式是運用較為廣泛的計算方法,用語篇中的實詞數除以單詞總數再乘以100%而得出平均每百詞中所包含的詞項數量,即:
實詞數/單詞總數×100%=詞匯密度
Ure指出,詞匯密度是區別語體正式程度的一個標準,語體越正式,詞匯密度越高,語體越非正式,越接近自然口語,詞匯密度越低。Ure發現口語的詞匯密度大概在40%以下,書面語的詞匯密度則在40%以上(吳瑾,鄒青,2009)。
Halliday的詞匯密度公式是用詞匯項的數除以語篇中的小句數總數,即:
實詞數/小句總數=詞匯密度
在Halliday看來,句子中的小句是一種具有彈性功能的單位。它可以同時表現三種功能:(1)作為現象的表征;(2)作為話語功能的表達;(3)作為信息的載體。這三種功能決定了小句可以作為一個獨立的功能單位來加以分析(高彥梅,2003)。
Halliday對英語口語和書面語作了對比分析,發現口語語篇的平均詞匯密度為1.5至2,書面語篇的平均詞匯密度為3至6(楊信彰,1995)。表3是利用這兩種公式來計算顏譯和楊譯的詞匯密度的結果對比。

表3 顏譯和楊譯的詞匯密度對比
由表3可知,雖然顏譯的類符/形符比數大于楊譯(分別為31.67和26.72),但兩種不同公式計算出的結果都是楊譯的詞匯密度略大于顏譯。這說明從信息承載量方面,楊譯更加豐富。高詞匯密度也說明對同一個單詞的重復次數少,語言形式的多樣化。
書面語中詞匯密度高主要是因為出現名詞化的傾向,而口語詞匯密度較低,是因為名詞化傾向化較弱,這是由它們的不同的社會功能所決定的。書面語在語篇生成的過程中,對語境的依賴性不像口頭語那么直接,就可以經過一番思考和推敲,就會顯得更正式,更嚴謹。因此,書面語,尤其是文學翻譯,譯者對所使用的詞匯語法越刻意雕琢、推敲就越容易出現名詞化傾向,這是因為書面語在呈現現實世界的經驗和現象時,把這些經驗和現象作為物體來看待,所以多使用名詞。譯本的名詞化現象可以從一個側面反映出譯者的文體風格(楊信彰,1995)。
3.名詞化
名詞化是指動詞、形容詞等在功能上轉化為名詞或名詞性句法結構的過程。一般來說,正式程度越高,句子結構越完整復雜,詞匯選擇也越講究,發音也越充分清晰(侯維瑞,1998)。王晉軍(2003)在對不同語篇類型的語料進行分析后發現名詞化比例與語篇類型的正式程度成正比,法律英語和科技英語的正式程度最高,新聞英語和英語小說次之,寓言和童話最低。其中小說中名詞化的比例僅為27.2%,這與小說的寫作目的和讀者群相關。小說主要是通過模仿生活來啟迪大眾,小說的語言多為一些日常用語,名詞化程度較低。
語篇中名詞化的形式很多,由于篇幅有限,本文僅就兩譯文中名詞化的某些形式進行分析。通過WordSmith軟件中的Concord工具對附碼后的兩個譯文中具有名詞化標志詞綴的名詞,例如-tion,-ment,-ship等進行檢索統計,結果如下:

表4 顏譯和楊譯的名詞化結構使用頻率對比
由表4可知,顏譯的名詞化比率將近楊譯的兩倍,名詞化程度相對較高,這就使顏譯顯得比較正式,例如:
原文2:太夫人素嚴毅,生逡巡不敢辭讓;
顏譯:As the old lady was very punctilious and conservative in such matters, he hesitated to express any objection, still less opposition;
楊譯:His mother was so strict that Li, though hesitant, dared not decline;
原文雖然出自唐代作家蔣防之手,但文風簡潔,結構緊湊,句子短小精悍,除去少量古代文言詞之外,內容淺顯易懂。顏譯中高名詞化現象與作為通俗文學的短篇小說的文體風格相悖。而且根據Manttari的行為翻譯理論,翻譯過程被看成是由一系列參與者組成的過程,其中包括:發起者(initiator)、原文生產者(source-text producer)、譯者(translator)、譯文收受者(target-text addressee)和譯文接收者(target-text receiver)等七個翻譯過程的參與者。在國內,兩個譯文的收受者和接收者主要是英語學習者、愛好者及翻譯工作者。作為譯者應綜合考慮以上兩方面的因素,在翻譯過程中盡量使譯文風格符合原文風格,更加貼近讀者。因此,楊譯在這些方面優于顏譯。
1.句子特點

表5 三個語料庫中句長的對比
句子長度也可作為表現個人文體風格典型的標志之一。句子長度是指一個句子中單詞的數量。由表5可知,與顏譯的句子平均長度相比,楊譯和參照庫的平均句長差別較小。另外,原文是由12個自然段組成,顏譯共有63段,楊譯共分46段,這表明兩個譯文都對原文結構作出了調整。顏譯中較多使用成分復雜的長句進行翻譯,有時一句話就單獨成段,使譯文呈現出結構復雜、銜接緊密、邏輯嚴密的翻譯風格,而楊譯整體上使用了中等長度句進行翻譯,譯文結構簡單明了,清晰易懂,楊譯句長的使用上更接近本族語使用者,更符合譯語語言的文類特點。例如:
原文3:生自以孤負盟約,大愆回期,寂不知聞,欲斷其望,遙托親故,不遣漏言。
顏譯:Realizing now that he had violated his oath to Jade and broken his promise to meet her soon, Li decided not even to correspond with her, so as to put an end once and for all to her hopes, and, moreover, cowardly requested his friends and acquaintances to keep everything about his doings secret from her.
楊譯:Knowing that he had broken his promise to fetch Jade at the appointed time, he sent no massage to her, hoping that she would give him up. He also asked his friends not to disclose the truth.
原文中這句話并不單獨成段,顏惠慶在翻譯時將其獨辟一段,整段由一個句子構成,共用56個單詞。長句的使用增加了句子的復雜性,在翻譯時采用加譯的策略,使用了多個起連接作用的單詞或短語來構建句子間的關系和銜接,這就增加了譯文的邏輯性和連貫性。楊譯把原文譯成兩句,共用37個單詞,這樣的處理即準確的表達了意思,又顯得簡潔、流暢。
2.可讀性
可讀性研究始于上世紀二十年代的美國,是指篇章的難易程度,主要涉及語言表面層次的語義和句法特性,如詞長、句長以及語言表達的復雜性??勺x性計算公式是檢測閱讀篇章難易程度的工具,在預測可讀性方面能起到有效的檢測作用(姚國樹,2008)。常用的計算可讀性的公式有四種:(1)福格指數(Gunning-Fog Index),(2)福來士易讀指數(Flesch Reading Ease Score),(3)福來士難度級(Flesch-Kincaid Reading Grade Level Readability Test),(4)自動可讀性指數(The automated readability index)。計算福格指數公式表示為:
Fog Index=0.4×(L+H)
其中L為平均每句所含單詞的數量,H為平均每百個單詞所含多音節單詞數。福格指數測量的是你需要接受多少年的教育才能看懂閱讀的內容。指數越低閱讀內容就越容易,6代表容易,20代表很難。
福來士易讀指數的計算公式為:
Flesch Reading Ease Score=206.835
(1.015×ASL) (84.6×ASW)
其中ASL表示句子的平均長度;ASW 表示每個單詞的平均音節數。其對閱讀篇章進行從100(容易)到0(很難)的評估。福來士把65作為一般難度英語的分值。
福來士難度級數的測量基于美國學校年級等級,如8.0表示8年級的學生能看懂的篇章,7.8到8.0之間屬于正常水平。其計算公式為:
Flesch-Kincaid Grade Level=(0.39×ASL)+(11.8×ASW) -15.59。
其中ASL和ASW所表示的內容與福來士易讀指數中的變量相同。
自動可讀性指數是由Smith and Senter(1967)首創,最早是為了評估空軍手冊和技術性文件的文本可理解性。其公式為:
The automated readability index=4.71×(c÷w)+0.5×(w÷s2)-21.43
其中C代表字母數,W代表單詞數,S代表文本中的句子數,自動可讀性指數的平均水平為7,高于7則說明較難。
表6是兩個譯文的四種可讀性指數對比。
德國功能派翻譯理論學派學者Vermeer提出的目的論理論中有兩個重要的法則,連貫性法則和忠實性法則。連貫性法即“語內連貫”,要求譯文必須符合譯入語文化的表達習慣,能讓讀者理解??梢娍勺x性也是衡量譯文的重要依據之一。雖然計算的公式不同,但是數據所反映出的結果是一樣的,那就是總體而言,楊譯比顏譯更淺顯易懂,更具可讀性。例如:
原文4:生聞之驚躍,神飛體輕,引鮑手且拜且謝曰:“一生作奴,死亦不憚?!?/p>
顏譯:“I am willing to be her slave all my life,” cried the young scholar, dancing with delight and seizing Mrs. Bao’s hands to show his gratefulness.
楊譯:When Li heard this he leaped for joy and felt as if he were walking on air. Taking Bao’s hands he bowed and thanked her, saying: “I shall be your slave as long as I live!”
原文5:自是長安中稍有知者。風流之士,共感玉之多情;豪俠之倫,皆怒生之薄行。
顏譯:The story of Li’s scandalous treatment of his mistress became widely known among the literary and romantic circles of Changan. One and all sympathized with and lauded Miss Jade for her deep attachment to her lover and condemned Li for his heartlessness.
楊譯:When the story became known in the capital, all the young scholars were moved by the girl’s love and all the young gallants were indignant at Li’s heartlessness.
在顏譯中有一些不妥之處。如“一生作奴”中到底是作誰的奴隸?根據原文的語境可知,這是李生為感謝鮑氏為其做媒說的客套話,“作奴”譯為“be her slave”,而“her”指的是誰?這樣翻譯顯然不可取?!帮L流之士”和“豪俠之倫”被譯作“the literary and romantic circles of Changan”也不免讓人產生疑惑。風流在中國古代文學作品中有多種理解,如風韻,才華出眾,風采,風俗教化,遺風等等。但是風流并不等同于愛情和浪漫,用“romantic”一詞容易使讀者產生誤解。相比之下,楊譯文中的用詞就更加貼切,從語義和形式上都更加忠實原文。
通過以上的比較分析可見,楊譯的翻譯風格更加簡潔流暢,忠實原文。在表情達意方面,能充分發揮譯語的特點;遣詞造句形式多樣,富于變化,多種翻譯手法的交互使用,張弛有度,使譯文更加貼近讀者。顏譯能做到再現原文的特點,將原作者的意圖傳遞給了譯文讀者。用詞豐富,譯文豐滿,并極具情感色彩,句子結構緊湊,邏輯性強。長詞的大量使用,使譯文略顯復雜,同時也增加了閱讀的難度;但過多直譯使譯文風格稍顯呆板,有欠靈活性。
利用語料庫研究譯文風格,通過分析所獲得的數據,探討不同譯文的翻譯風格。這種方法把定量研究與定性研究相結合,使客觀地把握原文風格和科學地分析譯文風格成為可能。同時,這種研究方法更系統、更有針對性、可比性更強,為翻譯研究提供可靠的量化依據,具有很強的客觀性和說服力。這樣,既避免了傳統研究方法的主觀性和隨意性等缺陷,又能從整體上客觀地把握文本,譯者風格研究的科學性和實證性特點,使其可以為翻譯批評提供可靠的依據,也可以運用到翻譯教學和翻者培訓中,因此不失為翻譯研究的一條新路。
[參考文獻]
[1] Baker, Mona. 2000. Towards a methodology for investigating the style of a literary translators[J]. Target, 12.
[2] Biber, D, S. Conrad, R. Reppen. 1994. Corpus-based approaches to issues in applied linguistics[J]. Applied Linguistics, 15,169-189.
[3] Halliday, M.A.K. Spoken and Written English [M]. Victoria: DUP, 1985.
[4] Ure, Jean N. Lexical density and register differentiation [A]. Selected Papers of the Second International Conference of Applied Linguistics [C]. Cambridge: Cambridge University Press, 1971.
[5] 陳偉. 翻譯英語語料庫與基于翻譯英語語料庫的描述性翻譯研究[J]. 外國語,2007(1):67-73.
[6] 侯維瑞. 英語語體 [M]. 上海:上海外語教育出版社,1988.
[7] 高健. 翻譯中的風格問題 [J]. 外國語, 1995(3):7-11.
[8] 高彥梅. 運用LD評估語篇能力 [J]. 外語教學,2003(5):65-68.
[9] 李文革. 西方翻譯理論流派研究 [M]. 北京:中國社會科學出版社,2003.
[10] 吳瑾,鄒青.中國學生英語口筆語語體特征研究:詞匯密度與詞頻 [J].山東外語教學,2009(1):8-13.
[11] 王晉軍. 名詞化在語篇類型中的體現 [J]. 外語學刊,2003,(2):74-78.
[12] 顏惠慶. 中國古代短篇小說選 [M]. 北京:外文出版社,2003.
[13] 楊惠中. 語料庫語言學導論 [M]. 上海:上海外語教育出版社,2002.
[14] 楊憲益,戴乃迭. 唐代傳奇選 [M]. 北京:外文出版社,2003.
[15] 楊信彰. 英語書面語體中的詞匯密度特征 [J]. 解放軍外國語學院學報,1995(3):14-18.
[16] 姚國樹. 英語篇章的可讀性檢測 [J]. 內江科技,2008(11):28.
[17] 朱耕. 論譯者的翻譯策略[J].重慶工學院學報(社科版),2009(3):142.