蘇寶英
(鄭州成功財經學院 外語系,河南 鄭州 451200)
中國的《政府工作報告》(以下簡稱《報告》)是中華人民共和國政府的一種公文形式。《報告》由各級政府的辦公機構擬稿,交政府領導審閱后,正式在“兩會”上由國務院總理宣讀。《報告》結構通常由三部分組成:一是回顧并總結上一年來的政府工作情況;二是歸納當年政府各項工作,回報這一年政府的工作計劃和目標;三是政府自身建設。
《報告》屬政論文體,此類文體用詞講究分寸,莊重嚴謹,準確規范。[1]程鎮球(2002)指出,在政論體漢英翻譯中,譯者應竭力忠實于原文,要忠實于原文的字句,更要忠實于原文的精神。其次,譯者要有高度的政治責任感和嚴肅認真的工作態度。為滿足外界了解中國的形勢和政治主張,達到對外宣傳的目的,報告對應的英文翻譯就顯得十分重要。
數據驅動學習(Data-driven Learning,簡稱 DDL)由 Tim Johns于1991年提出,這種語言教學模式“讓學生自己使用語詞索引軟件去查詢本族語者口語或書面語的語料庫,給他們提供語言使用的真實樣例,而不是一些語法書中設計出的例子”。[2]這種基于語料庫的學習模式體現了“以人為本”的教育思想,它能夠根據學生各自的程度、需求和興趣,利用檢索分析工具,發現式或者驗證式地進行學習,是其他非語料庫學習模式所難以實現的。[3]DDL廣義上隸屬于語料庫語言學范疇,著重于語料庫對促進學生發現式學習起到的積極作用,強調要從學習者的角度對語料庫進行有不同針對性的檢索,并利用檢索結果來輔助學生的自主學習,讓語言教學更有效、更靈活。[4]
早期的DDL最常用于ESL教學中的詞匯教學,如對某個領域術語的理解與運用,或是對情態動詞、助動詞、介詞和連詞等的掌握(Johns et al 1991)。隨后DDL亦擴展運用于其他語言單位的學習,包括掌握句子的各種連接形式,不同類型語篇模式的規律等 (Granger 1996;St.John 2001;Schmied 2003;Pereira2004,etc)。國內學者也對數據驅動學習模式進行過相關的理論探討(許葵花、張衛平2003;王金銓2004;甄鳳超2005),但將這一模式應用于翻譯實踐研究的很少。本文將以《政府工作報告》為例,具體分析如何將語料庫和數據驅動學習相結合并應用于翻譯實踐中。
語料庫在翻譯研究中的運用主要包括以下幾個方面:
一是翻譯共性研究,即通過語料庫試圖探尋翻譯語言的整體特征。近年來對翻譯共性的討論包括顯化(explicitation)、隱化(implicitation)、簡化(simplification)、范化(normalization/conventionalization)、集 中 化 (convergence)、整 齊 化 (levelling out)、非典型搭配(untypical collocations)、干擾(interference)、獨特項(unique items)等,方法上則是從具體語言因素入手,采用語際、語內或兩者結合的對比模式,以概率和統計為手段,嘗試從語言之間相互作用在語言層面的表現探索翻譯語言的規律性特征,并從語言內、外加以解釋。[5]
二是譯者風格研究,Baker倡導的基于語料庫的譯者風格研究有三個特點:第一,目標文本導向(target text-orientedness)。譯者風格研究中,目標語文本整體是分析的焦點,分析過程通常不考慮對應的原文本。第二,譯者下意識的語言行為。譯者風格考察的各類特征是譯者下意識或習慣性選擇的結果,而非針對原文本的有意識反應行為。第三,區別性。數據統計分析的結果能將譯者的風格與其他譯者區分開來。[6]
三是翻譯過程研究,即譯者大腦中轉換活動的過程研究,試圖解釋翻譯過程中譯者的思維過程。目前主要采取的策略是有聲思維法(think-aloudprotocol)——一種文本數據采集方法,以此來記錄譯者翻譯思維過程。Englund-Dimitrova(2005)借助有聲思維法和計算機記錄書寫過程等手段,對俄語-瑞典語翻譯中轉折連詞在譯文中顯化與否進行了考察,這種方法可以將記錄翻譯過程的原文本(meta-text)與翻譯文本本身結合起來考察翻譯過程。
四是翻譯應用研究,此類研究主要體現在譯者培訓、翻譯教學(教學內容設計、語料庫課堂運用、語料庫輔助翻譯教學、語料庫翻譯搭配教學等)及相關軟件的開發(語料庫檢索工具、機輔翻譯工具、專門對應語料庫的研制及語料庫的加工、術語庫的創建等)(王克非,2007;Olohan,2004;Pearson,2003 等)。
雙語平行語料庫(bilingual parallel corpus)的研究在翻譯教學和實踐中得到了廣泛的應用。TM(Translation Memory)本身就可以看做是一個以字段為單位對齊的雙語平行語料庫,可以查看、調用語料,輔助翻譯教學。[7]翻譯記憶系統可以將翻譯完成后的翻譯記憶庫導出為句對齊的雙語平行語料庫。翻譯過程中,譯文會在后臺自動保存,這樣譯者在翻譯過程中可能會看到并選用其他較好的譯文,從而逐步提高自身的翻譯能力。
在所有TM軟件中,德國著名翻譯軟件公司Trados軟件應用最廣泛。據統計,“目前,塔多思在國際翻譯工具市場中占有絕對領先地位,市場份額高達70%以上,已成為眾多翻譯人士、企業解決方案供應商及國際大公司的首選。”。[8]Trados不是一種機器翻譯軟件,而是一種翻譯記憶軟件。譯者利用已有的原文和譯文,建立起一個或多個翻譯記憶庫,在翻譯過程中,系統將自動搜索翻譯記憶庫中相同或相似的翻譯資源(如句子、段落等),給出參考譯文,使用戶避免無謂的重復勞動,同時改進和提高翻譯質量。簡言之,就是將譯員做過的工作,用Trados提供的工具存儲起來,放到兩個主要的數據庫(記憶庫)中,一個是句料庫(用WinAlign工具制作),另一個是術語庫(即Multiterm)。
本文是一項基于語料庫的研究,所使用的語料庫是一個雙語平行語料庫。筆者收錄了從2007到2011年的《報告》的中文及譯文(來自中國日報)利用Trados軟件建立成一個小型平行語料庫,規模約為16萬字詞,其中中文約9萬字,英文約7萬詞,兩種文本采用半自動的方法在句子水平上對齊。旨在幫助譯者提供一種有效地翻譯實踐手段。下面針對筆者建立的《報告》語料庫,對2012年《報告》的翻譯實踐進行詳細介紹:
在翻譯過程中,大多數學習者或者翻譯人員針對生詞的處理,更喜歡使用詞匯的直接意義或者詞典中的意義,這種情況在漢英翻譯中普遍存在。實踐表明,使用詞典意義雖然比較容易得到詞語的表面意義,但往往與語境相脫節,致使譯文表達不準確、不恰當,不符合原文風格。而Trados建立的平行語料庫可以自動搜索翻譯記憶庫中相同或者相似的詞語或句子,給出參考譯文,恰當地解決了這一問題,從而提高了翻譯的準確性和效率。
圖1:Trados的詞匯檢索結果
如上圖所示,針對“各位代表”一詞在所建語料庫中進行檢索可顯示出圖中結果。左列為漢語語料,右列為英文語料,譯文匹配顯示100%。該語料庫不僅能顯示出該詞語對應的英文表達,而且能夠給出該表達使用的語境,這樣翻譯人員可以根據自己的需要,選取同等語境下該詞語的表達。
對于科技翻譯的文體特點,紐馬克指出“科技翻譯因科技術語而從根本上有別于其他類翻譯,這類術語占到了5%~10%”。[9]而航天、計算機、工程等專業領域的翻譯資料的重復率一般都達到了20~80%,[10]對于技術翻譯來說,術語的準確性和一致性是確保翻譯質量的關鍵要素之一。[11]有效利用Trados軟件,計算機便能夠自動為翻譯人員提供對應的術語譯文,大大提高了工作效率,同時又能保證專門用途漢譯英文本術語的一致性。
圖2:Trados的術語搜索結果
如上圖所示,對“熱錢”一詞在術語庫中檢索結果得知其對應英文為“hot money”。使用Trados可以保證術語在前后文本中的翻譯一致。在滿足“等值”要求的同時,Trados還能避免重復勞動,提高翻譯效率。根據SDL公司的數據,應用Trados解決方案后,用戶的翻譯工作效率可以提高30%~80%,翻譯成本降低30%~60%。“翻譯記憶和術語管理有助于保證不同譯者的術語一致性,起到了良好的輔助作用。”[7]從而幫助翻譯人員提高翻譯質量和效率,更加有效地應對專門用途體裁的翻譯。
Trados軟件中WingAlign可以讓用戶重復利用現有資源,通過翻譯記憶技術再次利用用戶已翻譯過的資料,對原語料和目標語文本進行分析,精確找出相對應的句子和段落,自動地將源語文本與目標語文本匹配對應。將找到相同或類似的語料同其翻譯一起顯示出來,如有與所存文本不同的詞或短語,這些詞或短語將被突出地標出。用戶翻譯時可對其進行修改、接受或放棄。再次修改或重新翻譯的文本將被保存在翻譯記憶中,以便翻譯人員進行之后的工作。
圖3:Trados的句子檢索結果
如上圖所示,針對“我們將堅定不移地貫徹‘一國兩制’、‘港人治港’、‘澳人治澳’、高度自治的方針,全力支持香港、澳門發展經濟,改善民生,推進民主。”一句,Trados自動檢索到類似的句子同其翻譯一同顯示出來,并提供了豐富的語境信息。結果顯示將要翻譯的句子與翻譯記憶庫中的句子匹配率達到84%,翻譯人員只需將突出顯示出的不同詞語稍作修改即可完成。
同時附帶顯示出目標語句中出現的術語,“一國兩制 (one country,t wo systems)”、“高度自治(with a high degree of autonomy)”、“民生(wellbeing)”等的翻譯,這樣不僅提高了翻譯工作的效率,而且提高了翻譯的質量。
圖4:術語識別結果
基于語料庫和數據驅動學習的翻譯實踐,在詞匯檢索、術語搜索及文本匹配等層面有其獨特的優勢。數據驅動學習基于語料庫,要求語言學習者帶著問題,運用檢索軟件,在對大量真實語料進行觀察和分析的基礎上,由學生從真實的語言使用實例中歸納總結出語言使用特征,并最終將問題解決。[12]
這種發現式學習方法鼓勵譯者發散性思維,充分調動了譯者的翻譯興趣,對專門用途體裁的漢英翻譯,尤其對于《報告》這一特殊的文體,為了達到對外宣傳的目的,其英譯文本應在保持原文意思的基礎上,遵循簡潔的原則,盡可能靠近本族語者的表達習慣,從而被目的語讀者接受。通過這種方法不僅可以大大提高譯員的翻譯效率,而且對今后的翻譯教學和翻譯學習者自主學習也有一定的指導意義。
(注:本文系河南省教育廳人文社會科學研究項目“基于英語口譯語料庫和數據驅動學習的多維度語塊研究”,項目編號:2013-QN-537)
[1]陳建生,崔亞妮.基于語料庫的中國《政府工作報告》英譯本詞匯特征研究[J].當代外語研究,2010,(6):39-43.
[2]Meyer Charles.English Corpus Linguistics[M].Port Chester:Cambridge University Press,2002.27.
[3] 何安平.語料庫與外語教學[J].國外外語教學,2001,(3):15-19.
[4]李德超,王克非.基于雙語旅游語料庫的DDL翻譯教學[J].外語電化教學,2011,(1):20-26.
[5]王克非.語料庫翻譯學探索[M].上海:上海交通大學出版社,2012.18.
[6]黃立波,王克非.語料庫翻譯學:課題與進展[J].外語教學與研究,2011,(6):91-923.
[7]王正,孫東云.翻譯記憶在翻譯教學中的優勢與局限性[J].外語界,2009,(2):16-22.
[8]汪溶.翻譯質量瓶頸的重大突破——TRADOS翻譯解決方案的巨大貢獻[J].中國科技翻譯,2002,(1):42.
[9]Newmark.Approaches to Translation[M].上海:上海外語教育出版社,1988.151.
[10]馮志偉.機器翻譯研究 [M].北京:中國對外翻譯出版公司,2004.65.
[11]袁亦寧.翻譯技術與我國技術翻譯人才的培養[J].中國科技翻譯,2005,(1):51-54.
[12]吳進善.基于多媒體語料庫的數據驅動學習模式研究[J].當代外語研究,2010,(6):44-47.