侯林平
(山東科技大學 外國語學院,山東青島 266590)
《語料庫翻譯研究的新方向》評介
侯林平
(山東科技大學 外國語學院,山東青島 266590)
C. Fantinuoli & F. Zanettin. 2015. NewDirections in corPus-bAsed TrAnslAtion Studies. Berlin: Language Science Press, 167.
德國柏林語言科學出版社于2015年出版了由Claudio Fantinuoli和 Federico Zanettin主編的《語料庫翻譯研究的新方向》(NewDirections in corPus-bAsed TrAnslAtion Studies)一書。本書由七篇獨立成章的論文組成,圍繞多語語料庫建設與多重復合分析議題展開,匯集了多語語料庫建設及其在翻譯研究中應用的前瞻性成果,代表了本領域研究的新進展,特撰文概述與評析這兩個主要議題。
根據所含語言種類的多寡,語料庫一般可以分為單語語料庫和多語語料庫。在語料庫語言學文獻中,以語言研究為目的的多語語料庫主要指同一文本及其譯文通過編輯和對齊而成的雙語或者三語書面語平行語料庫(Schmidt & W?rner,2012:xi)。在自然語言信息處理研究和開發中,多語語料庫也是以雙語平行語料庫居多(常保保、詹衛東、張華瑞,2003)。而平行語料庫所涉及的語言可以多達幾十種(?ermák & Rosen,2012)甚至上百種(ChristodoulouPoulos & Steedman,2015)。本書中的多語語料庫是適合不同翻譯研究項目所建成的語料庫,既有雙語或者三語平行語料庫,又有兩種以上語言建成的可比語料庫。
1 平行語料庫
Serbina等、Mouka等及Zubillaga等學者分別創建了適合其研究目的的多語平行語料庫。Serbina等整合運用translog(一款能夠通過點擊鍵盤和鼠標生成中間譯文的擊鍵記錄軟件)產生的實驗過程數據與最終產品數據開發了擊鍵記錄翻譯語料庫(keystroke logged translation corPus),以期探索譯者的不同認知特征與再現模式。語料來自一個研究語法復雜性的翻譯過程數據。該語料庫由原文子庫、過程/中間譯文子庫和目標譯文子庫構成,并且進行了多層標注和復雜對齊等加工。首先使用已有的工具對原文和目標譯文進行自動標注和對齊,然后再與標注過的過程文本進行對齊。過程文本采用2013年最新研發的半自動對齊工具進行對齊,主要包括:(1)擊鍵記錄的一組行為(如插入/刪除字符和點擊鼠標等)與過程文本中表達詞匯意義的語符對齊;(2)語符與原文/譯文中的詞匯對齊;(3)短語層面上對齊;(4)語法功能層面上對齊。過程文本采用XML進行多層標注,主要包括:(1)實驗受試者身份、譯文的版本和受試者組別等元信息;(2)詞性、句法剖析和語法功能等語言信息;(3)停頓時長和回車次數等行為信息。該語料庫的建立為翻譯過程和結果結合的研究提供了藍本。
Mouka等則描寫英語、希臘語、西班牙語三語字幕翻譯語料庫的創建。為了更好地研究電影字幕翻譯中種族主義話語的語域轉換策略,Mouka等將有關種族主義主題的五部英語電影轉寫后與希臘語和西班牙字幕文字進行對齊,并且在采用XML進行多層標注時綜合利用了多種語料庫加工工具。采用eLAIN及GATe 平臺,eLAIN標注說話者的信息,并且同步視頻與音頻的播放時間,GATe平臺標注語域轉換方式、態度類型及強度等語言信息。就語料選擇而言,該平行語料庫或許是第一個從交際情景來選擇語料而建成的有關種族主義的多模態話語語料庫。
為了探討強勢/弱勢民族文學翻譯現象,Zubillaga等創建了德語、西班牙語、巴斯克語三語平行語料庫(Aleuska)。該庫分工合作,采用XML進行多層標注,在句子層面進行對齊。在共享研究目的、研究框架和建庫工具的前提下,Zubillaga等分別建立了詈語和語氣詞的兒童/青年文學子庫、慣用語/詞組的敘事子庫和出版審查制度的哲學子庫,并且按照研究重點進行
分別標注。在標注文本元信息時,各子庫均標注了四類翻譯信息,即直接翻譯、間接翻譯、假定直接翻譯和假定間接翻譯。值得一提的是,由于現有的建庫工具無法應用到此語料庫建設中,Zubillaga等與IT專家合作開發了符合本項研究特制的對齊工具(TRACe-Aligner 3.0)和搜素引擎。作者對建庫資料的選擇、信息標注和對齊都體現出了創新。
需要指出的是,除了自建平行語料庫進行翻譯現象研究之外,本書中還探討了Doms基于現有的英語、荷蘭語平行語料庫,探討give和show的非人稱主語如何轉譯到荷蘭語中的問題。
2 可比語料庫
為了實現了不同的研究目的,LaPshinova-Koltunski和Pontrandolfo分別自建了可比語料庫。通過顯化、簡化、范化/透過效應和趨同化四個譯文特征,探索同一英語原文采用不同翻譯方法而產生多個不同德語譯文的變異現象,LaPshinova-Koltunski創建了名為VARTRA-SMALL的可比語料庫。VARTRASMALL包括六個子庫:一個英語原文子庫、一個現成的人工德語譯文子庫、一個機助德語譯文子庫和三個利用不同機器翻譯系統而產生的機譯德語譯文子庫。各子庫均通過有關軟件進行自動語符化、詞元化、詞類標注和句子切分。除人工子庫在句子層面與原文對齊外,其他子庫未對齊。
為了探索復雜介詞、二聯詞/三聯詞、詞匯搭配和常用程式化結構等司法用語在英語、意大利語和西班牙語中的頻率分布模式,Pontrandolfo自建了刑事判決語料庫(CoSPe)。CoSPe文本采集標準統一,遵循體裁和使用域一致的原則。該語料庫中的文本屬于不同的司法體系,無需進行語言標注和對齊加工,卻仍然能實現其為法律譯者和法律專家提供可利用資源以及提高司法用語能力的目的。
除了根據實際研究需要自建語料庫之外,本書均采用了語料庫翻譯研究的多重復合分析模式,即通過平行語料庫和可比語料庫系統比較和對照,在語言、文化和/或認知層面/維度上研究翻譯現象,如譯者處理語法復雜性的方式、譯者的價值判斷與接受、譯文變化的波動現象等。
Serbina等創建的擊鍵記錄翻譯語料庫不僅含有原文和目標譯文,而且包含了多個過程/中間譯文。通過此語料庫,Serbina等定量分析了英德翻譯(多個)中間譯文中的同一個語符的不同詞匯選擇、同一個語義、不同詞類替換或者在短語和小句層面的轉換、同一個詞的詞匯屈折變化和同義詞替換現象,從而探討了譯者在語法復雜性方面的處理方式。Serbina等的研究體現了語料庫翻譯研究從產品取向研究轉向產品和過程整合認知研究的新方向。在整合批評話語分析和系統功能語言學中利用人際意義的評價理論探討種族主義話語的語域轉換時,Mouka等作者對相關理論進行了改造,使之符合特定的研究目的,并且具有可操作性。通過自建的多模態平行語料庫及其與參照語料庫分析,Mouka等發現種族主義話語的負面態度意義在翻譯轉換中呈現弱化的總體趨勢。該文通過多層次/多維度的語料庫翻譯分析為我們提供了整合多語多模態語料庫和參考語料庫探討種族主義語域轉換研究的先例。
在自建平行語料庫和參照語料庫基礎上,Zubillaga等研究了德語與巴斯克語直接/間接翻譯模式,發現德語與巴斯克語直接翻譯和間接翻譯都符合Toury(1995)描寫翻譯研究的標準化法則和干擾法則。該文對基于語料庫的強勢與弱勢/少數文學翻譯研究極具借鑒意義,此類課題的進一步系統實證研究將為翻譯教學、詞典編纂、對比語言學和相關領域提供參考價值。值得一提的是,基于現有英語、荷蘭語平行語料庫,Doms在句法和語義層面探討英荷譯者對give 和show的非人稱主語的翻譯方式。與其研究假設相反,該研究發現荷蘭語譯文受到原文干擾,譯文中give 和show的主語分布模式為非人稱>無人稱>人稱,Doms從語言的句法和語義層面進一步闡釋了其中的原因。該文的研究體現了復合式研究的特征,體現了對比模式與因果模式相結合的新趨勢。
通過自建VARTRA-SMALL可比語料庫,LaPshinova-Koltunski通過詞匯語法模式和詞頻統計指標,探討了人工譯文、機助譯文和機器譯文的顯化、簡化、范化/透過效應和趨同化特征變異現象。研究結果表明,除趨同化之外,作者基于前人人工翻譯研究基礎上的研究假設均不成立。需要指出的是,在綜合比較研究不同翻譯方式產生的譯文特征變化方面,該文尚屬首例。在自建CoSPe可比語料庫和參照語料庫基礎上,Pontrandolfo綜合研究了司法用語的特征,數據分析顯示,與參考語料庫相比,CoSPe的司法用語出現頻率高,體現了該體裁在詞匯和句法方面的區別性特征;在標準化程度和司法用語使用頻率方面,英語子庫低于意大利語子庫和西班牙語子庫;法律語篇中典型出現的一系列慣用法似乎證明法律/司法語法的存在。該文的研究實現了語料庫驅動的翻譯研究目的,即為法律譯者、法律專家和詞典編纂者提供資源,提高司法用語能力。
一般認為,語料庫語言學在描寫翻譯研究中的應用發軔于Baker(1993)的研究,即翻譯研究將得益于語料庫基礎上的比較和對比研究。基于大型單語翻譯語料庫和非翻譯/目標語參考語料庫,Baker及其同事進行了譯文取向的語言特征描寫研究,主要探討翻譯共性假設。在語料庫翻譯研究中,Kenny(2001)
等學者則認為,能夠進行語際比較研究的雙語平行語料庫是對單語可比語料庫研究的有益補充。平行語料庫基礎上的原文取向翻譯研究重獲新生,并且不斷向過程取向和功能取向拓展(Xiao & Yue,2009),出現了適合特定研究課題(如譯者風格和意識形態)的自建小型雙語語料庫。最近十年來語料庫語言學方法在翻譯研究中的應用呈現上升趨勢,語料庫翻譯研究取得了長足發展,在翻譯研究中占有重要地位(Zanettin,Saldanha & Harding,2015)。
盡管語料庫翻譯研究在翻譯共性、意識形態、譯者風格和翻譯教學等方面發表和出版了一批價值頗高的研究成果,但是與單語語料庫相比,多語語料庫的建設和在翻譯中的應用進展緩慢。語料庫建設需要投入大量工作,其設計應該與應用目標相一致。“語料的收集、語料的構成以及對語料的加工應該緊緊圍繞語料庫的應用目標進行。”(常保保、詹衛東、張華瑞,2003)本書中的語料庫主要是符合特定翻譯研究課題而自建的小型多語語料庫,具有以下特色:(1)在語料的收集和加工方面緊緊圍繞其研究目的而設計;(2)均采用當前流行的XML標記語言進行標注,符合資源重復利用原則;(3)文本類型和數據類型涵蓋廣,主要有科技、電影字幕、文學和法律等多樣化的文本類型和多語種、多模態、行為數據和機譯數據等多種數據類型;(4)代表了語料庫創建的不同新方向,如翻譯產品與過程整合的平行語料庫、字幕翻譯多模態平行語料庫、直接/間接翻譯平行語料庫和人工/機器翻譯可比語料庫等;(5)自行研發的語料庫加工工具開辟了利用文本和研究材料的新途徑,拓展了語料庫應用范圍。
目前國際上語料庫翻譯研究方法出現了轉向,由單語類比研究模式轉向了雙語平行研究模式,雙語平行研究模式正在轉向多重復合分析模式。多重復合分析模式是采用原文子語料庫+(多語/多個)譯文子語料庫+非譯文子語料庫構成的平行語料庫和可比語料庫系統比較和對照的方法,可以多層次和多維度研究翻譯中語言、文化或認知現象(Mcenery & Xiao,2002;肖忠華,2012:5)。多重復合分析模式突破了語料庫翻譯研究的單純雙語平行研究模式和簡單雙語平行+類比研究模式,這種研究新趨勢“是復合式的對比模式,并向過程和因果模式過渡”(黃立波、王克非,2011)。在根據實際研究需要自建語料庫基礎上,本書各項研究均體現了多重復合分析模式的新趨勢,突破了單一類比研究模式、單純雙語平行研究模式和簡單雙語平行+類比研究模式的研究,并且在語言、文化和/或認知層面/維度上注重與過程模式和因果模式結合進行研究。本書采用的多語平行語料庫和多語可比語料庫復合研究方法體現了方法論意義上的新進展。
綜上所述,本書體現了語料庫的前沿研究,具有鮮明特色。語料庫緊緊圍繞其研究目的而進行設計,符合資源重復利用的原則,涵蓋多種文本/數據類型,代表語料庫創建的不同新方向。在根據實際研究需要自建語料庫基礎上,本書各項研究均進行多層面/維度的復合分析,體現了多重復合分析模式的新趨勢。
盡管本書在多語語料庫建設和多語語料庫翻譯研究方面體現了語料庫建設的新動向及其研究方法的新突破,但是總體上和個別研究中也存在值得商榷和有待完善之處。本書探討了七種歐洲語言(巴斯克語、荷蘭語、德語、希臘語、意大利語、西班牙語和英語)的多語語料庫建設與應用,缺少其他歐洲語言和非歐洲語言的語料庫建設和應用。多模態口譯語料庫的建設和研究是語料庫口譯研究新動向(黃立波、王克非,2011),本書缺少此類語料庫的建設和研究,盡管Mouka等的多模態字幕翻譯平行語料庫建設對多模態口譯語料庫的建設極具借鑒作用。本書中的自建語料庫規模小,缺少語料或者(半)自動加工軟件。
本書中的個別研究中存在有待完善之處。盡管Mouka等提供了多語多模態電影字幕語料庫的多層標注方法以及種族主義在電影字幕翻譯中語域轉換研究的先例,但是就翻譯方向和積極話語分析方面而言,我們發現Mouka等未曾涉及到其轉換特點與規律。不同翻譯方向的積極話語分析應當是進一步探索的領域。盡管LaPshinova-Koltunski開創了探討譯文變異現象的新方法,即將不同翻譯方式產生的譯文進行綜合比較研究,但是研究也存在不足,如未能將譯者經驗和機器翻譯記憶系統納入此研究中,并且探討譯文特征研究的文獻相對較多。Doms的研究價值在于正本清源地描述和解釋了譯者實時進行翻譯選擇的事實。由于語言差異,譯者在理論上會作出符合譯入語取向的選擇,但是譯者在實踐上往往會在源語和譯入語之間左右搖擺。該文注重語言分析,缺少社會文化和認知要素的分析。我們認為,翻譯生態環境(如翻譯方向、源語地位、原文語體、譯者翻譯能力、譯文讀者和出版審查制度等)會影響譯者的選擇,同時翻譯認知加工經濟機制也是關鍵要素。這些都是該文未曾探討的方面。
展望本書的研究,我們認為,科學技術進步和研究方法革新的有機結合是語料庫翻譯學不斷發展的推動力,從而使描寫翻譯學、理論翻譯學和應用翻譯學研究出現跨越性發展。隨著語料的不斷豐富和加工工具的研發與完善,若書中提到的各類語料庫規模不斷擴大,其應用前景可觀。科技技術進步使翻譯研究超越了Holms(1972)和Toury(1995)所倡導的描寫翻譯學的界限(Carl,Bangalore & Schaeffer,2016:3),突破了原有的語料庫翻譯研究范式。如前所述,多語語料庫建設和研究工具的開發及多重復合翻譯研究模
式中的多層次對比分析、因果探討和過程探索,部分承擔了理論翻譯學建構的使命,同時為應用翻譯學提供了理論和應用支持,如成果可以開發為培訓口筆譯者的材料/工具,以期提高譯者的翻譯能力。科技進步和研究方法的革新應當有機結合在一起。研究方法的選用并非生硬地移植或者組合,而應當與研究目的相適應。本書中的研究方法選擇適當,均與其研究目標一致。正如本書編者所言:“語料庫建設和研究主要取決于可獲得的語料資源和合適的語料處理工具,兩者緊密結合是探索語料庫翻譯研究新方向的關鍵。”(Fantinuoli & Zanettin,2015:9)
除了起決定性作用的研究工具/方法之外,語料庫翻譯研究的進一步發展同樣離不開研究團隊的內部合作以及跨地域、跨國界合作。不同領域和地域的學者取長補短,互利合作,是語料庫翻譯學乃至整個翻譯學學科建設和發展的重要保障。這是由語料庫翻譯學的跨學科性決定的。展望未來我們有理由相信建設性的地域或者國際聯合研究項目既可以保證科學技術進步和研究方法革新的有機結合,也有望在語料庫規模、語料類型、數據深加工、縱深拓展研究領域以及其應用價值等方面繼續探索,以期實現創新研究和其價值最大化。
經過 20 年左右的發展,語料庫翻譯學出現了產品—功能—過程與單語—雙語—多語的跨越發展,研究成果不斷涌現。多語語料庫建設與多語語料庫基礎上的翻譯研究成為語料庫翻譯學的一大亮點和新趨勢。盡管存在一定的不足,但是本書體現了語料庫翻譯學研究的新方向,在多語種和多模態語料庫的開發、深化舊課題(如翻譯共性、譯者風格、意識形態和翻譯教學等)和拓展新課題(如譯者的認知努力和譯者的專業能力等)的研究、多視角/多層次的多重復合研究模式(如對比、因果和過程等整合研究模式)等方面推動了翻譯學科的建設和發展。
[1] Baker, M. 1993. CorPus Linguistics and Translation Studies: ImPlications and APPlications[A]. In M. Baker, G. Francis & e. Tognini-Bonelli (eds.) TextAnd Technology: In Нonour of John SinclAir[C]. Amsterdam: John Benjamins Publishing ComPany.
[2] Carl, M., S. Bangalore & M. Schaeffer. 2016. Introduction and overview[A]. In M. Carl, S. Bangalore & M. Schaeffer (eds.) NewDirections in EmPiricAl TrAnslAtion Process ReseArch:ExPloring the cRITT TPR-DB[C]. Cham: SPringer Interrnational Publishing AG.
[3] ?ermák, F & A. Rosen. 2012. The Case of InterCorP, a Multilingual Parallel CorPus[J]. InternAtionAl JournAl of corPus Linguistics, (3): 411-427.
[4] ChristodoulouPoulos, C. & M. Steedman. 2015. A Massively Parallel CorPus: The Bible in 100 Languages[J]. LAng Resources & EvAluAtion, (49): 375-395.
[5] Fantinuoli, C. & F. Zanettin. 2015. NewDirections in corPus-bAsed TrAnslAtion Studies[C]. Berlin: Language Science Press.
[6] Holmes, J. 1972. The Name and Nature of Translation Studies[R]. Translation Section of the Third International Congress of APPlied Linguistics, CoPenhagen.
[7] Kenny, D. 2001. Lexis And creAtivity in TrAnslAtion[M]. Manchester: St. Jerome Publishing.
[8] Mcenery, A. & R. Xiao. 2002. Domains, Text TyPes, AsPect Making and Chinese Translation[J]. LAnguAges in contrAst, (2): 211-231.
[9] Schm idt, T. & K. W?rner. 2012. MultilinguAl corPorA And MultilinguAl corPus AnAlysis[C]. Amsterdam: John Benjam ins Publishing ComPany.
[10] Toury, G. 1995. DescriPtive TrAnslAtion Studies And beyond[M]. Amsterdam: John Benjamins Publishing ComPany.
[11] Xiao, R. & M. Yue. 2009. Using CorPora in Translation Studies: The State of the Art[A]. In P. Baker (ed.) contemPorAry corPus Linguistics[C]. London: Continuum.
[12] Zanettin, F., G. Saldanha & S. Harding. 2015. Sketching LandscaPes in Translation Studies: A BibliograPhic Study[J]. PersPectives: Studies inTrAnslAtology, (2): 1–22.
[13] 常保保, 詹衛東, 張華瑞. 2003. 面向漢英機器翻譯的雙語語料庫的建設及其管理[J].術語標準化與信息技術, (1): 28-31.
[14] 黃立波, 王克非. 2011. 語料庫翻譯學:課題與進展[J].外語教學與研究, (6): 911-923.
[15] 肖忠華. 2012. 英漢翻譯中的漢語譯文語料庫研究[M].上海:上海交通大學出版社.
(責任編輯:于 濤)
2016-03-28;
2016-04-11
侯林平,男,副教授,博士生,研究方向:語料庫翻譯學、認知神經翻譯學