□董 妍
機器翻譯與文本編輯:進展與展望
□董 妍
全球化進程的加快,促使國際交流變得日益重要,這不可避免地把口筆譯者推向了高需求的平臺,基于其承擔著連接不同語言國家交流的任務并充當重要角色。然而,在實現這一跨語言交際的過程中,很多的障礙隨之顯現,涵蓋領域也較廣,從經濟問題、語用學及一致性問題到翻譯速度的問題。換言之,大筆的資金和大量的精力需要投入到翻譯之中,以保證翻譯的速度和質量。事實上,人力固然可以做到很多,但翻譯文本各方面都要達到完美卻不可強求,而此時,基于電腦的工具和MT(機器翻譯)便應運而生,以最大限度的滿足翻譯需求。從字面意思來理解機器翻譯:由電腦來完成的翻譯,其工作原理遵照一套體系——首先,“分析源語言以建立內部表征(internal representation),然后用特有的方法運用這些內部表征來最終生成目標語言”。
機器翻譯 人工 創造力 翻億庫
在翻譯的歷史中,電腦和人工翻譯之間的關系可追溯到17世紀,可謂源遠流長。然而直到20世紀50年代第一個機翻系統才誕生,可以說機翻的發展成熟非常緩慢。最初,機翻的文稿質量偏低以至于無法采納。當時,機翻系統只收錄有限幾種語言的字典。后來,隨著在線資源的日益豐富,機翻的質量逐漸提高并開始廣為所用。盡管機翻曾經給人們的印象是只要按一下按鈕就可以了(Hutchins,2003),這種翻譯方法確實為翻譯事業提供了很多幫助和便捷。如下圖所示(Wu,2012):

顯然,在翻譯過程中,鑒于機翻與人工翻譯的關系以及他們各自獨立翻譯時的表現,不可否認的是,電腦在做簡單翻譯時比人工更勝一籌。然而,當源語言文件的復雜程度逐漸提高時,機翻的質量也隨之下降,因此可以看出,文件的復雜性僅僅對人工翻譯產生不明顯的影響。也就是說,對不同文本(從簡單到適中再到復雜)的翻譯,人工的表現更平衡一些。當翻譯復雜文本,如詩歌、理論和諺語時,在文體學、語義學和語用學方面人工表現更靈活自然。更重要的是,從上圖可得知,在電腦的輔助下,人工翻譯的質量得到了顯著改善。正如Wu所提“不同的翻譯文本要使用不同的翻譯工具,對癥下藥(Right tools for right tasks)——在某種程度上,電腦對人工翻譯起到了補充作用。(Wu,2012)
既然電腦與人工翻譯的關系得到了印證,那么他們之間如何有效合作并做出高質量的翻譯被納入議題。如下圖(Matthiessen,2001:114):

從上圖可以看出電腦和人工在翻譯過程中的工作分配,在圖表的最上端可以看到電腦扮演的角色是“行動者”而人的角色是“受益者”,也就是說在這一階段,電腦做了主要的翻譯工作。然而整個圖表顯示出電腦與人工的關系在不同階段產生了變化——當電腦承擔了主要的翻譯工作而沒有人工介入時,人便是“受益者”;當電腦做部分的翻譯時,人是決策者,也要做一些前期編輯和后期編輯,這些會在本文后部分討論;當人工做所有的翻譯時,電腦變為“工具”,而人則是“行動者”,例如關鍵詞和字典的翻譯。
前文提到,在做機器翻譯時,前期編輯和后期的翻譯需要人工完成,因為電腦的智能程度與人類相差甚遠,它們無法保證對每個字、詞進行恰當合適的翻譯,也就是說,一個單詞在一種語言內是多義的,因此,在翻譯時語域和具體概念要進行相應的考量,這是電腦無法實現的。因此,在為機翻做前期編輯和準備工作時,人們需要對句子進行“分割以處理復雜的意群、可能產生歧義的語義模糊的詞匯和其他類似的情況”(MacDonald,1979:91-143)。Hutchins也指出前期編輯可應用于不同情況,例如:“某個單詞是否具有特定含義、某個名稱是否需要翻譯以及復合名詞的界限”,以插入“標點符號”或者把“長句分割為短句”(Hutchins,2003)。除了對源語言的翻譯加以注意外,盡管有拼寫和語法檢查器,人工翻譯時也應該避免誤拼的現象,因為“個別的單詞可能無法為電腦識別,一旦發生錯識將會對后期的翻譯產生很大的影響”。如果前期編輯打下良好的基礎,后期編輯的工作量將會有顯著的減少。Hutchins還指出,理論上,在做前期編輯時,人們無需對目標語言有廣泛的了解,然而事實上,一定的了解還是必要的,這對后期的翻譯有一定的幫助。但是,前期編輯也有一些弊端仍然被認為是權宜之計。(MacDonald,1979:91-143)
完成前期編輯之后,電腦就可以自主進行翻譯,盡管仍然會有一些小的誤翻。前期編輯主要專注于一些省略、代詞和一致性等問題。Hutchins認為后期編輯的工作量是可以減少的——“文稿越標準化”,術語和陳詞濫調越多,文稿就越老套且缺乏創造性,機翻的準確性就越高,這樣一來,后期編輯的校正工作也就相應減少了(Hutchins,2003)。電腦最擅長的工作就是標準化的翻譯,所以它更擅長處理一些規矩的句子,因為創造性的翻譯沒有程序可遵循,且不可預見。換言之,翻憶庫(翻譯記憶庫)——一種“存儲所謂的句子‘片斷’的數據庫,例如句子或類似于句子的語言單位——標題、題目或者列表的各項,這些片斷都是現成的可參考的翻譯”,(翻譯記憶庫,2012)它的研發者不可能輸入所有單詞的所有意思,因此,當面臨創造性或不常見的詞組或句子結構時,翻憶庫的存儲數據就顯得不足。
與前期編輯不同,后期編輯一般由譯者來完成,因為雙語技能的獲得是靠時間積累而來,這一點專業譯者比非專業譯者更具優勢(Hutchins,2003)。因此,人工在翻譯中被引入,也就導致“翻譯成本提高”(McDonald,1979:91-143)。當然,這其中也包含前期編輯的費用。另外,譯者們在做后期編輯時需要保持一致性,因為不同的譯者對于某些詞匯或句子結構有其更傾向的翻譯,這樣最終在翻譯過程中可能會導致文體或詞匯選擇的不一致。
不可否認的是,機翻可以做到對概念、重復和常見的句子結構的翻譯保持一致。但是,Hutchins提出后期編輯的另外一個弊端——如果翻憶庫中存儲的是不恰當的字或句子翻譯,做后期編輯的譯者就要不停的修正這些問題,這樣人們的工作就是輔助電腦而不是機翻的受益者。他也因此提出一項解決方案,有一定翻譯技能的后期譯者可以代替專業譯者來做后期編輯,他們也可以接受一定的培訓以提高翻譯水平。當然后期譯者的傭金可能會相對低一些。(Hutchins,2003)
為了提高機翻質量,人工和電腦的合作至關重要,因此基于語言本身一直在變化(新詞,創造性用法的不斷出現),人們在翻譯的過程中要做出一定的調整。Bar-Hillel列舉了一些例子:“字典自動存儲和檢索的問題 ”和“微語言學意義和微語法”。盡管這些例子在幾十年前就己經提出,但到現在仍然適用,因為語言一直在變化,這導致翻譯的質量也一直提升沒有終點(Bar-Hillel,1960:91-163)。Josselson也提出了類似觀點:擴大字典涵蓋的方面和豐富語法對于提高機翻的質量十分必要,這包括:“設計出符合雙語的形態學的、句法的和語義的編碼、句法分析的規則、自動的句子語法分析規則和多選規則”。他還認為在機翻過程中,對比分析最適合產出高質量的翻譯。通過比較目標語言的不同譯本,翻憶庫的研發者就可以有不斷豐富的數據資源以翻譯在源語言中出現的創新的表達、詞匯組合(Josselson,1971:1-53)。同時,隨著科技發展,自動的后期編輯可以由電腦來完成,但同樣,這是對未來發展的展望。
具體說來,近年來,評估電腦自動后期編輯的項目層出不窮。由此,研究人員通過結構分析可以尋找更多有益于提高翻譯質量的方法。Doyon等人在2008年做過一個名為《通過后期編輯提高自動機翻質量的技術:分析師和譯者經驗》的研究項目。這個項目的研究人員比較了由電腦和人工分別做出的后期編輯的譯本,發現前者的翻譯的質量“低于譯者和分析師認可的可被采納的標準,而所有的人工做出的后期編輯都處于甚至高于此標準”(Doyon et al,2008)。從這一研究結果得知機翻始終不盡人意,即其在輔助人工翻譯方面還有很長的路要走。他們還做了一個調查,結果顯示一旦經過人工的后期編輯,人們還是更傾向于使用機器翻譯,而且當時在阿拉伯語和英語機器翻譯中并無不可采納的自動后期編輯譯本。該項目的實驗有一定的局限性,但是,Ariadna得出了相似的結論——大多數的機翻系統與后期編輯的配合并不如翻憶庫數據和SDL系統的Multerm默契。她提出了兩個改善建議:第一,“在線翻譯校正工具”對“簡單的錯誤診斷和不明顯的錯誤分類”是有幫助的;第二,“自動的翻譯規則完善工具通過追溯譯文的錯誤到原始的翻譯規則和詞條錄入,進行修正多數屬于詞匯和形態句法的錯誤”,例如“用詞順序錯誤或未遵循語言間轉換規則”(Ariadna,2009)。然而無論如何,大多數時候,人們在機翻的過程中仍然發揮著不可替代的作用,因為很多不同領域的調整,從功能語法到對翻憶庫的擴充,都需要人為完成,并且人工智能程度是電腦無法企及的,況且不同語言的表達方法也不可預知。
盡管機翻有一段相對較長的歷史,機翻軟件還是處于初級階段且人們可以想像人工翻譯的未來也許是“電腦輸出較對”和機器可以做一些人工的翻譯工作且具有一定的準確性(Champollion,2010)。盡管實踐證明人們在搜索信息時使用的機翻軟件有很強的包容性,但機翻是否可以滿足廣大的市場需求仍依賴于語言本身和市場規模(Bracken,2011)。考慮到如上因素,在某種程度上,電腦在未來可以很好地輔助人工翻譯,盡管在前期或后期編輯過程中仍需要有少量或無人工介入。
本文介紹了電腦在輔助人工翻譯方面的功能,并做了一些文獻回顧和討論,以明確雙方如何相互作用。事實上,盡管電腦在某些特定領域己經可以替代人工做很大一部分的翻譯工作,例如一些技術性的或簡單的無創造性的文章,但其范疇仍然是受限的,特別是在一些語言方面——電腦對“某種語言的翻譯質量要明顯高于其他語言”(Bracken,2011),這種現像表明機翻發展的不平衡性。此外,機翻的現狀是在前期編輯,甚至是后期編輯過程中仍然需要人工的介入。從另外一個角度講,電腦翻譯的文本可以看作是“草稿”而人工進行的后期編輯則可以看作是“校對”,這個前文提及的“電腦輸出較對”意味著在追求高質量翻譯的同時,人們的工作量將大大減少。盡管有人認為由于在完成并完善“草稿”的過程中,人工的大量投入,看起來人們是輔助電腦而不是接受幫助的一方,然而恰恰相反。人們在完善機翻系統的同時,提高了其翻譯的質量,這恰恰有助于提高人們以后的翻譯質量。這樣一來,實現無需大量人力和大筆物力投入的高質量翻譯藍圖的可能性將提高。因此,電腦與人類是互惠合作關系。把Bracken的話作為本文的結尾再適合不過:“除卻所有的進步之外,在主流翻譯中,機器在替代人工的路還有很長一段要走,但是事實也證明了機翻的自身價值,即所有的語言服務提供商對機器翻譯的態度都是承認其可行性而非排斥?!保˙racken,2011)
[1]Ariadna,FL.Automatic Improvement of Machine Translation Systems[D/OL].[2012-06-16].http://gradworks.umi. com/32/85/3285855.html.
[2]Bar-Hillel,Y.The PresentStatus of Automatic Translation of Languages[A].Alt FL.Advances in Computers[C].New York:Academic Press,1960.
[3]Bracken,C.Machine Translation:where is it now,and where is it headed?[Z/OL].2011[2012-06-16].http://www. andovar.com/blog/machine-translation/.
[4]Champollion,Y.MachineTranslation(MT),and the Future of the Translation Industry[J/OL].2010[2012-06-16]. http://www.bokorlang.com/journal/15mt.htm.
[5]Doran,C,Doyon.J,Means,CD & Parr,D.Automated Machine Translation Improvement Through Post-Editing Techniques:Analyst and Translator Experiments[DB/OL]. 2008[2012-06-16].http://www.mt-archive.info/AMTA-2008-Doyon.pdf.
[6]Durgesh,DR 1998,Machine Translation:A General Introduction[DB/OL].1998[2012-06-15].http://www.ias. ac.in/resonance/July1998/pdf/July1998p61-70.pdf.
[7]Hutchins,J.Eds.MachineTranslation and Computer-based Translation Tools:what’s available and how it’s used.from transcript of presentation[M].Valladolid:University of Valladolid,2003.
[8]Josselson,M.Eds.Automatic Translation of Languages since 1960:a linguist’s view[A].Advances in Computers[C].1971.
[9]MacDonald,RR.The Problem of Machine Translation[A]. Henise-Dostert,B,Macdonald,RR & Zarechnak.Machine Translation[C].The Hague:Mouton Publishers,1979.
[10]Matthiessen,C.The Environments of Translation[A]. Steiner,E & Yallop,C.Exploring Translation and Multilingual Text Production:beyond Content[C]. Berlin,New York:Mouton de Gruyter,2001.
[11]TranslationMemory[DB/OL].2012[2012-06-15].http:// en.wikipedia.org/wiki/Translation_memory.
[12]Wu,CZ.Lecture 1,PowerPoint slides[DB].Sydney:Macquarie University,2012.
(董妍 澳大利亞麥考瑞大學人文科學學院)