羅季美
(同濟大學外國語學院,上海 200092)
隨著計算機科學技術、語言學、邏輯學和信息學等相關學科的發展,在最近的三十多年中,機器翻譯研究無論在理論方面還是工程實踐方面都已經積累了豐富的經驗,取得了顯著的成就,尤其在對受限語言①[1]的處理上,機器翻譯已達到了最高的5級適用級別和85%的可翻譯度[2]。本文將以“汽車技術文獻翻譯語料庫”為基礎,對機器在這一受限語言范疇內表現出的術語翻譯錯誤進行歸納、描述和分析,縮小這一限定語言內術語的范疇和詞義,為翻譯系統在原有基礎上提高對這一受限語言范疇內的機器翻譯質量提供語言分析基礎。
在受限語言內進行機器翻譯也是計算機翻譯誕生之初人們所限定的機器翻譯的使用范圍[3]?!稒C器翻譯后譯文編輯模式研究》②項目組選擇了同濟大學汽車學院“汽車技術文獻翻譯語料庫”中某一知名品牌汽車操作手冊這一受限語言語料作為研究對象,對十萬句對的英語原語料、機器翻譯譯文和人工翻譯譯文進行了一句英語原文對應一句機器譯文和一句人工譯文的平行對比。其中機器譯文由“華建機器翻譯系統”(中國科學院計算機語言信息工程研究中心研發)生成獲取,人工譯文來源于同濟大學汽車學院資料翻譯研究所[4]。
筆者作為語料對比的參與者,在人工逐句對比的基礎上,對機器翻譯中的詞匯、句法和符號等翻譯錯誤進行了標注、統計。下文將對機器在詞匯處理中的術語翻譯錯誤做出歸納、描述和分析說明。
術語是各門學科的專門用語。《蘇聯大百科全書》定義術語是用來準確標示專門領域內的概念及其與其他概念關系的詞或詞組,是該領域內有代表性的事物、現象、其特征與關系的專業化的、加以限定的表述[5]。術語可以是詞,也可以是詞組;術語不同于語言中的普通詞匯,具有專業性、科學性、單義性和系統性特征[6]?!霸谌魏伟l達語言中,術語在詞匯總量中所占的比重都遠遠高于普通詞匯?!保?]這一點從《機器翻譯后譯文編輯模式研究》項目組對機器譯文詞匯翻譯錯誤概率統計中已得到鮮明的反映。
對本次語料對比的錯譯標注進行統計發現,在包括詞性錯譯、連詞錯譯、術語錯譯、縮略詞錯譯、詞匯替代錯譯、詞匯漏譯和詞匯不譯等七類詞匯錯譯中,術語錯譯率以78.85%高居榜首,而6.45%的縮略詞錯譯率也主要體現在術語縮略詞的錯誤處理上[4]。兩者相加意味著實際術語錯譯率高達85.3%。
術語的準確轉換不僅是機器翻譯有待解決的問題,事實上對非翻譯材料所涉及專業的譯員而言也一直是個瓶頸。術語問題之所以成為翻譯的巨大障礙,主要原因還在于術語的單義性只是其在某一專業范圍內的意義單一,而對同一客觀事物或現象等,在不同的學科和日常生活中可能會用不同的詞語表示,如“unlock”在一般用語中常譯為“開鎖”,而在汽車專業中則應譯為“解鎖”;“memory system”在心理學中可譯為“記憶系統”,而在汽車專業中則應該譯為“存儲系統”;“terminal”在計算機領域指“終端”,而在汽車專業則固定譯為“端子”。其次,由于非術語詞的術語化正是術語創造的主要方式之一,術語與非術語的互相轉化也為機器準確翻譯增加了難度。而大量使用術語是科技文獻的重要語言特征,本次汽車技術文獻機器譯文表現出的術語及縮略詞翻譯錯誤率也從另一側面證實了這一點。
通過細致的譯文對比,我們發現機器對術語的錯誤處理主要有以下三個表現:術語詞義翻譯錯誤涉及多種詞性,術語縮略詞翻譯錯誤,在同一受限語言中機器對術語的處理無法保持一致性。下文將結合實例對這三類術語錯譯的表現形式加以描述和說明。
在下文所有例句句對中,英語為汽車操作手冊的原英語語料,A句為機器譯文,B句為人工譯文。在所給例句中,每次只針對所述錯誤類型的單一翻譯錯誤進行比較。因為語料本身的問題或采集時處理不當,或因為機器翻譯系統本身的性能問題,所列句對中有些句子可能缺少標點、符號或存在文字漏譯等現象。為了嚴格保持譯文對比的客觀性,下文所引用的例句都保持了語料原始樣本。
1)涉及多種詞性的術語詞義翻譯錯誤
在英語中一詞多義是較為普遍的現象,譯員只要對其所譯內容具有相關基本知識儲備,在翻譯中一般都能準確理解;即使譯員不具備相關基本知識,往往也會因其自身的謹慎態度去尋求專業人員的幫助。在機器翻譯中對術語詞義的準確把握卻是一大難題,常常生成錯誤譯文。這種錯譯在科技文本的機器翻譯中表現得更為突出,在名詞術語、形容詞術語和動詞術語的處理上都存在大量錯譯。
(1)名詞術語翻譯錯誤
① ACT+(B10-2)— Body ground
A:ACT+(B10-2)— 身體地
B:ACT+(B10-2)— 車身搭鐵
②CHECK HARNESS AND CONNECTOR(ECU—ACTUATOR)
A:檢查馬具和連接器(ECU—激勵器)
B:檢查線束和連接器(ECU—執行器)
③CHECK TERMINAL VOLTAGE(TACH TERMINAL)
A:檢查終端電壓(TACH末端)
B:檢查端子電壓(TACH端子)
在①和②中,機器將“Body ground”“HARNESS”和“ACTUATOR”譯為“身體地”“馬具”和“激勵器”,對比人工譯文可以看到機器將汽車技術領域的專用術語誤譯為日常用語。在③中“TERMINAL”一詞的機器譯文使用了非汽車行業的術語詞“終端”和“末端”。
(2)動詞術語翻譯錯誤
①TACH signals from the ECM remain interrupted for 1.3 seconds or more.
A:來自ECM的TACH信號保持打斷1.3秒或更長。
B:來自 ECM的 TACH信號持續中斷達1.3秒或更長時間。
②Disconnect the throttle body connector and clamp.
A:拆開節流閥身體連接器和壓板。
B:斷開節氣門體連接器和卡夾。
③Uniformly loosen and remove the 6 bolts and 4 nuts.
A:均勻,6個螺栓和4顆螺母放松并且遷移了。
B:均勻地擰松并拆下6個螺栓和4個螺母。
用詞準確嚴謹是科技英語的一個重要文體特征,在①和③的機器譯文中,分別用“打斷”和“放松”來解釋“interrupted”和“loosen”,與人工譯文選詞“中斷”和“擰松”相比,其選用的詞匯口語性較強,缺乏科技術語的嚴謹和正式。在②和③的機器譯文中選用了“拆開”和“遷移”來表示“disconnect”和“remove”之義,與人工譯文選用的“斷開”和“拆下”有明顯的詞義差別,會給譯文讀者造成對原文的誤解。
(3)形容詞術語翻譯錯誤
①Models with Intelligent AFS:
A:有聰明的AFS的模型:
B:帶智能AFS的車型:
②Reconnect the active control engine mount ECU connector.
A:再接通活躍的控制器ECU連接器山。
B:重新連接主動控制發動機支座 ECU連接器。
“Intelligent”在科技文章中與名詞結合表示物體的智能特性已成為常用詞,①中A句將其譯為“聰明的”顯然構成誤譯。②中機器譯文將修飾“control engine”的“active”譯為“活躍的”,這與 B句中“主動”對“control engine(控制發動機)”的描述具有性質上的差別。
2)術語縮略詞翻譯錯誤
為使文本更加簡潔明了,科技英語中經常會使用術語縮略詞??s略詞的構成方法不一,可以由多個單詞的首字母組成,如“TLD”代表“tension limits detector(張力極限檢測器)”,或由單詞的前幾個字母組成,如“POT”代表“potentiometer(電位計)”,或抽出單詞中的關鍵字母組成,如“TCPL”或“T/C”代表“thermocouple(熱電偶)”。 也有一些縮略詞由不同的方法混合而成。無論縮略詞以何種方式構成,使用縮略詞的目的都是為了使表達更加簡練,使人易記。但要準確翻譯縮略詞,必須正確理解其本來面目和詞義。對縮略詞的理解,除“radar”“aids”等一些常用縮略詞外,讀者通常必須將其還原回全稱形式。要求機器自動還原縮略詞以得到準確譯文,可行而且比較有效的方法就是建立縮略詞詞典。譯文比較也真實反映了在缺乏縮略詞詞典的狀態下機器在縮略詞翻譯上的失敗。
① If the CAN communication malfunctions, the ECU cannot receive the current data from the ECM.
A:如果罐頭通訊故障,ECU不能從ECM得到當今的數據。
B:如果CAN通信有故障,ECU不能接收來自ECM的當前數據。
CAN是 Controller Area Network(控制器局域網)的首字母縮寫,已成為汽車技術中的固定術語?!癈AN”在日常用語中可以表示“罐頭”之義。此處機器將其譯為“罐頭”,使得整句的譯文質量大打折扣,讓讀者不知所云。
另有研究顯示,吃熟食時血液和腸道中白細胞數量會出現暫時性增多,這可能與白細胞參與調動體內酶類消化食物有關,長期、單純的食用熟食,導致免疫系統負荷增加,可能會降低機體的殺菌和免疫功能。
②Remove the hood hinge cover RH.
A:除去罩絞鏈蓋住萊茵鋼鐵公司。
B:拆下發動機蓋右側鉸鏈蓋。
RH可以是“Rhinemetal Group”的縮寫,因此在②A句中譯成了萊茵鋼鐵公司,但這樣的譯文使整個句子不知所云。B句將RH譯為右側,因為RH也可以是“right hand”的縮寫,人工譯文因其對“RH”譯文的準確把握使句子具有實際意義或可理解性。在本次語料中像“RH”這樣出現頻率較高的表示方位的縮略詞術語還有“LH”(left hand)和“FR”(front)等。
3)術語翻譯缺乏一致性
在科技文本的翻譯中,保持術語的一致性是翻譯的基本原則。而此次譯文對比發現同一術語出現在不同的上下文中時,機器在翻譯過程中卻時常不能保持其一致性。
①Install the active control engine mount ECU with the nut.
A:用堅果安裝活躍的控制器ECU山。
B:用螺母安裝主動控制發動機支座ECU。
②Remove the 3 nuts and active control engine mount.
A:除去笨和活躍的控制器安裝的這3個。
B:拆下3個螺母和主動控制發動機支座。
③Install the active control engine mount with the 3 nuts.
A:用3顆螺母安裝活躍的控制器底座。
B:用3個螺母安裝主動控制發動機支座。
在以上三個例句中,機器對“nut”做翻譯處理時分別選擇了“堅果”“笨”和“螺母”,而從三句人工譯文中可以看到實際上“nut”在這些句子中的意義是一致的,都應譯為“螺母”。
④INSTALL ENGINE MOUNTINGBRACKET FR
A:安裝發動機騎在馬上方括號FR
B:安裝前發動機懸置支架
⑤Install the engine mounting bracket FR with the 4 bolts.
A:安裝這臺發動機爬上與這4個螺栓一起FR。
B:用4個螺栓安裝前發動機懸置支架。
④和⑤中的“ENGINE MOUNTING BRACKET FR”和“the engine mounting bracket FR”屬于詞組類術語,在兩句中意義一致,都表示“前發動機懸置支架”,但機器對同一術語的翻譯完全喪失了保持術語一致性的原則。機器對同一技術文本中同一術語處理的隨意性所造成的信息失真及給讀者帶來的閱讀障礙是顯而易見的。
大量使用術語是科技文體的一個重要特征,機器翻譯在術語翻譯上出現的近85.3%的錯誤率,不僅會給譯文讀者帶來很多不便,有時甚至會導致科學研究工作的重大失誤。術語翻譯的錯誤也屬于詞的歧義問題之一。早在機器翻譯初創期,韋弗(Weaver)就提出詞的歧義問題可以通過具體的語境來解決[7]。語境提供了較充足的信息,在很大程度上可以保證詞義分析的正確性。利用“汽車翻譯語料庫”中的譯文語料進行機器譯文和人工譯文的對比,極大地縮小了這一限定語言內術語的范疇和詞義,為建立汽車專業技術文件的術語詞典提供了便利。考慮到術語翻譯錯誤在十萬句對機器譯文中的錯誤率,汽車技術文件術語詞典的創建應該是提高機器翻譯系統對這一限定專業領域內文件處理能力的高效便捷途徑。
注釋
①受限語言指為克服語言的復雜性,語言學家和工程師對自然語言進行一定限制的語言的真子集。目前受控語言已發展至第三代,其多數產品屬于面向機器的受控語言。
②李梅主持的教育部人文社科項目“機器翻譯后譯文編輯模式研究”(2007—2010年,項目號為07JA740010)。
[1]胡清平.機器翻譯中的受控語言[J].中國科技翻譯,2005(8):24-27.
[2]張政.計算機翻譯研究[M].北京:清華大學出版社,2006:131-162.
[3]Hutchins W J, Somers H L.An Introduction to Machine Translation[M].San Diego: Academic Press, 1992:5.
[4]羅季美,李梅.機器翻譯譯文錯誤分析[J].中國翻譯,2012(5):84-89.
[5]鄭述譜.關于術語及術語學[J].外語學刊,2001(2):5-9.
[6]馮志偉.現代術語學引論[M].北京:語文出版社,1997.
[7]Weaver W.Translation [C]//Machine Translation of Languages.Locke W N&Booth A D.New York:John Wiley, 1955:15-27.