999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于錯誤類型的譯前編輯策略探究

2024-12-31 00:00:00王行舟
新楚文化 2024年21期

【摘要】機器翻譯在經歷了基于實例、基于統計、基于神經網絡的三次迭代后,翻譯質量在某些領域甚至能和專業譯員媲美,人機協作的翻譯模式因此成為語言服務市場的主流。譯前編輯作為一種人機協作翻譯模式,較少受到國內學者的關注,卻對減少譯后編輯工作量不可或缺。因此本文著眼于文學文本的譯前編輯,采用MQM質量評估標準,對《邊城》機器翻譯中的錯誤進行歸類,提出可行的譯前編輯策略并檢驗其對機翻質量的影響,以期為機器翻譯的領域適應和效率提升提供啟示。

【關鍵詞】機器翻譯;譯前編輯;神經網絡翻譯;《邊城》

【中圖分類號】H085;I046 " " "【文獻標識碼】A 【文章編號】2097-2261(2024)21-0056-04

【DOI】10.20133/j.cnki.CN42-1932/G1.2024.21.014

【基金項目】本文系2022年湖南省社科基金項目“《邊城》英語譯介的湘西敘事重構研究”(項目編號:2022YBA200)的階段性研究成果。

一、引言

隨著自然語言處理和人工智能的突飛猛進,機器翻譯完成了從基于實例、基于統計、基于神經網絡的升級,在翻譯質量上得到顯著提升。

2016年谷歌推出神經網絡翻譯系統并投入商用,機器翻譯迅速普及走向了產業化。在某些領域,神經網絡機器翻譯產出的譯文質量甚至可以達到專業譯員的水平。然而神經網絡機器翻譯不免出現漏譯和誤譯現象,人類譯員的把關仍舊必不可少。

人機協作的翻譯模式始于20世紀50年代,早期從事譯后編輯的人員甚至不需要掌握源語,到80年代譯后編輯才被確立為翻譯過程中的重要一環。經過四十多年的發展,如今人機混合翻譯服務已成為市場主流。

2021年美國CSA Research公司預測,人機混合服務的需求將成為語言服務行業發展的主要推動力,而譯后編輯則是其中的首要需求。王華樹和李智通過調查發現,受試者中半數以上的譯員借助機器翻譯并結合譯后編輯來完成工作,并表示人機協作的翻譯模式能提高11%至70%的翻譯效率[1]。

譯前編輯和譯后編輯同屬人機協作的翻譯模式,在學術界獲得的關注卻呈現出顯著差異。譯前編輯僅僅在關于譯后編輯的討論中被順帶提及,缺少學者針對性的深入研究。而國內外譯后編輯研究則已形成聚類,如“譯后編輯概述、譯后編輯評估研究、機器翻譯錯誤識別與譯后編輯工具研發、譯后編輯研究的行業視角、譯后編輯能力與譯后編輯者的培養”等[2]。

然而,譯前編輯對于減少譯后編輯工作量,避免低質機譯造成的精力損耗有著重要意義。譯前編輯過的原文經過機器翻譯后,產出的原始譯文中需要糾正的錯誤更少。此外,許多文本也存在譯后編輯工作量過大或者無法進行譯后編輯的情況,此時譯前編輯的干預則尤為重要。

二、譯前編輯概述

譯前編輯涉及使用一套術語、文體指南或規則,在翻譯自動化之前準備原文,以提高原始輸出質量。原文準備中不僅要去除排版錯誤,糾正內容中可能出現的錯誤,還要調整句子長度,使用某些語法結構,如簡化語序和減少被動語態,或語義選擇,如使用一致的術語,或者標注某些可能不需要翻譯的術語,如產品名稱。

相較之下,譯后編輯則致力于修正機器輸出譯文中的錯誤,使譯文達到預期的質量標準。如果說譯后編輯是對錯誤產生后的一種被動彌補,那么譯前編輯則是主動預設可能出現的錯誤。

和譯前編輯較為相似的一個概念是受控語言,兩者都是通過處理原文以提高機器翻譯的質量,但在應用場景、編輯范圍和文本類型方面,兩者仍存在顯著的差異。譯前編輯主要應用于機器翻譯,是針對文本的具體處理,而受控語言除了翻譯之外,還可以運用在技術寫作,翻譯審校等領域,是一套指導文本處理的規則。

在編輯范圍上,譯前編輯可以對內容、格式和印刷方面任何可能出現的錯誤進行調整,而受控語言則主要從詞匯語法和風格層面對原文進行改寫以使之符合規范。在應用文本層面,譯前編輯可應用于多種文本類型,而受控語言常用在技術文檔的生成和翻譯。

國外對于譯前編輯的研究已有了一些嘗試。不同的語言對和翻譯方向,不同的文本類型和特定機器翻譯系統都對會對譯前編輯的效率產生影響。Mercader-Alarcon和Sanchez-Matinez[3]以及Miyata和Fujita[4]分別使用基于規則和基于短語的統計機器翻譯進行譯前編輯,觀察到原始輸出的機器翻譯譯文在錯誤率上有了下降。然而譯前編輯對于提升NMT產出譯文質量的效力卻并不明確。?ner Bulut和Alimen發現在英語和土耳其語言對上,譯前編輯并未能減少NMT翻譯用戶指南中的術語錯誤[5]。Bounaas等人指出,在英語到阿拉伯語的兒童文學翻譯中,譯前編輯提升了NMT產出譯文的可接受性和可讀性[6]。

目前國內對于譯前編輯的關注較少,但是眾多學者都已關注到了譯前編輯的必要性,并將之作為未來的研究方向。馮全功和崔啟亮表示利用受控語言進行譯前編輯可以有效地提高機器翻譯的準確性。王湘玲和賈艷芳也指出實施譯前編輯對于減少消極翻譯指征和提高機器翻譯質量有著重要作用[7]。徐紅和黃協安認為,梳理譯前編輯研究有利于傳播該領域新的研究范式,總結有效的譯前編輯方法,為找到研究突破口提供啟示[8]。也有學者表示機器翻譯的廣泛使用和日新月異,相關研究不僅需要針對特定語言對、特定機器翻譯系統和特定文本類型進行譯前編輯策略的探索,同時需要對相關策略進行及時更新。

三、機器翻譯錯誤類型概述

譯后編輯領域里,機器翻譯的錯誤類型分類主要服務于區分譯后編輯的工作量。分類方法大致可概括為宏觀的編輯過程分類和微觀的語言學概念分類。宏觀層面,Lacruz I、 Denkowski M和Lavie A將機器翻譯錯誤分為機械類(Mechanical)錯誤和遷移類(Transfer)錯誤,不需要參考原文進行改正的錯誤為機械類錯誤,而需要對照原文進行修改的錯誤則被定義為遷移類錯誤[9]。

微觀語言學概念的分類中,國內學者崔啟亮和李聞基于科技文本中的機器翻譯錯誤,列出了十一類機器翻譯的錯誤類型,從詞語和句子層面、形式和格式、漏譯誤譯等角度進行了錯誤列舉[10]。Temnikova則根據常見翻譯活動的認知努力對主要的錯誤類型進行了排名,其中詞語的形式(曲折變化)錯誤和使用了錯誤風格的近義詞被劃分為修正較為容易的類別,而詞層面的詞序錯誤和短語層面的詞序錯誤則被認定為修正難度最大的類別[11]。

國內已有的機翻錯誤類型研究大多從科技文本著手,涉及法律、醫藥、機械等專業領域,然而某些機器翻譯錯誤在不同的文本類型、不同的翻譯方向、不同的翻譯目的下可能并不構成錯誤或歸屬于其他類別,因此機器翻譯錯誤的分類標準也受到了特定語言對和文本類型等因素的限定。

四、翻譯多維質量標準(MQM)

MQM是一種基于錯誤類型及其嚴重性進行翻譯質量評估的框架。該框架定義了7種主要錯誤類型。評估者可以根據自己的需要定制框架,對某類錯誤的嚴重性進行評級,默認嚴重性級別為無(減0分)、次要(減1分)、主要(減5分)和關鍵(減25分)。翻譯的質量可以通過其獲得的罰分來判斷。嚴重性定義為無的錯誤一般不需要進一步關注,而嚴重性高則意味著該錯誤將導致譯文不過關。

《邊城》機翻譯文的錯誤類別及其嚴重性程度將在下文中舉例討論。

五、《邊城》中的主要機翻錯誤

《邊城》第一章介紹了故事發生的地理環境和主要人物翠翠和祖父,句型多為連動無主語句,語言風格簡潔但內涵豐富,涉及部分文化負載詞,在內容和風格上都具有文學性。因此本文將第一章作為研究文本,利用MQM對原始產出譯文中的錯誤進行分類,并以可讀性作為錯誤嚴重性的劃分標準,對各類錯誤罰分并計算出最后的單字平均罰分。針對原始譯文中出現的錯誤,筆者將提出相應的譯前編輯策略,并通過應用譯前編輯策略,對比機翻譯文的錯誤罰分,檢驗譯前編輯策略的效率。

根據MQM標準,《邊城》第一章中的單字罰分為0.1574。機翻錯誤主要出現在術語(terminology)、準確性(accuracy)、語言慣例(linguistic convention)、風格(style)、本地化(locale convention)、讀者接受度(audience appropriateness)、格式標點(design and markup)。其中準確性錯誤較為突出,大多因為原文中無主語句和文化特定表達導致。

例如“代替了天,使他在日頭升起時,感到生活的力量”一句中省略的主語本是指翠翠,然而機翻譯文中卻譯成“It replaced the sky, allowing him to feel the power of life when the sun rose”中的“it”。又如“管船人卻情不過”被NMT翻譯為“The ship keeper couldn't help it”。其次風格層面的錯誤多為譯文中突兀的正式用語和贅余翻譯。

例如“卻依然清澈透明”的譯文“but it is still so clear and transparent”中“transparent”的使用,以及“依然塞到那人手心里去”譯文“stuffed it into the palm of the man's hand”中對“手心”的多譯。術語層面錯誤多集中于文化負載詞和專有名詞前后使用不一致兩類。

例如機翻譯文中用“yellow dog”和“Huang Gou”來稱呼文中的黃狗,以及將“七百錢”翻譯成“seven hundred dollars”。讀者接受角度錯誤則主要由文化差異導致。例如“翠翠在風日里長養著,把皮膚變得黑黑的”中“變得黑黑的”被譯為“turning the skin black”。“Black”形容皮膚帶有歧視色彩,容易造成目的語讀者的誤會,被曬黑的原意與“tanned”更貼切。

針對《邊城》中第一章中的主要機翻錯誤,筆者認為譯前編輯可從詞匯、句子、文化角度入手。首先詞匯方面,補充隱含的主語,修改不恰當的主謂和動賓搭配;句子層面,簡化句子結構,刪減語義重復的結構,合理斷句減少逗號使用;文化角度,簡化或解釋中文特有文化內涵的表達。經譯前編輯后的機翻譯文的單字罰分為0.129。

六、譯前編輯策略效率分析

通過對比譯前編輯前后的機翻譯文可以發現,譯前編輯后產出的譯文在錯誤數量上和總罰分上都有了顯著減少,尤其有效地規避了機器翻譯在本地化(locale convention)、讀者接受度(audience appropriateness)和格式標點(design and markup)上可能產生的錯誤。

(1)原文:翠翠在風日里長養著,把皮膚變得黑黑的

NMT譯文:The greenery has grown up in the wind and sun, turning the skin black

譯前編輯后的原文:翠翠在大自然里長大,她的皮膚曬得黑黑的

NMT譯文:Cuicui grew up in nature, and her skin is tanned

例(1)中譯前編輯通過詞匯層面的補充主語和更換謂語動詞,使得原文語義更加清晰。因此NMT產出的譯文使用了更符合英語母語者閱讀習慣和接受度的“tanned”,規避了初次翻譯中“black”的歧視色彩。

此外,術語、準確度和風格層面的錯誤也有了大幅減少,但仍存在部分譯前編輯難以規避的機器翻譯錯誤,或是譯前編輯僅僅帶來了錯誤類型的轉移而非消失的情況。

(2)原文:或翠翠與黃狗皆張著耳朵,聽祖父說些城中多年以前的戰爭故事。

NMT譯文:Or Cuicui and Huang Gou both opened their ears, listening to their grandfather telling stories about wars in the city many years ago.

譯前編輯后的原文:有時翠翠和黃狗都張著耳朵,聽祖父說些城中多年以前的戰爭故事。

NMT譯文:Sometimes Cuicui and Huang Gou open their ears and listen to their grandfather telling stories about wars in the city many years ago.

(3)原文:溪流如弓背,山路如弓弦,故遠近有了小小差異。

NMT譯文:The stream is like the back of a bow, and the mountain road is like the string of a bow, so there is a slight difference between the distance and the distance.

譯前編輯后的原文:溪流像弓背一樣的曲線,而山路像弓弦一樣的直線,所以走不同的路會有距離的差異。

NMT譯文:The stream is curved like the back of a bow, while the mountain road is straight like a bowstring, so the distance will vary depending on the path.

例(2)中“黃狗”一詞在進行過譯前編輯之后仍然被NMT誤譯為“Huang Gou”,與前文所譯的“yellow dog”不一致。例(3)中譯前編輯后的NMT譯文更加忠實于原文語義,但在風格上的平鋪直敘丟失了中文的意境。雖然擺脫了準確度的錯誤,卻在風格上被歸為次要錯誤。

七、結語

本文借用MQM對《邊城》第一章中的場景和人物描寫的機器翻譯質量進行評估,通過對比譯前編輯前后的兩個版本譯文,筆者發現譯前編輯整體上顯著減少NMT的翻譯錯誤,與前文中徐紅和Bounaas的研究結果基本一致。此外本研究發現譯前編輯策略對于規避本地化,讀者接受度和格式標點層面的機翻錯誤尤為有效。而在術語、準確度和風格層面上,部分機翻錯誤也無法通過譯前編輯策略進行規避,或是嚴重程度有所減弱,或是錯誤類型有所改變。因此,NMT翻譯質量的提升雖極大提高了語言服務的效率,卻仍然無法完全取代人類譯員。NMT譯文仍然需要譯前編輯和譯后編輯的把關。

本文僅從詞匯、句子和文化因素三方面對于譯前編輯策略進行初步嘗試,未來研究可納入規模更大的樣本語料,邀請多位評分者評估機翻譯文質量,結合譯寫和變譯等策略對文學翻譯的譯前編輯進行更靈活的探索。

參考文獻:

[1]王華樹,李智.人工智能時代筆譯員翻譯技術應用調查——現狀、發現與建議[J].外語電化教學,2019(06):67-72.

[2]馮全功,崔啟亮.譯后編輯研究:焦點透析與發展趨勢[J].上海翻譯,2016(06):67-74+89+94.

[3]Mercader-Alarcón J,F Sánchez-Matínez.Analysis of translation errors and evaluation of pre-editing rules for the translation of English news texts into Spanish with Lucy LT[J].Tradumàtica:Tecnologies de La Traducció,2016(14).

[4]Miyata R, A Fujita. Understanding pre-editing for black-box neural machine translation[EB/OL].https://arxiv.org / pdf /2102.02955.pdf,2021.

[5]?ner Bulut S,N Alimen.Translator education as a collaborative quest for insights into the re-positioning of the human translator (educator) in the age of machine translation:The results of a learning experiment [J].The Interpreter and Translator Trainer, 2023(03).

[6]Bounaas C,et al.Effects of pre-editing operations on audiovisual translation using TRADOS:An experimental analysis of Saudi students’translations[J].Texto Livre,2023(16).

[7]王湘玲,賈艷芳.21世紀國外機器翻譯譯后編輯實證研究[J].湖南大學學報(社會科學版),2018,32(02):82-87.

[8]徐紅,黃協安.譯前編輯和機器翻譯研究綜述(1990-2023)[J].外語電化教學,2023(06):43-49+112.

[9]孟福永,唐旭日.效率為先:機器翻譯譯后編輯技術綜述[J].計算機工程與應用,2020,56(22):25-32.

[10]崔啟亮,李聞.譯后編輯錯誤類型研究——基于科技文本英漢機器翻譯[J].中國科技翻譯,2015,28(04):19-22.

[11]Temnikova I P.Cognitive evaluation approach for a controlled language post-editing experiment[C]//7th International Conference on Language Resources and Evaluation,2010.

作者簡介:

王行舟(1996-),女,漢族,湖南岳陽人,碩士研究生,助教,研究方向:商務英語教學與翻譯研究。

主站蜘蛛池模板: 亚洲一区精品视频在线| 热re99久久精品国99热| 欧美a在线| 国产亚洲欧美另类一区二区| 无码区日韩专区免费系列| 亚洲日本中文字幕天堂网| 无码视频国产精品一区二区| 色悠久久久久久久综合网伊人| 色综合成人| 国模私拍一区二区| 91精品国产情侣高潮露脸| 九九九精品视频| 高清无码一本到东京热| 国产靠逼视频| 三上悠亚在线精品二区| 伊人丁香五月天久久综合 | 亚洲国产精品日韩av专区| 欧洲熟妇精品视频| 亚洲无码视频喷水| 国产亚洲精久久久久久无码AV| 国产精品视频猛进猛出| 亚洲V日韩V无码一区二区 | 在线中文字幕日韩| 综合天天色| 99成人在线观看| 亚洲开心婷婷中文字幕| 一级黄色网站在线免费看| 色综合五月| 国产成人1024精品| 日日拍夜夜操| 天天综合天天综合| 欧美日韩另类在线| 2020国产精品视频| 精品成人一区二区三区电影| 在线看国产精品| 99国产精品国产高清一区二区| 福利片91| 香蕉99国内自产自拍视频| 一本大道香蕉高清久久| 国产美女免费网站| 中文字幕首页系列人妻| 午夜成人在线视频| 97免费在线观看视频| 亚洲天堂久久新| 亚洲Aⅴ无码专区在线观看q| 国产一级特黄aa级特黄裸毛片| 欧美一级在线| 国产成人亚洲毛片| Jizz国产色系免费| 亚洲天堂视频在线免费观看| 亚洲国产av无码综合原创国产| 国产丝袜精品| 国产黄在线免费观看| 国产95在线 | 啦啦啦网站在线观看a毛片| 免费观看国产小粉嫩喷水 | 亚洲天堂网在线观看视频| 久久公开视频| 无码精油按摩潮喷在线播放| 国产毛片一区| 国产va欧美va在线观看| 无码精品国产dvd在线观看9久| 亚洲成综合人影院在院播放| 另类专区亚洲| 日韩精品亚洲一区中文字幕| 波多野结衣在线se| 很黄的网站在线观看| 亚洲午夜久久久精品电影院| 一本大道东京热无码av| 99这里只有精品6| 伊人激情综合网| 亚洲第一香蕉视频| 免费无码网站| 午夜毛片福利| 成年人视频一区二区| 香蕉伊思人视频| 日韩精品专区免费无码aⅴ| 国产成人高清精品免费软件| 色婷婷在线播放| 国产一二视频| 91在线播放国产| 久久人妻系列无码一区|