宋欣陽
(太原工業(yè)學(xué)院 外語系,山西 太原 030008)
譯后編輯在計算機輔助翻譯中應(yīng)用的研究
宋欣陽
(太原工業(yè)學(xué)院 外語系,山西 太原 030008)
隨著技術(shù)進步,計算機輔助翻譯的功能愈加強大,此類軟件已能部分代替人工完成翻譯。但多數(shù)情況下,CAT軟件生成的譯文仍需進一步編輯修改,此過程即所謂譯后編輯。CAT加PE的翻譯模式也已成為提升翻譯效率的重要手段,該研究從概念、效率的提升、應(yīng)用領(lǐng)域等方面探討譯后編輯的發(fā)展狀況,并分析了其發(fā)展前景。
譯后編輯;計算機輔助翻譯;機器翻譯
隨著軟件技術(shù)的發(fā)展,計算機輔助翻譯(Computer Aided Translation,簡稱CAT)在翻譯實踐中應(yīng)用愈加廣泛,此類軟件整合了機器翻譯(Machine Translation,簡稱 MT)和翻譯記憶庫(Translation Memory,簡稱TM)兩大功能,能夠在譯者翻譯時同步提示每一句段的翻譯,并允許譯者針對自動生成的譯文進行編輯。CAT技術(shù)的興起催生了該領(lǐng)域的研究,譯后編輯(Post-Editing,簡稱PE)這一的概念也逐漸引起人們的關(guān)注。國際標準化組織技術(shù)委員會(ISO Technical Committee)發(fā)布的報告將機器翻譯定義為“使用計算機程序?qū)⒁环N自然語言自動翻譯成另一種語言”(Machine Translation:automated translation of text from one naturallanguage to another using a computer application)。譯后編輯是“編輯修正機器翻譯輸出”(post-edit:editand correctmachine translation output)(ISO,2014)[1]。DePalma(2013)將譯后編輯定義為“通過人工評審,編輯,提高譯文質(zhì)量和適用性的過程”[2]。以上定義將譯后編輯局限于機器翻譯產(chǎn)生的譯文,但隨著技術(shù)發(fā)展,機器翻譯只是CAT軟件自動生成譯文的來源之一,另一個來源則是翻譯記憶庫。針對翻譯記憶庫生成譯文進行編輯的行為,亦為譯后編輯的一種。崔啟亮(2014)將“廣義的譯后編輯”定義為“在集成翻譯環(huán)境中,為了保持譯文質(zhì)量和翻譯效率,由專業(yè)編輯人員根據(jù)特定的質(zhì)量目標,對輸出的初始譯文進行人工評審或部分自動化修訂的過程”[3]。
計算機輔助翻譯技術(shù),包括機器翻譯和譯后編輯,已在全球翻譯行業(yè)內(nèi)得到廣泛應(yīng)用。國內(nèi)外的學(xué)者也對該領(lǐng)域的研究也從未中斷。20世紀80年代中期,Senez D.,Wagner E.等人發(fā)表了數(shù)篇關(guān)于譯后編輯的研究,至今已有超過三十年的歷史。2007年起,國內(nèi)的一些學(xué)者,如崔啟亮、張慧玉等,也開始逐步關(guān)注該領(lǐng)域的研究。期間國內(nèi)外學(xué)者相關(guān)領(lǐng)域論文數(shù)百篇。隨著研究的深入,目前學(xué)界正努力建立譯后編輯的詳細進程模型,力圖發(fā)現(xiàn)對翻譯效能影響最大的文本、任務(wù)和譯者特點。借助工具記錄譯后編輯人員在真實工作場景下的按鍵次數(shù)、眼球運動等數(shù)據(jù),并根據(jù)這些可靠的數(shù)據(jù)找到針對不同文本和譯者類型的最優(yōu)翻譯流程[4]。
相比于傳統(tǒng)翻譯模式,計算機輔助翻譯(CAT)有著多方面的優(yōu)勢。第一,有助于提高翻譯效率,降低翻譯成本。翻譯是艱難而緩慢的過程,熟練譯員的翻譯費用也較為昂貴。CAT軟件可自動提示譯者,并且自動處理原文中重復(fù)部分,避免譯者重復(fù)勞動,減輕翻譯過程中的壓力。通過這一人機交互的過程,提高翻譯效率,降低翻譯成本。第二,有助于形成規(guī)范統(tǒng)一的譯文。在翻譯記憶庫和術(shù)語庫幫助下,譯文中的術(shù)語,如人名、地名等,都能得到良好地統(tǒng)一,譯者只需把關(guān)語言質(zhì)量。
目前計算機輔助翻譯軟件主要通過兩種途徑給與譯者幫助,一是軟件翻譯引擎自動生成譯文,既機器翻譯(MT);二是查找翻譯記憶庫(TM)進行模糊匹配。由于英漢兩種語言差異較大,機器翻譯生成的漢語譯文質(zhì)量往往不太理想。此時就需要譯者進行人工編輯,既譯后編輯(PT),將機器翻譯生成的譯文調(diào)整成為符合譯入語習(xí)慣的語句。第二種方式翻譯記憶庫(TM)模糊匹配精準度較高,因為其工作原理就是將之前翻譯過的語言對存入翻譯記憶庫,后期一旦再次出現(xiàn)既自動調(diào)用記憶庫中的譯文。但這種翻譯方式也會出現(xiàn)一些誤差,因為軟件還無法判斷語境,“pilot”一詞上文中可能指“飛行員”,而下文中則可能指“試運行”。這些計算機輔助翻譯技術(shù)的局限性都需要譯者在譯后編輯的過程中予以糾正。目前來看,“MT+PT”的翻譯模式短期內(nèi)不會改變,譯后編輯始終將是計算機輔助翻譯必不可少的關(guān)鍵環(huán)節(jié)。
計算機輔助翻譯技術(shù)需要人工參與編輯,不同于傳統(tǒng)翻譯模式,這種人機交互的主要優(yōu)勢在于其對翻譯效能的提升。相關(guān)研究表明,采用機器翻譯結(jié)合譯后編輯對翻譯效率的提升較為明顯,但具體提升幅度依情況而變,一些學(xué)者指出機器翻譯加譯后編輯能節(jié)省40%翻譯時間[5],而一些研究表明現(xiàn)實工作環(huán)境下,能縮短15%-20%的翻譯時間[6]。造成差異的原因主要是譯員熟練度有別、翻譯樣本差異和語言對不同。
Plitt M和Masselot F在其研究《統(tǒng)計計算機翻譯效率測試-典型本地化背景下的譯后編輯》中指出,使用機器翻譯結(jié)合譯后編輯,所有譯者的工作效率都有所提升,但提升幅度差異較大,效率增加幅度從增加20%到131%[7]。譯者效率平均提升74%,也就是說機器翻譯結(jié)合譯后編輯節(jié)省了43%的翻譯時間。
Moran J等人研究了現(xiàn)實工作環(huán)境中使用CAT工具對翻譯效率的影響。在其論文《譯后編輯數(shù)據(jù)分析:對改造后CAT工具效率的現(xiàn)場測驗》中,研究人員使用了計算機輔助翻譯軟件iOmega,并對此軟件加以改造,使其能夠記錄譯者的行為,如時間、按鍵統(tǒng)計、自我檢查等。該研究指出,在為期兩個工作日的現(xiàn)場實驗中,單時段(single session)的譯后編輯效率比完全人工翻譯高80%[8]。
隨著國際交流日益頻繁,各個行業(yè)對翻譯的需求也在逐步增加。根據(jù)《中國語言服務(wù)行業(yè)發(fā)展報告2012》提供的數(shù)據(jù),截止2011年12月31日,全國(不含港、澳、臺)共有語言服務(wù)企業(yè)37197家,從業(yè)人員約119萬人,2011年創(chuàng)造產(chǎn)值約1576億元[9]。不僅需要翻譯的文本數(shù)量增長迅猛,而且還需要譯者快速、低成本完成翻譯。依靠熟練譯者人工翻譯數(shù)量龐大的文本時間和金錢方面的成本都較高,而完全依靠機器翻譯則難以保證質(zhì)量。在時間和成本都有限的情況下,運用CAT軟件的機器翻譯功能配合譯后編輯的翻譯模式能夠滿足質(zhì)量和效率方面的要求。翻譯自動化用戶協(xié)會(TAUS)分析指出,機器翻譯主要用于以下4種場景:1、交付時間緊張的文本。2、譯文質(zhì)量要求不高的內(nèi)容。3、為人工譯后編輯生成初稿。4、審校人員檢測譯文問題的手段[10]。針對不同類型的文本和需求,需要根據(jù)以下幾個因素選擇具體的翻譯模式,這些因素包括翻譯題材、質(zhì)量要求、交付時間、預(yù)算費用和譯員對翻譯技術(shù)的掌握程度等。譯后編輯兼顧了效率和質(zhì)量,適用于對這兩方面有一定要求的題材。某些文本,如產(chǎn)品技術(shù)參考材料、網(wǎng)頁瀏覽、情報檢索等,由于文本中多為術(shù)語或客戶無需高質(zhì)量譯文,且客戶無法付出太多時間和經(jīng)濟成本,比較適用機器翻譯(MT)。而如小說、散文等文學(xué)類文本,由于對譯文質(zhì)量期望較高,則更適合人工翻譯(HT)。大多數(shù)情況下,法律、工程、合同等文本適用翻譯記憶、機器翻譯配合譯后編輯(TM+PE)的模式。由于客戶對翻譯譯文的質(zhì)量、成本與效率的要求不同,譯后編輯主要應(yīng)用于重視譯文效率、質(zhì)量和成本的領(lǐng)域。當前翻譯市場占主導(dǎo)的文本類型是工程、科技、法律類文本。根據(jù)翻譯服務(wù)提供商Translated的數(shù)據(jù),2015年,在其收集的3千萬字的翻譯資料中,工程、科技、法律類文本占比最大,超過總量的50%,而這三類文本格式較為固定,且均為信息型文本,比較適合采用機器翻譯配合譯后編輯的翻譯模式。機器翻譯配合譯后編輯的翻譯模式具有廣闊的市場應(yīng)用潛力。
根據(jù)Translated提供的數(shù)據(jù),2015年使用CAT軟件的譯者占比已近6成,而使用CAT軟件翻譯的字數(shù)占總翻譯字數(shù)比例則高達80%[12]。可見此類軟件具有其不可比擬的優(yōu)勢。隨著CAT軟件用戶數(shù)量的增長和云儲存、大數(shù)據(jù)技術(shù)的發(fā)展,越來越多的語言對將被存入翻譯記憶庫中,并由專業(yè)團隊負責維護,篩選記憶庫中的高質(zhì)量譯文。今后,每位譯者都可在翻譯時接入記憶庫,獲得精準的提示譯文,并發(fā)揮自己的專長,為記憶庫提供更加準確的譯文。隨著該領(lǐng)域研究的深入,譯后編輯的流程將更加優(yōu)化,其效率和質(zhì)量也將進一步提升。
隨著CAT軟件逐步普及,每個行業(yè)和領(lǐng)域都能建立屬于自己的術(shù)語庫和記憶庫,并逐步積累完善。CAT軟件自動生成的譯文將會越來越準確,給予譯者的幫助也會越來越大,但無論計算機輔助翻譯技術(shù)發(fā)展到何種地步,譯者始終都是譯文質(zhì)量的把關(guān)者,譯后編輯也必定是不可或缺的翻譯環(huán)節(jié)。CAT軟件搭建了一個平臺,整合了機器翻譯、人工譯后編輯和翻譯項目管理,使機器翻譯效率優(yōu)勢和人工翻譯質(zhì)量優(yōu)勢得以充分發(fā)揮。為了進一步開發(fā)CAT軟件的潛力,需加強應(yīng)用研究,優(yōu)化翻譯流程、合理選擇適用機器翻譯的文本類型、提升譯后編輯效率。
[1]ISO TC 37.ISO 18587 Translation services-Postediting of machine translation output Requirements[Z].2014.
[2]DePalma,Donald A.Post-Edited Machine TranslationDefine [EB/OL].(2013-04-30)[2016-09-21].http://www.commonsenseadvisory.
com/AbstractView.aspx?ArticleID=5499.
[3]崔啟亮.論機器翻譯的譯后編輯[J].中國翻譯,2014,(6):69.
[4]O'Brien S etal. Post-editing of Machine Translation,Processes and Applications[G],Newcastle:Cambridge Scholars Publishing,2014:9-11.
[5][7]Plitt M,Masselot F.A Productivity Test of Statistical Machine Translation Post-Editing in a Typical Localisation Context[J].The Prague Bulletin of Mathematical Linguistics,2010(1):16.
[8]MorgenJ.AnalysisofPost-editingData:A Productivity Field Test using an Instrumented CAT Tool[C].O'Brien S etal.Post-editing of Machine Translation,Processes and Applications,Newcastle:Cambridge Scholars Publishing,2014.
[9]中國翻譯協(xié)會等.中國語言服務(wù)業(yè)發(fā)展報告[R]. 2012.
[10]TAUS.Post-editing In Practice[EB/OL].(2010)[2016-09-21].http://www.translationautomation. com/reports/postediting-inpractice.
[11]Translated.net.Industry Report[EB/OL].(2015)[2016-09-21].http://www.translated.net/top/ sm_charts.php?

Song Xin-yang
(Foreign Languages Department of Taiyuan Institute of Technology,Taiyuan Shanxi 030008)
(責任編輯 郭 佳)
H315.9
A
1673-2014(2016)06-0069-03
2016—10—17
宋欣陽(1989— ),男,山西長治人,碩士研究生,助教,主要從事翻譯理論與實踐研究。