胡倩



摘 要|本研究將探索翻譯質量評估的科學方法,并借此研究譯前編輯對翻譯質量的影響,力圖填補譯后編輯領域的研究不足。通過客觀的評分系統,本研究結果表明,合理的譯前編輯和預處理能夠顯著提升文本對機器的適應度,進而提高機器翻譯的精準性和質量。
關鍵詞|譯前編輯;翻譯質量;翻譯質量評估體系
Copyright ? 2023 by author (s) and SciScan Publishing Limited
This article is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
https://creativecommons.org/licenses/by-nc/4.0/
一、引言
隨著科技的快速更新,機器翻譯(Machine Translation,MT)在翻譯行業中發展迅猛。從最早的基于規則庫的語法和詞匯知識系統,到統計機器翻譯(Statistical Machine Translation,SMT),再到谷歌2016年推出的神經機器翻譯系統(Neural Machine Translation,NMT)以及2023年初出現的ChatGPT,都標志著機器翻譯的不斷改進和發展。如今,機器翻譯已經成為主流,并且常常與譯后編輯相結合。但是,對于某些特殊領域的文本和復雜句子,機器翻譯仍然效果不佳,需要大量的譯后編輯工作,從而降低了整體翻譯效率。相反,譯前編輯在機器翻譯之前對需要翻譯的文本或文檔進行有針對性的修改編輯以提高機器翻譯產出的質量(馮全功,2017:63-68)。然而,由于人們翻譯實踐中的思維習慣或者時間壓力,譯前編輯常存在于譯后編輯的陰影下,其角色常被忽略,其作用常被低估。
本文以湖南省人民政府門戶網站發布的《湖南省優化營商環境規定》為材料,以百度翻譯和DeepL為機器翻譯工具,進行漢譯英機器翻譯實踐,主要探析譯前編輯對機器翻譯質量的影響。本文先回顧了譯前譯后編輯和翻譯質量評估的研究現狀,再對機器翻譯的試句結果進行質量評估,以檢驗譯前編輯對翻譯質量的影響,最后介紹本研究的結果和意義。
二、譯后編輯和譯前編輯的研究現狀
從國內外對譯后編輯和譯前編輯的研究來看,主要關注點在兩個方面,一是對翻譯效率的影響,二是對翻譯質量的影響。首先,關于對翻譯效率的影響,根據OBrien(2007)的研究,譯后編輯時包含消極翻譯指征的句子會導致整體編輯速度變慢,例如較長的名詞短語和動名詞會對編輯負荷有較大的影響。Garcia(2011)進行了英漢雙向翻譯后編輯的研究,發現在逆向翻譯(漢譯英)時,譯后編輯可以顯著提高速度。此次,關于譯前譯后編輯對翻譯質量的影響,Barreiro(2011)介紹了SPIDER系統,這是一種用于文檔編輯和修訂中的改寫系統,適用于機器翻譯譯前編輯。通過收集實際的譯前編輯實例,以提高機器翻譯系統的翻譯質量。Rei Miyata(2017)進行了針對日語到英語的翻譯實驗,共收集了400個源句子的12687個譯前編輯實例,結果表明,超過85%的源句子被MT系統準確翻譯。
而國內主要研究譯前和譯后編輯的方法和策略。袁亦寧(2003)提出將“受控語言”(controlled language)引入譯前編輯,此舉意在限制句子的表達,使其能被機器翻譯系統理解。胡清平(2005)則更進一步討論了受控翻譯及其前景和設想,認為受控語言是解決自然語言使用中的隨意。魏長宏(2008)提出格式轉換、使用受控語言、建立翻譯記憶庫等手段。黃越悅(2017)、曹媛(2018)和陳麗(2020)則重點分析了機器翻譯中譯前編輯的幾種方法,包括句法機構調整、增補、省略、提前翻譯術語、補充標點符號等。
總而言之,隨著機器翻譯和翻譯實踐的發展,譯前和譯后編輯的研究和應用也應該不斷前進和調整。首先,從知網上的論文數量來看,以“譯后編輯”為主題的中英總庫文章超過800篇,而以“譯前編輯”為主題的文章只有不到70篇,顯示出譯前編輯的研究明顯少于譯后編輯。但事實上,譯前編輯在確保翻譯質量方面起著至關重要的作用,它可以幫助機器更好地理解原文。其次,如何確定編輯后的譯文質量得到提升?這的確缺乏客觀標準,主要是因為翻譯本身就是一項藝術,難以將其完全量化。然而,我們可以通過與原始文本的準確度、流暢度、一致性等因素進行比較來評估翻譯的質量。
三、翻譯質量評估
本文采用翻譯多維質量標準Multidimensional Quality Metrics(MQM)對譯前編輯前后的譯文進行評估,來比較譯文質量的變化。MQM翻譯質量評估系統可以對人工翻譯和機器翻譯進行翻譯質量評測,它提供了一種標準化的方法來評估翻譯質量,它由本地化行業標準協會(LISA)開發,現在由全球化和本地化協會(GALA)維護,并以兩個國際標準為體系基礎:(1)ISO DIS 5060:2022,翻譯服務—翻譯產出的評估—通用指南;(2)ASTM WK46396:分析性翻譯質量評估的標準做法。
MQM系統基于一組指標,涵蓋翻譯質量的各個方面,這些指標包括若干個維度,比如準確性、流暢度、術語、風格、一致性和文化適應性。每個指標都被分配0至4的分數,其中0代表完全不符合該指標,也就是說沒有出現該錯誤;4代表最符合的程度,表示該錯誤很明顯。評估者可以使用這些分數計算翻譯的整體MQM得分,該得分可用于比較不同翻譯的質量或跟蹤隨時間的改進(總分100分)。需要注意的是,由于錯誤類型眾多、文本類型多樣,評估者應該只選擇他們需要的那些錯誤類型,并根據特定內容類型的質量要求和利益相關者的要求來評分。
本文將根據MQM翻譯質量評估體系對所有被試句子進行評分,包括沒有進行譯前編輯的一組和進行了譯前編輯的一組,以比較譯前編輯前后的評估分數,探究譯前編輯對翻譯質量的影響。
四、譯前編輯方法探究
譯前編輯即通過對文本的改寫和調整,使其更容易被機器翻譯系統所理解,最終幫助我們提高翻譯實踐的質量與效率。上述提到的譯前編輯方法可以分為多種,但總體來說可以分為大三類:切分組合、轉換擴充和適當刪減。
(一)切分和組合
第一種是需要切分的情況,因為中文中很多長句不見句號,還有很多并沒有體現邏輯和結構,所以在漢譯英時,譯前編輯可以嘗試多進行適當的斷句。而另一種需要組合的情況,漢語重意合,句子以動詞為中心,有很多流水句,一般不需要介詞、連接詞和分句,所以譯前編輯可以選擇組合詞句的方法。
句子1:依法必須進行招標的項目以特定行政區域、特定行業的業績、獎項作為投標、加分和中標條件。
百度翻譯:Projects that must be tendered in accordance with the law are subject to bidding, bonus points, and winning conditions based on the performance and awards of specific administrative regions and industries. (MQM質量評估:64.5分)
DeepL:Projects that must be tendered in accordance with the law to specific administrative regions, specific industry performance, awards as bids, bonus points and winning conditions. (MQM質量評估:56分)
第一,從術語維度來看,“投標、加分和中標”的翻譯需要更貼合語境,錯誤較為明顯;第二,準確性不高,原文重點是“項目以若干指標作為投標條件”,但是機器翻譯譯文把重點放在了“項目進行投標”;第三,語法方面基本符合英文語法規則;第四,譯文風格與原文相差不大,基本符合要求;第五,表達方式不夠自然,需要進一步改進。
以句子1的百度翻譯結果為例,基于以上分析,各維度罰分和最后總分如表1所示。
原句第一個頓號之前的“招標的項目”是后面一連串介詞短語“以特定行政區域、特定行業的業績、獎項作為投標、加分和中標條件”的修飾對象。由于后面介詞短語部分過長和復雜,可以選擇把這兩部分分開的方法,使機器更明晰句子結構,以免誤解整句的修飾對象。
譯前編輯后:依法必須進行招標的項目,以特定行政區域、特定行業的業績和獎項作為投標、加分和中標條件。
百度翻譯:Projects that must be tendered in
accordance with the law shall have performance and awards from specific administrative regions and industries as the conditions for bidding, bonus points, and winning the bid. (MQM質量評估:81.25分)
DeepL:Projects that must be tendered in accordance with the law, take the specific administrative regions, specific industry performance and awards as bids, extra points and winning conditions. (MQM質量評估:74.1分)
句子2:企業取得建設用地后,已經實行區域評估,且符合適用條件的審批事項可以實行告知承諾制辦理。
百度翻譯:After obtaining construction land, the enterprise has implemented regional assessment, and the approval items that meet the applicable conditions can be handled through a notification commitment system. (MQM質量評估:77.8分)
DeepL:Enterprises obtain land for construction, has been the implementation of regional assessment, and meet the applicable conditions of approval matters can be implemented to inform the commitment system for. (MQM質量評估:58.6分)
原句是典型的中文流水句,邏輯體現不強,所以可以通過加連接詞體現其層次,幫助機器理解。添加“則”體現行為的結果,并用“且”緊密連接前后兩個平行條件,防止翻譯機器系統分開理解。
譯前編輯后:企業取得建設用地后,則可以對已經實行區域評估且符合適用條件的審批事項,實行告知承諾制辦理。
百度翻譯:After obtaining construction land, enterprises can implement a notification and commitment system for approval items that have already undergone regional assessment and meet applicable conditions. (MQM質量評估:92分)
DeepL:After enterprises obtain land for construction, then they can implement the notification and commitment system for the approval matters that have been implemented for regional assessment and meet the applicable conditions. (MQM質量評估:80.6分)
句子3:行政機關以及法律法規授權的具有管理公共事務職能的組織辦理依申請的行政事項要求提供證明材料時,應當按照便民利民原則,推行證明事項告知承諾制。
百度翻譯:Administrative agencies and organizations authorized by laws and regulations to manage public affairs shall, when providing proof materials in accordance with the requirements of the applied administrative matters, implement a system of notification and commitment of proof matters in accordance with the principle of convenience and benefit to the people. (MQM質量評估:76分)
DeepL:Administrative organs and laws and regulations authorized by the management of public affairs functions of the organization for the application of administrative matters required to provide supporting documents, should be in accordance with the principle of convenience and benefit to the people, the implementation of the commitment to inform the certification system. (MQM質量評估:77分)
句子太長時,機器不好做出判斷,在句子3中有多個動詞,如“授權”“辦理”“提供”“告知”“承諾”等,可以預判機器容易弄錯其中的邏輯關系或主動和被動關系,所以譯前編輯可以做切分處理。
譯前編輯后:行政機關以及法律法規授權的具有管理公共事務職能的組織,辦理依申請的行政事項要求提供證明材料時,應當按照便民利民原則,推行證明事項告知承諾制。
百度翻譯:Administrative agencies and organizations authorized by laws and regulations with the function of managing public affairs, when handling administrative matters according to the application and requesting proof materials, should follow the principle of convenience and benefit to the people and implement a system of notification and commitment for proof matters. (MQM質量評估:92分)
DeepL:Administrative organs and laws and regulations authorized by the organization with the management of public affairs functions, for administrative matters on application required to provide supporting documents, should be in accordance with the principle of convenience, the implementation of the commitment to inform the certificate system. (MQM質量評估:76.1分)
句子4:鼓勵中央垂直管理部門將其實施的政務服務事項進入所在地綜合性政務服務大廳集中辦理。
百度翻譯:Encourage central vertical management departments to centrally handle their government service matters in the comprehensive government service hall where they are located. (MQM質量評估:63.6分)
DeepL:Encourage the central vertical management departments to implement its government services into the location of comprehensive government services hall centralized processing. (MQM質量評估:61.9分)
同樣地,句子4比較長且句子中動詞多,譯前編輯可以選擇在適當處斷句。
譯前編輯后:鼓勵中央垂直管理部門,將其實施的政務服務事項納入當地綜合性政務服務大廳集中辦理。
百度翻譯:Encourage central vertical management departments to include their implemented government service matters in the centralized processing of local comprehensive government service halls. (MQM質量評估:86.4分)
DeepL:Encourage the central vertical management of its implementation of government services matters into the local comprehensive government services hall centralized processing. (MQM質量評估:81分)
(二)轉換和擴充
語言的表達方式因文化、時代、地域等因素而異,因此直接將一種語言中的句子直譯成另一種語言中的句子可能會導致信息的丟失或誤解。在進行翻譯時,適當的擴充和轉換可以讓翻譯更符合目標語言的語言習慣和表達方式,同時使翻譯更加流暢易懂。此外,有時原文中含有語言的一些特有的表達方式,而這些方式在目標語言中并不存在,因此在翻譯時需要進行適當的轉換和替換,以便更好地傳遞原文的意思。
句子5:幫辦代辦
百度翻譯:Assistant agent (MQM質量評估:0分)
DeepL:Help Desk (MQM質量評估:0分)
譯前編輯后:幫助辦理和第三人代辦
百度翻譯:Assist in handling and third-party handling (MQM質量評估:66.7分)
DeepL:Help with processing and third-party representation (MQM質量評估:50分)
句子6:錯時延時服務
百度翻譯:Wrong time delay service (MQM質量評估:0分)
DeepL:Staggered time delay service (MQM質量評估:0分)
譯前編輯后:錯開時間和推遲時間的服務
百度翻譯:Staggered and delayed services (MQM質量評估:75分)
DeepL: Staggered and delayed services (MQM質量評估:75分)
句子7:違規增設或者變相增設報裝業務辦理環節、申請資料、前置條件。
百度翻譯:Violation of regulations or disguised addition of installation application procedures, application materials, and prerequisites. (MQM質量評估:78.6分)
DeepL:Illegal additional or disguised additional business processing links, application information, pre-conditions. (MQM質量評估:75分)
句子7的難點在于“變相增設”,而“變相增設”與前面的“違規增設”是并列的,內涵一種相反的關系,所以實際上可以理解為“直接與間接”的關系,可以作為譯前編輯的切入點。
譯后編輯后:違規增設或者間接增設報裝業務辦理環節、申請資料、前置條件。
百度翻譯:Violating regulations by adding or indirectly adding installation procedures, application materials, and prerequisites. (MQM質量評估:84.6分)
DeepL:Illegal additional or indirectly additional reporting business processing links, application information, pre-conditions. (MQM質量評估:75分)
句子8:有條件的地區對涉及不動產轉移登記的供水、供電、供氣、維修資金等過戶業務實現聯動辦理。
百度翻譯:Regions with conditions can achieve linkage processing for transfer businesses involving real estate transfer registration, such as water supply, power supply, gas supply, and maintenance funds. (MQM質量評估:88.5分)
DeepL:Conditional areas involving real estate transfer registration of water supply, power supply, gas supply, maintenance funds and other transfer business to achieve linkage. (MQM質量評估:69.6分)
“有條件”在中文里實際是指“達到條件的”,此處原句表述容易存在混淆,可以預判機器也許會理解錯誤。
譯前編輯后:符合條件的地區對涉及不動產轉移登記的供水、供電、供氣、維修資金等過戶業務實現聯動辦理。
百度翻譯:Regions that meet the conditions will
achieve linkage processing for transfer businesses involving real estate transfer registration, such as water supply, power supply, gas supply, and maintenance funds. (MQM質量評估:92分)
DeepL:Qualified areas involved in real estate transfer registration of water supply, power supply, gas supply, maintenance funds and other transfer business to achieve linkage. (MQM質量評估:87.5分)
(三)適當刪減
句子9:健全政務服務績效由企業和群眾評判的“好差評”制度。
百度翻譯:Improve the “good and bad” evaluation system for government service performance, which is evaluated by enterprises and the public. (MQM質量評估:78.9分)
DeepL:Sound performance of government services judged by enterprises and the public “good and bad” system. (MQM質量評估:73.3分)
句子中意思的重復會誤導機器。每種語言都有冗余現象,中文也存在一些語言的冗余,比如一些范疇詞和修飾詞(趙剛,2004:57-62)。因此在句子9中我們在譯前編輯時可以刪除“好差評”,這不僅不影響原文意思而且能夠幫助機器更好地理解文本。
譯前編輯后:健全政務服務績效由企業和群眾評判的制度。
百度翻譯:Improve the system of evaluating the performance of government services by enterprises and the public. (MQM質量評估:93.3分)
DeepL:Sound system of government service performance judged by enterprises and the public. (MQM質量評估:83.3分)
五、MQM翻譯質量評估分數
評估結果分為兩大組:未進行譯前編輯的譯文和進行了譯前編輯的譯文,并使用了兩個主流機器翻譯網站進行機器翻譯處理,從表2可以看出,經過譯前編輯后,句子質量得到顯著提升,人工譯前編輯對機器翻譯質量有積極作用。
六、結語
本研究首先探討了科學的翻譯質量評估方法,以MQM質量評估體系為基礎,提供更科學的評分指導,減少了主觀因素的影響。以此為基礎,我們研究了譯前編輯對翻譯質量的影響,試圖填補譯前編輯領域的研究不足。研究結果表明,譯前編輯普遍對譯文質量產生積極影響。未來的研究需要更多關注譯前編輯對于提升譯文質量的潛力,探索合理的譯前編輯和預處理方法,以提高文本對機器的適應度,以滿足不同領域和場景的翻譯需求。
參考文獻
[1]Barreiro A.SPIDER:A System for Paraphrasing in Document Editing and Revision—Applicability in Machine Translation Pre-editing[J].Lecture Notes in Computer Science,2011.
[2]Miyata R,Fujita A.Dissecting human pre-editing toward better use of off-the-shelf machine translation systems[C]//Proceedings of the 20th Annual Conference of the European Association for Machine Translation,2017.
[3]OBrien S.An empirical investigation of temporal and technical post-editing effort[J].Translation and Interpreting Studies,2007,2(1):83-136.
[4]Garcia.Translating by post-editing:is it the way forward[J].Machine Translation,2011,25(3):217-237.
[5]陳麗.機器翻譯中的譯前編輯翻譯技巧——以Google漢譯英《邊城》為例[J].海外英語,2020(8):10-11.
[6]曹媛,馬永良.谷歌翻譯漢譯英的譯前編輯——以北京中醫藥信息網新聞稿的英譯為例[J].海外英語,2018(15):153-155.
[7]馮全功,高琳.基于受控語言的譯前編輯對機器翻譯的影響[J].當代外語研究,2017(2):63-68,87,110.
[8]胡清平.機器翻譯中的受控語言[J].中國科技翻譯,2005(3):24-27.
[9]黃越悅.淺談機器翻譯中譯前編輯的應用[J].湖北函授大學學報,2017,30(3):175-176,179.
[10]魏長宏.機器翻譯的譯前處理[J].科協論壇(下半月),2008(9):93-94.
[11]袁亦寧.受控語言:機器翻譯的新途徑[J].上海科技翻譯,2003(3):77-80.
[12]趙剛.漢語中的冗余信息及其翻譯[J].國外外語教學,2004(4):57-62.
The Impact of Pre-Editing on the Quality of Machine Translation
Hu Qian
Zhongnan University of Economics and Law, School of Foreign Languages, Wuhan
Abstract: This study seeks to explore scientific methods for evaluating translation quality and investigate the potential impact of pre-editing on translation quality, aiming to fill gaps in post-editing research. Utilizing an objective scoring system, our results indicate that rational pre-editing and preprocessing significantly enhance text adaptability for machines, ultimately improving machine translation accuracy and quality.
Key words: Pre-editing; Translation quality; Translation quality assessment system
*2023年度中南財經政法大學研究生科研創新平臺項目(202310810)。