華道陽 胡妮


摘要:文章探討了翻譯記憶技術在航空文本翻譯中的應用,以航空文本《2021年民航行業發展統計公報》為翻譯實例,使用計算機輔助翻譯工具SDL Trados,展示了翻譯記憶技術在航空文本翻譯中的實操步驟,包括翻譯記憶庫的建立和應用,證明了翻譯記憶技術有助于提高翻譯的效率。文章旨在為航空領域的譯者和研究者提供一定的參考和借鑒,同時也為翻譯技術的發展和推廣做出一定貢獻。
關鍵詞:翻譯記憶技術;SDL Trados;航空文本翻譯
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2024)14-0120-03 開放科學(資源服務)標識碼(OSID) :
0 引言
翻譯記憶(Translation Memory,TM) 技術是計算機輔助翻譯(Computer Aided Translation,CAT) 技術的主體[1],它可以存儲和重復使用以前翻譯過的文本句段,從而提高翻譯的速度、質量和一致性。翻譯記憶技術已經廣泛應用于各個領域的專業翻譯,如法律、醫學、工程、商務等,為譯者和客戶帶來了諸多好處。然而,翻譯記憶技術在航空文本翻譯中的應用卻鮮有研究,由于航空文本具有高度的專業性、規范性和重復性,由此,非常適合使用翻譯記憶技術來提高翻譯效率和質量。航空文本的翻譯對于促進國際航空合作、保障航空安全、推動航空發展具有重要的作用。然而,航空文本的翻譯也面臨著一些挑戰。航空文本的翻譯不僅要面對航空術語的多種多樣和復雜難懂,還要應對航空文本的數量龐大和更新頻繁等問題。因此,航空文本的翻譯需要借助先進的翻譯技術,如翻譯記憶技術,來提高翻譯的效率和質量,保證翻譯的一致性和準確性。本文首先對翻譯記憶技術進行了相關概述,然后對計算機輔助翻譯工具的選取進行了說明,最后以《2021年民航行業發展統計公報》[2]為翻譯實例,介紹了使用SDL Trados建立和應用翻譯記憶庫的詳細過程,并通過文本中的具體案例展示翻譯記憶庫是如何在翻譯過程中提高翻譯效率的。
1 翻譯記憶技術概述
翻譯記憶技術利用已有的原文和譯文,建立一個或多個翻譯記憶庫,用于存儲和重用之前翻譯過的文本(如句子或段落)。翻譯記憶庫是一種“用于儲存原文本及其譯文的語言數據庫”[3]。翻譯記憶技術充分利用了數據庫的強大功能,注重提高已有翻譯資料的復用,從而無需重復翻譯相同或相似的內容。因此在資料重復度高達20%~70% 的專業翻譯領域中,翻譯記憶能大量消除譯者的重復勞動,避免相同句子出現多種翻譯結果,極大地提高了工作效率[4]。翻譯記憶的基本原理是:根據輸入內容在翻譯記憶庫中檢索與其最相似的句子,并將該句子的翻譯,作為參考翻譯提交給譯者進行后編輯[5]。它的主要優點是可以提高翻譯的速度、質量和一致性,以及降低翻譯的成本。
翻譯記憶技術主要涉及文本句段的劃分、存儲和匹配,一般都遵循以下幾個步驟:1) 劃分:將原文和譯文按照一定的規則或算法切分成若干個句段,通常以句子為單位,也可以是段落等;2) 存儲:將切分好的原文和譯文以一定的格式存儲在翻譯記憶庫中,形成一對一的翻譯單元。常用的格式有 TMX格式(翻譯記憶交換格式),可以實現不同系統之間的兼容和轉換;3) 匹配:當譯員在翻譯一個新的句段時,系統會根據一定的算法或標準,從翻譯記憶庫中檢索出與之相同或相似的句段,并給出相應的譯文。相似度通常用百分比表示,100% 表示完全匹配,低于100% 的表示模糊匹配。譯員可以根據需要接受、修改或拒絕系統提供的譯文。
翻譯記憶的研究和應用已經有了幾十年的歷史,目前已經成為計算機輔助翻譯的主流技術之一,廣泛應用于各種領域和場合,如技術文檔、法律文本、網站本地化等。翻譯記憶的發展也面臨著一些挑戰和問題,例如,如何提高翻譯記憶庫的質量和覆蓋率,如何與其他技術(如機器翻譯、術語管理、語料庫分析等)結合和協同,如何適應不同的語言和文化等。
2 計算機輔助翻譯工具的選取
研究選取SDL Trados作為計算機輔助翻譯工具,主要基于其在專業領域翻譯中的廣泛應用以及其對于航空文本翻譯的顯著應用優勢。根據王華樹在2018年—2019年展開的一項問卷調查結果顯示,譯員目前使用最多的三款CAT 工具依次為SDL Trados、memoQ 和Déjà Vu,分別占比53.71%、25.52% 和18.4%[6],可見SDL Trados最受譯員的歡迎。作為一款被眾多專業翻譯人員和翻譯公司信賴的翻譯工具,SDL Trados在各行業中積累了豐富的經驗。其成功應用于航空、醫學、法律等領域,尤其是在處理大規模項目和專業術語時表現出色。對于《2021年民航行業發展統計公報》這樣包含大量專業術語和存在一定行業標準的文本,SDL Trados的專業性和可靠性使其成為優選工具。
SDL Trados在航空文本翻譯中的顯著應用優勢表現為它的翻譯記憶功能可以極大地提升航空文本的翻譯效率。航空類文本經常包含大量重復或相似的內容和術語,而SDL Trados能夠存儲并重復利用先前翻譯過的內容,從而提高翻譯效率。這不僅減少了翻譯人員的工作負擔,還確保了文本中相同表達的一致性。
因此,鑒于SDL Trados在專業領域的廣泛應用和其強大的翻譯記憶功能,在此次針對翻譯記憶技術在航空文本翻譯中的應用的探究中,筆者認為它能夠提供高效和可靠的工具和技術支持。
3 翻譯記憶技術的在航空文本翻譯中的實際應用案例
翻譯記憶技術的實際應用流程主要包括翻譯記憶庫的建立和應用。翻譯記憶庫的建立需要對原始文本進行對齊和存儲,以形成翻譯單元。翻譯記憶庫的應用需要利用計算機輔助翻譯軟件將源語言文本與記憶庫中的翻譯單元進行比較,找出最合適的翻譯候選項。
3.1 翻譯記憶庫的建立
在對《2021年民航行業發展統計公報》展開翻譯之前,需先將在《2020年民航行業發展統計公報》的中文版本和官方英文譯本制成翻譯記憶庫。 具體步驟包括:1) 格式轉換;2) 文本清洗;3) 新建翻譯記憶庫;4) 導入雙語文件;5) 對齊。以上五個步驟的具體說明如下:
格式轉換:由于《2020年民航行業發展統計公報》為PDF格式的文件,但并不是所有PDF文件都能被SDL Trados完美識別和處理,而PDF轉換為Word格式可以確保文件在SDL Trados中的兼容性,因此可使用合適的格式轉換工具將其轉換為Word格式,從而更好地保留原文的格式和結構。
文本清洗:文本清洗是指對文本數據進行預處理,去除其中無用或者冗余的部分,避免影響翻譯記憶庫的整潔性。文本清洗包括去除HTML標簽、特殊符號、空格等非文本內容以及圖表等無法導入翻譯記憶庫的內容;
新建翻譯記憶庫:點擊SDL Trados“翻譯記憶庫”視圖下的“新建”選項,在“新建翻譯記憶庫”界面設置記憶庫名稱、存儲路徑、源語言和目標語言,最后點擊“完成”。在此次翻譯項目中,該翻譯記憶庫的名稱為“民航行業發展統計公報TM”。
導入雙語文件:在“對齊文檔”模塊下點擊“對齊單一文件對”,導入待對齊的源文件及目標文件,即《2020年民航行業發展統計公報》的中文版本和官方英文譯本。
對齊:在完成“導入雙語文件”操作后,翻譯記憶庫中會呈現左右對照的原文和譯文格式。通過“紅色”“黃色”“綠色”的虛線條呈現自動對齊的結果。其中,紅色、黃色和綠色分別代表對齊質量“較差”“一般”“良好”。對于質量較差或一般的對齊句段,應先點擊“斷開連接”操作,然后再“重新連接”。連接方式為分別點擊左右兩側“序號列”,再點擊“連接”,即可將兩側意思對應的原文和譯文連接在一起,此時,重新對齊后的句段將以“綠色”實線連接。然而,并不是所有對齊都能按照1:1連接。由于存在一行原文對應多行譯文的情況,因此應進行“一對多”連接。具體方式為按住ctrl鍵后再在序號列點擊相應譯文的所有序號,從而一次性將多行譯文選中,然后再與原文句段連接即可。最后,在點擊“確認”所有句段均按照原文和譯文一一對齊后,翻譯記憶庫“民航行業發展統計公報TM”則成功建立完成。
3.2 翻譯記憶庫的應用
翻譯記憶庫的應用是翻譯記憶技術在翻譯實踐中應用的最重要的一個環節,而在SDL Trados中,翻譯記憶庫在實際翻譯項目中的應用主要包括預翻譯和譯后編輯兩個階段。
3.2.1 預翻譯
“預翻譯”是指基于翻譯記憶庫和設定好的匹配率對翻譯項目進行自動翻譯[7],即Trados的翻譯記憶系統會自動檢索翻譯記憶庫中的內容,對于翻譯項目中內容相同或相似的句段,翻譯記憶系統會自動填充記憶庫中的譯文。根據匹配率的不同,翻譯記憶庫的匹配分為100% 匹配、上下文匹配、模糊匹配和零匹配,100% 匹配是指翻譯項目的某一句段與翻譯記憶庫中的句段在內容和格式上均一致地匹配,上下文匹配指在滿足100% 匹配的情況下,上下文內容也相同的匹配,模糊匹配即為匹配率低于100% 的匹配,該匹配下的翻譯項目的內容或格式相比記憶庫存在或多或少的差異。對于100% 匹配和上下文匹配,譯者可無須修改譯文,而對于模糊匹配的譯文,則仍需對照原文進行相應的修改。
在對《2021年民航行業發展統計公報》翻譯項目“預翻譯”之前,首先需要對該項目進行項目設置,包括添加翻譯記憶庫和設置最低匹配率值。添加翻譯記憶庫的具體步驟包括“點擊項目設置-選擇翻譯記憶庫和自動翻譯-使用文件翻譯記憶庫-啟用”。對于最低匹配率的設置,為了達到更好的匹配效果,一般設置為70% 或以上為佳。經過對翻譯項目的“預翻譯”,生成了如圖1所示的“預翻譯報告”。該報告的分析結果包括已翻譯句段及其百分比、未翻譯句段及其百分比。根據該報告,翻譯項目《2021年民航行業發展統計公報》的字數共計4035 字,經預翻譯處理后58.87% 為“已翻譯”,41.43% 為“未翻譯”,這意味著在應用翻譯記憶庫后,該項目的一半以上內容與翻譯記憶庫中的內容相同或相似,在后續的譯后編輯階段則可在很大程度上避免重復內容二次翻譯,從而顯著縮短翻譯時間,大大提高翻譯效率。
3.2.2 譯后編輯
“譯后編輯”是指對匹配度低于100% 的模糊匹配句段的預翻譯譯文進行人工修改的過程。SDL Trados 翻譯記憶庫匹配的譯文一般默認顯示于編輯視圖左上角的“匹配結果”一欄,方便譯者將正在翻譯的內容與記憶庫中的內容進行快速比對。而對于不同之處,“匹配結果”一欄會呈現不同顏色,方便譯者迅速定位二者原文的不同之處,然后進行“對癥”翻譯。例如:
翻譯記憶庫原文:“其中,大中型飛機平均日利用率為6·.61 ··小時,比上年減少2· .88 ··小時;小型飛機平均日利用率為4· .14 ··小時,比上年減少2· .25 ··小時。”
翻譯記憶庫譯文:Specifically, the rate of mediumand large sized aircraft was 6.61 hours, down by 2.88hours from a year earlier, whereas that of small sized air?craft was 4.14 hours, down by 2.25 hours.
項目原文:“其中,大中型飛機平均日利用率為6·.77 ··小時,比上年增加0·.16 ··小時;小型飛機平均日利用率為3·.78 ··小時,比上年減少0·.36 ··小時。”
項目預翻譯譯文:Specifically, the rate of mediumand large sized aircraft was 6.77 hours, down by 0.16hours from a year earlier, whereas that of small sized air?craft was 3.78 hours, down by 0.36 hours.
在以上例子中,項目原文和翻譯記憶庫原文的內容基本相同,除數字不同外,只有表示趨勢的兩個詞匯,即“ 增加”和“減少”存在差異。在SDL Trados編輯試圖中,“匹配結果”一欄會默認以不同顏色區分存在差異的內容。如在該例子中,翻譯記憶庫原文中的“減少”二字會顯示為紅色,項目原文內容中的“增加”則顯示為綠色。譯者根據顏色提示即可迅速判斷出項目譯文中需要進行譯后編輯的精確位置。
根據項目預翻譯譯文所示,經預翻譯后,由于SDL Trados會自動復制原文數字至對應譯文框,因此譯文與原文數字已自動保持一致,且其他相同的內容也都已自動調用了翻譯記憶庫的翻譯結果,因此均無需進行人工譯后編輯處理。但項目原文“增加”二字的翻譯卻仍為“down”,這顯然是錯誤的,因此還需對其進行輕微的譯后編輯,即將“down”改為“up”,從而保證項目譯文的準確性。這樣譯后編輯后的準確譯文則為:Specifically, the rate of medium and large sizedaircraft was 6.77 hours, up by 0.16 hours from a year ear?lier, whereas that of small sized aircraft was 3.78 hours,down by 0.36 hours.
上述例子表明,對于與翻譯記憶庫相同或相似的內容,譯者僅需通過輕微的譯后編輯即可完成句段的準確翻譯,避免了重復工作,大大節省了翻譯時間,保留了以往的翻譯風格和習慣,提高了翻譯的效率。
4 結束語
翻譯記憶技術在翻譯行業中已經成為一種主流的翻譯輔助技術,可以為翻譯工作者帶來顯著的效益,包括提高翻譯質量、保證語言一致性、節省時間和成本等。航空文本專業性強、格式規范、重復度高等特點使得翻譯記憶技術在航空文本翻譯中具有較高的適用性。本文通過一個具體的翻譯案例,詳細地介紹了如何使用SDL Trados軟件的翻譯記憶功能來提升航空文本的翻譯效率,并對SDL Trados軟件的操作方法進行了詳細說明。本文旨在幫助航空領域的譯者了解和掌握翻譯記憶技術在實際翻譯項目中的應用方法,同時也為其他領域的譯者提供了一種參考和借鑒的翻譯技術。最后,翻譯工作者應該積極地適應翻譯市場的變化,主動地轉變翻譯觀念,擁抱翻譯技術,以提高自身的翻譯水平和競爭力。
參考文獻:
[1] 王正,孫東云. 利用翻譯記憶系統自建雙語平行語料庫[J].外語研究,2009(5):80-85.
[2] 中國民用航空局. 2021年民航行業發展統計公報[EB/OL].(2022-5-18)[2024-1-8]. http://www. caac. gov. cn/big5/www.caac. gov. cn/XXGK/XXGK/TJSJ/202205/P020220518569126412044. pdf.
[3] BOWKER L.Computer-aided translation technology:a practical introduction[M].Ottawa [Ont.]:University of Ottawa Press,2002.
[4] 周文,徐國梁. 翻譯記憶中語句相似度計算方法的研究[J].計算機應用,2007,27(5):1210-1213.
[5] 汪昆,宗成慶,蘇克毅. 統計機器翻譯和翻譯記憶的動態融合方法研究[J]. 中文信息學報,2015,29(2):87-94,102.
[6] 王華樹,李智. 人工智能時代筆譯員翻譯技術應用調查:現狀、發現與建議[J]. 外語電化教學,2019(6):67-72.
[7] 王華樹,李智. 人工智能時代的翻譯技術研究:內涵、分類與趨勢[J]. 外國語言與文化,2020,4(1):86-95.
【通聯編輯:李雅琪】
基金項目:江西省研究生創新專項資金(省級項目)(YC2022-s733) ;江西省教育科學“十四五”規劃2023 年度重點課題“新時代大學生用外語講好中國故事能力培育實證研究——以南昌航空大學為例”(23ZD017) ;江西省高等教育學會2023 年度重點課題“教育數字化時代大學英語課程思政教學評一體化研究與實踐”(ZX4-B-006) ;新文科背景下航空文化多語種平行語料庫及教學案例庫建設(231004296280839)