摘 要:近年來,在信息化大數據的時代背景下,CAT工具已成為譯者的必備工具。自語料庫引入翻譯研究以來,也成為譯者的重要參考工具,幫助譯者提高了翻譯質量和效率。本文介紹了基于計算機輔助翻譯工具memoQ2015進行語料庫建設和應用的方法,為譯者提供了借助語料庫進行翻譯的工具和方法。
關鍵詞:語料庫 計算機輔助翻譯 翻譯質量和效率
一、基于語料庫的翻譯研究
語料庫(Corpus)的實質是科學取樣加工的大規模電子文本庫,它具備三大特點:(1)語料庫中存放的是在語言實際使用中真實出現的語言材料;(2)語料庫是承載語言知識的基礎資源,但并不是語言知識;(3)真實語料需要經過加工才能成為有用資源。
語料庫翻譯(Corpus-based translation studies)自誕生以來,就已廣泛應用于翻譯研究,為譯者提供了研究思路和工具。“翻譯研究除需要‘雙語對照語料庫之外,還要有‘雙語平行語料庫和‘單語比較語料庫”。(Lynne Bowker等,2007 X)如今,基于語料庫的翻譯研究已成為描述翻譯研究的新型研究范式,在理論和應用層面都對翻譯研究作用巨大。“基于語料庫的翻譯研究能使我們簡潔、有效地進行編碼,能使我們查詢并獲得大量數據”。(Tymoczko,1998,1)。[1]
二、語料庫的建立
目前,世界上有許多通用的語料庫可供譯者或研究人員使用。
但在翻譯中,譯者會發現既有語料庫未必能滿足需求,或尚未有相關題材的語料庫可使用。此時,譯者可以根據自己的需求自建雙語語料庫提高翻譯質量和效率。本文根據譯者的翻譯項目為例,介紹語料庫建設及其在翻譯工具memoQ2015中的應用。[2]
1.語言資料的準備
譯者進行的翻譯項目需要建立與“一帶一路”相關的語料庫。
語言材料的搜集可通過網絡進行,例如,搜集整理近年來國家關于“一帶一路”的雙語報道,可參考“中國一帶一路網”上的報道等,將材料搜集整理下來后以電子文稿的形式存儲。語言材料可使用雙語文檔(中英文本儲存在兩個文檔),亦可用單語文檔(中英文本儲存在同一文檔)儲存。下一部分所介紹的Tmxmall在線對齊功能可進行雙語文檔和單語文檔對齊。[3]
2.利用Tmxmall進行語料對齊
文檔對齊可以實現語言材料的句句對齊或段段對齊,雖然該對齊可以靠手工調整實現,但利用對齊工具可以快速、高效地實現對齊。
如圖1所示Tmxmall雙語文檔對齊界面,在下圖所示的文件夾
位置點擊并選擇上傳文檔。上傳完成后,如下圖2所示。此時,檢查
一下兩個文檔中的段落數量是否一致,如不一致,需要手動將段落數量調整一致,可使用圖2界面中的“合并”、“拆分”功能鍵。此時不需查看段落內容是否對應,確保段落數量相同即可。段落數量調整后,則選擇圖2的“對齊”按鍵進行對齊。
對齊完成后,需要檢查對齊效果是否理想。對齊過程并非完全正確,因而還需譯者檢查,對于出錯的地方可以采用“合并”、“拆分”、“刪除”、“插入”和“上/下移”等功能鍵調整。對齊完成后的界面如下圖3所示。可以看到,對齊后的文檔既可是句句對齊,也可是段落對齊。
對齊完成后的文本,需要“導出”為合適的格式,用作在memoQ2015中建立語料庫的文本資料。選擇“導出”后,可以看到Tmxmall給出了不同的導出格式,此時選擇語料庫常用的TMX格式。大部分計算機輔助翻譯軟件都支持導入TMX文件;如有其他需要,可以根據自身需求導出其他格式。文件導出后,存儲在文件夾中待用。[4]
3.在memoQ中建立語料庫
在先前的步驟中,我們已經準備好了語言材料,下面我們需要
在計算機輔助翻譯軟件memoQ2015中建立語料庫,將其作為載體,用于承載處理后的語言材料。
運行memoQ2015,打開需要翻譯的翻譯項目可以看到,左側選
項欄中有“LiveDocs”(語料庫)選項,這就是我們需要使用的功能。點擊“LiveDocs”,如下圖4所示。
在圖4所示界面上方選項欄中選擇“Creat/Use New”,新建語料庫,并根據自身需求命名;語料庫建立后,在上方選項欄中找到“Import Document”,導入處理好的TMX文本。導入完成后,確保勾選語料庫前的選擇框,保證所建語料庫能在數據檢索中起作用。
三、語料庫在memoQ2015中的應用及數據檢索
以上過程完成后,在真正的翻譯實踐過程中,譯者可能會遇到拿不準的術語等,尤其是對于專業領域的術語來說,往往需要查詢資料才能確定某個詞匯的譯法。借助語料庫,譯者可以快速查詢某個詞匯的表達,從而幫助自己提高翻譯質量和效率。
在使用memoQ2015進行翻譯時,譯者會遇到某個不確定譯法的詞匯,這時就可以使用先前建立的語料庫進行數據檢索,查看語料庫中是否存有該詞匯,并查詢譯法。
如下圖5所示,第223個句段出現了“政治互信”一詞,但譯者不明確其譯法,此時,譯者可以用鼠標選定該詞,并按“Ctrl+K”調出數據檢索框,點擊右側“Concordance”開始檢索。如下圖所示,我們可以看到,軟件用時0.03秒便檢索出了10條結果。檢索速度比查詢紙質材料或在Word文檔中使用“查找”功能快很多。此時,譯者可以查看數據檢索給出的結果,選擇符合語境的合適譯法即可。
又例如,譯者在檢索“利益共同體”一詞時,用時0.04秒,檢索得到5條結果。由于建立的語料庫相對較小,因而檢索結果較少,在語料庫足夠大的情況下,可以得到更多、更精確的檢索結果。
通過使用自建語料庫可以發現,軟件能夠幫助譯者在極短時間內快速完成數據檢索,大大減少查詢時間。但需要注意的是,語料庫中所使用的材料須是權威材料,如此才能保證檢索結果的可靠性。
相對于幾萬甚至十幾萬字詞的翻譯項目來說,借助語料庫,可以幫助譯員快速實現語言資源的檢索;同時,這些語言材料是可以不斷重復使用的;當然,也可以在使用過程中根據需求進行增刪,建立更加完善的語料庫。根據語料庫數據檢索所用的時間來看,只需不到1秒(語料庫較大時,耗時也會較多)的時間,我們就可以獲得多個相關結果,這種效率對于大型翻譯項目而言無疑是十分節省時間的。因而,我們可以看到借助語料庫,可以有效地幫助譯員提高翻譯質量和效率。[5]
參考文獻
[1] Bowker,Lynne. Unity Diversity? Current Trends in Translation Studies[C]. Beijing Foreign Language Teaching and Research Press,2007.x.
[2] Tymoczko,M. Computerized corpora and the future of translation studies[J]. Meta,XL[j],1998,4.1-8.
[3] 王克非. 新型雙語對應語料庫的設計與構建[J]. 中國翻譯,2004,(6):73-75.
[4] 胡開寶,毛鵬飛. 國外語料庫翻譯學研究述評[J]. 當代語言學,2012,14(04):380-395+437-438.
[5] 楊梅,白楠. 國內語料庫翻譯研究現狀調查——基于國內學術期刊的數據分析(1993-2009)[J]. 中國翻譯,2010,31(06):46-50.
作者簡介
劉曉婷(1992-),女,民族:漢,籍貫:山東省濟南市。學歷:碩士,單位:山東師范大學,單位省市:山東省,研究方向:計算機輔助翻譯,翻譯學,英語筆譯。endprint