劉嘉茜


摘要本文將以語料庫翻譯學為指導,探討以陶瓷為核心的英漢雙語平行語料庫的創建與應用,詳細闡述語料庫的整體設計思路與具體研制步驟,以及語料庫在陶瓷語言特點研究、課堂教學、陶瓷術語庫構建等方面的實際應用。希望通過這種新的研究范式,提升陶瓷翻譯的質量及效率,推動陶瓷文化的國際傳播。
關鍵詞 ?陶瓷;平行語料庫;雙語
0引言
中國因陶瓷而聞名,在中國文化史上,陶瓷是一種獨特而重要的載體,然而許多中國陶瓷中的基本概念,在不同文化背景下有著不同的理解,這導致陶瓷英譯存在一定困難。例如,“青”為陶瓷典籍的核心概念之一,關于“青”的表達有青綠、粉青、霽青、青瓷、青花、青白、頭青等等,英譯時應需根據語境和陶瓷專業知識,具體辨析“青”的內涵和用法,采取相應的翻譯策略。近年來,國內外關于雙語語料庫尤其是平行語料庫的創建與應用研究蓬勃發展,但迄今為止,專門為陶瓷翻譯研究而創建的平行語料庫寥寥可數,陶瓷英漢雙語平行語料庫(以下簡稱陶瓷語料庫)不僅能用于陶瓷語言研究,還能在翻譯中幫助譯者“理解和掌握同一領域中不同語言的常用術語、慣用表達式、文章語氣及典型的語篇結構,避免在專業翻譯中經常出現的語言‘不自然或‘形似而神不似的現象”。此外,陶瓷語料庫還將為課堂教學、詞典編纂、術語庫構建提供平臺,具有廣闊的應用前景。
1陶瓷語料庫構建的必要性
目前陶瓷翻譯研究中主要存在以下問題:(1)術語的一詞多譯,如“三彩”可譯為“Sancai”“Tricolor”“tri-color”“Three-color”“tri-colored glazed”等。術語譯文的不統一將增大外國讀者的閱讀難度,也不利于中國陶瓷文化的傳播;(2)專業知識匱乏,如“雞首壺”譯為“chicken-head-shaped ewer”,但“雞首壺”并不是整個壺(ewer)像雞首,只是壺嘴(spout)像雞首而已,應改譯為“Celadon ewer with chicken-head-shaped spout”。陶瓷文本的英譯需要譯者具備充分的陶瓷專業知識,原文與譯文的機械對等可能導致歧義;(3)中西方文化差異,如龍是陶瓷上常見的裝飾紋樣,但中西方文化中的龍是完全不同的。在西方文化中,龍是代表貪婪與破壞的邪惡象征。而在中國文化中,龍被認為是創造世界的四大神獸之一。在封建時代,龍也被看作是帝王的象征,因此將龍直譯為“dragon”是不準確的,也會造成歧義,不妨音譯為“Long”,“這一處理在最大程度上保留了中國特色術語概念的原生性”。
陶瓷語料庫的構建將為解決上述問題提供很好的參照。首先,通過創建陶瓷語料庫獲得較為完善和齊全的陶瓷雙語語料,可以在比較并分析大量語料的基礎上構建陶瓷術語庫,解決陶瓷術語譯名不統一、亂譯、錯譯的問題;其次,平行語料庫中的兩種語言互為對應,記載著兩種語言中的對應詞和對應單位,成為詞典編纂者最可靠的數據來源;再者,在輔助教學方面,平行語料庫也能為課堂提供豐富的案例與上下文語境,通過對語料的加工還能夠提供詞匯的搭配情況、頻率、反向檢索等數據。綜上,創建關于陶瓷語料庫可以極大提高陶瓷類文本的翻譯效率,并且有雙向的中英文語料作為參照,譯文能做到準確傳達原文信息的同時,可讀性也大大增強。
2陶瓷語料庫的設計與構建
2.1語料庫的設計
語料庫的整體設計是語料庫研究和應用的關鍵,Sinclair認為語料庫如何選材、如何架構往往決定了語料庫的后續發展,甚至決定了能獲取什么樣的研究成果。就性質而言,陶瓷語料庫屬于專用(specialized)、同質的(homogeneous)語料庫,只收集與陶瓷相關的中英文原生性的文本及其譯文。不同于通用型語料庫,專用語料庫通常是為滿足使用者特定的研究需求而創建的。陶瓷語料庫的研究用途主要有兩點:一是陶瓷翻譯研究,二是陶瓷語言研究。其中,針對翻譯研究而采集的語料為雙向(bi-directional)的平行語料,即英譯漢的語料和漢譯英的語料。針對語言研究所收集的類比語料則分為英語原創語言、英語翻譯語言、漢語原創語言、漢語翻譯語言四類。將平行語料與類比語料相結合,能在語料庫的翻譯研究中發揮更大的增效作用。
2.2語料收集與降噪
原始語料的選擇是語料庫建設過程中的一個重要問題,我們結合陶瓷語料庫的研制目的,制訂出以下幾條標準:(1)類型豐富,為適用于不同類型的陶瓷翻譯研究,我們將盡可能采集多樣化的語料,包含陶瓷的典籍、通用書籍、圖冊、手冊等,本研究旨在盡可能覆蓋陶瓷文本的全部類型,但并不單純追求語料庫規模的龐大。(2)學術性高,文本撰寫者須為國內外陶瓷學界的著名學者,且英漢均為已出版的書籍。(3)時間分布合理,為便于開展歷時的語言變化研究及語言與翻譯的關系研究,我們也將注意語料的出版時間。(4)雙向語料,中英文互譯的雙向語料可實現原文與譯文的比較,也可實現譯文與非譯文的比較,能夠最大限度地利用語料庫。鑒于以上標準,我們首批采集的語料約48萬字、詞,其中英語語料274 447詞,漢語語料210 372字,時間跨度為1897-2011年。
語料的具體收集步驟如下:首先,對紙質文本進行掃描,并使用OCR文字識別軟件導出成可編輯的Word格式文本。將文本中配圖及圖注單獨編號存儲后,清洗掉無關的、錯誤的信息及符號,再使用Word軟件中的“查找-替換”功能,對多余空格、段落空行、軟回車或硬回車等進行降噪,盡量消除文本噪音,才能滿足精確檢索的要求。由于文本類型眾多,我們要求語料文本格式一致、文件名規范,將原文與譯文使用同一文件名存儲,但使用不同前綴,例如:ch-中國外銷瓷、en-中國外銷瓷。此外,單詞拼寫錯誤須人工校對,校對無誤后存儲為純文本(plain text)格式,也就是后綴為“.txt”的記事本文件,這是語料最常用也最簡便的存儲方式,幾乎所有檢索軟件都能加載并讀取此類文本數據。
2.3語料的分詞與標注
為便于后期進行更深層次的研究,我們將對中英文語料分詞及標注。中文語料使用中科院研發的軟件ICTLAS進行分詞和標注,英文語料使用軟件CLAWS進行標注。通過檢索標注后的文本,可以對文本進行詞匯層面或句子層面的考察。例如,計算詞匯密度即實詞與總詞數比值的百分比。在句子層面,通過檢索特定的正則表達式(regular expression)可專門研究某一特定句型在陶瓷文本中的使用,這些檢索結果不僅能夠幫助我們分析陶瓷文本中專有的語言特點,也能為英漢陶瓷文本對比提供數據。
當我們使用一個語料樣本時,我們需要知道與這個樣本相關的作者、出版時間、標題等數據,這類信息稱為篇頭(HEAD)。陶瓷語料庫的篇頭元信息包含:中英文標題、作者、譯者、翻譯方向、年代、出版信息、文本字數。
2.4語料的對齊
語料的對齊一般分為:段對齊、句對齊和段對齊下的句對齊。由于本語料庫的研究目的之一為陶瓷翻譯研究,因此采用句級對齊。使用對齊軟件對所有中英文語料進行對齊,但由于英漢語言的差異,實際翻譯中可能出現一對一、一對多、多對一、多對多等情況。因此,在完成機器對齊后仍須人工校對,圖1為已對齊的中英文語料。對齊后的語料有兩種存儲方式:純文本格式與TMX格式。純文本格式最大的好處是占用空間小、存取方便,而且幾乎所有操作系統都能處理。TMX格式可直接在翻譯輔助平臺上直接作為平行語料庫供查詢和檢索。
3陶瓷語料庫的應用
3.1陶瓷語言特點研究
根據已建成的陶瓷語料庫,可以通過檢索和分析
來研究陶瓷文本語言本身的特點,例如高頻詞,高頻詞是指在某一文本中出現頻率特別高的詞語,可通過該詞在全文中所占百分比或該詞在詞頻中所處的前后位置來確定。我們使用軟件AntConc分別統計英語和漢語中出現頻率最高的前十五個詞語,如表1所示。
根據表1得出結論如下:(1)虛詞的頻率遠高于實詞,這一點無論在英語還是漢語中都是一樣的,所不同的是虛詞的種類。(2)所屬關系的表達方式,漢語詞語中出現頻率最高的是“的”,“的”常用來表達代詞或名詞的屬格關系(如“我的”“瓷器的”),而在英語中除了通過代詞屬格的變化(如you和your),還可以通過名詞之間加of的形式來表達,所以of也是英語中出現頻率第二高的單詞。(3)介詞的差異,漢語中的“在”與“上”“中”搭配使用適用于多種場合,但英語中的介詞一般都有較特定的用法。(4)漢語高頻詞中,“釉”“窯”“瓷器”“紋”“器”都是與陶瓷密切相關的詞語,具有明顯的陶瓷文本特點。但英語中前十五個高頻詞并沒有明顯具有陶瓷特色的詞語。除高頻詞外,我們還能研究陶瓷文本在語篇、修辭、詞匯、常用術語、慣用表達式等方面與普通語言不同的特點。
3.2輔助課堂教學
傳統的翻譯教學課堂是以“教師+教材”為中心,而將陶瓷語料庫應用于課堂教學進行數據驅動式學習(data-driven learning,簡稱DDL),實現以“學生+案例”為中心的翻譯教學。陶瓷語料庫將為陶瓷翻譯教學提供大量英漢對齊的電子文本,并“輔以計算機統計手段”,通過“觀摩、對比、分析、借鑒的方式”來培養學生的翻譯意識。例如,使用中國傳媒大學研發的檢索軟件CUC_ParaConc,以“瓷”為關鍵詞對已完成對齊的文本進行檢索,共檢索到3 901處,其中porcelain826處、wares738處、ware411處、ceramics388處、ceramic164處。語料庫可以對某一檢索詞或術語提供豐富的雙語對譯案例,幫助學生進行對比分析,提高學生翻譯的意識和應變能力。雙語平行語料庫在翻譯教學中的作用是教科書所不能替代的,并且具有廣闊的使用前景與潛在的開發價值。
3.3建立陶瓷術語庫
作為中國特色傳統術語之一,陶瓷術語“源自中華民族發展的不同歷史時期,涉及科技、人文及社會實踐等諸多領域”。作為陶瓷文化的核心,術語的應用與傳播具有“重復性”特征,對其進行“統一規定”非常必要,因此我們將在已建成的語料庫基礎上制作陶瓷術語庫。在SDL MultiTerm Extract中導入已對齊的翻譯記憶庫,點擊Term Properties框對術語進行依次修改和篩選,確認無誤后保存。確認和添加完所有的術語對后將術語庫導出。目前,我們已構建了陶瓷款識術語庫,其中收集了400對款識及其譯文,并標注款識的類型、翻譯方法等信息。
話語傳播,術語先行。中國特色術語翻譯標準化是中國特色話語有效對外傳播的前提與基礎。伴隨著陶瓷語料庫的不斷更新,我們也將不斷完善陶瓷術語庫,為陶瓷術語的統一提供標準,增強陶瓷文化對外傳播的科學性和嚴謹性。
4結語
本文主要探討了陶瓷英漢雙語平行語料庫的具體構建步驟,并對中英文陶瓷語言特點、課堂教學應用以及陶瓷術語庫構建做了詳細闡述。在未來的研究中,我們會將平行語料與計算機輔助翻譯記憶庫結合,進一步提升陶瓷翻譯的質量及效率,以促進陶瓷文化的傳播。目前陶瓷語料庫只是初步建成,后期也會將語言種類擴展,補充其他語種的語料,將其構建成以中文為核心的多語言陶瓷語料庫。希望通過翻譯這一媒介,能夠將中國瓷器的輝煌成就弘揚世界,也能向世界展示中國形象,促進文明交流互鑒,提高國際話語權。
參考文獻
[1]盧軍羽.中國陶瓷典籍中“青”的內涵源流及英譯[J].中國翻譯,2016,37(04):105-109.
[2]李德超,王克非.新型雙語旅游語料庫的研制和應用[J].現代外語,2010,33(01):46-54.
[3]陳蓉.從術語庫到語料庫——陶瓷術語“三彩”的譯名研究[J].陶瓷研究,2021,36(04):4-7.
[4]歐飛兵.陶瓷文化術語對外傳播及翻譯標準化[J].景德鎮學院學報,2022,37(05):114-118.
[5]魏向清,楊平.中國特色話語對外傳播與術語翻譯標準化[J].中國翻譯,2019,40(01):91-97.
[6]王克非.中國英漢平行語料庫的設計與研制[J].中國外語,2012,9(06):23-27.
[7]Sinclair,John. Council of Europe Multilingual Lexicography Project [R].Report submitted to the Council of Europe under contract no.57/89,1991.
[8]黃昌寧.語料庫語言學[M].北京:商務印書館,2002.
[9]秦洪武.雙語語料庫的研制與應用[M].北京:外語教學與研究出版社,2021.
[10]王朝暉,余軍.韓素音國際翻譯大賽語料庫構建及翻譯教學應用[J].中國翻譯,2019,40(05):72-79.
[11]馮慶華.思維模式下的譯文詞匯[M].上海:上海外語教育出版社,2012.
[12]王克非.語料庫翻譯學探索[M].上海:上海交通大學出版社,2012.