楊科++王瀟

摘 要藏族文學典籍對外譯介如何取得更好的效果?借助計算機輔助翻譯軟件技術提高翻譯效率已成為高校和翻譯業界普遍探索的方向。本文梳理了目前計算機輔助翻譯技術在中文、英文和藏語翻譯中取得的成績,并提出了針對于藏英漢三語的計算機輔助翻譯系統和藏英漢平行語料庫的設計方案,重點圍繞在藏英漢平行語料庫設計中所涉及的藏民族文學典籍語料庫建設和維護,以及藏英、藏漢雙語句段對齊等關鍵問題。
【關鍵詞】語料庫 建設框架 藏族文學典籍 計算機輔助翻譯
1 藏族典籍藏英漢語料庫的建設意義
不同民族有不同的生產生活方式、文化傳統、風俗人情等,由此形成了不同的文化資源,這些文化資源是中國少數民族文獻的重要組成部分。少數民族文獻是以語言為載體、能夠體現中國特色的文化要素。少數民族文化作為其不可或缺的重要組成部分,是我國各族人民共同擁有的寶貴精神財富和資源。而少數民族文獻是記錄有關少數民族在不同時期、不同地域、不同學科,以不同方式進行社會實踐的知識和經驗總結的所有載體。通過文字、圖像、音頻、視頻等多種途徑和媒介譯介少數民族文獻,這對世界了解中國傳統文化精髓和少數民族的文化魅力,具有重要的現實意義。
傳統的譯介載體主要是紙質文件和口頭翻譯。不論是文學譯著,還是合同文書,都采用紙質文件的形式保管和傳播。口頭翻譯傳統上包括同聲傳譯、交替翻譯和陪同翻譯。但多途徑譯介不僅包括傳統的紙質和口頭形式,還應充分利用當前的多媒體手段,以便達到更好的保管和傳播效果。
調查顯示,目前雙語語料庫有GCEPC ( General Chinese-English Parallel Corpus,北京外國語大學通用漢英對應語料庫),ZCTC ( ZJU Corpus of Translational Chinese,浙江大學漢語譯文語料庫),ECCC ( English-Chinese Classics Corpus,英漢名著翻譯語料庫),ECPCSP( English-Chinese Parallel Corpus of Shakespeare's Plays,莎劇英漢平行語料庫),LPCC( Literature Parallel Corpus for Children,兒童文學平行語料庫) 以及各種多譯本語料庫。盡管這些語料庫的類型和目的各異,但針對少數民族語言并不多見。涉及少數民族語言與英語的雙語語料庫,更是少之又少;而考慮到翻譯成本、時間、精確度以及雙語翻譯人才的缺乏,建立一個這樣的雙語語料庫尤為顯得尤為重要。
“英語翻譯語料庫大都是把真實的、已正式出版的譯文匯集起來,并可用計算機對其語言現象進行統計、比較和分析”。語料庫有多種類型,確定類型的主要依據是它的研究目的和用途。“美國學者馬克·本德爾認為中國少數民族文獻翻譯主要有三種途徑:(一)基于第二種語言材料的翻譯;(二)同樣也是在第二語言的基礎上進行的翻譯;(三)直接從語言A到語言B的翻譯”。第三種途徑可以減少兩次翻譯產生的“失真”,最大程度保留原文本的語言信息和文體風格。但這種途徑對譯者提出很高要求,若是少數民族譯者,需精通英語并對其民族的文化有所感悟總結,若是英語國家譯者,需要長期生活在少數民族地區,深入了解至少一個少數民族的生活習慣、文化習俗、地理歷史。藏語民族典籍英譯雙語語料庫建設完成后,可以系統地為科研人員提供一個統一的規范的文獻翻譯來源,便于藏語語言學的研究和藏文信息處理等方面的科研的進行。
2 藏族文學典籍藏英漢語料庫多模態建設框架研究
對于如何構建語料庫主要總結幾個方面:
(1)對于語素原料方面的收集,包括人名、醫藥名稱、重要歷史資料典故以及藏傳佛教專門術語等不常見的特殊名詞。
(2)利用現代科技技術多媒體等方式用圖像手段進行某些特定詞匯的錄入:比如“通過建立藏文人名構成詞的成分屬性詞典,動態生成人名庫,利用傳統文法中人名上下文信息特征的文法規則建立藏文人名上下文指示詞庫對人名自動識別的方法。”
(3)在文字語料庫建設的同時,需要針對藏族語言具體情況,積累語音、視頻、圖畫等多種形式的資料庫,為深入研究準備。
具體來講,根據做過的積累, 初步籌建:臧英民族事務語料庫;藏英文學典籍語料庫等具有特色和前期基礎的語料庫。
3 具體實施策略
3.1 創建過程中的難點及解決辦法
創建語料庫的過程中,難點在于語料對齊。語料對齊有篇章、段落、句子、短語、詞語幾個截然不同的層次。如果用計算機程序做自動對齊,那不同的層次所要解決的問題也不同。如:
段落對齊:每種語言的每個段落都有其獨特的標志,所以段落對齊是最簡單的也是最容易實現的。
句子對齊:在翻譯的過程中,語料大都來自人工翻譯, 句子之間并不都是一對一的翻譯模式, 還有一對多、多對多的翻譯模式;兩種語言中對應譯文的句子長度不盡相等等原因導致句子對齊難度不小。在這里,舉例“基于詞典的漢藏句子對齊,使用的是在動態規劃的框架下,尋找最優對齊路徑的算法。
3.2 語料庫建設過程
3.2.1 語料選擇與收集
在建設少數民族和英語雙語語料庫之前,為了讓翻譯者更好的通過觀察和描寫其翻譯語言,充分利用雙語平行對應的語料,需要大量積累少數民族文獻典籍素材。其次,翻譯者需掌握少數民族語言與英語之間的轉換規律,為之后的翻譯研究、翻譯實踐等奠定堅實的基礎。具體有特點的有圖像與多媒體技術藏文人名自動識別研究。目前的藏文人名識別研究大多通過英語、漢語等語種的方法來研究藏文人名的識別,比如在《統計與規則相結合的藏文人名自動識別研究》一文中,“在處理漢族音譯人名情況時,采用姓氏驅動的方法,很好地解決了藏文文本中漢族人名的識別問題。實驗結果表明,該方法具有較高的準確率和召回率。”