999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

藏族文學典籍藏英漢語料庫多模態建設框架

2017-06-10 20:02:01楊科王瀟
電子技術與軟件工程 2017年11期

楊科++王瀟

摘 要藏族文學典籍對外譯介如何取得更好的效果?借助計算機輔助翻譯軟件技術提高翻譯效率已成為高校和翻譯業界普遍探索的方向。本文梳理了目前計算機輔助翻譯技術在中文、英文和藏語翻譯中取得的成績,并提出了針對于藏英漢三語的計算機輔助翻譯系統和藏英漢平行語料庫的設計方案,重點圍繞在藏英漢平行語料庫設計中所涉及的藏民族文學典籍語料庫建設和維護,以及藏英、藏漢雙語句段對齊等關鍵問題。

【關鍵詞】語料庫 建設框架 藏族文學典籍 計算機輔助翻譯

1 藏族典籍藏英漢語料庫的建設意義

不同民族有不同的生產生活方式、文化傳統、風俗人情等,由此形成了不同的文化資源,這些文化資源是中國少數民族文獻的重要組成部分。少數民族文獻是以語言為載體、能夠體現中國特色的文化要素。少數民族文化作為其不可或缺的重要組成部分,是我國各族人民共同擁有的寶貴精神財富和資源。而少數民族文獻是記錄有關少數民族在不同時期、不同地域、不同學科,以不同方式進行社會實踐的知識和經驗總結的所有載體。通過文字、圖像、音頻、視頻等多種途徑和媒介譯介少數民族文獻,這對世界了解中國傳統文化精髓和少數民族的文化魅力,具有重要的現實意義。

傳統的譯介載體主要是紙質文件和口頭翻譯。不論是文學譯著,還是合同文書,都采用紙質文件的形式保管和傳播。口頭翻譯傳統上包括同聲傳譯、交替翻譯和陪同翻譯。但多途徑譯介不僅包括傳統的紙質和口頭形式,還應充分利用當前的多媒體手段,以便達到更好的保管和傳播效果。

調查顯示,目前雙語語料庫有GCEPC ( General Chinese-English Parallel Corpus,北京外國語大學通用漢英對應語料庫),ZCTC ( ZJU Corpus of Translational Chinese,浙江大學漢語譯文語料庫),ECCC ( English-Chinese Classics Corpus,英漢名著翻譯語料庫),ECPCSP( English-Chinese Parallel Corpus of Shakespeare's Plays,莎劇英漢平行語料庫),LPCC( Literature Parallel Corpus for Children,兒童文學平行語料庫) 以及各種多譯本語料庫。盡管這些語料庫的類型和目的各異,但針對少數民族語言并不多見。涉及少數民族語言與英語的雙語語料庫,更是少之又少;而考慮到翻譯成本、時間、精確度以及雙語翻譯人才的缺乏,建立一個這樣的雙語語料庫尤為顯得尤為重要。

“英語翻譯語料庫大都是把真實的、已正式出版的譯文匯集起來,并可用計算機對其語言現象進行統計、比較和分析”。語料庫有多種類型,確定類型的主要依據是它的研究目的和用途。“美國學者馬克·本德爾認為中國少數民族文獻翻譯主要有三種途徑:(一)基于第二種語言材料的翻譯;(二)同樣也是在第二語言的基礎上進行的翻譯;(三)直接從語言A到語言B的翻譯”。第三種途徑可以減少兩次翻譯產生的“失真”,最大程度保留原文本的語言信息和文體風格。但這種途徑對譯者提出很高要求,若是少數民族譯者,需精通英語并對其民族的文化有所感悟總結,若是英語國家譯者,需要長期生活在少數民族地區,深入了解至少一個少數民族的生活習慣、文化習俗、地理歷史。藏語民族典籍英譯雙語語料庫建設完成后,可以系統地為科研人員提供一個統一的規范的文獻翻譯來源,便于藏語語言學的研究和藏文信息處理等方面的科研的進行。

2 藏族文學典籍藏英漢語料庫多模態建設框架研究

對于如何構建語料庫主要總結幾個方面:

(1)對于語素原料方面的收集,包括人名、醫藥名稱、重要歷史資料典故以及藏傳佛教專門術語等不常見的特殊名詞。

(2)利用現代科技技術多媒體等方式用圖像手段進行某些特定詞匯的錄入:比如“通過建立藏文人名構成詞的成分屬性詞典,動態生成人名庫,利用傳統文法中人名上下文信息特征的文法規則建立藏文人名上下文指示詞庫對人名自動識別的方法。”

(3)在文字語料庫建設的同時,需要針對藏族語言具體情況,積累語音、視頻、圖畫等多種形式的資料庫,為深入研究準備。

具體來講,根據做過的積累, 初步籌建:臧英民族事務語料庫;藏英文學典籍語料庫等具有特色和前期基礎的語料庫。

3 具體實施策略

3.1 創建過程中的難點及解決辦法

創建語料庫的過程中,難點在于語料對齊。語料對齊有篇章、段落、句子、短語、詞語幾個截然不同的層次。如果用計算機程序做自動對齊,那不同的層次所要解決的問題也不同。如:

段落對齊:每種語言的每個段落都有其獨特的標志,所以段落對齊是最簡單的也是最容易實現的。

句子對齊:在翻譯的過程中,語料大都來自人工翻譯, 句子之間并不都是一對一的翻譯模式, 還有一對多、多對多的翻譯模式;兩種語言中對應譯文的句子長度不盡相等等原因導致句子對齊難度不小。在這里,舉例“基于詞典的漢藏句子對齊,使用的是在動態規劃的框架下,尋找最優對齊路徑的算法。

3.2 語料庫建設過程

3.2.1 語料選擇與收集

在建設少數民族和英語雙語語料庫之前,為了讓翻譯者更好的通過觀察和描寫其翻譯語言,充分利用雙語平行對應的語料,需要大量積累少數民族文獻典籍素材。其次,翻譯者需掌握少數民族語言與英語之間的轉換規律,為之后的翻譯研究、翻譯實踐等奠定堅實的基礎。具體有特點的有圖像與多媒體技術藏文人名自動識別研究。目前的藏文人名識別研究大多通過英語、漢語等語種的方法來研究藏文人名的識別,比如在《統計與規則相結合的藏文人名自動識別研究》一文中,“在處理漢族音譯人名情況時,采用姓氏驅動的方法,很好地解決了藏文文本中漢族人名的識別問題。實驗結果表明,該方法具有較高的準確率和召回率。”

主站蜘蛛池模板: 伊人91视频| 美女被躁出白浆视频播放| 亚洲国产成人久久精品软件| 精品国产成人av免费| 国产成人精品2021欧美日韩| 99re在线视频观看| 欧美日韩一区二区在线免费观看| 91麻豆精品国产91久久久久| 欧美伦理一区| 国产成人精品第一区二区| 91黄视频在线观看| 91在线精品麻豆欧美在线| 日本黄色a视频| 日本不卡在线| 老色鬼久久亚洲AV综合| 国产亚洲精品无码专| 国产成人91精品免费网址在线| 一级香蕉人体视频| 中文精品久久久久国产网址 | 性网站在线观看| 国产在线精彩视频二区| 99热这里只有精品2| 尤物亚洲最大AV无码网站| 一级片免费网站| 精品伊人久久久香线蕉 | 国产精品美女免费视频大全| 久久免费精品琪琪| 国产欧美日韩视频怡春院| 97精品国产高清久久久久蜜芽| 久久免费观看视频| 欧美午夜理伦三级在线观看| 在线观看的黄网| 22sihu国产精品视频影视资讯| 国产福利不卡视频| 99草精品视频| 欧美日本在线观看| 国产95在线 | 欧美午夜在线播放| 欧美笫一页| 免费无遮挡AV| 国产精品福利社| 日本精品一在线观看视频| 韩日无码在线不卡| 国产麻豆永久视频| 午夜丁香婷婷| 精品视频在线观看你懂的一区| 欧美日韩国产成人在线观看| 丰满人妻久久中文字幕| 亚洲床戏一区| 亚洲人成网站观看在线观看| 国产91无毒不卡在线观看| 国产欧美一区二区三区视频在线观看| 综合网天天| 亚洲中文字幕日产无码2021| 欧美A级V片在线观看| 国产91熟女高潮一区二区| 欧美专区在线观看| 色成人亚洲| 欧美亚洲欧美| 精品国产91爱| 三上悠亚精品二区在线观看| 成人在线不卡| 免费av一区二区三区在线| 91精品国产综合久久香蕉922| 超清无码一区二区三区| 色悠久久久| 伊人成人在线| 久久精品欧美一区二区| 亚洲国产成人超福利久久精品| 精品无码日韩国产不卡av | 成人毛片免费在线观看| 狠狠色狠狠色综合久久第一次| 一区二区三区高清视频国产女人| 国产成人综合网在线观看| 国产在线麻豆波多野结衣| 欧美劲爆第一页| 伊大人香蕉久久网欧美| 亚洲欧洲日韩综合| 中文字幕有乳无码| 色播五月婷婷| 成人免费一区二区三区| 国产精品免费p区|