999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于句法和語義的英漢翻譯記憶系統的研究與實現

2016-11-21 09:47:32汪美俠
電子設計工程 2016年21期

汪美俠

(咸陽師范學院 外國語學院,陜西 咸陽 712000)

基于句法和語義的英漢翻譯記憶系統的研究與實現

汪美俠

(咸陽師范學院 外國語學院,陜西 咸陽712000)

由于目前市場所存在的英漢翻譯系統不能準確將語句翻譯出來,所以仍是輔助工具作為人們工作生活中的翻譯手段。但對于資料重復率高的工作,完全可以利用強大的數據庫來減少重復工作。基于此,文中提出了一個基于句法和語義的英漢翻譯記憶系統。本文首先在分析語句相似度以后,應用WordNet技術對相似度的算法進行了研究,然后對記憶庫進行設計,最后對該系統進行了詳細研究。將該系統應用于實際實驗翻譯實踐中,結果表明該系統大大避免了對相同句子的翻譯過程,提高了翻譯速度、節約了時間。

翻譯記憶;相似度;WordNet

機器翻譯,顧名思義,就是將一種自然語言通過計算機翻譯成另一種所要求的目標自然語言。隨著現今互聯網的快速興起,讓人們看到了機器翻譯的未來地位,也更堅定了人們開發機器翻譯系統的決心。同時,伴隨著現在國家之間的交流逐漸增多,人們相互交流越發的不順暢,使用先進的、準確的機器翻譯系統勢在必行。目前,現在流行的機器翻譯系統分為兩類,一類是基于語法分析、一類是基于語料庫,其中,基于語料庫技術發展的更好一些。但是,自然語言畢竟是經過長時間發展演化才形成的,同時不同人對語言的理解把握能力也不盡相同,所以,機器翻譯對結果的準確性還是有待提高。同時,對于所需翻譯文件的重復率較高的工作,若每次都對這些文件進行翻譯,大大消耗了人力物力,那么,采用翻譯記憶技術來做這些工作的話,大大減少了工作時間、提高了工作效率。文中在句法和語義的基礎上,提出了一個英漢翻譯記憶系統[1-5]。

1 翻譯記憶

翻譯記憶技術就是指的是根據之前所翻譯任務所獲得的經驗并將其應用在之后的翻譯任務當中,為該翻譯任務提供必要的信息,采用該技術的系統就是翻譯記憶系統。在翻譯過程中,系統會根據所需翻譯的內容在本身存在的記憶庫中尋找類似的資源,并以此提供參考譯文,翻譯者可根據這些參考來更改內容,這樣可以極大的節省翻譯工作,對新內容投入更多精力。對于新內容的翻譯,系統將這些新內容與庫中數據進行比較匹配,然后提供參考譯文,譯者根據參考譯文可以更改或接受,然后系統就會將新譯文保存入數據庫中,為以后的翻譯工作提供便利,這樣累計以后,記憶庫中數據變多,就會大大提高翻譯效率,避免重復工作。該翻譯過程如圖1所示[6-8]。

那么在翻譯記憶過程中,需要注意的幾個關鍵技術有:

1)相似度計算

圖1 翻譯記憶的工作流程

2)譯文構造

3)記憶庫的設計

2 基于句法和語義的英語句子相似度算法

文中提出的算法是英語句子相似度算法,該算法從句法和語義兩方面來考慮。其中,相似度表示的是兩個句子是否相似,通常用[0,1]的區間范圍來表示,1指的是兩個句子無論從句法還是語義都是非常相似的,也就意味著這兩個句子都含有相同語義的單詞,同時這些單詞的排序順序也是相同的。0指的是兩個句子的句法和語義都是完全不同的,兩個句子之間不存在任何聯系。在0到1之間的不同數值則表示兩個句子之間不同的相似度。

對于文中提出的算法,過程如下:首先使用Link Grammar Parser軟件對所需計算的句子進行計算,得到各個句子的句法結構,然后再采用算法判定兩者句法結構是否相同,若兩者結構相同,那么再進一步利用算法來判定兩個句子的中的句義是否相似。在判定句義相似度的過程中,要根據句子中各個組成部分的句義相似度來判斷,由此可以避免與實際情況不相符的狀況發生[9-10]。

3 記憶庫的設計和譯文生成

3.1翻譯記憶庫的設計

記憶庫是翻譯記憶系統的重要組成部分,目前所存在的記憶庫主要分為3個級別,分別為句子級、詞匯級和更深層級,3個層次的優缺點對比如表1所示。

表1 記憶庫方案比較

由表1可看出,對于記憶庫的設計而言,若前期加工程度較重,那么后期工作就會變少,但是帶來的困難就是管理上較為麻煩;若前期加工較淺,那么隨之而來的就是后期譯文生成就會繁瑣。在翻譯的英語句子中,即使是復雜的句子也是由不同的簡單句組合而成,也就是說,每個英語句子都會包括主語和謂語,文中所設計的系統就是以句子為單位來進行翻譯的[11-12]。

在設計記憶庫時,要對系統的檢索效率以及對系統的管理相互兼顧,考慮周到才好。文中設計的記憶庫的結構如表2所示。

表2 記憶庫的結構表

在記憶庫的設計過程中,要注意的是,若待譯譯文是全新的句子,那么需要譯者對其進行翻譯,然后將翻譯的譯文存儲在記憶系統當中,以便之后對相同句子的翻譯;若待譯譯文與例句僅有部分相似,那么譯者對最相似的句子進行修改,并將修改后的譯文存儲在記憶庫當中[13]。

3.2譯文生成

文中是針對句子的翻譯,所以翻譯所用的算法得到的結果在區間[0,1]之間,那對于匹配的類別也就有所不同,匹配類別分類如表3所示[14]。

根據表3的不同情況,也分為3種處理方式,分別為:

1)直接復用譯文

2)人工翻譯

3)修改譯文

句子的譯文生成過程如圖2所示。

圖2 譯文的修改

表3 匹配的類別

4 基于句法和語義的翻譯記憶系統的開發

4.1系統的總體框架

文中所設計的框架如圖3所示。

系統的總體流程如下:

1)先輸入需要翻譯的句子

圖3 系統總體框架圖

2)通過分析句子的長度以及字符串,在記憶庫中找相似的例句,再將兩者進行比較

3)如果相等,則給出譯文

4)如果不相等,再根據句法找尋相似句法的例句

5)計算兩個句子的相似度

6)對最相似的例句通過譯文生成方式得到翻譯結果

7)若對譯文不滿意,可以人文進行修改,再將最后修改的譯文存儲到記憶庫中

4.2系統實現

4.2.1翻譯記憶庫的創建

文中設計的系統的翻譯記憶庫是利用SQL Sever 2000建立,該庫包括3個表,分別是:

Sentence表:該表中顯示的是所需翻譯的英語句子以及翻譯結果的詳細信息。

Structure表:該表是用來保存相關句子信息,例如句法結構。

Component表:保存句子的各個部分和譯文[15]。

4.2.2相似度計算

相似度的計算流程如圖4所示。如圖4所示,在開始相似性計算時,先根據句子的字符串進行相似比較,若相似度為1,那么返回相似度。若相似度不完全一致,那么就會再計算句法結構,判斷句法結構是否一致,若一致,則對句子中的各個關鍵詞進行抽取計算相似度,然后再返回相似度計算,若句法不一致,那么相似度判定為0,再返回相似度最初端。

圖4 相似度的計算流程

4.2.3譯文生成

譯文生成是以相似度為依據的,通過比較所需翻譯的句子與例句,根據相似度來適當進行處理,再利用兩者之間的關系生成譯文的。圖5為譯文生成的實例。可以根據生成的譯文進行修改,從而得到最后的結果。圖中,82%表示相似度,“[]”表示需要修改的譯文。

圖5 譯文修改

為更好表達該系統的高效性,表4列出了部分對比數據。

表4 Navigator 6.0和7.0技術手冊的相關數據

由表可看出,該系統大大提高了翻譯速度,節省了時間。

5 結束語

文中提出了一個基于句法和語義的英漢翻譯記憶系統。本文首先在分析語句相似度以后,應用WordNet技術對相似度的算法進行了研究,然后對記憶庫進行設計,最后對該系統進行了詳細研究。將該系統應用于實際實驗當中,結果表明該系統大大避免了對相同句子的翻譯過程,提高了翻譯速度、節約了時間。

[1]王金銓.翻譯記憶(TM)—計算機翻譯技術的新發展[J].現代圖書情報技術,2004,2004(5):13-16.

[2]Peter F.Brown,Stephen A,Della Pietra,et al.The Mathematics of Statistical Machine Translation:Parameter Estimation[J].Computational Linguistics,1993,19(2):263-311.

[3]Snell-Hornby.Mary.Translation Studies:An Integrated Approach.Revised edition[J].Amsterdam and Philadelphia:John Benjamins Publishing Company,1995:29.

[4]張健.基于實例的機器翻譯的泛化方法研究[D].北京:中國科學院計算技術研究所,2001.

[5]Nagao M.A Framework of a Mechanical translation between Japanese and Englishby analogy principle[C]∥In:Elithom A and Banerji R.Artificial and Human Intelligence,Edited ReviewPaperspresentedattheInternationalNATOSymposium.Amsterdam:NATO Publications,1984,173-180.

[6]Timothy Baldwin.A Look under the Hood and Road Test[C]∥In:Proceedings of 15th International Japanese/English Translation Conference.Yokohama,Japan:IEEE Press,2004,29-30.

[7]俞曉峰.面向譯文選擇的雙語語義詞典自動構建研究[D].哈爾濱:哈爾濱工業大學計算機科學與技術學院,2005.

[8]王斌.漢英雙語語料庫自動對齊研究[D].北京:中國科學院計算技術研究所,1999.

[9]安玉璞.自然語言問答系統的設計與實現[D].哈爾濱:哈爾濱工業大學,2003.

[10]張濤,楊爾弘.基于上下文詞語同現向量的詞語相似度計算[J].電腦開發與應用,2006,18(3):41-43.

[11]魯松.自然語言中詞相關性知識無導獲取和均衡分類器的構建[D].北京:中國科學院計算技術研究所,2001.

[12]穗志方,俞士汶.基于骨架依存樹的語句相似度計算模型[C]//1998中文信息處理國際會議論文集,北京:清華大學出版社,1998,458-465.

[13]車萬翔,劉挺,秦兵等.面向雙語句對檢索的漢語句子相似度計算[C]∥全國第七屆計算語言學聯合學術會議論文集.北京:清華大學出版社,2003:81-88.

[14]Hirst G,St-Onge D.Lexical Chains as representations of context for the detection and correction of malapropisms[C]∥In:C.Fellbaum(ed.)WordNet:An Electronic Lexical Database,Cambridge,MA:The MIT Press,1998:305-332.

[15]單玉秋.英漢輔助翻譯系統用戶需求調查及源語言輔助分析技術[C]∥2002全國機器翻譯研討會論文集,杭州:電子工業出版社,2002:15.

Research and implementation of English and Chinese translation memory system based on syntax and semantics

WANG Mei-xia
(School of Foreign Languages,Xianyang Normal University,Xianyang 712000,China)

As the English and Chinese translation system in the present market cannot translate the words accurately,it still works as a tool for people in their work and life.However,for the high rate of repetitive work,it is desirable to use the powerful database to reduce the burden of theheavy work.Based on this,this paper proposes a translation memory system based on syntax and semantics.Firstly,after analyzing the sentence similarity,this paper studies the algorithm of similarity based on WordNet technology,and then designs the memory database.Finally,it makes a detailed study on the system.This system will be applied to the actual experiment and translation practice,the results show that the system can greatly avoid the process of translation of the same sentence,therefore,improve the speed of translation and savetime.

translation memory;similarity;WordNet

TM933.4

A

1674-6236(2016)21-0024-03

2015-12-18稿件編號:201512201

陜西省社會科學基金項目(13K045);咸陽師范學院2013年專項科研基金項目(13XSYK037);陜西省教育廳專項科研計劃項目(14JK1781)。

汪美俠(1977—),女,陜西咸陽人,碩士研究生,講師。研究方向:英語教學與英語翻譯。

主站蜘蛛池模板: 人妻精品久久久无码区色视| 91热爆在线| 国产人人干| 国产女人在线视频| 亚洲精品午夜天堂网页| 欧美一级一级做性视频| 国产91透明丝袜美腿在线| 天天综合网在线| 亚洲美女一级毛片| 久久精品人妻中文系列| 国产成人av大片在线播放| 国产手机在线观看| lhav亚洲精品| 91精品视频在线播放| 亚洲成aⅴ人片在线影院八| 国产男女免费完整版视频| 成人免费午夜视频| 亚洲娇小与黑人巨大交| 国内老司机精品视频在线播出| 午夜视频在线观看免费网站| 国产午夜一级淫片| 57pao国产成视频免费播放| 高清无码手机在线观看| 免费看a毛片| 亚洲成a人片在线观看88| 最新亚洲av女人的天堂| 国产欧美日本在线观看| 精品無碼一區在線觀看 | 国产日韩精品欧美一区灰| 亚洲黄色成人| 成人国产三级在线播放| 色综合久久综合网| 日韩欧美视频第一区在线观看| 国产精品主播| 色婷婷久久| 亚洲综合一区国产精品| 亚洲午夜18| 国产网友愉拍精品视频| 亚洲综合日韩精品| 精品成人一区二区三区电影| 国产精品成人一区二区不卡| 国产国产人在线成免费视频狼人色| 国产一在线观看| 日本国产在线| 国产欧美在线观看视频| 四虎国产精品永久一区| 在线观看国产精品第一区免费 | 嫩草国产在线| 97se亚洲综合在线| 亚洲久悠悠色悠在线播放| 欧美在线视频不卡| 欧美综合中文字幕久久| 久久午夜夜伦鲁鲁片无码免费| 男女猛烈无遮挡午夜视频| 免费av一区二区三区在线| 亚洲三级网站| 亚洲va视频| 亚洲色图欧美| 国产欧美亚洲精品第3页在线| 欧美国产综合视频| 性欧美在线| 最新国产午夜精品视频成人| 香蕉国产精品视频| 日韩欧美国产三级| 一级毛片免费不卡在线视频| 欧美激情福利| AV熟女乱| 久久综合色88| 福利一区在线| 国产成人狂喷潮在线观看2345| 久久永久精品免费视频| 色综合天天综合| 欧美啪啪一区| 91亚洲视频下载| 亚洲三级片在线看| 伊人久久精品无码麻豆精品| 日韩免费中文字幕| 亚洲欧美天堂网| 欧美啪啪一区| 天堂网亚洲系列亚洲系列| 在线国产欧美| 亚洲婷婷在线视频|