999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語料庫的機器翻譯的現(xiàn)狀與前景

2019-08-27 02:33:33鐘媛媛延宏
青年與社會 2019年21期
關(guān)鍵詞:前景

鐘媛媛 延宏

摘 要:文章主要介紹了兩種基于語料庫的機器翻譯方法:基于實例的機器翻譯方法以及基于統(tǒng)計的機器翻譯方法。前者強調(diào)從計算機的角度通過實例推理的手段得到譯文,后者側(cè)重于從數(shù)學(xué)角度建立模型進行翻譯。兩種翻譯方法各有優(yōu)缺點,文章認為基于語料庫的機器翻譯的前景:將不同的翻譯方法取長補短,互相融合,發(fā)展多策略融合式機器翻譯方法,同時加強基于語料庫的機器翻譯方法與其它學(xué)科的融合。

關(guān)鍵詞:語料庫;機器翻譯;基于實例的機器翻譯方法;基于統(tǒng)計的機器翻譯方法;前景

20世紀90年代,計算機技術(shù)與語料庫的建設(shè)取得了長足的發(fā)展。語料庫的作為一種科學(xué)的研究方法被引入翻譯這一領(lǐng)域,標志著機器翻譯的發(fā)展進入一個新紀元。國外關(guān)于語料庫機器翻譯的研究大多具有很強的實踐指導(dǎo)性,我國基于語料庫的機器翻譯研究主要是以研究型的探索為主。目前與語料庫機器翻譯相關(guān)的研究已經(jīng)進入非常具體,專業(yè)的細微領(lǐng)域。文章首先介紹了與機器翻譯相關(guān)的語料庫,基于規(guī)則的機器翻譯以及基于語料庫機器翻譯的兩種方法,對這些方法的優(yōu)缺點分別進行了總結(jié),旨在為研究者呈現(xiàn)一個清晰的語料庫機器翻譯相關(guān)知識的概括和總結(jié),最后,作者指明了語料庫機器翻譯的前景,以期為后來研究者提供借鑒。

一、語料庫與機器翻譯

(一)語料庫

語料庫是指根據(jù)一定的語言學(xué)原則的指導(dǎo),通過隨機抽樣的方法,收集未經(jīng)過任何加工的連續(xù)的語言文字運用文本或者語音片段,在此基礎(chǔ)上建成的一個容量相當?shù)拇笮碗娮游膸臁D壳埃Z料庫在語言教學(xué),語言研究以及語言工程等方面獲得了廣泛的應(yīng)用,具體的應(yīng)用領(lǐng)域主要有語言頻率統(tǒng)計,詞典編纂,詞匯搭配研究,語言教學(xué)以及自然語言處理等。

(二)機器翻譯和基于規(guī)則的機器翻譯方法

機器翻譯是利用計算機技術(shù)的輔助,將一種以一種語言形式存在的聲音或者文字轉(zhuǎn)化為以另一種語言形式存在的文字和聲音(文章主要探討的是機器翻譯的文字翻譯方面)。60年代初,隨著喬姆斯基的“轉(zhuǎn)換生成語法”理論的建立,機器翻譯系統(tǒng)得到迅速發(fā)展,也叫做基于規(guī)則的翻譯方法。基于規(guī)則的機器翻譯的工作原理是:對輸入的源語言進行格式保留處理以及分析,對源語言進行轉(zhuǎn)換,最后根據(jù)目標語的生成規(guī)則生成目標語。基于規(guī)則的機器翻譯的優(yōu)點是規(guī)則可以描述語言的語法構(gòu)成,方便計算機識別。但是,語法規(guī)則的得出需要大量的人力與物力。其次,語法規(guī)則由語法學(xué)家總結(jié)得到,不同的語言學(xué)家對語法規(guī)則的認識可能存在沖突。

除了某些特定的領(lǐng)域,基于規(guī)則的機器翻譯取得了相對較好的效果。但是,機器翻譯依舊沒有達到人類想要的效果。隨著語料庫語言學(xué)的不斷發(fā)展,人們逐漸引入了基于實例和基于統(tǒng)計這兩種與語料庫的應(yīng)用密切結(jié)合的翻譯方法。基于語料庫的機器翻譯迅速發(fā)展,取得了巨大成績。

二、基于語料庫的機器翻譯

(一)用于機器翻譯的語料庫

語料庫依據(jù)不同的標準可以分為不同的類別。與翻譯研究相關(guān)的語料庫有三類:平行語料庫,可比語料庫和多語語料庫。

平行語料庫收集了某種語言的原文本,以及該語言翻譯成另外一種語言的目標語言文本。可比語料庫收集了某種語言的原文,以及從其它語言翻譯成該語言的文本。多語語料庫收集兩個或者多個單語種語料,由這些語料組成復(fù)合語料庫。

(二)基于語料庫的機器翻譯方法

機器翻譯方法分為基于規(guī)則的翻譯方法和基于語料庫的翻譯方法。基于語料庫的翻譯方法又可以分為基于實例的翻譯和基于統(tǒng)計的翻譯。它們的區(qū)別在于:前者語料庫會作為一種翻譯知識參與翻譯,供翻譯主體查詢。后者語料庫的是用來尋找最有可能成為目標語的句子,不進行具體的翻譯實踐。

(1)基于實例的機器翻譯方法

基于實例的機器翻譯方法最早是由日本著名機器翻譯專家長尾真(Nagao Makoto)提出來的。他通過研究日本英語初學(xué)者翻譯句子的過程歸納總結(jié)了機器翻譯的基本原則。他認為人類在翻譯過程中,并不會進行深層的語言學(xué)分析,而是會在已經(jīng)形成的知識庫中盡可能尋找與需要翻譯的句子相似的結(jié)構(gòu),通過類比的手段,得到目標語的譯文。將這一思想運用到機器翻譯中的表現(xiàn)就是:給出待翻譯的句子S,在雙語語料庫中尋找與待翻譯句子最相似的句子V,V的譯文T就是S的譯文。在這一翻譯的過程中,起基礎(chǔ)性作用的一個大型的雙語語料庫。翻譯過程中的相似度計算是決定翻譯質(zhì)量的重要因素。

基于實例的機器翻譯方法主要有三種類型:完全實例,實例句型轉(zhuǎn)換的翻譯以及實例近似翻譯。

就基于實例的這一翻譯方法而言,當前主要存在的技術(shù)方面的問題:在詞匯與短語對齊層次中,如何避免歧義實現(xiàn)正確的對齊;在尋找最相似實例層次中,如何計算相似度,找到最相似,最恰當?shù)膶嵗?如何將已經(jīng)尋找到的實例片段進行有效的組合形成譯文;如何提高翻譯實例的覆蓋率等。

(2)基于統(tǒng)計的機器翻譯方法

基于統(tǒng)計的機器翻譯方法第一次提出是由IBM研究者于1990年左右提出來的。從2002 年開始,美國國家標準技術(shù)研究所(NIST)在美國ARPA的支持下開始開展一年一度的機器翻譯測評工作,基于統(tǒng)計的機器翻譯方法遙遙領(lǐng)先于傳統(tǒng)的基于規(guī)則的翻譯方法。最近幾年,基于統(tǒng)計的機器翻譯方法發(fā)展迅速,逐漸成熟。

基于統(tǒng)計的機器翻譯方法的中心思想:認為目標語中的任何一個句子都有可能是源語言的譯文,而唯一的不同就是它們成為源語言譯文的概率不同,機器翻譯的任務(wù)就是通過計算找出概率最大的句子。這一方法是通過對數(shù)據(jù)庫的分析對比將知識抽象成模型,根據(jù)統(tǒng)計模型來尋找最恰當?shù)淖g文。

基于統(tǒng)計的機器翻譯方法一共包含兩種模型:翻譯模型和語言模型。翻譯模型是用來計算將源語言翻譯成目標語的概率,也就是計算一個指定的語言串翻譯成為另一個語言串可能性。而后者是用來計算已經(jīng)翻譯好的譯文可能出現(xiàn)在目標語中的概率,也就是計算譯文語言串在目標語中存在的合理性。

基于統(tǒng)計的機器翻譯方法中統(tǒng)計模型是直接從語料庫中獲取的,無需人工總結(jié),時間短,效率高。譯文來源于人工語料,表達地道。但是,依據(jù)該方法,翻譯效果極大取決于翻譯模型和語料庫的覆蓋程度,語料難以收集的少數(shù)民族語言翻譯很難運用這一方法。利用統(tǒng)計模型進行翻譯,模型很難反映出句子內(nèi)部的所存在的差異,也無法解釋差異較大的語言之間內(nèi)部的復(fù)雜的結(jié)構(gòu)對應(yīng)關(guān)系,因此,通過這一方法得到的譯文經(jīng)常會出現(xiàn)翻譯腔,譯文晦澀難懂。

三、基于語料庫的機器翻譯的前景

基于統(tǒng)計的機器翻譯方法從語言現(xiàn)象入手,通過相對理性的模型得到譯文。基于實例的機器翻譯方法從機器自身學(xué)習(xí)的角度通過對實例的分析推理得到譯文。每種翻譯方法都存在缺陷。但是,兩種方法互不排斥。基于語料庫的機器翻譯的前景是將各種方法的優(yōu)點有機地結(jié)合起來,進一步提高機器翻譯系統(tǒng)的性能。現(xiàn)在,基于語料庫的機器翻譯的前景就是如何將各種方法各自的優(yōu)點發(fā)揮到最大限度,并將它們有機的結(jié)合起來,從而進一步改善并且提高機器翻譯系統(tǒng)的性能。

基于語料庫的機器翻譯方法的另一個發(fā)展方向在學(xué)科之間的交叉融合上,與自然科學(xué),如神經(jīng)學(xué)科的融合促進機器翻譯的人工智能化,與社會科學(xué),如語言學(xué)和社會文化研究結(jié)合將促進機器翻譯更多的考慮到文化因素的影響。從而,改善基于語料庫的機器翻譯的性能。

參考文獻

[1] 任敬輝.國內(nèi)基于語料庫的翻譯研究綜述(2007-2013)[J].長春師范大學(xué)學(xué)報,2015,34(06):118.

[2] 李也剛,黃河燕,史樹敏,等.多策略機器翻譯研究綜述[J].中文信息學(xué)報,2015,29(02):2.

[3] 戴新宇,尹存燕,陳家俊,等.機器翻譯研究現(xiàn)狀與展望[J].計算機科學(xué),2004,31(11):177.

[4] 馮志偉.基于語料庫的機器翻譯系統(tǒng)[J].術(shù)語標準化與信息技術(shù),2010(01):28-32.

[5] 楊憲澤.機器翻譯的一些處理方法探討[J].西南民族大學(xué)學(xué)報(自然科學(xué)版),2004,30(01)2-3.

[6] 楊憲澤.基于實例的機器翻譯處理方法[J].計算機工程,2003,29(21):51-52.

[7] 楊憲澤.漢英混合式機器翻譯難點研究[J].西南民族大學(xué)學(xué)報(自然科學(xué)版),2016,42(03):304-305.

作者簡介:鐘媛媛(1994.12- ),女,山西忻州人,碩士,研究方向:外國語言學(xué)及應(yīng)用語言學(xué);延宏(1972- ),男,陜西綏德人,副教授,博士,研究方向:科技英語翻譯。

猜你喜歡
前景
化膿灸的應(yīng)用前景分析
我國旅游房地產(chǎn)開發(fā)前景的探討
法德軸心的重啟及前景
四種作物 北方種植有前景
離岸央票:需求與前景
中國外匯(2019年11期)2019-08-27 02:06:32
全球FDI:大幅下降,前景難言樂觀
中國外匯(2019年6期)2019-07-13 05:44:20
“新零售咖啡”前景幾何?
海峽姐妹(2019年1期)2019-03-23 02:42:58
迷你KTV的風(fēng)口前景如何
量子糾纏的來歷及應(yīng)用前景
太空探索(2016年10期)2016-07-10 12:07:01
低蛋白大米的制備方法及應(yīng)用前景
主站蜘蛛池模板: 中日无码在线观看| 一区二区三区成人| 免费毛片在线| 国产福利一区视频| 国内精品小视频在线| 黑色丝袜高跟国产在线91| 曰韩免费无码AV一区二区| 国产在线麻豆波多野结衣| 尤物精品国产福利网站| 婷婷中文在线| 91视频精品| 国产视频欧美| 国产特一级毛片| 67194成是人免费无码| 久草视频一区| 亚洲精品无码久久毛片波多野吉| 狠狠五月天中文字幕| 91久久偷偷做嫩草影院精品| 97在线免费| 五月丁香伊人啪啪手机免费观看| 成人夜夜嗨| 亚洲综合经典在线一区二区| 亚洲一区色| 亚洲欧洲一区二区三区| 香蕉网久久| 久久五月视频| 试看120秒男女啪啪免费| 国产va视频| 国产美女丝袜高潮| 日韩精品一区二区深田咏美| 热久久国产| 日韩色图区| 国产成人啪视频一区二区三区| 99热这里只有精品免费| 精品91自产拍在线| 精品久久久久久成人AV| 潮喷在线无码白浆| 久久人人妻人人爽人人卡片av| 少妇精品久久久一区二区三区| 欧美成人一级| 亚洲a级毛片| 婷婷成人综合| 免费无码又爽又刺激高| 免费国产小视频在线观看| 伊人蕉久影院| 亚洲精品午夜天堂网页| 婷婷午夜影院| 成人第一页| 亚洲人成网18禁| 久久国产精品影院| 成人a免费α片在线视频网站| 99在线视频免费| 在线高清亚洲精品二区| 制服丝袜亚洲| 在线无码九区| 日韩成人午夜| 久久狠狠色噜噜狠狠狠狠97视色| 欧美成人精品一级在线观看| 久久久久免费精品国产| 国产色婷婷视频在线观看| 日本午夜三级| 欧美亚洲另类在线观看| 色屁屁一区二区三区视频国产| 中国国产A一级毛片| 最新国产精品鲁鲁免费视频| 欧美国产在线一区| 亚洲高清中文字幕| 久久精品日日躁夜夜躁欧美| 久久国产精品电影| 97精品久久久大香线焦| 永久免费无码日韩视频| 亚洲色无码专线精品观看| 欧美日本在线播放| 中文字幕av一区二区三区欲色| AV无码无在线观看免费| 国产成人精品男人的天堂下载| 成人小视频网| 亚洲国产综合精品一区| 成人毛片在线播放| 久久这里只有精品免费| 国产美女91呻吟求| 国产系列在线|