999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

谷歌神經(jīng)翻譯器英譯漢過程中的詞義排歧問題

2019-04-29 06:29:18
福建質(zhì)量管理 2019年9期
關(guān)鍵詞:文本

(四川大學 四川 成都 610207)

一、背景介紹

機器翻譯這個話題在翻譯界備受關(guān)注,人工智能的應(yīng)用使得機器翻譯輸出的譯文質(zhì)量大有提升。因此譯者應(yīng)該充分認識到機器翻譯的重要性,了解機器翻譯并讓其為我們所用。提升機器翻譯譯文質(zhì)量面臨的一大挑戰(zhàn)便是詞義排歧,一個機器翻譯軟件譯文質(zhì)量的好壞基本取決于其詞義排歧的能力。許多學者們也著眼于此,期望提升翻譯器的詞義排歧能力。

功夫不負有心人,機器翻譯在某些領(lǐng)域的排歧能力已可媲美人工翻譯,例如實時天氣預(yù)報、金融新聞報道以及軟件本地化手冊。于2016年發(fā)布的谷歌神經(jīng)翻譯器也在詞義排歧問題上有了重大突破。據(jù)谷歌發(fā)表的論文稱,比起之前基于短語的翻譯器,谷歌神經(jīng)翻譯器在很多語言對翻譯中平均減少了60%的錯誤率,與人工翻譯結(jié)果越來越接近。雖然它還是會出現(xiàn)一些人工翻譯不會出現(xiàn)的問題,在排歧方面也還不盡完美,但考慮到語篇的組成成分,歧義在一定程度總是伴隨著語篇存在的。而且開發(fā)機器翻譯的初衷是為了輔助譯者更高效地進行翻譯工作,而不是為了取而代之。多數(shù)翻譯工作者仍將會是機器翻譯詞義排歧能力提升的受益者。

二、研究目的及方法介紹

本文選取了數(shù)個文本來探索谷歌神經(jīng)翻譯器在排歧方面的表現(xiàn)及錯誤規(guī)律,通過對比分析推論出其所擅長翻譯的文本類型,并提出一些可行的方法來提升其詞義排歧的表現(xiàn)。基于在該領(lǐng)域應(yīng)用機器翻譯的可行性和實用性的現(xiàn)實考量,本文所選取文本為商務(wù)信函和商務(wù)合同。商務(wù)文本專業(yè),嚴謹,凝練和實用的特點奠定了運用機器翻譯的基礎(chǔ)。既然要分析譯文質(zhì)量,便要有一套可量化的分析標準,學界提出了多種用于分析譯文質(zhì)量的標準,例如豪斯的翻譯質(zhì)量評估模式。但考慮到此處是用于分析機器翻譯譯文質(zhì)量,簡單的分析標準便足夠。因此本文融合了嚴復(fù)所提出的“信達雅”以及奈達所提出的“功能對等”理論。由于商務(wù)文本的目的是準確專業(yè)地傳達譯文信息,因此結(jié)合其翻譯目的,本文用于分析谷歌神經(jīng)翻譯器英文質(zhì)量的標準為“信”,“達”,以及“術(shù)語對等”。

三、歧義與詞義排歧

歧義是自然語言中存在的普遍現(xiàn)象。對機器翻譯來講,如果處理不好詞義排歧問題,那么輸出譯文的質(zhì)量肯定是堪憂的。在英譯漢過程中,我們面對的歧義主要分為兩大塊:語義歧義和句法歧義(楊良生,1994)。語義歧義主要來源于詞義選擇問題,可進一步分為詞匯歧義和語法歧義。而機器翻譯主要處理的是詞匯層面的歧義。

機器翻譯技術(shù)已現(xiàn)世60多年。而詞義排歧問題仍是制約其發(fā)展的瓶頸。詞義排歧這一概念是由Weaver在一場機器翻譯大會上首次提出的。他指出,若要使機器習得人類辨別詞語歧義的能力,那么機器必須要會如何在特定語境下選擇某一詞匯的正確含義。語境是影響機器詞義排歧性能的最主要因素。國內(nèi)外學者提出了多種模型來解決詞義排歧問題。有的模型在進化過程中被淘汰了,例如最大頻率法(most frequency approach)和選擇限制法(selectional restriction approach),有的模型經(jīng)歷了時間的考驗留存了下來,例如基于語料庫法(corpus-based approach)以及統(tǒng)計法(statistic methods)(馮志偉,2004)。

谷歌神經(jīng)翻譯器的詞義排歧模型為監(jiān)督式學習法,通過引入人工智能技術(shù),將文本標記并經(jīng)過一系列試錯過程來提升其譯文質(zhì)量。這便是所謂的深度學習。機器將通過反芻被標記的文本,達到修正輸出譯文質(zhì)量的目的。

四、結(jié)果及分析

(一)商務(wù)信函排歧錯誤規(guī)律分析

商務(wù)信函是與商業(yè)伙伴建立聯(lián)系的一種方式。它比日常收發(fā)的電子郵件更為正式。但是,它的正式度又次于商業(yè)合同。商務(wù)信函特點是簡潔凝練,較為專業(yè),使用商業(yè)術(shù)語,但應(yīng)注意其禮貌用法。

筆者選擇了3封商務(wù)信函,一封用于建立業(yè)務(wù)關(guān)系,一封用于詢盤,一封用于報價。對比譯本為人工翻譯的正確版本和谷歌神經(jīng)翻譯器處理的譯本。收集數(shù)據(jù)階段,本文作者對所選文本按句子數(shù)量進行了標注,以便追溯出錯之處。但由于本論文篇幅有限,具體的數(shù)據(jù)結(jié)果無法一一列舉。文章將直接呈現(xiàn)總體的錯誤數(shù)量及其類別。錯誤類別按照英文詞性以及商務(wù)文件術(shù)語劃分為名詞排歧錯誤、動詞排歧錯誤、形容詞排歧錯誤、術(shù)語排歧錯誤、代詞排歧錯誤、介詞排歧錯誤以及短語排歧錯誤。

在商務(wù)信函中選出了57個單詞和短語,谷歌神經(jīng)翻譯正確的為8個,錯誤分別為12個名詞,9個動詞,8個形容詞,7個術(shù)語,5個代詞,4個介詞,4個短語。

名詞排歧錯誤與單詞的一詞多義密不可分,谷歌在特定語境中沒有選擇出正確的單詞含義;動詞排歧錯誤主要與文本本身的流暢性和全面性有關(guān),谷歌翻譯的版本讓人很費解;形容詞排歧錯誤是由于語境疏忽而造成的;介詞排歧錯誤是谷歌無法確定介詞在句中的成分;谷歌由于缺乏商業(yè)知識背景而造成了商業(yè)領(lǐng)域常見的代詞,術(shù)語和短語的排歧錯誤。

(二)商務(wù)合同排歧錯誤規(guī)律分析

商業(yè)合同具有法律約束力,專業(yè)度和嚴謹度高,結(jié)構(gòu)復(fù)雜,夾雜各種長難句和復(fù)合句。語言特點正式,使用商業(yè)術(shù)語,古英語,如“hereby,hereunder,and thereafter”。因此,合同翻譯需要大量商務(wù)領(lǐng)域的知識。出于同樣的原因,如果機器可以習得商業(yè)方面的知識,它將有可能比人工翻譯更加高效。

本文節(jié)選了一些商務(wù)合同片段,對比譯本為人工翻譯的正確版本和谷歌神經(jīng)翻譯器處理的譯本。收集數(shù)據(jù)階段,本文作者對所選文本按句子數(shù)量進行了標注,以便追溯出錯之處。但由于篇幅有限,本文將直接呈現(xiàn)總體的錯誤數(shù)量及其類別。

在商務(wù)合同中選擇了82個單詞和短語,其中谷歌神經(jīng)翻譯正確的為17個。排歧錯誤分別為16個名詞,9個動詞,8個術(shù)語,6個短語,7個形容詞,5個副詞,4個數(shù)字表達,4個古英語,2個介詞,2個連詞和2個代詞。

名詞排歧錯誤主要與詞語本身一詞多義的特點及其在商業(yè)合同中的恰當含義有關(guān),其中谷歌翻譯的版本未能識別詞語在特定的語境下的正確含義,并且達不到商業(yè)合同所要求的正式度;動詞排歧錯誤主要與單詞本身含義不定和文本本身的全面性有關(guān),谷歌翻譯的版本完全錯誤,或與商業(yè)合同的背景不符;形容詞排歧錯誤也是對合同背景知識的缺乏造成的;介詞排歧錯誤在于谷歌無法確定介詞在句中的作用,它便直接略譯了此類介詞;商業(yè)合同領(lǐng)域的代詞,術(shù)語,古英語的排歧錯誤主要在于谷歌商業(yè)知識的缺乏。

(三)分析對比結(jié)果

為了便于更直接的對比兩類文本的排歧錯誤,筆者制作了以下圖表:每個排歧錯誤率的計算方法為該類排歧錯誤數(shù)除以詞語及短語總量。

排歧錯誤率(%)名詞 動詞 術(shù)語形容詞代詞副詞數(shù)字連詞介詞古英語正確短語商務(wù)信函21.015.812.314.08.80007.0014.07.0商務(wù)合同19.510.89.89.82.46.14.92.42.44.920.77.3總計20.112.910.810.85.03.62.91.44.32.918.07.2

通過對比分析發(fā)現(xiàn),兩種文本類型的排歧錯誤存在相似之處:

商業(yè)信函和合同中名詞和動詞排歧錯誤率都屬最高;排歧錯誤主要出現(xiàn)在實義詞中:名詞,動詞,形容詞和代詞,因為實義詞是文本用于傳達信息的主要手段。由于缺乏術(shù)語消歧能力,信函和合同的術(shù)語排歧錯誤率都相對較高。例如,商業(yè)信函中的“quote,enquiries 和 By L/C at sight”應(yīng)翻譯成“報價,詢價,即期信用證”,而在商業(yè)合同中,“documents,negotiation / collection”應(yīng)該翻譯成“單據(jù),議付/托收”。

兩種類型的排歧錯誤也存在差異:

不同類型的文本中收集的排歧錯誤詞表現(xiàn)出不同的特征。商務(wù)信函中的排歧錯誤較為簡短,商務(wù)合同出現(xiàn)的排歧錯誤較為冗長復(fù)雜,這是兩者現(xiàn)實句子結(jié)構(gòu)差異造成的,商務(wù)信函用于業(yè)務(wù)往來,清晰和簡潔是關(guān)鍵;商業(yè)合同用于名列法律陳述,需要注重形式和細節(jié),復(fù)雜的長難句是常態(tài),使得谷歌難以識別語句序列,從而影響谷歌翻譯在兩類文本中的排歧表現(xiàn)。

分析上表可知,商業(yè)合同的詞語排歧準確率為20.7%略高于商業(yè)信函的14.0%,這是因為谷歌擅長具有一定規(guī)律性的文本的詞義排歧,盡管合同句子結(jié)構(gòu)復(fù)雜,但有規(guī)律可循,所以谷歌神經(jīng)翻譯器能夠在其數(shù)據(jù)庫中找到匹配的語義;與商業(yè)合同相比,商務(wù)信函正式度大大降低,因此谷歌數(shù)據(jù)庫中可能無法查找出完全匹配的語義。

就術(shù)語排歧而言,谷歌在商業(yè)合同語境中的排歧正確率較高,因為商業(yè)合同創(chuàng)造了更加商業(yè)化的語境,相比之下,商業(yè)信函的語境更難確定,使谷歌對術(shù)語的排歧能力降低。因此可以推論,谷歌更擅長專業(yè)性較強文本的語義排歧。

代詞排歧錯誤與商務(wù)信函的禮貌原則有關(guān)。因此,信函中使用的代詞,例如“you,your”應(yīng)該翻譯成“貴公司,貴方”,而不是“您,您的”。相較而言,商業(yè)合同中的代詞錯誤沒有這樣的特征。

就副詞和形容詞排歧錯誤而言,多數(shù)錯誤是由于谷歌未能識別單詞在特定語境中的正確含義。這其中仍然有一些規(guī)律可循,例如,單詞“any”的排歧錯誤中出現(xiàn)了4次,而形容詞總共的排歧錯誤為7個,同一句子中出現(xiàn)的相同錯誤不予考慮。多數(shù)情況下,谷歌都無法進行有效正確的排歧。

就介詞排歧錯誤而言,谷歌的漏譯便是錯誤的根源。在商務(wù)信函中的4個介詞排歧錯誤中,有3個是由漏譯引起的,而合同中的2個介詞排歧錯誤都是由于漏譯造成的。此外,在排歧錯誤中還出現(xiàn)了文本特定的錯誤,例如商業(yè)合同特有的古英語詞和數(shù)字錯誤。

五、結(jié)論

根據(jù)上述論證、比較和分析,本文得出一個明確的結(jié)論:谷歌神經(jīng)翻譯器更擅長專業(yè)性強的文本語境下的詞義排歧。谷歌在不同詞性詞義排歧中表現(xiàn)出不同的規(guī)律。因此研究者可以通過加強谷歌對邊緣語境的識別能力以及增加對介詞用法訓練的語料庫,來提升谷歌神經(jīng)翻譯的詞義排歧性能。

這項研究仍有其局限性。由于時間和空間不足,本文的分析樣本受到限制。因此,論文可能不足以用來推翻當前的機器翻譯系統(tǒng)。但是,筆者希望學界能夠?qū)Υ诉M行深入研究,改善商務(wù)文本英譯中的譯本質(zhì)量問題。

猜你喜歡
文本
文本聯(lián)讀學概括 細致觀察促寫作
重點:論述類文本閱讀
重點:實用類文本閱讀
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
作為“文本鏈”的元電影
在808DA上文本顯示的改善
“文化傳承與理解”離不開對具體文本的解讀與把握
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
從背景出發(fā)還是從文本出發(fā)
語文知識(2015年11期)2015-02-28 22:01:59
主站蜘蛛池模板: 国内嫩模私拍精品视频| 欧美不卡视频在线| 国产精品国产三级国产专业不| a级毛片一区二区免费视频| 精品久久综合1区2区3区激情| 第九色区aⅴ天堂久久香| 日本五区在线不卡精品| 国产成人一区| 国产成人狂喷潮在线观看2345| 九九视频免费在线观看| 亚洲男人的天堂在线观看| 免费99精品国产自在现线| 精品国产黑色丝袜高跟鞋| 人妻丰满熟妇αv无码| 免费女人18毛片a级毛片视频| 久久综合色天堂av| 丁香五月婷婷激情基地| 无码精油按摩潮喷在线播放| 国产成人精品午夜视频'| 亚洲精品动漫| 久久久精品无码一区二区三区| 天堂成人在线视频| 亚洲午夜久久久精品电影院| jizz国产视频| 成年女人a毛片免费视频| av手机版在线播放| 亚洲V日韩V无码一区二区 | 国产成人成人一区二区| 免费播放毛片| 9丨情侣偷在线精品国产| 亚洲av成人无码网站在线观看| 日韩视频免费| 久久亚洲精少妇毛片午夜无码| 成人韩免费网站| 国产在线高清一级毛片| 伊在人亞洲香蕉精品區| 又污又黄又无遮挡网站| 免费在线a视频| 日韩中文无码av超清| 中文字幕无码av专区久久| 老司机久久99久久精品播放| 欧美亚洲第一页| 亚洲欧美日本国产综合在线 | 欧美在线视频不卡第一页| 亚洲天堂在线视频| 亚洲AⅤ波多系列中文字幕 | 99精品福利视频| 91av国产在线| 日本精品影院| 久久99国产精品成人欧美| 九色视频一区| 夜精品a一区二区三区| 国产女主播一区| 久久a毛片| 久久婷婷五月综合97色| 香蕉视频在线精品| 久久精品一品道久久精品| 国产成人永久免费视频| 无码 在线 在线| 欧美三级不卡在线观看视频| 国产v欧美v日韩v综合精品| 亚洲网综合| 久久五月视频| 国产精品无码一区二区桃花视频| 亚洲精品视频免费观看| 欧美中文一区| 狠狠色综合网| 欧美国产视频| 91高清在线视频| 老司机精品久久| 四虎在线观看视频高清无码| 国产一区二区三区在线观看免费| 欧美一区二区三区香蕉视| 亚洲香蕉伊综合在人在线| 亚洲精品视频免费| 欧美另类图片视频无弹跳第一页| 2022国产91精品久久久久久| 亚洲无码在线午夜电影| 高清欧美性猛交XXXX黑人猛交| 国产麻豆永久视频| 青青草原国产av福利网站| 欧美人在线一区二区三区|