999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學術文本機器翻譯錯誤探析

2023-05-31 22:49:07謝曉璐
今古文創 2023年15期

【摘要】使用YiCAT翻譯平臺中的機器翻譯引擎將《神經機器翻譯》第一章的第一部分譯成漢語,以此翻譯結果為研究對象,總結出現頻率較高的機器翻譯錯誤類型,如在詞匯層面的術語翻譯錯誤、多義詞誤譯、詞性錯譯,句法層面的語序錯誤、從句錯譯、欠譯,篇章層面的缺少銜接和邏輯混亂問題,并在此基礎上提出改進方法,對機器翻譯錯誤提出解決對策,以期為今后學術文本機器翻譯譯后編輯研究提供借鑒。

【關鍵詞】學術文本;機器翻譯;錯誤探析;譯后編輯

【中圖分類號】H315? ? ? ? ? ? 【文獻標識碼】A? ? ? ? ? ?【文章編號】2096-8264(2023)15-0113-03

【DOI】10.20024/j.cnki.CN42-1911/I.2023.15.036

近年來,隨著大數據、人工智能等技術的發展,機器翻譯逐漸成為關注的焦點。機器翻譯是“使用計算機系統將文本或語音從一種自然語言自動翻譯為另一種語言”[1]。但機器翻譯的質量無法讓人滿意,且在垂直領域僅依靠機器翻譯難以產出高質量譯文,因而譯后編輯環節必不可少[2]。本文選取的原文本屬于學術文本,學術著作屬于科學語言,它的功能是記錄科學活動和學術思想,科學活動和學術思想的顯著特點是概括性和抽象性,因此,相對于其他文本來說,學術著作的翻譯在學術性方面提出了很高的要求[3]。近幾年機器翻譯越來越多地參與到學術文本的翻譯過程中,相關研究也逐漸增多。因此運用計算機輔助翻譯是翻譯學術文本的一大趨勢。筆者借助YiCAT翻譯平臺,采用Tencent TranSmart交互式機器翻譯,以學術文本的機器翻譯譯文為例,總結學術文本機器翻譯結果的高頻錯誤,分析譯文存在的問題并提出解決辦法。

一、文獻綜述

國外對機器翻譯質量研究已經有60多年的歷史,例如:Garcia的Translating by post-editing:is it the way forward?Fiederer R和OBrien S的Quality and machine translation: A realistic objective。國外學者對譯后編輯的研究有近20多年的歷史,主要針對英德、英法互譯等。

國內對該領域的研究也取得了一定的進展,例如:崔啟亮、馮全功的《譯后編輯研究:焦點透析與發展趨勢》總結了譯后編輯的研究現狀,預測其趨勢,為學界提供參考,但是,譯后編輯在具體領域的應用研究鮮有談及[4],且機器翻譯系統對不同文本給出的譯文質量也存在差異。比較典型的研究有羅季美和李梅的《機器翻譯譯文錯誤分析》,李梅和朱錫明的《英漢機譯錯誤分類及數據統計分析》對汽車技術文獻的英漢機器翻譯錯誤進行歸類分析。

從上述研究分析可以看出,目前對機器翻譯學術文本的錯誤研究相對較少,本文將在對相關錯誤類型進行分析的基礎上,提出相應的解決辦法,以期提高學術文本譯后編輯的質量。

二、理論基礎:譯后編輯

譯后編輯是“檢查和修正機器翻譯的輸出”[1],是指根據特定的目的對機器翻譯的原始產出進行加工與修改的過程,包括更改翻譯(語言)錯誤、提高機譯產出的準確性與可讀性等[5]。就目前機器翻譯技術來說,自動翻譯生成的譯文質量對于參照原文進行理解一般還可以做到,但是還難以達到直接輸出譯文稿而無需人工潤色的質量,所以后編輯處理在很多情況下必須使用[6]。

三、機器翻譯錯誤類型及分析

本章著重分析使用YiCAT翻譯工具過程中遇到的機器翻譯錯誤,主要從詞匯、句法、語篇這三個層面闡述。

(一)詞匯層面

1. 術語翻譯錯誤

例1原文:Fluency also involves picking the right content words when there are several possible synonyms available.

機器譯文:流利還包括在有幾個可能的同義詞可用時選擇正確的內容詞。

譯后編輯:流暢性還包括在有很多同義詞的情況下選擇正確的實詞。

分析:學術文本中的術語較多,語義豐富,涉及的領域專業性較強,某些詞匯既可以作為一般詞匯又可以作為術語,而機器翻譯系統有時難以辨別一般詞匯和專業詞匯。“content words”這個術語翻譯錯誤,機器翻譯沒有采用通用譯法,機器譯文不符合英文表達習慣,通過查詢術語在線網(http://www.termonline.cn),確定將該術語譯為“實詞”,符合學術文本中術語翻譯的準確性。

2. 多義詞誤譯

例2原文:Four score and seven years is not just any way to say 87 years.

機器譯文:四分七年不是隨便說的87年。

譯后編輯:八十七年不是隨便說的87年。

分析:同一個單詞或短語經常有多種理解,多義詞識別是自然語言處理中一個較難解決的問題。這里score不表示“分數”,而是“二十”的意思。譯員在處理一詞多義的問題時會根據上下文或具體語境選擇恰當的含義,而機器翻譯系統目前雖然具備一定的語境處理能力,但此例的語境有些難處理,原因在于score作為“分數”義與years都是名詞,且前面都有數詞,很容易理解為兩個并列的名詞結構,score作為分數義,前面也多跟數詞,對于機器翻譯來說很難辨認,如此機器處理起來困難很大。由于計算機自身存在局限性,不能像人腦一樣靈活思考,在結合具體語境對文章進行分析的能力上還不足,往往會選用出現次數最多的那個單詞意思,不能選擇恰當的表達,容易出錯。

3. 詞性錯譯

例3原文:There is an extensive proliferation of tool kits available for research, development,and deployment of neural machine translation systems.

機器譯文:可用于神經機器翻譯系統的研究、開發和部署的工具包廣泛擴散。

譯后編輯:有大量的工具包可用于神經機器翻譯系統的研究、開發和部署。

分析:在英譯漢的過程中,我們一般會遵循漢語動詞優勢,將英語中的名詞或名詞詞組譯為漢語中的動詞,但這要視情況而定,在翻譯某些詞匯時須保留其本來的詞性。此例中,proliferation作為名詞有“擴散、激增、大量的事物”等含義,在短語a proliferation of中意為“大量的”,而機器在處理該情況時無法辨別,從而錯譯。此處仍需將proliferation看作名詞短語中的一部分,不改變詞性來翻譯。

(二)句法層面

1. 語序錯誤

例4原文:The data- driven methods that I discuss in this book are not able to match this performance.Yet.

機器譯文:我在本書中討論的數據驅動方法無法達到這種性能。還沒有。

譯后編輯:但是,我在本書中討論的數據驅動方法無法達到這種性能。

分析:可以看出機器譯文在語序安排上出了問題,不能使上下文合理銜接。Yet單獨成句放在句尾,表轉折,意為“但是”,然而英語和漢語的表達方式不同,漢語主要通過詞序反映詞義,根據漢語的邏輯思維和表達習慣,“但是”往往位于小句句首,此處需根據句子結構和內容,在形式上調整語序,作出變通,將Yet置于前面翻譯,從而體現本句的邏輯層次,以符合漢語的行文表達習慣。

2. 從句錯譯

例5原文:Anybody who can read this book will be able to build a machine translation system that is comparable to the state of the art.

機器譯文:任何人誰可以閱讀這本書將能夠創建一個機器翻譯系統,可以與現有技術相媲美。

譯后編輯:任何讀過這本書的人都將能夠建立一個機器翻譯系統,可以與現有技術相媲美。

分析:機器譯文的前半部分有誤,機器翻譯系統沒有結合從句中的成分對應分析,只是按照原文順序,逐個將單詞的含義翻譯出來,沒有考慮到這是定語從句,未注意到定語從句和所修飾詞“anybody”的關系密切,導致譯文松散。此處應該將“who”作為定語從句的引導詞,修飾前面的“anybody”,不必譯出具體含義。雖然機器翻譯系統多數情況下可以識別定語從句進行轉換,但有時還會出錯,說明機器翻譯系統存在不穩定性仍需改進。

3. 欠譯

例6原文:But there is more going on here.

機器譯文:但這里還有更多的事情。

譯后編輯:但對于這個問題還有很多需要闡述的內容。

分析:由于英漢語言表達的差異,翻譯時容易出現語義空缺,機器翻譯系統沒有擺脫原文的句法結構,僅逐字一對一地翻譯,使得譯文表達不通順,脫離語境。另外原文屬于學術文本,語言凝練,但機器譯文不符合學術文本的規范,不切合學術文本的語體,沒有傳達出原文的基本信息,未表達出作者要繼續解釋說明的意思。通過聯系上下文,可以發現本句有承上啟下的作用,是要對上文內容作補充,因此不能只翻譯字面意思,而應將語義具體化,將作者想要說明的關鍵內容表達出來,使譯文具有可讀性,讓讀者清楚地理解原文含義。

(三)語篇層面

1. 缺少銜接

例7原文:The biggest obstacle to data-driven methods is sparsity.And it is worse than you may think.

機器譯文:數據驅動方法最大的障礙是稀疏性。比你想象的還要糟糕。

譯后編輯:數據驅動方法最大的障礙是稀疏性,這比你想象的還要糟糕。

分析:原文中And表示遞進關系,是表達邏輯關系的手段,機器譯文漏譯and和it,使譯文中前后兩句的銜接顯得生硬,譯后編輯運用指示的方法,用“這”表示前面提及的事情,使語篇連貫。

2. 邏輯混亂

例8原文:So,a professional translator may decide to render this as the popular German news weekly Der Spiegel reported.

機器譯文:因此,一個專業的翻譯可能會決定翻譯這一點,因為受歡迎的德國新聞周刊《明鏡周刊》報道。

譯后編輯:因此,一個專業譯員可能會決定按照德國著名新聞周刊《明鏡周刊》報道的那樣,將其譯為《紐約時報》,而非美國報紙《紐約時報》。

分析:語言的邏輯缺層是指不符合常規邏輯推理的語言表達,即在行文中沒有形成完整的邏輯鏈[7]。此處機器翻譯系統沒有正確理解as的含義,擾亂邏輯層次,從而造成整句邏輯關系混亂,難以理解。這里as意為“按照……的方式”。機器譯文具有模糊性,讀者可能不清楚是按照《明鏡周刊》報道的要求來翻譯還是按照報道風格來翻譯,具有歧義,結合上文提到的“據《明鏡周刊》報道,直譯可能會使美國讀者對原文的可靠性產生懷疑”,為避免歧義,筆者做出修改,采用釋義的方式來翻譯。

四、未來建議

(一)優化機器翻譯系統

在未來,機器翻譯系統應努力朝向結合語境分析原文的方向發展,逐步解決機器翻譯中的文化干擾問題,盡量擴大機器翻譯系統所用的雙語數據資源,小牛翻譯創始人朱靖波表示要從少量數據中提高機器學習的泛化能力,解決數據稀缺的問題;從數據驅動擴展到知識驅動。

(二)實現人機結合

雖然機器翻譯技術已經向各個領域逐步深入,節省了人力和時間,但是其譯文質量仍有待提高,機器翻譯并不能完全替代人工翻譯,理想的做法是實現人機結合。首先,譯前編輯不可忽視,對提高譯文質量發揮著重要的作用。譯前編輯是對句式、標點、詞匯等作出適當調整,旨在盡可能降低機譯的錯誤譯文,提高機器譯文準確度,其主要手段是:拆分長句、調整語序、代詞替換、消除歧義、增刪句子成分、同義詞替換等[8],使機器翻譯系統更好地識別和理解源語的含義。

再使用機器系統處理基本的工作,使譯員對原文本的大意有基本的了解,再譯后編輯,修改錯誤,逐步分析,進行譯文的完善工作,提高譯文質量和工作效率。另外,建立并不斷擴充術語庫及語料庫,豐富語料資源,以提高匹配度。如此,將譯前和譯后的工作相結合,發揮機器翻譯和人工翻譯各自的優勢,取長補短,減輕工作量,提高譯文質量。

(三)提高譯員素養,重視語言學研究

譯員要有準確、快速發現機器翻譯錯誤的能力,并能有針對性地提出修改建議。充分掌握源語和目標語,具備雙語能力和轉換文本的能力,實現英漢雙語熟練轉換。除了具備外語能力,對其他領域的專業知識也要有所涉獵。要重視對計算機語言學領域的研究,只依靠技術完善并不能從根本上解決機器翻譯錯誤的問題,但在實際的研究過程中,人們的關注點往往在計算機性能創新和優化方面,從而忽視了計算機語言學方面的相關問題[9]。加大對語言學和翻譯學方面的研究,培育語言學方面的人才,通過各方面人才的努力,推進翻譯工作。

五、結語

綜上所述,本文對學術文本的機器翻譯英譯漢文本進行分析,總結錯誤類型,并認識到隨著市場需求的增加,翻譯技術的進步,機器翻譯的譯后編輯在語言服務實踐中發揮著越發重要的作用,為了發揮機器翻譯的高效率,人工翻譯的高質量,應該將機器翻譯、人工譯后編輯結合起來,而這將會是未來翻譯發展的一大趨勢。為此,我們需要不斷總結機器翻譯錯誤,加強譯后編輯領域的研究和應用,合理選擇譯后編輯策略,不斷改進譯后編輯工作。相信日后機器翻譯技術會繼續發展完善,譯文準確度會日益提高。

參考文獻:

[1]崔啟亮.論機器翻譯的譯后編輯[J].中國翻譯,

2014,35(06):68-73.

[2]郭望皓,胡富茂.神經機器翻譯譯文評測及譯后編輯研究[J].北京第二外國語學院學報,2021,(05).

[3]劉英.英語學術著作的漢譯策略[J].中國科技翻譯,2014,(02):8-11.

[4]馮全功,崔啟亮.譯后編輯研究:焦點透析與發展趨勢[J].上海翻譯,2016,(06):67-74.

[5]吳萍.外宣翻譯的譯后編輯[J].海外英語,2018,(13):133-134.

[6]趙鐵軍等.機器翻譯原理[M].哈爾濱:哈爾濱工業大學出版社,2000:9-10.

[7]吳迪龍.科技英語文章中的邏輯偏移及其漢譯處理[J].中國科技翻譯,2015,(4):1-4.

[8]馮全功,李嘉偉.新聞翻譯的譯后編輯模式研究[J].外語電化教學,2016,(06):74-79.

[9]安帥飛,邵楨貽.漢英小說體機器翻譯評測分析[J].文學教育(上),2019,(07):136-137.

作者簡介:

謝曉璐,女,山東煙臺人,青島大學外語學院在讀碩士研究生,研究方向:英語筆譯。

主站蜘蛛池模板: 99精品这里只有精品高清视频| 无码粉嫩虎白一线天在线观看| 欧美精品色视频| 国产美女自慰在线观看| 无码福利日韩神码福利片| 中文无码伦av中文字幕| 国产尤物jk自慰制服喷水| 无码中文字幕加勒比高清| 伊人网址在线| 在线观看精品自拍视频| 亚洲福利一区二区三区| 久久情精品国产品免费| 久久精品免费看一| 色哟哟色院91精品网站| 国产69囗曝护士吞精在线视频| 婷婷激情五月网| 欧美亚洲欧美| 精品国产自在现线看久久| 欧美在线视频不卡| 免费jjzz在在线播放国产| 丝袜亚洲综合| 欧洲精品视频在线观看| 久久香蕉国产线看观看精品蕉| 欧美一级在线| 国产成人综合久久精品下载| 亚洲欧美成人影院| 欧美黄网站免费观看| 欧美自慰一级看片免费| 国产免费网址| 国产美女主播一级成人毛片| 久久久久亚洲AV成人网站软件| 日本免费福利视频| 欧美特级AAAAAA视频免费观看| 伊人成色综合网| 国产成人无码播放| 亚洲资源站av无码网址| 久久久久亚洲Av片无码观看| 国产理论精品| 久久一色本道亚洲| 亚洲美女一级毛片| 五月激情综合网| 精品无码人妻一区二区| 国产成人精品一区二区| 日本日韩欧美| 老司国产精品视频91| 亚洲经典在线中文字幕| 成人无码区免费视频网站蜜臀| 亚洲中文字幕久久无码精品A| 日韩精品一区二区三区免费在线观看| 中文字幕亚洲电影| 国产香蕉97碰碰视频VA碰碰看| 国产嫩草在线观看| 婷婷六月在线| 欧美亚洲网| 亚洲欧洲天堂色AV| 国产精品蜜芽在线观看| 午夜日本永久乱码免费播放片| 日本精品一在线观看视频| 日韩欧美网址| 欧美成人日韩| 伊人久久精品无码麻豆精品| 久久天天躁夜夜躁狠狠| 国产精鲁鲁网在线视频| 亚洲国产日韩在线观看| a色毛片免费视频| 亚洲中文字幕日产无码2021| 亚洲伊人久久精品影院| 一级毛片在线免费视频| 99久视频| 欧美成人区| 萌白酱国产一区二区| 亚洲精品在线观看91| 国产精选小视频在线观看| 高清码无在线看| 97se亚洲综合在线韩国专区福利| 国产精品尤物铁牛tv| 欧美不卡在线视频| 久久精品国产亚洲麻豆| 国产屁屁影院| 国产成人亚洲无吗淙合青草| 中文字幕波多野不卡一区| 成人国产小视频|