999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

神經網絡機器翻譯在地方志中的可用性研究

2024-07-29 00:00:00鄒鑫雨
名家名作 2024年16期

[摘 要] 近年來,人工智能與深度學習技術迅猛發展,機器翻譯步入新的階段——基于神經網絡的機器翻譯。相比之前的機器翻譯,神經網絡機器翻譯在翻譯效率與質量上有所提高,但是仍面臨著許多挑戰,其中一個挑戰是神經機器翻譯在與訓練語料類型相同的文本中能達到良好的翻譯效果,但是一旦跨出該文本類型,翻譯性能就會急劇下降。據此,對目前的主流神經機器翻譯引擎在地方志《祁東縣志(1986—2005)》中的翻譯進行質量評估,旨在通過對比各神經機器翻譯在地方志《祁東縣志(1986—2005)》中的可用性,優選出適用于地方志文本的神經機器翻譯系統,以此為機器翻譯譯后編輯工作者在機器翻譯引擎的選擇上提供參考建議,提高機器翻譯譯后編輯的效率,同時也為神經機器翻譯系統的設計提供優化方向。

[關 鍵 詞] 機器翻譯;翻譯質量;《祁東縣志(1986—2005)》

一、機器翻譯質量研究現狀

就國內而言,筆者在CNKI中國知網——中國標準全文數據庫中分別以“機器翻譯質量評估”“機器翻譯質量評測”“機器翻譯質量評價”“機器翻譯質量估計”為主題進行了4次高級檢索,共得到與本項目研究相關的文章38篇:中文期刊文獻17篇,外文期刊文獻3篇,碩士論文18篇。在這38篇相關研究中,有人對機器翻譯質量評估方法進行研究,例如,鐘文康等人提出了一種基于蛻變測試的多粒度測試框架,用于在沒有參考譯文的情況下評估神經機器翻譯系統的翻譯質量(鐘文康等,2021:1051-1066);王青和馬蕭嘗試提出一種漸進式的機器翻譯質量評估方法:通過借助統計方法、余弦相似度和文本情感分析等技術,從詞匯、句子、語義和語用的宏觀層面探討機器譯文的忠實度和準確性,以及從詞頻統計、詞語搭配、平均句長、句法分析、文本相似度、主題詞、文本情感狀態和情感傾向的微觀層面考察機器譯文的實際翻譯情況(王青、馬蕭,2020:144-151);樊宇昕等人發現了一種基于FrameNet和雙層優化的譯文質量量化評判模式(樊宇昕、安中華,2019:101-105)。有人對機器翻譯質量評估進行整體性研究,如馬鳴皓簡要介紹了現有的機器翻譯質量評估方法(馬鳴皓,2019:76-78);秦穎則著重對機器翻譯質量的自動化評估方法進行了介紹(秦穎,2015:326-335)。還有人對機器翻譯在特定文本中的質量進行評估,比如,梁本彬和李天云以自己參加的翻譯實踐項目為例,展示了谷歌神經機器翻譯在人文社科圖書翻譯方面的表現(梁本彬、李天云,2021:63-68);肖維青和高佳輝以TED演講為素材,對比評估了“網易見外”自動生成英譯中字幕與網易公開課字幕的質量(肖維青、高佳輝,2020:95-105);吉奕衛對比評估了谷歌翻譯和有道翻譯的漢語被動語態翻譯質量(吉奕衛,2019:55-57)。此類研究涉及的文本主要有政府白皮書、財經新聞、《經濟學人》、《紐約時報》,所選取的研究角度有詞匯和句法錯誤分析、語內和語外錯誤分析、機器翻譯和人工526c0101754b374b09661c4685120cbaae4e595b952129bb8f1740a9af538d1b翻譯對比錯誤分析以及基于神經網絡的機器翻譯質量分析。從研究層次來看,因為機器翻譯質量評估其本身具有跨學科特征,研究集中在信息科技、哲學與人文社科、基礎科學三大學科。

就國外而言,有一些研究主要針對研究者自身的母語,分析英語到其母語的機器翻譯質量評估。Wojak與Gralinski利用基于網絡的人工平臺對波蘭語與英語雙語譯文產出進行評估(Wojak,Gralinski,2010:547-551)。Bentivogli等人在2015年國際口語翻譯系統評測大賽(IWSLT)中對神經網絡與基于短語的機器翻譯進行英語與德語的翻譯評測,指出神經網絡模型對于翻譯中動詞的重新排列有更高的靈敏度(Bentivogli,et al,2016:257-267)。Koehn與Knowles曾針對利用神經網絡英語到西語的翻譯系統進行研究并評測,他們使用了法律、醫藥等專業語料進行訓練,測試結果顯示只有語料規模達到1500萬字以上,才能得到一個性能較好的神經網絡翻譯模型(Koehn,Knowles,2017:28-39)。Toral等人對于羅曼語系、斯拉夫語系等語系中的9種語言進行英語到該語言的翻譯質量評估(Toral,2017:1063-1073)。盡管已有多項研究對基于神經網絡的機器翻譯質量進行測評,但是其測評主要集中在同一個或者相鄰的語系之間,缺少英漢之間的機器翻譯質量評估。

二、地方志機器翻譯質量對比的材料和方法

本研究主要對比地方志文本在不同機器翻譯引擎中的翻譯質量,此過程主要包括兩個步驟:一是將地方志文本輸入不同的機器翻譯引擎,得到用于對比這些機器翻譯質量的材料,即不同的機器譯文;二是用人工評估方法對機器譯文的質量進行對比評估。

(一)機器翻譯質量對比的材料

本研究選用地方志《祁東縣志(1986—2005)》作為原文本。《祁東縣志(1986—2005)》由祁東縣志編纂委員會編輯、方志出版社出版,記述湖南省祁東縣1986—2005年這一歷史階段的自然、政治、經濟、文化、社會等方面的發展面貌,體裁以記述體為主,語言客觀平實。將原文本輸入7個主流的機器翻譯引擎:搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯,得到本研究用于機器翻譯質量對比的材料,即七篇機器譯文。

(二)機器翻譯質量對比的方法

本研究采用人工評估的方法對比各機器譯文的質量,其中人工評估方法選用的評估標準是目前廣泛使用的DQF動態質量評估框架,具體的操作流程如下:

第一,選擇測試文本,即在本報告節選的《祁東縣志(1986—2005)》第十六篇第一章文化事業的第一節至第四節中選擇用于測試機器翻譯引擎質量的文本。測試文本既要具備原文本的特點,保證測試結果的可用性;又不能太長,保護測試過程的高效性。因此,本報告選擇第三節的第一段作為測試文本,該段落主要介紹祁東縣祁劇演出的演職員隊伍,段落長度為254個漢字。測試文本標記為ST’,如圖1所示。

第二,輸出評測譯文,即依次將測試文本ST’輸入搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯中,輸出這7個機器翻譯引擎所對應的7個版本的譯文,分別記為TT1、TT2、TT3、TT4、TT5、TT6、TT7。

第三,對機器翻譯譯文進行翻譯質量評估,即評估人員對機器譯文TT1、TT2、TT3、TT4、TT5、TT6、TT7的質量進行評估。此次評估的評估者是8名來自湖南師范大學外國語學院MTI專業的研三學生,評估者均已通過CATTI英語筆譯二級考試,具備優秀的翻譯能力,且上過計算機輔助翻譯課,了解機器翻譯相關知識。8位評估者分別編號為P1、P2、P3、P4、P5、P6、P7、P8。此次評估的評估標準是翻譯自動化用戶協會(TAUS)推出的DQF動態質量評估框架,DQF動態質量評估框架對機器翻譯質量給出了兩個評估屬性:準確度和流暢度。準確度指原文本的意義在目標譯文中的表達程度;流暢度指譯文的語法、拼寫、通用術語和名稱能被母語者接受并理解的程度(TAUS,2015: 12)。8位評估者對機器譯文的流暢度和準確度進行打分,流暢度和準確度的分數設置均為1-5分,1分表示譯文非常不流暢、準確度很低,5分表示譯文十分流暢、準確度很高。據此,將評估者Pn(n=1, 2, 3, 4, 5, 6, 7, 8)給ST’的機器翻譯譯文TT1~TT7的流暢度分數記作Fn1、Fn2、Fn3、Fn4、Fn5、Fn6、Fn7,將評估者Pn(n=1, 2, 3, 4, 5, 6, 7, 8)給ST’的機器翻譯譯文TT1~TT7的準確度分數記作An1、An2、An3、An4、An5、An6、An7。

三、地方志機器翻譯質量對比的結果分析

8位評估者給7個機器翻譯譯文的流暢度評分情況如表1所示,準確度評分情況如表2所示。

那么Fn1、Fn2、Fn3、Fn4、Fn5、Fn6、Fn7(n=1, 2, 3,4, 5, 6, 7, 8)就分別為搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯在ST’中的翻譯流暢度。同樣地,An1、An2、An3、An4、An5、An6、An7(n=1, 2, 3, 4, 5, 6, 7, 8)就分別為搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯在ST’中的翻譯準確度。7個機器翻譯引擎在ST’中的翻譯流暢度和準確度情況如圖2所示。

由圖2可以看出,在流暢度方面,TT2是7個機器譯文中最流暢的,而TT7和TT3的流暢度相對較低,剩余4個機器譯文TT1、TT4、TT5、TT6的流暢度相差不大。在準確度方面,TT2和TT5的準確度相同,而TT7和TT3的準確度相對較低,其他3個機器譯文的準確度沒有表現出明顯的差異。綜上所述,從流暢度和準確度兩方面來看,TT2是7個機器譯文中表現最好的。因此,在搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯這7個機器翻譯引擎中,輸出TT2的谷歌翻譯是最適合《祁東縣志(1986—2005)》的機器翻譯引擎,所以本報告選擇谷歌翻譯作為此次翻譯任務的機器翻譯引擎。

四、結論

從基于規則到基于實例、基于統計,再到基于神經網絡,機器翻譯確已取得較大進步,在翻譯方面的表現可圈可點。在此次翻譯實踐中,報告者采用“機器翻譯+譯后編輯”的模式翻譯《祁東縣志(1986—2005)》,首先報告者以DQF動態質量評估框架為評價標準,對比七個主流的機器翻譯引擎:搜狗翻譯、谷歌翻譯、有道翻譯、微軟翻譯、百度翻譯、騰訊翻譯君、DeepL翻譯在《祁東縣志(1986—2005)》中的譯文質量,最終以譯文準確度和流暢度都相對較高的谷歌翻譯引擎為工具,對《祁東縣志(1986—2005)》第十六篇第一章的第一至四節進行機器預翻譯,并在機器譯文的基礎上進行人工編輯,最終翻譯定稿。作為業內領先的線上翻譯平臺之一,在此次翻譯實踐中,谷歌翻譯在通用專有名詞與簡單句的處理上表現良好,報告者可直接采用機器譯文或僅進行簡單的譯后編輯即可,有效提高了筆者的翻譯效率,節約了時間成本。

近年來,人工智能與機器翻譯技術迅猛發展,機器翻譯的應用率呈大幅增長趨勢。盡管機器翻譯的表現愈來愈佳,但機器始終無法代替人腦。因而,人機結合的翻譯模式才能最大限度地發揮兩者的優勢,實現效率與質量的平衡。目前,越來越多的人采用“機器翻譯+譯后編輯”的翻譯模式。在信息井噴、翻譯需求劇增的大環境下,譯者有必要掌握靈活運用翻譯工具的能力,提高信息檢索與譯后編輯的能力,以適應時代所需。

參考文獻:

[1]陳明瑤,邱輝. 從語篇的銜接與連貫論《中國的環境保護》(白皮書)的英譯[J]. 上海翻譯,2009(1):20-24.

[2]崔啟亮. 論機器翻譯的譯后編輯[J]. 中國翻譯, 2014,35(6):68-73.

[3]馮全功,崔啟亮. 譯后編輯研究:焦點透析與發展趨勢[J]. 上海翻譯,2016(6):67-74,89,94.

[4]方夢之. 應用翻譯研究:原理、策略與技巧[M]. 上海:上海外語教育出版社,2013:184.

[5]黃國文. 語篇分析概要[M]. 長沙: 湖南教育出版社, 1988:11.

[6]黃河燕, 陳肇雄. 一種智能譯后編輯器的設計及其實現算法[J]. 軟件學報,1995(3):129-135.

[7]李梅, 朱錫明. 譯后編輯自動化的英漢機器翻譯新探索[J]. 中國翻譯,2013,34(4):83-87.

[8]李運興. 英漢語篇翻譯[M]. 北京: 清華大學出版社, 2011.

[9]羅季美,李梅. 機器翻譯譯文錯誤分析[J]. 中國翻譯,2012,33(5):84-89.

作者單位:湖南師范大學外國語學院

主站蜘蛛池模板: 网久久综合| 中国精品自拍| 免费播放毛片| 美女一级毛片无遮挡内谢| 国产第四页| 538精品在线观看| 亚洲国产成人久久精品软件| 久久黄色免费电影| 久久黄色影院| 99热国产这里只有精品9九| 日韩毛片在线视频| 制服丝袜一区| 亚洲一道AV无码午夜福利| 乱人伦中文视频在线观看免费| 久久国产精品无码hdav| 青青青国产视频手机| 男女性色大片免费网站| 国内精自线i品一区202| 亚洲国产日韩在线观看| 色综合天天视频在线观看| 久久77777| 伊人国产无码高清视频| 国产精品不卡片视频免费观看| julia中文字幕久久亚洲| 99在线视频网站| 亚洲一区二区三区国产精华液| 看国产一级毛片| av午夜福利一片免费看| 色婷婷天天综合在线| 亚洲精品欧美日本中文字幕| 操美女免费网站| 69av在线| 国产精品无码一区二区桃花视频| 亚洲国产av无码综合原创国产| 日韩精品亚洲精品第一页| 日韩在线第三页| 91在线一9|永久视频在线| 国产电话自拍伊人| 免费看美女自慰的网站| 国外欧美一区另类中文字幕| 高h视频在线| 九九九精品视频| 波多野结衣一区二区三区四区| 欧美成人手机在线观看网址| 先锋资源久久| 亚洲AⅤ无码日韩AV无码网站| 97视频精品全国免费观看| 国产精品内射视频| 亚洲福利一区二区三区| 亚洲国产精品一区二区高清无码久久| 2021精品国产自在现线看| 欧美日韩动态图| 亚洲综合色婷婷中文字幕| 亚洲女人在线| 女人爽到高潮免费视频大全| 欧美黑人欧美精品刺激| 91毛片网| A级毛片无码久久精品免费| 久久久噜噜噜| 在线播放国产99re| 久久黄色视频影| 精品伊人久久大香线蕉网站| 国产精品99久久久久久董美香| 18黑白丝水手服自慰喷水网站| 手机在线免费不卡一区二| 亚洲成肉网| 亚洲永久免费网站| 97亚洲色综久久精品| 在线精品欧美日韩| 98精品全国免费观看视频| 亚洲美女高潮久久久久久久| 五月天综合网亚洲综合天堂网| 亚洲无码不卡网| 亚洲综合婷婷激情| 国产综合另类小说色区色噜噜| 丁香综合在线| 久久成人国产精品免费软件| 久久人体视频| 国产乱人乱偷精品视频a人人澡| 国产成人AV大片大片在线播放 | 亚洲美女一级毛片| 精品久久久久久中文字幕女|