鄧良艷
摘 ? ?要: 近年來,隨著人工智能技術的進步,作為人工智能一部分的機器翻譯取得了突飛猛進的發展,特別是基于神經網絡的機器翻譯,與以往機器翻譯相比,具有更快速、效率更高、更準確等優點。本文通過對當前常用的幾款機器翻譯軟件對文學作品譯文質量進行分析和對比,了解機器翻譯的發展現狀與水平,探討機器翻譯在文學類作品方面存在的不足,展望人工智能背景下機器翻譯的發展趨勢和方向。
關鍵詞: 人工智能 ? ?機器翻譯 ? ?對比研究 ? ?《雙城記》
隨著《新一代人工智能發展規劃》的出臺,人工智能的不同領域取得了爆發式發展,作為其子領域的機器翻譯得到了飛速的進步,從基于規則的機器翻譯發展到現在的基于神經網絡的機器翻譯,功能越來越強大,譯文質量越來越高。面對機器翻譯的迅猛發展,人們不禁會問,機器翻譯是否會完全取代人工翻譯?本文以經典文學作品《雙城記》為例,從中選取一些經典的例子進行機譯和人譯的對比,分析現有發展水平下機器翻譯存在的不足之處,同時展望在人工智能背景下機譯發展的前景和方向。
1.人工智能
1.1人工智能(Artificial Intelligence,簡稱AI)的概念
人工智能(AI),也叫機器智能,屬于計算機科學的一個分支,它是用于描述模仿與人類思維相關的認知功能的機器,本質是利用計算機做只有人能做的工作,與人的自然智能形成鮮明的對比。
1.2人工智能的發展歷程
“人工智能”一詞最早由資深計算機科學家John McCarthy在1956年夏天在達特茅斯學院舉辦的研討會上提出,這次會議被認為是人工智能成立的標志。作為一門學科,人工智能的發展歷程主要經歷三個階段:人工智能的黃金歲月、人工智能的寒冬和人工智能的快速發展。
1.2.1人工智能的黃金歲月
1956年—1974年是人工智能學科發展的黃金歲月,對于大多數人來說,在這段時間內開發的程序無疑是令人驚訝的:計算機正在解決代數詞問題、證明幾何定理和學習說英語。當時很少有人相信機器的這種“智能”行為是可能的。研究人員表現出強烈的樂觀態度,預測將在不到二十年的時間內建成一臺全智能機器。
1.2.2人工智能的寒冬
在二十世紀七十年代后期,人工智能受到了批評和金融挫折。由于當時計算機的存儲空間有限及計算能力的不足,人工智能程序只能解決一些十分簡單的問題。同時,由于研究人員的盲目樂觀情緒,一些人工智能項目并未達到人們的預期,以失敗告終。于是,美國國防部高級研究計劃局終止對人工智能項目的資金支持,人工智能進入第一次寒冬。到了八十年代,世界各地的企業采用一種稱為“專家系統”的人工智能程序,給人工智能研究帶來新一輪發展。然而,人們很快發現“專家系統”維護成本太高且更新困難,同時,政府撥給人工智能的研究經費越來越少。于是,人工智能又陷入第二次寒冬。
1.2.3人工智能的快速發展
自二十世紀九十年代中后期以來,由于計算機能力的提高,人工智能開始再次復蘇。谷歌公司研發的人工智能圍棋軟件Alpha Go戰勝了世界圍棋冠軍李世石,引起了全球對于人工智能的關注。此外,大數據的發展,深度學習的算法推動了人工智能在圖像識別和語音識別方面的發展,人工智能進入快速發展階段。
2.機器翻譯
2.1機器翻譯(Machine Translation,簡稱MT)的概念
機器翻譯,俗稱機翻,是計算機語言學的一個子領域,本質是利用計算機程序將文字從一種自然語言(源語言, target language)翻譯成另一種自然語言(目標語言, source language)。機器翻譯試圖用計算機模擬人的翻譯能力,是人工智能的重要研究領域。
2.2機器翻譯的發展類型
機器翻譯這一想法最早由法國科學家阿爾楚尼(G.B.Artsouni)在二十世紀三十年代初明確提出。經過幾十年的長足發展,大致經歷以下三個發展類型:基于規則的機器翻譯、基于語料庫的機器翻譯和基于神經網絡的機器翻譯。
2.2.1基于規則的機器翻譯
規則法(Rule-based method)機器翻譯主要有三種類型:辭典法(Dictionary-based)、轉化法(Transfer-based)及中間語法(Interlingua-based)機器翻譯。辭典法翻譯即直接翻譯,將源語言與目標語言之間的詞匯進行一一對應翻譯;轉化翻譯對源語言的分析獨立于目標語言,在對目標語言的轉化過程中,會考慮與源語言的上下文、結構的差別;中間語言翻譯即假定存在有中間語言(interlingua),先把源語言翻譯成中間語言,再把中間語言按照目標語言的規范翻譯出來。
2.2.2基于語料庫的機器翻譯
基于語料庫(Corpus-based)的機器翻譯可以分為基于范例的方法(Example-based)和基于統計的方法(Statistics-based)。所謂范例法,即基于實例的翻譯方法。基本思路是電腦模擬大量翻譯實例(翻譯語料庫),進行有效替換的翻譯策略。統計機器翻譯的基本思想是通過對大量的平行語料庫進行統計分析,構建統計翻譯模型,使用此模型進行翻譯。
2.2.3基于神經網絡的機器翻譯
神經機器翻譯(Neural Machine Translation,簡稱NMT),它使用人工神經網絡提高翻譯的流暢度和準確性。自2013年以來,隨著深度學習的研究取得較大進展,相比較前面兩種機器翻譯類型,基于人工神經網絡的機器翻譯具有明顯的優勢。它可以自動從語料庫中學習翻譯知識,實現“理解語言,生成譯文”的翻譯方式,使譯文更加符合語法規范、流暢,容易理解。
3.A Tale of Two Cities簡介
A Tale of Two Cities(《雙城記》)是英國作家查爾斯·狄更斯創作的一部長篇歷史小說,首次出版于1859年。故事以法國大革命為背景,情節感人肺腑,是世界文學經典名著之一。雙城指的是巴黎和倫敦,故事將這兩大城市連接起來,講述了巴黎醫生曼奈特的故事。他因打抱不平,受到埃夫雷蒙侯爵兄弟的迫害,在巴士底監獄被關押了18年。出獄后,曼奈特之女露西卻與仇家的兒子達尼墜入情網。于是,在法國大革命的漩渦中,一幕幕家族的恩怨情仇隆重上演。善惡生死在沖突中交融,在轉瞬間變換。在斷頭臺上,卡爾登為了愛情,從容獻身。
A Tale of Two Cities結構嚴謹,語言凝練,狄更斯對革命與人性的深刻思考和令人嘆為觀止的寫作才華,在其中得到淋漓盡致的展現。本文選取文中極具代表性的經典語句進行翻譯對比分析,研究神經網絡機器翻譯軟件是否對經典文學作品進行準確的翻譯,探討人工智能背景下神經網絡機器翻譯是否取代人工翻譯。
4.機器翻譯A Tale of Two Cities質量對比研究與思考
4.1基于神經網絡的機器翻譯軟件
目前市場上口碑較好的幾款人工智能機器翻譯軟件有谷歌翻譯、百度翻譯和有道翻譯。這幾款翻譯均采用基于神經網絡的機器翻譯系統,實現多個語言的隨時互譯,因此本文將采用這三種機器翻譯系統樣本進行分析和研究。
4.2三款機器翻譯軟件譯文與人工譯文對比
4.2.1源語言文本
句子1:
A day wasted on others is not wasted on ones self.
句子2:
Never frown, even when you are sad, because you never know who is falling in love with your smile.
句子3:
It is a far, far better thing that I do, than I have ever done; It is a far, far better rest that I go to than I have ever known.
句子4:
A wonderful fact to reflect upon, that every human creature is constituted to be that profound secret and mystery to every other.
句子5:
It was the best of times, it was the worst of times. It was the age of wisdom, it was the age of foolishness. It was the epoch of belief, it was the epoch of incredulity. It was the season of light, it was the season of darkness. It was the spring of hope, it was the winter of despair.
4.2.2人工譯文
句子1:
在別人身上浪費一日,并非在自己身上浪費一天。
句子2:
縱然傷心,也不要愁眉不展,因為你不知道誰會愛上你的笑容。
句子3:
我現在已做的遠比我所做過的一切都美好;我將獲得的休息遠比我所知道的一切都甜蜜。
句子4:
每個人對別的人都是個天生的奧秘和奇跡——此事細想起來確實有些玄妙。
句子5:
那是最美好的時代,那是最糟糕的時代;那是智慧的歲月,那是愚昧的歲月;那是信仰的年代,那是懷疑的年代;那是光明的季節,那是黑暗的季節;那是希望的春天,那是失望的冬天。
4.2.3谷歌翻譯譯文
句子1:
浪費在別人身上的一天不會浪費在自己身上。
句子2:
縱然傷心,也不要愁眉不展,因為你永遠不知道誰會愛上你的笑容。
句子3:
這比我做過的事情要好得多;這比我所知道的要好得多。
句子4:
一個很好的事實要反思,每個人類的生物都構成了彼此深刻的秘密和神秘。
句子5:
這是最好的時代,它是最糟糕的時代,它是智慧的時代,它是愚蠢的時代,它是信仰的時代,它是不可思議的時代,它是光明的季節,它是黑暗的季節,它是希望的春天,是絕望的冬天。
4.2.4百度翻譯譯文
句子1:
浪費在別人身上的一天不是浪費在自己身上的。
句子2:
縱然傷心,也不要皺眉,因為你不知道是誰愛上了你的笑容。
句子3:
這是我做過的一件遠比我做過的好得多的事情;這是我去的一個遠比我所知道的好得多的休息。
句子4:
一個值得反思的奇妙事實是,每一個人類生物都被構成了彼此之間那種深奧的秘密和神秘。
句子5:
那是最好的時代,那是最壞的時代,那是智慧的時代,那是愚蠢的時代,那是信仰的時代,那是懷疑的時代,那是光明的季節,那是黑暗的季節,那是希望的春天,那是絕望的冬天。
4.2.5有道翻譯譯文
句子1:
浪費在別人身上的一天并不等于浪費在自己身上。
句子2:
縱然傷心,也不要愁眉不展,因為你不知是誰會愛上你的笑容。
句子3:
這是我做過的一件比以往任何時候都好的事情;我所得到的休息比我所知道的要好得多。
句子4:
一個值得深思的奇妙事實是,每一個人的生命都是如此的神秘莫測。
句子5:
這是最好的時代,這是最壞的時代,這是智慧的時代,這是愚蠢的時代,這是信仰的時期,那是懷疑的時期,這是光明的季節,這是黑暗的季節,這是希望的春天,這是絕望的冬天。
4.3對上述三款機器翻譯軟件的譯文質量分析
對句子1“A day wasted on others is not wasted on ones self.”的翻譯,三款軟件的譯文都與人工譯文基本相同。
第二句話“Never frown, even when you are sad, because you never know who is falling in love with your smile.”中,谷歌翻譯和有道翻譯與人工譯文意思相近,frown一詞都翻譯成“愁眉不展”,百度翻譯直接譯為“皺眉”,缺少文采,后半句“because you never know who is falling in love with your smile”,百度譯為“因為你不知道是誰愛上了你的笑容”,與人工譯文稍有區別。
句子3“It is a far, far better thing that I do, than I have ever done; it is a far, far better rest that I go to than I have ever known.”對這句話的翻譯,三款軟件的翻譯雖然都有不足之處,但是把原文的基本意思都傳達出來。有道翻譯的譯文質量要更好一點,谷歌和百度對后半句話中的rest一詞翻譯不夠準確。
對句子4“A wonderful fact to reflect upon, that every human creature is constituted to be that profound secret and mystery to every other.”的翻譯,人工譯文采用語序調換的策略,把前半句話放到后面進行一個解釋說明,三款機器翻譯均未對語序進行處理,不過從直譯的角度看,百度翻譯和有道翻譯的譯文要比谷歌翻譯的譯文更為順暢和符合中文的表達習慣。后半句對“every human creature”一詞的翻譯,谷歌和百度都直接譯成“每個人類生物”,讀起來明顯很奇怪,而有道翻譯為“每一個人的生命”,略微準確一些。總體來看,三款機器翻譯對這句話的翻譯均不是特別準確,譯文看后有種不知所云的感覺。
句子5的內容是《雙城記》中的經典開頭段落,可謂是膾炙人口,總體來看,因為這段話的結構簡單,三款機器翻譯的譯文都很準確地表達了原文的內容,但是一個缺憾就是,三款機器翻譯對原文特有的節奏美、韻律美卻很難表達出來。
4.4人工智能時代機器翻譯對文學作品翻譯的思考
通過對目前市場上常用的三款機器翻譯軟件譯文與人工譯文的分析可以知道,對于文學作品的翻譯,如果是一些簡單的句子表達,那么機器翻譯能夠做到準確地表達原文的意思,甚至與人工翻譯不分伯仲。面對一些句式比較復雜、語法結構比較難的句子,機器翻譯的質量還有待提高,因此,機器翻譯對文學作品的翻譯處理還是任重而道遠。
5.結語
雖然在目前的人工智能背景下,機器翻譯的譯文質量仍存在一些不足之處,但是不能否認與傳統的機器翻譯系統相比,當前基于神經網絡的神經機器翻譯的譯文質量已經有質的提升。誠然,就目前來看,人工翻譯仍然占據主導地位,但是,未來翻譯的發展必然是人工翻譯和機器翻譯相結合,機器翻譯輔助人工翻譯,提高翻譯效率。因此,隨著人工智能的進一步發展,機器翻譯的質量一定會取得新的突破和提升,使人類更快更便捷地溝通和交流。
參考文獻:
[1]馮志偉.機器翻譯研究[M].北京:中國對外翻譯出版公司,2004.
[2]Charles Dickens. A Tale of Two Cities[M].上海:上海外語教育出版社,2018.
[3]陳海峰.谷歌——人工智能引領未來[J].互聯網天地,2017(1):38-41.
[4]劉洋.神經機器翻譯前沿進展[J].計算機研究與發展,2017(54):1147.
[5]胡開寶,李翼.機器翻譯特征及其與人工翻譯關系的研究[J].中國翻譯,2016(5):10-14.