凌鋅燕 羅 淦
(江西科技師范大學,江西南昌 330038)
機器翻譯作為翻譯領域的人工智能,從基于規則的機器翻譯、基于統計的機器翻譯發展到如今的神經網絡機器翻譯,已成為應用于翻譯領域的主流技術。隨著計算機計算能力的提升、多語言信息的爆發式增長、各大互聯網巨頭推出的翻譯API,使得機器翻譯技術逐漸走出象牙塔,開始為普通用戶提供實時便捷的翻譯服務。百度翻譯軟件在海量翻譯知識獲取、翻譯模型、多語種翻譯技術等方面取得重大突破,實時準確地響應互聯網海量、復雜的翻譯請求。百度翻譯所研發的深度學習與多種主流翻譯模型相融合的在線翻譯系統以及基于“樞軸語言”等技術,處于業內領先水平,在國際上獲得了廣泛認可。
筆者在此選取兩組英漢語言的句子和語篇材料,利用百度翻譯進行在線英漢互譯。通過下方翻譯結果可以看出,首先,采用神經網絡機器翻譯技術的百度翻譯的翻譯結果存在一些問題,同人工翻譯相比有待提高。第一個問題是漏譯,下表中筆者認為源語有些詞沒有被翻譯出來,甚至有的時候輸入一個長句子有逗號分隔,有幾個子句都沒有翻譯出來。另個一問題是語篇翻譯。當前的機器翻譯是單句對照級翻譯,不考慮上下文,這就導致譯文顯得生硬不連貫。但同傳統機器翻譯結果比較,百度翻譯契合受眾群體,句子及篇章翻譯符合漢語語法規則、表達習慣和漢語受眾的認知習慣;同時在語義、語法、語氣等方面的準確度有明顯提升,翻譯結果的實用性也較高。無可置否的是,神經網絡翻譯技術在翻譯簡單、真實的句子時的質量還是不錯的。如果人類對理解一個句子的意思比對翻譯的質量更感興趣,像百度翻譯這樣的人工智能翻譯軟件會非常有幫助。神經網絡翻譯使用一種機械的、統計的過程來翻譯不同的語言。它會標出目標與嚴重單詞和短語出現時的不同模式,并嘗試在翻譯的時候選擇最方便的模式。而語言是一門博大精深的藝術,一個生活中的笑料、一個雙關語或是一個帶有暗示性的語言,對機器翻譯來說是最難克服的障礙。機器翻譯的固定模式有時會導致翻譯質量變差,從而使我們的表達變得很糟糕;而人工翻譯會考慮語言的文化和語境及文字背后的歷史及文化背景,同時再對單詞翻譯前還會對主題進行研究,人工翻譯還會就翻譯能力習得等人文方面不斷地進行自我要求來提高自我。總的來說,人工翻譯是一個較為復雜的過程。但當前人工智能背景下的機器翻譯仍然缺乏常識和抽象地解決問題的能力,使它能夠完全自動化掌握人類語言的學科。
盡管神經網絡的機器翻譯技術很大程度上提高了翻譯的質量,使機器翻譯有了質的飛躍,但是在處理感情色彩深厚的復雜文章時,機器翻譯與人工翻譯的質量的懸殊讓人難以接受。一個重要的原因是,當前的神經網絡翻譯技術其實是模擬人腦處理一些簡單的信息,但由于人腦的復雜性,在信息識別和處理、情感認知方面,技術還是無法模仿,更無法復制。中國數學家、語言學家周海中曾在論文《機器翻譯五十年》中指出,要提升機器翻譯的質量,首先要解決的是語言本身問題而不是程序設計問題,如果只是靠一些程序來做機器翻譯,是沒有辦法提高機器翻譯質量的。所以,開發人員需要考慮是機器對文本的認知,對翻譯文本的選擇。

Source language Baidu translation世上本無事,庸人自擾之Nothing in the world is to be bothered by mediocrity.I bundled her up in a blanket and gave her a hot drink. 我把她裹在毯子里,給了她一杯熱飲。Source languageBaidu translation The basis of social interactions might change, too, from a set of commitments founded on trust to calculations of risk and reward derived from the information a computer attaches to someone’s face.社會交往的基礎也可能發生變化,從建立在信任基礎上的一系列承諾,到從計算機附在某人臉上的信息中得出的風險和回報的計算。中方一貫倡導樹立共同、綜合、合作、可持續的新安全觀。我們希望美方能夠摒棄零和思維,放棄以對抗視角看待大國關系,順應和平與發展的時代大潮。China has always advocated the establishment of a new security concept of common, comprehensive, cooperative and sustainable development. We hope that the United States can abandon the zerosum thinking, abandon the view of confrontation on relations between major powers, and conform to the tide of the times of peace and development.
Model Front在這方面可能為人機翻譯的結合提供了新的思路。Model Front是對機器翻譯句子是否正確的風險預測平臺。它使用深度學習和非常大的數據集,采用了一種完全不同的機器翻譯風險預測方法,在平衡機器的規模和人工翻譯質量方面開辟了許多新途徑。首先,不同于BLEU和Meteor等用于在語料庫級別評估引擎的質量評估,Model Front可進行實時風險預測,實現客戶端應用程序可根據其用戶的翻譯速度、規模和質量目標決定如何對每個譯句的翻譯風險做出反應。Model Front還可以讓用戶立即使用良好的機器翻譯,并僅將有風險的翻譯發送給人工翻譯。其次,也可以按風險對翻譯結果進行優先排序,以便人工翻譯首先處理風險最高的翻譯。
Model Front還可比較來自多個API的翻譯以選擇最佳譯文,用戶可以同時對比百度翻譯及谷歌翻譯等API的譯文,優先選擇最好的翻譯結果。Model Front將Auto ML Translation(利用最新的神經機器翻譯技術將字符串翻譯成任何支持的語言)的轉換與默認翻譯API的轉換結果進行比較,為每個句子選擇最佳轉換。該功能為各行業缺少AI經驗的企業和開發者提供更好的渠道進行翻譯。另外,如果用戶知道多種語言,可以使用Model Front控制臺將翻譯與不同語言進行比較,最終選擇控制臺所顯示的最佳語言。Model Front控制臺的諸多功能不僅可以降低人工成本,也可以增強用戶,特別是職業譯者的信心。比如,當一個翻譯團隊的成員使用機器翻譯文本回復用戶或客戶評論或電子郵件時,可以在發送之前使用Model Front控制臺檢查翻譯是否存在風險,從而增加對業務工作流程中的機器翻譯閱讀和撰寫的信心。其次比較翻譯文本的功能會幫助譯者進行篩選,改進譯文質量。這些可說明一點,正確使用當今的人工智能技術,其實許多機器翻譯的錯誤是可檢測且可預防的。譯者也能充分發揮人類的語言優勢,花費較少的精力專注于糾正錯誤的機器翻譯結果方面,努力在利用好機器翻譯技術的情況下實現譯文的“信”、“達”、“雅”,進一步促進人工翻譯與機器翻譯理性而高效地結合起來。
當前,我們可以看到,機器翻譯提高了使用人類語言任務的速度,也減輕了人類大腦的負擔。但就現階段而言,神經網絡翻譯技術還未成熟,在處理一些語篇和復雜句時,其結果不盡人意。機器翻譯與人工翻譯的結合也尚不完全,所以,本文想說通過對神經網絡翻譯技術、翻譯風險預測技術及人工翻譯的三方結合的可行性分析,實現了一種新型的人機翻譯模式的新的可能性,極大概率地減少和修正翻譯錯誤,這種人機翻譯更高層次的結合也許才是不斷提高翻譯質量的可行性路徑。