摘 ?要 闡述機器翻譯經歷的各個階段,列舉機器翻譯的優勢與不足,展望其發展前景,以期為此方面的研究提供參考。
關鍵詞 機器翻譯;計算機;人工智能
中圖分類號:H085 ? ?文獻標識碼:B
文章編號:1671-489X(2020)19-0048-02
1 引言
在全球化已然普及的今天,翻譯作為溝通兩種不同語言文化的橋梁,在跨文化交際中起著不可或缺的重要作用。人工智能以及大數據的發展,提高了機器翻譯的地位,使其受到公眾的普遍關注。機器翻譯(machine translation)是指利用計算機把一種源語言轉變為另一種目標語言的過程,一般是指語言之間的句子和全文的翻譯。機器翻譯以其高效率、低成本等優點,受到很多有翻譯需求的個人及單位的青睞。機器翻譯的發展歷程如何?有什么樣的優點與缺點?有著怎樣的發展前景?本文就此類問題進行分析。
2 機器翻譯的發展歷程
早在20世紀30年代,就有學者初步構想了機器翻譯的雛形。時至今日,機器翻譯已經走過了90年的發展歷程。20世紀40年代,機器翻譯初步實施,60年代迸發了萌芽,七八十年代迅速發展,進入21世紀,機器翻譯進入繁榮發展和廣泛應用的新階段[1]。當然,機器翻譯并非發展得一帆風順,而是經歷了一個曲折上升的過程。
機器翻譯的設想,最早由法國科學家G.B.阿爾楚尼于1933年提出。1946年,世界上第一臺電子計算機問世,受此啟發,美國科學家W.Weaver提出使用計算機來對自然語言進行翻譯,隨后英國工程師A.D.Booth進行了機器查字典試驗。1949年,Weaver發表備忘錄,提出機器翻譯的可計算性。1954年,美國Georgetown大學與IBM公司合作,用計算機把幾個簡單的俄語句子翻譯成英語,實現了世界上第一個超出詞與詞對譯概念的機器翻譯系統,掀起一場機器翻譯的研究高潮。然而這個時期計算機的硬件水平不高,大規模、高質量的翻譯任務完全依賴機器來完成是不可能的。而且沒有同句法學家和語義學家合作,無法進行語言句法結構分析,翻譯的質量大大低于人工翻譯。因此,有專家提出建議,可以優先發展翻譯有控制的語言,而且只能在某些特定領域進行。
1964年,語言自動處理咨詢委員會(簡稱ALPAC)由美國科學院成立,調查機器翻譯的研究情況。1966年,ALPAC發表了一篇題為“語言與機器”的報告,表達了對機器翻譯的消極態度,稱“在目前給機器翻譯以大力支持還沒有多少理由”,理由在于機器翻譯存在難以克服的語義障礙。這給世界范圍內的機器翻譯研究帶來非常消極的影響,許多國家紛紛壓縮機器翻譯方面的研究經費,相關研究進入低潮期。
到了20世紀70年代,科技迅猛發展,促使各國之間的交流日益頻繁,對于翻譯的需求日益增加,推動機器翻譯發展到一個新的階段。這一階段機器翻譯開始注重對語言進行深層次的分析、轉換和生成,翻譯不再局限于詞語,而是進入句法、語義層面,被稱為基于規則的機器翻譯方法[2]。80年代,這種機器翻譯方法達到高峰,一些機器翻譯系統進入實用階段,如加拿大的Weinder系統、歐盟的EURPOTRA多國種翻譯系統等。這個時期經典語言理論和計算語言理論發展日益完善,催生了一大批商品化的機器翻譯系統,如美國的SYSTRAN、日本的ATLAS系統等。這個時期,機器翻譯的方法主要包括統計方法和語料庫機器翻譯方法,突破了以往機器翻譯系統的弊端,取得飛躍式發展。
進入21世紀,機器翻譯研究迅猛發展,微型計算機能夠連接網絡,并擁有大容量的存儲功能,隨之發明了各種各樣的翻譯工具。比如利用“翻譯記憶”功能,已得譯文得以存儲下來,方便以后的修訂和再次利用。機器翻譯逐步與人工翻譯結合起來,機助人譯(Computer-aided Machine
Translation)和人助機譯(Human-aided Translation)相互結合。大量語料庫被建立和發展起來,為機器翻譯的理論和技術研究提供源泉。神經機器翻譯是更為高級的發展產物。2016年,谷歌以短語為單位,開發了機器翻譯的新算法,推出神經機器翻譯系統,該系統能夠大大縮小人工翻譯和機器翻譯之間的差別。運用微軟研發的newstest 2017進行翻譯,譯文與人工翻譯“幾乎無法區分”。而云計算、移動終端、大數據等使機器翻譯的形式更為多樣化,出現了照相翻譯、文字掃描翻譯、語音翻譯等應用。
1956年,我國的機器翻譯起步,當時的《科學發展綱要》把“機器翻譯/自然語言的數學理論”列入其中,這種理論后來又被列入不同的重大科研項目。由于我國當時與蘇聯有著頻繁的經濟和政治往來,產生大量中俄語的翻譯需求,機器翻譯的MT系統應運而生。20世紀80年代中期到90年代,兩個英漢機譯系統KY-1和863-IMT在我國研制成功。進入21世紀,隨著網絡技術的成熟和發展,一些互聯網巨頭如搜狗、網易、科大訊飛等紛紛加入機器翻譯研究隊伍,研發了各種人工智能翻譯設備[3],如雅信、譯星、科建、通譯等,金山詞霸、百度翻譯、有道翻譯等APP的研發與使用更是極大地滿足了人們對翻譯的需求。目前,機器翻譯涉足一些新的應用領域,如對話翻譯系統、圖像翻譯系統等。
機器翻譯經歷了從簡單到復雜、由初級到高級的發展變化,在理論和實踐兩方面不斷進行革新。目前,世界各國的學者正努力向機器翻譯的智能化和自動化進發,致力于提升機器翻譯的效率和翻譯質量[4]。
3 機器翻譯的優勢與不足
機器翻譯的優勢
1)提高翻譯效率。由于現代機器翻譯擁有了翻譯記憶技術,即進行翻譯時,記憶庫在后臺不斷自動儲存錄入的譯文,從而建立語料庫。這樣一來,如果譯者在翻譯時再次出現相同或類似的語言,系統就能自動搜索翻譯記憶庫中已有的相同或相近的內容,為譯者提供參考譯文,使其翻譯速度大大提升,需要的翻譯時間縮短,而且避免了重復的翻譯勞動,工作效率就會大大提升[5]。
2)彌補人工翻譯不足。有些初出茅廬的譯者翻譯態度不夠嚴謹,又缺乏必要的知識儲備,尤其是翻譯一些專業性較強的材料時,缺乏相關知識,造成翻譯水平參差不齊。如多人共同完成一項翻譯任務時,最終的譯作很可能會因個體因素的影響,導致前后譯文不一致、銜接不通順,甚至連主人公的名字都可能會出現差異,造成理解上的偏差。而機器翻譯軟件能很好地解決這一問題,它應用語料庫來確保譯文語言的一致性,避免了譯文前后不統一的問題,從而保證了譯作的質量,彌補了人工翻譯的不足。
3)降低翻譯成本。機器翻譯軟件隨著其記憶庫和語料庫的不斷擴充,能夠很快地完成一份導入文稿的翻譯。如果是網絡中的在線翻譯,也基本都能在網絡上找到源語文件,很大程度上降低了時間成本,使譯員及其單位能在更短的時間內創造出更大的利潤。尤其是對一些商業文件的翻譯來說,由于機器翻譯軟件的使用,節約了大量人力成本,極具吸引力。
機器翻譯的不足
1)對句式結構把握差。機器對句式結構的轉換往往能力不足,由于源語和譯語的句式可能有非常大的差別,很多起限定、修飾作用的成分,如英語中的非謂語動詞、從句等,機器翻譯往往只會生搬硬套輸入的信息,無法靈活地運用語法,句子結構一旦復雜一點兒、修飾限定的成分稍微多了一點兒,就無法根據上下文做出正確的判斷和處理,譯文顯得生硬而死板。對于英語中廣泛使用的冠詞、連詞等,機器在譯為不常用到它們的漢語時也往往把握不準,給翻譯的句式轉換造成麻煩,影響譯文的準確度和可讀性。
2)語境聯系欠缺。機器翻譯無法將語境同文字翻譯很好地結合起來。在有些語言環境中,同一詞語擁有兩個甚至多個不相關含義的情況常常存在。如果發生這種情況,就必須依靠語境來對詞義加以理解,語境對詞義理解影響巨大,甚至很大程度上,語境決定了詞義。要想得到精確的譯文,必須將詞語與其所在的特定語境結合起來,這對機器而言,無疑難度巨大。機器翻譯缺乏結合譯文與語境、聯系上下文去理解和翻譯的能力,所以機器翻譯中的誤譯、漏譯現象很常見。
3)無法準確傳達文化。文化蘊含在每一種語言之中,任何語言想要表達某種含義,都會與其所屬的文化產生直接或間接的關系,離開了文化的土壤,語言之花便無法開放。不同的文化擁有各自不同的語言系統,如俚語、習語、雙關等,機器翻譯永遠無法理解和翻譯特定的文化,譯文也可能并不符合文化的特定規范,這將是機器翻譯很難跨越的一道鴻溝。
4 機器翻譯的前景
雖然機器翻譯仍存在不足和缺陷,但無法否認它給人們帶來的便利與高效。在全球一體化的今天,機器翻譯也必將發揮越來越大的作用,在全球交流與合作中占據越來越重要的位置。也許有一天,人們會發現機器翻譯的產品進入人們生活的各個領域并發揮作用,人們可以隨時運用各種類型的機器翻譯系統,在任何時間、任何地點都能方便地使用機器翻譯。當然,機器翻譯的研究需要多學科共同發展,如果能將翻譯學、語言學、計算機科學、數學等相關學科的研究緊密結合在一起,促進機器翻譯在句式、語篇、文化方面翻譯能力的提高,從技術和應用兩方面齊頭并進,必將推動機器翻譯向更加專業、更加智能、更加便捷的方向發展,機器翻譯的發展前景必定更加燦爛光明。
5 結語
自20世紀40年代以來,機器翻譯歷經萌芽、發展、低谷、繁榮等不同階段,雖然目前已進入穩定發展時期,但是仍然需要翻譯學、語言學、計算機科學等相關學科的共同努力,才能使其更加準確、完善。希望隨著全球化一體化的快速推進,機器翻譯可以得到更好的發展,為各國交流合作提供便利。
參考文獻
[1]馮志偉.機器翻譯研究[M].北京:中國對外翻譯出版公司,2004.
[2]沈春澤.人工智能真的可以取代同傳翻譯嗎?[J].大數據時代,2018(11):32-39.
[3]張政,苗天順.計算語言學與機器翻譯導論[M].北京:外語教學與研究出版社,2010.
[4]吳會芹.機器翻譯的回顧與展望[J].外語電化教學,2003(4):51-54.
[5]俞娟.淺談機器文本翻譯[J].改革與開放,2015(6):98-99,101.
作者:李利,沈陽醫學院外語教學部,講師,研究方向為外國語言學及應用語言學(110034)。