陳永智
[摘要]信息化時代下,機器翻譯(MT,Machine Translation)和計算機輔助翻譯(CAT,Computer Aided Translation)是兩個既有聯系又有本質區別的概念。機器翻譯便捷迅速,但是缺陷過多,翻譯質量長期以來幾乎沒有顯著提升,而計算機輔助翻譯憑借翻譯記憶核心技術,極大提高人工翻譯的效率和質量。本文首先回顧機器翻譯和計算機輔助翻譯的歷史,其次列舉了兩者的優缺點,最后對機器翻譯和計算機輔助翻譯進行對比分析,得出兩種翻譯方式在未來都有著不可替代的作用,在發展上應相輔相成而不能厚此薄彼。
[關鍵詞]機器翻譯 計算機輔助翻譯 翻譯記憶
[中圖分類號]H085 [文獻標識碼]A [文章編號]1009-5349(2016)18-0154-02
一、機器翻譯和計算機輔助翻譯
機器翻譯(Machine Translation)是利用計算機將一種自然語言自動轉換成另一種自然語言的過程。機器翻譯真正意義上的出現是在20世紀50年代,然而到60年代由于美國科學院公布的ALPAC報告幾乎徹底否定機器翻譯的作用和成果,機器翻譯步入蕭條期。90年代隨著網絡的發展,傳統的人工翻譯無法滿足迅速增長的翻譯需求,人們對機器翻譯的需求空前增長,眾多公司也相繼推出一系列機器翻譯軟件,因此機器翻譯取得了快速發展。
計算機輔助翻譯是指人在計算機的輔助下完成整個翻譯的過程。與機器翻譯相比,其翻譯質量要高于單單利用機器翻譯的應用領域。其翻譯幾乎等同于人工翻譯,但翻譯效率要比人工翻譯高一倍以上。計算機輔助翻譯產生于機器翻譯之上,其作為語料庫技術一個重要的領域,近年來也得到了迅速發展。可以說,計算機輔助翻譯是在機器翻譯遇到阻力后的產物。
二、機器翻譯的原理及其局限性
所謂機器翻譯,即整個翻譯過程中沒有任何人工的參與行為。其過程分為原文分析、原文譯文轉換和譯文生成三個階段。
(一)機器翻譯的原理
機器翻譯的實現技術主要有兩大原理:
(1)基于語法的分析是指計算機通過對源語言單詞、語法、句法等進行分析并進行判斷和取舍,然后重新進行排列組合,最后生成目標語言。雖然計算機具有龐大的存儲記憶和反應能力,在詞義的翻譯上比人腦快無數倍,但是計算機至今沒有達到如人腦一般良好的思維功能,因此機器翻譯基于語法分析的譯文可讀性并不理想。
(2)基于語料庫是近年來十分受重視并在越來越多的產品開發中得到應用,但其難點也存在:首先,由于自然語言也在不斷發展,要構建一個龐大的語料庫并盡可能存儲某一自然語言的所有句型其可實現性比較低。其次,即使構筑如此龐大的語料庫可以實現,如何使其有效運行依然存在困難。
(二)機器翻譯的局限性
自然語言十分靈活,人工翻譯過程中,為了目的語的可讀性,譯者在目的語的選詞上具有較大的靈活性,這一點是機器翻譯無法比擬更無法超越的。比如翻譯“機器翻譯的研究歷史可以追溯到20世紀三四十年代”,有道詞典的機器翻譯為“The research of machine translation history can be traced back to the thirties of the 20th century”,谷歌在線翻譯為“Machine translation studies dating back to the 20th century, three forties”,其中有道翻譯的翻譯引擎基于搜索引擎,采用搜索引擎后臺數據和“網頁萃取”技術,谷歌翻譯采用了源自全球范圍內樣本的“統計機器翻譯”技術,究其本質兩者都是基于語料庫的機器翻譯,也能看出兩個譯文都對詞義和語法的辨析出現錯誤。再以英譯漢為例,由于機器翻譯技術蓬勃發展和改進,如今很多機器翻譯軟件對英語簡單句的翻譯都比較準確且符合目的語的語言習慣,但是倘若一個句子中出現了較多個句子成分,如定語、狀語或者補語等等,一旦機器翻譯對于這些部分理解不正確,譯文就會出現問題,甚至讓人難以理解。以某次翻譯作業中的句子為例,“The second point is that the idea that the Industrial Revolution was “British” and that Europe was just a “follower” seems overstated and, in some sense, wrong.”在有道詞典的譯文為“第二次,認為工業革命是‘英國,只是一個‘追隨者,歐洲似乎夸大了,從某種意義上說,錯了。”谷歌在線翻譯為“第二點是,有觀點認為,工業革命是“英國”,而歐洲只是一個“跟隨者”似乎夸大了,在某種意義上,是錯誤的。”該例句是個復合句,其中包括賓語從句和定語從句,因此兩者的機器翻譯結果都讓人覺得莫名其妙。
三、計算機輔助翻譯——翻譯記憶(TM)
計算機輔助翻譯與機器翻譯的本質區別在于計算機在翻譯過程中不是唯一的主角,主角是譯員,計算機在翻譯過程只是通過各種各樣的手段給予譯員輔助。計算機輔助翻譯的核心是翻譯記憶,它的原理是在譯員翻譯的同時,計算機輔助翻譯軟件會在后臺建立翻譯記憶庫,運用翻譯記憶和數據庫功能,把譯文文本內容加以儲存。在翻譯過程中,當有相近或者重復的術語、短語、句型、詞組等出現時,系統通過自動搜索、比對,為譯員提供記憶庫中相近的譯文,讓譯員自行決定是否采納、編輯或者拒絕使用。翻譯記憶其實是提供了一種翻譯建議,在提高效率的同時,提升了翻譯品質。
據相關統計,在不同行業和部門,資料的重復率達到20%—70%,倘若利用傳統人工翻譯,便意味著譯員有20%以上的勞動屬于無謂的機械重復勞動。翻譯記憶技術的應用一方面極大提高了譯員翻譯的效率,另一方面也提高了翻譯的質量。目前比較受歡迎的計算機輔助翻譯軟件有Trandos,MemoQ,Transit,OmegaT等,國內主要有雅信、雪人等。以CAT軟件鼻祖塔多思(Trados)為例,在利用Trados翻譯的過程中機器會自動記憶翻譯結果,當譯者再次翻譯時,翻譯機遇會搜索記憶庫并進行對比,挑出相似的譯文作為參考譯文,并且譯者只需要一次性建立一個或者多個標準術語列表,翻譯時,術語庫會自動識別出已入庫的術語并給出相應的術語譯語,保證術語的統一,節省翻譯時間,提高翻譯效率和翻譯質量。關于計算機輔助翻譯的翻譯引擎在下一章節會詳細展開。
四、機器翻譯和計算機輔助翻譯的對比分析
(一)不同的設計理念
機器翻譯軟件設計的理念是讓機器徹底代替人工翻譯,由于其可讀性和準確性較差,因此機器翻譯主要是針對外語基礎比較差的用戶,其目的是解決基本的語言障礙問題。如今有很多人在閱讀外國文獻時都會先通過機器翻譯來了解大致內容,并且有相當一部分人對翻譯的需求僅限于基本了解即可,并不需要花費人力、物力將其準確翻譯出來,譯文的質量取決于軟件技術。
計算機輔助翻譯軟件則是針對外語水平比較高的用戶群體,強調的是機器翻譯的輔助作用,而不是完全取代人工翻譯。計算機輔助翻譯軟件在翻譯過程中起的作用是提高翻譯人員的翻譯效率,減少或者避免簡單的重復勞動。
(二)應用范圍不同
從機器翻譯的角度來看,日常翻譯的材料主要分為以下6類:1.文學作品;2.非文學出版物;3.法律文件;4.網頁及計算機相關材料;5.情報資料;6.文摘。其中非文學出版物,如產品說明書等一些基于專業語料庫的材料翻譯都可以使用機器翻譯。另外,由于有些文件過于龐大,比如網頁及計算機相關材料每日的更新都數以萬計,倘若使用人工翻譯根本應接不暇,因而需要使用機器翻譯。此外,對于有些文本讀者不需要仔細閱讀整篇文章,只需要讀懂大概的內容即可,此類文本翻譯也可以使用機器翻譯。
法律文獻對措辭和術語的準確性要求極高,擁有龐大的專業法律語料庫的機器翻譯軟件可以勉強勝任此類翻譯。但是為了避免不必要的麻煩,尤其是涉及到法律方面的糾紛,還是應當采取計算機輔助翻譯,以專業譯員的翻譯為準。最后,文學翻譯由于其問題的特殊性,因此只能用計算機輔助翻譯,通過譯者問文學作品的理解輔以計算機輔助翻譯軟件進行翻譯。總而言之,哪種材料運用哪種翻譯技術還是要根據材料的性質來定,但是在翻譯過程中,無論機器翻譯還是計算機輔助翻譯都是不可或缺的翻譯技術。
(三)翻譯引擎不同
機器翻譯軟件更注重綜合功能,因為機器翻譯沒有人工的參與,也沒有審核等環節,譯文即最終結果,因此為了保證翻譯效果,機器翻譯軟件對語法庫、專業詞庫等要求比較高。在前面已經介紹了機器翻譯技術原理的兩個分支,基于語法分析和基于語料庫,此處不再贅述。
計算機輔助翻譯的翻譯引擎包括四個方面:1.在翻譯過程中軟件會自動存儲翻譯結果,在之后的翻譯中自動搜索記憶庫,并將當前句子與庫中存在的翻譯單元進行對比和匹配,篩選出一定程度上較符合的譯文作為參考譯文。2.術語管理功能。術語管理是計算機輔助翻譯軟件的另一個重要特點。據統計,目前市場上有95%的翻譯是非文學翻譯,也就意味著幾乎每篇文檔都包含很多的專業術語,例如科技、法律、經濟等。而翻譯記憶軟件中有一個術語管理工具來規范所有的專業術語,以Trados為例,Trados系統中包括MultiTerm軟件,該軟件可以將目前市場上的主流格式文檔制作成術語庫并添加到Trados軟件中,在翻譯時,它會自動搜索該術語庫,如果該術語存在,它的翻譯就會顯示在Workbench的窗口。
五、結論
如今雖然機器翻譯的發展和受重視程度越來越不如計算機輔助翻譯,且機器翻譯中依然存在著這樣或者那樣的問題為很多人詬病,但是它的易用性為人們提供了極大的方便,對于大量并且精確性要求不高的文本機器翻譯要優于計算機輔助翻譯。而另一方面,計算機輔助翻譯先進的記憶技術、可共享交流的翻譯記憶庫和術語庫為專業翻譯人員提供了一個高效率、高質量的翻譯平臺,從而大大提高了譯員的翻譯效率和翻譯質量。
【參考文獻】
[1]李魯.機器翻譯與計算機輔助翻譯研究與探索[J].東南大學學報(哲學社會科學版),2002(03):175-179.
[2]賴怡霏.機器翻譯與計算機輔助翻譯的比較研究[J].德宏師范高等專科學校學報,2014(02):97-99+85.
[3]李艷勤.淺析計算機輔助翻譯中的翻譯記憶技術和軟件[A].福建省外國語文學會.福建省外國語文學會2010年年會論文集[C].福建省外國語文學會,2010:13.
[4]薛文楓.中國機器翻譯軟件與計算機輔助翻譯軟件的發展與現狀[J].西南民族大學學報(人文社科版),2008,S1:56-57.
[5]張治中,俞可懷.“機器翻譯”還是“機器輔助翻譯”——對“機器翻譯”之管見[J].大連理工大學學報(社會科學版),2002(03):54-58.
[6]Shuttleworth,work&Cowie;,Moria.ictionary of Translation Studies[M].St.Jerome publishing,1997.
責任編輯:張麗