摘 要:本文作者選擇章振邦主編的《新編英語語法教程》學生用書第五版中的第十六章有關虛擬式的例句作為測試語料,對當下流行的百度在線翻譯軟件的譯文質量進行人工測評。本文研究的目的一方面是為提高翻譯學員對機譯軟件譯文質量的鑒別能力提供參考。另一方面為軟件開發者了解使用者的要求和期望提供依據。
關鍵詞:人工測評;英漢機譯
作者簡介: 劉嵐申(1991-),女 吉林省長春市人 陜西師范大學本科生,主要研究方向:翻譯。
[中圖分類號]:H059 [文獻標識碼]:A
[文章編號]:1002-2139(2013)-21--02
1. 測評研究對象及譯文質量考查點
1.1 百度在線翻譯軟件使用現狀
百度翻譯是一項免費的在線翻譯服務,支持中英文之間的文本和網頁翻譯功能。
1.2 虛擬式英漢翻譯考查點
虛擬式,作為專門表達假設意義和其他非事實意義的動詞形式,僅是古英語遺留下來的殘余。它僅有兩個形式,即be-型虛擬式和were-型虛擬式。
根據其語法特點,在虛擬式英漢翻譯中不可回避的三個問題便是:
① 說話人的意圖是什么,想要做什么而沒做或不想做什么卻做了?
② 遇到標志假設含義的詞組或句型,如何對應為目標語言的虛擬含義表達形式?
③ 這個假設是在什么時間做的,過去,現在還是未來?
基于以上問題,作者把虛擬式英漢機譯過程中的考查點歸納為三個方面,即“含義傳達”、“標志性結構識別”、“時間定位”。
2. 測評標準和測評方法
2.1 測評標準
目前常用的機譯譯文評價的標準是“流利度”和“忠實度”這兩個標準。
流利度。包括語法正確性和慣用語選擇兩個方面,結合虛擬式英漢機譯的考查點則指“時間定位”和“標志性結構識別”。
忠實度。輸出譯文能否傳達與原文相同的意思?此項標準應對虛擬式英漢機譯的考查點——“含義轉達”。
2.2 測評方法
作者采用的是人工評測方法,下面是作者設計的打分標準表(見表一、表二)。
3.測評結果及問題分析
3.1 測評結果
在由三位評價者獨立地對機譯譯文的19個句子打分后,計算出每個句子在相應測評標準下的平均得分。而后把每個句子的各項平均得分加起來得到單項例句譯文質量的相對總分(滿分為10分,見表三,按討論需要展示部分數據)。
根據以上圖表當中的數值,作者將最后一列19個例句譯文質量的相對總分加起來再除以例句的數目,得到一個平均數值——接受測評機器系統對虛擬式英漢翻譯處理能力的參考數值。經計算,該數值為6.69,即百度在線翻譯軟件可以保證虛擬式英漢譯文的質量維持在60%—70%之間,處理效果比較理想,基本實現譯文的通暢性和準確性。
3.2 測評結果分析
3.2.1 含義傳達
這里的“含義”指字面意義之上的“隱含義”。百度在線翻譯軟件是如何處理這一隱含義的呢?測評語料第5、17句,在譯文的準確度上都值得了0分。例如:
例句5:Long live the People’s Republic of China!
機譯譯文:長的中華人民共和國中生活。
正確譯文:中華人民共和國萬歲!
很顯然,機器沒有翻譯出“live”的隱含義——“生生不息”,而且也沒有識別出倒裝結構,正常的語序是“The People's Republic of China live long !” 所以只翻譯出“生活”的字面含義是不夠的,本句的隱含義是“祝愿中華人民共和國國運昌盛,薪火世代相傳”。
這廣為人知的句子肯定會收錄在機器的語料庫系統當中,怎會出現這種低級錯誤?那么,在哪可以彌補這個錯誤呢?原來在百度在線翻譯操作界面的右下角有一排小字提醒用戶:新!為您提供類似表述。這樣就能彌補機器翻譯出錯的情況。
3.2.2 標志性結構識別
這里所謂的“標志性結構識別”是指像“if only”,“as if”和“ I wish” 這些慣用表達形式,從而把源語言轉換成目標語言相應的結構。但是機器是否快速準確地辨認出這些慣用表達形式呢?
作者發現在句子結構較為簡單的情況下,機器能夠做到這一點,如表三當中的第13句到第18句的譯文流利度的分數都在4分以上,這是因為這些例句的譯文在標志性結構識別測評項目上得分接近滿分。例如:
例句18:But for your help,I couldn't have achieved anything.
機譯譯文:要不是你的幫助,我不可能取得任何東西。
在此例句中,機器很好地識別了“but for” 句式,準確翻譯為“要不是……”來表達否定對過去事實的假設含義。但是當句子結構稍微難上一點,機器翻譯就回到了字對字的翻譯起點。
3.2.3 時間定位
一般來說,機器翻譯在動詞的“時、體、態、式”這四個方面的處理上,“時”的處理是最理想的。因為英語的動詞本身有時態的變化,可以根據動詞的形位變化來判斷事件發生的時間。例如:
例句6:He spoke to me as if I were deaf. (動詞過去式,對過去事件的虛擬)
機譯譯文:他跟我說話時就好像我是聾子。
例句7:I wish it were spring all the year round. (表常態的時間狀語,對現在事件的虛擬)
機譯譯文:我希望這一年四季都是春天。
4.結束語
首先,從數據分析來看,百度在線翻譯軟件可以保證虛擬式英漢譯文的質量維持在60%—70%之間,處理效果比較理想。其次,從翻譯標準來衡量,譯文的忠實度要比譯文的流利度處理得要好,可以基本保證假設含義的傳達,但是語法結構的處理和識別能力就相對弱一些。
最后,從具體實例來看,在虛擬式三大語法考查點當中,百度在線翻譯處理得最好的便是時間定位,基本反映出了說話人的情景。
參考文獻:
[1] http://baike.baidu.com/view/608784.htm
[2] 章振邦,新編英語語法教程學生用書第五版,上海外語教育出版社,181—190
[3] Philipp Koehn ,統計機器翻譯譯本,電子工業出版社,147—148
[4] http://nlp.ict.ac.cn/evalshow.php?id=2013