經驗人:胡 偉
“百度翻譯”是互聯網上常用的一款免費在線翻譯工具,對英漢翻譯起到一定的輔助作用,筆者利用該工具將若干不同層次的英語語句翻譯成中文,對結果進行人工評測,并給出初步改進策略,希望對讀者有一定幫助。
“百度翻譯”(網址:http://fanyi.baidu.com/#auto/zh/)是互聯網上常用的一款免費在線翻譯工具,現實中越來越多的用戶依賴于該翻譯工具進行翻譯,并希望有較好的準確性。筆者將若干難易程度不同的英語句式分別用該翻譯工具進行翻譯,并對結果進行分析和評述,進而提出基本改進策略,希望能進一步提高“百度翻譯”的翻譯質量。
首先打開“百度翻譯”網頁,將待翻譯的英語源語言輸入左邊的方框,點擊翻譯按鈕,軟件會自動將中文翻譯結果顯示在右邊的方框中。如果點擊右邊方框中的中文翻譯結果會出現一個下拉菜單,顯示若干條其他備選翻譯結果供參考。例如在左邊方框中輸入英文“She is under the weather.”點擊翻譯按鈕后顯示的中文翻譯為“她在天氣下”,點擊該語句將顯示其他可能的翻譯結果,如下截圖所示:

有時給出的中文翻譯不一定是最準確的,可以點擊該中文句子顯示下拉菜單查看是否有更佳的翻譯。
首先對比較簡單的英語語句進行翻譯,輸入以下兩個英文語句:
(1)I want to buy a cartoon book tomorrow.
(2)She is used to staying up late.
給出的首選翻譯結果分別為:
(1)我明天要買一本卡通書。
(2)她習慣熬夜了。
對于此類簡單的英語語句,百度翻譯能給出較好的翻譯結果,可以識別 be used to,stay up late 一類比較經典的短語詞組。
由于客觀條件限制,筆者選取了約30 條含有常用英語習語或成語的語句進行測試,備選結果中都能找到基本正確的中文翻譯,例如以下面四個帶有英語習語或成語的語句在“百度翻譯”中進行翻譯的結果為例,這四個英文句子是:
(1)She is under the weather.
(2)He is all thumbs.
(3)You shouldn’t pass the buck.
(4)an old flame。經過翻譯,從“百度翻譯”提供的備選結果中均可以找到基本正確的對應中文,較佳的翻譯結果分別如下:
(1)她心情不好;她不舒服。
(2)他笨手笨腳。
(3)你不應該推卸責任。
(4)舊情人。
可見對于比較常用的習語或者成語,“百度翻譯”的正確率還是較高的。不過對于少數不常用的習語“百度翻譯”只能按照字面意義進行翻譯,例如對如下兩個習語:Cordelia’s Gift(女性真誠的聲音),be a Jason(薄情郎),“百度翻譯”給出的所有中文參考結果基本都是按照字面進行翻譯,無法識別隱含的意義,從而與正確的中文本意有實質性差別。
首先嘗試對英文“All the teachers did not attend the meeting yesterday”進行翻譯,這是一種比較特殊的否定句,all 與not 構成的否定句往往表示部分否定,有時not 可以后置于謂語中,屬于英語習慣表達方式,該句實際上等價于“Not all the teachers attended the meeting yesterday.”對應的正確中文意思是:“不是所有的老師都參加了昨天的會議?!钡恰鞍俣确g”翻譯的結果為:“所有的老師都沒有參加昨天的會議.”備選結果中也沒有部分否定的表達,與原句意思有實質性差別,可見沒有識別出其中部分否定的特殊結構。
再對英文“You can not be too careful in choosing friends.”進行翻譯,“百度翻譯”翻譯的結果為“在選擇朋友時,你不能太小心?!被蚱渌e誤表達。這又是典型的按照字面翻譯導致謬誤的實例。Cannot…too(much)…這種特殊否定結構往往表示強烈的肯定語氣,表示“無論怎么樣…都不為過;要非常的…”。所以該句對應的正確中文意思是:“你選擇朋友時越小心越好。”
再看英文“I will stay here for 3 more months.”,該句的正確中文意思是:“我將在這里再多待三個月?!闭f話人打算在原來逗留的時間上再另外延長三個月,而“百度翻譯”給出的所有備選結果都與原意差別很大,其中最好的翻譯結果為:“我會在這里待三個多月的?!笨梢姏]有識別出3 more 這中特殊表達,而誤以為是more than 3,導致翻譯成3 個多月。
最后對英文“She will make him a good wife.”進行翻譯,“百度翻譯”給出的中文結果如下截圖所示:

從中發現一個有趣的現象,“百度翻譯”對make him a good wife 這個句式即按照賓補結構又按照雙賓結構分別進行了翻譯,所以出現兩個大相徑庭的中文表述,一個是:“她會讓他成為一個好妻子?!绷硪粋€是:“她會成為他的好妻子?!憋@然第一種表述有明顯的現實邏輯錯誤,男性的他是不可能成為妻子的。而第二種表述基本符合本意。由于有客觀現實邏輯的約束,此處make 引導的只能是雙賓結構,實際上該英文等價于“She will make a good wife for him.”,正確的中文翻譯是:“她會為他成為一個好妻子?!?/p>
通過以上測試可見,百度翻譯對于一些特殊句式不能很好識別與翻譯,并且缺乏基于客觀現實的邏輯判定程序,進而對于某些特殊句式構成的句子也就不能排除干擾項給出準確的翻譯。
通過以上分析不難看出,“百度翻譯”對于較簡單的句式和固定表達,翻譯的正確率較高,對于不常用的習語成語或某些特殊的句式結構,不能有效識別深層含義從而導致翻譯結果失真,可以通過以下方面改進翻譯質量。
1.進一步加大自身語料庫建設,可以通過開放性輸入平臺的方式最大程度收集英文固定表達形式及對應的中文意思,定期由英漢語料庫數據員加以篩選確認納入語料庫,以盡可能多的識別具有固定表達形式的英語習語、成語、慣用語等。
2.借助百度自身搜索引擎(https://www.baidu.com/)的優勢,對需要翻譯的英語語句在互聯網中進行模糊匹配搜索,找出其他網頁或者數據庫中的關聯信息,作為翻譯的參考。比如Cordelia’s Gift(女性真誠的聲音),“百度翻譯”未能給出正確的隱含意義,但是通過百度搜索引擎可以找到涉及該短語的網頁(參見:http://zhidao.baidu.com/link?url=h0QpBZmypFnm LnijUUyfZ8K5XMuUPkVLv -g3NVKYZVIgsPX4sN GzL3eP5VPFK4dndJNESI5V1CnSk7OT5EhnaJ -mCdbfEocrFQqRu_ZCQ4_;
http://wenku.baidu.com/link?url=oI8oBGPkF3 v4WjRWpwvIyLXz4Arj4kbrdP3k8jsOMnkcERxx1Iy 1SJ5KMDwdDY9UJvQ6oPnFM7RwsrfXRYeZBVa 1zfPEfvAlvXAHHANcOtu;),從中可以清楚的了解到該短語的意義,并且在有道在線字典中(http://dict.youdao.com/)對 Cordelia’s Gift,be a Jason 都有正確的注解,從而可以借助這些網頁或數據庫的信息修正百度翻譯自身的翻譯結果。
3.引入基于知識庫和專家推理的算法,從而可以避免有明顯知識錯誤和邏輯錯誤的翻譯結果。
筆者通過實例對“百度翻譯”英譯漢質量進行了初步評述。總體上,對簡單英語句和常用英語短語翻譯結果正確率較高,對不常用短語和某些特殊句式不能進行正確翻譯,并給出了改進策略,希望對讀者有一定幫助。