郭亞軍 徐 芮
(長安大學(xué)外國語學(xué)院,陜西 西安 710064)
隨著中日兩國政治、經(jīng)濟(jì)及文化交流的日益頻繁,日漢翻譯的需求也與日俱增。在信息技術(shù)和人工智能技術(shù)飛速發(fā)展之際,機(jī)器翻譯應(yīng)運(yùn)而生,并在人們的日常生活中扮演著越來越重要的角色?,F(xiàn)代社會(huì)幾乎人人都擁有智能手機(jī),非常便于使用各種機(jī)器翻譯應(yīng)用軟件。許多日語學(xué)習(xí)者,特別是初級(jí)水平的學(xué)習(xí)者,都會(huì)頻繁使用手機(jī)機(jī)器翻譯工具。但是,機(jī)器翻譯的效果到底如何,能不能完全依賴于它的翻譯結(jié)果等,這些問題的答案都尚不明確。
目前研究機(jī)器翻譯的文章有很多,但主要集中在日英翻譯(吉見,2001;吉見,2003;小田,2019)和漢英翻譯(何,2018;馮,2001;梁,2018;張,2019;張,2008),很少有關(guān)于漢日翻譯的研究。并且選擇研究的文本數(shù)量較少,文本題材也較局限,多為科技類(陳,2005)、報(bào)紙類(張,2019)、演講稿類(孫,2017;)等,幾乎沒有以日常生活類文本作為研究對象。此外,提出的對策多從機(jī)器翻譯開發(fā)者(王,2007;謝,2004)和職業(yè)翻譯工作者(董,2019;陳,2019)的角度出發(fā),很少有從日語學(xué)習(xí)者和日語水平較低者的角度進(jìn)行分析。
本文選擇Baidu 翻譯為研究對象,以大學(xué)日語權(quán)威教科書《綜合日語第一冊》為翻譯文本,以教育部2006 年發(fā)布的《機(jī)器翻譯評(píng)測規(guī)范》為參考準(zhǔn)則,通過比較分析文本的Baidu翻譯結(jié)果與教師參考書中的翻譯范本,評(píng)估Baidu 翻譯的日漢翻譯特點(diǎn)與質(zhì)量,找出機(jī)器翻譯的問題并提出對策。
根據(jù)艾瑞PC Web 指數(shù),2018 年10 月到2019 年10 月,Baidu 翻譯持續(xù)位列在線翻譯領(lǐng)域月度覆蓋人數(shù)第一名。數(shù)據(jù)分析可得,Baidu 翻譯月平均覆蓋人數(shù)約為4167 萬,最高可達(dá)4600 萬,且整體呈上升趨勢,是當(dāng)前在中國使用人數(shù)最多的在線翻譯平臺(tái),知名度較高,使用范圍較廣,接入產(chǎn)品較多。
筆者對長安大學(xué)日語專業(yè)學(xué)生Baidu 翻譯平臺(tái)的使用狀況進(jìn)行了問卷調(diào)查,發(fā)放問卷78 份,回收78 份,其中有效問卷78 份。問卷結(jié)果表明,78 名受訪者中,關(guān)于Baidu 翻譯的使用頻度,所有的學(xué)生均表示在日語學(xué)習(xí)過程中使用過Baidu 翻譯或其合作方的翻譯功能;關(guān)于Baidu 翻譯的質(zhì)量,有20%的學(xué)生對Baidu 翻譯質(zhì)量表示滿意,68%的學(xué)生認(rèn)為Baidu 翻譯的結(jié)果一般,僅12%的學(xué)生表示不滿意。由此可見,日語學(xué)習(xí)者對于Baidu 翻譯總體接受度較高,但對其翻譯質(zhì)量持中立態(tài)度較多。那么Baidu 翻譯的質(zhì)量究竟如何,筆者選取《綜合日語第一冊》作為語料庫進(jìn)行了考察。
本文將《綜合日語第一冊》的Baidu 翻譯結(jié)果與《綜合日語第一冊教師用書》會(huì)話課文的譯文進(jìn)行對比分析,以2006年教育部發(fā)行的《機(jī)器翻譯系統(tǒng)評(píng)測規(guī)范》為打分標(biāo)準(zhǔn)。滿分為5 分,根據(jù)翻譯質(zhì)量的優(yōu)劣對翻譯結(jié)果打分。具體標(biāo)準(zhǔn)如下表1:

表1 《機(jī)器翻譯系統(tǒng)評(píng)測規(guī)范》
《綜合日語第一冊》共有十五課,前四課無課文,因此本文選擇第5-15 課課文展開研究,每課第一、二單元為會(huì)話文,第三單元為讀解文;共計(jì)22 篇會(huì)話文,11 篇讀解文。具體得分如下表2:
從表2 可以看出,讀解文的平均分?jǐn)?shù)為4.64 分,會(huì)話文的平均分?jǐn)?shù)為3.91 分。換算成百分比即讀解文的平均準(zhǔn)確率為92.8%,會(huì)話文的平均準(zhǔn)確率為78.2%。從得分?jǐn)?shù)據(jù)可以看出,讀解文分?jǐn)?shù)較高,會(huì)話文分?jǐn)?shù)較低。即Baidu 翻譯對相對正式的文本翻譯非常準(zhǔn)確,而在較口語化的日常會(huì)話文本中,水平較低。就總體而言,機(jī)器翻譯結(jié)果得分均為3 及以上,即準(zhǔn)確率為60%及以上。大部分譯文傳達(dá)了原始文本的大概含義,與原文在局部上有所不同。在大多數(shù)情況下都可以參考原文,迅速糾正錯(cuò)誤。有時(shí)甚至無需參考原文也可理解譯文的含義。
1、讀解類文章
讀解類的問題主要是部分詞匯翻譯不準(zhǔn)確。例如中日同形詞「大學(xué)院」的翻譯結(jié)果仍然是“大學(xué)院”,但在中國,并不使用“大學(xué)院”一詞,而是“研究學(xué)院”。「歴史學(xué)部」一詞的機(jī)器翻譯是“歷史學(xué)部”,但是中文常使用的是“歷史系”?!复髮W(xué)祭」的翻譯結(jié)果是“大學(xué)祭”,中文中沒有這樣的詞,應(yīng)翻譯為文化節(jié)。
雖然讀解類的文章存在一些問題,但大多數(shù)都是不符合漢語習(xí)慣、可忽略的小錯(cuò)誤,不會(huì)影響讀者的理解。無需看原文也可猜測到大致意思。因此本文的研究重點(diǎn)主要集中在會(huì)話類文章。
2、會(huì)話類文章
會(huì)話類文章的翻譯結(jié)果扣分的主要問題如下:

表2 文章類得分統(tǒng)計(jì)數(shù)據(jù)
(1)語氣詞誤譯。
①原文:鈴木:あれ?知り合いですか。
Baidu 翻譯結(jié)果:那是我認(rèn)識(shí)的人嗎?
參考書翻譯:咦?你們認(rèn)識(shí)呀?
例文選自第5 課第1 單元,會(huì)話場景為:高橋?qū)π⊥跽f:“昨天的事情對不起?!庇谑且慌缘拟從締栃⊥酰骸斑??你們認(rèn)識(shí)呀?”機(jī)器翻譯卻譯為“那是我認(rèn)識(shí)的人嗎?”這里「あれ」的翻譯不正確,此處為語氣詞,表達(dá)了說話人輕微的驚訝,應(yīng)該譯為“咦”,而不是指示詞“那個(gè)”。人們可以根據(jù)上下文區(qū)分「あれ」的不同用法,而機(jī)器翻譯卻無法做到,常常在翻譯語氣詞時(shí)出現(xiàn)錯(cuò)誤。
②原文:あ、そうですか。
Baidu 翻譯結(jié)果:啊,是嗎?
參考書的翻譯:哦,是這樣啊!
例文選自第5 課第2 單元,會(huì)話場景為高橋又拿出來另一張照片,指著照片上的小狗說她的戀人是這個(gè),名字是太郎。小王看完后說:“哦,是這樣?。 贝颂幷f話人是一種恍然大悟的語氣。Baidu 翻譯的結(jié)果是一種疑問、不確定的語氣“啊,是嗎”。
(2)省略部分誤譯。
①原文:王:おばあさんは、お母さんのお母さんですか。
高橋:いいえ、父の母です。
Baidu 翻譯結(jié)果:王:奶奶是媽媽的媽媽嗎?
高橋:不,我是爸爸的媽媽。
參考書的翻譯:王:奶奶是母親的母親嗎?
高橋:不,是我父親的母親。
例文選自第5 課第2 單元,會(huì)話場景為小王指著照片上的老奶奶,問高橋是她母親的母親嗎?即確認(rèn)是否為高橋的外婆。參考書翻譯是“不,是我父親的母親。”Baidu 翻譯結(jié)果是“不,我是爸爸的媽媽。”日語原文中高橋的回答省略了主語“奶奶”,因此正確的是“不,(這個(gè)照片上的老奶奶)是我父親的母親?!睓C(jī)器翻譯對省略部分的處理往往不能達(dá)到令人滿意的效果。
②原文:王:朝8 時(shí)からです。午後はだいたい5 時(shí)50 分までです。
高橋:そうですか。きょうも?
王:いいえ、きょうは7 時(shí)50 分までです。
Baidu 翻譯結(jié)果:王:早上8 點(diǎn)開始。下午大概5 點(diǎn)50 分。
高橋:是嗎?今天也要嘗試一下。
王:不,今天7 點(diǎn)50 分結(jié)束。
參考書的翻譯:王:早上8 點(diǎn)開始。下午大概5 點(diǎn)50 分。
高橋:是嗎?今天也是這樣嗎
王:不,今天7 點(diǎn)50 分結(jié)束。
例文選自第6 課第2 單元,會(huì)話場景為小王和高橋走在校園里,高橋問中國的大學(xué)每天的第一節(jié)課幾點(diǎn)開始,小王回答,從早上8 點(diǎn)開始到下午大概5 點(diǎn)50 分結(jié)束。高橋問,是嗎,今天也是這樣嗎?小王說,不是的,今天7 點(diǎn)50 結(jié)束。Baidu 翻譯把高橋第二次的提問「きょうも?」翻譯成“今天也要嘗試一下”,但這里的意思是“今天也是這樣嗎?”當(dāng)省略謂詞時(shí),機(jī)器翻譯會(huì)自己進(jìn)行補(bǔ)充,但補(bǔ)充部分常常出錯(cuò)。
(3)人物性別誤譯。會(huì)話中人物被默認(rèn)譯為男性。
原文:ああ、その人は姉の婚約者です。
Baidu 翻譯結(jié)果:啊,那個(gè)人是姐姐的未婚妻。
參考書的翻譯:啊,那個(gè)人是姐姐的未婚夫。
例文選自第5 課第2 單元,會(huì)話場景為兩個(gè)人正在討論各自的家庭,指著照片上一位男士說那個(gè)人是姐姐的未婚夫。對于日語中「婚約者」一詞,機(jī)器翻譯無法判斷男女,但根據(jù)文中“姐姐的婚約者”可以判斷為男性,應(yīng)該翻譯成未婚夫。機(jī)器翻譯則判斷為女性,錯(cuò)譯成未婚妻。日語中的許多詞都沒有性別區(qū)分,如「先輩」、「後輩」、「さん」。這種情況在漢語中也會(huì)出現(xiàn),如“雨神”這個(gè)詞,日語中有男女之分,「雨男」、「雨女」。這是由于詞匯分布的不均勻性導(dǎo)致的。
(4)人稱翻譯生硬。
原文:「高橋さんは鈴木さんのガールフレンドですか?!?/p>
Baidu 翻譯結(jié)果:高橋是鈴木的女朋友嗎?
參考書的翻譯:高橋是你的女朋友嗎?
例文選自第5 課第1 單元,會(huì)話場景為小王悄悄問鈴木,高橋是不是他的女朋友。當(dāng)在對話中與熟識(shí)的人面對面交談時(shí),機(jī)器翻譯會(huì)直接翻譯對方的名字,但是從中文的角度來看,這樣的翻譯非常生硬。最好翻譯成第二個(gè)人稱“你”或“您”。這里的小王和鈴木面對面交談,“鈴木さん”直接翻譯成鈴木較為生硬。
(5)特殊詞匯誤譯。
原文:「チーズ!」
Baidu 翻譯結(jié)果:奶酪!
參考書的翻譯:茄子!
例文選自第10 課第1 單元,會(huì)話場景為幾個(gè)人正準(zhǔn)備在北京的一處景點(diǎn)拍照,一起喊「チーズ」,Baidu 翻譯結(jié)果中被翻譯成“奶酪”。但實(shí)際情況是拍照喊的口號(hào)。因此這里應(yīng)該翻譯成中國人拍照時(shí)喊的“茄子”。
(6)專有名詞誤譯。
原文:それは、トンポーロウです。
Baidu 翻譯結(jié)果:那是龍貓。
參考書的翻譯:那是東坡肉。
例文選自第10 課第2 單元,會(huì)話場景為小王品嘗一下正宗的中國菜,其中的一道菜名「トンポーロー」被翻譯成“龍貓”,實(shí)際意思為“東坡肉”。東坡肉為菜名,是固有詞匯。語料庫中未包含,因此翻譯錯(cuò)誤。
(7)多義詞誤譯。
①原文:何時(shí)に大學(xué)を出ますか。
Baidu 翻譯結(jié)果:幾點(diǎn)大學(xué)畢業(yè)?
參考書的翻譯:幾點(diǎn)從學(xué)校出來?
例文選自第8 課第2 單元,會(huì)話場景為小王問高橋幾點(diǎn)從學(xué)校出來,Baidu 翻譯的結(jié)果把這里的動(dòng)詞「出る」翻譯成畢業(yè)的意思,即離開學(xué)校步入社會(huì)。但實(shí)際上這里的含義是“出來,外出去別的地方”。類似的還有第13 課第1 單元中,原文是「寮は女性が入っていてもいい」。這里的意思是“女性可以進(jìn)入”。卻被翻譯成“女性可以入住”。
②原文:高橋:ああ、ここですね。あのう、すみません、それから…
趙:はい。
Baidu 翻譯結(jié)果:高橋:啊,在這里呢。那個(gè),對不起,還有…
趙:好的。
參考書的翻譯:高橋:啊,在這里呢。那個(gè),對不起,還有…
趙:你說吧。
例文選自第6 課第1 單元,會(huì)話場景為圖書館里,趙媛媛想問高橋洗手間在哪里。高橋有點(diǎn)不好意思,所以先說「あのう、すみません、それから…」,即表示有事情想詢問,趙媛媛回答「はい」,即你說吧。這里的「はい」是一種應(yīng)答、回應(yīng),而不是對前面事情的肯定。翻譯多義詞時(shí)常常會(huì)發(fā)生錯(cuò)誤,將錯(cuò)誤的釋義放入句子中會(huì)導(dǎo)致整個(gè)文本產(chǎn)生違和感。
機(jī)器翻譯的優(yōu)點(diǎn)是可以快速翻譯大量文本,但其翻譯結(jié)果仍然需要檢查,質(zhì)量和準(zhǔn)確性也依然落后于人工翻譯。在核對翻譯結(jié)果時(shí),尤其要注意專有名詞,特殊用法詞匯,中日同形詞,人稱,多義詞和人物性別。在會(huì)話類譯文不通順的情況下,要通過關(guān)聯(lián)上下文,判斷句子的語氣和省略。日語學(xué)習(xí)者不可盲目依賴于機(jī)器翻譯,如果可以做到合理地利用機(jī)器翻譯工具,則可以節(jié)省大量查字典的時(shí)間。
通過分析翻譯結(jié)果,可知Baidu 翻譯在翻譯指示代詞,人稱,專有名詞,中日同形詞,多義詞和特殊用法詞匯時(shí)的翻譯準(zhǔn)確度較低,在判斷人物性別和語氣上仍存在較大問題,從而導(dǎo)致整個(gè)文本的翻譯質(zhì)量下降。因此,有以下四種方法可以提高日語機(jī)器翻譯的準(zhǔn)確率。首先,應(yīng)擴(kuò)充語料庫的容量,有必要在語料庫中添加更多專有名詞,例如人名,地名,菜名和書名。其次,對于日語中的多義詞、慣用句和中日同形詞等容易出現(xiàn)錯(cuò)誤的地方需要添加特殊的語言規(guī)則。此外,在人物性別無法判斷時(shí),應(yīng)設(shè)置規(guī)則使機(jī)器翻譯直譯人物名稱,不翻譯帶有男女性別的稱謂。最后,機(jī)器翻譯對于語氣的判斷仍有較大問題,應(yīng)該把基于統(tǒng)計(jì)的機(jī)器翻譯方法與傳統(tǒng)的基于規(guī)則的機(jī)器翻譯方法結(jié)合起來。
本文分析了《綜合日語》中33 篇文章的Baidu 翻譯結(jié)果,通過統(tǒng)計(jì)數(shù)據(jù)可以看出書面文章類翻譯正確率很高,會(huì)話類則較低。因此,日語初學(xué)者及水平較低者應(yīng)根據(jù)文章的種類科學(xué)合理地使用機(jī)器翻譯工具,不可過度依賴機(jī)器翻譯,要將機(jī)器翻譯容易出現(xiàn)錯(cuò)誤的地方與原文再次核對。開發(fā)者應(yīng)對目前出現(xiàn)不足的領(lǐng)域進(jìn)行改善,提高翻譯精度。