【摘要】近幾年,機器翻譯發(fā)展如火如荼,而國產(chǎn)機器翻譯軟件的譯文質(zhì)量如何呢?本文選取了兩家比較有特色的國產(chǎn)機器翻譯平臺——小牛翻譯和新譯翻譯,根據(jù)中國翻譯協(xié)會2016年制定的《本地化翻譯和文檔排版質(zhì)量評估規(guī)范》,對其譯文質(zhì)量進行評價、打分、對比。經(jīng)統(tǒng)計,就譯文質(zhì)量而言,在英譯中方面,小牛翻譯以39.68分優(yōu)于新譯的31.75分;在中譯英方面,新譯翻譯以48.67分稍稍優(yōu)于小牛翻譯的47.64分。就錯誤類型而言,語法錯誤、表述問題、標點問題、冗譯和術(shù)語問題是最為常見的共性問題。
【關(guān)鍵詞】機器翻譯;小牛翻譯;新譯翻譯;譯文質(zhì)量評價
【作者簡介】郭思佳,對外經(jīng)濟貿(mào)易大學。
一、小牛翻譯和新譯翻譯
小牛翻譯(NiuTrans)團隊,依托于東北大學自然語言處理實驗室,在國內(nèi)頂級自然語言處理專家朱靖波的帶領(lǐng)下,于2012年5月成立了沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司,正式進軍機器翻譯領(lǐng)域。此后,小牛翻譯研發(fā)完成小牛翻譯云平臺、語音翻譯APP“牛牛翻譯”、上線騰訊“翻譯君”,并與科大訊飛建立了戰(zhàn)略合作伙伴關(guān)系。小牛翻譯支持近40種語種互譯,并開發(fā)了中文與維吾爾語、蒙語等國內(nèi)7大少數(shù)民族語言互譯的特色功能。
新譯科技(NewTranx)成立于2014年,以智能翻譯、語言資產(chǎn)、輔助翻譯、檢索、語音識別五大核心技術(shù)為基礎(chǔ),已推出在線智能翻譯、在線輔助翻譯平臺、互聯(lián)網(wǎng)語言服務(wù)平臺等產(chǎn)品。公司擁有多達百億句對語料數(shù)據(jù)資產(chǎn),數(shù)據(jù)數(shù)量、翻譯質(zhì)量均在行業(yè)內(nèi)處于領(lǐng)先地位。目前,新譯翻譯支持中文、英語、德語、阿拉伯語等37種熱門語言互譯。
二、小牛翻譯與新譯翻譯英譯中譯文質(zhì)量評價及對比
本文選取了彭博社關(guān)于香港銀行的一段315單詞的報道作為待譯文本,測試小牛翻譯和新譯翻譯英譯中的譯文質(zhì)量。在譯后編輯中,修改小牛翻譯24次,修改新譯翻譯21次。依據(jù)《本地化翻譯和文檔排版質(zhì)量評估規(guī)范》,小牛翻譯共有1處錯譯、2處冗譯、1處漏譯和1處亂碼共5處嚴重錯誤,4處術(shù)語不當?shù)囊话沐e誤,3處語法錯誤、4處措辭問題、6處標點錯誤、1處空格問題、1處格式錯誤共15處次要錯誤;新譯翻譯共有2處嚴重錯譯的重大錯誤,4處錯譯、3錯冗譯共7處嚴重錯誤,2處術(shù)語不當?shù)囊话沐e誤,3處語法錯誤、2處措辭問題、1處空格問題、3處標點錯誤和1處數(shù)字格式等共10處次要錯誤。
根據(jù)公式:質(zhì)量得分=100-1000(重大錯誤數(shù)量×2 + 嚴重錯誤數(shù)量×1.5 + 一般錯誤數(shù)量×1 + 次要錯誤數(shù)量×0.5)/有效譯文字數(shù),得到小牛翻譯質(zhì)量得分為39.68分,新譯翻譯質(zhì)量得分為31.75分。由此可見,小牛翻譯英譯中的譯文質(zhì)量略勝一籌,遠高于新譯翻譯。
在英譯中方面,小牛翻譯標點問題最為突出,占25%;術(shù)語不當和表述問題緊隨其后,均為17%;語法錯誤也較為嚴重,占比13%。而新譯翻譯錯譯問題最為突出,占19%;語法錯誤、冗譯和標點問題也較為嚴重,均占14%;其中,嚴重錯誤占10%,嚴重影響了譯文質(zhì)量。
小牛翻譯和新譯翻譯的錯誤類型也有很多共通之處,如標點錯誤、語法錯誤、表述不準確等。所以,在上述方面,其他國產(chǎn)翻譯軟件也可以加以借鑒,努力提升譯文質(zhì)量。
三、小牛翻譯與新譯翻譯中譯英譯文質(zhì)量評價及對比
本文選取華為公司輪值CEO徐直軍在2014年度全球移動寬帶論壇上的發(fā)言作為待譯文本,共487字,測試小牛翻譯和新譯翻譯中譯英的譯文質(zhì)量。依據(jù)華為官方發(fā)布的譯文,對機器翻譯譯文進行譯后編輯,修改小牛翻譯35次,修改新譯翻譯30次。依據(jù)《本地化翻譯和文檔排版質(zhì)量評估規(guī)范》,小牛翻譯有4處冗譯、2處漏譯共6處嚴重錯誤,4處術(shù)語不當?shù)囊话沐e誤,14處語法錯誤、9處表述問題、1處換行、1處格式問題共25處次要錯誤;新譯翻譯有2處錯譯、3處冗譯、2處漏譯共7處嚴重錯誤,6處術(shù)語不當?shù)囊话沐e誤,7處語法錯誤、7處表述不當、2處格式錯誤、1處標點共17處次要錯誤。
根據(jù)公式:質(zhì)量得分=100-1000(重大錯誤數(shù)量×2 + 嚴重錯誤數(shù)量×1.5 + 一般錯誤數(shù)量×1 + 次要錯誤數(shù)量×0.5)/有效譯文字數(shù),可得小牛翻譯質(zhì)量得分為47.64分,新譯翻譯質(zhì)量得分為48.67分。因此,小牛翻譯和新譯翻譯在中譯英方面,譯文質(zhì)量相差不多,但新譯翻譯略勝一籌。
在中譯英方面,小牛翻譯語法錯誤占比最高,為40%;表述問題緊隨其后,為26%;術(shù)語不準確和冗譯并列第三,均為11%。而新譯翻譯,語法錯誤和表述問題并列第一,均為23%;術(shù)語不當和冗譯問題,分別占比20%和10%。所以,中譯英方面小牛翻譯和新譯翻譯不僅譯文質(zhì)量相差不多,錯誤類型也如出一轍。由此可見,國產(chǎn)機器翻譯軟件在中譯英方面,應(yīng)該著重提高語法準確性,表述的恰當性和術(shù)語的準確性。同時,應(yīng)加強地道英文語篇的機器學習訓練,提高語言的簡潔性,從而減少冗譯,甚至錯譯問題。
四、結(jié)語
本文根據(jù)中國翻譯協(xié)會2016年制定的《本地化翻譯和文檔排版質(zhì)量評估規(guī)范》對小牛翻譯和新譯翻譯的譯文質(zhì)量進行了評價,以量化的方式計算得出二者的譯文質(zhì)量分數(shù),并統(tǒng)計分析了主要的錯誤類型。雖然本文選取的測試文本有限,得出的結(jié)果具有隨機性,但在一定程度上反映了其不足。本文作為一次嘗試性探究,希望為今后的機器翻譯譯文質(zhì)量測評提供借鑒。
參考文獻:
[1]周光父,高巖杰.論機器翻譯質(zhì)量的評估[J].上海科技翻譯,1989 (04).
[2]馮全功,崔啟亮.譯后編輯研究:焦點透析與發(fā)展趨勢[J].上海翻譯, 2016(06).
[3]本地化翻譯和文檔排版質(zhì)量評估規(guī)范[J].2016.