李思迪 賀涵薇 曾藝梅

【摘要】? ? 本文通過介紹機器翻譯和譯后編輯的基本概念,對機器翻譯的主要問題加以分析與探討,在此基礎上,根據機器翻譯誤譯類型,以譯后編輯的原則設計為指導思想,總結了譯后編輯所應采取的處理對策,并著重闡述了“俄漢機器翻譯+譯后編輯”新模型的結構與意義。
【關鍵詞】? ? 俄漢機器翻譯? ? 譯后編輯? ? 結構模式
一、俄漢機器翻譯和譯后編輯
(一)機器翻譯的定義
機器翻譯(MT)是利用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的過程,又叫做自動翻譯,但通常也泛指在某些語句或全文與自然語言之間的翻譯。機器翻譯技術需要通過計算機數據庫和翻譯軟件系統來完成操作,所以機器翻譯科技的發展離不開計算機、人工智能、語言學、翻譯學等多學科的發展。
(二)譯后編輯的基本概念
譯后編輯是在機器翻譯系統生成的譯文經過源語言到目標語言處理后再進行的進一步完善編輯操作。posteditor一方面可以指代人工的譯后編輯,另一方面也代表了具有譯后編輯功能的譯后編輯器。它是完全獨立于應用程序以及操作系統的后期編輯模塊,需要根據具體操作系統的特點和需求來設計。
譯后編輯,通常是指通過少量的手工修改來完善機器生成的翻譯的流程。譯后編輯的工作量沒有定性、因材料而異。根據修改量的多少,譯后編輯可分為最小PE、快速PE、部分PE、最大PE和完全PE。
文本標準化水平越高,術語越多,則機器翻譯的精準度就越高,且譯后編輯的修改工作量也越小。流行的文字表達方式、創新的構詞方法以及復雜的句法結構都會造成傳統機器翻譯系統的譯文輸出品質低下,從而加大了人工編譯與改寫的工作量。
二、“俄漢機器翻譯+譯后編輯”模式的必要性
(一)機器翻譯的步驟和常見錯誤
一般而言,機器翻譯包括三步驟。第一步,對源語言文本進行譯前編輯,由機器翻譯系統在此流程中對源語言文本加以整理和標記,隨后再根據原文本的語言規律轉化為基于計算機語言編程的中間語。最后,由電腦根據目標語言的句法結構進行對中間語的詞序調整,最后輸出合乎目的、語法標準的翻譯成果。
但由于自然語言存在高復雜性,所以機器翻譯的翻譯質量往往無法達到人們的實際要求。部分原因如下:1.一般情形下,機器不能根據具體語境去判斷多義詞語、一般單詞和專業詞語的真實含義,由此導致詞性分類失敗,產生誤譯、漏譯現象,進而導致翻譯精確度下降。2.由于機器辨別語句結構的能力不強,對各限定詞、修飾成分、詞首的位置等處理能力也不強。當語句結構復雜,且修飾成分較多時,機器只會按照原文字的語句結構進行翻譯,而無法根據語言規范靈活調節,難以判斷語言表層下的含義。3.在詞篇銜接方面,由于詞序不合理、短語和邏輯詞之間的連接方式出現偏差以及語氣的錯誤等問題,使得詞篇在機器翻譯中的銜接程度較低。4.存在譯文軟件數據庫建設更新速度慢、俄漢雙語語料庫不完整、計算機技術發展瓶頸、大數據編程固有規律等問題,也會對譯文的翻譯質量產生負面影響。
(二)譯后編輯的必要性
譯后翻譯的最大優勢,就在于可以保證質量最高化。機器翻譯系統則可保證術語的統一性。因此復雜的、熟悉的工作可以由機器翻譯系統完成,但是譯文質量問題,則需人工對翻譯過程嚴格把關。
譯后的再處理功能,同樣是對用戶語言進行調節和加工的輔助功能,也有助于降低人工翻譯工作量。通常還需加入再處理階段,以實現對各種關鍵性要點的歸攏合并和譯后再處理過程,以此順利獲得一個更高質量的譯文輸出結果。因此機器翻譯得出的譯文由人工進行二次修改,并且在人工譯后編輯后總結規律、改良系統的方案是現階段的最佳方案。
三、譯后編輯方法及原則設想
(一)譯后編輯方法
1.針對上述機器翻譯問題的解決策略
上文總結了機器翻譯中部分常見的錯誤類型:語義內容、語句結構、語意連貫,且進行再次細化,針對性修改與編輯。“對癥下藥”總結出具體的修改方法,即對于語句意義內容和結構,糾正錯譯、補充漏譯、刪除多譯,修改生硬句和晦澀難懂處,糾正符號使用錯誤,檢查核實、人名、地名、書名、數字、時間和單位等。 對于語意連貫的方面,調整字詞順序、增添語法邏輯詞和連接詞,修改結構問題、詞匯翻譯錯誤和時態語態選擇錯誤等錯誤類別。
2.已有經驗借鑒
國外研究者根據機器翻譯的常見錯誤,總結出五條在翻譯后重新編輯時可以使用的策略,依次是:調整句子結構、去除冗余詞匯、修改詞型、增加遺漏的詞語和修改詞匯選擇。其范圍相當寬泛,在進行譯后編輯時可以根據文章類別加以細分。
國內學者從詞匯、句子和語法三個層面提出了相應的譯后編輯策略。在詞匯層面,包括檢查地名、人名和專有名詞的誤譯和漏譯;檢查并調整詞語的順序及詞匯表現等。在句子層面包括對長句進行斷句和平衡句子結構。在語法層面,則提出了確定主語、修改時態和調整語態三大策略。
3.技術創新——利用電腦科技增加云資源庫、專業術語庫
針對語句內容部分的錯譯,便可利用電腦端科技建立專業化的云資源庫、術語庫、縮略詞庫、高頻連詞梳理庫等,持續增加多種庫容量,實現翻譯的高匹配度。如此則需借助科學技術的高效研發、創新突破,進一步加固譯后編輯與機器翻譯的深層合作、必然聯系。除強大的科學技術力量支撐外,仍需要譯后編輯工作者嚴謹科學的工作態度、經驗積累與付出,不斷擴充資源術語庫的匹配容量,實現量變到質變的重大突破。在現今出現的軟件開發功能基礎上,還須加強譯后校對的云資源庫功能,以重點句子語言句法結構、文化誤解等的深層次問題,而不僅僅局限于提升人們對軟件編譯后所使用的便利性上。在這個步驟之前,先需要進行收集和處理加工語料,同時需要正確地對經機器翻譯后的翻譯結果進行錯誤校正和錯誤分類,從而通過研究總結語言層面上存在的大量類似出錯情況,并收集高頻出錯實例。最后所收集和獲得的錯誤樣本都可替換成描述性語言表達,然后再將所描述的研究語言以軟件建模的方式構建,接入到翻譯平臺的下端。
4.人工譯后編輯方法
(1)檢查是否有錯譯、漏譯、多譯的狀況,如有上述狀況及時修改。(2)檢查是否存在專有名詞的翻譯錯誤,專有名詞的錯譯會對文章譯文產生重大偏差。(3)刪改部分過于字面化的翻譯方式和生硬的機械化表達。(4)俄漢雙語類屬不同語系,語言習慣和表達方法有較大差異,需要檢查句子成分是否完整。(5)由于漢語語句相對于俄語語句邏輯表述并不明確清晰,需檢查翻譯后句子的邏輯關系。(6)當出現多個形容詞修飾一個名詞時,機器翻譯往往不能把握句子的核心,這時就需要人工進行處理和加工。(7)注意漢語中長句的俄譯,因為漢語中的多個長句往往只能指多個意群,而機器卻又無法提出具體的斷句,鑒于此,機器常常把某個漢語中長句翻譯成了其他的多個短句,這樣就造成了很多語法錯誤和含義上的誤差。所以需要人工地切分詞句,以增加對譯文的理解性和可讀性。
(二)譯后編輯原則設想
現階段,國內關于新興譯后編輯方面的研究較少,譯后編輯理論尚未完善。但因譯后編輯工作者共同承擔了譯審和翻譯工作的雙重責任,所以需要相關編譯人員的理論思想作為譯后編輯工作的原則參考,從而實現譯后編輯工作的合理性、科學性。
1.文本層面
(1)補足隱藏信息,指的是原文有此類含義,而字面含義卻不能表示,這就涉及了句法、語義、邏輯等信息。通過譯后編輯,適當補足源語言的隱藏信息內容。(2)刪除煩瑣多余信息,指的就是去除了原文的累贅或重復信息,比如:顯性重復、范疇詞等。因為漢語修辭和習慣上的特點,有時同樣的詞匯會交錯重疊地出現,而在機器翻譯時也往往是直接根據原文內容進行逐詞的翻譯,造成了初次翻譯的信息內容比較復雜、冗余,或者煩瑣。所以,在初譯后的翻譯過程中一定要酌情更換或刪去冗雜信息。
2.所指層面
(1)根據“名從源主”的原則,來翻譯具有突出地方特點的專有名詞;按照“名從源主”原則翻譯特色專有名詞,是指劉法公提出的“從‘源頭’上尊重最新公布、最權威部門的譯名”。不過,由于在中國傳統機械編譯法中存在對許多專有名詞的錯譯誤譯,導致無法直接使用,所以在翻譯后的編譯人員必須比較嚴格地按照該準則尋找,才能證實這一譯名的真正來歷。(2)按原文語境,選擇譯文的表述。按原文語境選定的翻譯表述方式,是指通過俄漢雙語中所體現的文化關系,分析主客觀原因,從而選定翻譯表達方式。所以,譯后編者必須根據上下文語境,并且設想預測讀者的反應,選用最合適的翻譯用語,以補充傳統機器翻譯的缺陷。
3.銜接層面
(1)利用詞語替代進行連接。即通過詞語替代銜接是指通過上下文對某個詞語加以替代,以便進行語句連接。通過詞語替代的方法,以實現語篇文本緊湊與銜接的目的。(2)理清邏輯關系,調節句子結構。即根據中俄文本句法的差異和原文實際含義,適當地調整部分句子結構,以表達翻譯的邏輯關系,同時增加文章的銜接和貫通。
4.自然層面
(1)調整詞匯的構成方式,使之更符合漢語使用習慣。根據俄語和漢語在表達習慣上的差異,可以適當更換詞匯,調整說法。機器翻譯大多數會直接根據原文逐字逐句的譯文,這使得譯者無法符合漢語搭配慣例。而且在譯后編輯中需要根據俄語詞匯進行相應的漢語詞語修改和造句。(2)用詞準確,符合文化內涵。譯后編輯需要準確的詞匯,才能更好地展現中俄文化內涵。
四、“俄漢機器翻譯+譯后編輯”的結合模式和意義
近年來,機器翻譯與譯后編輯相結合的模式得到了廣泛的應用。本研究在機器預翻譯后,先處理常見的機器翻譯問題,然后再使用譯后編輯器。如使用了一些銜接手段和信息重組安排方式來處理機器翻譯的邏輯問題。最后,再經過人工編譯后的重新編輯和校正得出最后的譯文。
(一)示意圖
(二)模式部分概述
1.機器翻譯
將選定的俄語文本導入YiCAT在線翻譯管理平臺, 使用格式刪除工具從文本中刪除不相關的格式,只留下簡單的文本。鑒于目前處于早期探索階段,還未完全建立完備的俄漢雙語語料庫,因此暫時選擇平臺配置的網絡翻譯來直接用于預翻譯。在預翻譯后分析俄漢機器翻譯中的錯誤,以便更好地進行譯后編輯。
2.譯后編輯
在預譯后,通常要查看翻譯內容是否有遺漏,格式是否正確,以及標點符號是否有錯,之后再仔細閱讀全文。基于對譯文內容的了解,筆者對機器翻譯的用詞、術語表達、語序、復合句的翻譯以及語句中間的連接詞等問題加以逐一編輯。在此過程中,把所有的問題都標記在備注欄中,從而對俄漢機器翻譯過程中所存在的問題加以分析與匯總,并總結出譯文后的具體編輯對策。計算機輔助翻譯工具生成的翻譯記憶和語料庫內容也為翻譯實踐提供了充分的數據支持,提升了再翻譯此類文本的效率,節省了大量時間。
(三)研究“俄漢機器翻譯+譯后編輯”模式的意義
1.提高翻譯準確性、減少誤譯的存在
機器翻譯技術目前已得到廣泛應用,它可以縮短編譯過程,提高翻譯效率。然而,由于機器翻譯系統的局限性和俄漢語之間的差異性,機器翻譯往往無法達到理想效果。為了取得翻譯質量和效率之間的平衡,譯后編輯技術已成為一種必不可少的實用輔助手段。人工智能時代的機器翻譯融合了經驗主義和理性主義方法,將計算機大數據處理技術與人的認知能力緊密結合。俄漢機器翻譯與譯后編輯技術相輔相成,大大提高了翻譯的準確性。
2.縮短翻譯所需時間、提升效率的途徑
機器翻譯+譯后編輯"的模式,把傳統機器翻譯技術與專業的人工譯后編輯技術相結合,以實現學生更能適應高要求高質量的譯文需求。同時因為翻譯后的編輯工作人員大多為經過專業訓練的語言人才,所以學生們可以迅速發現原文翻譯中需要調整或修正的部分,進而大大地提高了譯文品質。通常情形下,從人工翻譯是在目標文本中獲取同樣水平創造力信息的最佳方法,但卻需要大量時間。而如果首先使用機器翻譯,之后再進行人工處理,該操作過程對于節省時間和提升生產效率來說,無疑是最好的方式。一般情況下,人工翻譯是從目標文本中獲得同等水平創造力的最好方式,但也需要大量時間。若先使用機器翻譯,然后再加以人工處理,該操作過程對節省時間和提高生產效率而言,無疑是極佳的方法。
3.創新模式,跨越多領域發展的助力
在此情況下,譯后編輯與俄漢機器翻譯有機結合的新模式發展快速,機器翻譯翻譯成本低、速度快、人工工作量小。而人工則更能夠發揮其對翻譯精確性的把握,從而提升了翻譯的質量水平。二者相結合的創新模式,使得該模式同時具備機器翻譯與譯后翻譯兩者的綜合優勢,高效準確、保質保量。
“俄漢機器翻譯+譯后編輯”模型,既充分提升了機器翻譯的效率(速度),又充分確保了人工翻譯的質量 (精確性)。這些模式不但適應了俄漢翻譯市場快速增長的需求,同時推動俄漢翻譯技術的迅速發展。
4.開發基礎軟件,動態完善新型模式
該模式是對“俄漢機器翻譯+譯后編輯”模式的新型探索。通過比較機器翻譯譯文的準確性,系統地剖析機翻譯文的錯誤成因,總結錯誤的種類。深入分析了解典型的俄文用詞用句錯誤,并在生成的俄語語法框架下做出形式化說明。最后在自然語言處理領域中,引入一些功能組成部分,如語義字詞典、具有分詞或語義消歧功能的軟件、分析引擎等。使用者可以任意選用功能組成部分并對其進行安裝、編譯和調試。
五、結束語
本研究結果將有助于人們深入地發展翻譯后再編輯的基礎軟件,將其視為一個關鍵功能部分,即將它作為一種重要功能組成部分,在基礎軟件系統之外添加功能到終端,從而動態地完成“俄漢機器翻譯+譯后編輯”的模型,有效促進相關“機器翻譯+譯后編輯”模式的不斷完善與探索。
作者單位:李思迪? ? 賀涵薇? ? 曾藝梅? ? 中南林業科技大學 外國語學院
參? 考? 文? 獻
[1]尹韓君,楚向群.基于譯前處理和譯后編輯的機器譯文質量改善[J].現代商貿工業, 2018,39 26 145-146.
[2]李梅,朱錫明.譯后編輯自動化的英漢機器翻譯新探索[J].中國翻譯, 2013,34(220), 04 85-89.
[3]魏長宏,張春柏.機器翻譯的譯后編輯[J].中國科技翻譯,2007,No.77 03 11+24-26.