馬英順
摘 要:翻譯是一個極其復雜的過程,從源語言的輸入到目的語的輸出是各種主客體因素綜合作用下的結果。現有的機器翻譯系統進行翻譯的依據基本都是我們所輸入的源語言的句子,這也是現有機械翻譯不夠“智能”、太過死板的根本原因。本文從語言外語境的角度入手,研究如何在現有機械翻譯的基礎上加上語言外語境的約束,使機械翻譯輸出的目的語更準確、更切合目的語的文化背景和社會背景。
關鍵詞:機械翻譯 語用學 言外語境
自從人工智能翻譯飛速發展并在翻譯界占據半壁江山之后,其與人工翻譯之間的矛盾便一直存在。那么機械翻譯能否取代人工翻譯呢,在第十七屆全國翻譯研討會上訊飛北京研究院院長、訊飛AI研究院副院長王士進在說,人工智能在全球范圍內掀起發展高潮,不僅是作為各個國家和地區的戰略發展重點,更體現在傳統工業上改變了人們的生產和生活模式。但王士進院長強調我們應該理性地看待機器翻譯,機器翻譯雖然在不斷地進步,但就目前來看并不能完全滿足翻譯的需求。普通機器翻譯的優勢是高速低成本,但是在涉及多重語境或者復雜的背景知識下的翻譯時,機器的弊病也顯露無遺。
一、機械翻譯現狀
2018年3月15日,微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊所研發出的機械翻譯系統在通用新聞報道領域的中譯英測試方面達到了人類專業譯者的水平,這是在機械翻譯發展史上具有里程碑意義的重大事件,也是第一個在新聞報道的翻譯質量和準確率等方面媲美人類專業譯者的翻譯系統。盡管如此,機械翻譯的弊端并沒有從根本上被解決。一方面,達到人類專業譯者水準的翻譯系統只局限在新聞報道的翻譯這一個情景中,并不適用與其他情景;另一方面,開發此系統所消耗的大量人力物力也決定了這種系統不可能短時間內進行大范圍普及。
當前市面上流行的翻譯軟件主要可以劃分為基于規則( Rule-Based )和基于語料庫(Corpus-Based)兩大類。基于規則的翻譯軟件是比較傳統的機械翻譯,它由詞典和規則庫構成知識源,運用語法和語義理論生成目的語。基于語料庫的翻譯軟件是比較現代的機械翻譯,它的知識源是語料庫,經過語料庫的篩選和模仿實現目的語的輸出。然而兩者都存在明顯的缺陷,基于規則依靠詞典和規則庫構成知識源過于死板,輸出目的語的效率和質量都不高,實用性低;基于語料庫雖然擺脫了復雜的詞典和死板的語法規則,但是其統計規律并不穩定,其原因在于:基于統計的方法需要大規模雙語語料,翻譯模型、語言模型參數的準確性直接依賴于語料的多少,而翻譯質量的高低主要取決于概率模型的好壞和語料庫的覆蓋能力。
二、語用學及語境
語用學是在相應的情境下對話語進行研究,目的是讓人們能夠懂得在各種交際環境當中正確地理解語言和準確地應用語言。語言學中的語用學指出詞的詞義都是潛在的、游離不定的,它會隨著語用環境而發生變化,因此是不可靠的。只有在實際的語言環境中才能確定某個詞或某句話,乃至某篇文章的真正語義。如果我們要準確地完成從源語言到目的語的翻譯,就必須考慮語境這種語言外因素。語言交流并不是語言內部的事,他還與時間、地點、場合、語言使用者、交際目的等諸多語言外的因素有密切的關系。這些就是我們進行言語交際時所依賴的語境。
語境可以從廣義上分為語言內語境及語言外語境,語言內語境指的就是詞、短語、句子及語言的上下文;語言外語境指的是語言產生的環境,它包括個人的認知、社會文化背景、語言產生的時間地點等因素。當前主流翻譯軟件進行翻譯的依據主要是語言中的詞、短語、句子;劉海軍提出的機械翻譯系統可以以人工智能機械翻譯系統為基礎,分析出句子的主謂賓等成分,構成篇章環境的局部信息,從局部信息中精煉出篇章的全局信息,從而構造了一個句子翻譯時的環境。把語言的上下文環境納入機械翻譯的范圍,但是關于語言外因素在機械翻譯中的應用的研究并不多,由于個人認知等主觀因素無法把握,本文研究的語言外因素主要是社會文化背景及言語交際發生的時間、地點、場合等客觀因素。
三、語境在機械翻譯上的應用
作為外語專業的學生基本都經歷過情景模擬的學習方法,即假設一個情景并以該情景為背景進行對話的練習和學習以提高語言的學習效率。有過翻譯經驗的人也都知道,情景和相對應的背景知識在翻譯實踐中是至關重要的,有經驗的口譯員為了特定的目標翻譯任務需要數周乃至一個月的時間進行準備。如果可以在計算機翻譯程序中加入與外語學習時相類似的情景模擬程序再加上相對應的篩選系統,一定可以大大提高機器翻譯的準確度,使之在高速低成本的基礎上再增加相對高效的優勢。而機器沒有人的思維,如何在進行機械翻譯的同時考慮到言外語境的因素呢,我們可以在輸入源語言的同時運用語用學理論進行模擬情境的生成,從而在計算機進行人工智能翻譯的過程中進行關聯檢索,使之輸出的目的語因為語言外語境因素中的部分因素被確定而更加準確。模擬情景構建的過程發生在機器翻譯軟件進行人工智能翻譯之前,模擬情景的方法既可以是限定關鍵詞,也可以是指定特定的場景。
(一)時間地點形式限定
限定關鍵詞主要是對源語言的時間地點等因素進行限定,以德語為例,言語交際發生的時間、地點不同,其中所蘊含的社會文化背景就有差異,言語所表達的意思也就會不同。德國是世界上最大的德語國家,但同時德語也有很多變體和方言,大約有800萬的德語母語者居住在奧地利,在瑞士也有很多人講德語,這也是瑞士的官方語言之一。盡管德語使用者在奧地利和瑞士這兩個國家都不會有理解上的問題,因為他們都會適度使用一些標準德語,但還是要考慮到奧地利和瑞士的德語在很多方面都有所區分。例如,土豆在德國德語中的表達是Kartoffel,而在奧地利德語中的表達是Erdapfel。除此之外,德國的州與州之間,南北部之間德語的用法也存在差異。我們如果能夠在輸入源語言的同時進行關鍵詞的限制,計算機就可以在檢索語料庫的同時根據關鍵詞的限定匹配到更合適的目的語。
例如,在中德翻譯中的稱呼問題上,中國的貶自尊人的傳統理念形成了以職業、職務、職稱、學位、取代名字和就高不就低的稱呼原則,但是這些在中國社會必須遵守的交際原則在德國卻不適用,在那里職業通常不與稱呼掛鉤,沒有人稱呼Lehrer Meier,Direktor Meier的,而是一律用Herr/Frau+Name來稱呼對方,這些文化差異給德譯中時的機器翻譯造成了很大的障礙。如果在輸入源語言的同時進行情景模擬構建的話就可以解決這種問題,人工智能翻譯系統會在進行機器翻譯的同時按照設定好的情景或者關鍵詞把Herr Li翻譯為李老師、李醫生或者李經理。如果根據指示牌上的德語:IHK-Stock 6,Zimmer608.來進行翻譯:德國工商會辦公室位于6層608房間,剛到德國的中國客人肯定找不到他們要去的地方,因為德國的層數不算底層,而是從二層算起。如果事先把語境的地點設定為德國在進行翻譯,就會得到準確的答案:德國工商會辦公室在7層608房間。
除了時間、地點因素外,具有濃厚社會文化背景的俗語、成語包括中文的古文都是翻譯中的重點和難點,也是口譯和筆譯工作者需要格外重視的地方。在3月12日舉行的外交部例行記者會上,外交部發言人耿爽在回答路透社記者提問的問題時,引用了一句中國的古語“行有不得,反求諸己”并向提問的路透社記者問道:“知道什么意思嗎”。顯然這句古語讓外國的翻譯工作者們束手無策,對于我們國內的翻譯工作者們來說也是一個不小的挑戰。從機械翻譯的角度來說,我們把這句古語用谷歌翻譯的中翻德模式翻譯成德語輸出的目的語是“Tu was du kannst”,這顯然是不對的。那么運用情景模擬的方法,在輸入這句古語的同時選擇一個中文古語翻譯的關鍵詞,使計算機在一個中間平臺先把中文的古語轉化為白話文:“遇到什么困難挫折,不要去責怪抱怨別人,一定要多從自己身上找問題。”再把它翻譯成德語:“Wenn Sie auf Schwierigkeiten oder Frustrationen stoen, beschuldigen Sie sich nicht und beschweren Sie sich über andere. Stellen Sie sicher, dass Sie mehr Probleme von sich selbst finden.”就可以知道大概的意思了。
(二)場合限定
指定特定的場景即在輸入源語言的同時為使用者提供幾種情景的選擇,比如嚴肅的商務會談會用到更多的和貿易、金融有關的單詞和句子,輕松的八卦閑聊會涉及更多跟新聞、年輕人使用的網絡用語等,專業的不同領域學術探討會出現很多專業領域的專有名詞。這些特定的情景中會包含與之相關的語義場,這樣在計算機進行人工智能翻譯的過程中就可以通過語義場來進行快速準確地檢索,從而提高生成目的語的準確度,這種通過語義場檢索的方式和普通的人工智能翻譯軟件不同,除了要進行翻譯的目標語的語義場還有場景關鍵詞的語義場。
例如,我們把德語例句“Bitte best tigen Sie diesen Zuschlag”輸入到谷歌翻譯的中翻德模式中,得到的目的語就是“請確認此附加費”。“Zuschlag”在德語中的意思一般指附加費、追加費和拍賣成交時的拍板等,但是它還有其他幾個不同的意思,如在經濟領域“Zuschlag”指的是訂貨的意思,在工業領域還有助溶劑、添加劑的意思,那么我們就不能確定源語言的譯文是“請確認此附加費”、“請確認訂貨”還是“請確認添加劑”。如果進行翻譯的是人工翻譯,那么譯者可以根據不同的情景來確定單詞的具體含義,但是當前市面上流行的機器翻譯并不具備這種功能。按照本研究的理論在輸入源語言的同時確定源語言產生的情景——選擇經濟領域或者工業領域,就能使計算機在進行翻譯的同時利用情景的語義場進行偏重性的檢索匹配,從而準確地輸出目的語。
在實際的翻譯實踐中,語義的決定因素遠遠不限于兩種語言的文化背景,從翻譯學的角度來講,我們要確定語義的內容,在一定程度上必須借語境這一重要手段,因為在語言使用中,詞、詞義和語境處于相互聯系、相互制約之中。而模擬情景構建簡單地講就是在計算機進行人工智能翻譯之前,就“告訴”計算機要翻譯的源語言發生的語境,使機器翻譯也能做到類似人工翻譯的情景識別的過程,這樣翻譯的效率自然會提高。
四、結語
近年來,神經網絡機械翻譯的研究成為熱門的前沿發展方向,然而機械翻譯的發展距離完全取代人工翻譯仍有一定距離。本研究并不打算與機器翻譯向神經翻譯過度的主流趨勢對抗,而是計劃在這個過渡的過程中開辟出一條支路,通過在中德機械翻譯中添加關鍵詞限定檢索和情景限定檢索兩種方式,完善機械翻譯在情景不明確的情況下的翻譯機制和解決具有濃重社會文化背景的古文、成語、諺語等源語言的翻譯困難的問題,使機械翻譯更好地滿足人類社會發展的需要并在現有的基礎上得到更廣泛地應用。但是本研究仍然未能突破機械翻譯的根本弊端,經過完善的統計匹配翻譯機制生成的目的語只是比原有的機械翻譯系統在一些特定的場景下更加準確,涉及更復雜、更靈活的翻譯場景并不能取代人工翻譯。這也反映了人工翻譯在當前時代背景下的重要性和不可替代性。
參考文獻
[1]余高峰.語境因素對翻譯的影響[J].上海翻譯,2011(2):13—15.
[2]阮玉慧.論非語言語境對翻譯的影響———《紅樓夢》譯文片段分析[J].安徽工業大學學報(社會科學版),2009(4):46—49.
[3]徐本川.從語用學角度看語境在口譯過程中的作用[J].海外英語,2019(4):15—19.
[4]肖慧玲.機械翻譯與人工翻譯的差異及未來展望[J].家庭生活指南,2019(7):101—104.
[5]陳少凡.情景語境下的外語學習APP界面設計研究[J].設計,2019(21):10—12.
[6]崔林艷,虞金芳.人工智能背景下機器翻譯質量對比分析與前景展望[J].皖西學院學報,2019(2):67—19.
[7]張少恩.論語境因素在機器翻譯中的重要作用[J].農業網絡信息,2008(07):78—81.