摘 要: 排除語言歧義是機器翻譯中最難的難題,如果語言歧義不能排除,機器翻譯的譯文質量就不會有質的提高。本文從詞匯歧義和句法歧義兩方面對英語語言中的歧義現象進行分析,闡明其形成過程,探析其形成原因,并提出英漢機器翻譯的一些消歧方法,以提高機器翻譯的譯文質量。
關鍵詞: 機器翻譯 詞匯歧義 句法歧義 消歧方法
一、引言
機器翻譯(MT)指的是通過計算機系統將源語翻譯成目的語的一種翻譯方法。語言歧義的排除是機器翻譯的難題,歧義現象是自然語言的普遍現象,歧義的處理是提高譯文質量的關鍵。要提高排除語言歧義的效率就必須在深入研究語義變化一般規律的同時,研究每個多義詞詞義變化的特殊規律,選擇何種排歧方法要因詞而異,這樣才能提高排歧效率。
二、英語歧義現象
一種語言形式能夠傳遞兩種或兩種以上的意義,可以作兩種或兩種以上的解釋,這就是歧義(ambiguity)。一詞多義是自然語言中存在的普遍現象,英語中的名詞、代詞、動詞、形容詞、連接詞、介詞等都存在歧義。
例1:Tom is a bachelor.
句中名詞“bachelor”既可以表示“單身漢”(an unmarried man),又可以表示“學士”(a first university degree),準確的含義要根據上下文或語境來確定。又如:
例2:I ate a fish with a fork. (我用叉子吃魚。)
例3:I ate a fish with bones. (我吃帶刺的魚。)
三、英語歧義形成的分析
(一)詞匯歧義形成的分析
詞義存在著三個層次:系統詞義(概念詞義)、情景詞義和聯想詞義。系統詞義是詞義的第一個層次,它是一種抽象的詞義,主要是指一類事物的基本特征;情景詞義是詞義的第二個層次,它是詞的具體所指,屬語言使用中的詞義(當然,具有情景詞義的詞主要是實詞,功能詞沒有這種性質)。聯想詞義屬詞義的第三個層次,它附屬于概念詞義,呈隱性,埋伏較深,容易被忽略。
詞義不是單一的,而是錯綜復雜Sdl3g7F+w3C+sInkSNZMJAeiPr2h26Ldl4i3uxI5TsA=的。在交際中,交際雙方有時雖然都使用同一個詞,但由于各自理解該詞的詞義層次不同,便會產生歧義。詞義的特征之一是它具有民族特點的語言范疇。不同的民族對同一個詞產生的聯想詞義不一定相同,這也常常造成歧義。例如,“龍”字,在漢語中有很重的文化意義。龍是中華民族的象征,它代表一種氣勢磅礴的民族精神,從古至今,龍所引起的聯想都是正面意義,中華民族也被稱作“龍的傳人”。然而在西方,“dragon”的文化意義是“怪物、魔鬼、兇殘”等,是罪惡的象征,兩種聯想意義大相徑庭。
通過以上分析我們可以發現,由于詞義的多層次性,在交際過程中,如果交際雙方對同一個詞匯的意義作不同層次的理解,便有可能產生歧解。因此,詞義的多層次性是產生詞匯歧義的主要原因之一。
2.句法歧義形成的分析
句子意義紛繁復雜,頭緒眾多。一句話有句法層次結構,也有語義層次結構。句子意義的分析有兩種層次框架:第一種是與句法結構相對應的語義層次框架(結構框架),第二種是語符與語義之間關系的框架(符義框架)。
如果一個句子的結構從語法上可作兩種或兩種以上劃分,每一種劃分便分別對應著一種意義,句子便由此產生歧義。
例4:They kidnapped the old coin collector.
這個句子所以引起歧義,是因為其中的形容詞轄域(focus scope)不確定。例句中的形容詞old既可以修飾名詞coin,又可以修飾coin和collector兩個名詞組成的組合體,從而使句子產生兩種句義:①他們綁架了那位古幣收藏家;②他們綁架了那位年邁的硬幣收藏家。
句法歧義的產生有時正是因為句子在同一個表層結構下,有兩個或兩個以上的深層結構,由此引出兩個或兩個以上的句子意義。
例5:The refugees had discarded clothes.
歧義的產生源于短語had discarded有兩種語法關系,即兩種語義解釋為:①難民們有了(被別人)拋棄的衣服;②難民們把衣服都拋棄了。
由于“句法不僅包括已經說出來的話,還包括對于已經說出來的話還說了什么或暗示什么”,因此,一個句子除了其詞匯、語法意義外,有時還蘊含了發話者暗含的意義。讀者或受話者若聽話不聽音,錯誤理解其中的蘊含意義,便會產生歧義。
實際上,結構框架和符義框架是相互聯系和影響的,兩者的交匯點是句子的總體直接句義。
四、英語歧義的消除
(一)詞義消歧方法
1.選擇最常見涵義
這個方法的消歧效率非常低,但由于它簡單易行,而目前又沒有其他非常有效的方法可用,因此大多數翻譯系統采用這一方法。
2.利用詞類進行詞義消歧
比如,在句子“We can what he can eat.”中的第一個“can”應該為動詞,所以可以確定其涵義為“把……裝罐”。但是當兩個義項屬于同一個詞類時,這種方法就無法消歧。例如,對于“The man is rather old.”一句中的“old”這種方法就不能確定到底該譯為“這個人很舊了”還是應該譯為“這個人很老了”,因為“舊”和“老”兩個義項同屬于形容詞。不過這種方法能夠有效地縮小詞義選擇范圍,所以可以配合其他消歧方法一起使用。
3.基于選擇限制詞義消歧
上例中“old”表示“老”時,要求主語是生物,而表示“舊”則要求主語為非生物。國內外對于這種消歧方法研究得比較深入,比如普林斯頓大學認知科學實驗室開發的詞網(Word-Net)軟件,國內中科院董振東先生建立了知網(How-Net),等等。這些研究成果都為基于選擇限制詞義消歧做出了很大貢獻。
4.基于共現特征的詞義消歧
多義詞的每個義項一般都與另外一些詞一起出現,例如,“bank”是多義詞,在“The flood destroyed the river bank.” 一句中出現的“flood”和“river”一般與“bank”的“堤”義項一起出現,所以“flood”和“river”可以幫助消歧。
5.無指導的詞義消歧
這種方法先通過對大量的語料進行計算統計,得出任意兩個詞的共現頻率,然后對共現頻率比較高的任意兩個詞進行計算統計,篩選出大于一定共現頻率的數據,形成共現頻率表。
6.基于詞典的詞義消歧
這種方法首先計算上下文中相鄰詞定義間的相似度,然后選擇定義相似度較高的義項。例如在“I ate a fish with a fork.”一句中“with”是個多義詞。如果在計算機可讀詞典中“fork”定義為:“an instrument for eating food”并且“with”定義為①instrument;②part of ...兩個詞的定義中都出現了“instrument”那么這句中的“with”就應該取“instrument”的涵義,而不應該取“part of”的涵義。這種方法的主要缺點是計算機可讀詞典中的每個詞的定義通常太短,無法為詞義消歧提供足夠的信息資源(馮志偉,2004:594)。
(二)消歧應因詞而異
在研究過程中發現,根據多義詞的情況不同,適用的消歧方法也不同。比如,區分“old”的兩個義項“老”和“舊”時,基于選擇限制的詞義消歧特別有效。這里基于共現特征的詞義消歧則不適用,因為屬于人類和非人類的詞太多。而另一種情況下基于選擇限制的詞義消歧則可能完全派不上用場,例如“bank”的第17個義項“封(爐,火)”要求“bank”做及物動詞,并且賓語為“爐”或者“火”,選擇限制利用詞的具體分類不可能具體到包括“爐、火類”的程度。在這種情況下,基于共現特征的詞義消歧方法卻十分有效,只要給出“fire”,“flame”,“furnace”等共現詞,并要求這些共現詞出現的結構中與“bank”發生密切關系,就可以判定在該語境中使用的是這一義項。基于共現特征的詞義消歧由于不能因詞而異,因而經常導致失敗。在基于共現特征的詞義消歧時,要具體規定共現詞出現在什么位置、什么結構中,如果不規定而根據窗口大小判定,很可能導致語義消歧的失敗。上面例子對于“封(火)”這一義項可以這樣判定:如果“bank”做及物動詞且后面賓語為“fire”,“flame”,“furnace”等,或者當“fire”,“flame”,“furnace”等為主語且后面出現“be+banked”謂語時,“bank”表示“封(火)”。另外,該方法只注意到共現詞,沒注意到其他共現特征。比如“bank”的最常見涵義“銀行”,使用這一義項時,上下文并不一定出現“money”,“account”等共現詞,也不能用基于選擇限制的方法,但是有一個非常明顯的卻沒被發現有消歧方法考慮到的特征:“bank”往往首字母大寫,而且常出現于“Bank of”,后面再跟上首字母大寫的另一個單詞;還有一種情況是“bank”首字母大寫,前一個詞也是首字母大寫。這一特征與“銀行”這一義項有極密切的共現關系,而字母的大小寫往往在語義消歧中被忽略了。
由此可見,常用的消歧方法過于追求詞義變化規律的普遍性和消歧方法的通用性,而忽略了多義詞詞義變化是沒有普遍規律可言的事實,所以不能最終解決語義消歧的難題。
五、結語
語義消歧是機器翻譯中最困難的問題,也是決定譯文質量的關鍵問題。因為每個多義詞的詞義變化規律都各不相同,所以在研究語義消歧的過程中沒有什么捷徑可求,只能因詞而異,一個詞一個詞地去研究。這任務雖然看似在編寫一部雙語詞典,事實上要比編寫一部雙語詞典難幾十倍,因為每個多義詞的消歧都需要耗費研究者大量的時間和精力。不過,如果能解決作為當代科技十大難題之一的機器翻譯問題,意義將是非常深遠的,這方面的商業價值也不可估量。
參考文獻:
[1]馮志偉.機器翻譯研究[M].北京:中國對外翻譯出版公司,2004.
[2]王揚.略論語境與詞義的理解[J].國外外語教學,1999.
[3]廖定中,蔣澄生.英語句法歧義簡議[J].四川外語學院,1998.
[4]史曉亮.英漢機器翻譯中語言陷阱的自動檢索標識方法[J].科技信息,2011.
[5]魯孝賢.機器翻譯語義排歧的方法[J].中國科技翻譯,2007.