朱新杰
摘 要:隱喻自動識別關鍵的第一步是要解開人類對隱喻理解的認知機制,建立語言的形式化模型,使之能夠以計算機能夠識別的形式表示出來。這一過程很大程度上需要依賴認知語言學理論的指導。目前關于隱喻計算研究的綜述性文章主要針對隱喻模型設計、知識庫和數據資源建設及隱喻處理的應用方面進行介紹,而本文將從認知語言學和計算機科學的交叉角度對隱喻識別所涉及的理論和方法進行探究。本文主要研究多學科交叉視角下的大學英語教學方法探究。
關鍵詞:多學科;交叉視角;大學英語;教學方法;探究
1 隱喻識別的認知語言學視角
1.1基于文本線索的識別
隱喻表達的特征之一是具有一定的語言標記,可以把這些語言標記作為隱喻識別的線索。這種研究思路在隱喻識別中非常直觀,起到一種“路標”的作用,具有較高的價值。通過隱喻標記語的明確指示,做出不能對該話語做字面意義理解而應做隱喻意義理解的明確引導。由于隱喻標記語的介入,人類對隱喻進行推理的時候,就能很容易地領會蘊藏的意圖,從而作出正確的隱喻識別。因此,隱喻標記語的使用明示了話語的語義邏輯關系,對隱喻的人腦推理過程起到了明示的語用制約,從而幫助理解與識別。束定芳[7]總結了隱喻表達的七種文本線索標記:
(1)領域信號或話題標志。如intellectual stagnation(智力上的停滯)、psychic eddy current(心理旋渦)、時間隧道、歷史悲劇。(2)元語言信號。直接用metaphor,metaphorical,metaphorically或“比如”等字眼。(3)強調詞信號。In fact,literally,actually,really,漢語中的幾乎、差不多、簡直等。(4)模糊限制詞。如英語中的a little,practically,漢語中的“有點”“某種意義上”等。(5)表示隱喻轉換的上義詞。如sort of,type of,“某種”等。(6)明喻。明喻是隱喻的一個種類,其比喻詞like,as,“好像”,“仿佛”等明確表明這是隱喻式話語。(7)引號。
根據上述認知語言學理論,在隱喻計算機自動識別領域,有一些研究工作是針對文本中的線索而進行的。本文第3.1節將介紹相關研究方法和技術。
1.2 隱喻本質
概念隱喻觀運用源域與目標域之間的映射以及意象圖式來解釋隱喻現象,認為隱喻的本質是以一種事物去理解另一種事物的手段,從一個比較熟悉,易于理解的源域映射一個不太熟悉、較難理解的目標領域。人類對隱喻識別是指在語境中發現隱喻表達,找出源域、目標域及映射域的關系。束定芳[6]歸納了人類對隱喻識別的兩種基本方法:(1)基于文本線索;(2)基于語義沖突。在認知語言學背景下,隱喻被普遍認為是一種思維方式和認知模式。概念隱喻理論認為隱喻是利用一種概念表達另一種概念,需要這兩種概念之間的相互關聯。這種關聯是客觀事物在人的認知領域中的聯想。
1.3 基于語義沖突的識別
人類對隱喻的理解首先建立在上下文語境的基礎上,根據語言認知系統知識庫及涉身概念知識庫,對語言形式和字面意思進行分析,確定源域與目標域的語義沖突,并運用概念聯想提取機制判斷出映射關系,最后作出概念隱喻的判斷。多數隱喻的出現并沒有什么明確的信號或標志,需要通過對語義沖突的理解來識別隱喻。語義沖突也稱為語義偏離(deviation),指的是在語言意義組合中違反語義選擇限制和常理的現象,是隱喻產生的基本條件。語義沖突可以產生在句子內部,也可以產生在句子與語境之間。Ortony[8]認為某一語言表達成為隱喻的第一要素是從語用角度或從語境角度看,它必須是異常的,即從其字面意義來理解有明顯與語境不符合之處。人類需要根據話語的字面意義在邏輯上或與語境形成的語義和語用沖突及其性質,判斷某一種用法是否屬于隱喻。
2 交叉視角的文本表達
2.1 基于文本線索的方法
因為更多的隱喻不具有明顯的語言標記,所以這種基于文本線索的方法只能作為一種輔助來提高識別效果。隱喻標記統計的基礎上,把標記隱喻的語言信號分為若干類別,并考察其在文本中的出現頻率與隱喻的使用關系。研究表明,雖然帶有語言標記的隱喻句在隱喻句總數量中存在的比例并不大,但是存在隱喻標記語的書面語中隱喻的比例達到了大約1/2的比例。除了隱喻標記語的詞匯層面,Ferrari[13]還把句法分析作為文本線索進行隱喻識別的研究。例如,通常作為隱喻標記的單詞metaphor,在句子“A metaphor is a figure of speech where comparison is implied.”中作為主語出現,此句不再是隱喻,metaphor也失去了標記的功能。這種方法概括起來就是利用規則約束與機器學習相結合,從語料庫中統計隱喻的語言標記和句法信息出現的概率,以此作為文本線索進行隱喻計算機自動識別。
2.2 基于語義知識的方法
對基于語義知識的方法進行了早期的研究,建立語義沖突分類體系,并手工建立了語義知識庫,但對大規模的語料分析具有局限性,也耗時耗力。Mason[15]通過大規模語料庫自動獲取詞匯的優選語義,從領域語料庫獲得詞匯的語義特征,對比特征語義沖突完成概念映射的優選。但由于領域知識庫規模不足,此方法只能處理與動詞相關較簡單的概念隱喻,對于復雜映射具有很大的局限性。利用詞典和語義搭配知識是基于語義知識方法的另一項應用。如Krishnakumaran利用英語詞典word-Net得到語義知識,計算詞語在語料庫中語義搭配的概率[16]。同樣,楊蕓利[17]用《同義詞詞林》和《詞語常規搭配庫》來識別漢語語義搭配型隱喻。另外,機器學習方法是隱喻自動識別研究的一個新方向,在處理海量信息上有著明顯的優勢和廣泛的應用[18-19]。面對日益增多的數據與計算機技術迅速發展,廣泛地嘗試探索基于機器學習的隱喻識別研究十分必要。基本上,此方法把隱喻識別的問題轉化成文本分類問題,最終達到識別目的。
3 總結
3.1 語言學家與計算機研究者攜手共進
語言學與計算機科學對于隱喻識別,有著共同的研究處理對象及共同的奮斗目標——揭示人類語言中隱喻的秘密,開發人類語言智能的功能。利用計算機對隱喻進行識別,基于規則和統計相結合的辦法是有效辦法之一,只利用任何一種方法都有它的局限性。計算機固然可以迅速地從大規模的語料中獲取隱喻知識,解決系統的一些具體問題,但是卻不能解釋確切的運行機制和其中的規則到底是如何建立的。所以需要語言學家對語言進行描述與規則制定,實現計算語言的形式化,這些都是跟語言學的基礎理論分不開的。同樣,語言學也需要進一步現代化。而計算機隱喻識別所提出的一系列新的方向與需求,一方面啟發語言學家從新的角度去思考和探索,這必將深化語言學的理論知識;另一方面,通過計算機改造語言學理論,可以促進語言描寫的形式化、科學化和精密化。計算機科學的發展,不但為語言學提供了現代化的研究手段,而且擴展了語言學的研究視野。因此,語言學家與計算機研究者加強合作與支持,才能促進隱喻研究的重大突破。
3.2 隱喻知識庫與英語教學
隱喻知識所提供的實例分析和分類幫助學生形成系統的理解和有序的邏輯思維,分清隱喻表述的各部分關系,代替死記硬背的學習方式,遵循有效的認知規律,從語言學習的根源和理論上整體把握,從而提高對語言深層次的理解,提高學習的效果,增強英語語感。隱喻的各種計算模型往往需要一個或多個知識庫的支撐,這是由隱喻的認知性所決定的。知識庫中除了三個例句,還給出了與force類別相關的隱喻類別(Related metaphors:related to Causes are Force)。指出了隱喻的源域(substance,contents,container,hitting)和目標域(force),另外還有簡要分析的以幫助理解(note)。例句中都包含概念隱喻的影子。借助概念隱喻可以認識到隱喻表達形式的根源,將原本分散的形式內涵按根源進行歸類。隱喻知識庫所提供的概念隱喻系統使語言學習者了解到隱喻生成機制的原理,利用映射原理對知識系統分類整理。
參考文獻
[1] Lakoff,G.,Johnson,M.Metaphors We Live By [M],Chicago:University of Chicago Press,1980.
[2] Turner,M.,Fauconnier,G.Conceptual Integration and Formal Expression[J].Metaphor & Symbolic Activity,1995,10(3):183-204.
[3] Derrida.Margins of Philosophy[M].Chicago:The University of Chicago Press,1982:31.
[4] Shen,Y.,&Gadir,O.How to interpret the music of caressing:Target and source assignment in synaesthetic genitive constructions[J].Journal of Pragmatics,2009,41(2):357-371.