倪盛儉,姬東鴻
(1. 安慶師范學院 外國語學院,安徽 安慶 246000; 2. 武漢大學 計算機學院,湖北 武漢 430070)
?
基于圖式的文本蘊涵識別初探
倪盛儉1,姬東鴻2
(1. 安慶師范學院 外國語學院,安徽 安慶 246000; 2. 武漢大學 計算機學院,湖北 武漢 430070)
文本蘊涵識別是大部分自然語言信息處理應用的核心。該文嘗試探討文本蘊涵識別中涉及的(意象)圖式理據。通過對選自語料例子的分析,顯示各類圖式是如何成為文本蘊涵識別的理據的。圖式包括物性結構、理想認知模型、框架、腳本等。這些圖式都是表示語義信息的結構。從廣義上講它們都可以納入語義特征的范疇,都可能成為蘊涵關系成立的理據。基于圖式的文本蘊涵識別研究結合有關圖式庫的構建,有望為突破文本蘊涵識別瓶頸作出重要貢獻。
文本蘊涵識別;圖式;物性結構;理想認知模型;框架;腳本
文本推理過程的關鍵是文本蘊涵(textual entailment, TE)的識別。現有文本蘊涵識別(recognition of textual entailment, RTE)成果,幾乎都來自自然語言處理(NLP)領域,且研究對象基本上都是英語。有學者指出RTE是大部分NLP應用研究的核心[1],但現有RTE系統針對PASCAL的RTE競賽所提供的TE測試集,獲得的召回率、正確率一般都只有60%~70%左右,綜合評價(F-score)在0.6到0.7之間。面對大量真實文本, RTE效果應該比這些數值體現的效果差些。RTE效果還不令人滿意且遇到了瓶頸,其重要原因是對蘊涵成立的語言理據挖掘嚴重不足。現有RTE研究一般只能處理簡單的詞語(語義)關系、表層句法關系或語義特征(semantic features,SF),對TE成立的其他條件如意象圖式(簡稱圖式)理據等并不是很明確。
本文嘗試從廣義和認知的角度理解SF,把圖式納入SF范疇。本文所說圖式包括QS、ICM、框架、腳本。QS是生成詞庫理論(the Generative Lexicon, GL)的重要內容。GL在廣泛的認知語境中對意義進行分解分析,其QS具有普通認知圖式的特征,是用來分解、表示詞語意義的工具;認知語義學中,ICM、框架、腳本*可以把腳本理解為事件的序列,但腳本仍然可以表示詞語信息,因為單個詞語可以觸發腳本,這個腳本都可以成為理解該詞語的語境。也是用來表示詞語信息的,因而,這些圖式都可以納入SF范疇。馮志偉先生指出: 語義表征,既需要配價的描述,也需要認知圖式的描述[2]。所以,SF不僅包括傳統成分分析法所獲得的語義信息,還可包括各種圖式內容。
本文主要探討圖式作為SF是如何成為RTE理據的。本文安排如下: 先簡單介紹各類圖式,然后說明它們怎樣成為RTE的理據,最后是總結,進一步明確本研究的意義。
所有圖式都具有特定結構和內容,有理想性、整體性、不易變動性,同時具有開放性、選擇性、關聯性、普遍性等特點[3]。圖式相對穩定,但從長時間看,其內容和結構會發生變化,以適應變動的社會和文化。圖式在不變性和開放性方面(這兩方面不是本文的重點)與文化類似。
2.1 QS
新結構主義語義學理論中,Pustejovsky所創立的GL是最精密、最富有成效的后生成主義形式分解語義學,它提供了當代語義學中最詳盡的形式化分解方法模式。GL聚焦于語境中語義確定和調節機制,注重一詞多義現象和創造性語言用法的描述,試圖通過超越“義項枚舉詞庫(方法)”(SEL)趕超Katz語義學。GL將詞庫作為基礎來描述語言動態、創造性的用法,它超越Katz詞匯語義學的地方主要包括: 明顯與語義邏輯表示產生聯系,對表示進行分層,內容更豐富細致;表示模式面向計算語言學,提出可操作的語義生成機制[4-5]。
QS是結構化的、用來表示詞條(義項-詞形對)所指的實體特別是人工物與有關內容間的關系[4],包括四部分內容。
? 構成角色: 實體與其組成成分或構成部分等之間的關系,如材料、重量、成分和構成元素等。
? 形式角色: 將實體從一個更大的領域中區分出來,包括方向、大小、形狀、維度、顏色、位置等。
? 目的角色: 表示實體的目的或功能。
? 施成角色: 即導致實體產生或出現的因素,如創造者、天然物或人造物(作為工具導致實體的產生)、因果鏈(因果關系)。
QS所表示的關系,是對傳統語義關系的補充,也是對傳統所表示詞語語義的補充*當然這種補充也不是圓滿的,如語義-文本理論(Meaning-Text Theory)的詞匯函數(Lexical function)所表示的各類詞語關系就基本上不能為QS所表示。詞匯函數和QS適用表示的詞語關系范圍不同。。QS是GL最成功的內容之一,已經被許多語言理論框架吸收[4,6]。QS是GL語義生成性的來源之一。QS的構成角色和形式角色實現為言語后,在語句中與表示被描述實體詞語間的關系為非論元性語義依存關系,而其功用角色和施成角色在語句中與被描述實體能指之間的關系是論元性的語義依存關系。QS是橋接詞匯、句法和常識的有效手段之一,這種特性使得它可以對蘊涵識別作出貢獻。
2.2 ICM
認知語義學中比較系統、權威的理論是ICM理論和框架理論。ICM在Lakoff的著作中首次得到全面、系統描述,該書核心思想是: ICM是組織知識的手段,范疇結構和原型效應是這種組織的副產品。Lakoff對ICM的描述較為復雜,這里僅引用王寅(2005)對ICM的有關論述以便理解[7]。
王寅認為,認知模型就是人們在認識事體、理解世界過程中所形成的一種相對定型的心智結構,是組織和表征知識的模式,由概念及其間相對固定的聯系構成[8]。王寅對ICM的概念總結如下:
所謂ICM,就是指在特定的文化背景中說話人對某領域中的經驗和知識所作出的抽象的、較為完整的、理想化的理解,這是建立在許多認知模型之上的一種復雜的、整合的完形結構,是一種具有格式塔性質的復雜認知模型。ICM是由很多認知模型組成的,具有體驗性(在人類與外界互動的基礎上形成)、完形性(不僅僅是由各構成部分組合而成,而且也是一個整體結構)、內在性(是心智中認識事體的方式)[9]。
本研究中,ICM用于表達抽象詞語的概念結構,為抽象詞語的理解提供語境,進而為RTE服務。
2.3 框架
框架和腳本概念源自人工智能領域研究[10]。框架被Fillmore引入語言學而得到充分發展[11],框架語義學在認知語義學中獨樹一幟,它基于真實語料研究語言,以其為理論基礎構建的框架網(FrameNet)[12]在NLP等領域得到了廣泛應用。
Fillmore把“框架”定位為涵蓋多種其他圖式的概念,本文繼承傳統人工智能研究關于框架和腳本的認識,認為多個框架構成腳本,腳本是框架的序列。
框架語義學與ICM理論的不同之處在于: 前者切入點是社會語境中事件結構的描述和理解,重點在世界知識,后者切入點是概念結構描述,重點在于心智及其操作過程。框架語義學把格語法中針對語言的“格框架”映射到對世界知識的處理,對情景進行描述。每一個格框架刻畫一個抽象、具有圖式化特征的小“情景”或“語境”。格框架映射到現實世界,體現為各種事件框架。框架中的實體(詞語、范疇或概念等)是激發理解語境的索引,對框架的全面理解,需要許多為一個言語社團所共享、默認的知識。
框架內容和框架間的關系都可能成為RTE的理據。FrameNet1.5提供了八種框架關系,其中的視角關系可以理解如下[12]:
同一事件或框架,因視角不同,使用不同的詞語、實現為不同的句法[13]。認知語言學中,視角是語義識解(construal)的一個重要方面。如商業事件框架中,如果聚焦于買方,則買方成為前景,被突顯而成為射體,買方成為主語,用動詞buy,spend,pay做句子核心;如果聚焦于賣方,則賣方成為主語,句子核心是sell或charge;如果商品成為主語,則cost成為句子核心。
框架語義學和FrameNet除了用于解釋一詞多義、歧義區分等外,還可幫助RTE。
2.4 腳本
關于腳本,沒有統一的定義,以下僅舉兩個定義來幫助理解。
Schank和Abelson給出的腳本定義如下:
腳本是特定語境中事件的合適序列結構,它由一些槽(slots)和關于什么樣的內容可以填充這些槽的要求構成。腳本是一個互相連接的整體,一個槽的內容會影響另外一個槽內可以出現什么內容。腳本處理程式化日常情景,它們通常不易變化,不提供處理新情景的手段[10]。
腳本不易變化,不意味著其絕對不能變動。Schank和Abelson在其下文中指出了腳本的可變化性,即腳本偏離。腳本偏離和以腳本為骨架實現的語句(文本)都可以提供新信,體現語言使用的動態性,這不是本文重點,不詳述。本文要利用的是腳本靜態、不易變的特點。
后來Abelson進一步將腳本定義并解釋如下。
總之,腳本是假設的認知結構,激發的腳本能夠組織基于事件情景的理解。弱式意義上,腳本是一系列關于事件集出現的潛在性(可能性)的推理,它可能與其他不處理事件的圖式在結構上有相似性。強式意義上,腳本同時涉及事件的發生和對事件順序的預期。最強式意義上,腳本中事件完全按照儀式化程序排列(如日本茶道),這時對腳本的預測絕對可靠,不過這類腳本相對少見[14]。
根據上述腳本定義和其他學者的論述,腳本具有以下為TE的獲得提供線索和方便的特點: 1)腳本的內容和結構相對穩定;2)默認狀態下,腳本中有關要素和內容是一個整體,不可分割;3)強式腳本中,前后事件之間可具有因果關系,前面事件的實現,是后續事件發生的必要條件。
蘊涵通常研究句子或命題之間的關系,而TE則研究文本(片段)間的關系。文本可以是單句、復句或者句群、語段、篇章。如果一個文本(片段)(被蘊涵文本,稱為假設,記為H)的真實性來自另一個文本(片段)(蘊涵文本,記為T)的真實性,那么,這兩個文本(片段)間存在TE關系。如:
(1) 媽媽: 寶寶,別躺地上,剛下過雨呢。(T)
(1a) 媽媽告訴寶寶不要躺地上,因為地上是濕的。(H)
容易判定,文本(1)蘊涵文本(1a),因為如無特殊說明(典型或理想狀態下),“下雨”的默認結果是“地濕”,“下雨”是原因。
語言理解涉及的推理,需要獲取因果關系、語義蘊涵和會話含義等。因果關系有多因多果、多因一果、一因一果、一因多果等情況。從因推出果,可以稱為結果蘊涵,從果推測因,則是預設。因而,廣義上的TE包括文本預設、文本結果蘊涵、文本語義蘊涵、文本會話含義。預設又可分為語義預設和語用預設,會話含義分為規約會話含義和非規約會話含義。由于語用預設具有主觀性、隱蔽性、可取消性等特征[15],而非規約會話含義又涉及很廣的語境,包括社會文化歷史價值觀念、心理認知狀態等,具有很強的動態性和不確定性,本文暫不研究語用預設和非規約會話含義。
筆者將由詞語間直接的語義關系(如WordNet所表示的詞語關系)和句法轉換導致的TE歸入文本語義蘊涵。這類蘊涵的研究現在已經很多,這里不再論述。這樣本文研究對象就只有文本語義預設、文本規約會話含義和文本結果蘊涵。預設(H)在時間上先于語句(T)的言語行為或其描述的事件、命題,會話含義則具有伴隨性、共時性,結果蘊涵則在時間上具有滯后性。
3.1 RTE的QS理據
QS主要對文本語義預設、文本規約會話含義有貢獻。先看語義預設的例子:
(2) 邦邦,別把自行車腳架拆下來。(T)
(2a) (這輛)自行車有腳架。(H)
自行車QS的“構成角色”包括材料、重量和部件等。根據生活經驗,“腳架”是自行車重要部件,應該成為自行車所激發QS的內容之一,即從自行車的QS可知,“自行車”和“腳架”之間有整體-部分的語義依存關系,借助該QS可知“自行車腳架”包含H,也即T蘊涵H。
事實上,一旦圖式被觸發,關于其所有內容的存在性和事實性描述都可以成為語義預設,體現圖式的整體性。語義預設是語言理解的語境之一,對其利用需要根據具體情況加以選擇(圖式的選擇性)。
如果在“自行車”的QS中包括“騎”這樣的“功能”,就可以為機器識別以下T和H之間蘊涵關系做出貢獻:
(3) 去超市有點遠,借我的自行車去吧。(T)
(3a) 說話人建議聽話人騎自行車去超市。(H)
這是一個由T獲得規約會話含義H的例子。T蘊涵H主要源于: 1)“吧”有勸誘義,具有“建議”等言語效果(當然,這點不是QS的貢獻);2)“自行車”自然地觸發其功能“騎”。這實際上是語義預設內容之一。事實上,規約會話含義的產生,通常以語義預設為基礎。
3.2 RTE的ICM理據
ICM主要對文本語義預設、文本規約會話含義有作用。此處以“母親”的ICM為例來說明。Lakoff認為“母親”的ICM至少應當包括以下子模型:
生殖模型——生孩子
遺傳模型——提供基因
養育模型——養育孩子
婚姻模型——父親的妻子
宗譜模型——孩子最親近的女性長輩[7]
因ICM作為圖式具有整體性,理想狀態下,“A是B的媽媽”至少包含以下這些語義預設:
H1: A生了B。
H2: B身上有A的基因。(或“B繼承了A的基因”)
H3: A養育了B。(或“A對B有養育之恩”)
類似地,ICM可以觸發文本規約會話含義。試看:
(4) 地球是人類的母親,人類生活在地球的懷抱中。(T)
(4a) 地球養育著人類。(H1)
(4b) 地球為人類提供了生活所需的條件。(H2)
(4c) 地球為人類提供了舒適的生存環境。(H3)
(4)中“母親”是隱喻用法。隱喻基于圖式,是從源域(如母親)到目標域(如地球)基于相似性的映射。隱喻理論認為“映射是系統性的,隱喻圖式具有能產性和創造性。一旦隱喻映射發生了,源域的用法可以系統地被目標域所接收,一些新的隱喻用法可能被創造,目標域可能被賦予新的解讀[16]”。
逐個把“母親”各個子模型與“地球”可以觸發的聯想(不同維度的意義,可以規約化為子模型,但本文沒有提供)匹配,發現“母親”的“養育”模型在意義上與地球所具有的能力(作用)具有許多相似之處: 母親為子女提供衣食住行和無微不至的照顧,地球也無私地為人類提供各類生活資源和良好的生存環境。基于相似性,“母親”和“地球”之間借助“母親”的“養育”子模型確立了隱喻映射,映射確定后,“養育”子模型所有內容及其結構都可能成為“地球”ICM的內容、結構,進而賦予“地球”新的解讀,其結果包括: H1、H2和H3等都可以成為T的規范會話含義。這體現了隱喻的能產性和創造性。可見,隱喻映射可以發生于不同ICM的子模型之間,這是局部的映射,隱喻映射具有選擇性。上述推理過程中,只突顯“母親”ICM的“養育”這個子模型,體現了認知的轉喻性。可見,本例又是“轉喻、隱喻是基于圖式的,認知模式主要是意象圖式形式,而不是命題形式”這個論斷的一個例示。
3.3 RTE的框架理據
國外有學者專門談論了框架語言學對RTE的影響[17]。并出現了利用框架[18]及其關系[19]做NLP的RTE識別研究,取得不錯的效果。但語言學方面的研究還有待深入。
框架和框架關系都可以觸發蘊涵,它們主要對語義預設和規約會話含義的識別有貢獻。框架觸發蘊涵的過程與ICM類似,這里不再舉例說明。以下僅從幾個框架關系看蘊涵的獲取。
FrameNet 1.5提供了繼承、利用、分框架和視角等框架關系。框架間繼承關系與詞語間繼承關系性質類似,詞語繼承關系觸發語義蘊涵,框架繼承關系因其間接性所觸發的蘊涵被納入規約會話含義。根據利用的定義[12],它能觸發語義預設,如:
(5) 由于速度太快,在轉彎時撞墻起火,車上兩名歹徒當場斃命。
(5a) 車以很快的速度行駛。
“速度”是“速度”框架的觸發語之一,該框架預設主體的“運動框架”。針對主體“車”而言,用于描述其運動的動詞包括“行駛”,因而(5)語義預設(5a)。
分框架關系中,如果分框架之間具有嚴格的時間先后或因果關系,則也可產生語義預設。如犯罪框架包括逮捕、傳訊、審判和宣判四個分框架,后面的分框架預設前面所有分框架。
同一事件因視角不同而有不同語句實現,這些語句相互蘊涵。如“雇傭”框架包括從雇主角度看的“聘用”框架和從求職人員角度的“找工作”框架。試看:
(6) 他于是就退學了,以示抗議,但至今沒有找到工作。(T)
(6a) 至今沒有人聘用他。(H)
(6)的“(他)至今沒有找到工作”借助求職者“找工作”框架觸發“雇傭”框架,(6a)則借助雇主“聘用”框架觸發“雇傭”框架,在具體框架元素相同或沒有沖突的情況下,這兩個角度的框架互相依賴、互相蘊涵,而且(6a)與(6)都沒有蘊涵阻塞語*蘊涵中阻塞語的研究是個有一定復雜性的問題,現有研究不少,這里不詳述。。根據這些條件可以判斷,(6)蘊涵(6a)。從(6)得到(6a)借助于間接的框架關系,因而(6a)是(6)的文本規約會話含義。
3.4 RTE的腳本理據
國外已經有人嘗試在RTE中加入腳本內容[20]。腳本是由框架構成的,因而兩者區分不是界限分明的。但腳本因自身特點,在作為RTE理據時有別于框架。腳本可以為文本語義預設、規約會話含義和結果蘊涵的識別做出貢獻。以下借助“飯店”腳本舉例說明。
根據Schank & Abelson[10],從顧客的視角,飯店腳本的草圖包括以下內容:
腳本: 飯店
角色: 顧客,服務員,廚師,出納員(cashier)
理由: 取得并享受食物,充饑。
場景1: 進入(飯店)
顧客進入飯店,尋找空位,就坐。
場景2: 點菜
接受菜單,看菜單,決定吃什么,點菜。
場景3: 吃
收到食物,吃食物。
場景4: 從飯店出來
要求結賬,拿到賬單,給女服務員小費,走到出納處,把錢給出納,從飯店出來。
這個腳本在英語文化中是典型的。漢語文化中的飯店腳本也大致如此,但通常顧客不會給服務員小費。這個腳本屬于強腳本,前后場景和事件按照時間順序構成具有因果關系的序列,前面重要的事件,構成后續必要事件發生的必要條件。
借助“飯店”腳本,可以識別以下(7)和(7a)之間的語義預設蘊涵關系:
(7) A: 要不,一起去吃飯吧。B: 我剛從小觀園回來呢。
(7a) B已經吃過飯。
類似(7)這樣的話,估計在武漢大學經常發生,通常說話人和聽話人都明白“小觀園”是一個吃飯地方(飯店或酒店)。“小觀園”容易觸發“飯店”腳本,腳本與其他圖式一樣,都具有理想性,如無特別說明,既然已經“從小觀園回來”(蘊涵“從飯店出來”),意味著腳本中時間上先于“從飯店出來”的其他事件都已發生過,因而(7)語義預設(7a)。
根據“飯店”腳本,也可觸發文本規約會話含義,試看:
(8) 多帶點錢來,我要吃飯。(T)
(8a) 說話人要去飯店吃飯。(H)
“錢”是飯店腳本的必要元素,“吃飯”+“(帶)錢”就能激活飯店腳本,(8)中帶錢的目的是去飯店吃飯,因而T蘊涵H。事實上,在吃飯這個大背景下,飯店腳本中任何特有的事件(如點菜、結賬)(不同于在家吃飯的事件)或實體(如女服務員、賬單),都可以激發飯店腳本。
由于強腳本的各個事件之間往往具有因果關系,因而可以為文本結果蘊涵識別服務。從因果角度看,上面(7)中B說的內容是(7a)的“果”,(7a)則是(7)中B說的內容的因。盡管從邏輯角度看(7)和(7a)未必具有因果關系,但語言學上可以說得通,試看:
(9) 你為什么從飯店出來呢?
(9a) 因為我已經吃過飯了。
(9b) 因為我已經付過錢了。
(9)和(9a)、(9b)作為問和答是自然的,可見借助腳本,可以識別某些文本結果蘊涵。
認知語義學認為認知模式主要是(意象)圖式形式(而不是命題形式),語言中無處不在的隱喻、換喻的運作是基于圖式之上的。本研究顯示,不僅隱喻、轉喻推理基于圖式,語言(詞語)很多字面用法也涉及圖式。要使NLP的RTE獲得更好效果,需全面深入研究,明確圖式在RTE中的作用,并建立相應資源。這樣有望同時為語言字面用法和隱喻、轉喻性用法理解提供更為有效的手段,提高RTE效果。
目前,基于框架語義學的框架網已經構建,而且在多個領域得到了應用。腳本庫雖未建立,也已經有人利用腳本做RTE,但效果還不理想。參考馮志偉先生的觀點,物性結構、理想認知模型、腳本與框架一樣,都有形式化的特點,應該可以構建機器可讀的相關資源[21]。面向NLP的QS庫、腳本庫、ICM庫的構建,必可提高RTE的效果。但是,這些圖式資源庫的構建,將是一項難度不亞于文本蘊含的艱巨的任務,因此這成為了應用圖式方法的一個瓶頸,是未來基于圖式RTE需要解決的主要問題。
[1] Pazienza Pennacchiotti, M Zanzotto. A linguistic inspection of textual entailment. Advances in Artificial Intelligence[C]//Proceedings in Lecture Notes in Artificial Intelligence, 2005, (3673): 315-326.
[2] 馮志偉. 計算語言學的歷史回顧與現狀分析[J]. 外國語,2011(1): 9-17.
[3] Ungerer F, Schmid H J. An Introduction to Cognitive Linguistics[M]. Beijing: Foreign Language Teaching and Research Press, 2001: F27.
[4] Pustejovsky J. The Generative Lexicon[J]. Massachusetts: Massachusetts Institute of Technology, 1996: 60-140.
[5] 宋作艷. 生成詞庫理論的最新發展[J]. 語言學論叢,2001,43(6): 202-221.
[6] Pustejovsky J. Type Theory and Lexical Decomposition[J]. Journal of Cognitive Science, 2006,(6): 39-76.
[7] Lakoff G. Women, Fire, and Dangerous Things: What Categories Reveal about the Mind[M]. Chicago and London: The University of Chicago Press, 1987: 68-71, 74, 106, 133-134, 154, 159-376, 487.
[8] 王寅. 語義理論與語言教學[M]. 上海: 上海外語教育出版社,2001: 192.
[9] 王寅. 認知語言學探索[M]. 重慶: 重慶出版社, 2005: 140.
[10] Schank R C, Abelson R P. Scripts, Plans, and Knowledge[M].Yale University, New Haven, Connecticut, 1975:152.
[11] Fillmore Charles J. Frame Semantics in Linguistics[C]//Proceedings of In the Morning Calm. Seoul: Hanshin Publishing Co., 1982: 111-137.
[12] FrameNet [OL],http://www.icsi.berkeley.edu/~framenet/, accessed 10/20/2011.
[13] Langacker R W. Cognitive Grammar: A Basic Introduction[M]. New York: Oxford University Press, 2008: 73-76.
[14] Abelson R P. Psychological status of the script concept[J]. American Psychologisl, 1981, 36: 715-729.
[15] 計道宏. 預設的語用功能研究[J]. 東北師大學報(哲學社會科學版),2011,(5): 101-103.
[16] Lakoff G, Johnson M. Metaphors we live by[M]. London: The university of Chicago press, 2003: 246, 253.
[17] Burchardt A, et al. Assessing the impact of frame semantics on textual entailment[J]. Nat. Lang. Engineering, 2009, 15(4): 527-550.
[18] Ion A, Prodromos M. A Survey of Paraphrasing and Textual Entailment Methods[J]. Journal of Artificial Intelligence Research, 2010, 38: 135-187.
[19] 張鵬,等. 基于FrameNet框架關系的文本蘊含識別[J]. 中文信息學報,2012,26(2): 46-50.
[20] Murray W R. Conceptual Metaphor and Scripts in Recognizing Textual Entailment. Natural Language Processing and Cognitive Science[C]//Proceedings, 2008:127-136.
[21] 馮志偉. 自然語言處理中的一些宏觀問題之我見[J]. 中國外語,2009,(5): 36-41.
[22] 束定芳. 認知語義學的基本原理 、研究目標與方法[J]. 山東外語教學,2005,(5): 3-11.
A Tentative Study on Schemata Based Textual Entailment Recognition
NI Shengjian1, JI Donghong2
(1. School of Foreign Languages, Anqing Teachers’ College, Anqing, Anhui 246000, China; 2. School of Computer, Wuhan University, Wuhan, Hubei 430070, China)
Recognition of Textual Entailment (RTE) is of substantial significance to most natural language processing. This paper explores the schematic explanations to TE, revealing how (image) schemata can justify the TE results by case studies. Schemata include qualia structure, idealized cognitive model, and frame, script, etc., all of which are structures that can be used for representing word meaning. In a broad sense, all these kinds of schemata belong to the category of semantic feature and thus have the potential to become evidences for TE. Exploration into RTE based on schemata and the construction of corresponding corpora of schemata may contribute to solving the bottleneck issues in RTE.
RTE; schema; qualia structure (QS); idealized cognitive model (ICM); frame; script

倪盛儉(1969—),博士,主要研究領域為詞匯語義學。E?mail:723853360@qq.com姬東鴻(1966—),教授,博士生導師,主要研究領域為自然語言處理,詞匯語義學。E?mail:Donghong_ji2000@yahoo.com.cn
1003-0077(2015)03-0082-06
2013-04-08 定稿日期: 2013-07-26
安徽省2014年質量工程教學研究重點項目(2014JYXM236);國家自然科學基金(61173062,61202193)。
TP391
A