基于全局優(yōu)化的中文事件時(shí)序關(guān)系推理方法

2016-05-04 02:43:09李培峰朱巧明

中文信息學(xué)報(bào) 2016年5期

鄭新，李培峰，朱巧明

(1. 蘇州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院，江蘇蘇州 215006； 2. 江蘇省計(jì)算機(jī)信息處理技術(shù)重點(diǎn)實(shí)驗(yàn)室，江蘇蘇州 215006)

鄭新1，2，李培峰1，2，朱巧明1，2

近年來，越來越多的研究關(guān)注事件時(shí)序關(guān)系，但大多數(shù)工作集中于提高事件關(guān)系分類器的性能，忽略了分類器錯(cuò)誤所造成的事件關(guān)系間不一致的問題。該文利用了一個(gè)全局優(yōu)化的推理模型來解決這一問題，將事件時(shí)序關(guān)系全局優(yōu)化看成整數(shù)線性規(guī)劃問題，使用了自反性、傳遞性、同指性、時(shí)序連接詞、事件類型對(duì)等多個(gè)約束條件。實(shí)驗(yàn)結(jié)果表明，該文的全局推理方法與分類器相比，F(xiàn)1值提高了3.56%。

事件；時(shí)序關(guān)系；推理

1 引言

事件時(shí)序關(guān)系識(shí)別是篇章理解研究的重要組成部分，廣泛應(yīng)用于信息抽取、文本摘要等多個(gè)自然語言處理應(yīng)用領(lǐng)域。例如，在系列化的新聞報(bào)道中，了解各個(gè)事件之間發(fā)生的時(shí)序關(guān)系，可以更好地對(duì)文章內(nèi)容進(jìn)行歸納總結(jié)，方便人們快速獲取有效信息；在文景轉(zhuǎn)換系統(tǒng)中，需要知道文中事件發(fā)生的先后順序，以此來排列動(dòng)畫場(chǎng)景，保證整個(gè)故事情節(jié)的連續(xù)性。

隨著TimeBank等語料庫(kù)的出現(xiàn)，機(jī)器學(xué)習(xí)方法逐漸應(yīng)用到這一研究任務(wù)。給定一個(gè)事件對(duì)，根據(jù)它們的特征集合訓(xùn)練出一個(gè)分類器來預(yù)測(cè)事件對(duì)的時(shí)序關(guān)系。這種方法由于它每次只考慮一個(gè)單一事件對(duì)的時(shí)序關(guān)系，卻忽略了同一文章中事件之間的聯(lián)系。這種局部性方法往往會(huì)存在以下的缺點(diǎn)：分類結(jié)果有時(shí)會(huì)違反時(shí)序關(guān)系集合中的邏輯約束條件。圖1中，(a)表示的是一個(gè)分類器識(shí)別的關(guān)系圖，其中事件e1發(fā)生在事件e2之前，事件e2發(fā)生在事件e3之前，而事件e1卻發(fā)生在事件e3之后——很明顯這是會(huì)產(chǎn)生一個(gè)時(shí)序邏輯關(guān)系矛盾。

為了消除分類器帶來的這種矛盾，Chambers[1]、Do[2]等人提出一個(gè)全局推理模型，即使用傳遞性約束條件(e1 before e2 + e2 before e3 → e1 before e3)，來優(yōu)化事件對(duì)之間的關(guān)系，最終得到一個(gè)最優(yōu)的事件關(guān)系圖。然而，經(jīng)過傳遞性約束限制后，得到的并不一定是正確的事件關(guān)系圖，圖1中，(b)、(c)、(d)均可能是(a)經(jīng)過全局優(yōu)化后的結(jié)果，而正確的結(jié)果只能是其中一個(gè)。因此，只有保證其中兩個(gè)事件對(duì)關(guān)系的正確性，才能正確優(yōu)化第三個(gè)事件對(duì)的關(guān)系。

圖1 事件時(shí)序關(guān)系圖注： (a) 表示分類器識(shí)別的時(shí)序關(guān)系圖； (b)、(c)、(d)分別為全局優(yōu)化后的可能結(jié)果

本文的主要貢獻(xiàn)是：為了保證傳遞性約束限制后結(jié)果的正確性，本文在Do[2]的基礎(chǔ)上進(jìn)一步提出了同指關(guān)系、時(shí)序連接詞及事件類型對(duì)等多個(gè)約束條件。這些約束條件的加入，使得全局推理模型的實(shí)驗(yàn)性能有了顯著提高。

本文組織結(jié)構(gòu)如下：第二節(jié)介紹相關(guān)工作；第三節(jié)講述本文實(shí)驗(yàn)的基準(zhǔn)系統(tǒng)；第四節(jié)提出了一種全局優(yōu)化的推理方法來提高事件時(shí)序關(guān)系識(shí)別；第五節(jié)是實(shí)驗(yàn)結(jié)果與分析；最后是對(duì)本文工作的總結(jié)及下一步工作展望。

2 相關(guān)工作

目前，事件時(shí)序關(guān)系的研究絕大多數(shù)針對(duì)英文。早期研究采用基于規(guī)則方法，隨著TimeML(Time Markup Language)標(biāo)注體系的發(fā)展以及TimeBank[3]語料庫(kù)的出現(xiàn)，統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法開始廣泛應(yīng)用于事件時(shí)序關(guān)系識(shí)別方面。

Mani[4]等在TimeML語料庫(kù)和Opinion語料庫(kù)的基礎(chǔ)上，提出了事件屬性特征(稱為“完美特征”)：事件類別、體態(tài)、形態(tài)、極性、時(shí)態(tài)等。Chambers[5]在Mani的基礎(chǔ)上，進(jìn)一步拓展了特征空間，引入了詞法、句法等特征，使得分類器的結(jié)果有了很大的提高。D’Souza[6]等較全面地總結(jié)了事件時(shí)序關(guān)系識(shí)別的相關(guān)特征，并進(jìn)一步提出了有關(guān)篇章級(jí)別的特征，使系統(tǒng)性能有了一定的提高。Ng[7]等借助修辭結(jié)構(gòu)理論、篇章關(guān)系及話題文本分割等篇章結(jié)構(gòu)方面的技術(shù)在很大程度上提高了事件時(shí)序關(guān)系識(shí)別的性能。

中文時(shí)序關(guān)系的研究相對(duì)較少，絕大多數(shù)的研究集中在事件與時(shí)間之間的關(guān)系。王昀[8]提出了一個(gè)基于轉(zhuǎn)換的時(shí)間-事件映射關(guān)系的方法。林靜[9]介紹了漢語文本中時(shí)間關(guān)系的抽取方法，并分別從時(shí)間與時(shí)間、時(shí)間與事件和事件與事件三個(gè)方面研究了時(shí)間關(guān)系的抽取與計(jì)算。事件映射關(guān)系的方法，并取得了較高的實(shí)驗(yàn)性能。仲兆滿[10]提出了一種事件關(guān)系表示模型，并做了一個(gè)簡(jiǎn)單的事件關(guān)系推理實(shí)驗(yàn)。Cheng[11-12]借鑒TimeML的標(biāo)注準(zhǔn)則，構(gòu)建了一個(gè)中文事件時(shí)序關(guān)系的語料庫(kù)，并通過事件的類型來識(shí)別中文事件時(shí)序關(guān)系。譚紅葉[13]總結(jié)了當(dāng)前時(shí)間關(guān)系識(shí)別研究進(jìn)展，并探討了研究中存在的問題和未來研究的重點(diǎn)。王風(fēng)娥[14]采用最大熵分類器識(shí)別句子內(nèi)的事件時(shí)序關(guān)系，實(shí)驗(yàn)中使用了一些有助于提高同句內(nèi)事件時(shí)序關(guān)系的語言特征。

近幾年運(yùn)用全局推理方法來提高事件時(shí)序關(guān)系識(shí)別的研究工作已有很多。Chambers[1]與Do[2]的做法類似，都是在有監(jiān)督機(jī)器學(xué)習(xí)方法的基礎(chǔ)上，運(yùn)用了整數(shù)線性規(guī)劃方法來提高實(shí)驗(yàn)性能。而Yoshikawa[15]使用的則是馬爾可夫推理模型來提高機(jī)器學(xué)習(xí)的方法。Denis[16]通過用區(qū)間端點(diǎn)表示事件和時(shí)間的方法來控制Chambers[1]等人的聯(lián)合推理方法的復(fù)雜性，并提出了一個(gè)圖的分解方法來簡(jiǎn)化圖的優(yōu)化問題。然而，Chambers[1]、Do[2]等人的全局優(yōu)化方法所使用的約束條件較為單一，僅包含反轉(zhuǎn)性、傳遞性等規(guī)則。

絕大多數(shù)研究使用的是TimeBank語料庫(kù)，也有少數(shù)人使用的是ACE語料庫(kù)*http://www.ldc.upenn.edu/Projects/ACE/docs/Chinese-Events-Guidelines_v5.5.1.pdf(如Do[2]、Ng[7]等)，而這兩種語料庫(kù)的標(biāo)注規(guī)則卻大有不同。ACE語料庫(kù)中標(biāo)注的事件是一個(gè)具體發(fā)生的事情，往往是一個(gè)短語或一句話，并用觸發(fā)詞來表示該事件，而TimeBank語料庫(kù)則是將大部分動(dòng)詞、動(dòng)名詞都標(biāo)注為事件。因此，ACE語料庫(kù)適用于信息抽取、問答系統(tǒng)等領(lǐng)域，TimeBank語料庫(kù)則更適用于文景轉(zhuǎn)換系統(tǒng)等研究。

此外，由于TimeBank語料庫(kù)中只標(biāo)注了同句及鄰句中部分事件之間的關(guān)系，Chambers[17]對(duì)TimeBank語料庫(kù)中部分語料重新標(biāo)注了同句及鄰句中所有事件之間可能的時(shí)序關(guān)系，構(gòu)建了一個(gè)稠密的事件時(shí)序關(guān)系語料庫(kù)。與之類似，Do[2]使用的也是一個(gè)稠密的事件時(shí)序關(guān)系語料庫(kù)。本文所采用的實(shí)驗(yàn)語料庫(kù)則是標(biāo)注了同一篇文章中任意兩個(gè)事件之間的時(shí)序關(guān)系。

3 基準(zhǔn)系統(tǒng)

本文的基準(zhǔn)系統(tǒng)采用有監(jiān)督的機(jī)器學(xué)習(xí)方法構(gòu)造一個(gè)事件時(shí)序關(guān)系分類器，即給定一個(gè)事件對(duì)，構(gòu)造一個(gè)分類器能夠預(yù)測(cè)它們之間屬于哪一種時(shí)序關(guān)系。具體表示如式(1)。

(1)

其中，ei,ej分別表示第i個(gè)和第j個(gè)事件。

為了訓(xùn)練這樣的分類器，本文定義了一個(gè)特征空間，包括詞法特征、句法特征、語義特征等，如表1所示。這些特征一部分是英文時(shí)序關(guān)系識(shí)別用到的特征[2，4-5]，另一部分是根據(jù)中文語言特征總結(jié)的一些有用的特征(用*標(biāo)記)。

表1 時(shí)序關(guān)系識(shí)別特征集合

續(xù)表

注：表中(4)、(2)、(1)等表示對(duì)應(yīng)的特征數(shù)目。

4 全局推理模型

由于分類器獨(dú)立地對(duì)每一對(duì)事件關(guān)系進(jìn)行分類，忽略了事件對(duì)之間的聯(lián)系，因而有可能會(huì)產(chǎn)生事件關(guān)系對(duì)之間的邏輯性矛盾；而已有的全局優(yōu)化方法僅使用了自反性和傳遞性約束條件，并不能保證優(yōu)化后結(jié)果的正確性，如圖1所示。因此，本文在全局優(yōu)化策略的基礎(chǔ)上，提出多個(gè)有效地約束條件，進(jìn)一步提升事件時(shí)序關(guān)系識(shí)別性能。

本文提出的全局推理模型分為兩步： 1)訓(xùn)練一個(gè)時(shí)序關(guān)系分類器(見第三節(jié))；2)利用分類器的預(yù)測(cè)概率以及約束條件，轉(zhuǎn)化成最優(yōu)化問題，最終得到一個(gè)全局最優(yōu)的結(jié)果。本文使用整數(shù)線性規(guī)劃(Integer Linear Programming)法來解決這一問題。

4.1 目標(biāo)函數(shù)

目標(biāo)函數(shù)被定義為事件時(shí)序關(guān)系分類器預(yù)測(cè)概率的對(duì)數(shù)之和，如式(2)所示。

(2)

其中，x(eiej,r)是一個(gè)二元變量，取值為1時(shí)，表示ei與ej之間的關(guān)系為r；p(eiej,r)表示分類器CE-E預(yù)測(cè)ei與ej之間的關(guān)系為r的概率；ε={e1,e2,…,en}表示同一篇文章中所有事件的集合；εε={(ei,ej)∈ε×ε|ei∈ε,ej∈ε,i≠j}表示同一篇文章中的事件對(duì)集合；R={before,after,overlap,unknown}表示時(shí)序關(guān)系集合。

本文的目標(biāo)函數(shù)是概率p的對(duì)數(shù)之和，而不是直接求概率p之和，因?yàn)槿?duì)數(shù)后，變量x的權(quán)重更離散化(p的取值為[0,1], 而logp取值為[-,0])，從而更有利于區(qū)分事件對(duì)之間屬于哪一種時(shí)序關(guān)系。

4.2 基本約束條件

1) 唯一性

式(3)保證x(eiej,r)是一個(gè)二元變量，它的取值只能是0或1。式(4)是為了確保ei與ej之間只存在一種時(shí)序關(guān)系，即其中一種關(guān)系取值為1，其余均為0。

例如，relation(ei,ej)只能是{before,after,overlap,unknown}四種關(guān)系中的一種。

2) 自反性

如果已知relation1(ei,ej)，那么很容易就知道relation2(ej,ei)。例如，若e1beforee2，則必有e2aftere1。具體可表示為式(5)。

(5)

3) 傳遞性

由(Bramsen[18]，Chambers[1]，Do[2])等人的工作可知，事件時(shí)序關(guān)系之間存在傳遞閉包的性質(zhì)。如果已知relation1(ei,ej)且relation2(ej,ek)，那么可以推出relation3(ei,ek)。即relation1(ei,ej)+relation2(ej,ek)?relation3(ei,ek)。如式(6)所示。

(6)

其中(r1,r2,r3)∈{(b,b,b),(a,a,a)}。

例如，before(ei,ej)+before(ej,ek)?before(ei,ek)。

4.3 擴(kuò)展約束條件

1) 同指性

① 若ei與ej互為同指關(guān)系，則必有overlap(ei,ej)。

② 若已知ei與ej互為同指關(guān)系且relation1(ei,ek)，則有relation1(ej,ek)。

以上兩條性質(zhì)可表示為式(7)和式(8)。

例如，已知e1beforee2且e3為e1的同指事件，則必有e3beforee2。

2) 時(shí)序連接詞

如果兩個(gè)相鄰事件之間存在特定的時(shí)序連接詞，那么就可以根據(jù)該連接詞確定它們之間的時(shí)序關(guān)系。例如，ei與ej之間存在時(shí)序連接詞“之后”，那么就有eibeforeej。

若某時(shí)序連接詞在訓(xùn)練集中出現(xiàn)三次以上，則加入到時(shí)序連接詞詞表中；然后，使用開發(fā)集篩選詞表中的時(shí)序連接詞；最終得到一個(gè)最優(yōu)的時(shí)序連接詞詞表，部分時(shí)序連接詞見表2。

公式化為式(9)所示。

(9)

其中，conj為時(shí)序連接詞，Conj_List為時(shí)序連接詞詞表，r1為conj對(duì)應(yīng)的時(shí)序關(guān)系。

例如，一些巴勒斯坦人從清真寺出來后在老城獅子門處同以軍警發(fā)生了沖突。由于事件“出來”與“沖突”之間存在時(shí)序連接詞“后”，那么很容易判斷事件“出來”發(fā)生在事件“沖突”之前。

表2 部分時(shí)序連接詞詞表與事件類型對(duì)表

3) 事件類型對(duì)

一篇文章中通常圍繞某個(gè)話題來闡述，隨著話題的推演與發(fā)展，與之相關(guān)的事件也不斷發(fā)生與結(jié)束。某些特定類型的事件對(duì)之間往往具有特定的時(shí)序關(guān)系，例如，Arrest，逮捕→Trial-Hearing: 審理→Sentence: 判處。

若某事件類型對(duì)在訓(xùn)練集中出現(xiàn)五次以上且均被分為同一種關(guān)系，則加入到事件類型對(duì)列表中；然后，使用開發(fā)集篩選列表中的事件類型對(duì)，最終得到一個(gè)最優(yōu)的事件類型對(duì)列表(表2)。

公式化為式(10)所示。

(10)

其中，typei,typej分別為ei,ej的類型，r1為對(duì)應(yīng)的時(shí)序關(guān)系。

例如，法院今天公開開庭審理了一起殺人案。…… 據(jù)悉，法院擇日對(duì)此進(jìn)行宣判。司法類話題中不同類型的事件一般是按序進(jìn)行的，只有先審理才能進(jìn)行宣判，即事件“審理”通常發(fā)生在事件“宣判”之前。

5 實(shí)驗(yàn)

本節(jié)中，首先介紹本文的實(shí)驗(yàn)設(shè)置及基準(zhǔn)系統(tǒng)，然后給出詳細(xì)的實(shí)驗(yàn)結(jié)果與分析，最后討論與英文相關(guān)工作的異同。

5.1 實(shí)驗(yàn)設(shè)置與基準(zhǔn)系統(tǒng)

本文實(shí)驗(yàn)所用的語料共包含271篇新聞文本，其中103篇取自ACE 2005中文語料庫(kù)，其余168篇語料的原文選自Chinese TreeBank 6.0 和Chinese Gigaword語料庫(kù)，并遵循ACE 2005中文語料庫(kù)的標(biāo)注規(guī)則，進(jìn)行事件標(biāo)注。然后人工標(biāo)注了每篇文本中任意兩個(gè)事件之間的時(shí)序關(guān)系(本文將事件時(shí)序關(guān)系分為四種： before，after，overlap，unknown)。語料最終共標(biāo)注了2 291個(gè)事件，20 632對(duì)事件關(guān)系。

本文的實(shí)驗(yàn)語料由兩位標(biāo)注者完成，其中before、after和overlap三類標(biāo)注結(jié)果的Kappa值均達(dá)到0.7，由于unknown關(guān)系歧義性較大，Kappa值僅0.5。對(duì)于標(biāo)注不一致的事件關(guān)系對(duì)，邀請(qǐng)第三位標(biāo)注者共同商量決定最終的結(jié)果。

本文實(shí)驗(yàn)中隨機(jī)選取187篇語料作訓(xùn)練集，30篇作開發(fā)集，54篇作測(cè)試集，采用常用的準(zhǔn)確率(Precision)、召回率(Recall)及F1值作為評(píng)價(jià)準(zhǔn)則。基準(zhǔn)系統(tǒng)中使用最大熵分類器；在推理階段，使用Gurobi Optimizer構(gòu)建全局推理模型。

本文將第三節(jié)中提到的有監(jiān)督機(jī)器學(xué)習(xí)方法作為實(shí)驗(yàn)的一個(gè)基準(zhǔn)系統(tǒng)。此外，為了與全局推理方法對(duì)比，本文實(shí)現(xiàn)了一個(gè)強(qiáng)規(guī)則推理方法。即利用第四節(jié)中的約束規(guī)則來修正違反約束規(guī)則的時(shí)序關(guān)系。具體操作為：首先，將測(cè)試集分為可信集與不可信集兩部分，即設(shè)定一個(gè)閥值K*本文實(shí)驗(yàn)中，經(jīng)開發(fā)集調(diào)參后，K取0.9，若事件對(duì)(ei,ej)的預(yù)測(cè)概率大于K時(shí)，則被分到可信集中，否則被分到不可信集中；然后，把可信集中的事件對(duì)關(guān)系當(dāng)作已知條件，根據(jù)約束條件，推出不可信集中的事件對(duì)關(guān)系。

5.2 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)結(jié)果如表3所示，其中，“Do”是在本文數(shù)據(jù)集上重現(xiàn)Do[2]原文中的方法。不過，Do[2]還將事件與時(shí)間表達(dá)式關(guān)系的識(shí)別結(jié)果作為一個(gè)約束條件，本文未涉及此研究?jī)?nèi)容，故表3中Do與本文方法的實(shí)驗(yàn)結(jié)果均未使用此約束條件。

表3 各方法實(shí)驗(yàn)性能比較

首先，比較本文的全局推理方法與基準(zhǔn)系統(tǒng)的實(shí)驗(yàn)結(jié)果，可以看出，本文的全局推理方法的F1值比基準(zhǔn)系統(tǒng)高了3.56%。這表明使用全局約束條件的全局優(yōu)化模型處理事件時(shí)序關(guān)系識(shí)別問題的有效性。本文采用McNemar檢驗(yàn)法對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行顯著性檢驗(yàn)，求得P值<0.000 1，因此，本文方法較基準(zhǔn)系統(tǒng)有顯著性提升。

然后，比較本文全局推理方法與強(qiáng)規(guī)則推理方法的實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)，基于全局優(yōu)化推理方法要明顯優(yōu)于強(qiáng)規(guī)則的局部推理方法，而強(qiáng)規(guī)則推理方法較基準(zhǔn)系統(tǒng)其F1值僅提高了0.91%。經(jīng)分析實(shí)驗(yàn)數(shù)據(jù)發(fā)現(xiàn)，強(qiáng)規(guī)則推理方法根據(jù)預(yù)測(cè)概率劃分可信集與不可信集，而可信集中仍然含有大量的錯(cuò)誤樣例。當(dāng)把錯(cuò)誤樣例作為已知條件進(jìn)行推理時(shí)，這不僅不能夠正確推出不可信集中樣例的結(jié)果，甚至?xí)⒃痉诸惼鞣诸愓_的樣例推理成錯(cuò)誤的。因而，強(qiáng)規(guī)則推理方法的性能提升相對(duì)較小。

整數(shù)線性規(guī)劃是一種尋找一組最優(yōu)解使目標(biāo)函數(shù)最大化且滿足一系列限制約束條件的數(shù)學(xué)推理方法。全局優(yōu)化推理方法綜合考慮了各事件關(guān)系對(duì)之間的聯(lián)系，而不是將每個(gè)事件對(duì)單獨(dú)來處理。加入有效地約束條件后，在保證了部分事件關(guān)系對(duì)正確的情況下，盡可能的修正錯(cuò)誤的事件關(guān)系對(duì)，使得最終的結(jié)果達(dá)到最優(yōu)，因此，性能提升較大。

最后，比較本文方法與Do方法的實(shí)驗(yàn)性能。本文方法是在Do的基礎(chǔ)之上，加入了同指關(guān)系、時(shí)序連接詞及事件類型對(duì)多個(gè)約束條件，F(xiàn)1值比Do高了1.96%。這表明，本文提出的幾個(gè)約束條件非常有效。

另外，約束條件的不同對(duì)全局推理模型的性能有著很大的影響，表4給出了不同約束條件之間對(duì)ILP的貢獻(xiàn)度。

表4中，貢獻(xiàn)度最大的是傳遞性約束條件，其次是同指關(guān)系約束條件，因?yàn)檫@二者是多個(gè)事件對(duì)之間的約束條件，充分利用了事件對(duì)之間的聯(lián)系，而“連接詞”、“事件類型對(duì)”則是針對(duì)單個(gè)事件對(duì)的約束條件。然而，“自反性”約束條件的貢獻(xiàn)度為0，經(jīng)分析分類器的實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)，互為逆反關(guān)系的兩個(gè)事件對(duì)要么都被正確分類，要么都被分到同一個(gè)錯(cuò)誤類別中去，因此“自反性”并沒有對(duì)實(shí)驗(yàn)性能產(chǎn)生影響。

表4 各約束條件對(duì)實(shí)驗(yàn)性能的貢獻(xiàn)度

此外，“傳遞性”+“時(shí)序連接詞”的貢獻(xiàn)度要大于它們各自貢獻(xiàn)度之和(2.89>1.60+0.53)，因?yàn)椤皶r(shí)序連接詞”的加入提升了“傳遞性”中部分事件關(guān)系對(duì)的正確率，從而保證了其余事件關(guān)系對(duì)能夠被正確約束。而“傳遞性”+“事件類型對(duì)”的貢獻(xiàn)度卻小于它們各自貢獻(xiàn)度之和(2.15<1.60+0.70)，主要原因在于特定類型的事件對(duì)之間的關(guān)系不如含有時(shí)序連接詞的事件對(duì)關(guān)系明確，例如，一個(gè)攻擊類事件發(fā)生后造成受傷類事件，可能之后又發(fā)生了攻擊類事件，再如審理之后對(duì)被告判決，可能由于被告不服，會(huì)再次審理。

本文所用約束條件中，“自反性”、“傳遞性”和“同指性”為強(qiáng)規(guī)則約束條件，理論上是完全正確的；而“時(shí)序連接詞”和“事件類型對(duì)”僅僅是在絕大多數(shù)情況下成立的，并不能保證完全正確，例如，“近幾起沖突共造成10人死亡”中，雖有時(shí)序標(biāo)志詞“造成”，但事件“沖突”的發(fā)生時(shí)間是一個(gè)時(shí)間段，所以“沖突”與“死亡”是overlap關(guān)系。若“時(shí)序連接詞”和“事件類型對(duì)”與強(qiáng)規(guī)則約束條件發(fā)生沖突時(shí)，則以強(qiáng)規(guī)則約束條件為準(zhǔn)；若“時(shí)序連接詞”與“事件類型對(duì)”發(fā)生沖突時(shí)，以“時(shí)序連接詞”為準(zhǔn)，因?yàn)椤皶r(shí)序連接詞”的正確率相對(duì)較高。

5.3 討論

本文實(shí)驗(yàn)所采用的時(shí)序關(guān)系分類方法與文獻(xiàn)[2]中類似，實(shí)驗(yàn)語料均為ACE新聞?wù)Z料，并且都使用全局推理方法，但是，本文實(shí)驗(yàn)改進(jìn)了目標(biāo)函數(shù)，并引入了更多更有效地約束條件。

兩次實(shí)驗(yàn)均表明，全局推理方法能有效提高事件時(shí)序關(guān)系識(shí)別性能。文獻(xiàn)[2]中，實(shí)驗(yàn)結(jié)果表明，在僅使用自反性、傳遞性等少量約束條件時(shí)，全局推理方法較機(jī)器學(xué)習(xí)方法就有很大的提升。而本文實(shí)驗(yàn)在僅使用文獻(xiàn)[2]中的約束條件時(shí)，提升的結(jié)果并不是很高。其原因主要有：一、本文中的機(jī)器學(xué)習(xí)分類方法實(shí)驗(yàn)性能要遠(yuǎn)高于文獻(xiàn)[2]的實(shí)驗(yàn)性能(F1值高了將近15%)；二、文獻(xiàn)[2]所用語料較為稀疏，僅僅20篇文檔， 324個(gè)事件，實(shí)驗(yàn)結(jié)果偶然性較大，而本文實(shí)驗(yàn)語料包含271篇文檔，2 291個(gè)事件。

此外，本文提出了幾個(gè)約束條件使實(shí)驗(yàn)性能有很大的提高，這幾個(gè)約束條件的加入，保證了傳遞閉包性質(zhì)的有效性。因此，有效地約束條件能更好地提升全局推理模型的性能。

6 總結(jié)與展望

本文提出了一個(gè)全局推理方法來進(jìn)一步提升中文事件時(shí)序關(guān)系識(shí)別的性能。特別是在構(gòu)建全局推理模型時(shí)，提出了同指關(guān)系、時(shí)序連接詞及事件類型對(duì)多個(gè)有效約束條件。實(shí)驗(yàn)結(jié)果表明，本文的全局推理方法在有監(jiān)督的機(jī)器學(xué)習(xí)方法的基礎(chǔ)上有了較大的提高，且本文提出的幾個(gè)約束條件起到了很大的作用。

在下一步研究工作中，一方面提高“時(shí)序連接詞”和“事件類型對(duì)”的正確率；另一方面引入更多的語義和篇章知識(shí)等信息加入到全局推理模型中，進(jìn)一步提高系統(tǒng)的性能。

[1] Nathanael Chambers, DanJurafsky. Jointly Combining Implicit Constraints Improves Temporal Ordering[C]//Proceedings of the Conference on EMNLP, 2008: 698-706.

[2] Quang Xuan Do, Wei Lu, Dan Roth. Joint Inference for Event Timeline Construction[C]//Proceedings of the 2012 Joint Conference on EMNLP, 2012: 677-687.

[3] James Pustejovsky, Patrick Hanks, Roser Sauri, et al. The TimeBank Corpus[C]//Proceedings of the Corpus Linguistics, 2003: 647-656.

[4] Inderjeet Mani, Marc Verhagen, Ben Wellner, et al. Machine Learning of Temporal Relations [C]//Proceedings of the 21st International Conference on Computational Linguistics and the 44th annual meeting of the Association for Computational Linguistics, 2006: 753-760.

[5] Nathanael Chambers, Shan Wang, DanJurafsky. Classifying Temporal Relations between Events [C]//Proceedings of the 45th Annual Meeting of the ACL on Interactive Poster and Demonstration Sessions, 2007: 173: 176.

[6] Jennifer D’Souza, Vincent Ng. Classifying Temporal Relations with Rich Linguistic Knowledge[C]//Proceedings of NAACL-HLT, 2013: 918-927.

[7] Jun-Ping Ng, Min-YenKan, Ziheng Lin, et al. Exploiting Discourse Analysis for Article-Wide Temporal Classification[C]//Proceedings of EMNLP, 2013: 12-23.

[8] 王昀, 苑春法. 基于轉(zhuǎn)換的時(shí)間-事件關(guān)系映射[J]. 中文信息學(xué)報(bào), 2004, 18(4): 23-30.

[9] 林靜, 苑春法. 漢語時(shí)間關(guān)系抽取與計(jì)算[J]. 中文信息學(xué)報(bào), 2009, 23(5): 62-67.

[10] 仲兆滿, 劉宗田, 周文, 付劍鋒. 事件關(guān)系表示模型[J]. 中文信息學(xué)報(bào), 2009, 23(6): 56-60.

[11] Y C Cheng, M Asahara, Y Matsumoto. Constructing a Temporal Relation Tagged Corpus of Chinese based on Dependency Structure Analysis[C]//Proceedings of Temporal Representation and Reasoning, In 14th International Symposium on Temporal Representation and Reasoning, 2007: 59-69.

[12] Y C Cheng, M Asahara, Y Matsumoto. Use of Event Types for Temporal Relation Identification in Chinese Text[C]//Proceedings of IJCNLP, 2008: 31-38.

[13] 譚紅葉, 鄭家恒, 梁吉業(yè). 時(shí)間關(guān)系識(shí)別研究進(jìn)展[J]. 中文信息學(xué)報(bào), 2011,, 25(5): 44-52.

[14] 王風(fēng)娥, 譚紅葉, 錢揖麗. 基于最大熵的句內(nèi)時(shí)間關(guān)系識(shí)別[J]. 計(jì)算機(jī)工程, 2012, 38(4): 37-39.

[15] Katsumasa Yoshikawa, Sebastian Riedel. Jointly Identifying Temporal Relations with Markov Logic[C]//Proceedings of the 47th Annual Meeting of the ACL and the 4th IJCNLP of the AFNLP, 2009: 405-413.

[16] Pascal Denisand Philippe Muller. Predicting globally-coherent temporal structures from texts via endpoint inference and graph decomposition[C]//Proceedings of the Conference on IJCAI, 2011: 1788-1793.

[17] Nathanael Chambers, Taylor Cassidy, Bill McDowell, et al. Dense Event Ordering with a Multi-Pass Architecture[C]//Proceedings of the Transactions of the Association for Computational Linguistics, 2014: 273-284.

[18] PhilipBramsen, Pawan Deshpande, Yoong Keok Lee, et al. Inducing Temporal Graphs[C]//Proceedings of the 2006 Conference on EMNLP, 2006: 198-198.

Global Inference for Temporal Relations Between Chinese Events

ZHENG Xin1，2, LI Peifeng1，2, ZHU Qiaoming1，2

(1. School of Computer Science and Technology, Soochow University, Suzhou，Jiangsu 215006，China; 2. Key Lab of Computer Information Processing Technology of Jiangsu Province, Suzhou, Jiangsu 215006, China)

In recently years, more and more studies are devoted to temporal relations between events, with a focuse on improving pairwise classifiers, ignoring the obvious inconsistent problems in the global space of events when misclassifications occur. In this paper, we use a global inference model to resolve such problem bytreating temporal relations recognition as Integer Linear Program. We use many constraints, such as reflexivity, transitivity, event coreference, temporal conjunctions, pairs of event types, etc. The experimental results show that the global inference model outperformed the local classifiers by 3.56% in F1.

event; temporal relation; inference

鄭新(1990—)，碩士研究生，主要研究領(lǐng)域?yàn)樽匀徽Z言處理，中文信息處理。E?mail：358581959@qq．com李培峰(1971—)，博士，教授，主要研究領(lǐng)域?yàn)樽匀徽Z言處理，中文信息處理，Web信息處理和嵌入式系統(tǒng)。E?mail：pfli@suda．edu．cn朱巧明(1963—)，博士，博士生導(dǎo)師，主要研究領(lǐng)域?yàn)樽匀徽Z言處理，中文信息處理，Web信息處理和嵌入式系統(tǒng)。E?mail：qmzhu@suda．edu．cn

1003-0077(2016)05-0129-07

2014-02-29 定稿日期： 2015-03-30

國(guó)家自然科學(xué)基金(61472265)；國(guó)家自然科學(xué)基金(61331011)；江蘇省前瞻性聯(lián)合研究項(xiàng)目(BY2014059-08)

TP391