李業剛,孫福振,李鑒柏,呂新宇
(1.山東理工大學計算機科學與技術學院,山東淄博255091;2.北京理工大學計算機學院,北京100081)
語義角色標注就是對于給定句子中的每個謂詞(動詞、名詞等)分析出其在句中的相應語義成分,并作相應的語義標記,如施事、受事、工具或附加語等.具體而言,即標注句子中的一些成分為給定謂詞的語義角色,這些成分作為此謂詞框架的一部分被賦予一定的語義含義.語義角色標注綜合了自然語言處理領域的基礎技術,如分詞、詞性標注、句法分析等,因此研究語義角色標注也為研究機器學習方法和那些底層的技術提供了研究平臺.作為自然語言處理的基礎技術,語義角色標注在很多應用中也發揮了很大的作用.目前語義角色標注已在問答系統[1]、信息抽取、信息檢索[4],自動文摘[5]、文本蘊涵、機器翻譯[8]等領域成功應用.本文擬從語義角色標注的語料庫的資源、預處理、標注單元、標注過程及目前研究存在的問題及發展方向等進行了論述.
進行自動語義角色標注,需要規模大、質量高的語料資源的支持.目前,英語較為知名的語義角色標注資源為FrameNet[9]、PropBank[10]和Nom-Bank[11].
U.C.Berkeley開發的FrameNet以框架語義為標注的理論基礎對英國國家語料庫進行標注.它試圖描述每個謂詞(動詞、部分名詞以及形容詞)的語義框架,并試圖描述這些框架之間的關系.Prop-Bank是賓夕法尼亞大學在Penn TreeBank句法分析語料庫的基礎上標注的語義角色標注語料庫.PropBank只對動詞(不包括系動詞)進行標注,相應的被稱作謂語動詞.而且只包含20多個語義角色.其中核心的語義角色為Arg0~5六種,Arg0通常表示動作的施事,Arg1通常表示動作的影響等,Arg2~5根據謂語動詞不同會有不同的語義含義.與FrameNet相比,PropBank基于Penn TreeBank手工標注的句法分析結果進行標注,因此標注的結果幾乎不受句法分析錯誤的影響,準確率較高.它幾乎對Penn TreeBank中的每個動詞及其語義角色進行了標注,因此覆蓋范圍更廣,可學習性更強.紐約大學的研究人員開發的NomBank是為了彌補PropBank僅以動詞作為謂詞,存在標注過于粗略的缺點.NomBank標注了Penn TreeBank中的名詞性的謂詞及其語義角色.另外NomBank容許角色出現相互覆蓋的情況,這也是與PropBank不同的.
中文語義角色標注的研究主要使用三種資源:Chinese Proposition Bank(CPB),Chinese Nombank[12],Chinese FrameNet[13].Chinese PropBank(CPB)同英文PropBank基本類似,是Upenn基于Penn Chinese Treebank(CTB)標注的漢語淺層語義標注資源,在Penn Chinese Treebank句法分析樹的對應句法成分中加入了語義信息.Chinese Nombank把傳統的英文Proposition Bank和Nombank的標注框架,擴展到對中文名詞性謂詞的標注.山西大學構建的Chinese FrameNet是基于框架語義理論的,是一種FrameNet風格的中文詞典.它描述了詞匯單元以及參與者框架元素之間的關系,也包含了框架元素的詳細句法信息.
預處理主要是對原始句子進行詞匯、句法分析和謂詞識別等.謂詞識別是識別出句子中的動詞性謂語,并為它們分配詞義.在傳統的基于短語結構句法分析的語義角色標注(SRL)系統中通常不執行這步,默認謂詞已識別正確.CoNLL2008要求進行謂詞標注,謂詞識別分為兩步:謂詞標注和詞義識別.謂詞標注的任務是標注出句子中的謂詞;詞義識別在前者所識別的謂詞基礎上進行詞義的分配.這兩步都可以看成是分類問題,前者是一個二元分類問題,詞義識別則是多元分類問題,因此在實現時可采用各種分類器進行分類.在特征向量的選取上,采用了同語義角色標注類似的特征.因此預處理的關鍵就變成了分類器的選擇和特征向量的選取的問題.
根據對句子的不同標注情況,語義角色標注系統自動標注的基本單元可以是句法成分、組塊、短語、詞等.詞標注單元主要用于基于依存句法分析語義角色標注系統,短語主要用于基于Chunk的語義角色標注系統,句法成分主要用于基于短語結構句法分析的語義角色標注系統.目前,從整體效果上看,以句法成分為標注單元的語義角色標注要優于以詞和短語為標注單元的方法.
文獻[14] 以句法成分為基本標注單元的,這種策略在短語結構句法分析比較成熟的語言(如英文等)上表現得較好.然而,在其它語言上,很難自動的獲得這種深層句法分析的結果,而且現有的句法分析系統,在通用領域表現欠佳.為此有人試圖將語義角色標注建立在淺層句法分析的基礎之上,其中文獻[15] 中文語義角色標注F1值為74%.畢竟淺層句法分析的魯棒性要好于深層句法分析.詞是比短語更細的語言單位,有些語義角色標注系統也使用詞作為標注的基本單位,然而效果并不如基于短語的和基于句法成分的理想[16].以上的方法都是建立在短語結構句法分析方法基礎之上的,Hacioglu使用依存句法分析結果進行語義角色標注[17],也取得了可以與基于短語結構句法分析的相比較的結果.我們可以直接使用依存句法分析器獲得依存句法分析的結果,也可以轉化短語結構句法分析的結果為依存句法分析結果.與基于短語結構句法分析的方法相比,基于依存句法分析不但可以利用短語之間的依存特征,而且只需要學習和預測與謂詞有依存關系的短語為某種語義角色即可,因此也加快了標注的速度.
基于短語結構的句法分析是句法分析中最為成熟的技術,性能和結果各方面都比較可靠、穩定.這種策略在句法分析比較成熟的語言(如英文等)上表現得較好.然而句法分析效果并不完美,所以不可能每一個角色都能夠在句法分析樹中找到與之匹配的句法成分.據統計在PropBank中,基于手工標注的句法分析樹中有4.3%的語義角色找不到句法成分與之相匹配.對于由Charniak Parser產生的自動句法分析樹約有10.0%的語義角色與句法成分不相匹配.而由Collins Parser產生的自動句法分析樹,這一數值更高,約為12%.在其它語言上,很難自動的獲得這種句法分析的結果,而且現有的句法分析系統,在通用領域表現欠佳.為此有研究者試圖將淺層語義分析建立在淺層句法分析的基礎上.
現在絕大多數的語義角色標注系統采用基于短語結構的句法分析,按照對句法分析的不同依賴程度可分成三類:基于最佳單棵句法樹的SRL方法、基于最佳n棵句法樹的SRL方法和基于聯合學習的句法分析和SRL方法.在這些方法中,基于最佳單棵句法樹的SRL方法是被研究最多的,占主導地位.目前文獻報告的在單個自動句法樹上的有劉挺等[18],F1值為77.13%,李軍輝[19]等在CoNLL2005 Shared Task開發集和WSJ測試集上分別獲得了77.54%和78.75%的F1值,.而在手工句法分析上最好的成績是Pradhan等[20]報告的,F1值為89.4%.從上述數據可看出,基于手工句法分析的結果相比于自動句法分析的結果,相差了約12.3%,它們的性能差別主要取決于提供的句法分析的性能.
基于語義組塊分析的語義角色標注中,標注的流程不再是傳統的句法分析-語義角色識別-語義角色分類,而是一種簡化的語義組塊識別-語義組塊分類流程.這一方法將語義角色標注從一個節點的分類問題轉化為序列標注問題,由于避開了句法分析這個階段,使得語義角色標注擺脫了對句法分析的依賴,從而突破了語法分析器的時間和性能限制.可以取得較高的準確率,并且大大節省了分析的時間.丁偉偉[21]與Carreras[22]等,Punyakanok[23]等比較發現,在中文語義角色標注中基于語義組塊的方法上產生了與基于句法分析的方法可比較的結果.而英文則不然,主要因為,從分析準確率來看,中文的句法分析器相較于英文遜色許多,錯誤的分析對語義角色標注的負面影響是很大的,這使得使用基于句法分析的方法進行語義角色標注效果不好.其次,不同于基于語法組塊的方法,語義組塊使組塊分析直接面向語義角色標注.語義組塊識別直接依賴于特定動詞,有利于充分提取與語義角色標注相關的特征,這使得基于語義組塊方法避免了傳統的基于語法組塊方法中由于句法組塊分析和語義角色標注脫節(例如組塊邊界和語義角色邊界不一致)帶來的弊端,提高了標注的準確率.
依存句法分析表達的句法結構是單詞與單詞之間的依賴關系圖.從理論上分析,依存句法中的句法-語義接口更簡單、更直觀,并提供了更透明的謂詞-論元關系表達.因此在基于短語結構句法分析的語義角色標注系統遭遇到發展瓶頸,如局部模型的機器學習方法很難有更大進展,數據的稀疏問題嚴重,更有效的特征難以抽取等,導致性能無法進一步提高.因此研究者開始探討在另一種句法分析上進行語義角色標注——基于依存關系的語義角色標注.
基于依存分析的SRL研究相對較少,Hacioglu等[24]首次采用基于依存分析的方法來實現語義角色標注,所使用的依存樹是由句法樹轉化而來,采用SVM分類器實現了角色的分類,提出了12個特征(依存關系,位置,中心詞,依賴詞等),并且表明謂詞相關信息的重組對性能影響很大.最終在基于手工依存分析語料庫Depbank和CoNLL2004shared task語料庫上的F1值分別為84.6和79.8.這表明雖然使用的信息比基于句法分析SRL少,但取得的結果相似.Pradhan等[25]使用基于規則的依存分析結果進行SRL實驗,取得的結果比使用最新的基于統計短語結構句法分析的性能要差很多,在WSJSection23上的F值從78.4下降到了47.2.類似的,Swanson和Gordon[26]報告:從基于規則的依存分析中抽取的句法樹特征不如從短語結構句法分析上抽取的相同特征表現穩定.而最新的基于依存關系的SRL研究出現在CoNLL2008評測中,代表作是Johansson等的工作.在Johansson等一文中,詳細比較了基于短語結構句法分析和基于依存結構句法分析的SRL在FrameNet語料庫上的性能,結果表明使用現代基于統計的依存句法分析,兩者的性能幾乎是相當的.文章還指出早期基于依存關系SRL的性能較差的原因是依存句法分析的準確率較低.他們的實驗還表明,依存關系表示中的語法功能信息影響了語義角色分類器的訓練;而使用依存關系訓練得到的角色分類器對因跨領域而引起的詞匯問題更具復原力.在Johansson等的另一篇文章[28]中詳細分析比較了兩種SRL系統在Prop-Bank語料上的性能.這篇文章的貢獻在于分別使用基于部分短語的(segment-based)和基于依存關系(dependency-based)的衡量標準來公平的比較代表當前最好性能的兩類SRL系統的性能.他們實現的基于依存句法的SRL系統在上述兩項衡量標準下F值分別為77.97(WSJ+Brown)和84.29(CoNLL-2008測試集).實驗結果表明,基于依存分析的SRL系統更偏向于查找角色頭而不是角色的文字片斷.這樣的特性究竟是優點還是缺點取決于具體的應用,如對于使用模板填充類的系統可能需要完整的角色;而對于使用語義角色標注表示的文本分類則可能僅需要角色的頭.同基于短語結構句法分析的語義角色標注類似,基于依存關系的語義角色標注步驟一般可分為三步:謂詞識別、角色識別和角色分類.當然還可以包括后處理,這里的后處理主要是進行全局推導.
進行語義角色標注首先需要進行句法分析,并在句法分析的基礎上進行謂詞識別.所謂謂詞識別就是識別出句子中的謂語動詞或名詞,并為該謂詞標注詞義.目前大部分的語義角色標注系統并不進行謂詞識別,這是因為大部分系統默認使用了語料庫中人工標注的謂詞及其詞義.但謂詞識別也是語義角色標注中的重要一步,它的性能直接影響到系統性能.除去對原始句子進行詞匯、句法分析和謂詞識別等預處理外,目前大部分語義角色標注系統的標注過程采用四個步驟完成:剪枝、識別、分類和后處理.國內外很多學者對每個過程的研究也非常豐富,對于識別、分類階段的特征挑選方面也進行了細致的研究.當然,并非所有的系統都包括以上4個步驟,特別是前兩個步驟,其主要目的是提高處理效率,但隨之帶來的是召回率的下降,即損失了一些本應是語義角色的標注單元.因此,在某些系統中,去除了剪枝步驟.還有些系統合并了識別和分類步驟[29],直接對語義角色進行分類,也就是將非語義角色的標注單元也看成是一類.
以句法成分為標注單元的語義角色標注,首先需要一種簡單的剪枝預處理方法來過濾句法分析樹中一些不可能成為語義角色的句法成分,保留盡量少的候選句法成分,以提高準確性.劉挺等[18]采用識別分類一步到位的方法對與謂詞相關的全部句法成分進行訓練和預測,只裁掉了句法類型為詞性的句法成分.但使得AM-MOD和AM-NEG等角色對句法樹上的句法成分匹配率很低,還要進行后處理.使用最廣泛的剪枝算法是由Xue等[12]提出的.其基本思想是選取當前謂詞結點和其祖先的兄弟結點作為候選角色,輸入到角色識別階段,其中如果當前結點是PP,則同時收集其直接孩子結點.
王紅玲等[30]提出了基于中心詞的剪枝算法,在預處理階段,針對句法分析樹中句法成分與語義角色不一一匹配的問題,在Xue[12]剪枝算法的基礎上改進,提出了基于中心詞的剪枝算法.該算法除選取當前謂詞結點和其祖先的兄弟結點作為候選角色外,也選取這些兄弟結點的孩子結點,如孩子結點與其父親結點具有相同中心詞時,舍去孩子結點和其兄弟結點.該算法提高了系統的召回率(1.1%).
標注方法語義角色的識別和分類步驟尤為重要,它們可以作為分類問題處理.也就是說,人們可以逐一判斷一個標注單元是否是某一動詞的語義角色,更進一步的,可以預測其屬于何種具體的語義角色.最初人們使用基于規則的方法來解決分類問題,但是,此方法需要專家構筑大規模的知識庫,這不但需要有專業技能的專家,也需要付出大量勞動.同時,隨著知識庫的增加,矛盾和沖突的規則也隨之產生.為了克服知識庫方法的缺點,人們后來使用機器學習的方法來解決此問題.該方法的優點是不需要有專業技能的專家書寫知識庫,只需要有一定專業知識的人對任意一種語言現象做出適當的分類即可.然后以此為訓練數據,再使用各種學習方法構造性能卓越的分類器.該方法通常稱為有指導學習(Supervised Learning)方法.雖然它能夠較好的解決一些已有大量正確標注語料庫的自然語言處理問題,但是通常,我們獲得這種語料庫的代價也是昂貴的.為此,人們試圖使用未標注的語料庫直接進行學習,這種方法被稱作無指導學習(Unsupervised Learning)[31].或者只借助少量標注語料,利用大量未標注語料的半指導學習(Semi-supervised Learning)[32].然而無論是無指導學習,還是半指導學習,其理論都不甚完備,效果也不如有指導學習方法,但是泛化要好得多.
對于一個句法成分嵌套在另一個成分中的情況,如不采取處理系統有可能對這兩個成分都進行了標注.但是,根據語義角色標注的規范,這是不允許的.因此,最簡單的做法是在嵌套關系發生時,只保留一個角色.由于最大熵分類器能夠很容易地預測每一個輸出的概率,因此,處理嵌套時只把嵌套關系中概率最高的成分標注出來.
嵌套關系的處理也可以放在論元識別之后、分類之前進行.這是因為二元訓練中樣例大致平衡,準確率也比較高,同時對分類階段引入的錯誤也可以降低.Toutanova等[33]采用了這種方法,而且還采用動態規劃的方法,自底向上地從句法樹的葉子結點開始到根計算當前句法成分為根形成的不嵌套的子樹與當前句法成分分別為空角色和非空角色的概率和,從而取得不嵌套的論元序列.
王紅玲等[34]提出了基于角色共現概率的去除重復論元算法,具體思想為:經過分類后,可取得最可能承擔當前句法成分角色的兩個角色的概率,即具有最高概率的兩個角色,然后通過計算角色的共現概率,來決定最終的角色.在后處理階段,針對語義角色標注中不允許兩個嵌套的句法成分同時承擔動詞的角色的問題,提出了基于角色共現概率的去除嵌套關系的算法,其基本思想是根據角色共現概率的大小決定保留的角色.針對謂語動詞不會同時存在兩個或兩個以上的相同的核心角色的問題,提出了基于角色共現概率的去除重復論元的算法,具體思想為:經過分類后,取得最可能承擔當前句法成分角色的兩個角色的概率,即具有最高概率的兩個角色,然后通過計算角色的共現概率,來決定最終的角色.實驗結果表明,角色分類的準確率普遍提高,而對召回率的影響很?。@個現象充分說明了后處理對角色分類是有效的.
語義角色標注的性能嚴重依賴于句法分析的性能,而這個問題在中文的語義角色標注中尤其突出;由于很難提出更有效的特征,基于短語結構的語義角色標注系統發展遭遇瓶頸,性能很難進一步提高;跨領域分析性能較差等各個方面.
由于句法分析的錯誤,語義分析的性能等原因,獨立的語義角色標注系統很難獲得滿意的分析結果,因此試圖融合多種語義角色標注的結果可以作為一種嘗試.但要面對各種融合方法都或多或少的提高了系統的整體性能,當然也造成了系統構造復雜,分析效率不高等問題.
語義角色標注的性能離實用化還有一定的距離,需要繼續深入研究.歸納起來,有以下幾個方面有待進一步研究:
1)領域適應性問題.為了使語義角色標注達到實用的目的,必須解決領域適應性問題,也就是說解決測試語料和訓練語料屬于不同的領域,性能下降較多的問題.研究結果表明,Brown語料上的評測結果均較之WSJ語料結果低10%左右.真正解決這個問題還有很遠的路要走.
2)句法分析和語義分析的聯合學習.以往的研究均表明,不管是短語結構句法還是依存結構句法,語義角色標注系統的性能都受制于句法分析的性能,這一點在中文上表現尤為突出.實驗結果表明:在英文中,使用手工標注和自動標注句法分析的SRL系統性能相差10%,而在中文上,這個值達到了30%.而進行聯合學習是解決這個問題的一個有效途經.
3)基于依存句法分析的中文語義角色標注的進一步研究.這個研究方向剛剛起步,主要原因是沒有合適的標注語料庫,也沒有合理的評測標準.已有研究表明,依存句法分析相比與短語結構的句法分析,含有更多的語義信息.因此該研究方向值得進一步深入研究.
[1] Shen D,Lapata M.Using semantic roles to improve question answering[C] //Annie Zaenen,Antal van den Bosch.Proceedings of the 2007Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning.Edmonton:Association for Computational Linguistics,2007:12-21.
[2] Mihai S,Sanda H,John W.Using predicate-argument structures for information extraction[C] //Erhard W Hinrichs,Dan Roth.Proceedings of the Annual Meeting on Association for Computational Lingustics.Sapporo:Association for Computational Linguistics,2003:8-15.
[3] 于江德,樊孝忠,龐文博.事件信息抽取中語義角色標注研究[J] .計算機科學.2008,35(3):155–157
[4] Bilotti M W,Ogilvie P,Callan J,et al.Structured retrieval for question answering[C] //Kraaij W,de Vries AP,Clarke CLA,eds.Proceedings of the 30th Annual Int'l ACM SIGIR Conf.on Research and Development in Information Retrieval.New York:ACM,2007,351-358.
[5] 秦兵,劉挺,李生.多文檔自動文摘綜述[J] .中文信息學報,2005,19(6):14-20.
[6] Braz R,Girju R,Punyakanok V,Roth D,et al.An inference model for semantic entailment in natural language[C] //Cristiano Castelfranchi.National Conference on Artificial Intelligence.Virginia:AAAI,2005:1 678-1 679.
[7] 吳曉鋒,宗成慶.基于語義角色標注的新聞領域復述句識別方法.中文信息學報[J] .2010,24(5):3-8
[8] Jinho D C,Matha P.Transition-based semantic role labeling using predicate argument clustering[C] //Matsumoto,Yuji Mihalcea,Rada.Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics:Human Language Technologies.Portland:Association for Computational Linguistics,2011:37-45.
[9] Baker C F,Fillmore C J,Lowe J B.The berkeley frameNetproject[C] //Salimer M.Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics and 17th International Conference on Computational Linguistics.Montreal:Association for Computational Linguistics.1998:86-90.
[10] Palmer M,Gildea D,Kingsbury P.The proposition bank:an annotated corpus of semantic roles[J] .Computational Linguistics.2005,31(1):71-106.
[11] Meyers A,Reeves R,Macleod C.The nombank project:an interim report[C] //Susan Dumais,Daniel Marcu,Salim Roukos Proceedings of HLT-NAACL 2004Workshop:Frontiers in Corpus Annotation.Boston:Association for Computational Linguistics,2004:24-31.
[12] Xue N.Annotating the predicate-argument structure of chinese nominalizations[C] //M Gild.Proceedings of the LREC 2006.Genoa:Association for Computational Linguistics,2006:1382 1387.
[13] You L P,Liu K Y.Building chinese framenet database[C] //Mrques K.Conference on Natural Language Processing and Knowledge Engineering(IEEE NLP-KE).NewYork:IEEE,2005:301-306.
[14] Punyakanok V,Roth D,Yih W T.The necessity of syntactic parsing for semantic role labeling[C] //R.Dale.Proceedings of IJCAI-2005.Berlin:Association for Computational Linguistics,2005:1 117-1 123.
[15] 王鑫,孫薇薇,穗志方.基于淺層句法分析的中文語義角色標注研究.中文信息學報[J] .2011,25(1):116–122
[16] Kwong O Y,Tsou B K.Semantic role tagging for chinese at the lexical level[C] //Robert Dale.Second International Joint Conference on Natural Language Processing.Jeju Island:Association for Computational Linguistics,2005:804-814.
[17] Hacioglu K.Semantic role labeling using dependency trees[C] //COLING'04Proceedings of the 20th international conference on Computational Linguistics.Geneva:Association for Computational Linguistics,2004:1 273-1 281.
[18] 劉挺,車萬翔,李生.基于最大熵分類器的語義角色標注[J] .軟件學報,2007,18(3):565-573.
[19] 李軍輝,王紅玲,周國棟,等.語義角色標注中句法特征的研究.中文信息學報[J] .2009,23(6):11-18
[20] Pradhan S,Hacioglu K,Krugler V,et al.Support vector learning for semantic argument classification[J] .Machine Learning Journal.2005,60(1):11-39.
[21] 丁偉偉,常寶寶.基于語義組塊分析的漢語語義角色標注.中文信息學報[J] .2009,23(5):53-61,74
[22] Carreras X,Mrques L.Introduction to the conll2005shared task:semantic role labeling[C] //Daniel Gildea,CONLL'05 Proceedings of the Ninth Conference on Computational Natural Language Learning.Stroudsburg:Association for Computational Linguistics,2005:152-164.
[23] Duan H,Bai X,Chang B,et al.Chinese word segmentation at Peking University[C] //Qing Ma,Fei Xia.Proceedings of the Second SIGHAN Workshop on Chinese Language Processing.Sapporo:Association for Computational Linguistics,2003:152-155.
[24] Hacioglu K.Semantic role labeling using dependency trees[C] //Joakim Nivre,COLING'04Proceedings of the 20th international conference on Computational Linguistics.Geneva:Association for Computational Linguistics,2004:1273-1276.
[25] Pradhan S,Ward W,Hacioglu K,et al.Semantic role labeling using different syntactic views[C] //Kevin Knight,Hwee Tou Ng,Kemal Oflazer.Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics,Ann Arbor:Association for Computational Linguistics,2005:581-588.
[26] Swanson R,Gordon A S.A comparison of alternative parser tree paths for labeling semantic roles[C] //Nicoletta Calzolari,Claire Cardie,Pierre Isabelle.Proceedings of the 21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics.Sydney:Association for Computational Linguistics,2006:811-818.
[27] Johansson R,Nugues P.The effect of syntactic representation on semantic role labeling[C] //Donia Scott,Hans Uszkoreit,Proceedings of 22nd International Conference on Computational Linguistics.Stroudsburg:Association for Computational Linguistics 2008:393-400.
[28] Johansson R,Nugues P.Dependency-based semantic role labeling of PropBank[C] //Mirella Lapata,Hwee Tou Ng,Proceedings of the 2008Conference on Empirical Methods in Natural Language Processing,Honolulu:Association for Computational Linguistics.2008:69-78.
[29] Liu T,Che W,Li S,et al.Semantic role labeling system using maximum entropy classifier[C] //Daniel Gildea.CONLL'05 Proceedings of the Ninth Conference on Computational Natural Language Learning.Stroudsburg:Association for Computational Linguistics,2005:189-192.
[30] Wang H L,Zhou G D,Zhu Q M.Dependency tree-based SRL with proper pruning and extensive feature engineering[C] //Iryna Gurevych,Delphine Bernhard.Proceedings of the 22nd International Conference on Computational Linguistics(Coling 2008),Manchester:Coling 2008Organizing Committee,2008.23-24.
[31] Swier R S,Stevenson S.Unsupervised semantic role labelling[C] //D Lin,D Wu.Proceedings of the 2004Conference on Empirical Methods in Natural Language Processing.Barcelona:Association for Computational Linguistics,2004:95-102
[32] 陳耀東,王挺,陳火旺.半監督學習和主動學習相結合的淺層語義分析.中文信息學報[J] .2008,22(2):70-75
[33] Zhang M,Che W X,AW A T,et al.A grammar-driven convolution tree kernel for semantic role classification[C] //Annie Zaenen,Antal van den Bosch.Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics.Prague:Association for Computational Linguistics,2007:200-207.
[34] Wang H L.Research on feature-based semantic role labeling for English and Chinese[D] .Suzhou:Soochow University,2008.