許有勝
(中國石油大學對外漢語教學部,北京102249)
本文主要是基于規則的方法,討論漢語中一種復雜謂語——連動結構的自動識別以及分析的辦法,我們不奢求能解決所有問題,我們的目標有兩個:一是如何識別出連動結構,二是如何大致分析出同時關系連動結構還是異時關系連動結構,如果是表示異時關系連動結構,可以分辨出是順承關系連動結構還是有時間先后也兼表目的關系的連動結構。我們的目標是在一個實際語料的語篇中,通過系統的自動分析,辨析出連動結構,以及連動結構的基本類型。大致的分析流程主要包括:分句規則→詞法分析→短語結構分析→句法語義分析→分解規則→連動結構分析。
對句子進行識別,首先要切分小句。我們利用張衛國(2003)的研究成果,可以將一整段話按照標點符號將每個小句分行顯示,完成分句分析。這樣,就為我們在小句基礎上分析連動結構作好了前提條件和準備。
提取出小句后,就需要對各個句子進行詞法分析,包括自動分詞和詞性標注兩個方面。通過最大匹配法、最大概率法都可以達到很好的分詞效果;通過基于隱馬爾可夫模型的詞性標注方法或者是基于轉換的錯誤驅動的詞性標注方法①關于這兩種詞性標注方法可以參看俞士汶,《計算語言學概論》,北京,商務印書館,2004。這些方法的標注正確率可以達到95%以上,基本能滿足句法分析的需要。經過自動分詞處理和詞性標注以后的語句,很多語言信息可以在此基礎上處理。如“把這篇報道編輯一下”,標注以后的形式如下:
把/p這/r篇/q報道/n編輯/v一/m 下/q②本文所采用詹衛東(1999)的符號代碼,可以參看詹衛東,《面向中文信息處理的現代漢語短語結構規則研究》,北京,清華大學出版社,1999,第20頁。其中p表示介詞,r表示代詞,q表示量詞,n表示名詞,v表示動詞,m表示動量詞。
作為一個句法成分,很多語言分析是在短語層面進行的,而對連動結構來說,尤其如此,如我們在討論連動結構的時候是以動詞短語為單位,而不能以動詞為單位,如:
他/n爬/v起來/v了/u。
上面的例句中有兩個動詞,但我們不能據此判斷這是一個連動結構,我們只能以一個動詞短語“爬起來”計算,判斷這是一個單動結構的謂語句。
對短語層面的處理包括對短語邊界的界定和對短語性質的界定兩個方面。對于短語邊界的界定,主要的方法有:基于規則、基于互信息、基于神經元網絡、基于最大熵模型以及利用二叉樹剪枝等手段來識別。①分別參看郁梅(1994)、張國煊(1995)、奚晨海(2002)、李劍鋒(2004)、荀恩東(2006)等人著作。
關于各種短語性質界定,可以參見詹衛東(1999)。
短語中也可以鑲嵌短語,標注以后的一些形式如下:
周仲偉/n[跑/v過去/v]vp[拉/v開/v]vp了/u[[這/r道/q]rp門/n]np 。
其中,“這道門”這個名詞性短語中鑲嵌了“這道”一個代詞性短語。
在進行句法結構分析之前,要首先對句法結構中缺省和省略的一些句法成分進行還原處理。我們需要補出的主要是主語和論元兩個部分。
2.3.1 補出主語:
構成連動結構的一個基本要求就是多個動詞性結構只有一個共同的主語,而連動結構的主語很多是在小句之外,給識別造成困難,這就要在小句外面找出該連動結構的主語,幫助識別。如:
(1)他走到擺著煙卷的黃銅橢圓桌子邊,從銀匣里撿了一枝雪茄煙燃著了。②本文例句大多選自茅盾《子夜》,例句后方括號數字為選自該書的章節數。
“撿了一枝雪茄”和“燃著了”在小句范圍內都沒有主語,聯系前一個分句,這個主語應該是“他”。
2.3.2 補出動詞的論元成分
我們在進行自動分析的時候很大程度是依靠動詞的論元的語義角色的辨別,所以對于不是按照正常排位的句法序列,要將動詞的論元調整和找回,以便于連動結構類型的識別,如:
(2)“家里的貓食快吃完了,你再去超市買點回來來喂貓。”媽媽對我說。
對于這個例句,我們不能按照常規的分析方式,而是要首先還原動詞的語義角色的配位方式。應該先把“貓食”抽取出來,作為“買”的受事和“喂貓”的材料。這樣就是通過論元共享而關聯起來的連動結構,我們可以判斷出這是表示目的關系的連動結構。否則,我們只能根據VP1是動結式短語“買回來”判斷這是一個表示異時關系的連動結構。
在完成對句法成分的補充處理以后,整個句子相對比較理想,各種成分也比較完整。在這個基礎上可以進行句法分析(parsing)和語義角色標注(semantic role annotation)。句法分析是指研究如何通過計算機算法得到自然語言句子的句法結構。完成句法分析任務的計算機程序或軟件叫做句法分析器(parser)。句法分析器的主要功能是判斷輸入的自然語言的句子是否是句法上合法的句子,如果是句法上正確的句子,則輸出它們的句法結構。如我們輸入一個句子 “王大栓去下窗板”(《茶館》),得到的句法分析的樹形圖如下:③此樹形圖見詹衛東先生開發“現代漢語句法樹庫”(TreeBank)。

連動結構句法分析圖
語義角色標注主要是通過標明在一個事件中扮演了不同參與者角色的有關語言成分,這種分析是基于動詞的。把這種語義角色與動詞的關系標明出來后會對句法分析和語義信息的處理提供很大的方便。

連動結構中語義角色標注圖
一種比較成熟的語義標注方法是加州大學 Gildea.D&Jurafsky.D(2002)提出的自動標注方法①參見 Gildea,D,Jurafsky,D,“Automatic Labeling of Semantic Roles”,Computational Linguistics,NO3,245-288,2002。。這種標注方法對于已經切分了成分的語料在辨別語義角色時候,可以達到82%的正確率。而對于需要同時進行片段切分和標注語義角色的語料,可以達到65%的正確率和62%的召回率。
在樹形圖上進行語義角色標注過的句子形式如下:②表示語義角色的符號請參看袁毓林(2006)。
我們在查找《子夜》連動結構的同時也注意了和連動結構的形似句(多動結構的謂語),發現一個句子中的謂語里多動結構有以下幾種類型。
2.4.1 與緊縮句的分解規則
根據向若(1984)的歸納,緊縮句共有四種類型:
主語相同的兩個謂語間有關聯詞語,如:
(3)主任答不上來就發了脾氣。
主語不同的兩個謂語間沒有停頓,如:
(4)你不問我替你問。
單句形式前有連詞
(5)就是世界上最快的馬也要落在背后。
前后呼應的緊縮復句
(6)我不問也明白八成。
結合向若的分析,從形式上看,緊縮句可以分為兩類,一類是有標記關聯的緊縮句,一類是沒有標記的關聯。其中前者要占絕大多數。根據陳穎(2005)統計,在選取的786個例句中,有標記關聯的636個,占81%,無標記關聯的150個,占19%。
對于有標記關聯的緊縮句,可以通過標記詞語和詞性標注,分解出來。對這些關聯標記,我們可以窮盡地歸納出來,關聯詞獨用的有“就、也、還、又、都、才”,成對使用的關聯詞有“一……就……、再……也……、不……也……、非……也……、不……不……、越……越……”等,③其中有些連詞是兼類詞,比如“一”,可以是數詞,在這里可以看作連詞,這些詞性分別可以通過詞性標注解決。對于這些有標記的緊縮句,可以利用這些標記將他們分辨出來。即兩個動詞性結構之間總有關聯成分連接。
對于沒有標記關聯的緊縮句,它們的一個特點是兩個動詞的主語不同,這類多動結構可以通過句法結構分析和語義角色分析結合的辦法從連動結構中分解出去。如“你不問我替你問”中,在句法分析上,兩個小句并列:“你不問”和“我替你問”。第一個小句主語是“你”,第二個小句的主語是“我”。在語義角色分析上,第一個問的施事是“你”,第二個“問”的施事是“我”。
2.4.2 與兼語句的分解規則
兼語句的第一個動詞后面必須要有一個名詞性成分(也就是身兼兩職的成分)。兼語句的另一個特點是它的第一個動詞在意義上有很明顯的特征,具有[+使成]、[+命令]、[+命名]等特征。 而且這些動詞是封閉的類,我們可以窮盡性列舉,形成一個“兼語動詞”詞表,①我們通過對《漢語動詞用法詞典》(商務印書館,1999)中1223個動詞(2117個義項)進行統計,得出一份可以作為兼語動詞的詞表,共163個。在實際語料中,能作兼語動詞的,可能不止我們列舉的這些動詞。但這份詞表是開放的,可以不斷添加新的詞語。如:“讓、叫、要、使、強迫、逼、催、督促、責成、縱容、惹、招、勸、吩咐、囑咐、告訴、指示、提拔、提升、分配、收、培養、派、打發、送、放、趕、分配”等。 這一點李臨定(1986)、邢欣(1995)有詳細論述。
我們可以通過句法結構與這種兼語動詞匹配的方式進行,即先掃描輸入的語料,如果掃描到“V1+NP+VP2”序列,再用V1與詞表匹配,如果是詞表中的詞語,基本就可以確定是兼語句。如下面兩個句子:(1)我/n買/v一本書/np看/v;(2)他/n逼/v我/n/看/v書/n。第一個句子可以掃描到“vnpv”這樣的序列串,然后再拿v1與詞表進行匹配,沒有發現“買”,可以斷定這不是一個兼語句,第二個句子可以先掃描出“vnpv”這樣的序列串,在匹配時候可以發現v1“逼”是詞表中收錄的一個動詞,可以判斷出這是一個兼語句。
2.4.3 與動狀句的分解規則
動詞作狀語一般可以分為兩類,一種是后面有“地”作為標記的,如:
(7)他同情地望著這個傷病員。
因為區別詞“地”的出現,這類動詞狀語句比較容易區別出來,掃描句子中的VP是否有“V地V”格式,如果有,則判定是動狀句。
難辦的是動詞直接作狀語的類型。在句法結構的線性序列上與部分連動結構相似,如:
(8)他先告辭/v走/v了(連動)
(9)從龍潭湖公園鳥市買回15對虎皮鸚鵡試/v養/v。 (動狀)
對這類結構的分解可以采用兩種規則,一是通過“詞表”匹配的辦法,根據孫德金(2000)在3036個動詞的統計中,有36個單音節動詞和78個雙音節動詞可以直接做狀語。高增霞(2006)通過對2002年5月19日的《北京青年報》統計,又得出19個雙音節動詞可以直接作狀語,我們在這些動詞的基礎上編制一份“詞表”,然后對V1與詞表進行匹配。
其次是“音節搭配規律”,根據孫德金(2000)的研究,動詞作狀語在音節搭配上,基本上遵循著“單音節+單音節”“雙音節+雙音節”的組配模式。我們可以利用這一音節的組配模式作為辨別的輔助手段,可以排除象“告辭走了”一類句子。
2.4.4 與動詞聯合結構的分解規則
兩個動詞組合在一起也可以形成聯合結構,如:
(10)工廠開發研制了一種新產品。
(11)我們加工整理了一遍。
聯合結構沒有什么標記,動詞的語義特征上也不明顯,分解出來比較困難,我們這里采用吳云芳(2004)對“V+V”識別聯合結構采取的方法。她先采用排除方法,縮小范圍:先討論什么情況下不能形成并列關系。這樣就排除了三分之二的“V+V”結構。然后再討論什么情況下可以形成并列關系。(具體參見吳云芳2004)
2.4.5 與謂賓結構的分解規則
朱德熙(1982)將謂賓動詞分為真謂賓動詞和準謂賓動詞,為了計算機識別的需要我們將謂賓動詞重新調整分為兩類:一類是動詞性結構作賓語(包括單個動詞、述賓結構、述補結構、連動結構、偏正結構),一類帶小句賓語,我們分別為它們建立詞表。
我們收集的動詞性結構賓語的謂賓動詞共有489個,這種動詞如果后接動詞性結構,只能是謂賓結構。V1如果是帶動詞性結構作賓語的動詞,在形如“V1V2”結構中,只能是動詞性結構作賓語,而不可能是連動結構。如果是“V1N/NPV2”的序列,則不可能是謂詞賓語句。這樣,我們就可以對照詞表和句法結構將該類謂賓結構將帶動詞性結構賓語的句子直接掃描出來。
帶了小句賓語的謂賓結構,一般會先掃描出“V1N(NP)V2”的字符串,其中的 N(NP)是賓語小句的主語。如果V1是可以帶小句賓語的動詞,在“V1N(NP)V2”序列中,若 N(NP)是 V2 的一個論元,則這個句子是動詞帶小句賓語,如“觀察熱帶魚甩子”;若N(NP)是V1的論元,則這個句子不是小句作賓語。
連動結構按照時間關系,可以分為同時、異時和泛時關系。若幾個動詞性詞組之間有先后關系,則稱為異時關系連動結構;若動詞性詞組表達的動作或狀態大致同時發生,則稱為同時關系連動結構。如果細分,先后關系連動結構還可以分為順承關系和目的關系連動結構。目的關系則可以分為位移、工具等下位類型的連動結構。分不出同時或先后關系的連動結構是泛時關系連動結構。
各種不同類型的連動結構有以下幾個特點:
其一,不同連動結構的動詞性詞組之間有一些不同的形式特征,如異時關系的體標記“了”,同時關系的持續體標記“著”、“在”等一些“特征詞/字”;異時關系連動結構中VP1中的結果補語等。
其二,連動結構各個動詞性詞組存在不少省略成分,如主語和論元。
其三,對于多于兩個動詞詞組的連動結構,存在先后組合的層次問題,如:
(12)姚太太拄著拐杖站起來迎接,問來客姓名。
“拄著拐杖”、“站起來”和“迎接”是三個動作,“拄著拐杖”和“站起來”先組合為一個同時關系連動結構,然后“拄著拐杖站起來”和“迎接”再組合,形成先后關系的連動結構。
泛時關系連動結構結構數量較少,就我們在《子夜》中的統計,泛時連動結構占了整個連動結構的13.5%。
我們在下文中主要討論對異時和同時連動結構的識別和分析。
從形式上看,各類連動結構大多有形式上的特征,可資我們利用的有時體標記、句法結構特征(如動結式)等。根據我們的研究,VP1在形式標記上比較明顯,而VP2的形式標記則不容易作出歸納,所以決定連動結構類型主要依靠VP1的形式特征,我們主要考察VP1的形式特征,而沒有過多關注VP2的形式特征。
VP1形式特征主要有以下一些:
3.2.1 “了”
(13)末后就開了房門出去。
連動結構中兩個動詞性結構之間出現 “了”的一律可以認為是在時間上表示異時關系。
3.2.2 動結式短語
動結式短語由兩部分組成,前一部分表示一個動作,后一部分表示因為前一個動作而產生的結果。我們這里所說的動結式是廣義的,也包括動趨式,如“爬起來、走回去”等。
通過檢索《現代漢語語法信息詞典》,我們可以知道哪些動詞可以帶結果補語,哪些形容詞、動詞可以作結果補語。可以作結果補語的單音節形容詞204個,單音節動詞112個。形容詞如“笨、昏、蒙、呆、乖、傻、好、壞”等,動詞如“懂、累、忘、通、怕、迷、煩”等。
動趨式結構可以通過趨向動詞來判斷,大家認定的趨向動詞基本包括下面24個,如“上、下、來、去、上來、下來”等。
3.2.3 動詞的短時體(簡單重疊形式)和瞬間完成體“一”
動詞的簡單重疊形式和動詞前的準瞬間完成體標記“一”在時間上都有一個終結點,當連動結構的VP1出現這些標記的時候,都是表明第一個動作發生以后才會發生第二個動作,如:
(14)宋教授看看苗情以后說。
(15)他一聽以后非常驚慌。
3.2.4 “著”
“著”作為一種靜態持續體的標記,表示伴隨著VP2發生的動作的同時發生了VP1的動作。雖然“V1著V2”的形式可以表示兩種類型的連動結構:既可以表示伴隨狀況的連動結構,也可以表示異時關系的連動結構。前者如“閉著眼睛說瞎話”,后者如“留著喂狗”等。至于兩者的區分可以再利用“語義角色”來加以區分,但“著”作為一個表示同時關系的連動結構的可能條件,不失為判斷表示同時關系連動結構的一個重要的形式特征。
3.2.5 動詞的復雜重疊
動詞的復雜重疊形式作為連動結構的第一個動詞性結構,表示動作連續不斷,可以作為VP2表示的動作的伴隨狀況,所以掃描到VP1是動詞的復雜重疊形式的連動結構即可以判斷這種連動結構表示同時關系。根據陳前瑞(2003)統計,這種復雜重疊從形式上看有以下幾種:“V1V1V2V2(蹦蹦跳跳)、V 來 V 去(走來走去)、V1了 V2,V2了 V1(打了談,談了打)、一 V 一 V(一拐一拐)、VV(V 為雙音節動詞,走動走動)、V了又V(說了又說)”。
此外,限定性定語、名/動量補語等也可以作為判斷連動結構時間類型的形式上的判斷標準。
語義關系也可以對結構類型的辨別起到一定的作用。
3.3.1 通過語義角色來分解目的關系連動結構的下位類型
在表示時間先后關系的連動結構中,如果兩個動詞之間有共享的論元,則基本上可以判定是表示目的的連動結構。分析共享論元分別是V1和V2的什么語義角色,可以幫助我們判斷出目的關系連動結構的下位類型。
3.3.2 通過語義角色可以分解不同類型的連動結構
“V1著V2”可以表示兩種不同類型的連動結構,目的關系和伴隨狀況。如:“留著那些飯喂狗”與 “閉著眼睛休息”。它們在句法形式上完全相同,沒有辦法通過形式特征來識別。但這兩者在語義角色上有很多的不同,表示目的關系的“V1著V2”存在著共享的論元,“飯”是“留”的受事,同時又是“喂”的耗費材料。而表示伴隨狀況的“V1著 V2”則不存在論元共享,“眼睛”是“閉”的受事,與“休息”之間沒有直接的語義聯系。
根據上面的分析,我們建立的連動結構的分析模型,總共分為六個大的模塊,各自負責一些功能,可以如下圖所示:


連動結構分析模型圖
連動結構的算法可以用下面的自然語言描述出來:
Step1:進行篇章掃描,掃描出具有分句作用的標點符號,然后作出切分,另起一行輸入,得到各個小句;
Step2:進行小句掃描,對小句中的詞語進行自動切分和詞性標注。
Step3:對已經詞法處理過的句子進行短語層面的處理,即界定出短語并對短語的性質進行判斷。
Step4:先對小句進行句法成分還原處理,找回缺省和省略的成分,盡量保持一個完整的理想的句法結構;然后進行句法結構分析,切分出句子的主語和謂語;以連動結構中的動詞為核心,作出語義角色的標注。
Step5:對作過切分和詞性標注的句子進行句法結構分析。
Step6:對句子的謂語再次進行掃描,如果有多于兩個動詞的,則作為備查對象,另外儲存起來。
Step7:調用形似句的分解規則,排除出是以緊縮結構、兼語結構、動詞性并列結構、動詞作狀語、以及謂賓結構作謂語的句子,保留剩下來的句子,即連動結構作謂語的句子。
Step8:對連動結構進行順向和逆向多次掃描,結合能掃描出的形式特征,查詢特征規則庫,得出這種類型時間關系,如果沒有形式上的特征,結合語義角色關系進行判斷;對于已經判斷出時間類型的連動結構,再利用語義角色上一些特征,判斷該種時間類型連動結構的下位語義關系。
Step9:如果n=2,則分析到Step7已經完成了整個分析過程;如果n>2,則首先順次掃描前動詞性結構,根據先同時,后異時;異時關系連動結構按照句法出現先后順序兩兩組合;同時關系連動結構按照伴隨狀況的動詞性結構和前景化動詞性結構分別組合;完成連動結構的最后分析。
最后,根據分析的結構,畫出連動結構的關系類型圖。
我們根據上面的算法,給出兩個例子的分析過程(一個三個動詞詞組的同類組合,一個四個動詞詞組的異類組合)。
我們分析的例句是“我十分高興,爬起來到客廳接電話。”這是《王朔文集》中的一個句子,分析結果如下:
Step1分析結果:將句子“我十分高興”和“爬起來到客廳接電話”都分離出來,作為一個單獨的小句。
Step2分析結果:將句子中的詞語自動切分出來并進行了詞性標注。得到結果如下:
我/r十分/d高興/a,
爬/v起來/v到/v客廳/n接/v電話/n。
Step3分析結果:對詞語串進行短語層面的組合,上面兩個句子則被標記如下:
我/r十分高興/ap,
爬起來/vp到客廳/vp接電話/vp。
Step4分析結果:通過句法還原處理,上面一個分句沒有改變,下面一個小句則把主語“我”給還原回來了。變成了:
(我/r) 爬起來/vp 到客廳/vp 接電話/vp。
Step5分析結果:對小句進行句法結構分析,得出:
我/r||十分高興/ap
(我/r)||爬起來/vp 到客廳/vp 接電話/vp。
Step6分析結果:對小句謂語部分掃描,因為第一個小句的謂語只有一個形容詞短語,所以可以排除;對下一個小句的謂語進行掃描,里面包含了三個動詞性結構,作為備查對象保存起來。
Step7分析結果:將 “爬起來/vp 到客廳/vp接電話/vp”分成兩個結構體“爬起來/vp 到客廳/vp”和“到客廳/vp 接電話/vp”與連動結構形似句進行比照,不能將其歸入其中任何一類,如兩個結構體都沒有緊縮句的標記,所以不屬于緊縮句;“爬”和“到”都不是兼語結構第一個動詞的特征,所以排除了兼語結構的可能;“爬”和“到”均不是可作狀語動詞,且兩個詞后面都有后續成分,所以不是動詞狀語結構,同時也可以排除并列結構和謂賓句的可能。所以可以判斷出這是一個由三個動詞性結構組成的連動結構。
Step8分析結果:以動詞為中心進行語義標注可以形成下面的形式:
[爬/v1起來/v]vp [到v2客廳/nGO2L3]vp[接v3電話/RE]vp
Step9分析結果:因為n>3,所以依次相臨兩個動詞性結構組合一次,“[爬/v1起來/v]vp[到v2客廳/nGO2L3]vp”和“[到 v2 客廳/nGO2L3]vp[接v3電話/RE]vp”根據形式特征和語義特征,可以判斷出前兩個動詞性結構之間的關系是時間先后關系,因為“爬起來”是一個動結式短語;后兩個動詞性結構之間也是時間先后的連動結構,而且兩者之間有目的關系,兩者共享一個論元“客廳”。這類聯合結構屬于同類組合,所以依次組合,可以得出這樣的關系類型圖:

連動結構屬于復雜的句法形式,涉及到一個結構體中含有多個動詞,在句法形式上也有很多的形似句,因而對于自動識別來說是個難題,我們提供的方案只是一種基于“規則識別”的思路,是通過對連動結構在漢語本體的分析研究基礎上,建立了一系列的規則,如與相似句的分解規則、利用形式特征和語義角色來進行類型識別的規則等。當然,我們的規則不可能解決全部的問題,很多環節的處理還不能達到理想的效果,如對語義角色的標注問題。一個環節的問題沒解決,就會帶來后面一系列問題的處理。但這是一種解決問題思路,具體的每個模塊的操作都是可以逐步完善的。
[1]陳穎.緊縮句的有標關聯和無標關聯[D].武漢:華中科技大學,2005.
[2]高增霞.現代漢語連動式的語法化視角[M].北京:中國檔案出版社,2006.
[3]李劍鋒,等.基于最大熵模型的韻律短語邊界預測[J].中文信息學報,2004,(5).
[4]李臨定.現代漢語句型[M].北京:商務印書館,1986.
[5]孫德金.現代漢語動詞做狀語考察[J].語言教學與研究,1997,(3).
[6]吳云芳.V+V 形成的并列結構[J].語言研究,2004,(3).
[7]奚晨海,孫茂松.基于神經元網絡的漢語短語邊界識別[J].中文信息學報,2002,(2).
[8]向若.緊縮句[M].上海:上海教育出版社,1984.
[9]邢欣.致使動詞的配價[A].沈陽,鄭定歐編.現代漢語配價語法研究[C].北京:北京大學出版社,1996.
[10]荀恩東,等.應用二叉樹剪枝識別韻律短語邊界[J].中文信息學報,2006,(3).
[11]郁梅,等.基于規則的漢語短語邊界劃分的研究[J].蘇州大學學報(自然科學版),1994,(3).
[12]俞士汶.計算語言學概論[M].北京:商務印書館,2004.
[13]俞士汶.現代漢語語法信息詞典[M].北京:清華大學出版社,1998.
[14]袁毓林,等.編制語義角色框架文檔的規范(未發表).2006.
[15]詹衛東.面向中文信息處理的現代漢語短語結構規則研究[M].北京:清華大學出版社,1999.
[17]張國煊,等.基于互信息的漢語短語邊界劃分[J].杭州電子工業學院學報,1995,(1).
[18]張衛國.ICON語言教程[M].北京:清華大學出版社,2003.
[19]Gildea,D,Jurafsky,D.Automatic Labeling of Semantic Roles[J].Computational Linguistics,2002,(3).