摘要: 范疇語法通過確立句子中詞語對應的范疇及應用一定的演算規則可以判定一定語言中句子的“合法性”。它在對句子的生成的解釋上具有一定的解釋力,在計算機語言處理上也有很大的應用前景。作為一種純形式語法,在實際應用中,特別是在漢語中,范疇語法還存在著一系列問題。如何促進形式跟語義的結合,應該是其發展中亟待解決的問題。
關鍵詞:范疇語法 語法范疇 計算語言學 形式 語義
一、“范疇語法”的簡要介紹
范疇語法是一種用數學方法構造的、描寫自然語言的句法理論,它是從生成的角度來對句子的形成進行的一種“數學運算”,可以說,范疇語法也是生成語法的一種。1953年,著名數理邏輯專家巴爾·希列爾(Y.Bar-Hillel)在《句法描寫的準算術記法》一文中,用數學中演算的方法對句法類型進行了描寫。1958年,數學家蘭姆貝克(J.Lambek)在《句子結構的數學》中,提出了句法類型演算的理論。接著,巴爾·希列爾進一步發展了句法類型演算的理論,并且對自然語言結構的生成制定了一系列判定程序。句法類型是從語法方面對句子結構所作的一種歸類,是一種語法范疇,1960年巴爾·希列爾等在《論范疇語法和短語結構語法》中,把這種理論稱為范疇語法(categorial grammar)[1]。這樣,范疇語法逐漸成為一種成熟的句法理論,人們將這種語法理論應用到對自然語言的句法研究上,可以判定某個符號串在某種語言中對語言的計算處理產生的影響。作為一種新興的句法理論,范疇語法對語言的句法分析也產生了較大影響。
范疇語法是通過建立句子中詞語相對應的“句法類型”或“范疇”,來實現對整個句法結構的“演算”或“推演”的。范疇語法中的兩個基本范疇是S和N,S相當于句子,N相當于名詞,句子中的句法成分都可以根據它的句法功能用S和N(再加上范疇構造符“/”“\\”和左右括號“(”“)”,“/”“\\”分別表示“左缺”“右缺”)以不同的方式組合起來表示自身的“句法類型”或“范疇”,規則是:
①如果有某個詞B,其后面的詞C的句法類型是γ,而它們所構成的詞的序列BC的功能與β相同,則這個詞B的句法類型記為β/γ;
②如果有某個詞B,其前面的詞A的句法類型為α,而它們所構成的詞的序列AB的功能與β相同,則這個詞B的句法類型記為α\\β;
③如果有某個詞B,其前面的詞A的句法類型為α,其后面的詞的句法類型為γ,而它們所構成的詞的序列ABC的功能與β相同,則這個詞β的句法類型為α\\β/γ。例如在漢語中:“蘋果”的句法類型為N,“青蘋果”中的“青”,它后面為名詞“蘋果”,而“青蘋果”的功能與名詞相同,故“青”的句法類型為N/N;“蘋果熟了”中的“熟”,它前面為名詞“蘋果”,而“蘋果爛了”的功能與句子相同,故其句法類型為N\\S;“他吃蘋果”中的“吃”,它前面為名詞“他”,后面為名詞“蘋果”,而“他吃蘋果”的功能與句子相同,故其句法類型為N\\S\\N;“他吃飽了”中的“飽”,它前面的“吃”的范疇為N\\S,而“吃飽了”的功能與“吃”相同,故其句法類型為(N\\S)\\N\\S等等。 但是,范疇的標注類型與詞類之間并非是一一對應的關系,它主要是針對成分的功能的(這里的功能主要是語法功能),因此,同一個詞在不同的句法位置上可以有不同的范疇標注,如,“吃”在“我吃”中屬于N\\S,而在“我吃蘋果”中屬于N\\S\\N。
根據這種范疇標記的方法,語言中詞語的“句法類型”,即“范疇”都可以描寫出來,這樣,符號串之間的關系就可以用一系列的范疇表示出來,句子成分的組配相當于詞語對應范疇之間所進行的一系列數學演算,演算規則是“如果有形如a、a\\β\\r、r的符號序列,那么就用β來替換它,同時,它包含兩個規則:①如果有形如a、 a\\β的符號序列,那么就用β來替換它;②如果有形如β\\r、r的符號序列,那么就用β來替換它。”[1]根據范疇標注及運算規則可以對語言中的任何符號串進行判定,我們可以根據運算最后所得到的結果是否是“S”來判定句子的語法是否“合格”,即是否能夠成句。如果經過有窮的運算步驟,運算結果最后為S,那么這個符號串便是合格的句子。如:

首先對該句中的每個詞進行范疇標注,根據范疇標注進行演算,最后結果為S,說明“她是一個漂亮女孩兒”是“合法”的句子。
當然,這種演算在對自然語言的處理過程中會遇到很多問題,有些句子的處理絕非這么簡單,因為語言中的句子既是合規則的又是不合規則的。很多時候,現實語言中的句子并不都是中規中距的,這就給這種理想化了的語言處理方法帶來非常大的障礙,在漢語這種缺少形態標志的語言中運用時就會碰到更多的問題。
二、范疇語法的應用及對我們的啟示
范疇語法作為一種生成語法,早在1975年,馮志偉先生就在《計算機應用與應用數學》雜志上介紹過,但當時并未引起學界的重視,直到近年來才在語言的計算處理方面被廣泛關注。
“生成語法的一個特點是把語言看作數學客體,跟數學一樣,它由一組公理和一組推導規則組成,也跟數學中用公理和推導規則證明一個數學定理是否為真一樣,生成語法用公理和推導規則證明一個句子是否符合語法,因此生成語法是一種證明的理論。”[2]Chomsky并不是生成語法的唯一代表,范疇語法作為生成語法中的一種句法理論,它的光輝幾乎被Chomsky的轉換生成語法的光芒所遮蓋,因此在產生后很長一段時間以來,并未產生如轉換生成語法那么大的影響,直到后來人們在機器處理方面才發現了它巨大的應用價值。
范疇語法把語言的構成看作是一系列詞語的范疇標記的演算過程,通過這種演算我們可以判斷一定的句子在一定的語言中是否“合法”。范疇語法對句子生成的描述可以說是通過詞語之間的互相依存關系一步一步建立起來的,這種互相依存的關系往往是一種線性的排列關系,因此,可以說它的操作前提是語言本身是一個線性的有序的規則的系統。對于語言的生成范疇語法是從微觀的一個個具體的詞出發來建立一個跟這個詞有關的合法的鏈條,如果這個鏈條是按照這個詞所應該后加或前加的范疇來建立的話,那么它就是一個合法的鏈條。而Chomsky的轉換生成語法則基本上是從句子格局的宏觀著眼,通過建立一系列的規則,通過層層轉換來生成一個具體的句子,語言是從一個底層的深層裝置(語義層面)通過一系列的轉換規則層層轉換為表層裝置(語音平面)輸出來的。可以說轉換生成語法在對句子的生成的描寫上還注意到了句子的層次性,而范疇語法則較多注意了語言的線性排列。因此,我們說,范疇語法是近年來語言學中詞匯主義的典型代表。
范疇語法在對句子本身生成的闡釋上也有問。范疇語法的實際操作是在一個符號串(而不管它到底是否合法)存在的前提下進行的,對詞語范疇的標記必然涉及到其在符號串中所對應的語法功能,這樣,就有了一個先入為主的理念在前面。
“范疇語法”和“語法范疇”是兩個完全不同的概念,但是我們覺得應該在兩者之間尋找一種對應關系。在范疇語法中我們過分強調句法的形式特征,而對那些僅僅由語義關系而結合在一起的結構或變式句、移位句難以描述和解釋清楚。這就要求我們從語義上去尋求解釋的可能性,語義上的尋求必須要建立一定的范疇,即“語義范疇”,即把具有相同或相似的語義功能的詞歸為一類,在兩者之間找到一種聯系。現在所出現的詞語的語義網絡文法可以說是尋求詞語之間語義聯系的很好代表,我們可以通過這種語義上的網絡進行選擇,然后,再根據范疇語法里的范疇標記進行數學的演算。這樣,就會克服很大一部分范疇語法里的缺點。或者還可以嘗試將范疇語法與配價語法(這時應該主要是潛在的語義上的配價)中對語義關系的研究成果結合起來。
三、范疇語法存在的主要問題及發展前景
范疇語法的提出,它的前提假設是語言的一種理想狀態。因為如果我們要從詞匯的句法類型中推導出各個上級結構成分的類型,那就必須認為語言中所有的結構都是由詞匯負載的。事實上,并非如此,語言中還經常存在一些其他結構,如:漢語中的主謂謂語結構、連謂結構以及復句中小句之間的結構,很難說是詞匯結構。而有些語義結構僅僅用詞匯的結構是難以描述完備的,特別是在實際的語言運用中,變式句和移位句是經常存在的,這些句子的實際內部結構肯定不能簡單的按照詞匯結構的標準去認定。
范疇語法只有詞庫而沒有規則,它主要是通過詞庫中詞語的范疇標記的運算來生成句子的。如果要按照運算規則實現句法類型的演算,那么它就必須假設語言中所有成分的結合必定是鄰接成分的結合,而不能有超越鄰接成分的超距離結合。事實上這也是不可能的,像剛才我們所提到的變式句和移位句,它們的內部結構都是超距離的,并不是線性的。再如,語句中有些成分的語義指向并不是簡單的前指或后指,它可以跨越語言的層次和別的成分發生語義上的關系等等。特別是在漢語中,句子語言成分之間的意合性非常強,因此對某些句子的存在就更加難以預料和解釋清楚。
因此,這些理想的假設,就使范疇語法在語言學的句法分析和機器計算上產生了一系列問題:在確定句法成分的范疇標記時,它和詞類不是一一對應的,我們必須在一定的符號串中才能確定。而有時候確定起來就相當困難,尤其是遇到虛字詞時,困難就更加明顯。漢語的詞語缺少形態標記,很多詞的詞性本身就很難確定,漢語詞語的兼類現象又大量存在(指絕對數量),這都給范疇標記的確定帶來一定的困難;當我們遇到那些超距離成分時,符號串的演算就很難或無法進行,如變式句和移位句的演算,以及遇到那些超常搭配的句子,如:一定語境下,不及物動詞帶上賓語的句子;動詞或形容詞做主語或謂語的句子等。范疇語法中存在的兩個基本范疇S和N有時候無法承擔表達復雜類型之間的演算關系的任務,特別是在漢語這種“意合性”極強的語言中,其對句法完備性的要求是很低的,很多時候句子都可以省掉一些成分或隱含一些成分而不影響句子本身的合法性和理解,如漢語中的主語承前省略或謂詞隱含等,用范疇語法描述的時候所遇到的困難就會有很多。應用范疇語法來建立漢語語義范疇的演算系統,還有很多問題需要探索,還有很長的路要走,需要大家的共同努力。
范疇語法所存在的問題主要是由于它本身過分注重形式而較少關注句子成分之間的語義關系而造成的,因此,我們應該探求把句法范疇和語義范疇結合起來,以便在句法描述和語義描述之間找到一種對應關系。只能用此方法我們才能不停留在理想的層面,而是更加現實、更加詳細完備地描述復雜的規則而又非規則的自然語言。
范疇語法作為一種句法理論,它在句子生成領域所作的探討具有先導性。雖然還存在著種種不足,但是其成果在句法分析和語言的計算處理上還是顯示出了它的實際可操作性,特別是在計算機處理領域,越來越多的人認識到了范疇語法的重要性。它已經成為當代計算語言學的理論基石之一,具有很好發展空間和前景。范疇語法存在的問題,需要我們在以后的研究中,逐步建立各種規則去限定它的具體演算過程或(如前面所說)探討同語義網絡文法和配價語法的結合的可能性。這都需要我們大家的共同努力。
參考文獻:
[1]馮志偉.范疇語法, 語言文字應用[J], 2001,(3).
[2]方立.范疇語法, 外國語言文學[J], 2003,(3).
[3]劉穎.計算語言學[M], 北京:清華大學出版社, 2002.
[4]馮志偉.計算語言學基礎[M], 北京:商務印書館, 2001.
[5]侯敏.計算語言學與漢語自動分析[M], 北京:北京廣播學院出版社,1999.
(孫紅舉,西南大學文學院)