“自己”的語用解釋的約束條件系統

2012-12-04 09:28:18楊春雷

當代外語研究 2012年11期

楊春雷

(上海外國語大學，上海，200083)

1.介紹

1.1 “自己”的語用解釋

篇章中，聽話者對指示語的所指有不同的認知狀態。說話者對這種認知狀態的假設被稱為“可辨性”(identifiability)(Chen 2004)。如果說話者認為聽話者能通過語境中涉及的其他事物辨認出所指的特定事物，這個所指是可辨的；反之，則不可辨。例如，“自己”在例1中不可辨，而在例2中可辨。

(1) 事實上很少有人會對自己所不知道的事大加議論……

(2) 我知道能讓蒙田深感愉快的證詞遠遠不止這些。這些證人的錯誤并不是信口開河，并不是不負責任地說一些自己不太了解的事物。

(余華《什么是一個作家的看法》)

我們認為，無論說話者認為所指的指代內容對聽話者而言是特定的事物(particular entity)還是泛指一類事物，對說話者而言都是可辨的。只有無法辨認所指內容，或者有歧義的時候，才不可辨。是否可辨，其實就是分辨出確切的語用解釋。“自己”的語用解釋包括“特指”(specific)和“泛指”(generic)。如果“自己”是可辨的，即它指向一個語境中特定的事物，它的語用解釋的值標記為“特指”；相反如果它指向一類事物而非任何個體，則標記為“泛指”。本文的主要目的是要發現不同層次上有哪些因素影響語篇中“自己”的語用解釋。

1.2 約束條件系統

約束條件系統(expert system，簡稱ES)在自然語言處理、自動化、人工智能領域更多地譯為“專家系統”。這種研究方法最早始于20世紀六十年代，指用戶通過回答系統給出的提問，準確描述某個待解決問題的特征，然后系統參考專家經驗給出結論。

約束條件系統是通過建立在數據庫基礎上的規則系統描寫語言規律，理解語義并生成新的語句。它由作為經驗基礎的數據庫和在此基礎上的規則系統兩個主要部分組成。數據庫的作用像一個專家，可以在此基礎上得出專家經驗以解決問題。

約束條件系統的工作原理如圖1所示，假設用一個較大的橢圓來表示一個未知的語言形式的解釋，用一個較小的橢圓表示能決定該解釋的約束條件，如果這個約束條件具有一定的普遍性，那么這個較小的橢圓的大部分或全部面積應該與大橢圓重合。當然，單單一個約束條件很難做出準確預測，但是隨著有效約束條件的增加，已知范圍也就越來越大。換言之，發現的有效約束條件越多，對解釋的預測越為科學和精確。

圖1 決定語用解釋的多個約束條件

將約束條件系統應用到語言研究中的代表是Weiss和Kulikowski(1991)、Kuno等(1999，2001)。已有學者采用約束條件系統研究漢語語言現象，如楊春雷(2004，2011)建立了漢語量化詞轄域的約束條件系統，證明能夠有效預測量化句的語用解釋。

2.關于約束條件的說明

根據前期研究和相關文獻，我們暫時提出兩類約束條件進行考察，一類是比較成熟的合格約束條件，另外一類是潛在約束條件。分別說明如下：

2.1 合格約束條件

1) “自己”和先行詞的形式類別:在數據庫中，標記了兩類“自己”的形式類別，即“復合”(compound)“自己”(如我們自己,他自己等)和“光稈”(bare)“自己”。“自己”的先行詞的形式類別包括專有名詞、人稱代詞、有/無生命代詞、復合反身代詞、反身代詞、指示詞、其他和未知先行詞。

2) “自己”和先行詞的性別。

3) “自己”和先行詞的句法位置：數據庫中標記了5個主要句法位置，包括主語、賓語、旁語、屬格形式和具有潛在影響的其他位置(如副詞狀語位置)。

4) 文體類別：文體也影響語篇中“自己”的語用解釋。Bruner(1986:11-12)區分了兩種思維方式，一種是“邏輯—科學式”(logico-scientific)，另外一種是“敘述式”(narrative)。兩種方式的特點不同，前者是“理論驅動的、分類的、概括的、脫離語境的”；后者是“以意義為中心的、試驗性的、特殊性的、具體的和對語境敏感的”。人工智能領域中已經有通過計算機研究文體的自動識別。如Karlgren(2004)進行了一項基于數據的分析實驗，通過對人稱代詞、指示詞、言談動詞(verbs of utterance)、“私”動詞(“private” verbs)和每個單詞的詞長等特征的考察，研究不同文本文體的自動識別，如廣告、特寫、悼詞、評論和書籍等。本研究的數據庫暫只包括議論和敘述文體。

2.2 潛在約束條件

一些約束條件雖然現階段由于不同的原因，暫時不能成為有效約束條件，但在未來的研究中可以深入考察并取得突破，如：

1) 語義計算在決定“自己”的語用解釋的作用。使用Liu和Li(2002)設計的基于知識詞典HowNet的詞匯語義相似度計算軟件，計算“自己”和潛在的先行詞間的詞匯和語義相似度，確定它的先行詞，如例3是一個語篇中通過詞匯相似度計算幫助確定“自己”的先行詞的例子：

(3) 他并且探出來做這種買賣的同行很多，例如東方大學、東美合眾國大學、聯合大學(Intercollegiate University)、真理大學等等，便宜的可以十塊美金出買碩士文憑，神玄大學(College of Divine Metaphysics)廉價一起奉送三種博士文憑；這都是堂堂立案注冊的學校，自己萬萬比不上。(錢鐘書《圍城》)

表1 “自己”和潛在先行詞間的詞匯相似度①

表1顯示“他”與“自己”的相似度相對最高，最有可能是“自己”的先行詞，這也符合我們的語感。此外，相似度計算在尋找連鎖(chained)“自己”的先行詞的時候特別有效。如：

(4) 自己沒有文憑，好像精神上赤條條的，沒有包裹。可是現在要弄個學位。無論自己去讀或雇槍手代做論文，時間經濟都不夠。(錢鐘書《圍城》)

(5) 人們需要一個虛構的世界來擴展自己的現實，雖然這樣的世界是建立在別人的經歷和情感之上，然而對照和共鳴會使自己感同身受。(余華《網絡和文學》)

很明顯，兩個相鄰“自己”的相似度為1，因此第一個“自己”是第二個“自己”的具有同指內容的第一選擇。數據表明，在我們的數據庫中，所有的連鎖“自己”的例子都屬于此類。但是考慮到現有的知識詞典對“自己”的描述仍舊需要完善②，還不能過重倚賴語義計算決定先行詞，并進一步搜集所需信息。

2) “自己”和先行詞距離。“自己”和先行詞距離可以根據標點、字的數量、詞的數量、句法結構(如：動詞+賓語)、功能詞(如：連接詞)、間隔小句數和段落數標記計算。這個約束條件的影響力還要通過進一步的數據分析并結合其他條件才能確定其有效性。

3) Xu(1994)提出了論旨角色的可及性層階，如下所示：

施動>體驗者>主題>受動

他認為，一個名詞詞組只有滿足了下列兩個條件中的至少一個才可能成為“自己”的先行詞：(1)在層階上更靠左；(2)除了其他的語義和語用條件，它應當是句法結構中的主語。他并未指出如果指代路徑被阻，如何確定“自己”的先行詞。他建議采用綜合的研究方法，納入語義、篇章和句法因素解決“自己”的指示問題。由于現階段還未發現較為有效的能夠自動識別這些論旨角色的方法，該層階還不能列為合格的約束條件。

3.數據庫建設

數據庫建設參考了許余龍(2005)中提出的語篇中前指解釋數據庫建設的一些基本原則、方法、程序和部分特征，也包括了一些新的特征，如語義計算、標點符號標志距離等③。

數據庫中的語料來源和“自己”的分布如表2所示，其中篇章代碼欄中N代表敘述文本，A則代表議論文本。

目前學者對市場間聯動性的研究成果豐富，但多以靜態相依性描述為主，本文基于GJR-GARCHDCC模型對“深港通”前后深港股市之間的聯動性進行動態互動分析，文章可能的貢獻有：第一，以“深港通”為切入點，首次系統性分析了“深港通”機制的運行對深圳股市與香港股市的聯動效應影響；第二，為了刻畫兩地股市的時變特征，本文運用DCC模型來描述市場聯動效應的動態變化，測算了深市與港市的動態風險溢出效應。研究發現“深港通”開通之后，兩地聯動效應經過一定的過渡期才得到顯著加強，風險溢出方向主要還是由深市向港市溢出，為金融市場跨地區的協作提供動態監管方向，也為中國股市的健康發展提供可靠的實證依據。

表2 數據庫中“自己”的來源與分布

4.討論和發現

4.1 相互關聯的約束條件

分析數據表明在一些約束條件之間存在明顯的相互影響的關系。

1) 距離和文體的相互關系：以“自己”和先行詞之間的小句和句子數目為例，見表3：

表3 距離和文體的相互關系

“自己”和先行詞的距離在兩種不同文體中存在一致的明顯差異。在敘述文中，“自己”可在更大的范圍內自由選擇先行詞，而議論文中的“自己”則相對受限。

2) “自己”和先行詞的句法位置間的關系：Keenan和Comrie (1977)提出了名詞短語的可及性層階(The Noun Phrase Accessibility Hierarchy,簡稱NPA)，后來又在Keenan和Comrie(1979)中通過大量的多語種的例證研究了這些語言中關系從句的構成策略。該層階如圖2所示：

主語>直接賓語>間接賓語>

旁語>屬格形式>比較結構賓語④

圖2名詞短語可及性層階

研究表明名詞短語的句法位置在決定指代性(referentiality)方面作用顯著，可及性在指稱研究和約束體系中具有同樣重要的作用，“自己”和潛在的先行詞的句法位置影響先行詞選擇，因此在我們的約束條件系統中也將包括這方面的特征。表4包含“自己”和先行詞的句法位置對應關系的相關數據。

表4 “自己”和它的先行詞的句法位置間的關系

表4表明主語位置的“自己”和主語位置的先行詞具有最高的吻合度(85%)；旁語位置的吻合度最低(10%)。

這些明顯相互影響的約束條件雖然不能直接用來預測“自己”的語用解釋，但可以幫助我們把較抽象、寬泛的約束條件(如文體、先行詞等)分解成操作性更強，更精確的約束條件，從而更加準確的預測語用解釋。

4.2 點數配置與點數和的計算

4.2.1 點數配置

只有當一個約束條件的某個值對“自己”的語用解釋產生顯著的直接影響時，才會根據該值對特定的語用解釋的預測效率賦予其點數。現階段，我們規定如果含有值A的70%以上的例子屬于某一特定的語用解釋，那么該值即成為能夠預測這種語用解釋的合格的約束條件。如果值A對于“自己”的特指解釋有顯著影響，它將被賦予一個正值點數，賦值的計算公式為：

相反，如果值A對泛指解釋具有顯著影響，它的點數要被轉為負值。計算公式如下：

但是，即使70%以上的含有值A的例子與某種語用解釋重疊，如果缺乏足夠的語料支持，暫時也不會被賦予點數。

下面我們將根據表5的數據分別考察發現的約束條件并為其賦值。

表5 約束條件及其值概覽

1) 復合“自己”傾向于具有特指解釋，它對特指解釋的影響點數為：點數特指=91/134=0.70。

2) 兩種文體對“自己”的語用解釋的影響很大。所有的泛指解釋都出現在議論文中，而80%的特指解釋的例子出現在敘述文中。“自己”的語用解釋在兩種文體的比例也符合Bruner(1986)總結的兩種文體的特征。分別給兩種文體賦值，該約束條件的絕對值將達到1.8，出于對單一約束條件量權過重的顧慮，現階段我們暫只給議論文中“自己”對泛指解釋的影響加-1。

3) “自己”和先行詞的主語位置的特指解釋的比例相當高，大約是該位置的泛指解釋的3倍。而其他位置上的語用解釋并無太大區別。主語位置的“自己”對特指解釋影響的點數為：點數特指=60/81=0.74。主語位置的先行詞對特指解釋影響的點數為：點數特指=100/138=0.72。

4) 雖然先行詞的性別的值之間不存在顯著差別，但泛指解釋中的未知性別的比例特別高。總的來說，數據表明先行詞的確定的性別不影響“自己”的語用解釋，但如果先行詞的性別未知，“自己”傾向于具有泛指解釋。先行詞的未知性別對泛指解釋影響的點數為：點數泛指=52/67=-0.78。

5) 先行詞為復數形式的“自己”傾向于泛指解釋，而單數形式則傾向于特指解釋。先行詞的單數形式影響特指解釋的點數為：點數特指=103/113=0.91；復數形式影響泛指解釋的點數為：點數泛指=-41/51=-0.80。

6) 先行詞如果是專有名詞短語，“自己”則必然是特指解釋。盡管在其他的類別中，如先行詞是名詞短語、有生命短語和反身代詞時，也發現了一些顯著影響，但是綜合考慮語料支持強度和影響的大小，在現階段，只有當先行詞是專有名詞時，“自己”的特指解釋才會被加上1個點數。

綜上所述，我們所討論過的合格的約束條件被賦予的點數如表6所示：

表6 “自己”的約束條件的點數

4.2.2 點數和計算

賦予每個約束條件點數后，將每個“自己”符合條件的約束條件對應的點數相加得到點數和。每個“自己”的點數和決定了它在篇章中的語用解釋。表(7-8)表明了具有特指和泛指解釋的“自己”的點數和分布情況。

表7 “自己”的泛指解釋的點數和分布圖

表8 “自己”的特指解釋的點數和分布圖

為了確定能夠準確預測“自己”的語用解釋的標準，表9包括了應用不同的待選標準后得到的預測效率。

表9 應用不同標準對“自己”的語用解釋的預測效率

表9顯示如果以點數和0.5作為預測標準，會得到最佳的預測效率91%。點數和高于0.5的“自己”具有特指解釋，低于這個標準的具有泛指解釋。

5.反例分析及深入研究的方向

通過對反例分析，我們發現“自己”的先行詞的人稱也對它的語用解釋有重要影響。例如，相對其他人稱，漢語中的第一人稱單數“我”一般不用于泛指解釋。例6是具有特指解釋的反例，兩句中的“自己”都有-0.15的點數和(計算公式為：點數和=(0.91+0.72)-1-0.78=-0.15)。

(6) 至于如何對待音樂明確的特性，我告訴自己應該相信門德爾松的話。(余華《字與音》)

根據前文得出的0.5預測標準，“自己”應當具有泛指解釋，然而根據語感，它指作者本人，為特指解釋。為了證明第一人稱單數是否能夠決定“自己”的特指解釋，還需要在未來更大規模的語料庫中，在不同的人稱代詞的影響力區分中尋求證明。

基于本研究，今后可以在以下方面做深入研究：首先，進一步擴大語料庫規模。真實語料的增加和豐富將增加系統的準確性和說服力。第二，主要因為現有的計算條件還無法有效的甄別并計算一些潛在的約束條件，如語義角色和語義距離，它們未被作為合格的約束條件計算點數，但相信經過進一步的語料的檢驗和技術的進步，這些條件在今后的研究中將會發揮更重要的作用。第三，如果點數配置能夠根據真實語料的統計數據，經過條件間的相對調整，通過計算機程序找到最佳預測力的點數分配方案，預測的結果會更加精確。最后，此類研究方法可以應用于其他指示語的語用解釋研究。語料庫中指示語和其他短語亦可實現銜接，這有利于提高語篇的計算處理的準確性。

附注:

① “自己”在HowNet中只有兩個概念(concept)：

ADJ {aValue|屬性值，kind|類型}

PRON {self|己}

因此，詞匯相似度計算器的參數被重新調整為β1 =0.60,β2=0.40,β3 & β4=0。根據驗證，這也產生了更佳的解釋力。

② 參見黃居仁(2003：6-21)的相關評論。

③ 數據庫結構信息，如有需要請與作者聯系。

④ >表示前者比后者的可及性更高。

Bruner, J.1986.ActualMinds,PossibleWorlds[M].Cambridge, MA: Harvard University Press.

Chen, P.2004.Identifiability and definiteness in Chinese [J].Linguistics42: 1129-84.

Karlgren, J.2004.The wheres and whyfores for studying text genre computationally[OL].http://www.aaai.org/library/symposia/fall/fs04-07.php

Keenan, E.L.& B.Comrie.1977.Noun phrase accessibility and universal grammar [J].LinguisticInquiry8: 63-99.

Keenan, E.L.& B.Comrie.1979.Data on the noun phrase accessibility hierarchy [J].Language55: 331-51.

Kuno, S., K.Takami & Y.Wu.1999.Quantifier scope in English, Chinese and Japanese [J].Language75: 63-111.

Kuno, S., K.Takami & Y.Wu.2001.Response to Aoun and Li [J].Language77: 134-43.

Liu, Q.& S.Li.2002.Word similarity computing based on HowNet [J].ComputationalLinguisticsandChineseLanguageProcessing2: 59-76.

Weiss, S.M.& C.A.Kulikowski.1991.ComputerSystemsThatLearn:ClassificationandPredictionMethodsfromStatistics,NeuralNets,MachineLearningandExpertSystems[M].San Mateo: Morgan Kaufmann Publishers.

Xu, L.1994.The antecedent of ziji [J].JournalofChineseLinguistics22: 115-36.

黃居仁.2003.語意網,詞網與知識本體:淺談未來網路上的知識運籌[J].佛教圖書館館訊33：6-21.

許余龍.2005.語篇回指實證研究中的數據庫建設[J].外國語(2)：23-29.

楊春雷.2004.漢語量化詞轄域的約束條件系統[J].現代外語(3)：255-63.

楊春雷.2011.面向語用解釋消歧的量化名詞短語約束條件系統[J].語言文字應用(1)：122-28.