蔡莉 敖鋒
(國防科技大學,湖南 長沙 410073)
關系從句作為一種普遍的語言現(xiàn)象,長期以來一直受到語言研究者們的關注。在不同的語言之間,研究者們發(fā)現(xiàn)了不同的關系從句掛靠偏向。一些歐洲語言如西班牙語在關系從句掛靠上表現(xiàn)出非就近掛靠偏向,這與語言中普遍存在的就近現(xiàn)象相矛盾。因此,許多研究者著力于發(fā)現(xiàn)不同語言之間在關系從句掛靠上的差異并尋找合適的理論來解釋這些差異。目前,國內對關系從句掛靠偏向的研究還很少(牛萌萌、吳一安,2007),并且在方法上還主要限于離線調查。因此,通過語料庫分析方法從關系從句掛靠偏向的角度探討漢語關系從句掛靠偏向必將為國內的關系從句研究提供新的思路。
關系從句掛靠偏向是指句子處理者在處理關系從句掛靠歧義現(xiàn)象時所做出的消歧策略。這種歧義現(xiàn)象包含一個復雜的名詞短語作為關系從句的先行詞,該名詞短語包括兩個或三個掛靠點,關系從句只能掛靠到其中一個。比如,
(1)The guests laughed at the husband of the lady who complimented himself too many times.
(2)The guests laughed at the husband of the lady who complimented herself too many times.
(3)一匹狼從獵人的家里叼走了外出打獵的獵人的孩子。
(4)一匹狼從獵人的家里叼走了還未斷奶的獵人的孩子。
上面四個句子都有一個關系從句,關系從句的先行詞是一個屬格結構的名詞短語(NP),其中的每一個名詞短語(NP1和NP2)都是關系從句的掛靠點。從(1)和(2)的對比可以看出,關系從句分別掛靠在屬格結構的NP1和NP2上,這樣的掛靠方式被分別稱為高位掛靠(high attachment)和低位掛靠(low attachment)。漢語和英語在關系從句的結構上有所不同,英語的關系從句是“NP1-of-NP2-關系從句”結構,而漢語的關系從句是“關系從句-NP1-的-NP2”的先行詞后置結構。因此,當漢語關系從句掛靠到NP1時,我們稱之為低位掛靠;當關系從句掛靠到 NP2時我們稱之為高位掛靠。
有研究(Carreiras& Clifton,1999)表明,當關系從句先行詞為屬格結構時,母語為英語的句子處理者傾向于低位掛靠。而以其他語言為母語的語言處理者卻可能傾向于高位掛靠(西班牙語Mitchell& Cuetos,1991;荷蘭語 Brysbaert& Mitchell,1996;南非荷蘭語 Mitchell,Brysbaert,Grondelaers&Swanepoel,2000)。引發(fā)語言間不同掛靠偏向的原因是什么?國外學者提出了諸多理論對此進行解釋,其中兩個影響最大。
Mitchell和Cuetos(1991)提出的調整假設是基于經(jīng)驗的句子處理策略。句子處理者平時接受的語言刺激會影響他們在首輪句子分析中的選擇,出現(xiàn)頻率最高的處理選擇會成為他們的首選。在每次成功處理了該類型句子以后,當時所用的處理選擇就會逐漸增加其在整個句子處理機制當中的權重。在以后遇見同類型的句子時,句子處理者也就傾向于這個處理選擇。
驗證調整假設正確性最好的方法就是語料庫分析。以英語為例,如果調整假設是正確的,那么在英語語料庫中具有關系從句掛靠歧義的句子就會更多表現(xiàn)出低位(NP2)掛靠偏向。實際上,學者們已經(jīng)發(fā)現(xiàn)了一些支持調整假設的證據(jù)。Mitchell,Cuetos和Corley(1992)在分析了 LOB語料庫后發(fā)現(xiàn):62%具有關系從句掛靠歧義的句子表現(xiàn)出低位掛靠。同樣,Gibson和 Pearlmutter(1994)通過對Brown語料庫的分析也發(fā)現(xiàn):當關系從句具有三個掛靠選擇時,低位掛靠(在這里是 NP3)是首選對象。
然而,同樣利用語料庫分析的方法,一些研究也發(fā)現(xiàn)了與調整假設不相符的數(shù)據(jù)。比如,Gibson等人(1999)在對西班牙語中的關系從句掛靠偏向進行研究時發(fā)現(xiàn):當關系從句有兩個掛靠點可供選擇時,句子處理者偏向于高位掛靠,這與調整假設的預測一致;但是當關系從句有三個掛靠點時,句子處理者卻傾向于低位(此時是NP3)掛靠,這與調整假設相矛盾。無獨有偶,Mitchell和 Brysbaert(1998)在對荷蘭語的關系從句掛靠偏向研究中發(fā)現(xiàn),語料庫數(shù)據(jù)中出現(xiàn)更多的是低位掛靠偏向的結構,而在線實驗數(shù)據(jù)中出現(xiàn)更多的卻是高位掛靠偏向,這也使調整假設的解釋力打了折扣。
解釋假設由Frazier和Clifton(1996)提出,可以說是花園小徑理論的一個變體。解釋假設的中心議題之一是區(qū)分主要關系和非主要關系。主要關系指的是(謂語)動詞與其核心題元之間的關系。非主要關系指的是主要關系以外的附屬成分關系,比如關系從句的掛靠。之所以要區(qū)分這兩種關系,是因為在處理它們的過程中涉及不同的處理機制。處理主要關系時要使用的是普遍的句法分析原則,如遲關閉策略;而處理非主要關系時需要使用與當前題元域有關的語義或語用原則,比如指示原則(referentiality principle)或格賴斯方式準則等。
Frazier和Clifton(1996)證實解釋假設可以解釋英語的關系從句掛靠偏向。但也有不少研究表明解釋假設缺乏跨語言的普遍性,比如Brysbaert和Mitchell(1996)對荷蘭語關系從句掛靠偏向的研究和Mitchell等人(2000)關于南非荷蘭語關系從句掛靠的研究。
就漢語而言,漢語中只有一種屬格形式,即“NP1-的-NP2”。根據(jù)解釋假設,由于方式準則無法發(fā)揮作用,只有指示原則發(fā)揮作用,因此關系從句應該表現(xiàn)出高位掛靠偏向。那么,漢語中的關系從句掛靠偏向究竟如何,本文將采用語料庫分析的方法予以研究。
語料庫分析的目的在于發(fā)現(xiàn)漢語語料中的關系從句是否有掛靠偏向,并以此推斷漢語母語者在這方面接受的語言刺激。
本研究采用的語料包括報刊和小說兩種文體。選用兩種文體的目的在于防止文體的特征影響分析的結果。報刊文體相對正式,并經(jīng)過專業(yè)的編輯整理。小說文體相對報刊文體而言比較隨意,更接近人們的日常用語,且本研究中選用的小說語料均為北京方言小說,因此語言風格比較口語化。
報刊文體的語料取自《人民日報》1995年1月的所有文章,字數(shù)逾210萬。小說語料取自30部北京方言小說,共約140萬字。
在收集語料的工作結束以后,首先使用EmEditor軟件檢索其中所有含有“的”的語料,然后利用CIPP—中文信息處理平臺對語料進行檢索,查找其中含有“……的……的……”結構的語料,最后對這些語料進行人工分析,判斷其中的“……的……的……”結構是否為“關系從句—NP1—的—NP2”,并確定其中的關系從句掛靠偏向。檢索結果中,單純使用語義或句法信息無法區(qū)分關系從句掛靠偏向的語料被剔除。人工分析由兩位研究人員分別完成。對于分析結果具有分歧的語料,由兩位研究人員商議決定最終結果。
漢語語料中的關系從句掛靠情況表現(xiàn)出明顯的低位掛靠偏向,表1中列舉了語料分析的具體結果。通過卡方檢驗發(fā)現(xiàn):不同文體語料之間在掛靠偏向上不存在顯著差異(p>0.05)。因此,以下的分析不區(qū)分文體。通過同樣的檢驗方法發(fā)現(xiàn),漢語關系從句中低位掛靠的句子顯著多于高位掛靠的句子(p<0.05),即漢語關系從句具有低位掛靠偏向。
Desmet等(2002)將語料作為掛靠點語義特征的函數(shù)來進行分析時發(fā)現(xiàn),語料庫數(shù)據(jù)分析結果與未區(qū)分掛靠點語義特征時不同。Desmet等人將掛靠點按照生命性特征分為了四類:有生命NP1+有生命NP2;無生命NP1+有生命NP2;有生命NP1+無生命NP2;無生命NP1+無生命NP2。結果發(fā)現(xiàn):在不區(qū)分掛靠點語義特征時語料庫分析結果表明:荷蘭語關系從句呈現(xiàn)低位掛靠偏向,這主要是由無生命NP1造成的。
鑒于此,本研究也根據(jù)掛靠點的生命性特征進行語料庫分析。從數(shù)量上看,語料中掛靠點具有生命性的例子占總數(shù)的35%。表2是對掛靠偏向與掛靠點生命性之間關系的描述統(tǒng)計。從表2中可以清楚地發(fā)現(xiàn):高位掛靠偏向的句子中很大一部分的低位掛靠點具有無生命性特征。

表1 漢語語料中的關系從句掛靠情況

表2 掛靠偏向與掛靠點生命性之間的關系
進一步進行卡方檢驗發(fā)現(xiàn),在低位掛靠點的生命性上,高位掛靠與低位掛靠偏向之間具有顯著差異(p<0.05)。具體來說,當?shù)臀粧炜奎c有生命時,低位掛靠偏向的句子顯著多于高位掛靠的句子。而當?shù)臀粧炜奎c無生命時,高、低位掛靠偏向的句子在數(shù)量上不存在顯著差異。比如:
(5)這一舉動遭到包括臺灣同胞在內的全中國人民的譴責。(《人民日報》1995年1月1日《在全國政協(xié)新年茶話會上的講話》)——低位掛靠點有生命,低位掛靠。
(6)他看著一片片閃過的工友們的枯黃頭盔。(王朔所著小說《永失我愛》)——低位掛靠點有生命,高位掛靠。
(7)車主是我小時候就很熟悉的鄰寨的潘大叔。(《人民日報》1995年 1月 2日《山寨“馬的”》)——低位掛靠點無生命,高位掛靠。
(8)它是經(jīng)臺灣海峽或南海南北航行的船只的轉向點。(《人民日報》1995年 1月 3日《南海行》)——低位掛靠點無生命,低位掛靠。
語料庫中類似于(5)的句子顯著多于類似于(6)的句子(p<0.05)。而類似于句(7)和(8)的句子數(shù)量之間不存在具有統(tǒng)計學意義的顯著差異。在高位掛靠點的生命性上,高位掛靠與低位掛靠之間不存在顯著差異。
總體而言,研究通過對總字數(shù)達350萬字的語料進行分析發(fā)現(xiàn):1)漢語表現(xiàn)出關系從句低位掛靠偏向;2)低位掛靠點的生命性特征會影響關系從句掛靠偏向。
要解釋這個現(xiàn)象,首先需要找到?jīng)Q定漢語關系從句低位掛靠偏向的機制。按照解釋假設的預測,漢語關系從句掛靠應該遵循指示原則,關系從句應該掛靠到先行詞的中心詞上,即高位掛靠。然而,研究結果發(fā)現(xiàn)的是低位掛靠偏向,這說明解釋假設不適用于漢語關系從句掛靠。
再看掛靠點的生命性特征對掛靠偏向的影響。經(jīng)過統(tǒng)計分析發(fā)現(xiàn):在低位掛靠點的生命性上,高位掛靠與低位掛靠之間存在顯著差異;而在高位掛靠點的生命性上情況卻并非如此。這說明影響關系從句掛靠偏向的因素除了掛靠點的生命性特征以外,還有掛靠點的位置,即先行詞在句中的結構信息。這個結構信息很可能取決于決定漢語關系從句低位掛靠偏向的機制。
表面看,低位掛靠偏向與遲關閉策略相符。但是根據(jù)Frazier等人(1996)的理論,遲關閉策略等句法分析策略是用于分析句子主要關系的,而關系從句屬于非主要關系,應該由語義語用原則來解釋。因此,遲關閉策略不能解釋漢語中的低位掛靠偏向。既然本研究已經(jīng)發(fā)現(xiàn)關系從句掛靠受先行詞結構和掛靠點的生命性特征雙方面的影響,因此,要找到?jīng)Q定漢語關系從句掛靠偏向的機制就應該從這兩個方面分別進行探討。
本研究通過語料庫分析發(fā)現(xiàn):掛靠點的生命性會影響掛靠偏向。而Frazier和Clifton(1996:73)認為,并非是掛靠點的生命性特征影響掛靠偏向,而是先行詞的結構起決定性作用。這里的結構主要指附屬(adjunct)結構和題元(argument)結構。根據(jù)解釋假設的理論,掛靠點的生命性特征之所以會影響掛靠偏向是因為掛靠點的生命性特征會影響先行詞的結構。有生命的掛靠點之間通常是題元結構,而無生命名詞與有生命名詞之間通常是附屬結構。如果先行詞是附屬結構,那么,關系從句就掛靠在整個先行詞上;而如果先行詞是題元結構,由于題元結構中的題元介詞引出了一個新的題元域,那么,關系從句就掛靠在新題元域上。
為了判定究竟是掛靠點的生命性特征還是先行詞的結構影響著掛靠偏向,本研究又重新分析了語料庫中的數(shù)據(jù),將NP1有生命的語料分為附屬結構和題元結構兩種類型。結果發(fā)現(xiàn):附屬結構和題元結構所占比例幾乎相等。這說明掛靠點生命性特征不是通過決定先行詞的結構來影響關系從句掛靠偏向的。
Bock等人(Bock & Loebell,1990;Bock,Loebell&Morey,1992)發(fā)現(xiàn):概念上越熟悉的詞條占有越重要的語法低位,其中包括有生命的詞語。人們傾向于將有生命的詞語作為動作的發(fā)出者和句子的主語,因此關系從句傾向于掛靠在有生命的掛靠點上。這個理論在Desmet等(2002)在荷蘭語的研究中得到了支持。此外,MacDonald等(1993)也發(fā)現(xiàn)在語篇表征中,有生命的詞語比無生命的詞語更容易激活,而越容易激活的詞語就越容易被關系從句掛靠。這些研究都支持掛靠點生命性作為影響掛靠偏向的因素。不過,本研究與 Desmet等(2002)的研究結果有所不同。在Desmet等(2002)的研究中,高位掛靠點的生命性影響掛靠偏向;而在本研究中,低位掛靠點的生命性影響掛靠偏向。造成這個區(qū)別的原因可能是語言間的差異,也可能是生命性特征還不能完全解釋關系從句掛靠偏向。我們來逐一分析。
4.2.1 語言間差異
從語言間的差異來看,Desmet等(2002)研究的是荷蘭語中的關系從句掛靠偏向。荷蘭語關系從句的結構和英語類似,是“NP1-van-NP2-關系從句”。而漢語中是“關系從句-NP1-的-NP2”的結構。可見,荷蘭語中的高位掛靠是NP1掛靠,漢語中的低位掛靠也是NP1掛靠。表面上的語言間差異實際上很可能源自于同一種機制的作用,而這個機制與掛靠點在句子當中的位置有關。這讓我們想到Gibson等人(1996)提出的雙因素理論。
雙因素理論包含兩個原則,一個是就近原則(Recency Principle),另一個是謂詞接近原則(Predicate Proximity Principle)。就近原則是掛靠點與掛靠范疇之間新的語篇謂語和所指數(shù)量的函數(shù)。這種基于語篇的函數(shù)不僅可以解釋關系從句掛靠偏向,還可以解釋其他一些語言現(xiàn)象(比如,如果增加主語與動詞之間的距離,動詞的閱讀時間就會增加)。
謂詞接近原則認為掛靠點應該距離謂詞越近越好。該原則在各語言中的作用強度不同,受各語言中的相應結構發(fā)生頻率影響。在英語中,關系從句掛靠具有低位掛靠偏向,因為英語中就近原則的作用要強于謂詞接近原則的作用。在荷蘭語中,關系從句掛靠具有高位掛靠偏向,因為荷蘭語中謂詞接近原則的作用要強于就近原則的作用。在漢語中,本研究發(fā)現(xiàn)了關系從句的低位掛靠偏向。但是與英語不同的是,漢語的低位掛靠偏向既可能是就近原則的作用,也可能是謂詞接近原則的作用,當然也可能是二者的綜合。這里我們可以用排除法來判斷。
假設就近原則在漢語中發(fā)揮決定性作用。那么,中國英語學習者在母語和目標語中都應該采用就近原則來進行關系從句掛靠消歧,即使在英語關系從句掛靠消歧中即使受到了母語的影響也會仍然表現(xiàn)出低位掛靠偏向。但是,牛萌萌和吳一安(2007)的研究發(fā)現(xiàn):中國英語學習者在英語關系從句掛靠消歧中沒有表現(xiàn)出顯著偏向,這就否定了就近原則的作用。由此可以推斷,漢語中的低位掛靠偏向似乎更適合于用雙因素理論中的謂詞接近原則來解釋。
再來驗證一下。如果漢語中的低位掛靠偏向確實是謂詞接近原則作用的結果,那么,當關系從句先行詞是句子主語時,關系從句應該表現(xiàn)出高位掛靠;先行詞是句子賓語時應該表現(xiàn)出低位掛靠。本研究對語料庫中的數(shù)據(jù)再一次進行了統(tǒng)計后發(fā)現(xiàn),當關系從句先行詞是句子主語時,關系從句高位掛靠的比例為61%,低位掛靠比例為39%;當關系從句先行詞是句子賓語時,關系從句高位掛靠的比例為17%,低位掛靠比例為83%。這些數(shù)據(jù)表明,謂詞接近原則的確在漢語關系從句掛靠中發(fā)揮了作用。
4.2.2 生命性特征的作用機制
在比較了兩種語言之間的差異以后,再來觀察生命性特征對關系從句掛靠偏向的作用機制。4.1節(jié)中已經(jīng)提到過,關系從句掛靠點的生命性特征并不是通過影響關系從句先行詞的結構來影響掛靠偏向的。也就是說,掛靠點的詞匯信息可能直接作用于關系從句掛靠偏向。但是本研究的語料庫分析發(fā)現(xiàn),在高位掛靠點的生命性上,高位掛靠與低位掛靠之間不存在顯著差異;只有在低位掛靠點的生命性上高位掛靠與低位掛靠之間才存在顯著差異。這說明掛靠點的詞匯信息并非直接作用于關系從句掛靠偏向,它還必須和先行詞在句中的結構信息同時發(fā)揮作用。而通過4.2.1節(jié)的分析可以判斷,該結構信息來自謂詞接近原則。
因此,總的來說,掛靠點的詞匯信息和謂詞接近原則同時影響著漢語中的關系從句掛靠。
通過語料庫分析發(fā)現(xiàn),漢語中存在關系從句低位掛靠偏向。該結果與解釋假設的預測不符。通過對語料中關系從句掛靠點生命性特征的分析發(fā)現(xiàn),低位掛靠點的生命性特征會影響關系從句掛靠偏向,高位掛靠點則不然。掛靠點的詞匯信息和結構信息同時發(fā)揮作用,其中結構信息取決于雙因素理論中的謂詞接近原則。遺憾的是,該研究的語料庫分析中語料還比較少,所得出的結果還有進一步確認的必要。此外,要驗證調整假設是否可以解釋漢語中的關系從句掛靠偏向還需要進行心理語言學的在線實驗研究,這是進一步深入該研究的方向之一。
[1]Bock,J.K.& H.Loebell.Framing Sentences[J].Cognition,1990(35):1-39.
[2]Bock,J.K.,Loebell,H.& R.Morey,F(xiàn)rom Conceptual Roles to Structural Relations:Bridging the Syntactic Cleft[J].Psychological Review,1992(99):150-171.
[3]Brysbaert,M.& D.C.Mitchell.Modifier Attachment in Sentence Processing:Evidence from Dutch[J].The Quarterly Journal of Experimental Psychology,1996(49):664-695.
[4]Carreiras,M.& C.Clifton.Another Word on Parsing Relative Clauses:Eyetracking Evidence from Spanish and English[J].Memory and Cognition,1999(27):826-833.
[5]Desmet,T.,Brysbaert,M.& C.De Baecke,The Correspondence Between Sentence Production and Corpus Frequencies in Modifier Attachment[J].Quarterly Journal of xperimental Psychology,2002(55):879-896.
[6] Frazier,L.& Clifton,C.Jr.Construal[M].Cambridge,MA:MIT Press,1996.
[7]Gibson,E.& N.J.Pearlmutter.A Corpus-based Analysis of Psycholinguistic Constraints on PP Attachment[M]//Clifton,L.Frazier& K.Rayner.Perspectives on Sentence Processing,Hillsdale,NJ:Lawrence Erlbaum,1994:181-198.
[8]Gibson,E.,Pearlmutter,N.J.,Canseco-Gonzalez,E.& G.Hickok.Recency Preference in the Human Sentence Processing Mechanism [J].Cognition,1996(59):23-59.
[9]Gibson,E.,Pearlmutter,N.J.& V.Torrens.Recency and Lexical Preferences in Spanish[J].Memory and Cognition,1999(27):603-611.
[10]MacDonald,J.L.,Bock,J.K.& M.H.Kelly.Word and World Order:Semantic,Phonological,and Metrical Determinants of Serial Position[J].Cognitive Psychology,1993(25):188-230.
[11]Mitchell,D.C.& M.Brysbaert,Challenges to Recent Theories of Cross-Linguistic Variation in Parsing:Evidence from Dutch[M]//D.Hillert.Sentence Processing:A Cross-Linguistic Perspective.New York:Academic Press,1998:313-355.
[12]Mitchell,D.C.,Brysbaert,M.,Grondelaers,S.& P.Swanepoel.Modifier Attachment in Dutch:Testing aspects of the Construal theory[M]//A.Kennedy,R.Radach,D.Heller& J.Pynte.Reading as a Perceptual Process.Oxford:Elsevier,2000:493-516.
[13]Mitchell,D.,& F.Cuetos.The Origins of Parsing Strategies[M]//C.Smith.Current Issues in Natural Language Processing.Center for Cognitive Science,University of Austin,TX,1991:1-2.
[14]Mitchell,D.C.,Cuetos,F(xiàn).& M.M.B.Corley.Statistical Versus Linguistic Determinants of Parsing Bias:Crosslinguistic evidence[P].Paper Presented at the 5th Annual CUNY Conference on Human Sentence Processing,New York,March,1992:19-21.
[15]牛萌萌,吳一安.關系從句掛靠偏向研究[J].現(xiàn)代外語,2007(4):271-279.