高松 錢隆




摘? 要:方位詞是現代漢語中的一個特殊詞類,關于方位詞的研究大多基于定性分析展開。利用漢語依存樹庫資源,對方位詞的分類和范圍、語法功能、詞性歸屬等問題進行計量分析,可以驗證和補充現有的研究結論。根據方位詞的使用頻率,區分出核心方位詞和非核心方位詞。考察方位詞的語法功能分布,總結方位詞的語法特點。并通過對比方位詞與其他詞類的語法特征,來闡述方位詞的詞性歸屬。這將有利于更加深入地認識方位詞,量化信息豐富了以往單純依靠定性分析的研究,也可以為現代漢語自動句法分析提供參考。
關鍵詞:方位詞;語法特征;依存樹庫;計量
方位詞是漢語中的一個特殊詞類,目前已取得豐富的研究成果。關于方位詞的分類和范圍、語法特征、詞性歸屬等問題,學者們進行了深入的討論,這些研究大多是基于定性分析展開的,有關方位詞的計量研究相對較少。隨著語料庫語言學的發展,語料庫研究方法受到越來越多的關注。經過句法標注的語料庫,稱作“樹庫”。利用帶有標注信息的語料庫進行語言研究,提取語言數據,大大方便了語言研究者[1]。近些年來,樹庫用來獲取句法知識和評價句法分析結果,成為了句法分析器[2](P103-127)。在樹庫標注體系中,依存語法標注已經成為主流標注體系之一,依存語法可以很好地處理漢語句子中詞與詞之間的復雜關系。依存樹庫通過建立詞語之間的聯系來描述句法的結構,它以依存關系為基礎。依存關系是一種有向的非對稱關系,由支配詞、從屬詞和依存關系標記三個部分組成。句子中的每個詞都必須有一個支配詞[3](P98-99)。這里不妨以“那本書在桌子上”為例加以說明,其依存句法結構可如圖1所示:
在圖1中,帶有箭頭弧的起點是支配詞,弧的終點為從屬詞,弧上的標記為依存關系標記。在“那本書在桌子上”這個句子中,動詞“在”是句子的核心;“在”分別支配名詞“書”和方位詞“上”,它們的依存關系標記為“subj”和“obj”,分別表示主語和賓語。
本文所使用的樹庫是中國傳媒大學應用語言學研究所樹庫建設團隊建立的漢語依存樹庫Institute of Applied Linguistics-Communication University of China Chinese Dependency Treebank(簡稱“IAL-CUC CDT”)。該樹庫中共有3600個句子,98236個詞次。利用中國傳媒大學國家語言資源監測與研究有聲媒體中心的在線分詞標注系統(CUCBst),對文本進行了自動分詞和詞性標注。按照現代漢語依存關系句法標注體系,進行了句法標注[4]。標注結果經過人工和機器校對,以確保標注結果的準確性。本文利用漢語依存樹庫對方位詞進行計量分析,嘗試在樹庫中統計方位詞的范圍,考察方位詞的語法功能,明確方位詞的詞性歸屬,從定量分析的角度對已有研究結論進行驗證和補充。
一、方位詞的分類和范圍
關于方位詞的分類和范圍,學者們已經得出了一些共識性結論。通常認為,方位詞分為單純方位詞和合成方位詞兩類。單純方位詞包括“東、南、西、北、上、下、前、后、左、右、里、外、內、中”等[5]—[8]。
關于合成方位詞的范圍,尚存在一些爭議。黃伯榮、廖序東認為,合成方位詞只包含單純方位詞前加“以”“之”這兩種情況[5](P10)。邵敬敏指出,除了前加“以”“之”外,單純方位詞后加“邊”“面”“頭”也是合成方位詞[7](P174)。金昌吉認為,除了前加“以”“之”外,“前后”“左右”這種對舉類的也是合成方位詞[9]。呂叔湘則認為,“跟前”“底下”“中間”“當中”也屬于合成方位詞[10](P14)。各家爭議的主要原因,是在于對方位詞語法特點的認識不一致。金昌吉認為,方位詞附著在其他詞后面構成方位短語時,中間不能插入其他詞語[9]。邵敬敏則認為,中間可以插入其他詞語[7](P174-175)。
劃分詞類的主要依據是詞的語法功能[11](P38),具有相同語法功能的詞應歸為一類。因此,我們以語法功能為標準來確定方位詞的范圍,并根據方位詞的使用頻率區分出核心方位詞和非核心方位詞。方位詞的語法功能,是指方位詞作支配詞,支配其他詞而形成“方位結構補語”fc這種依存關系。筆者對樹庫中的“方位結構補語”進行了統計,共有3562個。為了便于統計分析,我們將一些“方位結構補語”的支配詞進行了合并。“當中”“中間”“面前”“底下”“邊上”等合并為其他類;“內外”“前后”“上下”等合并為對舉類。具體情況如表1所示:
從表1可以看出,在單純方位詞方面,“上”“中”“里”出現的頻次較高,是最為常用的單純方位詞,可以看作是核心方位詞。除此之外,“前”“后”“內”“下”“外”“間”等也是單純方位詞。這跟已有的研究結論一致。同時,我們還在樹庫里發現,“邊”也屬于單純方位詞,如“耳邊”“馬路邊”等,這一點學者們較少提到。通常認為的單純方位詞“東”“南”“西”“北”“左”“右”,在樹庫中均未單獨出現,都是以前加、后加或對舉形式構成合成方位詞。在合成方位詞方面,單純方位詞前加“以”“之”是最為常見的合成方位詞,其中,“之~”的出現頻次占比為8.59%,“以~”的占比為8.37%。因此,可以將單純方位詞前加“以”“之”構成的詞看作是核心方位詞。除“以”“之”外,單純方位詞后加“邊”“面”“頭”,單純方位詞對舉及單純方位詞與其他語素或詞結合,也能構成合成方位詞。此外,在依存樹庫中,“部”“方”“側”前加單純方位詞也能構成合成方位詞,如“機關內部”“屏幕下方”“場地左側”等,這也是已往研究較少關注的。
二、方位詞的語法特點
在依存樹庫中,我們統計了方位詞為支配詞時,它與從屬詞所形成的支配關系,包括支配關系標記、各種支配關系出現的頻次、每種支配關系占所有支配關系的比例以及在樹庫中的例句,其中,雙下劃線的詞是支配詞,單下劃線的詞是從屬詞。具體如表2所示:
在依存樹庫中,我們也統計了方位詞作從屬詞時,支配詞支配方位詞所形成的從屬關系,包括從屬關系標記、各種從屬關系出現的頻次、每種從屬關系占所有從屬關系的比例以及在樹庫中的例句,其中,雙下劃線的詞是支配詞,單下劃線的詞是從屬詞。具體如表3所示:
關于方位詞的語法特點,此前學者多有論及。丁聲樹等認為,方位詞單用作主語,限于前后并列的句法。復合方位詞修飾名詞的時候,一般要帶“的”;放在名詞后頭、受名詞修飾時,一般不帶“的”字[12](P78-79)。鄒韶華認為,方位詞差不多都能用在所有的物質名詞之后,一部分方位詞能用在時間名詞之后,用在抽象名詞之后表示引申意義的方位詞很少;方位詞可位于動名詞后面,一般不能位于形容詞后面;方位詞可用在數詞后,表示順序;重疊的量詞后面能加方位詞;代詞后面能加方位詞,但很少能加單音節的方位詞;只有表示最高級意味的副詞可以修飾方位詞;介詞后面能加方位詞,組成介詞結構;連詞可以用在幾個方位詞之間,起連接作用,不能放在單一的方位詞后面;方位詞不能用在助詞和嘆詞后面[13]。林祥楣指出,方位詞經常修飾動詞,部分方位詞能受“最”“盡”的修飾[14](P214)。楊潤陸、周一民指出,方位詞不能或不常受數量詞組的修飾[15](P234)。呂冀平指出,方位詞附在名詞后邊,或者同別的方位詞結合成一個表示時間或處所的名詞[16](P79)。方緒軍認為,方位詞與所附著的詞語之間不能插入“的”,方位詞只有在對舉的格式里,才可以作主、賓語[17](P141-142)。張誼生認為,多數的方位短語都可充當介詞賓語,以組成介詞詞組。單純方位詞在特定條件下可以充當句法成分;用在一些表位移的動詞前面,可以充當狀語;用在一些表方向的介詞后面,可以充當介詞賓語[18](P302)。劉叔新指出,方位詞不能受名量短語修飾,大部分都能受“最”修飾[19](P142)。張斌指出,方位詞一般只能附在名詞或名詞性短語的后面,組成方位短語。有時方位詞也可以單獨充當句法成分[20](P291)。
在依存樹庫中,“主要指建筑里的各種排水”等句子證明,方位詞一般不單獨使用,需要附在名詞或名詞性短語的后面,組成方位短語充當句法成分。在“他做事真是前怕狼后怕虎”“前輪過線,后輪還在線內”等句子中,存在方位短語作主語、定語和方位詞對舉的情況。我們發現,復合方位詞修飾名詞可以不帶“的”,特別是名詞前還有別的修飾詞時。如“在我們前邊這個場館,它是國家體育館。”“他后面那句話真讓我傷心。”在這兩個句子中,名詞“場館”“話”前面受“這個”“那句”修飾,復合方位詞“前邊”“后面”在修飾名詞“場館”“話”時,就沒有帶“的”字。當復合方位詞放在名詞后面時,一般不帶“的”,如“機油前面的黏度只是代表它的使用地區”,復合方位詞放在名詞“機油”后頭,不帶“的”字。此外,多數方位短語都可以充當介詞的賓語,組成介詞短語,我們發現很多方位短語作介詞賓語的句子,如“你們不是從這上面走過來的嗎?”等。單純方位詞也大量地用在介詞后面,作介詞賓語,如“她在場內一直喊著向前向前”。此外,單純方位詞還可以作狀語,如“在一個紅綠燈路口,我強行左拐了”中,單純方位詞“左”作動詞“拐”的狀語。
我們再來看方位詞與其他詞語的結合能力。方位詞能用在普通名詞和部分時間名詞后面,如“她思想上已經有準備了”“你務必八點前到”等;方位詞可用在動詞后面,如“抑肽酶注射液臨床上主要用于心臟手術的患者。”其中,方位詞“上”位于動詞“臨床”的后面,此處“臨床”具有名詞的特點和意義。鄒韶華認為,方位詞不能位于形容詞后面[13],而樹庫中有很多“形容詞+方位詞‘中、之中’”格式的句子,如“這些年是如何在孤獨中掙扎的。”“他從痛苦之中走出來了。”方位詞可用在數詞后,如“全國75%以上的城鎮就業崗位都是由中小企業提供的。”“我四十之前都沒意識到這個問題。”這里的方位詞“以上”“之前”分別位于數詞“75%”“四十”的后面。同時,量詞后面都可以帶方位詞,樹庫里有很多名量詞(如“達到30度以上”)、動量詞(如“每周跑兩次以上”)、時量詞(如“10分鐘左右”)帶方位詞的句子。代詞中,人稱代詞和指示代詞后面都可以加方位詞,如“他們之間的距離越來越近。”“這以前都白費了。”樹庫中沒有疑問代詞后面帶方位詞的用例。個別副詞“最、再”等可以修飾方位詞,如“我在最上面一排。”“那時真是左得不能再左了”。此外,樹庫中有大量的介詞后面帶方位詞的用法,如“就朝東邊走就能找到”等;還有連詞用在幾個方位詞之間的例證,如“東和西兩邊的房子比北方差一些,叫作廂房”等。
三、方位詞的詞性歸屬
關于方位詞的詞性歸屬,目前學界尚未達成共識。多數學者認為方位詞應歸入名詞,是名詞下的一個次類,如黃伯榮和廖序東[5](P10)、胡裕樹[8](P285)、劉月華等[21](P50)。對此,也有學者持不同觀點。朱德熙、邢公畹均認為,方位詞應該單列一類[11]、[22]。錢乃榮認為方位詞是介詞[23](P182)。劉丹青認為方位詞是框式介詞中的后置詞[24]。金昌吉認為方位詞只能算作是黏著“后置詞”,部分方位詞只能稱得上是構詞語素[9]。方經民則將方位成分由實到虛劃分為四類:方位名詞、方向詞、方位區別詞和方位詞[25]。
基于依存樹庫中方位詞的統計,我們認為,方位詞不是黏附語素。雖然方位詞經常附在名詞或名詞性短語的后面,組成方位短語,但是方位詞可以獨立充當句法成分。從表3可以看出,當方位詞為從屬詞時,可以作狀語、定語、賓語、主語等。
同時,我們也不認為方位詞是介詞或框式介詞中的后置詞。在表3中,方位詞作為從屬詞時,由介詞支配的比例為34.93%,方位詞與介詞之間具有語法關系,一般來講,介詞是不和另一個介詞產生語法關系的。此外,方位詞作定語、賓語、主語等句法功能,也是介詞所不具備的。因此,不能簡單地將方位詞看作介詞。在語言信息處理領域,肖丹等曾在依存句法標注實踐中引入框式介詞的標注方式,將介詞與方位詞之間的詞當作核心,由該詞分別支配前后的介詞和方位詞,并把方位詞當作介詞處理[26]。這種標注方式存在一些問題。在介賓結構中,介詞是核心,介詞后的補足語受介詞支配。在方位短語中,方位詞是核心,方位詞前的補足語受方位詞支配。李亞非曾從形式語法的角度解釋了方位詞與介詞的關系。從格語法角度來看,方位詞不能在句中賦格,而介詞在句子中最主要的功能就是給其他詞賦格。因此,方位詞并不是介詞或框式介詞中的后置詞[27]。
此外,根據依存樹庫中的統計,當方位詞為支配詞時,最主要的語法功能就是作方位短語中心詞,支配其他名詞或名詞短語;當方位詞為從屬詞時,最主要的語法功能是在句中作介詞的賓語或狀語,少部分可以作“的”字結構補足語或定語。可見,方位詞的語法功能與名詞的語法功能具有較大差異。在依據語法功能確定詞性歸屬的原則下,如果把方位詞看作是名詞下的一個附類就有些說不通了。
綜上所述,我們認為方位詞比較特殊,語法功能與其他詞類存在較大差異,應在實詞中將方位詞單列一類。
基于漢語依存樹庫,我們對現代漢語方位詞的分類和范圍、語法特點、詞性歸屬等進行了定量分析。首先,在方位詞的分類和范圍方面,區分出核心方位詞和非核心方位詞。其次,通過統計方位詞作支配詞、從屬詞所形成的依存關系,歸納出方位詞的語法特點。再次,根據方位詞語法功能與其他詞類的對比,明確方位詞的詞性歸屬,指出在實詞中方位詞應單列一類。從定量分析的角度,我們對已有的研究結論進行了驗證,對學者們未論及的問題進行了補充。這不僅有助于使方位詞的本體研究更加深入,而且可以為現代漢語自動句法分析和對外漢語教學提供有益的參考。
參考文獻:
[1]衛乃興.語料庫語言學的方法論及相關理念[J].外語研究,2009,(5).
[2]Abeillé,A.Treebanks:Building and Using Parsed Corpora[M].Dordrecht:Kluwer,2003.
[3]劉海濤.依存語法的理論與實踐[M].北京:科學出版社, 2009.
[4]Liu,H. & Huang W.A Chinese Dependency Syntax for Treebanking[A].Proceedings of The 20th Pacific Asia Conference on Language,Information and Computation[C].Beijing:Tsinghua University Press,2006.
[5]黃伯榮,廖序東.現代漢語(增訂六版)[M].北京:高等教育出版社,2017.
[6]蘭賓漢,邢向東.現代漢語[M].北京:中華書局,2006.
[7]邵敬敏.現代漢語通論(第二版)[M].上海:上海教育出版社,2007.
[8]胡裕樹.現代漢語(重訂本)[M].上海:上海教育出版社,1995.
[9]金昌吉.方位詞的語法功能及其語義分析[J].內蒙古民族師院學報(哲學社會科學版),1994,(3).
[10]呂叔湘.現代漢語八百詞(增訂本)[M].北京:商務印書館,1999.
[11]朱德熙.語法講義[M].北京:商務印書館,1982.
[12]丁聲樹,等.現代漢語語法講話[M].北京:商務印書館,1961.
[13]鄒韶華.現代漢語方位詞的語法功能[J].中國語文, 1984,(3).
[14]林祥楣.現代漢語[M].北京:語文出版社,1991.
[15]楊潤陸,周一民.現代漢語[M].北京:北京師范大學出版社,1995.
[16]呂冀平.漢語語法基礎[M].北京:商務印書館,2000.
[17]方緒軍.現代漢語實詞[M].上海:華東師范大學出版社,2000.
[18]張誼生.現代漢語虛詞[M].上海:華東師范大學出版社,2000.
[19]劉叔新.現代漢語理論教程[M].北京:高等教育出版社,2002.
[20]張斌.新編現代漢語(第二版)[M].上海:復旦大學出版社,2008.
[21]劉月華,潘文娛,故韡.實用現代漢語語法[M].北京:外語教學與研究出版社,1983.
[22]邢公畹.現代漢語教程[M].天津:南開大學出版社, 1994.
[23]錢乃榮.現代漢語(修訂本)[M].南京:江蘇教育出版社,2001.
[24]劉丹青.漢語中的框式介詞[J].當代語言學,2002,(4).
[25]方經民.現代漢語方位成分的分化和語法化[J].世界漢語教學,2004,(2).
[26]肖丹,楊爾弘,張明慧,陸天熒,楊麟兒.漢語中介語的依存句法標注規范及標注實踐[J].中文信息學報, 2020,(11).
[27]李亞非.漢語方位詞的詞性及其理論意義[J].中國語文,2009,(2).
A Quantitative Study of Localizers in the Chinese Dependency Treebank
Gao Song,Qian Long
(School of Chinese Studies, Dalian University of Foreign Languages, Dalian 116044, China)
Abstract:Localizers are a special category of words in modern Chinese. At present, most of the studies on localizers are based on qualitative analysis. In order to verify and supplement the findings of existing studies, we used the resources of the Chinese Dependency Treebank to conduct a quantitative analysis of the object range, syntactic function and lexical categorization of the localizers. A distinction was made between core and non-core localizers according to their frequency of use. The syntactic function distribution of the localizers is examined and the grammatical features of the localizers are summarised. Finally, the lexical categorization of localizers is proposed by comparing the grammatical features of localizers with those of other word classes. The study provides a deeper understanding of localizers, and the quantitative information enriches previous studies that relied solely on qualitative analysis, as well as providing a reference for automatic syntactic analysis of modern Chinese.
Key words:localizers;syntax;dependency treebank;quantitative study