彭志斌
(四川外語學(xué)院研究生部,重慶400031)
基于語料庫的“有”的詞性標(biāo)注研究及其對(duì)漢語詞典編纂的啟示
彭志斌
(四川外語學(xué)院研究生部,重慶400031)
“有”是現(xiàn)代漢語高頻使用的一個(gè)詞,大中型主流漢語詞典將其詞性處理為唯動(dòng)詞,這是值得商榷的。以普通漢語語料庫為基礎(chǔ),對(duì)“有”的用法進(jìn)行深入調(diào)查,發(fā)現(xiàn)“有”應(yīng)是動(dòng)代助兼類詞。在探討“有”的用法的基礎(chǔ)上,對(duì)詞典編纂提出了點(diǎn)滴建議。
有; 兼類; 語法功能; 語料庫; 詞典編纂
自1930年《王云五大辭典》的出版開創(chuàng)漢語詞典編纂標(biāo)注詞性的先河以來,漢語詞性問題歷經(jīng)上個(gè)世紀(jì)三次大討論,被推向了漢語詞典編纂研究的縱深。尤其是近30年來,國內(nèi)學(xué)者取得了很多詞類標(biāo)注的理論成果[1](P28)和實(shí)踐成果,即編纂出版了10多部帶詞類標(biāo)注的漢語詞典[1](P27)。盡管漢語詞類研究已經(jīng)取得了長足進(jìn)步,但由于漢語缺乏形態(tài)標(biāo)志及形態(tài)變化的自身特征,在詞類的本質(zhì)以及詞類劃分的標(biāo)準(zhǔn)或依據(jù)等問題上至今仍然存在爭(zhēng)議。其中,作為詞類標(biāo)注重點(diǎn)和難點(diǎn)的兼類詞處理問題特別引起了廣大學(xué)者的關(guān)注,如胡名揚(yáng)[2~4]、郭銳[5~6]、蘇寶榮[7]、楊同用[8]、李爾鋼[9]、王仁強(qiáng)[1,10~11]等都多次論述到漢語詞類兼類問題。盡管目前學(xué)界已取得一定成果,但在個(gè)別詞的處理上有失妥當(dāng),主要原因在于判斷詞類時(shí)主要采取了內(nèi)省的辦法而不是使用語料庫進(jìn)行系統(tǒng)研究。鑒于此,本文擬采用基于語料庫的研究方法,以漢語常用詞“有”的詞性處理為例進(jìn)行研究,為未來詞典編撰中兼類詞的處理提供新思路。
我們對(duì)《現(xiàn)代漢語詞典》(2005)、《現(xiàn)代漢語規(guī)范詞典》(2004)、《應(yīng)用漢語詞典》(2000)、《中華實(shí)用詞典》(1989)和《新編現(xiàn)代漢語多功能詞典》(1988)等5部帶有詞性標(biāo)注的詞典進(jìn)行了調(diào)查分析,發(fā)現(xiàn)現(xiàn)有漢語詞典對(duì)“有”的釋義均設(shè)置8個(gè)義項(xiàng),歸納如下:1.表示領(lǐng)有:我有一本《新華字典》。2.表示存在:屋里有5人。3.表示發(fā)生或出現(xiàn):形勢(shì)有了發(fā)展。4.表示達(dá)到一定的數(shù)量或某種程度:他有他哥哥那么高。5.表示所領(lǐng)有的事物的多或大:有經(jīng)驗(yàn)。6.泛指,跟“某”的作用相近:有人、有一天。7.用在“人、地方、時(shí)候”前,表示一部分:有人性子急,有人性子慢。8.用在某些動(dòng)詞的前面組成套語,表示客氣:有請(qǐng)、有勞。對(duì)于“有”的釋義,5部詞典基本一致。對(duì)其詞性標(biāo)注情況如下:《現(xiàn)代漢語規(guī)范詞典》(2004)將第8義標(biāo)注為助詞,其余義項(xiàng)均標(biāo)注為動(dòng)詞;其他4部詞典對(duì)8個(gè)義項(xiàng)均標(biāo)注為動(dòng)詞。現(xiàn)在我們的疑問是:“有”的詞性是否都是動(dòng)詞?
過去詞典編纂時(shí)語言材料的搜集、整理和加工完全是靠手工進(jìn)行的,這種方法費(fèi)時(shí)費(fèi)力,效率低下,占有材料有限。計(jì)算機(jī)出現(xiàn)之后,人們利用計(jì)算機(jī)的強(qiáng)大功能建立了語料庫,讓語言研究者能夠大量、詳盡地占有語言材料和使用語言材料,使語言研究得出更可靠的理論結(jié)論。“從某種意義上說,語料庫的使用,是語言研究的一次革命性的進(jìn)步。”[12]大量漢語語料庫的建立給詞典編纂研究者送來了一股春風(fēng),國內(nèi)很多學(xué)者借助語料庫進(jìn)行詞典編纂的理論研究,取得了可喜成績[1,10~11,13]。語料庫作為自然語言資料的集合,其語料通常反映了某一語言的用法特征及其多樣性。正確合理地使用語料庫可以為詞典編纂提供翔實(shí)可靠的依據(jù),從而使所編詞典更好地體現(xiàn)出語言的真實(shí)性,提高編纂質(zhì)量,同時(shí)也提高詞典的編纂效率。
我們就國家語委現(xiàn)代漢語語料庫對(duì)“有”進(jìn)行了檢索,共獲得條目53 556條。“有”是高頻使用的詞語,數(shù)目很大,為了使語料可控,同時(shí)考慮其代表性和平衡性,我們隨機(jī)抽取1 000條,再排除只是作為語素如“擁有”、“有關(guān)”中的“有”而存在的條目,通過人工篩選的方式獲得了827條“有”的有效索引,有效率為82.7%。
我們根據(jù)“有”的8個(gè)義項(xiàng)對(duì)所有827條合格語料進(jìn)行分類統(tǒng)計(jì),結(jié)果如表1。

表1 “有”的8種意義所占比例情況
為了判斷“有”的詞性是否都是動(dòng)詞,我們擬采用學(xué)術(shù)界普遍認(rèn)可的判斷動(dòng)詞的3項(xiàng)常規(guī)標(biāo)準(zhǔn):(1)能否單獨(dú)作謂語;(2)能否受否定副詞“不/或/沒(有)”的修飾;(3)能否帶“了、著、過”[10]。為討論方便,下文將“有”的8個(gè)義項(xiàng)分別稱為“有1”至“有8”。
“有1”到“有5”可以單獨(dú)做謂語,“有6”至“有8”不能單獨(dú)作謂語,所有語料的例句也未將其用作謂語。例如:
(1)當(dāng)然,真要理論起來,寫、編、發(fā)這些無聊玩意兒的文人都有一個(gè)共同理由:因?yàn)榇蠹覑劭础?/p>
(2)閩江上游的南平地區(qū)有7個(gè)縣市,日降雨量超過了100毫米。
(3)哪里有災(zāi)情,你們就出現(xiàn)在那里。
(4)你那兒雪有多厚呀?
(5)外表上沉默寡言,他其實(shí)很有學(xué)問。
(6)當(dāng)他救出10名群眾后,得知有一名要參加高考的女學(xué)生還被困在一幢樓上,他立即撐著小船趕去。
(7)現(xiàn)在,有人懷疑和否定黨的領(lǐng)導(dǎo),有人以共產(chǎn)黨有缺點(diǎn)錯(cuò)誤作為擺脫黨的領(lǐng)導(dǎo)的理由,甚至還有個(gè)別的人認(rèn)為資本主義國家沒有共產(chǎn)黨的領(lǐng)導(dǎo),不是也實(shí)現(xiàn)了現(xiàn)代化嗎?
(8)他隨即一轉(zhuǎn)身走進(jìn)窯洞:“主席,有請(qǐng)!”
例(1)至例(5)的“有”在句中均用作謂語,分別表示“擁有”、“存在”、“發(fā)生或出現(xiàn)”“達(dá)到”和“多或大”的語義。而表示“某”的例(6)、表示“有些”的例(7),以及表示客氣的例(8)在句中都未用作謂語。可見,“有6”至“有8”標(biāo)注為動(dòng)詞是值得商榷的。
語料顯示,“有1”到“有5”可以受否定副詞“不”和“沒(有)”修飾。例如:
(9)可他們有獨(dú)立的人格,他們可以沒有一切,但卻不可沒有藝術(shù)相伴。
(10)他的童年里沒有不快樂的時(shí)光。
(11)一年來,他們的工作、學(xué)習(xí)、生活條件沒有新的發(fā)展。
(12)這個(gè)園區(qū)耕地面積沒有10萬畝。
(13)小光氣憤地說道:“我是窮人,我沒有錢!”
“有6”,即表示“某”之義,在語料中顯示可以被“沒”修飾,但是,根據(jù)我們的觀察,此處的“有”卻用的是“有2”的“存在”之義。如“我決定北上,沒有人為我送行”。這里的“沒有人”即“不存在一個(gè)人”的意思,而且很顯然,“沒有人”在該句中也不是謂語動(dòng)詞。語料顯示,“有7”、“有8”不能被否定副詞“不”和“沒(有)”修飾。
為了檢驗(yàn)“有”的各個(gè)語義是否能帶“了、著、過”,我們?cè)趪艺Z委現(xiàn)代漢語語料庫中對(duì)“有了”、“有著”和“有過”進(jìn)行了檢索。分析語料得出:能帶“了、著、過”的例句中的“有”表示的語義是“有1”到“有5”。“有1”到“有4”可以帶“了、著、過”,但“有4”(特別是表比較時(shí))的詞性問題也有很大的爭(zhēng)議,有的學(xué)者認(rèn)為表比較的“有”是介詞[14~15]。“有5”可以帶“了、著、過”,但此時(shí)的“有”的含義卻是“有1”的“領(lǐng)有”,并不表示“多或大”的含義。“有5”表示“多或大”只用于一些光桿名詞前,這樣的情況在語料中所占比例極小,僅為1.93%,而且它的主要功能是作謂語,表示的主要意義是“領(lǐng)有”,建議將其歸為“有1”之下,當(dāng)作“有1”的一個(gè)次類來處理。
經(jīng)過以上分析,我們發(fā)現(xiàn)“有”的8個(gè)義項(xiàng)并非都是動(dòng)詞,大中型主流漢語詞典將其詞性處理為唯動(dòng)詞是值得商榷的。“有”的后3義不應(yīng)標(biāo)注為動(dòng)詞,那么,“有6”、“有7”和“有8”究竟該標(biāo)注為什么詞性更合理呢?
什么是兼類詞?目前主要有兩種觀點(diǎn)。寬泛一些的觀點(diǎn)認(rèn)為,讀音相同、詞形相同、意義有聯(lián)系(不一定相同)的具有兩種以上詞性的詞就是兼類詞;嚴(yán)格一點(diǎn)的看法認(rèn)為,讀音相同、詞形一致、意義一致的具有兩種以上詞性的詞才是兼類詞[9]。根據(jù)“意義是否一致”這一區(qū)別,郭銳把兼類詞區(qū)分為異型兼類詞和同型兼類詞兩種,異型兼類詞指詞義不同的兼類詞,同型兼類詞指詞義相同的兼類詞[5~6]。王仁強(qiáng)指出:“只要一個(gè)詞的表述功能發(fā)生轉(zhuǎn)化,就應(yīng)在詞典中確立其義項(xiàng)地位,而不管詞義是否發(fā)生多大的變化;至于處理成兼類詞還是同形詞,則是詞典編纂策略的問題。”[1](P21)因此,我們認(rèn)為現(xiàn)代漢語中高頻使用的“有”義項(xiàng)較多,盡管不同詞義聯(lián)系很小,也可以當(dāng)作兼類詞來處理。
詞性標(biāo)注以什么為依據(jù)呢?是詞義還是語法功能?以前很多辭書在判斷詞性時(shí)都主要根據(jù)詞語意義,然而意義似流沙難以把握,因此問題多多,只有根據(jù)詞的語法功能才能更可靠地把握詞性[1,8,16]。我們不能僅僅隨意舉出個(gè)別用例來判斷詞性,而是應(yīng)依靠計(jì)算機(jī)所建立的語料庫,特別是大型的平衡語料庫來對(duì)詞語的用法進(jìn)行定性定量分析。只有依靠大型的平衡的語料,我們才能更客觀可靠地把握詞的語法功能,從而判斷詞性。
我們對(duì)“有6”的63條語料進(jìn)行了詳細(xì)考察,發(fā)現(xiàn)有以下兩種用法:1.用在名詞前,表示泛指,如:有人;2.用在“一或幾+名詞”之前,如:有一天,有一年。功能上,一般是用作狀語和主語。我們所調(diào)查的5部詞典,它們都認(rèn)為“有6”表示“不定指”,與“某”的作用相似。因此,我們可以在此比較一下“有6”與“某”的用法區(qū)別。《現(xiàn)代漢語八百詞》認(rèn)為“某”有兩種用法:1.用在名詞前,指不確定的或不便明確地說出來的人或事物;第一種情況又有三種小類:a)某十名;b)某+甲(乙、丙…);c)某十?dāng)?shù)量十名,數(shù)詞限于“一、幾”。2.用在姓氏后,指確定的人或自稱[17]。可見,“有6”的用法完全包括在作代詞的“某”的用法之中,也就是說,“有”修飾“名詞”或“一/幾+名詞”所表示的意義,已經(jīng)不是動(dòng)詞的意義。這一搭配組合有明顯的不定代詞的特點(diǎn),應(yīng)該承認(rèn)其語義改變、語義范疇改變、組合上表現(xiàn)出不定代詞的語義特點(diǎn),因此,將其處理為代詞為妥。
“有7”在語料中占86條,主要用于“人,地方,時(shí)候”前,表示“一部分”。如:
(14)有人在妒火中燒中熬日月,有人于不公平待遇里苦撐持,更有人在“各有各的不幸”生活圈內(nèi)暗自飲泣,卻鮮為人知。
我們認(rèn)為,“有7”是“有些”作為代詞時(shí)的縮用,所有“有7”的語料均可用“有些”替換,因此,應(yīng)該與“有些”的詞性標(biāo)注一致,即代詞。
語料顯示,“有8”用在僅有的少數(shù)幾個(gè)動(dòng)詞的前面,表示客氣,如:有請(qǐng),有勞。其表義作用和組合特點(diǎn)完全同于助詞的意義和組合特點(diǎn)。因此,我們認(rèn)為《現(xiàn)代漢語規(guī)范詞典》(2004)將其處理為助詞是恰當(dāng)?shù)摹?/p>
經(jīng)過以上基于語料的分析,我們可以得出,目前5部詞典把“有”的詞性簡單處理為“動(dòng)詞”是不妥當(dāng)?shù)摹!坝?”到“有3”比較明顯地體現(xiàn)為動(dòng)詞。“有4”的詞性爭(zhēng)論正體現(xiàn)了原型范疇理論的觀點(diǎn),我們不能對(duì)其詞性做出一刀切的二元分割,語言中普遍存在著這種現(xiàn)象[18]。在詞典編纂時(shí),我們可以根據(jù)其占多數(shù)的詞性來確定,根據(jù)我們的語料分析,“有4”這個(gè)語義不表比較的情況更多,因此處理為動(dòng)詞。再將“有5”合并到“有1”,“有6”、“有7”、“有8”分別處理為代詞、代詞和助詞。中型漢語詞典可以這樣處理:
有yǒu:? 動(dòng) 擁有、領(lǐng)有:我 ~《現(xiàn)代漢語詞典》。|他~朝氣。注意:其后接光桿名詞表示“擁有很多xx”:他~錢。?動(dòng)存在:教室~5個(gè)人。?動(dòng)出現(xiàn)、發(fā)生:形勢(shì)~了新進(jìn)展。?動(dòng) 達(dá)到(某種數(shù)量或程度):水~一丈多深。|他~哥哥那么高。?代某(表泛指):~人這么說。|~一天他來了。?代有些、一些:~人性子急,~人性子慢。?助(無意義,用在少數(shù)動(dòng)詞前組成套語,表示客氣):~勞。|~請(qǐng)。
語言在漫長的進(jìn)化過程中為了滿足表義的需要,必然會(huì)發(fā)展出各種語法手段,其中最主要的是實(shí)詞虛化和曲折變化[19]。在缺乏形態(tài)變化的現(xiàn)代漢語中,很多詞語尤其是高頻使用的實(shí)詞,在組合中常常生出新義,語義范疇發(fā)生變化[20~21]。這種情況下對(duì)其詞性的標(biāo)注應(yīng)該怎樣處理為好?以語料庫為輔助工具,本文以現(xiàn)代漢語常用高頻詞“有”為例,對(duì)這類詞的詞性處理做了一個(gè)嘗試性探討,從我們的研究結(jié)果可以得出以下有關(guān)詞典編纂的啟示:第一,一些高頻使用的詞語常常因?yàn)槠涫褂梅秶鷱V而有許多不同的詞義和語法功能,我們不能根據(jù)其基本義將其詞性簡單地處理為單類詞,將其處理為兼類詞能更真實(shí)地反映詞語的實(shí)際用法。第二,“一個(gè)詞的意義就是它在語言中的使用。”[22]詞匯的意義并不是一成不變、僵化地存在著,隨著語言環(huán)境的改變,詞語的意義和功能都可能改變。因此,詞性標(biāo)注必須以“語法功能”為主。第三,漢語詞典編纂必須使用計(jì)算機(jī)語料庫,必須占有充分的語料,這樣才能保證釋義和詞性處理的準(zhǔn)確性。
本文以語料庫為研究工具,對(duì)現(xiàn)代漢語高頻使用的“有”的詞性進(jìn)行了深入調(diào)查,從而發(fā)現(xiàn)目前大中型漢語詞典在處理一些常用詞的詞性時(shí)存在簡單化的弊病,因此對(duì)“有”的詞性處理有失允當(dāng)。我們?cè)诶谜Z料庫占有充分的語言材料的基礎(chǔ)上,得出現(xiàn)代漢語的“有”是動(dòng)代助兼類詞。本文由此為詞典編纂得出啟示:詞性標(biāo)注應(yīng)以語法功能為主要標(biāo)準(zhǔn),而且詞性判斷不能單靠內(nèi)省,而應(yīng)依靠計(jì)算機(jī)語料庫占有充分的語言材料才能保證詞性處理的準(zhǔn)確性。
(衷心感謝四川外語學(xué)院王仁強(qiáng)教授的指導(dǎo)!)
[1]王仁強(qiáng).認(rèn)知視角的漢英詞典詞類標(biāo)注實(shí)證研究[M].上海:上海譯文出版社,2006.
[2]胡名揚(yáng).兼類問題[A].胡名揚(yáng).詞類問題考察[C].北京:北京語言文化大學(xué)出版社,1996.
[3]胡名揚(yáng).動(dòng)名兼類的計(jì)量考察[A].胡名揚(yáng).詞類問題考察[C].北京:北京語言文化大學(xué)出版社,1996.
[4]胡名揚(yáng).信息處理用現(xiàn)代漢語詞類的兼類問題[A].胡名揚(yáng).詞類問題考察續(xù)集[C].北京:北京語言大學(xué)出版社,2004.
[5]郭銳.語文詞典的詞性標(biāo)注問題[J].中國語文,1999,(1):150 ~158.
[6]郭銳.現(xiàn)代漢語詞類研究[M].北京:商務(wù)印書館,2002.
[7]蘇寶榮.詞語兼類的功能顯示與深層語義分析[J].語文研究,2005,(1):9 ~12.
[8]楊同用.詞的語法功能與語文辭書中兼類詞的詞性標(biāo)注[J].漢字文化,2010,(2):23 ~26.
[9]李爾鋼.兼類詞的義項(xiàng)設(shè)置和詞性標(biāo)注問題[J].辭書研究,2006,(3):14 ~24.
[10]王仁強(qiáng).基于語料庫的“生人”用法調(diào)查及其對(duì)漢語詞典編纂的啟示[J].四川外語學(xué)院學(xué)報(bào),2006,(5):94~99.
[11]王仁強(qiáng).語法隱喻與漢語詞典自指義項(xiàng)的設(shè)立——一項(xiàng)基于語料庫的研究[J].外國語文,2009,(2):100~108.
[12]Huston Susan.應(yīng)用語言學(xué)中的語料庫[M].馮志偉,譯.北京:世界圖書出版社,2006.D12.
[13]劉紅蕾.基于語料庫的雙語詞典編纂中的詞性標(biāo)注方法[J].華北工學(xué)院學(xué)報(bào)(社科版),2002,(3):63~65.
[14]宋玉柱.介詞“有”應(yīng)該肯定[J].漢語學(xué)習(xí),1987,(2):20~21.
[15]徐志敏.論介詞“有”[J].殷都學(xué)刊,2000,(1):102~105.
[16]王仁強(qiáng).現(xiàn)代漢語詞類體系效度研究[J].外語教學(xué)與研究,2010,42(5):380 ~386.
[17]呂叔湘.現(xiàn)代漢語八百詞[M].北京:商務(wù)印書館,1980/1998.390 ~391.
[18]Taylor J R.Linguistic Categorization-Prototypes in Linguistic Theory[M].Oxford:OUP,1989/1995.
[19]袁眉.語言起源研究綜述[J].重慶交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2009,9(5):96 ~100.
[20]符淮青.組合中語素和詞語義范疇的變化[J].江蘇大學(xué)學(xué)報(bào),2007,(1):70 ~74.
[21]符淮青.詞在組合中語義范疇的變化和詞性標(biāo)注[J].辭書研究,2010,(5):1 ~7.
[22]Wittgenstein L.Philosophical Investigations[M].Anscombe G E M(Trans).Basil Blackwell Ltd,1953/1958.
A Corpus-based Study of the Parts of Speech of YOU and Its Inspirations on Dictionary Compiling
PENG Zhi-bin
(Graduate School,Sichuan International Studies University,Chongqing 400031,China)
The parts of speech of the modern Chinese word“you”(to have),which is very widely used in modern Chinese,are regarded as verbs only by many main Chinese dictionaries,which is indefensible.Based on the corpus,a thorough research is done on its usage and there forms a conclusion that“you”can be verbs,pronouns and auxiliaries.Furthermore,some constructive suggestions are also presented for dictionary compiling.
“you”;concurrence;grammatical functions;corpus;dictionary compiling
H314.1
A
1674-0297(2011)04-0132-04
2011-04-11
彭志斌(1984-),男,四川營山人,四川外語學(xué)院碩士研究生,主要從事認(rèn)知語言學(xué)、語言哲學(xué)研究。
(責(zé)任編輯:張 璠)