王彩云
(中國人民大學文學院,北京 100872)
面向中文信息處理的狀動結構語義搭配
王彩云
(中國人民大學文學院,北京 100872)
以《現代漢語辭海》和《同義詞詞林》提供的材料為基礎,研究狀動結構的狀語與動詞之間的語義搭配規律,發現詞語的語義類別和狀動結構的搭配具有直接關系。即,動詞語義相同或相近,與之搭配的狀語語義相同或相近;動詞語義不同,與之搭配的狀語語義類別不同。狀動結構語義搭配研究為計算機對狀動結構的處理提供了語義方面的基礎。
狀動結構;語義類別;語義搭配;信息處理
現代漢語中,“動詞是一般句子里最重要的成分,以動詞為謂語或謂語中心詞的句子最多”[1]。因此,對信息處理來說,動詞為核心的句子研究能夠極大促進漢語信息處理的發展。事實亦如此,目前以動詞為核心的動詞組合框架研究已經有了很好的成果,為計算機處理漢語句子提供了良好的基礎。漢語句子不僅包括動詞的組合,還包括動詞組合框架內部、名詞組合框架內部各組成部分之間的關系,對它們進行研究對分析句子具有重大意義。目前對名詞短語內部偏詞與正詞之間的語義關系研究已取得不少成績,而對以動詞為核心的狀動結構研究則稍嫌不足。而如果對狀動內部的句法、語義特點沒有充分的認識和了解,則對整個動詞框架乃至整個句子的處理分析時會出現問題。所以,對狀動結構內部的搭配研究,即狀動結構內部的句法、語義研究,對計算機的漢語分析和處理來說是十分必要的。
狀動結構包括中心語和狀語,中心語可以是謂詞性的短語,也可以是謂詞,狀語可以是謂詞性的、名詞性的詞語,也可以是謂詞性的、名詞性的、介詞性的短語。本文以中心語是動詞、狀語是詞語的狀動結構為研究范圍。
考察以動詞為中心語的狀動結構里與中心語搭配的詞語的語義問題,即考察狀動結構中做中心語的動詞和做狀語的詞語的語義類別以及它們的語義類別與定中搭配的關系,從而為計算機對狀動結構的處理提供語義方面的基礎。
研究以《現代漢語辭海》提供的狀動搭配框架為狀動結構的判斷標準,以《同義詞詞林》提供的詞語語義類別為分類原則,借助《漢語水平詞匯與漢字等級大綱》和《現代漢語辭海》確定所選詞語的常用性,并從中確定 285個常用動詞。
《現代漢語辭海》[2](以下稱《辭海》)是中國人民大學語言文字研究所多年進行漢語詞語搭配研究成果的一個集成,該書詳細描寫漢語詞語的搭配面貌,對現代漢語中的常用詞、常用字的常用義的使用進行了盡可能充分的描寫。其中,以動詞為核心的狀中短語的搭配框架主要內容如下:
動詞 p inyin<動 >釋義。
〔在前〕
①并列:(~+動)
②主謂:(~+動)(~+形)
③動賓:(~+名)(~+動)(~+形)(~+數量)
④補充:(~+動)(~+形)(~+趨)(~+數量) (~+介賓)
⑤定中:(~+名)(~+動)(~+形)
⑥狀中:(~+動)(~+形)
⑦其他
〔在后〕
①并列:(動 +~)
②主謂:(動 +~)(名 +~)(形 +~)
③動賓:(動 +~)
④補充:(動 +~)(形 +~)
⑤定中:(名 +~)(動 +~)(形 +~)(數量 +~) (時間 +~)(處所 +~)(介賓 +~)
⑥狀中:(名 +~)
這些框架中,〔在后〕狀中這一框架為我們提供了動詞做中心語、前面帶有狀語,即狀動結構的搭配材料。
《同義詞詞林》[3](以下稱《詞林》)所收詞語全部按詞義分類進行編排,一組同義詞編為一個詞群,是目前為止對漢語詞語進行語義分類的著作中比較好的一部書,中文信息處理多以此書作為對漢語進行分類的依據。
《漢語水平詞匯與漢字等級大綱》[4]是以詞頻統計為依據,兼顧專家干預而制定的對外漢語詞匯教學的指導文件,它所收錄基本上為高頻詞,基本上反映了漢語基本的詞匯面貌和使用頻率。
本文旨在研究動詞和狀語搭配的語義問題,搭配是指語義上的搭配,因此不涉及句法形式,也不涉及詞語搭配中的語用問題。由于《辭海》中給出的關于狀動結構的框架組合并不全面,只要符合狀動結構的狀語都需要討論;“數量 +~”和“介賓 +~”中的數量短語和介詞短語本是短語與動詞的組合,但可以反映動詞對動量以及處所、時間等詞語的選擇,所以將此列入討論范圍。
1.檢索動詞
從《辭海》里檢索出詞性是動詞的詞條。例如:
打 da 2.<動 >用手或器具撞擊物體。
歌唱 gechang<動 >1.唱歌。
詞條中,<動 >表示該詞條的詞性是動詞。數字“1、2”是義項號。
2.檢索搭配釋例
從動詞詞條中檢索出動詞做中心語的狀動搭配的釋例,即“〔在后〕狀中”這一框架提供的動詞做中心語、前面帶有狀語的狀動結構的搭配材料。以上詞條的搭配釋例如下:
打 da 2.<動 >用手或器具撞擊物體。
(動 +~)拼命~使勁兒~不停地~;(形 +~)慢慢~快~早~飛快地~認真地~緊張地~高興地~;(數量 +~)一下下兒地~一個個地~多次~;(能愿 +~)可以~能~會~想~應該~該~愿意~;(副 +~)盡量~正在~已經~又~親自~;(時間 +~)天天~現在~;(介賓 +~)按鼓點兒~把玻璃~替鼓手~
歌唱 gechang<動 >1.唱歌。
(動 +~)放聲~齊聲~縱聲~引吭~;(形 +~)歡快地~盡情地~熱情地~快樂地~愉快地~幸福地~自由地~優美地~;(能愿 +~)會~要~必須~應該~應當~愿意~肯~可以~能~;(副 +~)一齊~一同~一直~時常~;(時間 +~)現在~今天~
這些是以動詞詞條“打2、歌唱1”為中心語的搭配釋例。其中,(形 +~)、(副 +~)、(能愿 +~)、(時間 +~)、(介賓 +~)等是形容詞、副詞、能愿動詞、時間詞語、介賓短語等作為狀語與中心語搭配,~代表詞條。
3.檢索搭配詞語
從 2的結果中檢索出搭配詞語。
與動詞“打、歌唱”搭配的詞語的有:
打 da 2.<動 >用手或器具撞擊物體。
(動)拼命使勁兒不停地;(形)慢慢快早飛快地認真地緊張地高興地;(數量)一下下兒地一個個地多次; (能愿)可以能會想應該該愿意;(副)盡量正在已經又親自;(時間)天天現在;(介賓)按鼓點兒 把玻璃 替鼓手
歌唱 gechang<動 >1.唱歌。
(動)放聲齊聲縱聲引吭;(形)歡快地盡情地熱情地快樂地愉快地幸福地自由地優美地;(能愿)會要必須應該應當愿意肯可以能;(副)一齊一同一直時常; (時間)現在今天
以上詞語分別是從《辭海》中檢索出來的與動詞“打、歌唱”搭配的詞語,對照 2可知,動詞“拼命”可以與動詞“打”搭配成“拼命地打”。
4.確定狀語的語義類別
在 3的基礎上,從《詞林》的數據中檢索出與中心語動詞搭配的狀語的語義類別,并把各詞語轉化為相應的語義類別。檢索、轉化結果如下:
Fa01打 da 2.<動 >用手或器具撞擊物體。
(動)Ka19 Ka19 Ka11;(形)Ka08 Ka08 Eb22 Eb23 Ee27 Ed39 Ga01(數量)一下下兒 一個個 Ka10;(能愿) Gc02 Gc02 Gc02 GC01 GC03 GC03 Gc01;(副)Ka19 Ka12 Ka12 Ka14親自;(時間)Ka11 Ca10;(介賓)按鼓點兒把玻璃替鼓手
Hh04歌唱 gechang<動 >1.唱歌。
(動)放聲齊聲縱聲引吭;(形)Ga01 Ka19 Ee33 Ga01 Ga01 Ef09 Ka09 Eb30;(能愿)Gc03 Gc02 Gc03 Gc03 Gc03 Gc01 Gc01 Gc02 Gc02;(副)Ka23 Ka23 Ka11 Ka10;(時間) Ca10 Ca23
“Ka19、Eb22”這樣的串是詞語在《詞林》中的語義類別符號,分別是第 K、E大類中的第 a、b小類的第 19、22子類。動詞詞條前這樣的串是該動詞在《詞林》中的語義類別符號,如“打”前的“Fa01”是第 F大類中的第 a小類下的第 01子類。有些詞語,如“放聲”,以及介賓短語,如“按鼓點兒”等在《詞林》中沒有相應的語義類別,因此沒有語義類別符號。與中心語動詞搭配的詞語相對應的是這些詞語在《詞林》中的語義類別符號,如動詞“打”詞條中,“Ka19”與“拼命”相對應,意思是與“打”搭配成“拼命地打”的“拼命”這個詞語的語義類別是“Ka19”。
5.分析搭配特點
分析與中心語動詞搭配的各詞語的類別,考察和歸納出各動詞做狀動結構的中心語時搭配上的特點,探討狀動結構中狀語與動詞的搭配規律。
1.研究得到的數據
(1)狀動結構中中心語動詞的列表 (如 (一)1),狀、動搭配列表(如(一)2)以及狀語列表(如(一)3)。
(2)動詞做狀動結構的中心語時搭配詞語的語義類別表(如(一)4)。
(3)狀動結構中與動詞搭配的詞語語義類別表。列出285個動詞詞條中搭配的語義類別及各類中的詞語,部分內容如下。
Ca05:平時、空閑、空當兒、課余、平常、平日、平生、空閑、間隙、茶余飯后、業余、素日等。
Ee12:果斷、堅決、毅然、決然、斷然、大刀闊斧、干脆利落、堅強、頑強、剛毅、百折不撓、堅貞不屈、堅定、堅韌、堅貞、堅忍不拔、堅定不移、軟弱、懦弱等。
Gc03:應該、應當、該、當、會當、理當、會須、理應、應、必須、務須、務必、須要、須、要、得、必得、非得、總得、無須、不必等。
Ka20:特意、特地、特別、專門、專誠、專程、故意、有意、成心、存心、有心、有意識、順便、順手、順帶、捎帶、隨口、順口、信手、趁手、順路、順腳、順帶、隨身、不自覺、不知不覺、無意等。
(4)狀動結構中做狀語的詞語的語義類別列表,部分內容如下。
Ca03;Ca04;Ca05;Ca06;Ca07;Ca08;Ca09;Ca10;Ca11; Ca12;Ca13;Ca14;Ca15;Ca16;Ca17;Ca18;Ca19;Ca20; Ca21;Ca22;Ca23;Ca24;Cb06;Cb07;Cb08;Cb09;Cb10; Cb11;Cb12;Cb06;Cb13;Cb14;Cb15;Cb16;Dd01;Dd04; Dd05;Dd06;Dd07;Dd08;Dd09;Dd10;Dd11;Dd12;Dd13; Eb01;Eb02;Eb03;Eb07;Eb08;Eb09;Eb10;Eb11;Eb12; Eb13;Eb14;Eb15;Ed01;Ed02;Ed03;Ed04;Ed05;Ed06; Ed07;Ed08;Ee01;Ee02;Ee03;Ee04;Ee05;Ee06;Ee07; Ee08;Ee09;Ef04;Ef05;Ef06;Ef07;Ef11;Ga01;Ga02;Ga03; Ga04;Gb01;Gb02;Gb03;Gb04;Gb05;Gc01;Gc02;Gc03; Gc04;Ka01;Ka02;Ka03;Ka04;Ka05;Ka06;Ka07;Ka08; Ka09;Ka10等等。
2.對所得結果的分析
對與動詞“照顧、照料、愛好、愛惜、打點、打動”搭配的狀語進行語義歸類,得到如下結果:
H i37照顧 zhaogu 3.〈動〉照料。
(動)Ka11 Ka03 Ka24;(形)Eb01 Ka08 Ka09 Ka19 Eb24 Ed07 Ed12 Ed24 Ed49 Eb23 Eb23 Ed11 Ed37 Ee30 Ee23 Ee33 Ee33 Ga01 Ed04 Ka25 Ed04 Ed28;(能愿)Gc02 Gc02 Gc03 Gc01 Gc01 Gc03 Gc03 Gc02;(副)Ka01 Ka03 Ka05 Ka15 Gc03 Ka12 Ka10 Ka08 Ed44 Ka10;(時間)Ca28 Ca28 Ca29;(處所)Cb09 Cb09 Cb09;(介賓)對同事在醫院由醫生被朋友從最早到晚
H i37照料 zhao liao<動 >關心料理;照顧。
(動)Ka03 Ka03 Ka11;(形)多多 Ka08 Eb24 Ka19 Ed07 Ed12 If04 Ed11 Ed49 Ed11 Ee27 Ee23 Ee17 Ee28 Eb23 Ed01 Ed49 Eb07 Ed28 Dd05;(能愿)Gc02 Gc02 Gc03 Gc01 Gc01 Gc03 Gc03 Gc02 Gc02;(副)Ka01 Ka18 Ka12 Eb24 Ka10 Ka16只顧 Ka10 Ka10 Ka23;(時)Ca28 Ca29;(處所) Cb09 Cb09;(介賓)在醫院到宿舍按規定替丈夫被護士
Gb09愛好 aihao〈動〉對某種事物有濃厚的興趣;喜愛。
(形)深深 Ed38 Eb24 Ka08 Ka01 Eb24 Ka30;(能愿) Gc03 Gc02 Gc02 Gc02;(副)Ka01 Ka01 Ka04 Ka05 Ka30 Ka32 Ka10 Ka28 Ka11 Ka07 Ka02 Ka04 Ka18;(時)Ca11 Ca10 Ca29 Ca28;(介賓)從心里比我們更打心底
Gb17愛惜 aixi〈動〉因為重視而愛護、珍惜,不糟蹋。
(形)Ee27 Ka19 Ka01 Ih05 Ed14 Ka01 Ka30;(能愿) Gc03 Gc03 Gc03 Gc01(副)Ka01 Ka04 Ka18 Ka01;(時) Ca11 Ca10 Ca11;(介賓)比以前
Je02打點 dadian 2<動 >收拾、準備。
(形)Ka08 Eb22 Ka08 Ee28 Ee28 Ef06 Ed9;(能愿) Gc02 Gc02 Gc03 Gc03 Gc03 Gc01;(副)Ka15 Ka12 Ka11 Ka06;(時間)昨晚 Ca10;(處所)Cb05箱子里;(介賓)按要求替爸爸
Je02打動 dadong<動 >使人感動。
(形)Ed15 Ka01 Ka30 Ka30 Jc07 Eb07 Ed46;(能愿) Gc02 Gc02 Gc02 Gc01 Gc03;(副)Ka19 Ka29 Ka15 Ka12 Ka30 Ka07;(時間)Ca11;(介賓)把觀眾讓這句話
對以“照顧、照料、愛好、愛惜、打點、打動”為中心語的狀動結構語義搭配進行分析,狀動結構的中心語與狀語的語義搭配具有一定的規律。
(1)時間、空間、能愿類狀語幾乎可以與任何語義類動詞搭配。從客觀角度看,任何動作或關系的產生與過程都在一定的時間和空間維度內進行;從主觀情態看,人可以對動作或關系的產生或過程等方面做出主觀推斷。所以,時間、空間、能愿類狀語可以與任何動詞搭配。
(2)動詞語義類別相同,與它們搭配的狀語的語義類別相同。例如動詞“照顧、照料”的語義類別相同,同屬于H i37(活動 -社交),Ka11、Ka03、Ka24、Ka03、Ka03、Ka11等語義類別的狀語都可以與這兩個動詞搭配。即使有些語義類別沒有同時出現在與兩個動詞搭的語義列表中,卻仍然可以與它們搭配,如 Ka24(輪流)類出現在與“照顧”搭配的語義類列表中,沒有出現在“照料”的搭配列表中, Ka24仍然可以與“照料”搭配,組成狀動結構“輪流照料”。
(3)動詞語義類別相近,與它們搭配的狀語的語義類別則同中有異、大同小異。例如對動詞“愛好、愛惜”而言,它們共同屬于大的語義類別 Gb,卻不屬于同一次類,“愛好”是 Gb09,“愛惜”是 Gb17。因此,與“愛好、愛惜”搭配的語義類別多數相同,如 Ed、Ka、Gc類都可以與之搭配;而與“愛惜”搭配的 Ib(生理現象)、Ee(德才)語義類卻很少與“愛好”搭配,語義大同小異的動詞,與之搭配的語義類別也大同小異。原因就在于動詞語義類別的差異,動詞“愛惜”不僅包含“愛好”的語義特征,還有“珍惜”的語義特征,所以與“愛好”搭配的語義類可以與“愛惜”搭配,反之則不然。
(4)動詞語義類別迥異,與它們搭配的狀語的語義類別大不同。動詞“打點、打動”所屬的語義大類不同,“打點”屬于 H j35(活動 -生活),“打動”屬于 Je02(關聯 -影響)。與“打點”搭配的語義類別包括 Ee28 Ef06 Ed39等,這些語義類不能與“打動”搭配,同樣,與“打動”搭配的語義類別 Ed15 Eb07 Ed46等也不能與“打點”搭配。動詞的語義類別不同使得與之搭配的狀語的語義類別存在較大不同。
詞語的語義類別和狀動結構中的搭配具有直接的關系。時間、處所、能愿等語義類別都可以與動詞搭配;語義類別相同或相近的動詞,與之搭配的詞語的語義類別也會相同或相近;語義類別迥異的動詞,與之搭配的詞語的語義類別也會不同。詞語的語義類別和狀動結構中的搭配不僅能夠描寫出一個動詞作為狀動結構的中心語時可以受哪些詞語修飾,更能反映狀動結構的搭配的趨勢。能夠描寫的搭配畢竟是有限的,可能出現的搭配是無限的,在動詞詞庫中說明詞語的搭配趨勢就能以簡馭繁,以有限應對無限,這無疑對計算機處理語言信息有重大意義。
[1] 胡裕樹,范曉.動詞研究 [M].鄭州:河南大學出版社,1995:1.
[2] 張衛國,冀小軍.現代漢語辭海[M].北京:中國人民大學出版社,1994:10.
[3] 梅家駒.同義詞詞林[M].上海:辭書出版社,1983:1 -354.
[4] 國家漢語水平考試委員會辦公室考試中心.漢語水平詞匯與漢字等級大綱 [M].北京:經濟科學出版社,2001.
2010-10-15
王彩云(1981—),女,博士研究生,研究方向:句法語義學。
H 08
A
1007-7111(2010)11-0066-04
(責任編輯 魏艷君)