□李祿興
?
談對外漢語詞典被釋詞的搭配原則——以“交流”為例
□李祿興
摘要:在對外漢語詞典編纂過程中,語料庫的運用顯得日益重要。一部好的詞典應該充分利用語料庫,注重體現被釋詞的常規搭配和高頻搭配,注重常用搭配的分布和語法搭配的框架等。“名詞+交流”和“交流+名詞”的結構占了“交流”搭配的60%左右。因此,在對外漢語詞典編纂中應該大幅增加這兩類搭配的舉例,并且描繪和提供常用高頻搭配下的實際例句,以提高非母語學習者的語感,增強其學習效果。
關鍵詞:對外漢語詞典詞語搭配語料庫
在語言研究中,語料庫是一個由大量的真實語言信息組成,專供語言研究、分析和描述的語言資料庫。當今我們談及詞典編纂的語料庫時,一般都指電子語料庫。這種語料庫一般由大量不同來源的詞語、句子、段落等組成,而這些材料又都是通過詞語切分、屬性標注等方式存入語料庫的。研究者利用計算機可以從數百萬、千萬乃至上億字的語料中調出某個詞、短語或者句子的實例。所以,使用語料庫可以快速針對某一個詞匯搜索出海量的句子,這些句子涉及面廣、內容真實、題材多樣、表達自然,如能恰當使用,應該能滿足對外漢語詞典編纂對于例句的需求。語料庫技術在對外漢語詞典編寫中的地位和作用越來越突出,可以說今天的詞典編纂工作在某種程度上已經離不開語料庫了。隨著語料庫規模的擴大、類別的增多以及功能的日益完善,可以為對外漢語詞典編纂提供的素材和參考內容越來越豐富。很難想象如果詞典編纂者還像過去那樣靠主觀語感、人為造句來編寫詞典,其科學性、實用性、適用性、準確性等如何得到保證。語料庫技術的應用早在上世紀七八十年代已有相關研究,而利用語料庫編纂對外漢語詞典的研究則是近些年的事情。靳光瑾[1]、鄭艷群和劉亞非[2]、郭曙倫[3]、季瑾[4]等都提出了語料庫技術在對外漢語詞典編寫中的一些應用設計和設想,并在這方面進行了有益的探索。
一部詞典包含三個最重要的構成因素,它們分別是被釋詞、釋義與例句。其中被釋詞是一部詞典的基礎和核心,任何一部詞典都要選定其收詞范圍、收詞條目。也就是說,哪些詞語可以作為被釋詞;釋義則是一部詞典的靈魂,茲古斯塔[5]認為“詞義是詞典編纂者所關注的中心問題”,但如何在詞典中恰當地解釋出或者體現出詞義,則是考驗詞典編纂者學識、經驗、技巧以及編寫態度的重要方面;例句則是詞典的“血肉”。Sidney I.Landau[6]說:“例證可以傳達有關搭配、使用變體(正式程度、詼諧語體或莊重語體等)、內涵意義、語法(某一動詞是否帶間接賓語等),當然還有指稱意義等各方面的大量信息。通常沒有比采用例證更好的辦法來揭示這些信息的了。”黃建華、陳楚祥[7]指出“例證不僅可以補充說明詞的意義,使其具體化,而且可以說明它的用法,包括它的語法特點、搭配范圍、修辭色彩等”。對于對外漢語詞典來說,例句設置就更應該注意其科學性和實用性,要從學習者的角度著手,按照第二語言習得的基本規律,體現學習者的學習梯度。它不可能是隨意的,也不可能是隨機的。如何才能保證被釋詞的搭配不隨意也不隨機呢?語料庫的原則是唯一的、根本的途徑,是詞典設例的一個重要原則,也是保證詞典科學性的一個重要方法。一個好的語料庫,能提供語言使用的有力證據,并能夠提供更多關于詞語意義和用法的可靠信息。靳光瑾[1]說:“語料庫是真實語言文字的集合,基于語料庫的辭書編纂更強調辭書內容、釋義、例證的真實性,拉近辭書內容與用戶的距離,使得辭書編纂更貼近用戶的需要。另外,語料庫可以提供情景、語用等豐富信息,以此為出發點可以構建基于情景語義的新模式的辭書。”應用語料庫的方法,我們可以統計語料庫中被釋詞的使用情況,按照實際語言環境中,被釋詞語法搭配關系頻度的高低對它們進行排序,然后將結果作為配例的依據。
由于漢語是非形態或少形態的語言,所以詞類問題以及詞與詞的搭配關系顯得非常重要。一般語法書上或者教材里處理詞匯的時候,只是指明該詞為某類詞,然后說明這類詞的語法特征。例如:先指出“交流”為動詞,然后舉出[主+交流]、[交流+賓語]、[動+交流]、[交流+補]幾種類型[9],每種類型下面舉出若干短語例子,然而,一般對外漢語詞典處理得還沒有教材或者語法書詳細。指出這些類型的特征一方面可以讓學生掌握部分信息,另一方面還不是非常確切,或者離學生掌握該詞還相差很遠。因為框架內的詞語是有選擇性的,而不是泛泛的。以“主語+交流”的框架為例,什么樣的主語,表人的還是表物的,施事還是受事,對主語的詞性有無要求等條件,都會限制學生無法根據這樣的框架造出正確的短語和句子。在語言組合式、運動式過程中,詞與詞的搭配是有條件的,也是有規律的,“可以說,詞是一種磁性體,在運動中,只同相吸的詞語搭配而同另一些詞相排斥”[8]。“交流+賓語”的結構中,對賓語的要求是有定的,不是所有的名詞都可以充當“交流”的賓語。留學生常常造出“我們交流了禮物”“交流一下位置”這樣的誤句。搭配關系既與詞性有關,也與詞義有關,如果不了解搭配的意義關系就會產生搭配不當的錯誤。由此可見,被釋詞搭配以語料庫為基礎,體現搭配的對象、頻率、類型等對學生是大有裨益的。
常規搭配指詞語的搭配比例較高、很多人使用的規范用法,非常規搭配指臨時借用或者誤用、搭配比例較低的非規范性用法。由于語料庫中收集的語料都是原始語料,基本沒有進行規范化加工、糾錯等,因此難免收錄一些非常規搭配。對外漢語詞典編纂在使用被釋詞的時候,應該注意避免這種非常規的搭配。我們基于北京大學中國語言學研究中心CLL語料庫(4.77億字)、北京語言大學《現代漢語研究語料庫》(200萬字精語料)、北京大學計算機語言學研究所《人民日報》語料庫(2700萬字)、現代漢語語料庫(1億字)等,對“交流”的搭配作了一個統計。

表1:
從上面的統計可以看出,常規搭配的數量占絕大多數,但仍有少量的非常規搭配。在非常規搭配中,“交流銳減”“交流下滑”等應為“交流量銳減”“交流量下滑”,“拓寬交流”顯然是缺少了某個成分,如“拓寬交流渠道”等。在對外漢語詞典編纂中,即使到了高級階段,仍應該盡量去除這些非常規搭配而選用常規搭配,最大限度地保持漢語規范化的表述方式。
通過語料庫不僅可以獲知被釋詞的搭配對象,而且可以獲知其搭配對象出現的頻率。以往編寫對外漢語詞典的時候,編者通常根據語感來判斷被釋詞語法搭配的常見度,但缺乏一定的科學驗證方法。有時候為了照顧詞語搭配的全面性,每個詞語的搭配只出現一次,而沒有體現其高頻搭配的特征。高頻搭配是留學生運用漢語的關鍵,教師講解生詞的時候往往讓學生造句,而學生經常完全根據詞義造出一些錯誤的句子。如果能夠運用語料中50%以上的搭配規則和搭配對象,就能保證學生造出來的句子至少不會在搭配上出現錯誤。例如:
(1)*反而不同性格的人在一起,他們不但可以互相~不同的性格,更可以明白到之間的好處,更可以提高自身的素質。
(2)*在城市里,生活條件好,交通也比較方便,至于跟別人的~也相當豐富。
上面兩個例句中,“交流”的搭配就出現了問題,“交流性格”“交流豐富”這樣的搭配在語料庫中沒有出現,在漢語的句子中也就不能隨意使用。為了讓學生通過詞典了解被釋詞的用法,詞典例句在某種搭配上可以體現高頻的特征。我們以李曉琪《漢語常用詞用法詞典》(P333)為例,來看“交流”在例句中的搭配:
(3)~學習體會/會上,大家~了經驗/可以把多余的物資拿出來,互相~一下兒/會議還沒有開始,代表們就~其各自的情況了。
例(3)中用到了三個述賓結構:“交流體會”“交流經驗”“交流情況”,占75%,這符合高頻搭配高頻出現的原則。漢語學習者可以通過這樣的動賓搭配很好地體會其所帶賓語的特征。如果教師輔以合理的補充,告訴學生“交流”是動詞,常常帶賓語,根據這個特點學生就會通過其所學語法知識,轉化成其他語法形式的正確搭配。例如:可以說“經驗交流”“思想交流”“情況交流”等主謂結構的短語,也可以說“思想的交流”“經驗的交流”“情況的交流”等定中結構的短語。如果搭配正確,很多語法格式也就會正確,再運用到句子中就會寫出符合漢語語法的句子。
再以李憶民《現代漢語常用詞用法詞典》為例(P610),在“交流”詞條下給出的例子則全部是“述賓搭配”。
(4)會上,代表們~了交通管理的經驗。/他倆互相~著學習心得。/在一起工作三年了,他們從沒~過思想。/我們雖然是同行,卻難得在一起~~各自的研究成果。
根據上述圖表的統計,“交流”帶名詞性賓語的使用頻率最高,因此,上述例句搭配的都是名詞,也完全符合高頻搭配高頻出現的特征。加上其重疊使用的“互相交流”“從沒交流”“難得交流”等結構,覆蓋了“交流”結構頻率的50%左右。
有些詞的搭配基本是固定的,或者某個被釋詞對應某個搭配詞的比例高達90%以上,這時候就基本可以忽略其他搭配方式,而把90%的搭配規律充分體現在詞典中。如“不爭”在語料庫中出現“不爭的事實”的頻率是94%,而“不爭的道理”“不爭的常識”加起來不超過6%。“不堪設想”與“后果”搭配比例也高達92%,所以例句中的搭配可以基本上以此類配為主。當然,“后果”的位置和功能可以有所不同,可以作主語、中心語等。
語料庫為我們提供了充分的搭配語料,使我們可以窮盡式地分析某個詞到底可以搭配多少詞匯,從而全面掌握該詞的搭配數量與搭配特點。對外漢語詞典編纂者不必再搜腸刮肚地想某個詞的用法,而完全可以根據語料庫提供的數據進行篩選,其中一個重要原則是應體現常用搭配的豐富性和多樣性。
高頻搭配能保證被釋詞的常規用法,學習者當場或當堂造句是最實用和有效的手段。但是造句只是一種機械式的學習方法和學習手段,在實際語言應用中,會出現各種各樣的場景和交際環境,當學習者一時找不到準確的詞匯時,就可能會創造性地使用某個詞語,從而造成搭配上的錯誤。所以在可能的情況下,對外漢語詞典應該提供充足的搭配,以保障詞典受眾和使用者對被釋詞有較為全面的掌握和了解。仍以“交流”為例,看看《HSK漢語水平考試詞典》(P326)中的例句。
(5)大家常常在一起~經驗|兩省決定定期~物資與人才。
對于有70多個搭配組合的“交流”來說,顯然例(5)所提供的搭配范圍是遠遠不夠的,學習者很難通過這兩個搭配舉一反三,從而掌握該詞較為全面的用法。相比而言,徐玉敏《當代漢語學習詞典》的處理就要好很多。該詞典(P442)在“交流”條下列舉了除“釋義句”外的6個句子,分別涉及到的搭配有“交流體會”“互相交流”“交流了一下兒”“交流研究成果”“交流思想”“政治、經濟、文化交流”“希望交流”“進行交流”“正在交流”“交流看法”等10種用法,基本涵蓋了交流的各種搭配,同時又體現了“高頻搭配高頻出現”的基本原則。通過查閱和通讀這些句子,可以領會該詞比較全面的用法,結合例句中的語境,學習者的習得效率就會大大提高。
體現常用搭配并不是說要把所有的搭配面面俱到地列舉出來,畢竟詞典受到規模、詞匯量、篇幅等諸多因素的限制,不可能將每種搭配都體現得那么充分,若體現其70%~80%的搭配格式和搭配對象,則是比較合適的比例。此外,根據詞典等級的不同,也可以有不同的取舍。
被釋詞的搭配不僅體現在詞語搭配上,廣義的搭配還包括語法成分的搭配、語用成分的搭配等。詞語搭配保證的是短語類型不會出現錯誤,而語法搭配則能保證句子符合語法,同時也意味著表達手段更加豐富。很多詞典注重詞語的搭配,列舉了不少的短語類型,但學生還是出現各種類型的錯誤。因為短語仍然是備用的語言材料,就像一堆半成品的食材或者建筑材料,等待廚師或者建筑師去合理調配。仍以“交流”為例,其語法搭配包括是否帶“了、著、過”等動態助詞,是否可以“重疊”、是否可以帶謂詞性賓語、前后成分經常包含哪些等。如果結合詞語搭配把語法搭配也體現出來,則會帶給使用者更加高效的查讀效果。當然,這種語法搭配不是靠說明性的文字,而是隱含在例句結構中的一種潛在構思。再以“害怕”為例,語料庫中“害怕”的名詞性賓語非常多,理論上說是很難窮盡的,某個人所害怕的東西、動物、現象等很難一一列舉出來,但“害怕”不僅可以帶名詞性賓語,還可以帶謂詞性賓語和小句賓語。《新HSK5000詞分級詞典(一~三級)》(P252-253)中的例子如下。
(6)他害怕一個人在家/打雷的時候她很害怕。/我害怕考試,一考試就緊張/他做錯了事,害怕被老師批評/他害怕極了,連看都不敢看/你越害怕困難,困難就越多。
例(6)中,被釋詞出現的語法功能搭配框架與語料庫中的搭配是基本一致的,語法功能的搭配基本涵蓋了被釋詞的日常用法(因該級別不涉及離合詞問題,所以沒有出現離合用法),對初級(預備級)水平的漢語學習者來說已經足夠了。被釋詞的語法搭配也并不是越多越好,而應該體現其常用的原則。再以《HSK漢語水平考試詞典》中的名詞“盆”為例。
(7)盆景|盆栽|便盆|骨盆|火盆|腳盆|瓦盆|澡盆|聚寶盆|傾盆大雨|花盆里載著一棵五針松|倒一盆水,洗洗臉。
暫且不論作為語素構成的上面這些詞語的語義留學生是否能夠理解,其語料庫統計中最常用的幾個搭配并沒有出現在詞典中,例如“(洗)臉盆”“飯盆”,盡管這兩個詞可以看作短語,但至少應該體現在句子中。此外,“盆”作為名詞時,其所使用的量詞搭配在語料庫中出現的頻率也相當高。“一個盆、一個……盆”3種語料庫中共出現了482次,而且也更生活化,對于詞義的理解是非常有幫助的,而詞典在這方面卻沒有體現。基于此,現在很多詞典編纂者開始使用“語法搭配框架”進行編寫,即在語料庫和語法特征的基礎上,進行對外漢語詞典的編寫,初稿寫成以后再抽去搭配框架,讓詞典呈現出一種自然的狀態。例如:
(8)交流:[動]互相把自己有的供給對方:[帶賓語]他們~了學習漢語的經驗︱~物資︱~技術︱~人才︱[重疊]~~思想感情‖[作謂語]雙方的情況都在會上~了︱[帶狀語]經常~︱廣泛~︱定期~‖[帶補語]在教學方面,兩校~過很多次︱~完︱~不了︱~一下兒‖[作定語]兩地~的方式很多︱~的內容︱~的方面︱~的愿望‖[前面加動詞]兩國之間要進一步擴大~︱進行~︱開展~︱需要~[作主語]~比較頻繁︱~增多了︱~太少了‖[作定種結構中心語]近幾年兩國加強了文化~︱城鄉~︱學術~︱校際~。
這種搭配框架一方面來自被釋詞的語法特點,另一方面來自語料庫中的語料收集。通過這種結合語料搭配框架的描寫,盡量減少搭配遺漏,從而可以最大限度地體現被釋詞的功能和用法。
參考文獻:
[1]靳光瑾.基于語料庫的數字化辭書編纂平臺研制與應用[A].對外漢語學習詞典學國際研討會論文集(一)[C].香港城市大學出版社,2005:146.
[2]鄭艷群,劉亞非.語料庫技術在HSK量詞學習詞典編纂中的應用[A].鄭定歐,李祿興,蔡永強.對外漢語學習詞典學國際研討會論文集(二)[C].北京:中國社會科學出版社,2006:363.
[3]郭曙綸.語料庫技術在對外漢語學習詞典編纂中的應用與實踐[A].鄭定歐,李祿興,蔡永強.對外漢語學習詞典學國際研討會論文集(二)[C].北京:中國社會科學出版社,2006:353.
[4]季瑾.基于語料庫的商務漢語學習詞典的編寫設想[J].語言教學與研究,2007,(5).
[5][捷]拉迪斯拉夫·茲古斯塔.詞典學概論[M].北京:商務印書館,1983:21.
[6][美]Sidney I. Landau.詞典編纂的藝術與技巧[M].章宜華、夏立新譯.北京:商務印書館,2005:226.
[7]黃建華,陳楚祥.雙語詞典學導論[M].北京:商務印書館,1997:76.
[8]張壽康,林杏光.現代漢語實詞搭配詞典(序言)[Z].北京:商務印書館,1992:2.
(李祿興北京中國人民大學文學院100872)