焦子桓 艾紅娟
(西南大學文學院 重慶 400715)
“中型語文詞典可以分為內向型詞典和外向型詞典,內向型詞典是供母語為本族語學習者使用的詞典,外向型詞典是供母語為非本族語學習者使用的詞典。”[1]本文涉及的內向型漢語詞典有:《現代漢語詞典》(第7版)、《現代漢語規范詞典》(第3版)、《現代漢語學習詞典》;外向型漢語詞典有:《當代漢語詞典》、《現代漢語學習詞典》(孫全州版)、《商務館學漢語》;內向型英語詞典有:《牛津簡明英語詞典》(第10版)、《韋氏大學詞典》(第10版)、《柯林斯英語詞典》(第13版);外向型英語詞典有:《牛津高階英語詞典》(第9版)、《韋氏高階英語學習詞典》、《柯林斯高階英語學習詞典》(第9版)。
義項精細度是指語文詞典中多義詞義項劃分的粗疏與細密程度。本文以李仕春《漢英中型語文性詞典義項精細度對比研究》“中型語文性詞典義項精細度比較表”為參照對象[2],建立“漢英內外型詞典義項精細度比較表”,分別統計出100核心詞在漢英內外型詞典中的義項精細度,并分析造成漢英詞典義項精細度差別的原因。
《現代漢語詞典》是我國第一部真正意義上的現代語文詞典,主要是為推廣普通話,促進漢語規范化服務的,具有“共時性、簡明性、語文性和規范性”[3]的特點,該詞典初版于1978年,第7版于2016年出版。《現代漢語規范詞典》是一部以促進全面推廣語言文字規范標準為中心工作的詞典,該詞典初版于2004年,第3版于2014年出版。2010年出版的《現代漢語學習詞典》與通用型詞典功能不同,它是以指導學生學習應用漢語為主旨的,立足于實用,目前還沒有修訂版。100核心詞在以上三部詞典中的平均義項如下:
100核心詞在《現代漢語詞典》中共有549個義項,平均每個詞有5.49個。
100核心詞在《現代漢語規范詞典》中共有568個義項,平均每個詞有5.68個。
100核心詞在《現代漢語學習詞典》中共有590個義項,平均每個詞有5.9個。
上述三部內向型詞典編纂目的是不同的,這應在辭書文本中有所體現,但上述數據顯示它們的義項精細度非常接近。
從詞典微觀方面分析,我們發現上述三部詞典不但義項數量非常相近而且義項相似度也很高。究其原因在于:“經典辭書的影響力和權威性大,后出產品的智力投放很難超越積累多代人智慧的經典辭書。”[4]這就有可能造成了后起的辭書借鑒之前出現的優秀辭書。我們隨機選取了30個詞,將上述三部詞典相同詞目的釋義進行對比,發現《現代漢語學習詞典》《現代漢語規范詞典》與《現代漢語詞典》的釋義相似度都分別高達80%以上。這表明《現代漢語規范詞典》與《現代漢語學習詞典》的釋義在很大程度上借鑒了《現代漢語詞典》。
1995年出版的《現代漢語學習詞典》是我國較早一批的對外漢語學習詞典,收錄詞語約23000個,它最大的特色是將漢語語法歸納為幾十個句法模式,并配有詳細的說明,有學者稱其“填補了我國對外漢語學習詞典的空白”[5]。2005年出版的《當代漢語詞典》是一部為外國學習者編纂的初級漢語學習詞典,主要收錄《漢語水平詞匯與漢字等級大綱》中的甲、乙級詞。在體例上對詞不做釋義,而是通過示例使讀者理解詞義、掌握語法。《商務館學漢語》是2007年出版的新作,被譽為 “迄今為止我國第一部專門為具有中級漢語水平的外國人編的漢語語文詞典”[6]。這三部外向型詞典到目前為止尚無修訂版。100核心詞在以上三部詞典中的平均義項如下:
100核心詞在《現代漢語學習詞典》中共有456個義項,平均每個詞有4.56個。
100核心詞在《當代漢語詞典》中共有153個義項,平均每個詞有1.53個。
100核心詞在《商務館學漢語》中共有330個義項,平均每個詞有3.3個。
上述數據顯示,漢語外向型詞典中100核心詞義項收錄的非常少。這是因為漢語外向型詞典的義項通常是在漢語內向型詞典基礎上刪減而來的。以“壞”字為例,對比《商務館學漢語》《現代漢語學習詞典》和《現代漢語詞典》的釋義:
更多類似例子顯示,《商務館學漢語》《現代漢語學習詞典》等外向型詞典在很大程度上沿襲了《現代漢語詞典》相同詞目的釋義。正如章宜華所說:“《現代漢語詞典》作為內向型普通語言詞典,其釋義的科學性和規范性使之成為漢語辭書的典范,在學界和廣大用戶中最具權威性,而這種權威性在辭書編纂中產生了很強的‘藍本效應’,無論是漢語學習詞典、對外漢語詞典、還是漢外雙語詞典的編纂大多以《現代漢語詞典》為‘藍本’,不管它是否符合潛在用戶的實際需求。”[7]因為作為“藍本”的《現代漢語詞典》自初版以來義項幾乎沒有明顯增長,從而間接使得以它為“藍本”的其他詞典在義項收錄上也難以取得進展。
《牛津簡明英語詞典》初版于1911年,第12版于2011年出版。《韋氏大學詞典》初版于1898年,第11版于2003年出版。《柯林斯英語詞典》被稱為“英國詞典的里程碑”,因為它是第一部采用計算機數據庫編纂和排版的詞典。該詞典初版于1979年,第13版于2018年出版。100核心詞在以上三部詞典中的平均義項如下:
100核心詞在《牛津簡明英語詞典》中共有1284個義項,平均每個詞有12.84個。
100核心詞在《韋氏大學詞典》中共有2395個義項,平均每個詞有23.95個。
100核心詞在《柯林斯英語詞典》中共有1982個義項,平均每個詞有19.82個。
上述數據顯示,英語內向型詞典義項較多,均在10個以上,且數量相差較大。這主要是因為:一、內向型詞典面向母語用戶,需要“廣泛收錄消極型詞匯,義項的收錄要考慮用戶閱讀會涉及的語義范圍,因此它的義項一般要比積極型詞典多得多”[8]。二、各品牌詞典義項的分合有各自的認定標準,雖然會相互借鑒,但總體上都保持著自身的釋義特色,避免被其他詞典同化。
《牛津高階英語詞典》首開外向型詞典編纂先河,該詞典初版于1948年,第9版于2016年出版。《柯林斯高階英語學習詞典》被譽為“語料庫驅動的詞典編纂的最早習作”[9]。它的面世標志著外向型詞典開始了激烈的競爭。該詞典初版于1987年,第9版于2018年出版。100核心詞在以上三部詞典中的平均義項如下:
100核心詞在《牛津高階英語詞典》中共有1046個義項,平均每個詞有10.46個。
100核心詞在《韋氏高階英語學習詞典》中共有1308個義項,平均每個詞有13.08個。
100核心詞在《柯林斯高階英語學習詞典》中共有796個義項,平均每個詞有7.96個。
從上述數據可以看出,英語類詞典收錄的義項普遍較多,其中一個很重要的原因是英語詞典修訂者非常重視利用語料庫技術來發現新的義項。李仕春從歷時的角度統計了《牛津高階英語詞典》1-8版100核心詞的平均義項數量分別是:7.55、7.91、7.03、8.25、8.47、10.2、10.47、10.61個。發現《牛津高階英語詞典》從第4版開始義項數量有了明顯變化,到第6版時義項數量趨于穩定。從出版時間來看,第4版出版時處于20世紀80年代末,這個時期牛津大學出版社開始為詞典編纂建立大型語料庫,并將利用語料庫技術豐富和補充常用詞的義項作為修訂重點。到21世紀初,第6版出版之時,已經完成了利用語料庫技術豐富和補充常用詞義項的工作。
“與傳統憑借語感編纂的詞典相比,建立在語料庫技術基礎上的英語類中型語文詞典在多義詞義項的劃分方面更加細化、義項的收錄更加全面,在詞典編纂史上實現了里程碑式的跨越發展。”[10]應用語料庫編纂詞典的歷史可追溯到塞繆爾· 約翰遜編纂《英語詞典》時期,他利用前人在150年間收集的資料建立了第一個用于詞典編纂的大型手工語料庫[11]。200多年后,這種詞典編纂方法被《牛津英語詞典》沿用,來自世界各地的2000多名志愿者為《牛津英語詞典》的編纂貢獻了超過500萬張詞語卡片,主編默里甚至為整理將近2噸重的卡片專門搭建了“繕寫室”。上世紀50年代以后,隨著現代計算機技術的發展,使語料庫從手工收集轉向鍵盤輸入成為了可能。第一個具有代表性的百萬級計算機語料庫——布朗語料庫于1964年在布朗大學建立。 隨后,各大出版公司陸續建立了自己的詞典語料庫,例如柯林斯出版公司和伯明翰大學聯合開發的語料庫(The English Bank)已積累了超過64500萬詞次,內容涉及英、美、奧、加等國家的英語,取材覆蓋書刊雜志、電視廣播、日常交談等正式或非正式語體;麥克米倫出版公司依托含詞2億的“世界英語語料庫”(World English Corpus);朗文和牛津出版公司使用擁有1.17億詞匯的“英語國家語料庫”(British National Corpus),此外朗文公司還自建擁有3000萬詞匯的“朗文蘭開斯特語料庫”(Longman Lancaster Corpus)和擁有500萬詞匯的“朗文學習者語料庫”(Longman Learner’s Corpus);韋伯斯特出版公司依托超過1億語詞的引語數據庫。“這些語料庫以多元的語料題材、驚人的信息存量、超強的客訴能力、高超的反應技術、簡易的分檔歸類、便利的檢索引導、穩定的工作性能等為特征,從根本上顛覆了傳統的詞典編纂理念,使詞典編纂方式發生了革命性的轉變”[12]。因此,王宗炎指出:“現代新出的重要英語辭書,一般都有個龐大的語料庫做依據”[13]。
從上文的統計數據可以看出,英語內向型詞典的義項精細度約是漢語內向型詞典的3倍,英語外向型詞典的義項精細度也是漢語外向型詞典的3倍。出現這樣巨大差距的原因在于漢語詞典漏收了大量的義項。為此,李仕春先后撰寫了《語料庫視野下的現代漢語“綠”字義項分布研究》[14]《語料庫視野下的現代漢語“黃”字義項分布研究》[15]《語料庫視野下的現代漢語“狗”字義項分布研究》[16]等一系列論文,證明:“現代漢語中100核心詞和現代英語中對應的100核心詞的平均義項數目基本相當(也即漢英中型語文性詞典中100個對應核心詞的平均義項數目基本一致),出現差距的原因在于英語詞典編纂者在修訂詞典時有意識地注意運用語料庫技術豐富并補充常用詞的義項,而漢語詞典編纂者對此沒有意識。”

從詞典修訂的頻率來看,語料庫技術的應用在很大程度上縮短了詞典修訂周期。以《柯林斯高階英語學習詞典》為例,從它的英文名稱《Collins COBULD Advanced Learner’s English Dictionary》可以看出,這是一部基于語料庫生成的學習詞典,21世紀以來,《柯林斯高階英語學習詞典》以平均2.5年/周期的速度修訂,在激烈的詞典市場中占盡先機。相比之下,我國詞典市場顯得非常被動,本文分析的漢語類詞典,除了《現代漢語詞典》《現代漢語規范詞典》還在以穩定的步伐進行修訂外,其他詞典至今都沒有修訂版,這就意味著那些沒有信息更新的詞典很快會被市場淘汰掉。事實上,我國自上個世紀90年代起,就相繼建立了一批漢語語料庫,如國家語委的“現代漢語平衡語料庫”,北京大學的“CCL語料庫”和“BCC語料庫”,其中“BCC”語料庫已超過150億字符,語料涉及口語、書面語、科技、政治、經濟、法律、文學、報紙等多個領域,按張志毅先生“學習詞典必須以足量、平衡、針對的語料為前提。收10000條、20000條、30000條的初級、中階、高階學習詞典,其語料必須3億、6億、9億字符”[17]的說法,BCC語料庫已經能夠勝任國內任何足本語文詞典編纂的重任。然而遺憾的是,到目前為止,國內尚無一部真正基于漢語語料庫開發的漢語詞典。正是因為沒有對語料庫技術的足夠重視,導致我國的詞典編纂水平遠遠落后于發達國家。
通過漢英內外型詞典義項精細度的對比,可以說明基于語料庫編纂的英語詞典義項收錄更加全面,義項劃分更加細化,更具科學性。不僅如此,語料庫在詞典編纂中對義項描寫,使用頻率統計,語法信息描述等方面也具無可比擬的優越性。在英美等辭書強國,幾乎所有著名品牌的英語詞典都是基于語料庫技術編纂而成的,語料庫技術早已把詞典編纂推向了一個新的高度,事實證明建立語料庫已經是編纂當代原創性詞典的必要條件。然而,在我國這方面的技術還處于初級階段,利用語料庫技術編纂詞典還沒有引起詞典編纂者的足夠重視,真正符合詞典編纂標準的大型語料庫又屈指可數,這一現狀與辭書強國形成強烈的反差。把語料庫技術和詞典編纂結合起來成規模地、系統地研究現代漢語常用詞的義項分布規律問題,是一項待展開的、需要成千上萬人參與的重大基礎應用研究項目,它是一項非常宏大的工程。