摘 要 本文結合具體的編纂實踐,認為新詞語詞典編纂的創新之處主要在于:準確認識新詞語,把握好收詞原則;利用大規模語料庫進行詞典編纂;從多個方面著手開發,形成立體體系。
關鍵詞 新詞語 詞典編纂 漢語應用研究
近年來我們在國家社科規劃項目、山東省教育廳科研項目及上海辭書出版社的資助下,收錄了1978年以來的漢語新詞語4萬多個,開發了《現代漢語新詞語信息(電子)詞典》,并在此基礎上陸續編纂出版了《最新流行語小詞典》、《實用網絡用語手冊》、《新詞語大詞典》?!俺鮿摷瘸桑岣摺?,在取得這些成果的基礎上,我們想結合編纂實踐中的體會,談談新詞語詞典編纂的創新,就教于各位專家、同行。
一、準確認識新詞語,把握收詞原則
新詞語的界定涉及兩個方面:一是“新”;二是有沒有詞的資格,或者說是否成詞。
“新”是相對的。一是指時間的范疇;一是指詞語本身是不是新的。
從時間的范疇來說,“時限的劃定,可長可短,本無定制。但我們認為,大體應根據政治、經濟、文化發展的階段性為依歸,因為詞匯的變化受政治、經濟、文化的影響實在太大了。具體說來,描寫型和規范型新詞語詞典的收詞,大致以少則10年、多則20年為限;時限過長會失去新,時限過短又難以確定其新”[1]。為了保持詞語的新穎度,“大的多年本的詞典收集新詞新語以1978年以來的為宜”[2]。我們認為,規定一個時間段是必要的,因此,《新詞語大詞典》重點收錄1978—2000年出現的新詞語,兼收2001年、2002年的大部分新詞語。
從詞本身來講,如在詞形、詞義、用法三方面中任何一個方面有新的成分,它就是新詞。鑒定新詞的參照系,則是現代漢語常用詞匯的詞形、詞義和用法。常用詞匯的代表是《現代漢語詞典》的主體詞匯,即其正文收錄的詞語。這樣處理比較容易操作,但要注意兩個方面的問題:一是《現代漢語詞典》在不斷修訂,正文中也會收錄一些新詞。比如“運作”,最早的用例于1988年出現在《人民日報(海外版)》上,1996年版的《現代漢語詞典(修訂本)》收錄了。類似的詞算不算新詞?我們認為,因為它是1978年以后使用日廣的,應該算。二是一些“復活”的“死詞”(即歷史上曾有過,但有一段時間基本不用,現在又開始使用的詞)算不算新詞?對這個問題,學術界有不同的看法。有的先生認為這是古漢語的詞匯,應該收入古漢語詞典,收入新詞語詞典不倫不類,影響詞典質量。與之相反的觀點是“我們主張收,以利交際,但是說明情況,以示區別”[3]。我們認為,這些“復活”的“死詞”如果不是以引用為主要的出現形式,而是作為現代漢語詞匯普遍使用,就應該收,原因是:(1)新詞語詞典和《現代漢語詞典》合起來應該能夠反映現代漢語詞匯的基本面貌,這些復活的“死詞”既是現代漢語的詞匯,新詞語詞典就應該有所反映。(2)詞典的功能之一是提供查檢服務,如果現代漢語的詞匯在現代漢語詞典中查不到,要讓用戶到古漢語詞典中查現代漢語的詞,有些不可思議。
從有沒有“詞”的資格(即是不是“詞”)這方面來看,也涉及兩點:一是“詞”的界定;一是新詞的規范標準。
按照語言學界的一般看法,詞是“最小的能夠獨立運用的語言單位”。據此,大多數新詞可以被看作是詞,因為它們都可以滿足“獨立運用”這一條件。主要問題是從現代漢語規范化的角度看,它們合不合規范,能不能被看作現代漢語的規范詞語并收入詞典?以往在這方面的要求比較嚴格,甚至近乎苛刻。但隨著社會的發展,人們對新詞語的態度逐漸發生了變化,由原來比較謹慎甚至苛刻轉變為比較寬容。國家語委新詞語規范原則課題組提出的九大原則,與以往的規范原則相比,寬容度大了很多[4]。尤其對“生造詞”,“我們認為,從理論上說,新詞語就包括生造詞,生造詞實際上也是新詞語,是新詞語大家庭中的一個成員,只不過它是新詞語這個大家庭中一個不太健全的成員而已。它們在性質上是相同的,其間不存在對立關系”[5]。在社會、政治、經濟以及思想觀念快速發展變化的今天,人們對新詞語態度越來越寬容,也越來越愿意接納。正如許嘉璐先生指出的:“我們是在不規范的情況下搞規范,語言又在規范中發展”,“規范并不能阻止語言的發展演變和出現一些奇奇怪怪的語言現象,當然也就不能保證出現的新詞新語新說法人人都懂得。不進行規范當然不行,過分強調規范,希望純而又純也不行”。[6]
綜上所述,我們認為:漢語新詞語是指1978年以來通過各種途徑產生的,具有現代漢語常用詞匯所沒有的新形式、新意義或新用法的詞,具體包括新造詞語、有新用法的舊詞、由方言進入普通話的詞匯、外來詞、簡略詞、由修辭用法穩定下來而構成的新詞語、因意義泛化而改變了使用范圍的專業術語、字母詞、網絡用語[7]?!缎略~語大詞典》正是基于這一觀念確認并收錄新詞語的。
二、基于大規模語料庫的新詞語詞典編纂
李建國先生早在1996年就指出:“在研究的基礎上編纂辭書,就需要理論語言學界與計算語言學界互補互動,聯手合作,充分利用計算機儲存、處理語料,通過定時、定量、定性的分析,為詞典編纂提供科學的依據。我們相信,這樣編出的詞典,才具有時代特點,才有可能改變以往單憑心記口誦、耳聞目見編寫的狀況?!?sup>[8]近幾年《辭書研究》連續發表了多篇探討計算機輔助辭書編纂的文章,也代表了這一方向。我們認為,基于大規模語料庫進行編纂是新詞語詞典創新的重要途徑??紤]到新詞語的收錄既要全面又要規范,我們編寫《新詞語大詞典》時確定了在超大規模動態機讀語料庫的基礎上編纂新詞語詞典的原則。具體涉及的語料有:《人民日報》1978—2002年的語料,人民網所含《人民日報》報系12種報紙近年語料,人民網所含9個網站近年的語料,《讀者文摘》(后更名為《讀者》)創刊以來的語料,《南方周末》創刊以來的語料,《光明日報》、《中國教育報》、《南方日報》網上的語料。除了這些語料外,必要時還利用“搜狐”、“新浪”、“263”等網站提供的搜索引擎搜索網上的所有語料。這些語料時間跨度達25年,涉及各個方面,形成了一個超大規模的、比較規范的動態語料庫?!罢驗槔昧烁咝录夹g,才可能廣泛搜集語料并使語料變換聚合的形態,改變查找語料的方式,方便而準確地對語料進行對比分析,確定每個新詞語出現的語境,概括其含義和用法,選擇鮮活的例句”[9]。有了這樣的動態語料庫,新詞語詞典的編纂就可以做到:(1)既保證收詞全面又保證收詞規范;(2)廣泛考察詞語的用法,準確地標注詞性;(3)探求詞源,準確釋義;[10](4)科學選例。
巢峰先生指出:“在治學之中,常常因一詞之源,費盡周折?!掇o源》要求‘結合書證,重在溯源’;《漢語大詞典》要求‘古今兼收,源流并重’。可見語文辭書溯源的重要。”“詞源就是知識,而辭書就是知識的結晶。重視辭書的知識性,盡可能交代新詞語的出處,是編出出類拔萃的新詞語詞典的重要條件。”[11]在編寫《新詞語大詞典》時,我們盡量給出詞目的詞源學說明:對于外來詞和字母詞說明語源;對于方言詞語說明出自哪種方言;對專業術語說明原來指什么,進入普通詞匯后意義有什么變化;對有了新用法的舊詞盡量說明原來指什么,現在指什么,以揭示新舊之間的變化;對簡略詞語說明原詞語;對由修辭用法固定下來的詞語,說明所使用的修辭手法。對其他詞,若可明了其來源的也加以說明。比如對“過把癮就死”,在說明其義是“為追求生活中的某種東西可以不計后果”后,還進一步說明“來自王朔的同名小說及據此改編的電視劇《過把癮》”。
科學的選例原則可保證例句準確、典型,增加詞典的內涵?!巴趿艘幌壬鷰资昵霸f過,一本詞典沒有好例句就形同一具骷髏。例句作用之大,就在于它可以進一步具體地幫助讀者理解詞義,掌握詞的用法。只有這樣,才能給讀者提供真正掌握這個詞的條件,才能圓滿地發揮詞典的作用?!?sup>[12]根據《新詞語大詞典》的實際需要,我們確定的選例原則是:語義準確原則;用法典型、全面原則[13];時代特征原則;時間原則。
李建國先生指出:“就新詞新語的成長而言,至少分‘少兒期’、‘青年期’和‘成年期’。少兒期的新詞新語獨立性弱,使用范圍小,是具有語料性質的詞語,能最迅速地反映社會政治、經濟、文化各方面的變化,社會學、文化學的研究價值大。青年期的新詞新語獨立性強,使用范圍大,最活躍,最敏感,很快進入共同語,文化學、語言學的實用價值大。成年期的新詞新語是全民使用的基本詞語,使用范圍最廣,構詞能力最強,語言學的價值最大?!?sup>[14]我們在編寫《新詞語大詞典》時發現,有些新詞語本身就代表一個新事物,有些新詞語與一些新事物緊緊相連。所以,我們選擇例句時,在不違反其他原則的情況下,重點選擇能夠反映新事物、富有時代特征的例句。這樣,《新詞語大詞典》不僅收錄了新詞語,解釋了其意義和用法,而且有了社會學、文化學的意義,擴大了詞典的內涵。
李行健先生指出:“新詞語本來就是一種過渡性的詞語……編寫新詞詞典時,可否標明該詞典收入的是什么年代到什么年代產生的新詞語?這樣也許更便于編者編纂和讀者研究使用。”[15]我們按照李先生的這個意見,對每個新詞語都特別注意考察了它的使用時間范圍,并把考察的結果通過例句的選擇體現出來:每個新詞語一般選兩個例句。一個是最早的,即靠近1978年的;一個是最晚的,即靠近現在的。目的在于說明該詞語使用的時間范圍,同時也可以從中看到一個詞語的興衰。
三、建立新詞語研究和詞典編纂的立體體系
對于新詞語有了比較明確的認識,我們確定的研究思路和努力目標是:在整理研究新詞語的同時,一并關注流行語、網絡用語,通過編年本的形式把新詞語(包括流行語、網絡用語)的搜集整理繼續下去,并且開發新詞語電子詞典、網絡詞典以及相關的大規模動態語料庫資源,形成新詞語研究的立體成果。
隨著信息技術與網絡的發展與普及,“流行語”、“網絡用語”產生速度之快、流行范圍之廣不同于以往,而且和新詞語交織在一起。我們認為,“流行語”、“網絡用語”也是新詞語的一個有機組成部分,理應受到關注。正是基于這種認識,在利用大規模語料庫搜集整理新詞語的同時,我們也搜集整理了流行語和網絡用語,分別于2000年、2003年編纂出版了《最新流行語小詞典》《實用網絡用語手冊》。當然,對于網絡用語,目前人們的看法還不一致,而全面搜集、整理網絡用語可以為進一步研究提供有價值的資源。
新詞語編年本的編纂非常有價值。編年本可以做到“逢詞必收”,及時、完整地記錄每年出現的新詞語,真實地反映詞匯的發展。這對現代漢語詞典的修訂、詞匯研究有重要的作用。基于這種認識,我們籌劃每年編纂一本新詞語詞典,收錄當年出現的新詞語。這項工作主要利用計算機語料庫技術自動從網上抽取新詞語,人工輔助完成。
《現代漢語新詞語信息電子詞典》的開發目前已基本完成。這部詞典已經收錄近4萬條新詞語,并根據語言信息處理的需要,按語法功能進行了粗分類,分出名詞、動詞、形容詞、區別詞、副詞等類。它采用數據庫文件格式,設立總庫1個,名詞分庫、動詞分庫、形容詞分庫、區別詞分庫、副詞分庫各1個,設立了拼音、義項、詞性,以及用法等屬性信息200多個,對每個新詞語的用法都進行了詳細的描述。[16]總庫和每個分庫之間均有三個相同的屬性字段,可以將這些庫鏈接在一起進行全部信息的檢索。此外還有與每個詞語鏈接的語料。新詞語電子詞典的開發將更加全面、系統地展示新詞語的全貌,既可以將我們收集到的4萬多條新詞語都展示給讀者,又可以將這些詞語的全部語法信息反映出來,并提供相應的語料,讓讀者獲取更加豐富的資料。這樣,可以彌補印刷本《新詞語大詞典》因各方面的限制而造成的不足。
以電子詞典為基礎,進一步進行新詞語網絡詞典的開發,是信息時代新詞語詞典開發的大勢所趨,也是辭書現代化的一個方向。近幾年,法國、美國等國家都開設了新詞語網站。[17]開設新詞語網站、開發網絡詞典對新詞語收集整理,考察研究新詞語可起到非常有效的作用。同時,這也是讀者的需要,因為網絡較少時空的限制,我們可以將更多的資源放在網上,讓人們及時、快捷地獲取所需的各種資源。
同時,利用網絡詞典建設的成果和編年本的成果,又可以不斷地對《新詞語大詞典》進行修訂,像滾雪球一樣把《新詞語大詞典》做大、做全,并使其具有權威性。
附注
[1][8]李建國新詞新語研究與詞典編纂辭書研究,1996(3)
[2][3][4][KG2]于根元,王鐵琨,孫述學新詞新語規范基本原則語言文字應用,2003(1)
[5]孫曼均生造詞問題的再思考//中國辭書學會學術委員會中國辭書論集2000北京:中國大百科全書出版社,2001
[6]許嘉璐容納·分析·引導·規范文匯報,1999-12-30
[7][10][13]亢世勇《新詞語大詞典》的編纂辭書研究,2003(2)
[9][12][15]李行健新詞語大詞典·序上海:上海辭書出版社,2003
[11]巢峰新詞語大詞典·序上海:上海辭書出版社,2003
[14]李建國再論新詞新語研究與辭書編纂語文建設,1997(12)
[16]亢世勇《現代漢語新詞語信息電子詞典》的研究與實現中文計算語言學期刊,2002(2)
[17]章宜華網絡環境下新詞語的傳播與規范辭書研究,2003(2)
(煙臺師范學院漢語言文學院山東264025)
(責任編輯陸嘉琦)