鐘蘭鳳 張璘
摘 要: 語料庫作為一種新方法,在詞典研編領域得到了普遍的認可。雖然這項技術手段的革新為詞典學理論與實踐研究提供了新的研究空間,但也提出了新的挑戰。語料庫詞典研編的最大挑戰是如何快速有效地梳理語料庫提供的龐大的具有語境共現的多義詞的義項及釋義。系統功能語言學是以實際使用中的語言的功能為研究對象,是對語言的各個系統的研究,這些理論研究為應對這一新的挑戰提供了內部條件。實踐表明,系統功能語言學對及物系統的研究可以幫助我們快速梳理語料庫中的多義詞的義項,有助于編者完成具象—抽象—具象的釋義過程。
關鍵詞: 漢英詞典; 語料庫詞典研編; 系統功能語言學
中圖分類號: H06文獻標識碼: A文章編號: 1671-6604(2012)02-0062-05
近年來,隨著計算機應用技術的發展及語言分析工具的增加,語料庫在詞典編纂與研究領域受到了越來越多研究者的青睞,基于語料庫的詞典編纂也隨之得到了人們的認同。一門新的交叉學科——語料庫詞典學也就應運而生了。我國詞典學界對基于語料庫的詞典研編基本上持贊同的態度,認為它解決了制約傳統詞典發展的一些“瓶頸”問題;同時,人們也意識到了語料庫詞典研編的局限性。
到目前為止,我國學者對語料庫詞典學的討論主要集中在優勢與局限的話題范圍,討論基本上停留在經驗的層面,缺乏理性的思考。而且,討論的對象大都是單語詞典或外漢詞典。隨著“漢語熱”的升溫,漢外詞典的質量直接影響著我國民族文化輸出的質量。作為一門新興的交叉學科,語料庫詞典學有其共性的一面,但不同類型的語料庫詞典學也存在個性的一面。不同類型的詞典由于其讀者群不同,編寫的目的不同,其研編的思路及所依據的理論也應有所不同。如面對中國英語學習者的漢英詞典的研編就不能完全照搬國外的單語或外漢詞典研究成果。漢英語料庫詞典研編所面臨的挑戰是什么?我們如何應對這些挑戰?這些問題還沒有引起學者們深入系統的探討,我們也沒有看到這方面的專論。本文擬從語料庫詞典學的興起與發展、基于語料庫的漢英詞典研編所面臨的機遇與挑戰、應對的策略三個方面來談談我們的粗淺認識。
一、 語料庫詞典學的興起與發展
語料庫詞典學(Corpus Lexicography)[1]這一術語首次出現在Atkins的著作中。從該詞的結構來看,語料庫詞典學是語料庫與詞典學的有機結合。語料庫是指“用科學的抽樣原則進行選材,具有一定的目的性,可以用計算機軟件檢索的語言電子文本庫”[2] 247。由此可見,如今的語料庫與傳統的詞典編纂中所使用的“卡片式”的語料庫是存在差別的,那就是計算機應用技術的參與。王馥芳與羅敏莉以是否應用計算機技術為界限,把語料庫詞典學的發展分為前計算機時代和計算機化時代[3]。前者指計算機應用技術興起之前的詞典編纂所使用的卡片式資料收集時代。
為了區別于傳統詞典編纂領域所使用的“卡片式”語料庫方法,不同的學者使用了不同的術語。Ooi在其著作中使用的術語是“計算機語料庫詞典學”(Computer Corpus Lexicography)[4]1-2。Hartmann和James在《詞典學詞典》中使用的術語是“基于語料庫的詞典學”(corpus瞣riented lexicography)[5]31。我國學者章宜華和雍和明根據詞典涉及的媒介和詞典語料來源把當代詞典學分為計算詞典學(computational lexicography)與語料庫詞典學(corpus lexicography)[6]411-413。前者研究如何利用計算機技術輔助詞典學研究和詞典編纂;后者是指基于語料庫的詞典學理論研究和詞典編纂的學問。前者側重于研究如何為輔助詞典編纂而設計和開發各種計算工具和方法;后者綜合并吸取了計算語言學、計算詞典學和語料庫語言學的觀點和方法,主要致力于基于語料庫的詞典編纂原則和實踐方面的研究。
以上對語料庫詞典學概念的分析表明:現代語料庫詞典學的興起與發展得益于計算機存儲及提取技術的發展,是技術革命的結果,并不僅僅是作為流行語言研究工具的語料庫語言學與詞典學結合的結果。雖然語料庫詞典學這一術語首次出現在上個世紀90年代,但真正意義上的語料庫詞典學興起于上個世紀80年代初,其標志性事件是Sinclair主持的Cobuild語料庫的建立并利用它編寫了系列詞典。Cobuild系列詞典的成功帶動了語料庫詞典學的發展。此外,“牛津系列”詞典、“朗文系列”詞典和《劍橋國際英語詞典》的編寫都借助了語料庫,取得了豐碩的成果。
①詳見《外語研究》2006年第2期、《解放軍外語學院學報》2006年第3期、《現代外語》2006年第4期的相關文章介紹。語料庫與詞典編纂結合所取得的成就及社會效益也引起了我國語言學界及詞典學界學者的關注。與英語詞典的研編相比,漢語詞典及漢英詞典的研編在理論研究和編纂的技術手段上都較為落后。直到本世紀,我國第一個基于平行語料庫的漢英雙語詞典編纂系統CpsDict才誕生。它是南京國際關系學院李德俊教授在南京大學雙語詞典中心攻讀博士學位時獨立開發的①。CpsDict系統的研發標志著我國語料庫詞典學在技術上邁開了一大步,基本解決了基于語料庫的漢英詞典編纂的技術問題,填補了我國這方面實踐研究的空白。
二、 基于語料庫研編漢英詞典所面臨的挑戰
顧名思義,語料庫詞典學是以語料庫為手段,以詞典學研究為目的的學問,是語料庫語言學與詞典學的自然聯姻。語料庫語言學是指以語料庫為基礎的語言研究與語言分析。由此可見,語料庫語言學能為語料庫詞典學提供借鑒,但能借鑒的主要是語料庫的方法、觀點以及技術手段。就這一點而言,語料庫語言學是語料庫詞典學的基礎。
語料庫詞典學有自己的特色。根據李德俊教授的觀察,語料庫詞典學具有以下特色:(1) 語料庫不是話語的全部,只是話語全域的縮影;(2) 語料庫詞典學摒棄了傳統詞典學給詞義定位的本體論觀念,取而代之的是根據不同語境獲取的用法和意義;(3) 語料庫詞典學不排斥人工的合理干預[2]43-44。
技術手段的革新為理論研究提供了新的空間。綜觀國內外有關語料庫詞典學的文獻,我們發現語料庫詞典學的研究者們主要從事以下三類工作:(1) 有關語料庫詞典學的軟件開發及語料庫建設;(2) 利用語料庫編寫各類詞典;(3) 系統描述基于語料庫的詞典編纂活動。前兩項工作在國內外都有不少學者從事,而最后一項卻鮮有學者涉足。
語料庫詞典學的興起使得詞典學的研究視角得到了極大的拓展,研究者們把視角轉向了實際使用中的語言,為詞典學研究提供了新的機遇。語料庫詞典學雖然解決了制約傳統詞典發展的一些“瓶頸”問題,如出版及修訂周期長、資料的收集與存貯、搭配定義的界定、詞頻的統計、義項的科學排列及新詞的確定難度大、詞目收錄的滯后性、詞義描述的片面性、例證選取上的人工痕跡太強等[7],但也提出了新的挑戰,具體表現如下:(1) 既然語料庫不是話語的全域,話語入庫的條件是什么?入選條件的明晰化至關重要,因為話語的選擇在很大程度上決定了詞目的選擇及其釋義與配例的選擇。(2) 語料庫為我們提供了浩如煙海的文本,挑選什么樣的例句才能算得上是科學的?如何才能發揮例證的輔助釋義功能?(3) 語料庫給我們提供的是實際使用中的語言,語義依附于特定的語境,而且話語的篇幅不一定完全符合詞典出版的經濟原則,我們如何才能做到既保持了話語的原語境又能使話語的篇幅符合商業要求?這就涉及了重新語境化問題。(4) 漢英語言間的差異給我們界定多義詞的義項帶來了很大的困難,我們如何利用語料庫提供的豐富話語實踐來探索漢語多義詞義項劃分的理論依據?(5) 在平行語料庫中,漢英兩種語言實現了零距離接觸。詞典編纂者應該具備怎樣的基本素質才能保證漢語不受到英語的干擾,保持漢語言文化的獨特性?
以上這些挑戰歸根結底還是語言學問題,是技術發展所帶來的新問題,單純依賴技術的進步是無法解決的。語言學與詞典學的淵源由來已久。根據Al-Kasimi、魏向清、王馥芳的研究,英語詞典編纂史上的每一個創新都與英語語言學理論的發展密不可分,如社會語言學、轉換生成語言學、認知語言學、語料庫語言學的研究成果都不同程度地促進了詞典學的發展與革新,更有甚者促使了新學科分支的誕生,如認知語言學與詞典學的聯姻誕生了認知詞典學[8]1-11,[9],[10]3。以上每一個語言學流派都不同程度地促進了前計算機時代詞典學的發展,但卻不能完全滿足語料庫詞典學的發展趨勢,我們有必要轉向新的語言學理論,尤其是以語義研究為目的的語言學理論。據我們考察,還沒有學者把系統功能語言學理論系統地應用在詞典學的研究中。隨著計算機應用技術的發展,語料庫作為詞典編纂的工具已成必然趨勢,語料庫詞典編纂的理論研究也迫在眉睫。語料庫詞典學的發展不能單純依靠技術的進步,技術僅是輔助手段,因此,語料庫詞典學要得到長足的發展不得不實行技術開發與理論研究并行,否則一方發展的滯后必然影響另一方的發展。
三、 應對的策略
如上所述,基于語料庫的詞典研編有賴于現代語言學理論研究成果的合理應用。系統功能語言學是以漢、英語言結構為基礎建立的普通語言學描寫模式,既研究語言的使用,也不忽略語言的結構,是“自上而下”的研究模式。以下將從系統功能語言學理論研究視角來考察基于語料庫的漢英詞典研編的內部條件,并結合具體實例來論證其在漢英詞典研編過程中的獨特作用。
(一) 系統功能語言學關照漢英詞典研編的內部條件
系統功能語言學是從歐洲功能主義派生出來的學派, 它吸收了歐洲功能主義理論,發展了一個從實體、形式到語義、情景;從潛在的系統到實際的結構(功能) 的語法理論。系統功能語言學要研究的是“作為社會符號的語言”[11]1-5,采用社會學研究方法從語言的各個層面來討論語義及語義的體現。這些層面包括語境層和語言層,前者包括文化語境層和情景語境層,兩者之間是“示例”關系;后者包括語義層、詞匯語法層和音系/字系層,他們之間是“體現”關系。
語義系統是體現更高層次的體現系統,即體現情景語境的系統。這樣我們就可以從情景語境的特征推測出語篇特征。文化語境與語類(genre)有關,情景語境與語域(register)有關。語言的使用是在人類某一活動領域中單個而具體的話語形式(包括口頭的和書面的話語)中實現的。每一個單個的表述,無疑是個人的,但使用語言的每一個領域卻會形成相對穩定的話語類型,即我們所說的語類(genre)。語域是指語言的功能變體。所謂功能變體,就是因情景語境的變化而產生的語言變化形式。情景語境有三個變量:話語范圍、話語基調和話語方式。話語范圍指的是交談的話題以及場地等情景因素。話語基調指的是交際雙方的社會角色關系即個人基調和話語活動的目的。話語方式指的是語言活動所采取的媒介或渠道,它可能是口頭的,也可能是書面的,或是介于兩者之間的。這三個變量分別對應語義系統中的三大元功能系統:概念功能、人際功能、謀篇功能。它們共同作用,制約說話者對詞語和語義結構的選擇,即任何一個變量的變化都有可能導致語言變體。
對語類、語域的深度研究為我們構建具有代表性的語料庫奠定了基礎。既然語料庫不是話語的全部,只是話語全域的縮影,我們所建立的語料庫理應具有代表性,以最大限度地保證不漏選詞目、詞義和析取典型例證,為人工的合理干預提供依據。此外,由于系統功能語言學包羅了語言學所涉及的各個領域, 形成了一個龐大的理論體系, 我們除了可以進行從文化語境的意識形態動因分析語篇特征外,還可以進行實體產生的全過程分析,如可以進行主位結構、語氣結構、信息結構、及物性結構分析以及詞素、詞、詞組、小句、句子、段落、章節等多結構、多層次、多級階的分析。這些分析構成了語料庫詞典研編所需要的知識與技能。
(二) 及物系統研究對釋義的關照
下面我們以“現已”一詞為例,應用系統功能語言學理論中的及物系統來闡述系統功能語言學對語料庫詞典學研究的價值。及物系統是功能語言學中體現經驗功能的一個語義系統,其作用是把人們在現實生活中的所見所聞、所作所為分成若干種“過程”,即將經驗通過語法進行范疇化,并指明參與各種過程的“參與者”與“環境成分”。韓禮德認為,人們可以通過及物系統把人類的經驗分成六種不同的過程:物質過程、心理過程、關系過程、行為過程、言語過程、存在過程[12]106-143。
前面我們已提及漢英詞典的釋義主要是找到英語中的對等表達。問題是并不是所有的漢語詞匯單位在英語中都是通過詞匯手段實現的,有的是通過語法手段實現的,有的是通過語法與詞匯手段共同實現的,如“現已”一詞就屬于這種情況。通過檢索,我們發現了以下帶有“現已”一詞的話語:(1) 中國的電話普及率現已達到26%。(China餾 telephone penetration rate has reached 26 percent.)(2) 溫柔體貼的愛麗絲,現已白發蒼蒼,略微發福。(Gentle Alice has now become gray and heavy. )(3) 結果現已日見明朗。 (The results are becoming clear.)(4) 電腦屏幕上現已出現了第一個匹配的數據。(The screen was already showing the first of the hits now.)(5) 羅斯林教堂現已成為喜歡冒險的獵奇者們朝圣的圣地。(Rosslyn had now become a pilgrimage site for mystery seekers.)(6) 小溪現已變成了奔騰的江河。(The stream has now become a torrent.)
以上含有“現已”的6個英語對等表達均屬于“關系過程”中的歸屬類關系小句。關系過程指的是反映事物處于何種關系的過程,它又可進一步分為“歸屬”和“識別”兩大類。歸屬類指某個實體具有哪些屬性,或者歸于哪種類型。歸屬類小句有三個共同之處:都含有一個表示“屬性”的成分;都含有屬性的“載體”;都含有表示關系過程的動詞。從以上6個英語小句可以看出,“現已”一詞在英語中沒有對等的詞匯表達,它是通過語法手段(第1、3、4句)或語法手段與詞匯手段相結合的方式(第2、5、6句)來實現的。因此我們可以從功能的角度來給“現已”一詞釋義:表示事物(載體)的屬性發生了或正在發生變化,主要通過進行時態或完成時態來實現,有時可以與“already”或者“now”結合共同實現,常與表示“變化”的動詞組合,如become、reach、arrive、show等。這種從功能的角度對在英語中找不到對應詞的漢語詞匯單位的功能性釋義有利于培養中國英語學習者的目標語再生成能力。這種釋義也符合漢語特性:漢語形式特征自身獨立性較弱, 而較多依賴于語言的意義和功能。
針對當前基于語料庫的漢英詞典研編所面臨的挑戰,我們認為,理論上應當突破當前漢英詞典學界的語言本體觀,以語言系統研究為中心,從宏觀與微觀兩個層面來考慮語料庫的建立、詞目、配例的選擇、譯義的方法及排序,豐富我國漢英詞典研編相關的理論研究,解決語料庫漢英詞典研編過程中其他語言學流派所不能解決的難題,提高漢英詞典編纂質量,推動我國漢英詞典編纂實踐的發展,使漢英詞典滿足我國社會政治、經濟、文化發展的新要求。在方法上要突破當前詞典學界所倚賴的文獻法,把實證的研究方法引入詞典學研究,以保障語料庫漢英詞典編纂理論研究的實用性。在漢英詞典編纂的目的方面,要一改現存漢英詞典重在解碼的研究傳統,以提高中國英語學習者的編碼能力為己任,服務于本民族文化輸出,為中國文化輸出戰略做出應有的貢獻。最后,由于詞典編纂中的主體因素無處不在[13],涉及詞典編纂的各個環節,我們有必要把詞典學界一度忽視的詞典編纂者的多重身份建構納入研究視野,這對基于語料庫的漢英詞典編纂者的培養具有現實意義。
參考文獻:
[1] Atkins, B. Building a Lexicon: the contribution of lexicography [J]. International Journal of Lexicography,1991(3): 167-204.
[2] 李德俊.平行語料庫與積極型漢英詞典的研編[M].上海:上海譯文出版社,2008.
[3] 王馥芳,羅敏莉.語料庫詞典學的興起與發展[J].辭書研究,2004(5):45-53.
[4] Ooi, V. B. Y. Computer Corpus Lexicography[M]. Edinburgh: Edinburgh University Press, 1998.
[5] Hartmann, R. R. K., James, G. Dictionary of Lexicography[M]. Beijing: Foreign Language Teaching and Research Press, 2000.
[6] 章宜華,雍和明.當代詞典學[M].北京:商務印書館,2007.
[7] 王馥芳,馬蘭梅.語料庫詞典的局限性[J]. 辭書研究,2003(5):20-28.
[8] Al睰asimi, A. M. Linguistics and Bilingual Dictionaries[M]. Leiden: E.J. Brill, 1977.
[9] 魏向清.英語語言學的發展與英語詞典[J].解放軍外國語學院學報,1998(1):13-18.
[10] 王馥芳.當代語言學與詞典創新[M].上海:上海辭書出版社,2004.
[11] Halliday, M. A. K. Language As Social Semiotic[M]. London: Edward Arnold, 1978.
[12] Halliday, M. A. K. An Introduction to Functional Grammar[M]. 北京:外語教學與研究出版社, 2000.
[13] 王馥芳,陸谷孫.詞典編纂中的“主體因素”[J].外語界,2006(3):74-79.
(責任編輯 張向鳳)
Corpus瞓ased Chinese睧nglish Lexicography: Opportunity,
Challenge and Counter瞞easures
Zhong Lanfeng, Zhang Lin
(School of Foreign Languages, Jiangsu University, Zhenjiang 212013, China)
Abstract: The application of corpora as a new method to dictionary making is now generally approved. The technical innovation brings to dictionary making theory and practice challenges as well as new space. The chief challenge is how to comb through the senses and definitions of the contextualized polysemes quickly and efficiently. This challenge can be met with the help of systemic linguistics for it sets as its main task the function and linguistic system of language in use and studies all the systems within language. Our practice in dictionary making suggests that the study of transitivity system by systemic linguists can help dictionary makers handle sense discrimination and defining process: concretization abstraction concretization.
Key words: Chinese睧nglish dictionary; corpus瞓ased lexicography; systemic linguistics
收稿日期: 2012-01-15
基金項目: 國家社會科學基金項目(07BYY038); 江蘇大學人才引進項目(10JDG010)
作者簡介: 鐘蘭鳳,副教授、碩士生導師,文學博士,從事系統功能語言學、話語分析、雙語詞典研編研究; 張 璘,副教授,碩士生導師,文學博士,從事翻譯理論研究。