鄭玉榮,欒 嵐,王麗麗
(哈爾濱工程大學外語系,哈爾濱150001)
我國的語料庫語言學研究始于20世紀80年代中期,楊惠中主持建成的國內第一個語料庫《上海交大科技英語語料庫》為大學英語教學大綱的制定和詞表統計提供了數據依據,為我國外語教學作出了積極的貢獻[1]。90年代后,我國語料庫研究走上了以建立和研究學習者語料庫為主的道路,如桂詩春編制的國際英語學習者語料庫中國子語料庫、中國學習者英語語料庫[2]等。
為了全面地了解國內基于語料庫的研究成就及發展動態,本文從中國知網、維普和萬方等數據庫檢索了從20世紀90年代到目前所有公開發表的關于語料庫的文章,一共確定了307篇文章,作為本文綜述性研究的基礎。
下圖中的統計數據表明國內基于語料庫的研究,基本呈穩步上升趨勢,其中2009年呈現出一個高峰期,文章數量達到60篇。遞增的發展趨勢說明基于語料庫的研究逐漸引起學者、教師的興趣。本文依據成果的數量、研究領域的變化及研究的深度將國內基于語料庫的研究分為三個階段:起步階段(20世紀90年代—2002年);發展階段(2003—2004年);成熟階段(2005—2010年)。
根據本文檢索到的文獻,國內最早發表的關于語料庫語言學的是1997年介紹國際英語學習者語料庫的文章《國際英語學習者語料庫與英語教學》[3],在2000年之前發表的13篇文章中,大部分為介紹或概述性質的文章,如王建新的3篇文章[4~6]分別介紹了語料庫語言學發展史上的幾個重要階段和我國在語料庫語言學研究方面的部分進展,英國國家語料庫(British National Corpus)的設計與內容。馮躍進、汪臘萍介紹了英特網上可免費使用的科比德在線演示版及相關應用軟件系統,呼吁“廣大英語教育者和研究人員應及早熟悉如何開發網上語料庫資源并予以充分使用”[7]。
這一階段也有幾例實證性研究,如何安平[8]采用OCP(Oxford Concordance Progra M)電腦軟件系統對大型英語口語語料庫LLC中的成功和非成功的插話進行語音、語法、詞匯、語篇和語用等多層面的分析,探討英語會話中形成插話的語境特征以及實施插話的語言機制和策略,這是國內最早的基于語料庫的實證研究,為后來的實證研究提供了研究范式。
2000年以后,國內基于語料庫的研究逐年增加,到2002年各類期刊共發表論文28篇。從研究的角度來看,一個明顯的特點是探討語料庫語言學對教學的作用的文章比較多。朱樂紅[9]從比較宏觀的角度探討了語料庫對外語教學的理念、方法和內容的影響和改變,杜金榜[10]研究學生英語寫作錯誤分析和索引在教學中的應用。另一個顯著特點是實證性的研究增多,大致分兩類。一類是跨庫語言研究,如孫建東[11~12]使用來自 SEC(Lancaster/IBMSpoken English Corpus)、LOB(Lancaster- Osle- Bergen)、APC(Associated Press Corpus)三個語料庫的實例,探討了名詞定語的句法與語義特征,分析復雜名詞定語的詞序和復雜名詞定語與中心詞之間的修飾關系,闡釋了使用復數名詞定語的諸種原因。另一類是對中國英語學習者中介語狀況的研究。李景泉、蔡金亭[13]對學生英語寫作中的冠詞誤用現象研究,陳萬霞[14]關于被動語態,張淑靜[15]關于英語專業學生 Make的使用特點調查報告,這三項研究在CNKI上顯示的引用率分別高達102次、57次和61次。
把2003年作為發展階段的開始點的原因是隨著CLEC由上海外語教育出版社的正式出版,越來越多的教師和研究者有機會利用這一寶貴的資源研究中國學生的英語中介語,這一點可以從在這兩年中發表的基于CLEC的研究數量得到證實。兩年中,發表的40篇文章中有18篇與CLEC有關。CLEC為研究中介語提供了豐富的素材,開始在中介語的不同層次結出令人驚喜的成果。影響最大的研究是桂詩春的《中國學習者英語失誤分析的認知模型》[16],他把失誤分為三個層面:單詞層面上的詞匯感知失誤(如拼寫)、詞際層面上詞匯語法失誤(如替代)和句子層面上的句法失誤(如句子片斷和結構缺陷),這一模型對后來的語料庫失誤分類和標注有重要的指導意義。
其他11篇研究是基于CLEC和其他語料庫的對比研究。例如,通過對比分析CLEC、BROWN和LOB中“afraid”的語法類型和詞匯類型,發現中國學生在英語形容詞的使用中存在著明顯的非母語性[17]。
把2003年作為發展階段開端的另一個原因是由文秋芳教授等人從這一年起開始建設國內另一個非常重要的學習者語料庫——《中國學生英語口筆語語料庫》,隨著先期語料的分析和研究,成果開始公開發表。在這一發展階段,另一個口語語料庫COLSEC也開始籌備并建設,旨在為了解中國學習者英語口語能力現狀提供研究平臺[18],這個基于非英語專業學生四、六級口語考試的口語語料庫與SECCL一起為研究中國英語學生英語口語特征提供了寶貴的素材。
這一時期最突出的特點是實證性的文章開始占多數,理論或較空泛地探討語料庫的重要性的文章減少。2003在上海召開的“第23屆語料庫語言學國際會議”是語料庫語言學在中國確立學科地位的一個重要里程碑,會議的廣泛議題和成功交流對后來有長遠的影響[19~20]。
隨著對CLEC語料庫研究的深入,SWECCL(1.0)版本和COLSEC的出版,我國基于學習者語料庫的研究進入快速發展的成熟階段。不但每年的文章數量增大,發表有關語料庫文章的期刊種類增加,而且探討的領域更廣,更有深度,對語料庫在教學中的應用,對中國英語學習者中介語的描述與解釋更加充分和理性。
本階段的一個突出特點是基于自建的語料庫的研究的增加和內容的豐富,在2005—2010年的227篇文章中有24篇涉及自建語料庫。如丁容容、何福勝[21]自建了由課程口語考試和隨堂的任務型口語測試語料構成的口語語料庫,研究強勢語(booster)的使用。李文中[22]建立一個“中國英語新聞語料庫”(CENAC),與對應的“英國英語新聞語料庫”(BENAC)對比,調查中國語境中詞簇的分布特征及語用功能。從以上例子可以得出,我國語料庫研究者已不再滿足對使用基于大型統考、開發現成的語料庫從事研究,已經從使用語料庫發展到掌握這門技術開發個性化的語料庫,為自己的研究目的服務,正在走向從使用到開發階段。
2006年以后,探究建庫技術文章增加是這一階段的另一特點。如書面語料自動詞性賦碼的信度研究[23]和口語語料自動詞性賦碼的信度研究[24],《當代語言學》2009年發表的《超大規模語料庫精加工技術研究》[25]一文體現了這一研究的跨學科特點,這無疑再一次證明語料庫語言學的學科正在成熟。
正如何安平[26]教授在為《語料庫語言學的進展》寫的導讀所說的那樣:“國內語料庫語言學的發展,也逐漸從上世紀末引介國外的語料庫、檢索工具、研究方法和成果發展到如今建設有中國特色的各類大型語料庫和自行研發檢索工具的階段”,國內所有關注這一領域發展的學者在為目前我國語料庫的迅速健康發展而振奮的同時,更應該了解現今國內外語料庫和基于語料庫研究的現狀,除了利用各種語料庫外,還應對現有的語料庫進行深層次的開發與研究,對原始語料庫作多層面信息進行自動賦碼處理,開發研制多功能語料庫檢索工具等。
[1]王建新.計算機語料庫的建設與應用[ M].北京:清華大學出版社,2005:30.
[2]桂詩春,楊惠中.中國學習者英語語料庫[ M].上海:上海外語教育出版社,2003.
[3]張煤.國際英語學習者語料庫與英語教學[J].國外外語教學,1997,(1):11 -14.
[4]王建新.語料庫語言學發展史上的幾個重要階段[J].外語教學與研究,1998,(4):52 -58.
[5]王建新.我國在語料庫語言學研究方面的部分進展(概述)[J].外語與外語教學,1999,(3):18-20.
[6]王建新.談談英國國家語料庫的設計與內容[J].解放軍外國語學院學報,1999,(6):44 -46.
[7]馮躍進,汪臘萍.科比德在線演示版及其應用[J].外語學刊,1999,(4):81 -86.
[8]何安平.英語會話中的成功與非成功插話[J].外國語,1998,(2):51 -57.
[9]朱樂紅.語料庫對語言研究及外語教學的作用[J].外語與外語教學,2000,(3):35 -37.
[10]杜金榜.從學生英語寫作錯誤看寫作教學[J].外語教學,2001,(2):43 -47.
[11]孫建東.名詞定語的句法與語義特征[J].四川外語學院學報,2000,(3):50 -53.
[12]孫建東.復雜名詞定語和復數名詞定語的使用與理解[J].外語教學,2001,(2):86 -90.
[13]李景泉,蔡金亭.中國學生英語寫作中的冠詞誤用現象:一項基于語料庫的研究[J].解放軍外國語學院學報,2001,(6):58 -62.
[14]陳萬霞.從中國學習者英語語料庫看英語被動語態習得[J].外語教學與研究,2002,(3):198-202.
[15]張淑靜.中國英語專業學生 Make的使用特點調查報告[J].解放軍外國語學院學報,2002,(4):58 -63.
[16]桂詩春.以語料庫為基礎的中國學習者英語失誤分析的認知模型[J].現代外語,2004,(2):129 -139.
[17]張立飛.中國學生使用英語形容詞時的非母語性:以“afraid”為例[J].解放軍外國語學院學報,2003,(5):32-36.
[18]楊惠中.中國學習者英語口語語料庫與英語口語能力研究[J].外語教育,2005,(4):1 -4.
[19]李文中,濮建忠,衛乃興.2003上海語料庫語言學國際會議述評[J].解放軍外國語學院學報,2004,(1):56-59.
[20]甄鳳超,張霞.語料庫語言學發展趨勢瞻望:2003語料庫語言學國際會議綜述[J].2004,(4):74 -77.
[21]丁容容,何福勝.中國學習者英語口語中強勢語的用法研究[J].外語教學,2006,(5):32 -36.
[22]李文中.中國英語新聞報刊中的詞簇[J].中國外語,2007,(3):38 -43.
[23]梁茂成.學習者英語書面語料自動詞性賦碼的信度研究[J].外語教學與研究,2006,(4):279-286.
[24]王莉,梁茂成.學習者口語語料自動詞性賦碼的信度研究[J].外語教學,2007,(4):47 -51.
[25]曲維光,唐旭日,俞敬松.超大規模語料庫精加工技術研究[J].當代語言學,2009,(2):136-146.
[26]何安平.語料庫語言學的進展[ M].北京:世界圖書出版社,2009.