摘 要: 語料庫是指基于計算機數據庫的電子文本集,由大量真實的語言材料和檢索系統組成。基于語料庫的研究是一種實證性研究,九十年代以后逐漸得到普及應用,如今已成為一大熱點。語料庫在英語教學科研的應用可從4個層面展開:語言結構層面、篇章結構層面、話語語用層面、文學作品分析層面。方法可遵循“點—線—面”的語境擴展分析法。
關鍵詞: 語料庫應用 輔助性 外語教研
一、語料庫是外語教學研究的熱點
英語的corpus(語料庫,復數為corpora)一詞,在《語料庫應用教程》(梁茂成、李文中、許家金編著)中的解釋是:來自拉丁語,本意為body[1]3。如此解釋,未嘗不可,但無助于理解現代英語中corpus的準確意義。
英國牛津大學出版社出版的The Advanced Learner’s Dictionary of Current English with Chinese Translation(最早版本可追溯到上世紀四十年代),還有后來七十年代出版的Longman Dictionary of Contemporary English,都清楚地標明corpus的意義為:a collection of...而后者給出的唯一的、詳細的解釋是:a collection of基于兩個意義,一是a collection of all the writings of a special kind,on a special subject,or by a certain person,如the corpus of Shakespeare’s works;二是a collection of material or information for study,如The dictionary is based on a corpus of 10,000,000 words taken form English books and newspapers。前一條可譯為“文集”,后一條可譯為“語料庫”。可見,corpus一詞在英美詞典中早不作body解,語料庫的概念也早已有之。
現在所指的語料庫是計算機時代的產物,是基于計算機技術的一個電子文本集(a collection of texts stored in an electronic database),是由大量真實的語言材料和計算機檢索系統組成的。“語料庫分析是一種客觀的定量分析”[2],“為研究提供可靠的范例保證”[3],在九十年代后逐漸得到普及應用。至今,利用語料庫的研究已成為一大熱點。從中國知網檢索近5年來(2006—2011)發表在國內各種學術期刊上篇名有《語料庫》的研究論文,多達2390多篇,發表在核心期刊的有660多篇。語料庫語言學作為一種新的研究方法,應引起廣大教師的重視。
二、基于語料庫研究的層面和方法
基于語料庫的外語教學研究可以進行基本文本特征分析、詞匯難度分布特點分析[4],或通過統計關鍵詞做話語分析,等等。研究可以從四個層面展開,可以采用“點—線—面”分析法。
(一)研究的層面
語料庫輔助外語教學研究可從4個層面[5]9展開:(1)語言結構層面,主要進行字詞、短語、語義、句法等方面的分析。(2)篇章結構層面,如起始語、含糊語、禮貌語、結束語,語音語調的篇章功能等。(3)話語語用層面,如批判話語分析、醫生與病人會話的語用分析。(4)文學作品分析,如文學批評、作品賞析、文體風格對比等。
目前很多研究從語言結構層面展開,探討某個詞項的出現頻率、共現語境、鄰近搭配、句法特征、篇章結構等,以及對一些規則、理論進行實證[6]。進行話語語用批評和文學作品分析的論文也不少,主要運用主題詞表和搭配檢索,分析語料的文本特征、作者風格、主題思想、語用含義等方面的問題[7]。
(二)研究的方法
基于語料庫的研究方法可以遵循“點—線—面”的語境擴展分析法[1]216。(1)點,是從詞項的檢索開始,如詞頻、主題性統計等。(2)線,主要是對詞項的使用語境展開檢索,如詞項的搭配和左右的共現現象、語義韻、詞塊檢索分析等。(3)面,定量分析之后,利用檢索的數據,展開一個全面的定性分析。最后一環是重要的,缺少這個環節,研究就有局限性。
“點—線—面”的分析方法一般多為話語批評和文學作品分析應用。首先是提出研究的和要解決的問題,其次是語料和檢索分析系統的準備,再次是檢索分析和儲存數據過程,最后是對數據的討論和分析。
三、語料庫研究的輔助性
語料庫在外語教學研究中主要起輔助性作用。下面介紹幾個例子,足可窺其一斑。
例子1:It rains cats and dogs.
這是英語教材中常見的一個短語,各種詞典都可以查到。碰到下雨天,我們也許會適時地說上一句,“Oh,It rains cats and dogs.”。但是,這個短語是否是一個常用的或者是已經死亡的短語?我們無法知道。
有一篇介紹語料庫的論文提到:英國語料庫語言學家Rundell曾同一位荷蘭婦女用英語交談。那位婦女講一口流利、地道的英語,幾乎不帶荷蘭口音。但是,當她在談話中使用rain cats and dogs這個短語時,語言學家意識到這婦女的母語不是英語。因為,現代英語中已幾乎沒有這種用法。為了證實這種直覺的判斷,Rundell檢索語料庫,在1000萬詞的口語材料中,這個短語一次也沒有出現過;在9000萬詞的書面語材料中也僅出現過一次[8]。語料庫給了語感的實證支持。
例子2:關于some和any的用法。
一般教科書都強調some和any的區別在于any用于否定句和疑問句,而some用于肯定句。考試也這樣考,否則就會丟分。有人調查了我國初中英語教材第一冊69例any,44例為否定句,25例為疑問句,無一例為肯定句。但人們不時發現any用于肯定,而some也不時用于否定,那么,去哪里搜集證據呢?語料庫就幫了這個忙。國外有學者做了大量語料庫調查發現,有50%的any竟用于肯定句,另有30%—40%的any用于否定句,用于疑問句的any僅有10%[5]49。就是說,教材所定的規則并不符合語言實際運用的情況。
例子3:關于cause的語義韻。
語義韻是指詞項搭配的語義范圍或色彩傾向。《語料庫應用教程》中提到:一名在英國留學的中國研究生在論文中用了cause一詞,英國導師卻把cause這一詞改為lead to,原文和修改文如下:
中國學生原文:Although economic improvement may be caused by tourism,the investment and operational costs of tourism must also be considered.
英國導師修改文:Although tourism may lead to economic improvement,the investment and operational costs of tourism must also be considered.
老師把cause改為lead to,再把被動語態改為主動語態。而這兩個詞意思是基本一致的,但為什么非要改?英國教師因此檢索語料庫,大量檢索行證實,cause一詞總是與消極的、不好色彩的詞連用,而lead to的搭配詞好壞參半[1]114-116。中國學生把cause與積極傾向的詞匯連用,所以英語本族語者就覺得不對勁。這也說明,我們這些非英語本族語學習者所不能體會的語感直覺,語料庫可以幫助我們解決。
四、結語
最后,外語教學研究可自建語料庫,具備兩樣東西即可:語料和檢索分析軟件。語料庫可大可小,視能否滿足研究需要而定。語料是否需要標注(annotation)也應視研究的需要而定。語料庫研究是輔助性的,主要為具體的研究提供客觀數據,增強分析力和說服力,可用于各種研究,如分析英文摘要的語法錯誤[9],或對英語修辭的理論探討[10],教學上分析大學英語四、六級考試[6]、分析教材難度[8],語料庫都發揮了積極作用,所提供的客觀統計數據,使外語教學研究更具可操作性和可接受性。因此,對于大多數外語教師來說,掌握語料庫的基本應用技術及使用方法非常必要。
參考文獻:
[1]梁茂成,李文中,許家金編著.語料庫應用教程[M].北京:外語教學與研究出版社,2010.7:3,216,114-116.
[2]羅建平.析美國總統就職演說的歷時語言特征——一項語料庫的量化調查[J].西南農業大學學報(社科版),2011,(12):125-129.
[3]羅建平,黃伶燕.名詞非范疇化與副名結構的聚合關系[J].重慶交通大學學報(社科版),2010,(3):128-132.
[4]羅建平.詞匯難度分析RANGE32的可靠性考證[J].重慶科技學院學報(社科版),2011,(20):114-115.
[5]何安平.語料庫語言學與英語教學[M].北京:北京大學出版社,2004:49,9.
[6]黃伶燕,羅建平.基于語料庫的CET4閱讀理解相關性分析[J].韶關學院學報,2011,(7):81-83.
[7]羅建平.美國總統就職演講主題詞的語料庫分析[J].浙江外國語學院學報,2011,(5):46-50.
[8]謝應光.語料庫語言學與外語教學[J].外語教學與研究,1996,(3):28-33.
[9]羅建平,黃伶燕.高校學報英文摘要中語法錯誤的分析——以自然科學版為例[J].中國科技期刊研究,2011,22(5):791-794.
[10]羅建平.語法隱喻理論在英語明喻研究中的應用[J].福建教育學院學報,2011,(3):105-107.