薛紅勤
摘 要: 文章主要介紹了語料庫的概念及其發展歷程,就語料庫在外語教學與研究中的應用進行了介紹。語料庫不僅在技術層面上豐富了外語教學的手段,而且使原來停留在理論和空想中的教學理念變為現實。隨著語料庫研究的不斷發展,人們已經在語言研究、語言教學、語言測試、詞典編撰、人工智能等領域應用了語料庫。
關鍵詞: 語料庫 語料庫語言學 教學應用
1.語料庫概念及發展史
語料庫(Corpus)是一個由大量在真實情況下使用的語言信息經過科學的收集和組織而集成的專供研究使用的資料庫。語料庫中的語料是某種語言中自然出現的,可以是書面的,也可以是口頭的。語料庫語言學就是在文本語料的基礎上進行語言研究的一門學科。語言學家把這種材料作為研究語言的素材。由于電腦語料庫容量大,資料真實,信息提取準確,因此,語言學家借助語料庫可以多方面多層次地描寫語言并驗證各種語言理論和假設,甚至建立新的語言模式和語言觀。
在沒有出現計算機之前,建設語料庫是一項十分繁重而成效甚微的工作。Samuel Johnson花了八年時間(1747—1755)才編成了世界上第一部英語詞典,其中大部分時間都用在尋找、整理語料與建立語料庫上。強調運用語料分析和描寫語言的美國結構主義語言學家Sapir和Baos在上個世紀初,為了搜集語料走訪一些印第安部落。但是到了上個世紀50年代后期,隨著Chomsky的生成語法學派的興起,“基于語料”的描寫語言學受到抨擊。因為Chomsky認為語料只不過是對語言行為的取樣,不能直接反映存在于人的大腦中的語言能力,因此不能作為語言研究的依據和材料。上世紀60年代初,很少有人對真實的語言素材進行研究。而基于語言學家的語感和直覺所得到的“可能的句子”及“不可能的句子”成了語言研究及語法教學的主要數據來源。
Quirk在1959年宣布建立英語用法調查語料庫(SEU),要對英語語法進行全面準確的描寫,提出新的語料庫語言學研究。隨著計算機的出現,不久之后,美國的Francis和Kucera等人利用計算機建立了布朗語料庫。在Quirk提出的語料庫語言學中,他強調研究自然語言材料的重要性,并引用Aldous Huxley的話說:“我們最精到的理論,我們最細致的描寫,都不過是對實際情況極度粗糙而又不講理的簡化,實際情況的每個最簡單的實例都是無比復雜的。”同時他指出,實際情況的這種復雜性正是語料庫語言學所需要研究的。從Quirk建立SEU語料庫開始,五十多年時間來,語料庫語言學的研究范圍不斷擴大,并取得很大的研究成果,語料庫語言學在語言學界的地位越來越重要。近些年借助計算機技術建立的語料庫,規模大、功能多、檢索方便,使語言研究的手段和方法更豐富,對語言的理論探索也產生深遠影響。
2.語料庫的作用
語料庫最直接的用途就是為編纂字典提供大量真實準確的例句,例如,根據COBU ILD語料庫編寫的詞典就有七種。除此之外,Leech(1993)還列出語料庫的十幾種用途,包括語言理論﹑語法﹑語義研究、語篇分析、兒童語言習得、語言學習、語言測試等。隨著計算機網絡的發展,基于網絡的語料庫為外語教學提供了大量新鮮的語言原料, 同時為編寫辭典、語法書及各種教材的提供了重要語料。事實上,現在一些對外語教學有重要影響的辭典和語法書都是以基于語料庫的方式編寫的。除此之外,語料庫在外語教學的思想、理論、方法、內容及手段等方面都起著十分重要的作用。為了更好地說明語料庫在外語教學和研究中的應用,筆者從下面幾個方面介紹語料庫的應用。
2.1語料庫與詞匯教學
在傳統外語教學中,詞匯教學往往只是“單”詞的教學,大部分語言教師都把單詞教學作為首位。但是,語言中的詞與詞之間經常存在音、形、義等各方面的聯系,如果單純地只學習一個詞,則是無法看到這種聯系的。現在我們可以通過計算機技術,迅速從包含上千萬個詞的語料庫中,把某個在這個語料庫中出現的詞或短語全部實例檢索出來,并同時統計出該詞或短語出現的頻率。這樣更準確更全面地建立詞匯之間的關系,從而認識到各語言形式在實際交際中的意義和用法。例如:桂詩春教授主持的國家“九五”社科規劃項目“中國英語學習者語料庫”項目,她通過收集5個組別(中學﹑大學英語四級﹑大學英語六級﹑專業英語低年級和專業英語高年級)的學生作文語料,共計100多萬個詞,并按詞形﹑動詞詞組、名詞詞組、代詞、形容詞詞組、副詞、介詞詞組、連詞、詞匯、搭配和句法制定了一個有61個細目的言語失誤標注表,然后對整個語料庫進行標注。從兩個方面對中國學生英語進行分析:一是對比其他以英語為母語的語料庫分析學習者的語料特征;二是對失誤特征進行分析。這個項目屬于國際上第一部公開發布的學習者語料庫,它對研究中國學生的語言應用和使用失誤等特征,以及它們與外語學習之間的關系等都具有十分重要的指導作用。
2.2語料庫與句法研究
句法與在其他方面的研究一樣,越來越多地依賴語料庫,并成為目前利用語料開展研究最多的語言層面。其原因首先是語料標和計算機檢索手段的發展,使得對語言中有代表性的語法現象加以量化分析更容易。其次是通過量化具備代表性的語法現象檢測根據語法理論所提出的假設。五十年代以來形成注重理論的理性學派(rationalistic)與注重實際語料的經驗學派(empirical),從八十年代中期以來呈現出前所未有的交匯,即很難判斷兩大研究傳統的研究者到底屬于哪個學派。他們開始用客觀的自然語料庫檢測理性的語法理論。而不只是純粹地通過描寫歸納客觀語言現象生成新的語法理論。羅芒( Romaine 1996)以British National Corpus (BNC)為依據,研究了雙重比較級現象。荷蘭的Njmegen 大學以J.Aarts為首的研究者,首先根據語言學家的內省及現有的語法描述設計了一套形式語法,將其輸入電腦在語料庫中運行,檢測該語法對語料庫數據的解釋程度,其次根據語料分析結果修訂語法,通過這種研究方法,他們認為語料庫使理論得到檢驗和進一步發展。
2.3語料庫與心理語言學
語料庫是心理語言學家對其收設進行測試研究的有力工具,尤其在語言病理分析方面能幫助研究人員準確確定問題到底發生在語言發展的哪一階段。
2.4語料庫與語言和語言教學
迅猛發展起來的電腦語料庫語言學近年來出現從純語言研究發展到語料庫與語言教學相結合研究的新趨勢。語料庫在語言教學方面得到直接或間接的應用。學生可以從語料庫中得到現實生活中真正會碰上的語言材料,并且現有許多專家已經開始利用語料庫對現有教學材料進行批評性研究。他們把從課本中發現的問題與語料庫中的真實語料進行比較,以此了解英語本族語的人們是如何表達這些意義的。另外,一批研究人員已開始建立“特定用途英語”語料庫提供特定領域的語言學習材料,如廣州石油英語語料庫(約411,000個詞)。語料庫同時在歷史語言學、方言等領域發揮重要作用,這種作用將隨著計算機的不斷發展而變得更顯著。
3.語料庫語言學的發展方向及前景
目前,計算機正以驚人的速度向前發展,語料庫語言學研究在國外開展得如火如荼。面對碩果累累的國外語料庫語言學研究,我們應該轉換觀念,更新思路,充分認識到語料庫研究對我國語言研究的重要意義,密切注意國外語料庫語言學發展的最新動態,充分利用一切語料庫資源和語料庫研究成果,并結合我國的語言教學和研究現狀,進行更深入的語言研究和語言應用研究。總之,計算機的發展使得用語料庫開展研究的人越來越多,從而擴展到研究的各個領域,同時語料庫中所收內容也會更廣泛、豐富。
參考文獻:
[1]陳建生.關于語料語言學[J].當代語言學,1997(1).
[2]C.J.F illmore(1992).Corpus Linguistics.J.Starvic(ed),1992, Directions in Corpus Linguistics, Berlin: Moutonde Gruyter.
[3]杜秉正,董眉君(1991).大學英語語法與練習[M ].上海:上海外語教育出版社;章振邦.(1989)新編英語語法(修訂本)[M]上海:上海譯文出版社.
[4]Johansson, S.Times change,and so do corpora[A].In Ajmer,K.&Altenberg ,B.(eds.)English Corpus Linguistics:Studies in Hon our of Jan Svartvik [C] .London and New York : Longman,1991.
[5]曾國強.語料庫在外語教學與研究中的應用.福建外語,2004(2).
[6]武和平,王秀秀.基于網絡的語料庫及其在英語教學中的應用.電化教育學院,2002(10).