馬志燕
【摘 要】本文旨在探討基于自建《高級職業英語》語料庫在數據驅動(DDL)模式下的詞匯學習模式,分析了基于《高級職業英語》語料庫的DDL模式下詞匯學習的具體過程,介紹了利用KWIC分析詞匯搭配、近義詞辨析、語義韻的詞匯學習的具體方式。
【關鍵詞】高級職業英語語料庫 數據驅動 DDL 詞匯學習
Tim Johns于2O世紀90年代初提出了“數據驅動學習(Data-driven learning,DDL)”的英語學習方法(Johns T.King P,1991)。該法基于語料庫,是指在課堂教學中引導學生利用計算機產生的索引(concordance)來對目標語進行檢索的教學方法,包括基于索引的各種活動和練習(JohnsT.,1991)。也就是通過“語境共現(key word in context,KWIC)”,把要檢索的詞置于語境之中展示出來,語料庫的使用者通過對大量語境的觀察,分析,歸納,從而了解到某一詞語,某一句式或某一語法的實際用法,這一過程具有探索性、發現性和自主性,符合當前語言教育的潮流。本文將討論基于自建的《高級職業英語》教材語料庫在數據驅動(DDL)模式下的詞匯學習模式。
一、數據驅動學習(DDL)的理論依據
(一)社會建構主義理論。哲學家、心理學家和教育學家和課程設計者常用“建構主義”來強調個體或學生在學習中的重要作用(吳慶麟,2006)。建構主義學習理論認為語言知識的習得并不是知識由教師到學生的單向傳遞過程,而是學生積極思考、主動選擇,在已有信息的基礎上對新信息進行探索發現,并與學習環境、學習同伴之間互相作用,重新構建新的知識體系。數據驅動下的英語學習正是重視學習過程、提供良好建構環境的學習模式。語料庫為學生提供了大量的帶有語境的語料,學生帶著問題對這些語料進行觀察分析,總結其中規律,不斷構建、完善語言知識,而不再是被動地接受傳統教學模式中的“規則+例子”的學習方式。應用DDL模式,學習者由知識的被動接受者成為主動探索者,這樣學生獲得的語言知識會更地道、印象更深、體系性更強、儲存更持久。
(二)自主學習理論。Holec(1981)認為自主學習是學習者自我負責管理語言學習的能力,即學習者能夠自己決定學習目標,確定學習內容和進度,選擇學習方法和技巧,監控習得過程及自我評估學習效果。傳統的“填鴨式”英語教學很大程度上限制了學生的個性發展。在DDL模式中,呈現在學習者面前的是一個自然語言的集合體。學習者既可以還原詞、詞組在口語語料庫中的真實語境,又可以在書面語語料庫中查看不同類型作品的寫作特點。除此之外,學習者還可以根據自己的興趣和需要結合不同語料庫的特點,利用相應的檢索軟件,來達到自己的學習和研究目的。
(三)語言習得理論。Krashen的“語言輸入假說”(input hypothesis)在第二語言習得研究領域是一個具有較大影響的理論(Mitchell R, Myles F.,2004)。Krashen認為,一個人的語言能力主要是通過習得途徑而獲得的,而第二語言習得則是在自然語言環境下,學習者大量地接觸略高于自己現有水平的可理解性語言輸入(comprehensive input),自然而然地習得語言。這一理論從質和量兩方面談到了促成語言習得發生的條件。由于語料庫中的材料取自實際生活各個方面典型的語言,而不是傳統英語課堂上教師僅憑直覺編造的幾個例句,這保證了語言輸入的真實性;現今所建成的語料庫,動輒幾千萬,甚至上億詞次,這從數量上保證了語言的輸入,而且是在不同的語境中反復再現,從認知心理學角度講,這有利于增加對詞語的感性認識和理解 ,加快詞語的內化。
二、語料庫的應用范疇
(一)語料庫作為教學資源。John Sinclair (1991)曾說:“One does not study all of botany by making artificial flowers”,通過內省編造出來的語言例子來研究語言就像生物學家用假花來研究植物一樣荒誕不經,自然發生的語言文本即語料庫才可作為學習者的語言教學資源。這種資源最大的特點便是自然性,語言學習者可通過觀察大量真實語句實例并結合上下文語境來分析語言使用的特定語境并歸納總結,避免孤立、片面地學習語言知識。
(二)語料庫作為教學手段。TogniniBonnelli(2001)認為:語料驅動思想的本質在于不承認任何脫離語言事實的理論預設。任何語言學習只能從真實的語言提取使用證據,任何語言學習范疇必須以復現模式及概率分布為基本證據。因此,可利用自建的英語教材語料庫和網絡語料庫結合起來進行教學設計。自建語料庫主要可進行主題引入、課文分析、翻譯閱讀技能訓練等一系列教學活動;網絡語料庫,如COCA、BNC等,可進行重點詞匯搭配和語法教學活動以及各種測試練習。總之,語料驅動的教學活動為學習者提供了諸多在做中學的條件和機會。
(三)語料庫作為學習工具。隨著計算機技術的不斷發展和大量基于語料庫的軟件的開發和應用,各種基于語料庫的學習模式不斷被提出,其中頗具代表性的是TimJohns提出的DDL模式(data-drivenlearning)和Barbara Seidlhofer(2002)提出的“學習驅動數據”(Learning-Driven Data)。這些學習模式的核心是以學習者為中心,強調在學習過程中進行探索發現并對發現進行自下而上的歸納總結,從而培養學習者自學能力。
三、基于《高級職業英語》語料庫的DDL詞匯學習
《高級職業英語》教材語料庫是由筆者主持建立,以高等教育出版社于2009年出版的《高級職業英語》(Advanced Career English)系列教材為語料來源,該教材分三級,每級含《讀寫教程》、《聽說教程》、《拓展教程》共9冊書?!陡呒壜殬I英語》教材語料庫收錄了課文、生詞、聽力文本材料、練習等絕大部分內容,約21萬詞次。對高職高專非英語專業學生而言,該教材語料庫題材豐富、語言規范、規模適中,便于搜索和觀察,適合學生進行詞匯學習。正如Hunston(2006)指出:教學語料庫的優點在于語料均為教材中出現過的內容,學生對其熟悉;而普通語料庫收集的語料缺乏針對性,內容陌生,學習難度相對提高。因此,在使用《高級職業英語》語料庫檢索某一詞條時,被檢索的詞匯將在不同層次的、已往學過的和未來即將學習的語境,以及聽力材料和練習材料的語境中反復循環出現,有利于增強學生的語言意識,并有助于他們在短時期內更好地掌握詞匯知識。endprint
基于《高級職業英語》語料庫的DDL詞匯學習多種多樣,教師可以根據實際情況靈活使用。比如,教師可以設計學習任務,在語料庫中進行相關檢索,并適當編輯以凸顯學習主題。將編輯后的檢索結果通過多媒體展示或印發給學生,提出研究問題,引導學生觀察檢索結果、解決問題,從而完成對目標詞匯的學習。也可安排課外DDL模式的學習,指導學生自行利用檢索工具對目標詞匯進行檢索,觀察詞匯的使用特點,并輔以小報告、小測驗來了解學生的學習效果。具體來說,有以下幾種常見的方法與手段。
1. KWIC索引
語料庫語言學主要的技術手段是詞語索引。詞語索引也應是DDL的常用手段形式。最常見的索引形式為KWIC (key words in context),即“語境中的關鍵詞”。索引行(concordance line)指關鍵詞及其語境的共現(甄鳳超,2005)。在英語課堂上,老師可以引導學生輸入關鍵詞,軟件自動檢索語料庫,將搜索到的關鍵詞提供所在行將索引行提供固定數量的語境詞,并以該關鍵詞為中心在屏幕上顯示出來。在教師的引導下,學生經過觀察討論,可以發現該詞的常用語法結構和意義。
2. 詞匯搭配的學習
Sinclair(1991:170)將搭配(collocation)定義為“兩個或兩個以上的詞在文本中短距離內的共現”搭配分析對研究詞語行為具有重要的意義。詞語與詞語搭配不僅對確立句法結構關系起著一定制約作用,而且是意義實現以及消除歧義的基本依據(甄鳳超,2005)。因此,通過詞匯搭配的學習,學生可以提高語言使用的流利度,表達更地道,擺脫“中式英語”。建立在《高級職業英語》語料庫的DDL詞匯學習模式中,我們可以憑借該語料庫的搜索功能,檢索某一詞匯在教材中出現的典型搭配,然后引導學生仔細觀察索引行,總結搭配規律。
3. 近義詞的辨析
學生往往對英語中許多意義、用法相近的詞匯感到難以區分,單靠詞典給出的解釋和一兩個例句常常不能清晰地掌握其差別。引入DDL學習模式后,我們在《高級職業英語》語料庫中對需要辨析的詞分別進行檢索,從中找到許多例子,引導學生根據已學到的語言知識對這些語境進行探索歸納,從而區分這些近義詞在意義和用法上的異同。必要時,再利用免費的在線本族語語料庫獲取更多的例證,以便進一步加深印象。
4. 類聯接的學習
類聯接(colligation)是詞語搭配研究中的一個重要概念,指語法范疇間的結合。“類聯接不是與詞語搭配平行的抽象,而是高一級的抽象”(衛乃興2002:300 )。類聯接是詞語搭配發生于其中的語法結構和框架,是“語法范疇之間在句法結構上的相互關系”(衛乃興,2006)通過建立類聯接,可以發現詞匯的語法模式。因此在DDL模式下,學生可以觀察對于某一詞條的檢索結果并建立其相關類聯接,從而掌握該檢索詞的語法形式特征。
5. 語義韻的學習
語義韻 (semantic prosody) 是語言的一項重要運作機制,不僅揭示了詞項結伴行為的語義特征,還傳達了人們通過詞匯搭配表達的語用功能(衛乃興,2006)。有些詞匯的使用時總是習慣地、反復地傾向與某一類詞匯共現,從而也具有了這一類詞的特點,這就使整個語境彌漫著一種特殊的語義氛圍,這就是語義韻。語義韻大體分為消極、中性和積極三類。從語義韻學習的角度來說,把語料庫引入英語教學是對教學法的一大改進,因為通過語義韻的學習,使學生意識到學習英語的時候,不僅要注意句子的語法要正確,還要注意表達的地道性,避免語用錯誤,提高表達的精確性,擺脫“中式英語”。比如,在學習“cause”這一明顯帶有“貶韻”的動詞時,教師可以從《高級職業英語》語料庫中搜索出具有代表性的語境,學生觀察討論后會發現,其后搭配的賓語頻繁出現damage(破壞)、trouble(麻煩)、diseases(疾病)、stress(壓力)、problems(問題、麻煩)等消極意義的詞,這樣學生將了解cause這個詞所使用的語義韻,從而正確地使用它。
不管基于語料庫對上述哪方面的學習,一般都遵循Tim Johns(1991)提出的DDL的三個步驟:① 提出問題(Identify)。由教師預先提出問題或由學習者自己提出學習過程中產生的疑問。②材料分類(classify)。通過檢索工具從語料庫中檢索出語言數據并進行恰當篩選和分類。③歸納總結(Generalize)。這是整個過程中最重要的一步,即在教師指導下,學生理解、分析并歸納出語言使用規律,解決事先提出的問題。
四、結語
基于語料庫的DDL學習模式是一種“頗具吸引力的”有助于提高準確性 (accuracy)和地道性(idiomaticity)的方法(Granger,1998:199),然而由于語料庫固有的特點,該模式也有一定的局限性。首先,目前《高級職業英語》語料庫只收錄了一套高職高專公共英語教材,學習的內容也僅僅覆蓋該教材的內容,而不能呈現更大的自然語境。所以在實施過程中,教師在準備DDL學習材料時最好在更大的語料庫中對目標詞匯進行檢索,以彌補單一語料庫的片面結果。另外,DDL模式中的練習、活動須精心設計,教師的工作量比較大。這種模式使用過多會太費時,學生容易失去積極性,所以應根據學生的語言基礎、觀察能力、推理能力和學習內容來使用,教師要充分考慮學生的學習風格,引導他們在DDL學習中使用不同的學習策略。
【參考文獻】
[1]Johns T.King P.ClassroomConcordancing[M].Birmingham:University of Birmingham,1991.
[2]JohnsT.Should you be persuaded—two samples ofdata—driven learningmaterials[J].English Language Research Journal,1991(4).endprint
[3]吳慶麟.教育心理學[M].上海:華東師范大學出版社,2006.
[4]Holec H.Autonomy and Foreign Language Learning[M].Oxford:Pergamon,1981.
[5]Mitchell R, Myles F. Second Language Learning Theories[ M].London:Hodder Arnold, 2004.
[6]SinclairJ.Corpus, Concordance, Collocation[M]. Oxford: Oxford University Press,1991.
[7]TogniniBonnelli E.Corpus Linguistics at Work[M]. Amsterdam:JohnBenjamins, 2001.
[8]Seidlhofer B. Pedagogy and local learnercorpora-working withlearning-driven data [A]. In Granger S. Hung J. &Petch-Tyson S.(Eds.) Computer Learner Corpora, Second Language Acquisitionand Foreign Language Teaching [C]. Amsterdam/Philadelphia:John Benjamins Publishing Company,2002:213-234.
[9]Huston,Susan.Corpora in applied linguistics[M]. Beijing:World Book Publishing Company,2006.
[10]甄鳳超.語料庫數據驅動的外語學習:思想、方法和技術[J].外語界,2005(4).
[11]衛乃興.語義韻研究的一般方法[J].外語教學與研究,2002 (4 ):300-307.
[12]衛乃興.基于語料庫學生英語中的語義韻對比研究[J].外語學刊,2006(5).
[13]Granger,S.The Computer Learner Corpus:A Versatile New Source of Data for SLA Research[A].In S.Granger (Ed.).Learner English on Computer[C].New York:Longman,1998.endprint