張 琦,鄒艷麗
(長春師范大學,吉林長春,130123)
語料庫語言學是利用計算機技術,對巨量真實語言或語言變體進行系統地描述和探究,包括其語言特征、語境意義、語用功能等。借助計算機的檢索優勢,直觀地觀察界面和巨量的語言信息使得語料庫語言學成為語言研究與教學的主要手段之一[1]。數據驅動學習(Data Driven Learning)是 Tim-Johns(1991)等人,基于英國伯明翰大學語料庫語言學創始人John Sinclair主導的Collins COBUILD研究項目的研究成果提出的語言學習理念,其核心是利用信息化技術手段,基于大量的語料庫數據,讓學生通過觀察、概括,歸納出語言使用現象[2]。數據驅動學習理念凸顯語料庫在輔助語言教學和培養學生的自主學習能力、研究能力和利用現代化信息技術能力方面的優勢。在語言教學中,使用這一學習法的主要目的有兩個:首先,語料庫語言學強調意義與功能存在于語境之中,因此,從學習內容上看,通過索引行可以使學生更直觀地通過上下文探索發現語言的形式、意義和功能[3];其次,從學習和講授方式上,這種學習方法強調以學生為中心,挑戰了以教師和教材為中心的傳統外語教學理念,換句話說,數據驅動學習要求教師不直接和明確地向學生傳遞信息和知識,而是作為引導者和合作者,控制教學流程,以研究探索的方式配合學生知識的輸入和產出。這種語言學習方法符合以學生為中心,教師為主導的教育方針,有利于鍛煉學生發現問題和獨立思考的能力。數據驅動學習提出之初,并沒有得到廣泛的認可,隨著計算機技術與語料庫技術在外語教學中的應用與普及,數據驅動學習的重要性日漸顯現[4-5]。本文首先簡要回顧數據驅動學習的概念和特點,結合Sinclair的詞匯語法理論,介紹數據驅動學習具體實踐步驟,在此基礎上,著力評述并總結此學習理念在國內外的研究和實踐現狀,最后探討這一理念應用于實踐需要解決的問題及其未來的發展趨勢。
語料庫語言學的特征是從巨量真實文本中通過頻次、搭配和索引行三個方面觀察語言特征。建構主義學習理論認為,語言知識的習得不是從教師傳授到學生的簡單過程,而是由學生自己發現和探索的過程[6]。教師需要構建起新舊知識之間的聯系,并引導學生在已有的知識經驗和認知結構上進行正向遷移,促使學生自主探索動機的形成,從而掌握新知識。而基于語料庫的數據驅動學習理念正具備了以上特征。首先,這一學習理念通過語料庫索引行以真實語料為語言輸入。其次,數據驅動學習理念要求以學習者為中心,以自主學習為主,學生在學習過程中自我管理、自我監察和自我評估。最后,這是一種自下而上的歸納式學習方法,學生需要從大量的語言數據中找出規則,這一過程不僅可以加深他們對語言知識的理解,還會訓練他們從現象找到本質的探究能力[4]。
Sinclair提出的詞匯語法理論包括節點詞、搭配、類聯接、語義傾向、語義韻五要素[7],是語料庫語言學研究的基本組成部分。因此,數據驅動學習的實施方法也對應這五個層級體系。具體說來,主要包括以下幾個方法和步驟。
檢索節點詞(node word)和觀察索引行(concordance):這一方法主要通過把目標語料文件導入語料庫分析軟件,檢索節點詞,界面呈現出索引行,學生們可以直觀地通過檢索結果觀察到節點詞出現的頻次、所在的上下文,推導出其語境意義與功能。
分析搭配(collocation)與類聯接(colligation):搭配的學習主要是根據語料庫語言學的短語理念,通過頻次和語境意義的分析去認識語言的共現特征。Sinclair將搭配定義為“兩個或兩個以上的詞在文本中短距離內的共現”[8],即同時共現的詞項具有語境意義;衛乃興提出的搭配概念強調了頻次特征,“在文本中實現一定的非成語意義并以一定的語法形式因循組合使用的一個詞語序列,構成該序列的詞語相互預期,以大于偶然的幾率共現”[9],也就是統計學意義上的搭配。而作為語料庫語言學中詞語搭配的一個重要概念,類聯接指語言在詞匯語法范疇間的結合,即詞與語法的共選關系。語料庫語言學研究運用類聯接來描述橫組合層面上的語法結構,“類聯接不是與詞語搭配平行的抽象,而是高一級的抽象”[9-10]。例如,“turn a blind eye to”體現的是“turn+a+ADJ+NOUN+to”這一詞匯語法結構,即類聯接。語料庫根據頻次的高低,給出適用于真實語境的詞匯搭配,呈現其語境意義,這一學習方法可以使學生習得更地道的語言表達方式。
認識語義傾向(semantic preference)與擴展語境(semantic prosody):Sinclair提出,意義單位由一個主體詞和常與這個詞共現的一類詞構成,具有較為穩定的語義特征,這就形成了語義傾向和語義韻[7]。通過語義韻能表達出說話人的觀點和態度。因此,認識并學習語義傾向和語義韻,可以在避免按照語法規則生造搭配的同時掌握準確恰當的語言形式進行交際[11]。
以上基于數據驅動學習的系列操作可以讓學生在看到大量真實的語言樣本的同時,做到身臨其境,依此策劃的課堂教學和語言學習,體現了現代教育的信息性和高科技性,理論上將可以提高學生的探究、歸納和自主學習能力。但將它們運用到外語教學的實踐過程中,有收獲也有困難。
數據驅動學習理念自提出之日起就有許多專家學者進行了探索,其在高等教育階段主要集中在通用英語、學術英語及翻譯技能教學三個方面。
Hutchinson&Waters把外語教學分為通用英語(General English)和專門用途英語(English forSpecific Purposes)兩大類[12]。通用英語的教學集中在培養學生聽、說、讀、寫、譯的語言技能,旨在提高學習者的語言交際能力。基于語料庫的數據驅動學習方法可以滿足通用英語教學的多方面需求。何安平在《語料庫語言學與英語教學》一書中提出,語料庫可以應用于寫作、閱讀、語法、詞匯等各個課型[13],并給出了詳細的教學設計。在此基礎上,唐潔儀、何安平首次將語料庫運用到英語專業學生的課堂中,讓師范生學習語料庫語言學理論知識,參與語料庫建設過程,并且對自建語料庫進行對比分析,提高師范生自身語言教學和研究能力[14]。隗雪燕、王雷把教學研究重心放在寫作評閱中出現的問題上,利用寫作學習語料庫對學生的習作進行評閱,取得了良好的效果[15]。何安平、陳文宜在閱讀教學上進行了嘗試,通過自建教材語料庫,利用AntConc軟件設計預讀、預測、語境猜詞和快讀等情節,提供了可行性較高的閱讀微型技能教學設計[16]。甄鳳超、王華通過教學實踐發現,在語法課中,學生能運用語料庫從語境共現中歸納語法結構相同特征,分析語法結構模式及其表達的意義,總結并掌握新知識[17]。基于數據驅動學習在通用英語中的實踐重點還體現在詞匯教學中。詞匯一直是外語語言學習的重點,學習者對詞匯的掌握程度直接影響其聽、說、讀、寫等各項語言技能,而基于語料庫提供的真實語境,學生可以掌握理解更多詞匯。鑒于此,與語料庫相結合的詞匯教學研究也頗具多樣性。國外的 Willis[18]首先對 Sinclair和 Reunof的思想進行了提煉,提出了詞匯大綱的設想,為詞匯教學做出了鋪墊。鑒于此,Coniam、Okamoto通過整理教材中的詞匯與一般語料庫對比,發現測試教材中呈現的詞匯傾向不平衡,詞匯在語義、用法和難度上存在的局限性[19-20]。國內的相關研究更多關注詞匯搭配,如,濮建忠從類聯接、搭配這兩個與詞匯知識深度相關的關鍵層面入手,表示英語詞匯教學的重點之一應置于詞塊教學。其他眾多學者也從單個詞的使用特點出發進行個案研究,或針對一種詞匯搭配型式進行共時和歷時對比研究[22-25]。綜上所述,對于外語技能的練習,語料庫可以提供更加直觀、準確的輔助和參考,而教師作為課堂的組織者和指導者,需要在不同的課型中靈活改變教學方法,適當運用語料庫工具,激發學生興趣,提高教學效率。
專門用途英語根據不同的目的分為學術英語EAP(Englishfor Academic Purposes)和 應 用 英 語EOP(English forOccupational Purposes)。學術英語主要強調通過學科特有的語言規范和話語策略與學術共同體溝通,其目的是實現學術交流,彰顯學術創新,提高學術聲望等[26-28]。
學術寫作是目前數據驅動學習的重點研究和實踐領域之一。劍橋大學的Maggie Charles[29-30]致力于學術英語寫作的教學改革,開創性地為學生設置了每周固定的語料庫課程,要求學生學期結束后評估語料庫對他們寫作或詞匯上的幫助,最初和最終的問卷中90%以上的學生表示數據驅動學習對學術寫作的學習有積極作用,可見,有針對性的、合理的課程設置有助于學生語言能力的提高。國內也有很多專家學者專注于試行語料庫應用于學術英語教學,如,對比中外學生學術語篇某一類詞的使用情況[31-32];探索學習者短語框架的使用特征[33];歸結學術論辯與話語實踐隨社會文化等語境變遷發生變化的原因等[34],這些研究通過語料庫研究方法總結語言發展特征,旨在為教學實踐提供參考。總之,在學術語篇寫作領域,基于數據驅動的學習方法已經成為教學設計和課堂教學的重要依據和教學的目標導向。
隨著機器翻譯的普及,語料庫提供的統計學建議開始受到重視,翻譯中使用的平行語料庫可以為翻譯教學提供翔實的語言實例,提高翻譯的準確性[35]。Mona Baker[36]率先將語料庫與翻譯教學結合,隨后,國外學者如Olohan[37]、Gallego-Hernández[38]對語料庫所提供的索引行資源、共現實例及其重要意義進行了討論。國內學者也從翻譯教學設計、師生互動模式等方面提出了改進意見,并給出了語料庫輔助翻譯教學的實施方案[39-40]。由于口語的轉錄工作比較復雜,基于語料庫的口譯教學相對滯后,雖然還沒有實踐,但隨著口語語料庫的建成,將數據驅動學習引入口譯教學課堂為期不遠[41]。總之,語料庫為翻譯教學與研究提供了參考與線索,有著極其重要的價值。
在語言教學的各個階段,數據驅動學習的相關研究面向不同的群體進行了廣泛的實驗和實踐,以上三個方面僅為具有代表性的教學領域,不能囊括所有數據驅動學習的歷史和基于語料庫的教學研究與實踐的應用和創新。
綜上所述,國內外的學者和教育工作者對數據驅動學習理念和實踐進行了深入廣泛的探索,在此基礎上得出相似的結論和教學啟示。如,充分利用語料庫數據,將教材編寫建立在自然發生的語料基礎上;對比學生與本族語者語言運用的差別,檢索高頻使用搭配,幫助教師和學生掌握地道的詞語搭配行為;同時,在詞匯教學中,不因過分關注學生詞匯量的大小而忽視詞匯的語境意義,而是積極運用語料庫檢索慣例性詞塊,學會在語境中高效記憶單詞;根據不同的課型和授課目標恰當運用語料庫工具,提供沉浸式語境,尋求基于數據的、有創新性、有挑戰度的教學方式。合理運用數據驅動學習方法,可以充分調動學生的積極性,發揮學生的能動性,給學生足夠的思考和表達空間,培養發散思維,提高學生手腦并用能力,達到既定教學目標。
在語言教學中,任何方法應用于實踐都要突破一些阻礙,基于數據驅動的學習亦是如此。許多教學研究實踐發現不同階段的學生對語料庫技術的接受程度會影響其在學習過程中發揮的作用。學生的語言能力和水平越高,對數據驅動學習方法的掌握效果越好,而語言水平較低的學習者對這一方法的接受情況并不理想[30]。針對這一問題,很多學者提出了有針對性的“微本”概念[42-44]。這一策略主張將在語料庫中檢索并篩選過的文本帶到課堂上與學生討論,循序漸進地進行親自操作,讓學生更輕松地掌握數據驅動學習方法,熟悉語料庫原理和功能,加快學習進度。因此,在數據驅動學習的課堂上,教師既要具備基本的語料庫語言學理論知識和語料庫工具的使用方法,也要在運用數據驅動學習教學方法時,引導學生合理安排使用語料庫進行自主式探究,對不同語言實例背后所蘊含的功能理據進行深入淺出的講解,讓學生足夠熟悉這種學習方式,提高學習興趣及綜合運用語言的能力[45]。這對任課教師的前期知識儲備、備課投入及課堂掌控和協調能力無疑是一項挑戰。
在科學技術的推動下,語料庫語言學研究以燎原之勢不斷發展,基于語料庫語言學的外語教學研究與實踐也得到廣泛的重視和應用。在信息技術高速發展的時代,數據驅動學習方法有望成為主流。對于學生而言,利用語料庫工具可以解決許多不確定的詞匯用法、句式表達等問題。對于教師而言,基于數據驅動學習的教學模式,有助于實現“兩性一度”的教學目標。需要指出的是,盡管數據驅動學習是很多專家和學者提倡的教學法,但依舊處于探索和試用階段,仍需要廣大師生大膽嘗試,充分利用一切語料庫資源,深入地進行數據驅動學習教學研究,為外語教學拓寬道路。