徐錦芬 范玉梅
?
中國英語課堂小組互動口語語料庫的建設*
徐錦芬 范玉梅[通訊作者]
(華中科技大學外國語學院,湖北武漢 430074)
文章論述了建設中國英語課堂小組互動口語語料庫的必要性,從該語料庫的設計原則、建設步驟與方法兩個角度提出了該語料庫的建設方案,并具體介紹了該語料庫的應用研究功能。該語料庫的建成,將為中國英語課堂研究提供大量真實可靠的數據,推動中國外語課堂教學與研究的進一步發展。
英語課堂;小組互動;口語語料庫
小組互動是以學習者為中心的外/二語課堂的一個普遍特征,得到了心理語言學理論、社會文化理論以及教育學理論的支持。大量實證研究也證明,小組互動有利于促進學習者的語言發展。但是,我們對“學習者在小組互動中產出的中介語質量如何”、“小組互動在課堂語言學習中如何促進學習者的語言發展”、“小組互動的作用機制是什么”等問題的解答卻知之甚少。導致這一狀況的主要原因在于缺乏基于大樣本的系統研究,而學習者語料庫的發展為基于大樣本的數據分析提供了重要支持。因此,迫切需要構建一個基于英語課堂的小組互動口語語料庫,并基于該語料庫對中國英語課堂小組互動進行系統的描寫、分析和研究,從而推動中國英語課堂教學與研究的進一步發展。
1 小組互動研究的現狀
從20世紀80年代至今,隨著外/二語教學理論逐漸由傳統的以教師為中心轉向以學習者為中心,互動一直是國外語言學界關注的熱點。國內對課堂互動的研究經歷了20世紀80年代初的理論引進熱潮后,在隨后的近20年里一直趨于沉寂。直到21世紀初,隨著國內外語界越來越強調外語課堂必須以培養學生的交際能力為目標,課堂互動研究才重新開始得到廣大外語教師和研究者的重視[1],而小組互動作為一種典型的課堂互動形式得到了廣泛提倡。
近年來,國內外學者主要從以下三個方面開展課堂小組互動研究:①小組互動的作用,如為學習者提供更多使用目標語的機會,促進學習自主性和自我導向學習[2];②小組互動的影響因素,如學習者語言水平[3]、任務類型[4]、任務難度[5]等;③小組互動中的語碼轉換,如Cook[6]認為語碼轉換是語言教學和學習的一種至關重要的交際手段。這三方面的研究,為本研究了解小組互動對外/二語發展的作用提供了重要依據。
2 英語語料庫建設的發展趨勢
自1961年建成最早的機讀語料庫Brown Corpus以來,國內外相繼建成了不同類型、用途、規模的語料庫。近年來,隨著計算機科學的飛速發展及其在語言研究領域的應用,英語語料庫的建設與研究呈現出一些新的發展趨勢。
(1)語料庫與二語習得研究相結合而出現的學習者語料庫成為一個重要的發展方向
目前,國外已建成的有影響力的學習者語料庫主要有劍橋學習者語料庫(Cambridge Learner Corpus,CLC)、國際英語學習者語料庫(International Corpus of Learner English,ICLE)、日本英語學習者語料庫(Japanese EFL Learner,JEFLL)等[7],而國內學習者語料庫主要有中國學習者英語語料庫(Chinese Learner English Corpus,CLEC)、中國英語學生口筆語語料庫(Spoken and Written English Corpus of Chinese Learners,SWECCL)等。國內外的這些學習者語料庫均以書面語為主,但“就第二語言習得與外語教學研究而言,學習者口語語料庫的建設不僅必要,而且迫切:僅憑書面語或有限的口語證據構建的習得理論極可能失之偏頗,而基于大量口語語料進行的習得研究則會更具效度和準確性”[8]。隨著研究者對口語語料重要性認識的深化以及數據采集手段的改進,學習者口語語料庫的建設與研究成為語料庫中的一股新生力量,國外一批重要的學習者口語語料庫也應運而生,出現了國際英語口語中介語語料庫(Louvain International Database of Spoken English Interlanguage,LINDSEI)、日本標準化英語口試語料庫(Standard Speaking Test Corpus of Japanese EFL Learners,SSTC)等。中國的學習者英語口語語料庫建設方興未艾,建成了中國學習者英語口語語料庫(College Learners’ Spoken English Corpus,COLSEC)、SWECCL的口語部分和華南師范大學的LINDSEI-China,并統一了轉寫方案和標注規則[9]。值得一提的是,國內建成的口語語料庫主要以大型考試的腳本為語料來源。
(2)專門的話語語料庫建設逐漸受到重視
密歇根大學學術口語語料庫(Michigan Corpus of Academic Spoken English,MICASE)收集了來自密歇根大學教師、工作人員以及各層次的學生約170萬詞的學術口語,錄制的話語事件包括課堂講座、討論、學位答辯等[10];英語本族語課堂話語語料庫(ClassBank English Corpus)是美國TalkBank項目的子項目,通過采集真實課堂中教師與學生的教學對話語料而建成[11];香港英語會話語料庫(Hong Kong Corpus of Conversational English,HKCCE)約有50萬詞,包含日常會話、學術話語、商業話語以及公共話語等四個子庫[12];由芬蘭赫爾辛基大學Mauranen教授主導建成的英語作為學術通用語語料庫(English as a Lingua Franca in Academic Settings,ELFA)收集了大學課堂、學術會議等學術場景下的英語語料,共計100萬詞[13]——這些專門的口語語料庫為研究學術話語、課堂話語以及自然會話提供了大量真實的語料。
(3)中國大陸課堂話語語料庫的建設發展迅速
在中國大陸,華南師范大學何安平教授帶領創建了“課堂教學實況語料庫”,包括中外大、中、小學英語課的教學話語語料庫[14];東北師范大學外國語學院課堂話語語料庫課題組建設完成了“基礎英語課堂話語語料庫”[15]。此外,由南京師范大學劉學惠教授[16]主導的“英語師范生課堂話語語料庫”項目,主要用來評價師范生的語言水平和教師的語言教學能力。雖然課堂話語語料庫的建設逐漸受到研究者的重視,但不難發現,這些語料庫主要從教師視角收集語料,其應用也主要集中在教師話語[17][18]研究,而從學習者視角收集語料的語料庫還未受到重視。
(4)歷時英語語料庫建設提上日程
Granger[19]在分析學習者語料庫的未來研究方向時指出,今后要有更多的縱向研究,而且以過程為導向的定性研究要對以結果為導向的定量研究進行補充。當前,國內外的書面語和口語歷時英語語料庫的開發利用都極其有限,這與跟蹤收集大量語料的難度緊密相關。盡管如此,研究者還是克服重重困難,建成了一些發展性語料庫。如Housen[20]籌建的“青年學習者中介語語料庫”,收集了不同一語背景的歐洲小學生在不同發展階段的英語學習數據;新加坡南洋理工大學國立教育學院開發的“教育研究語料庫”[21],包含1000節課堂教學的錄音錄像、教學資料、課堂觀察以及學生作業,有助于研究學習者的學習過程;中國學者李文中構建了“學習者電子檔案語料庫”,其設計中也突顯了關注學習過程的理念[22]。
3 當前小組互動研究與語料庫建設的不足
縱觀國內外,盡管當前小組互動研究和語料庫建設都取得了豐碩成果,但同時也存在一些不足:①學習者語料庫發展不平衡,基于真實語言課堂的小組互動口語語料庫還未引起重視;②當前的學習者語料庫多采取橫向設計,只收集共時性語料,以結果為導向,忽視了學習者語言發展的動態過程;③國內已有的學習者口語語料庫大多基于考試語料,而考試語料與自然課堂語料有很大區別;④已有的課堂小組互動研究結果一般是基于單次實驗、較短的課堂錄音轉寫語料或個案研究而得出,涉及的樣本少,研究的時間短,語料的代表性和結論的推廣性都受到很大限制;⑤主要的實證研究大都是在二語課堂或者實驗室環境下開展,鮮見基于外語課堂環境下的研究。
因此,如何借鑒國內外已有的研究成果,構建一個科學抽樣的、動態的、有代表性的基于自然英語課堂的小組互動口語語料庫并進行相關研究,以彌補上述不足,已成為當前中國外語界迫切需要完成的重要課題之一。
語料庫的建設方案與建庫目的緊密相關。中國英語課堂小組互動口語語料庫(下文簡稱“本語料庫”)的建設以反映中國各級英語課堂小組互動的實際情況為目標,旨在通過系統地收集中國初中、高中以及大學英語課堂小組互動中產出的中介語語料,以便客觀、準確地反映中國各級英語學習者通過課堂小組互動進行英語學習并由此產生的語言發展狀況。
1 語料庫的設計原則
為了確保所建語料庫與研究目的一致,本語料庫的建設必須遵循以下四項設計原則:
(1)代表性原則
代表性原則是建設語料庫應遵循的首要原則。Leech[23]指出,語料的代表性是指使用該語料庫語料獲得的分析結果可以概括成為這種語言整體或指定部分的特征,因此語料庫是否具有代表性直接關系到在語料庫基礎上所做出的研究及其結論的可靠性和普遍性[24]。一般來說,“對于一個無限的總體來說,在其它條件相同的情況下,樣本越大則代表性越好”[25]。英語課堂小組互動口語語料庫定位為專門的口語語料庫,語料庫的總庫容初步設計為60萬詞,涉及三個層次的英語課堂,即每層次包含20萬詞左右,后續研究可以在此基礎上不斷擴充庫容量。雖然與通用語料庫相比這一規模并不算大,但對于課堂口語語料庫來說是非常可觀的,能基本滿足英語教學研究的需求。此外,本語料庫所收集的語料應涵蓋中國不同區域、不同層次、不同類型學校的英語教學課堂,并能代表中國英語學習者的中介語發展狀況。
(2)真實性原則
語料庫中的所有語料都要有真實性,即語料收集的是基于人們真實的交流而非實驗條件或者其它人工條件下的交流信息[26]。因此,對于外/二語教學來說,采用誘導、內省方法獲得的實驗數據并不是合格的學習者語料庫的語料。本語料庫中語料的真實性體現在所有語料不是研究者為了研究目的去誘導學習者產出的,而是在自然課堂情形下學習者完成教師安排的各種教學活動時所產出的——這種即興、較自由的話語,真實地反映學習者的語言運用特征和互動特征。并且,每一次小組互動事件都會被完整地錄制下來,而不是只抽取其中的一部分細節予以錄入,故能夠反映整個互動過程,有助于今后的應用研究。由于小組互動會話通常會限定學習者的互動話題和時間,故小組互動會話不如日常交流中的自然會話那樣“真實”,而是一種半自然的[27]會話。但是,只要小組互動是一項真實的課堂活動,那么,在這項真實的活動中產出的口語語料就是真實的語料,由此而建成的語料庫就是具有真實性的語料庫。對于以學習為目的的外語課堂來說,這樣的語料能基本滿足教學研究的需求。
(3)動態性原則
堅持語料收集的動態性原則是本語料庫的一大特色,也是最具挑戰性的部分。為此,本研究堅持每個星期錄制一次學習者課堂互動會話,并跟蹤收集初中、高中以及大學英語學習者一年中在英語課堂小組互動中產出的中介語語料。這樣一來,本研究不僅能記錄下學習者一年中語言的發展狀況,便于研究學習者中介語的動態發展模式和規律,而且還能對學習者學習過程中的“微變化”進行細致描述,故對后期研究具有重要意義。
(4)平衡性原則
平衡性原則是指語料庫中各部分語料的均衡性問題。本語料庫中的語料來自初中、高中以及大學英語課堂,代表著不同的英語學習階段,要保證各級英語課堂語料數量基本相同。從學校類型來看,綜合性大學、理工類大學、師范類大學等不同類型大學的語料數量也應相當。另外考慮到互動任務對語言產出的影響,在收錄語料時也應盡可能地使不同任務的語料樣本相當。
2 語料庫建設的步驟與方法
(1)語料庫結構設計
為客觀、真實、全面地反映當前中國各級英語課堂小組互動的實況,本語料庫語料采集對象為初中、高中和大學三個層次的學習者,他們產出的小組互動語料分別構成三個子庫:初中英語課堂子庫、高中英語課堂子庫以及大學英語課堂子庫。每個子庫都由學習者變量信息、任務變量信息、標注語料和未標注語料等四部分組成,做到生、熟語料分開存放。其中,標注語料主要進行頭文件信息、詞性和話語信息標注;未標注語料包含文本語料和錄制的音頻語料,便于今后研究時進行核對。考慮到外語學習過程會受多種變量的影響,因此在設計本語料庫時,本研究特別強調將學習者變量和任務變量分別獨立做好文檢記錄(Documentation),供研究者根據自己的研究目的,提取相關語料構建自己的研究語料庫。具體來說,本研究主要考慮了五個學習者變量和三個任務變量——五個學習者變量分別為英語水平、性別、專業、學校、小組人數,三個任務變量則分別為討論話題、任務類型、互動時間。
(2)語料采集
語料的采集工作分三步進行:①對參與教師進行培訓,說明研究者的語料收集要求和錄音工具的使用,特別針對小組互動的任務類型、互動話題、互動時間、小組人數安排等重要變量進行培訓。該培訓的目的是將這些變量控制在較大的范圍內,以便今后研究工作的開展。如為了控制話題范圍,可以指導教師選擇生活、學習、社會熱點等問題設計小組互動話題。②開展先導研究,在各層次學校選取一個自然班收集1小時的語料,按照轉寫方案和標注方案分別進行轉寫、標注,檢驗所制定方案的可行性,并進行相應的修正。③在此基礎上,進行大規模的語料采集工作。語料采集工作每星期一次,持續一年時間,語料采集與轉寫、標注同步進行。
(3)語料庫的轉寫與標注
上海交通大學在建設COLSEC語料庫期間,探索了一套實用的學習者口語語料庫轉寫和標注方案,可供建設本語料庫借鑒。COLSEC語料庫包含學生與學生之間的自由討論話語類型,與本語料庫的課堂小組互動話語較為相似,因此借鑒COLSEC語料庫的轉寫與標注方案,也有利于今后的比較研究。具體來說,轉寫錄音語料要堅持“如實轉寫”原則,即如實地轉寫互動小組每位成員的原始語句,不回避錯誤,對其所用詞匯、短語、句式等都不做任何修改,以最大限度地保持語料原貌;對于單詞拼寫體系,本研究則規定統一采用美式單詞拼寫規則,而且對于學習者有發音錯誤的單詞,在能識別的情形下都采用正確拼寫。
對于標注,本研究擬采用XML格式對語料庫的頭文件信息、話語信息及詞性等進行標注:①頭文件信息包括小組互動活動的基本信息,如小組互動參與者的性別、年級、專業、學校、英語水平、語料收集時間、地點、互動話題、互動任務類型等。準確的頭文件信息標注,有助于研究者提取某一類參與者或者某一類話題的話語進行研究[28]。②話語信息標注主要涉及話輪、打斷、重疊、重復、停頓以及一些非言語聲音標注,這些標注為研究話語結構、交際策略、語用能力等提供了重要的數據[29]。話語信息標注主要依靠人工完成,雖然是最耗時、耗力的工作,但對本語料庫的后續應用研究意義重大。③相比前兩類標注,詞性賦碼相對容易,因為隨著賦碼軟件的開發及發展,詞性標注基本實現了自動化。如CLAWS、AGTS等都是廣泛使用的英語語料庫賦碼器,但由于這些賦碼器乃依據本族語語料而開發,故被應用于學習者語料時仍會存在一些問題,還需人工校對。隨著研究的深入,研究者還可以根據自己的需要進行更多標注。
本語料庫建成后,將解決當前英語課堂小組互動研究缺乏大樣本的資源瓶頸問題,并為學界基于課堂的二語習得研究提供大量真實可靠的數據,是對現有學習者口語語料庫的重要補充。本語料庫的應用研究功能主要包括:
①研究學習者的詞匯、語法、句法、口語語篇等中介語的特點及規律。一方面,縱向或者橫向研究中國英語學習者課堂環境下中介語的發展規律,如可以基于本語料庫驗證二語習得中的語言發展假設;另一方面,運用中介語對比分析方法,將本語料庫中的語料與本族語語料或者其他英語學習者語料進行對比研究,總結中國英語學習者中介語的發展特征與變化趨勢,從而更好地解釋二語習得中的遷移、僵化等重要問題。
②研究中國英語學習者在課堂環境下產出話語的互動特征,并利用動態性語料的特點跟蹤研究互動特征對學習者二語發展的影響。首先,研究學習者的互動模式特征及其如何運用語言手段來展現互動特征(如互動模式、協商策略、反饋語、糾正性反饋等)。其次,基于社會文化理論、認知互動理論等理論框架,研究這些互動特征對中國各層次英語學習者語言發展的影響,并進一步考察各變量(如任務、性別、英語水平等)對互動過程、互動產出的影響。
③研究基于語料庫的學習者課堂互動能力發展。越來越多的研究者將非本族語學習者視為“互動會話的參與者”,而不再是“能力欠缺的交際者”[30]。從這一視角出發,語言學習被看作是發展互動能力而不是語法能力[31]。在中國外語學習環境下,課堂小組互動是學習者學習、展示其互動能力的重要方式。因此,可以運用會話分析研究中國英語學習者如何配置互動資源(包括如何進行話輪轉換、如何配置語言或非語言資源等)、如何跟蹤研究英語課堂話語實踐、如何促進學習者互動能力發展等問題。
語料庫建設是一項費時費力的巨大工程,建設基于課堂互動的動態學習者口語語料庫更是如此。但這也是一項有意義、有價值的工作,因為借助學習者語料庫中“先進的語料處理手段、真實的語言數據、嚴格的設計標準和獨特的分析模式”更有利于對英語課堂小組互動進行全面、系統的研究[32]。近年來,隨著“翻轉課堂”等新的教學模式被引入英語課堂,小組互動教學得到了更廣泛的運用。因此,只有對中國各級英語課堂小組互動進行基于大樣本的研究,才能更好地反撥英語課堂互動教學。而且,學習者的英語口語能力和互動能力是一個動態發展的過程,只有融合縱向研究與橫向研究,才能更好地揭示中國課堂英語學習者中介語的發展特征與變化規律。期待國內外有更多課堂互動及語料庫研究的愛好者積極加入本語料庫建設的行列!
[1]徐錦芬,寇金南.大學英語課堂小組互動策略培訓實驗研究[J].外語教學與研究,2011,(1):84-95.
[2]Philp J, Adams R, Iwashita N. Peer interaction and second language learning[M]. New York, NY: Routledge, 2014:3.
[3]Watanabe Y, Swain M. Effects of proficiency differences and patterns of pair interaction on second language learning: Collaborative dialogue between adult ESL learners[J]. Language Teaching Research, 2007,(2):121-142.
[4]龐繼賢,吳薇薇.英語課堂小組活動實證研究[J].外語教學與研究, 2000,(6):424-430.
[5]Kim Y J. The effects of task complexity on learner-learner interaction[J]. System, 2009,(2):254-268.
[6]Cook V. Using the first language in the classroom[J]. Canadian Modern Language Review, 2001,(3):402-423.
[7]王立非,孫曉坤.國內外英語學習者語料庫的發展:現狀與方法[J].外語電化教學, 2005,(5):19-24.
[8][28][29]衛乃興,李文中,濮建忠.COLSEC語料庫的設計原則與標注方法[J].當代語言學, 2007,(3):235-246.
[9]甄鳳超,張霞.語料庫語言學發展趨勢瞻望——2003語料庫語言學國際會議綜述[J].外語界, 2004,(4):74-77.
[10]Swales J M. Corpus linguistics and English for academic purposes[J]. Information Technology in Languages for Specific Purposes Educational Linguistics, 2006,(7):19-33.
[11][14]劉慧,馬慧穎.英語課堂話語語料庫研究述評[J].天津師范大學學報(基礎教育版),2013,(3):46-48.
[12]Cheng W, Warren M. Facilitating a description of intercultural conversations: The Hong Kong Corpus of Conversational English[J]. ICAME Journal, 1999,(23):5-20.
[13]Mauranen A, Hynninen N, Ranta E. English as an academic lingua franca: The ELFA project[J]. English for Specific Purposes, 2010,(3):183-190.
[15]劉永兵,林正軍,王冰.基礎英語課堂話語語料庫的建構與研究功能[J].當代外語研究,2010,(8):17-21.
[16]劉學惠.英語師范生課堂話語的建庫、分析和應用[J].外語電化教學,2006,(5):41-45.
[17]何安平.基于語料庫的英語教師話語分析[J].現代外語,2003,(2):161-170.
[18]劉永兵,張會平.基于語料庫的中學英語課堂規約話語研究[J].外語與外語教學,2010,(4):14-18.
[19]Granger S. A bird’s-eye view of learner corpus research[A]. Granger S, Hung J, Petch-Tyson S. Computer learner corpora, second language acquisition and foreign language teaching[C]. Amsterdam: John Benjamins Publishing Company, 2002:11-14.
[20]Housen A. A corpus-based study of the L2-acquisition of the English verb system[A]. Granger S, Hung J, Petch-Tyson S. Computer learner corpora, second language acquisition and foreign language teaching[C]. Amsterdam: John Benjamins Publishing Company, 2002:77-116.
[21]Hong H. SCoRE: A multimodal corpus database of education discourse in Singapore schools[A]. Proceedings from the corpus linguistics conference series[C]. Birmingham: University of Birmingham, 2005:14-17.
[22]陳功,梁茂成.首屆全國學習者語料庫專題研討會綜述[J].外語電化教學,2010,(4):77-80.
[23]Leech G. The state of the art in corpus linguistics[A]. Altenberg B, Aijmer K. English corpus linguistics[C]. London: Longman, 1991:8-29.
[24][25]楊惠中.語料庫語言學導論[M].上海:上海外語教育出版社,2002:133.
[26]Sinclair J. EAGLES preliminary recommendations on corpus typology[OL].
[27]Granger S. Learner corpora[A]. Chapelle C A. The encyclopedia of applied linguistics[C]. Oxford, UK: Wiley-Blackwell, 2012:3235-3242.
[30] Firth A, Wagner J. On discourse, communication and (some) fundamental concepts in SLA research[J]. Modern Language Journal, 1997,(3):285-300.
[31]Young R. Sociolinguistic approaches to SLA[J]. Annual Review of Applied Linguistics1999,(19):105-132.
[32]鄧耀臣.學習者語料庫與第二語言習得研究述評[J].外語界,2007,(1):16-21.
編輯:小米
The Construction of Spoken English Corpus of Group Interaction in Chinese English Classrooms
XU Jin-fen FAN Yu-mei[Corresponding Author]
()
The paper discussed the necessity of constructing the Spoken English Corpus of Group Interaction in Chinese English Classrooms and put forward its construction scheme from the aspects of construction principles, construction procedures and methods. The paper also concretely introduced the research functions of this corpus. The completion of this corpus will provide a large number of real and reliable data for Chinese English classroom research and promote the development of domestic foreign language teaching and research.
English classroom; group interaction; spoken corpus
G40-057
A
1009—8097(2016)11—0107—07
10.3969/j.issn.1009-8097.2016.11.016
本文為2015年度國家社會科學基金項目“中國英語課堂小組互動口語語料庫建設與應用研究”(項目編號:15BYY0757)的階段性研究成果。
徐錦芬,教授,博士,研究方向為二語習得、教師發展、應用語言學,郵箱為xujinfen@hust.edu.cn。
2016年2月1日