張 敏
(北京信息科技大學外國語學院,北京 100192)
專業學術英語詞匯表編制及其在EAP教學中的應用
張 敏
(北京信息科技大學外國語學院,北京 100192)
以基于詞頻的英語詞匯分類方法和Coxhead學術英語詞匯表(AWL)的開發經驗為基礎,探討了運用語料庫分析軟件編制專業學術英語詞匯表(SAWL)的主要方法,包括專業語料庫的創建、詞頻統計及詞表的生成與分析。專業學術英語詞匯表對于外語教師掌握學習者的專業學術英語詞匯量、評估學術用途英語教學內容的詞匯負荷量、進行專業學術英語的體裁教學均具有較強的實用性和使用價值。
學術英語詞匯;語料庫;學術用途英語
詞匯習得一直以來被看作是語言學習中的一個關鍵組成部分,詞匯掌握的廣度和深度將直接影響語言使用者是否能夠有效地理解各種形式的語言輸入,同時自如、準確、充分地運用語言完成描述、概括、分析、闡釋等語言輸出行為。與此同時,掌握一門外語的詞匯對外語學習者來說是一項普遍令人生畏的任務,特別是當學習者將目標設定為獲取較高的外語讀寫能力[1]。Nation(2006)通過詞匯量測試推算,受過良好教育的英語本族語使用者能夠掌握大約20000個詞族(word family),而使用英語進行專業學術學習的非英語本族語使用者掌握的接受性詞匯大約為8000~9000個詞族[2]。由于詞族是指由同一詞根(word base)通過附加前綴或后綴構成的一組單詞,語言使用者可接觸到的詞匯量遠大于此,但這些詞匯在人們的語言實際運用中出現的頻次存在差異,對于循序漸進的外語學習者的詞匯學習而言也具有不同意義。隨著20世紀80年代開始大規模計算機語料庫的陸續創建和數據驅動的語言學研究方法的普及,研究者們得以通過定量的方法對詞匯進行更客觀準確的統計。將詞匯按照使用頻次來劃分,成為語料庫方法下詞匯研究的重要成果,對于外語教學也具有重要的指導意義。
Coxhead&Nation(2001)將英語詞匯劃分為四類,即高頻詞匯、學術詞匯、專業詞匯和低頻詞匯[3]。高頻詞匯涵蓋口語及各類書面語中的大部分常用詞匯,最具代表性的是由West(1953)提出的一般用途英語詞匯表GSL(General Service List),其中包含英語中最為常用的2000個詞族,覆蓋了英語口語中大約90%~95%和書面語中80%~85%
的用詞,可滿足日常一般用途英語的使用需要[4]。因此, GSL已被廣泛視為英語學習者,特別是英語初學者應率先掌握的詞匯。在此基礎上,中高級英語學習者,特別是將英語用于學術用途的學習者,應將注意力轉移到學術英語中的常見詞匯上來。學術英語詞匯,也被稱為半專業詞匯或廣泛應用于各類學科的高頻通用性學術詞匯。Campion &Elley(1971)搜集了大學生在大學學習中可能遇到的最常用500詞和常用3200詞[5]。Praninskas(1972)基于選自10個學科的10本大學教科書中的272466個詞匯,編制了美國大學詞匯表(American University Word List)[6]。Xue &Nation(1984)總結了大學詞匯表UWL(University Word List),搜集了學術語篇中除GSL以外約800個常見高頻學術詞族,覆蓋了典型的學術語篇中約8%的詞匯量[7-8]。
隨著計算機語料庫語言學的興起,研究者們陸續開始借助語料庫分析軟件對學術詞匯進行統計和分析,其中最具代表性的是由Coxhead(2000)通過Range軟件開發的學術詞匯表AWL(AcademicWordList)。該詞表基于人文、經濟、法律、科學4個大類、28個學科教科書及學術期刊350萬詞的學術英語語料庫,共計570個詞族,3107個類符,并按使用頻率劃分為10個子詞表,可涵蓋除GSL以外學術語篇中出現的約10%的詞匯[9]。AWL一經提出,由于其涵蓋的學科門類廣泛,通用性強,具有較好的普適性,即被視為由一般用途英語向學術用途英語學習過渡階段提高詞匯量的一條有效途徑。AWL與GSL兩者結合可覆蓋學術語篇90%以上的詞匯。除此以外,學術語篇還包括大約5%的專業詞匯,以及其它5%出現頻率更低的英語詞匯。
AWL基于語料庫分析軟件開發的模式和經驗得到了眾多研究者的關注和肯定,同時也促進了基于語料庫的學科專業學術英語詞匯研究。在Hyland&Tse(2007)進行的學科間學術英語詞匯的語篇覆蓋率對比研究中,AWL學術詞匯在計算機科學專業的語篇覆蓋率高達16%,而在生物學專業的語篇覆蓋率僅為6.2%[10]。Martinez(2009)建立了由826,416詞組成的農業研究論文語料庫,并通過Wordsmith Tools(WST)進行分析,結果發現AWL包含的3107個類符當中僅有1941個出現在所建語料庫中,而其中出現頻率最低的740個類符僅占整個語料庫中形符總數的1.98%[11]。學術詞匯和專業詞匯之間的實際界限也較為模糊,一定數量的專業詞匯使用頻率甚至超過了AWL當中的某些通用學術詞匯,而不同專業的通用學術詞匯的使用頻率也有所差異。因此,針對特定專業建立中小型專業語料庫,開發專業學術英語詞匯表SAWL(Specialized AcademicWord List)將有助于語言教師總結專業學術英語在詞匯、詞匯語法結構、修辭等方面的使用規律,更好地將研究成果應用到實際的英語教學中去,并使之具有更強的針對性和實用性。
基于AWL的專業學術英語詞匯表的開發和編制主要遵循以下原則與步驟:
Coxhead(2000)AWL的開發基于涵蓋28個學科350萬詞的學術英語語料庫。在此基礎上,Nelson(2000)創建了基于商務英語教材、商業刊物、商務信函合同等約60萬詞的商務英語語料庫,并在互聯網上建立了商務英語詞匯表[12];Mudraya(2006)創建了工程類專業英語語料庫,涉及電子工程、材料學、力學等專業約200萬詞的學術語篇全文,并通過WST軟件分析提取了由1260個詞族構成的工程專業學術英語詞匯表[13];Wang等(2008)創建了規模約為100萬詞的醫學研究論文語料庫,涉及32個醫學專業,發表自2000—2006年的288篇論文,從中提取了由623個詞族構成的醫學專業學術英語詞匯表[14];Martinez(2009)以AWL為基礎,自建由218篇論文組成的80萬詞的農業研究論文語料庫,通過WST篩選提取了農業專業最常用學術英語詞族92個[11]。
因此,當代專門用途英語語料庫呈現出專門/小型化的發展趨勢,“語料的體裁或主題更加專一化,語料庫的規模相應較小”[15],“只要語料庫精心設計、低至幾千詞、高至幾十萬詞的語料庫都有助于專門用途語言的研究,其中的關鍵是要保證語料庫的開放性、語料數據的充足、語料作者的多元化、以及語料與研究目的緊密關聯”[16]。專業學術英語語料庫的語料多選自專業期刊、教科書、報告、項目書等文本,選取時應遵循客觀性、隨機性和均衡性原則,盡量避免所選語料的作者、主題、篇幅、寫作時間及語料選取者的個人因素等對語料分析形成過多干擾,影響語料分析結果的可靠性和可信度。根據擬建語料庫涵蓋的專業范圍和建庫的研究目的,專業學術英語語料庫的實際大小可在幾十萬至幾百萬詞之間。
在建庫語料搜集完畢之后,應對語料進行一些必要的處理,例如將搜集的語料轉化為純文本格式,并按照統一的命名規則對其逐個進行命名,以便日后查找。對于按照IMRD模式(Introduction-Method-Results-Discussion)(Swales 1990)撰寫的學術論文或可將文本按語步進行劃分的語料,還可將各部分分別進行保存,以對比在不同語步寫作中學術英語詞匯的使用情況[17]。與此同時,還應剔除圖表、公式、參考文獻等與詞匯處理分析無關的內容。
在對語料進行詞頻統計時,可利用常見的語料庫分析軟件,如Words mith Tools,Range等,通過截詞將GSL詞匯過濾出去,并可將AWL設為匹配詞表(match list),將其余詞匯與AWL詞匯進行比對,可發現AWL統計的詞頻和所建專業學術英語語料庫中學術詞匯使用頻率的異同。例如經詞頻統計,Martinez(2009)發現其提取的農業學術英語詞匯表最常用60詞族中僅有significant,analysis,data, variation,indicate,estimate,specific,factor,identify,function, distribution,derived等26個詞族與AWL最常用子詞表1內60個詞族重疊,也從一個側面說明專業學術英語詞匯表與專業的相關性更高,對專業學習更具針對性。
在詞頻統計中,專業學術英語詞匯選擇通常遵循兩個主要標準,即范圍(range)和頻率(frequency)。在AWL的編制過程中,最終進入詞表的詞匯應不包含GSL,且能夠覆蓋建庫28個學科中一半以上學科語料,即保證入選詞匯使用范圍的廣度。與此同時,入選詞匯還應達到一定的使用頻率要求。在AWL所建350萬詞的學術英語語料庫中,最終統計生成的學術英語詞匯在語料庫中的使用頻率至少應達到100次以上,而高頻學術詞匯的使用頻率可達數千次。Hyland&Tse(2007)在進行跨學科學術英語詞匯詞頻統計時,將學術英語詞族使用的平均數作為高頻學術英語詞匯的標準,并統計得出了192個高頻學術英語詞族[10]。因此,在自建專業學術英語語料庫基礎上進行詞頻統計時,建庫者可根據實際需要來設定詞匯篩選統計的范圍和頻率標準。
通過語料庫軟件對語料的分析處理,研究者可獲得抽取語料中有關形符、類符、詞族總數等基本數據,也可通過匹配詞表或Range軟件直接將詞匯劃分為GSL、AWL及其它詞匯。結合之前設定的詞頻統計標準,可從中統計出AWL詞匯在所建專業學術英語語料庫中的使用情況,以及未包含在AWL詞表中具有本專業特色的專業學術英語高頻詞匯。在此基礎上,還可以根據所選語料的文體、主題、寫作時間、作者類型等變量,對專業學術英語詞匯進行更為具體的研究。
專業學術英語詞匯表(SAWL)的開發不僅對于詞匯研究者來說具有重要價值,對于學術用途英語(EAP)教學也具有實際的指導意義。學術用途英語作為特殊用途英語(ESP)的一個分支,已成為國內外眾多高校面向中高級學習者的英語教學以及英語水平測試的重要內容,旨在提高英語學習者使用英語進行學術學習、研究、交流等具有明確語言交流目的活動的能力。
專業學術英語語料庫的建立和相應詞匯表的編制將有助于英語教師:
通過基于SAWL的詞匯量測試,教師將能夠了解學生目前實際的專業學術英語詞匯掌握水平,找到學生在詞匯學習中的薄弱環節,為展開學術英語系列課程,例如學術英語閱讀、學術講座聽力、學術英語交際、學術英語寫作等做好基礎性的準備。學生也可從中較為直接地了解從一般用途英語向學術用途英語學習的過渡中如何進行有的放矢的學習。由于SAWL涉及學習者在本專業學習中的高頻學術詞匯,針對SAWL詞匯的學習能夠在學生的專業英語學習中得到強化和印證,也提高了學生學習英語的工具性意識和學習自主性。
一系列的觀察和實證研究發現對于將英語用于學術用途的學習者來說,造成詞匯困難的不是一般用途詞匯,也不是與學科高度相關的專業詞匯,而是介乎兩者之間的學術詞匯[18]。通過編制專業學術英語詞匯表,可以將學術詞匯和專業詞匯有效結合在一起,同時通過語料庫分析軟件的處理,將所建SAWL設為匹配詞表,可高效率的實現教學內容中專業學術英語詞匯有關覆蓋范圍和出現頻率的統計。教師可根據統計得出的結果決定教學內容的選擇、取舍、次序的安排等,引導學生進行循序漸進的學習。
專業學術英語詞匯大多較為正式,具有較強的學術氣息,為語言使用者提供了一套具有學術話語社團特色的詞匯框架與修辭手段,是構建學術語篇體驗的重要途徑之一。基于語篇體裁和語步詞匯使用特點的語料庫分析也是AWL和SAWL開發的拓展研究方向。例如,通過語料庫軟件對不同學術文體或同類語篇內不同語步進行詞匯分析,如學術詞匯在論文導言、文獻綜述、實驗方法、結果分析、結論等各語步的高頻詞匯分布,有助于學生在學術英語的學習中提高語類意識,并養成觀察語言使用規律的習慣,并通過實際的語料積累相關文體或語步的詞匯使用特點和寫作范式,提高學生使用專業學術英語的實際運用能力。
基于語料庫語言學研究方法的專業學術英語詞匯表(SAWL)的編制對于廣大語言教師而言結合了詞匯研究和實際的學術英語教學兩個方面,并且能夠做到互為促進,使得外語教師既成為專門用途語料庫的建庫者,又成為語料分析研究結果的直接受益者。大學學術英語教學作為大學基礎英語教學的延伸已引起越來越多外語教學研究者和教師的關注,學術詞匯表和專業學術英語詞匯表對于大學生順利完成基礎英語向專門用途英語的過渡,突破用英語進行學術學習、專業學習中的詞匯瓶頸障礙,將發揮十分重要的基礎性作用。
[1]Cobb T,HorstM.Is there room for an Academic Word List in French?(Draft chapter)[Electronic version]. In:B.Harley&J.Hulsteijn(Eds.),Vocabulary in a second language:selection,acquisition&testing,ProceedingsofHaifa-Leidenconferenceon vocabulary,2002.
[2]Nation I S P.How large a vocabulary is needed for reading and listening?The CanadianLanguage Review,2006, 63,1:59-82.
[3]Coxhead A,Nation P.The specialized vocabulary of English for academic purposes.In J.Flowerdew&M. Peacock(Eds.),Research perspectives on English for academic purposes.Cambridge:Cambridge University Press,2001.
[4]WestM.A general service list of English words.London:Longman,Green&Co.,1953.
[5]Campion M,Elley W.An academic vocabulary list. Wellington:New Zealand Council for Educational Research,1971
[6]Praninskas J.American university word list.London: Longman,1972.
[7]Xue G,Nation P.A university word list.Language Learning and Communication,1984,3(2):215-219.
[8]Nation I S P.Teaching and learning vocabulary.New York:Newbury House,1990.
[9]Coxhead A.A new academic word list.TESOL Quarterly,2000,34(2):213-238.
[10]Hyland K,Tse P.Is there an“academic vocabulary”? TESOL Quarterly,2007,41(2):235-253.
[11]Martinez I A.Academic vocabulary in agriculture research articles:a corpus-based study.English for Specific Purposes,2009,28:183-198.
[12]NelsonM A.Corpus-based study of business English and business English teachingmaterials[Electronic version]. Unpublished PhDThesis.Manchester:University of Manchester,2000.
[13]Mudraya,O.Engineering English:A lexical frequency instructionalmodel.English for Specific Purposes,2006, 25(2):235-256.
[14]Wang,J.Liang,S.&Ge,G.Establishment of a medical academic word list.English for Specific Purposes, 2008,27:442-458.
[15]黃大網,秦弈,徐賽穎.專門用途英語語料庫:挑戰、理據與愿景[J].寧波大學學報:人文科學版,2010,23 (5):48-52.
[16]Bowker L,Pearson J.Working with Specialized Language:A practical Guide to Using Corpora[M].London and New York:Routledge,2002.
[17]SwalesJ M.Genre analysis.English in academic and researchsettings.Cambridge:CambridgeUniversity Press,1990.
[18]Lam J.A study of semi-technical vocabulary in computer science texts,with special reference to ESP teaching and lexicography(Research reports,Vol.3).Hong Kong: Language Centre,Hong Kong University of Science and Technology,2001.
(責任編輯周江川)
H319.3
A
1007-7111(2011)01-0100-03
2010-11-10
北京信息科技大學教改項目“基于語料庫的大學生學術英語讀寫教學模式的探索與創新”(029923810)
張敏(1979—),女,講師,碩士研究生,研究方向:語料庫語言學、專門用途英語教學。