蔡基剛
(復旦大學 外文學院,上海 200433)
[摘要] 學術英語是專門用途英語的重要分支。與衡量學生英語水平進步的通用英語測試不同,學術英語測試是以滿足專業學習和工作的需求為驅動的。比較專門學術英語測試,通用學術英語更為流行,它從語言能力、學術技能和學術素養三個維度構成評估和測試的內容,既注重學生的語言基本功的訓練,又起到了培養學生跨學科的、用英語進行學習和工作的學術技能的作用。通用學術英語評估系統是基于需求分析的,可以建立以項目研究為核心的形成性評估和以綜合考察為核心的終結性評估。 寫作部分有兩種形式。1)文獻綜述題。提供3個文章段落(大約150詞左右),一般是正式學術論文的部分,或結論的發現部分。這3個段落不僅主題相同,而且要和聽力中的一篇主題相同。要求考生根據這3個段落和回憶前面聽過的一篇講座,寫出一篇100詞左右的綜述性文章。考生必須整理和歸納這4篇材料的觀點,發現異同或因果等,進行報告。2)評論題。根據所給出的和閱讀文章相關主題的命題作文題目,進行150詞左右的短文寫作。寫作中要通過引用前面4篇材料的相關觀點來說明自己的觀點。這兩項寫作任務由于要求在引用時必須使用轉寫技巧,必須提供文內引用出處和文獻參考,因此不僅鍛煉了學術規范的寫作能力,也促進了他們的批判性思維能力。
[關鍵詞] 學術英語;評估;測試
通用學術英語評估體系探索與研究
蔡基剛
(復旦大學 外文學院,上海200433)
[摘要]學術英語是專門用途英語的重要分支。與衡量學生英語水平進步的通用英語測試不同,學術英語測試是以滿足專業學習和工作的需求為驅動的。比較專門學術英語測試,通用學術英語更為流行,它從語言能力、學術技能和學術素養三個維度構成評估和測試的內容,既注重學生的語言基本功的訓練,又起到了培養學生跨學科的、用英語進行學習和工作的學術技能的作用。通用學術英語評估系統是基于需求分析的,可以建立以項目研究為核心的形成性評估和以綜合考察為核心的終結性評估。 寫作部分有兩種形式。1)文獻綜述題。提供3個文章段落(大約150詞左右),一般是正式學術論文的部分,或結論的發現部分。這3個段落不僅主題相同,而且要和聽力中的一篇主題相同。要求考生根據這3個段落和回憶前面聽過的一篇講座,寫出一篇100詞左右的綜述性文章。考生必須整理和歸納這4篇材料的觀點,發現異同或因果等,進行報告。2)評論題。根據所給出的和閱讀文章相關主題的命題作文題目,進行150詞左右的短文寫作。寫作中要通過引用前面4篇材料的相關觀點來說明自己的觀點。這兩項寫作任務由于要求在引用時必須使用轉寫技巧,必須提供文內引用出處和文獻參考,因此不僅鍛煉了學術規范的寫作能力,也促進了他們的批判性思維能力。
[關鍵詞]學術英語;評估;測試
收稿日期:2015-04-30
基金項目:本文為國家社科基金項目(項目編號:09BYY027)和上海市教委科學研究重點項目(項目編號:A1301)階段性成果。
作者簡介:蔡基剛,男,復旦大學外文學院,教授,博導。研究方向:對比語言學和應用語言學。
[中圖分類號]H319
[文獻標識碼]A[文獻編號] 1002-2643(2015)04-0040-08
Abstract:EAP is one of the important branches of ESP. Its tests are driven by the needs to use English in students’ academic studies and in their future careers as opposed to General English tests which are driven by learning languages. Compared with ESAP tests, the EGAP test gains more popularity because it measures the test takers’ academic skills and literacy as well as language abilities. It contributes to the promotion of the students across disciplines to use English in their academic studies and in their future work.
A Study of English Testing for General Academic Purposes
CAI Ji-gang
(College of Foreign Languages and Literature, Fudan University, Shanghai 200433, China)
Key words: EAP; measurement; testing
1.0引言
新近頒布的《大學英語教學指南》把專門用途英語納入大學英語教學的主要內容之一,這樣的規定是我國自1980年有大學英語教學大綱以來第一次,表明我國大學英語教學的定位開始發生變化。由于學術英語在專門用途英語中占主導地位(Swales,1988),學術英語正成為許多院校大學英語教學的發展方向。中國學者和教師在探索學術英語教學的實踐中,對學術英語需求分析、學術英語課程設置、學術英語教學方法、學術英語教材編寫等作了較多的研究,但對學術英語評估和測試比較困惑:如專門學術英語測試和專業英語測試有何區別?通用學術英語和目前的通用英語的差別又在哪里?如何評估學術英語學生的表現。我們的文獻調查也發現,討論學術英語評估和測試的文章相對較少。本文結合中國高校正在開展的學術英語教學,將討論學術英語評估和測試的必要性、內容和體系建立。
2.0專門用途英語測試的理論依據
學術英語或專門用途英語測試是否必要?一些傳統的觀點認為:1)專門用途英語能力無非是通用英語能力加上一些專業詞匯,因此只要通用英語基礎扎實,專門用途英語能力自然會高,兩者有極大的相關性,專門用途英語測試沒有必要;2)專門用途英語測試合理性不夠,因為一個學醫的學生可以憑自己的專業知識而不是語言能力答對題目,而一個沒有醫學知識背景的考生,盡管英語基礎很扎實,可能因為缺乏必要的知識在考試中失敗,這就違反了測試理論中關于考試中不應包括與構念無關的因素(construct irrelevant variance)。
根據Douglas(2000),專門用途英語測試的理論依據有三條:1)語言使用和交流是依據語境和情景變化的;2)專門用途語言的表達更為精確;3)專門用途英語測試融入專業知識。我們認為,專門用途英語測試最大的理論依據就是根據不同專業/行業對英語學習和工作的需求。盡管語言有其共核部分,如基本詞匯和語法,但是不同的專業/行業不僅有其特定的詞匯,還有特定的表達方式,如不同的語類語步、語篇結構等。例如導游和護士用的英語要比律師寫合同的英語口語化,更具有面對面交流的特點。同樣是書面語,醫生寫的病例和生物學家寫的實驗報告有很大的區別。同樣是國際學術論文,自然科學的論文和人文社會科學論文都有引言、主體和結論三大部分,但前者的主體部分細分為方法、結果和討論等語步,而后者更多的是按話題內容逐步展開。即使是自然科學,摘要的寫法也不一樣,如醫學的摘要是分論文目的、研究背景、運用方法、主要發現、存在不足等分段寫作,而一般物理、化學的論文摘要則放在一段里,而且長度也短。換句話說,一個通用英語能力較強的學生沒有專門用途英語的訓練是無法勝任用英語作為工具的專業學習和工作的。這種需求在高等教育國際化和經濟全球化時代更為迫切,因為無論什么專業或行業的人,只要參加國際交流,都涉及專門領域的活動,都必須用帶有專業或行業特點的英語來進行口語和書面交流。正如Hutchinson & Waters(1987:144)說的專門通用英語測試之所以重要,是因為它能評估考生開展某項學習和工作中的交際任務的能力,而不是一般語言能力。
學術英語測試和通用英語測試理論依據上的差異就在于此,前者是以專業/行業需求為驅動,測試內容的構成是基于對目標語使用情景分析的,換句話說,考生在目標語使用情景中所要求完成的學習和工作任務被轉化為測試任務,用試題形式反映出來。而后者一般是以二語習得理論為指導,測試內容是根據語言知識難易度和學生語言水平等級來制定的,目的是測試考生的語言水平,并不考慮考生的特定需求。舉一個簡單例子,在評判考生的主觀題中,無論是口試還是書面寫作,通用英語考試的考官主要聽這個學生的發音是否正確,句子是否連貫,表達是否流利;在寫作中主要看這個學生的語法(如時態、第三人稱一致性等)和句子使用是否正確等等,內容表達的豐富度往往是其次的。但在學術英語考試中,不僅需要考慮上述因素,還要考慮語體是否得當,如學術英語寫作中是否正確使用正式書面語詞匯和結構;要考慮學術規范性,如對引用內容是否正確轉寫、歸納和綜合,更重要的是考慮內容的深度性和邏輯性。一句話,學術英語考試測試學生能否達到用英語從事專業學習和工作的能力。
3.0專門用途英語考試的效度性
一個好的考試是信度和效度的結合。信度是指一項測試所產生的結果具有一致性和穩定性,即一個考生在相同條件下重復參加同樣試卷的考試,其考試結果應當是一致的;效度是指“一項測試是否測量了它所要測量的東西”(Lado,1961)。效度有各種各樣,但主要有四種:內容效度(內容應緊扣教學目標和教學大綱)、預測效度(考試結果能準確預測考生未來能力)、構念效度(試卷以一定的理論為基礎)和共時效度(一份試卷的測試結果與旨在考核相同內容的另一份試卷的測試結果一致)。但是一個社會公認度很高的考試,不僅要有信度和效度,而且還要有一定的價值意義(value implications)和所產生的積極的社會后果(social consequences)。為此,美國著名教育學家Messick(1989)把這兩個東西放入了效度的范疇。如從這個角度上說,專門用途英語的效度要更高,因為它超越了單純語言測試,為一定的社會目的服務,如能夠滿足用人單位找到合適人才的需求,具體表現在能滿足專業學習需求和工作需求。前些日子香港中文大學、香港大學等部分港校宣布從2015年起他們的研究生入學外語要求不再承認大學英語六級成績,轉而統一接受雅思和托福成績,原因就是大學英語六級只是一種通用英語考試,其測試的內容并不能滿足這些大學所需要的學術英語能力的需求。
學術英語測試的價值性首先體現在其測試的內容是和國家外語能力政策是非常相關的,能滿足大學生在新形勢下的專業學習和工作的迫切需求。學術英語是專門用途英語兩大分支中最重要的一個。另一個是職場英語。學術英語最早是英美大學“為國際留學生開設的預科性質的英語強化課程,目的是幫助學習者能以英語作為教學語言學習專業課程或從事研究活動”(Jordan,1997;Dudley-Evans & St. John,1998)。但是進入本世紀,Flowerdew & Peacock (2001)發現,學術英語教學不斷從高校教學語言為英語的國家和地區(如英美、加拿大和亞洲的馬來西亞、新加坡和我國香港等)向高校教學語言為母語的國家和地區(如西歐國家、拉丁美洲和亞洲的日本等)發展,而且,后一類學習學術英語的學生數量遠遠超過前一類。其中最大的原因就是高等教育國際化和英語作為學術界的國際通用語地位的上升。前者表現在國際化課程的開設。如在德國,為了適應國際化課程的建設,吸引國際留學生以及增強德國本土學生的專業領域內競爭力,許多大學都推出了與全英語專業課程,開設為此配套的學術英語課程就熱了起來。在日本、韓國,大力推進全英語課程已被政府視作推動高校教育發展,培養國際競爭性人才的主要措施,我國也是如此。如《國家中長期教育改革和發展規劃綱要(2010-2020)》不僅提出加強國際化課程的建設,而且提出高校要培養大批能夠參與國際競爭的國際化人才,即在自己的專業領域具有較強外語能力的人才。而學術英語就是從通用英語走向全英語課程的重要橋梁。另外,由于英語已成為國際各學科研究成果交流和發表的國際通用語(lingua franca),大學生和科技工作者不得不要用英語來汲取本專業的最新研究情況。正如Flowerdew & Peacock(2001)所說,不管這個大學的教學語言是英語還是母語,只要不想與國際學術社會隔離,學生都需要用英語查找專業文獻,參加國際學術交流。而這就需要學術英語來支撐。

表1 通用學術英語測試與基礎通用英語測試的區別
4.0學術英語測試內容與能力
Jordan(1997)把學術英語分成了寬窄兩種模式,前者是通用學術英語EGAP(English for General Academic Purposes),后者是專門學術英語ESAP (English for Specific Academic Purposes)。EGAP主要考查一般學術口語和書面的交流能力,如文獻閱讀、學術寫作(包括規范引用和參考文獻)、聽講座、記筆記、參加學術討論等(Alexander, Argent & Spencer,2008)。ESAP是以某一學科領域為內容的英語教學,如軟件英語、科技英語、工程英語、醫學英語、生物英語等課程,注重這一學科詞匯、句法、篇章、體裁和交流技能的教學;如果說通用學術英語是“適合所有專業學生的具有共性的學術能力的教學”,那么專門學術英語則是“適合具體專業特點的英語及其技能的教學”(Dudley-Evans & St.John,1998)。例如,現在的雅思考試(A類),托福考試和GRE考試就是屬于通用學術英語考試,而GRE專類考試(分數學、生物、醫學、化學、物理、文學和心理等八種)和GMAT考試就是專門學術英語考試。
但是學界對于專門學術英語測試爭議較大,因為涉及專業內容,只能根據考生不同專業分成不同的測試,這樣受眾面少,不宜大面積推廣,而且融入一定的專業知識會出現構念無關的因素——是考專業知識還是測試語言能力?這就影響了測試的效度。因此,雅思考試早期試用過適合不同專業的卷子(如物理、生物、社會、醫學、技術、通用學術)的方法沒有成功,最后改為了現在的通用學術英語測試。實際上通用學術英語在不同程度上體現了不同學科的語言表達的共性。我們認為,通用學術英語測試的優點表現在兩個方面。1)從內容載體上說,盡管也是學術的,但都是各個學科的導讀性材料,是學術百科知識,如海底開發、化學與人類、自閉癥、轉基因食品、安樂死、電子商務、城市雕塑、光污染與建筑等。Clapham(2000)認為無論哪個專業的科技人員都要有廣闊的交叉學科的知識,這是符合高校開展跨學科的通識教育的理念的。通用學術英語測試有助于這種教育。2)從測試技能上說,是跨學科性,是所有專業學生進行專業學習和研究的必備技能,主要是三個方面:第一、語言基本能力(如聽、說、讀、寫、譯)。第二、學術英語技能,如用英語聽講座和講課,記筆記的技能;用英語閱讀專業文獻;用符合學術規范的英語撰寫文獻綜述、論文/大會摘要和學術文章并進行學術交流;用英語宣讀論文,陳述演示研究成果,參加學術討論。第三、學術英語素養,如運用網絡和圖書管資源搜索與專業學習相關的信息的自主學習和獨立研究的能力;分析和綜合從各個渠道搜索來的信息,并對此進行評價、提出問題,解決問題的批判性思維能力;用團隊合作的方式開展基于項目的學術研究的能力;跨文化的溝通和交際能力;規避剽竊,遵守學術規范。由此構成了通用學術英語考試的內容。

表2 學術英語考試內容
和專門學術英語測試不同的是,通用學術英語對語言基本能力比較重視。Clapham(2000)極力主張,學術英語測試包括:1)英語語言知識和能力;2)專業學習中所需的學術技能。但是通用學術英語測試對語言能力考察和通用英語測試對語言能力考察有所不同。第一、學術英語測試的語言能力是通過學術英語界面表現出來的。所謂學術英語界面有兩個含義。1)內容是學術性的,以自然科學和人文社會學術語篇為主,信息性較強,而不是一般日常生活情景,即使是聽力也是以講座講課和課堂交際為主,而不是新聞或日常生活交際。2)語言能力和學術技能是緊密結合的,是通過完成真實任務來反映語言能力的,因此,學術英語考試中的聽、說、讀、寫都是和專業學習和工作提出的學術技能結合的。第二,語言能力的難度必須和專業學習和工作的需求大致一致。大學英語四、六級考試或專業英語四、八級考試是屬于 通用英語,純粹是依據語言難度來命題的: 大學英語四級考試要求4500詞匯量和每分鐘70-100詞閱讀速度,大學英語六級考試有5500詞匯量和每分鐘120詞閱讀速度的要求,這種規定顯然不是根據需求來確定的。按照用英語進行專業學習和工作的需求,學術英語測試就得考慮詞匯量要在10,000詞,如其中有1000的專業詞匯,對專業閱讀更為有效(Diller,1978)。也就是說,同樣聽、說、讀、寫的語言能力,學術英語考試的語言難度是根據專業學習需求來確定的。
5.0通用學術英語評估和測試體系的建立
通用學術英語評估體系的建立首先要進行需求分析,確定考生的專業學習和工作的具體語境和要求,然后以此為依據選擇測試的內容和形式。但是需求分析會發現很多需求,這些需求不是都可以測試的,或都可轉化為測試項目的(Alderson,1988,Clapham,2000) ,必須加以篩選。Douglas(2010:5)認為,知識性和真實性(authenticity)是專門用途英語考試區別通用英語考試的兩個主要特點。就知識性而言,盡管通用學術英語是跨學科性的(專門學術英語是特定領域的,我們暫不討論),但這些知識內容都是新的,需要去探索和研究。真實性是指評估和測試的任務應該模擬真實的學習或工作任務。Robinson & Ross (1996)提出了真實測量的方法(authentic measurement),即通過布置學生在大學學習中碰到的任務來考察他們的學術英語技能,這種測試稱為a task-based,performance-referenced testing。如給出一個reference list, 要求考生回答:如寫某方面的文章,可以挑選其中哪些文章來看;再如給出一個摘要,要求考生回答:這篇文章用的研究方法或主要結論是什么?
因此,如何把要探究的知識和在專業學習或未來工作中會碰到的真實任務結合起來構成了學術英語評估體系的基礎。Bachman(1990:307)認為,測試應當取自于目標語使用的真實語境中最有代表性的樣本,這就是表面效度(face validity)的要求。也就是說不僅測試內容要真實,測試形式也應真實。根據評估(assessment)和測試(testing),我們認為可以建立一個以形成性評估和終結性評估為主要內容的體系。其模型如下:

形成性評估主要是在課程中開展。我們認為主要采用基于項目和案例的教學法。以項目教學法為例。項目教學法是以學生為主體的一種教學方法。基于項目的教學法的特點有:以學生為中心,兼顧語言和知識學習。教師通過創設真實或接近真實的語境如項目研究任務來培養學生的聽說讀寫各種學術技能、自主和獨立學習的能力、團隊合作完成任務的能力、以及解決問題能力、批判性思維能力以及跨文化交際能力等。
以霧霾環境課文單元為例開展項目。第一,學生在教師的引導下,根據課文主題,到網上,如維基百科全書上查閱相關詞條和文獻,然后到班上進行頭腦風暴的討論(注意:沒有大量文獻和知識的輸入,即興的頭腦風暴是徒有其名),引出和確定若干他們感興趣的、可以探索和研究的問題和項目,如霧霾的產生原因、霧霾所產生后果、中國大城市霧霾調查、英國倫敦的霧霾歷史、霧霾與大工業發展、日本霧霾的治理等。在這一環節,教師可以通過每個學生貢獻的信息量和質量,以及課題的貼切性來評分,考察他們的文獻搜索能力。第二,按照不同課題進行分組,每個子項目有5-6個同學參加,組內學生自己協商進行任務分工,如項目負責人、資料搜集員、數據整理員、討論記錄員、報告撰寫員、PPT編寫員、口頭匯報員等(這些角色在下一個項目中就要輪換),然后制定通過集體討論的研究計劃(包括研究背景、研究問題、研究方法等),在班上交流。這個環節教師和學生互評,考察哪些計劃的可行性強。第三、實施計劃。按照組織討論制定的方案,分工行動,或搜索相關文獻,或問卷設計和實施,或開展訪談,或進行實驗或數據采集等。然后集體討論,如對搜索到的材料文章進行篩選、分析、評價、組織和整理。對采集到的數據進行分析和解讀等。在分工成員撰寫項目成果調查報告的基礎上,組內集中討論,進行修改,最后定稿。然后分頭制作PPT 演示課件和海報論文(posters)。第四、匯報演示。在大班上,可由班長主持,首先在介紹課題主項目研究的背景,然后各組依次進行陳述匯報(每個小組大約10分鐘),匯報結束,接受其他小組的提問和討論(大約3-5分鐘)。這個環節教師對各組報告和其他小組提問進行打分,各組之間相互打分。最后,各小組根據其他小組提出的意見,對自己的調查進一步完善,寫出定稿的調查報告或小論文(大約1500左右)。為了激勵學生學以致用的積極性,在此基礎上還可組織校級或跨校的大學生學術論壇。如前者有第二軍醫大學年度“大學生醫學人文論壇”,后者有每年的“大學生上海國際學術論壇”,如今年的主題是環境與發展,參加的學生都必須遞交1500詞左右的正式學術論文。

表3 學術英語項目評估表
終結性評估主要安排在期末進行,采用測試的方法。目的是測試每個學生的語言能力、學習技能和學術素養,考察學生是否能夠用學到的技能開展專業學習和工作。下面是一些題型的設計。
閱讀部分有兩種形式。1)2-3篇學術性文章,總閱讀量1500詞左右,這些文章是一個主題的,如轉基因糧食。但觀點或角度不一,或所選的文章有贊成與反對、原因與結果、優點與缺點、問題與解決等聯系。問題采用多項選擇,這不僅考察學生掌握文章內容細節和主旨要義的跳讀和略讀能力,而且考察他們推斷能力和批判性思維能力。2)選擇一篇1000詞左右的學術文章,一般是正式學術論文的討論部分,或者引言部分,或者結果分析部分(帶圖表最好)。問題形式有多種,如多項選擇題,提供5-6個段落大意,要求考生辨認出自它們分別來自哪些段落。還可以指定的1-2個段落,要求考生各寫一個大意歸納句子(summarizing),還可以劃出幾個句子,要求學生用自己的話來轉寫(paraphrasing),還可以隱去數據圖表上的小標題,讓學生根據表中提供的信息,還原這個標題。
聽力部分主要聽學術講座片段3-4個,每段長度在3分鐘左右,每段后有5個多項選擇題。也采用筆記填空的方法,聽兩遍,要求原詞填入;或歸納一小段的意思,用一句話寫出,主要考察學生聽講座記筆記的能力(note-taking)。
口語部分直接模仿國際學術會議。如首先要求考生把自己寫的作文內容壓縮后,對著屏幕話筒進行3分鐘陳述,然后會聽到考官根據寫作基于的4篇材料提出的3-4個問題進行回答。
各部分的內容可以根據需要進行調整,但不管怎樣,這個終結性評估或測試是按照真實語境來設計的,考察了學生的語言能力、學術技能和學術素養。中國學術英語教學研究會開發的高校通用學術英語水平考試就是以此為藍本的。
6.0結語
專門用途英語的評估和測試不僅是必要的而且是可行的。尤其是在學術英語教學剛剛起步,許多實踐者對學術英語教學的內涵還比較陌生的時候,建設一個科學的學術英語評估和測試體系對于我國高校的學術英語教學的發展將起到積極的反撥作用。比較通用學術英語和專門學術英語的評估和測試,我們認為應首推前者,因為通用學術英語測試可避免專門學術英語測試帶來的一些局限,從語言能力、學術英語技能和學術英語素養三個方面構成評估和測試內容,既注重學生的語言基本功的訓練,又起到了培養學生跨學科的用英語進行學習和工作的學術技能的作用。通用學術英語評估系統是基于需求分析的,首先要對學生專業學習和工作中的真實任務進行調查和歸類,確定主要評估和測試的任務。然后通過形成性評估和終結性評估兩種形式開展。前者主要以項目為驅動的方法來考察和評估,后者以筆試的形式進行。
參考文獻
[1] Alderson, J. C. Testing and its administration in ESP[A]. In D. Chamberlain & R. J. Baumgardner (eds.).ESPintheClassroom:PracticeandEvaluation[C]. London: Modern English Publication, 1988. 87-97
[2] Alexander, O., S. Argent & J. Spencer.EAPEssentials:ATeacher’sGuidetoPrinciplesandPractice[M]. Reading:Garnet Publishing, 2008.
[3] Bachman, L. F.FundamentalConsiderationsinLanguageTesting[M]. Oxford: Oxford University Press, 1990.
[4] Clapham, C. Assessment for academic purposes: Where next?[J].System, 2000,(28):511-521.
[5] Diller, K.TheLanguageTeachingControversy[M]. Rowley: Newbury House Publishers, 1978.
[6] Douglas, D.AssessingLanguagesforSpecificPurposes[M]. Cambridge: Cambridge University Press, 2000.
[7] Douglas, D. This won’t hurt a bit: Assessing English for Nursing[J].TaiwanInternationalESPJournal, 2010,(2):1-16.
[8] Dudley-Evans, T. & M. St. John.DevelopmentsinEnglishforSpecificPurposes[M]. Cambridge: Cambridge University Press, 1998.
[9] Flowerdew, J. & M. Peacock.ResearchPerspectivesonEnglishforAcademicPurposes[M]. Cambridge: Cambridge University Press, 2001.
[10] Hutchinson. T. & A. Waters.EnglishforSpecificPurpose[M]. Cambridge: Cambridge University Press, 1987.
[11] Jordan, R. R.EnglishforAcademicPurposes.AGuideandResourceBookforTeachers[M]. Cambridge: Cambridge University Press, 1997.
[12] Lado, R.LanguageTesting. New York: McGraw-Hill, 1961.
[13] Messick, S. Validity[A]. In R. L. Linn (ed.)EducationalMeasurement(3rdedition)[C]. New York: Macmillan, 1989.
[14] Robinson, P. & S. Ross. The development of task-based assessment in English for academic purposes programs[J].AppliedLinguistics, 1996,29(4):672-693.
[15] Swales, J. (ed.).EpisodesinESP:ASourceandReferenceBookfortheDevelopmentofEnglishforScienceandTechnology[C]. New York: Prentice Hall, 1988.