孫 婷
(韓國東亞大學 韓國·釜山 49324;九江學院經管學院 江西·九江 332005)
語言測評是語言教學中的一項不可或缺的環節。好的測評不僅可以給學生提供學習的評價與反饋,激勵其進步,教師也可以從測評中查找并發現自己的教學問題,從而進一步改進教學。然而,教師該如何設計測評?在設計過程中應當遵循哪些原則?具體該如何操作?H·DouglasBrown教授編著的書《語言測評:原理與課堂實踐》(第三版)將為讀者提供以上問題的答案。
全書除前言之外,共分12章。
第一章首先介紹了語言測評的相關概念及術語,其中區別了測評(assessment)與測試(testing)、測量(measurement)與評估(evaluation)的概念。然后簡述了五種類型的語言測試:能力測試(achievement tests)、診斷測試(diagnostic tests)、分級測試(placement tests)、水平測試(proficiency tests)和能力傾向測試(aptitude tests),并分析了如何根據不同目的和測試背景選擇這幾類測試方法。本章最后回顧了語言測評的歷史,以及當今的研究趨勢。
第二章著重討論了語言測評中的五項原則,即可行性(practicality)、信度(reliability)、效度(validity)、真實性(authenticity)和反撥效應(washback),其中包括信度和效度的子類。該章詳細分析了如何根據測評背景和目的的不同有效地運用每項原則,并通過列舉課堂測試的正、反例以及判定標準詳細地詮釋每項原則,為后續章節奠定理論基礎。
第三章則重點闡述了設計課堂測試的六個步驟。首先確定測試的目的或用途,其次詳盡地明確需要測試的能力,然后圍繞測試的目的及需考察的能力擬就測試標準。之后精心地選擇并系統地安排測試類型和項目,文中重點列舉了選擇題的設計方法。設計好測試項目后,如何確保考試順利完成并使學生發揮出最好水平是第五步的重點。作者周到地提供了一些考前提示及執行監考過程中需注意的細節。最后建立完善的打分評級體系,并給學生提供反饋,使考試發揮出有益的反撥效應。
第四章闡述了標準在教學指導及基于標準的測試中扮演的重要角色,綜述了為設計英語標準而做的研究。同時,作者還分析了基于標準測評的目的及優缺點,并討論了大型基于標準的考試在社會、政治以及意識形態等方面的影響。
第五章聚焦于標準化考試的相關構建。作者討論了標準化考試的優缺點,并詳盡闡述了標準化考試的設計步驟及評分標準的界定。
第六章則重點介紹了聽力測評。作者闡述了單項的聽力技能測評和涵蓋聽力的語言能力綜合測評的基本原理。然后根據不同的階段,把聽力表現分成了四種類型:精深式聆聽(intensive listening)、回應式聆聽(responsive listening)、選擇式聆聽(selective listening)和廣泛式聆聽(extensive listening),并分別根據這四種表現使用一些案例來展示如何設計測評任務。
第七章關注的是口語測評。作者首先陳述了口語測評的基本原理,包括口語作為單獨技能的測評以及加入了其他一項或三項語言能力的綜合測評。然后對口語表現也做了和聽力類似的分類,有模仿式口語(imitative speaking)、聚焦式口語(intensive speaking)、回應式口語(responsive speaking)、互動式口語(interactive speaking)和 泛式口語(extensive speaking)。針對這五種表現模式的類型,作者分別詮釋了如何設計口語測試并佐以樣例展示。
第八章著重討論了閱讀測評的相關內容。和前兩章類似,作者闡述了單項的閱讀技能以及并入其他一項或多項語言能力綜合測評的基本原理,并把閱讀表現分成了以下幾類:感受式閱讀(perceptive reading)、選擇式閱讀(selective reading)、精深式閱讀(interactive reading)、廣泛式閱讀(extensive reading)。作者隨后就這四種類型分別加以舉證闡述如何設計閱讀測評。
第九章著重闡述了寫作測評的相關理論和實踐操作。作者詮釋了把寫作作為單獨技能進行測評的基本原理,還介紹了整合了閱讀或其他語言能力的綜合測評的基本原理。文中從50多種書面語言體裁中選取了數種最常見的,并將之分為三大類,即學術類寫作(academic writing)、公文類寫作(job-related writing)和私文類寫作(personal writing)。之后作者根據不同的寫作表現,將寫作分為四類:模仿型寫作(imitative writing)、精深式寫作(intensive writing)、回應式寫作(responsive writing)和廣泛式寫作(extensive writing),并舉例說明如何根據這四類表現設計寫作測評。
第十章聚焦于語法和詞匯的測評。作者先闡述了注重語言形式測評的基本原理,接著界定了語法知識(grammar knowledge)的含義,并根據不同目的與語境設計相關的測評。之后介紹了詞匯的本質并定義了詞匯知識(lexical knowledge),分析詞匯能力的構成元素,并將之運用于詞匯知識的測評中。
第十一章著重介紹了評定等級以及對學生評估的內容。作者先介紹了評分的基本原則和選擇評分標準的指導原則,包括一致性(consistency)、透明性(transparency)、具體性(specificity)和加權值(weighting)。針對文化規范及背景對評分帶來的影響及限制,作者還闡述了如何基于可靠的評分體系評定等級,包括絕對等級和相對等級,以及如何建立評分細則去評價學生的表現并提供反饋。
最后一章提供了幾種其他非數字或字母評分的評價方法,鼓勵讓學生掌握打分權,幫助他們使用教師的反饋以促進學習。作者闡述了自我測評或同伴測評(self-and peer assessment)的優點、類型以及指導原則與分類法,還有如何建立學生進步檔案(portfolios)。最后解釋了如何使用敘事評價(narrative evaluations)和核對清單評價(checklist evaluations)的方法,以更好地幫助學生了解自己的強項和有待改進的方面。
作為語言測評領域的一本重要的教科書,本書介紹了語言測評的基本原理,并提供了大量全面的課堂實踐操作與測評工具,被用于教師培訓課、教師資格證和TESOL等項目的課程。本書和作者另兩本書《語言教學原理》(第六版)和《根據原理教學》(第四版)一起并稱為布朗教授的“三部曲”,其優點主要體現在以下幾個方面:
全書采用總分結構,逐層深入,條理清晰。書的開篇先定義測評的概念,轉而討論測評應遵循的五項原則,為后續論述做好理論鋪墊。測評實踐的內容則分成四部分進行討論:課堂語言測評、標準化測評、聽說讀寫分項測評和非打分類測評方法。全書涵蓋的測評方法和內容詳實全面,雖頭緒眾多,但都是建立于第二章的理論基礎之上的,由第一二章提綱挈領,其后若干章節分別作為書的體系支撐,分而不亂,條理清晰,整體一氣呵成。嚴謹的結構設計有助于讀者更好地理解和把握各種測評研究的概念范疇和范式。
本書作者把語言測評理論有機地融入課堂測評實踐的討論中,理論是實踐的行動基礎與指導原則,實踐是理論的具體體現,兩者相輔相成,相得益彰。書中列舉了大量的范例供讀者參考。如第八章閱讀測評中,作者提供了四大類測評任務,每種大類包含了若干個具體任務。其中互動性閱讀子類中就囊括了7種任務。作者結合理論詮釋了每種任務的具體操作和優缺點及注意事項,所舉的范例都具有代表性,有助于教師認識并解決測評中面臨的實際問題。
相對于前兩版,第三版除了更新參考文獻之外,還有以下變化。首先,針對評價學生特別是口語及書面語言能力方面,提供了更詳細的設計方法及評分標準(第11章)。其次,基于標準測評的領域變化較快,做了大量更新(第4章)。再次,將第二版第六章內容納入其他章節中,第三版已刪除此章,并重新排序。最后增加了新的一章——第12章,將原“測評的其他選擇”歸為非數字或字母評分手段的評價方法。最后這一章節的添加為讀者提供了更廣闊的的視野,也讓讀者思考測評的意義所在。測評應當是用來激勵學生學習的,好的測評能促使學生有更優的表現,促使其提高自身的能力(Glaser,1990;Stiggins,2005;Wiggins,1998)。
當然,本書也存在不足之處。例如,由于語言測評的復雜性,作者將語言教學限定為課堂測評,而沒有涉及課外以及最新的AI測評。但瑕不掩瑜,本書論述嚴謹,文字與圖表使用科學、規范,文字通暢、生動,可讀性強,不僅可作為語言學專業學習者的讀物,也可為從事語言教育的教師提供相關指導,同時,對各種測評方法優缺點的梳理也有助于拓展語言測評研究者的思路。總之,該書對語言測評及相關領域研究頗有價值,值得深讀。