《義務教育英語課程標準(2022年版)》(以下簡稱《義教課標》)提倡注重“教—學—評”一體化設計,強調教學評價的促學作用。這意味著教學評價要從“對學習的評價”(assessment of learning)轉向“促進學習的評價”(assessment for learning)(耿峰、于書林,2021)。在此背景下,外語教師要具備更高的語言評價素養(language assessment literacy)。然而,國內外的一些實證研究(如Jin,2010;Fulcher,2012;Lam,2015)表明,教師評價素養普遍不高(甘凌、蔣昌盛,2020),外語教師缺乏足夠的評價知識和技能,在以課堂為基礎的語言教學中,教師的評價素養尚未得到充分研究(Lan amp; Fan,2019)。此外,外語教師評價素養的實施路徑也鮮少有研究討論,特別是在我國外語課堂教學中提升教師評價素養的實證研究更為欠缺(江進林,2022)。部分學者指出,診斷測評有著判斷學情、促進針對性教學的作用,能夠為教學決策提供依據(蔣京麗,2022)。教師的評價素養在基于診斷測評的實踐中能得到發展(黃菊等,2018)。因此,本研究基于在線英語診斷測評平臺探索了一位初中英語教師課堂評價素養的發展過程。
課堂評價作為教師了解學生學習情況并及時給予反饋和調整的方式,是形成性評價的一種具體實踐。20世紀90年代末,形成性評價研究熱潮掀起,學者們從評價方法、評價的促學效果等方面展開研究(Black amp; Wiliam,2009;羅少茜等,2015)。然而,學界尚未對課堂評價和形成性評價的區別給出明確定義(楊莉芳,2022)。國外有學者將形成性評價稱為課堂評估(classroom evaluation 或 classroom-based evaluation)或課堂評價(classroom assessment)等(郭茜、楊志強,2003)。還有學者認為,形成性評估、課堂評估、教師評估、替代性評估以及促進學習的評價可以互換使用(Davison amp; Leung,2009)。由此可以看出,學界承認課堂評價與形成性評價在一定程度上可以互換。同時,目前的研究強調課堂評價在實踐中的效果(甘凌、蔣昌盛,2020;江進林,2022)。因此,本研究將課堂評價的重點延伸至外語教師在課堂實踐中的評價素養,即課堂評價素養。學者對課堂評價素養定義的關注點不同。Carless et al.(2006)認為,教師評價素養體現在教師能夠利用課堂評價讓學生參與評價,并能及時給予反饋,以培養學生的自主學習能力。Gu(2021)將形成性評估的過程具體化為以目標為導向的螺旋式循環,這個循環由收集證據、解讀證據、提供反饋和后續行動四個步驟組成(如圖1所示)。該框架基于前人的研究發展而來(趙士果,2013),更加全面地體現了評價促進學生學習的實施要點(胡潤,2022)。
李亮和王薔(2020)綜合了多位學者的觀點(Carless et al.,2006;Heritage,2010;楊向東、崔允漷,2012),界定了外語教師課堂評價素養的概念、構成及表征,為提升外語教師課堂評價素養提供實踐啟示。Xu amp; Brown(2016)構建了實踐中的教師評價素養框架(A conceptual framework of teacher assessment literacy in practice,簡稱TALiP),其中提到的教師評價素養前三層為評價知識、評價觀念和評價實踐。基于文獻回顧,本研究認為教師課堂評價素養的內容主要包括以下三方面:課堂評價知識、課堂評價觀念以及課堂評價實踐。
本研究對C老師的課堂評價素養發展路徑提出以下研究問題:
(1)C老師是如何基于在線診斷平臺實施課堂評價的?
(2)C老師的課堂評價素養在使用在線診斷測評平臺后有哪些變化?
本研究的對象為W市某較高水平中學七年級新教師C老師。本研究所使用的工具為外語教學與研究出版社研究開發的在線診斷測評系統U-Dig(優診學),該平臺以“診—教—學”模式幫助教師實施教學補救,能夠為教師提供班級學情的具體微技能信息,并且提供相應的教學支持與教學建議,為教師針對性地補救教學、調整教學提供依據。
本研究共歷時一年左右,2022年9月至2023年4月為數據收集階段,2023年4月至2023年7月為數據整理階段。在數據收集階段,研究者收集了C老師所教班級的優診學診斷測評結果以及C老師的教學反思、課堂錄像和實際課堂觀察等數據,并分別在2022年10月、2023年3月和7月對C老師進行了半結構化訪談。訪談安排在班級兩次優診學測試前后,共整理訪談文本約1.6萬字。在數據整理階段,研究者通過分析診斷測評結果、訪談文本、教學反思、課堂觀察等數據進行多方驗證,以回答兩個研究問題。
首先,研究者根據本研究界定的外語教師課堂評價素養的要素(評價知識、評價觀念和評價實踐)對數據進行編碼。其次,筆者計算各要素出現的總頻率。例如,在評價觀念這一要素下,研究者統計了訪談文本中有關C老師評價認知、評價情感等數據的出現頻率和基本主題,對其進行歸類,并根據診斷測評時間進行前后對比,以期體現出C老師評價觀念的變化。
2022年10月,C老師使用優診學對班級學生進行了在線寫作測試,即前測。通過分析學生寫作微技能表現結果,發現學生在語法運用上的問題較為突出。該診斷結果與C老師訪談中的信息相呼應:
他們在小學時,口頭表達都很好,但是都沒有怎么落實到筆頭,所以他們在這方面本來就沒有很扎實。(2022年10月25日訪談)
基于診斷測評結果報告,C老師著重訓練學生的語法運用微技能。在基于外研版《英語》七年級上冊Module 8 Unit 1 I always like birthday parties. 的聽說課磨課中,C老師運用診斷測評結果設計了教學活動。
(1)初期教學設計與效果
教學文本為一則討論生日慶祝活動和生日禮物的對話語篇。C老師基于文本分析設計了教學目標和11個教學活動,但在有限的40分鐘課堂時間內難以完整開展所有活動。因此,C老師試授課的結果并未達到預期。
我在第一個班上課時,前面花的時間太久,都還沒有上到產出環節就下課了,根本就沒有看到學生的產出是什么樣子,所以后面就做了調整。(2023年3月17日訪談)
試授課的結果令C老師倍感沮喪。經過高校科研組的課后研討、與本校教研組討論以及個人反思,C老師總結了本次授課中的問題:第一,未基于單元整體設計教學目標,導致文本分析不到位,教學目標偏離單元主題;第二,教學活動設計過多,導致教學和課堂評價均未完整進行;第三,未細致分析診斷測評結果報告,導致對學生在語法運用微技能弱項上的具體表現不清楚,課堂評價的重點沒有落到實處。
經過反思,C老師根據試授課的結果調整了教學設計和課堂評價重點,包括重設教學目標、減少教學活動、充分利用任務單收集學生學習證據和設計訓練學生語法運用微技能的活動等。
(2)改進的教學設計
首先,C老師重新確定了基于單元整體的教學目標,并在整體分析單元語篇后,凝練了本單元主題意義“建立并維護良好的人際關系”。接著,C老師基于診斷測評結果所反映的語法運用微技能弱項,深化了學情分析,從語言能力和主題知識儲備兩個層面進一步分析學生的已知和未知。C老師設定的教學目標如下:
① 獲取對話中的主要信息,包括誰過生日、什么時候過生日、Betty是否知道等;
② 獲取Daming的生日派對時間、地點與活動,回答問題并填寫表格;
③ 通過分析文本,明確Daming對生日禮物的考慮因素;
④ 在小組活動中,邀請同學參加班級生日會,并收集舉辦生日會的建議。
其次,C老師縮減了教學活動的數量,并針對每一個活動都設計了相應的引出學生學習證據的評價方式。例如,C老師在產出環節創設了舉辦班級生日會的活動情境,要求學生為班里所有在12月過生日的同學舉辦生日派對。該情境依托文本,真實且貼近學生的生活實際,與課堂導入環節中的問題“Whose birthday is in December?”相呼應,有助于教師及時評價學生對本節課關鍵知識的掌握情況,并據此進行有效的指導和反饋。
最后,C老師仔細研讀了班級學生的診斷測評結果報告。報告針對學生弱項微技能的具體表現提供了清晰示例,如名詞的數錯誤、主謂一致錯誤等。報告還給出了具體的教學建議,如對關鍵動詞時態、句型、詞組等進行教學點撥。這些具體的問題示例和教學建議都讓C老師在正式授課中更加注意收集和解釋學生語法運用方面的學習證據。
(1)引出學生學習證據
Gu(2021)指出,引出學生學習證據的中介是各種課堂活動。在導入環節,C老師結合學生熟悉的動畫電影《冰雪奇緣》中過生日的片段,分別提出三個具有邏輯關聯的問題“What’s this video about?”“Whose birthday is in December?”“What do you usually do on your birthday?”。該問題鏈一方面順利引入本課主題,另一方面也為本課的產出活動做了情境鋪墊。提問是一種常見的課堂評價方式。通過問題,C老師檢驗了學生是否抓住視頻的主要信息,激活了學生與主題相關的語言和背景知識。在之后的活動中,C老師的課堂評價方式包括觀察學生的行為或產出、檢驗學生完成任務單的情況等。學生的學習證據包含在教材中的勾畫、任務單完成情況、同伴對話輸出的語言以及回答問題的內容等。例如,在同伴對話的活動中,C老師讓學生兩人一組練習對話,之后選擇幾組學生當堂展示,以此獲取他們的學習證據,并及時進行指導和反饋。
(2)基于學生學習證據的解釋與反饋
在解釋證據環節,教師要對比任務標準和學生表現或學習證據,最終在頭腦中形成評判與解釋(Gu,2021)。在本課中,C老師在收集完學生的口頭和筆頭學習證據后,能夠及時判斷并解釋,明確學生表現與目標之間的差距,進而指出改進方向。此過程是教師解釋證據并對學生進行反饋的過程。
但在小組活動時,有學生詢問C老師某一句型的用法。C老師給出了清晰的解答,從而幫助學生解決了問題,使他能夠更加順利地投入到活動中。C老師在應對學生突發、隨機的提問(學習證據)時,及時解釋并給予反饋,屬于偶發性課堂形成性評價。
在計劃性形成性評價方面,C老師在聽力環節播放錄音后與學生進行問答并追問,判斷他們能否找出表示文本大意的關鍵句。
[教學片段1 ]
T: Does Betty know her friend’s birthday party well? Who’d like to try?
S: No, she doesn’t.
T: No, she doesn’t. (重復學生回答) How do you know?
S: She … she said … “I don’t know.”
T: Yeah. She said “I don’t know.” And she also said …?
S: …
T: She also said “I’m not sure, but I can ask him.” Right?
此外,C老師還根據學生的任務單完成情況檢驗學生概括聽力文本大意的能力。任務單包含一道聽錄音選擇題,C老師觀察學生的作答情況,并及時回答學生的問題,通過追問檢驗學生是否真正理解了聽力文本。
[教學片段2 ]
S: I choose C. “Daming’s mother never makes a birthday cake, but Betty buys a special one.”
T: Oh, yes! Can you tell me what is “the special one”?
S: A birthday cake.
T: Yes! It’s a special birthday cake.
當學生在回答提問的過程中出現了語法錯誤,C老師并沒有直接指出,而是通過復述和加重語氣的方式,使他們主動認識到問題并自主糾正。這種積極反饋有助于增強學生的學習動機,也有助于改進學生的行為(Harlen amp; Crick,2002)。學生也在教師的引導下,立即發現并改正了錯誤。
[教學片段3]
T: Why do you suggest Tony choose this present for Daming?
S1: ... because it’s good for him English.
T: Yes (先表揚). It’s good for him TO LEARN (加重語氣) English or it’s a good idea to learn English.
S2: You can give him a “red chacket” (學生不熟悉red packet的表達)
T: Yes. Red packets.
S2: Ah, yes. Red packets.
T: It’s a very good idea. You didn’t find in the text that he ever received a red packet, did you? (給學生信心)
(3)師生進一步行動
在對學生個體的評價方面,C老師在跟讀語句訓練中請個別學生跟讀,之后先進行表揚和肯定,再委婉地提出改進建議,學生即刻改正。這踐行了課堂形成性評價的最終步驟——后續行動(Gu,2021)。
[教學片段4 ]
S: … (跟讀語句)
T: OK! Your pronunciation is very great! (先表揚) And I think it would be better if you could add some emotional feelings in it. (委婉地提出改進建議)
S: … (即刻改正)
T: Yes! Now I can feel that you are very happy. And I’m sure you are very interested in Daming’s birthday party.
在明確評價細則的基礎上進行學生評價才能真正達到同伴評價促學目的(許悅婷,2014)。因此,在對學生小組活動的評價中,C老師在小組產出活動前先補充了互評表(見表1)。學生基于互評表以小組對話形式進行展示。具體的過程是學生A作為生日主角需要邀請B、C、D三位同班同學參加自己的生日會并正確使用邀請的句型,被邀請的三位同學也需要相應地使用對應句型詢問生日細節。在學生展示完后,C老師便從產出內容、表達技能和附加內容引導學生進行互評。互評有助于學生提高評價主體意識,使他們作為評價者參與評價的過程,提高學習積極性。
診斷測評后的訪談和課堂錄像顯示,C老師已經在課堂評價知識、觀念和實踐分別有了不同程度的提高。
通過深入分析班級診斷結果和教學建議,C老師已經能夠將診斷測評微技能的訓練與課堂評價(收集學生學習證據)的相關知識結合起來。但在磨課后,C老師仍認為自己的課堂評價能力匱乏,缺少對具體教學評價方法的實踐。因此本研究發現C老師的課堂評價知識和實踐在一定程度上有所脫節。
我問他,你喜歡在那里的生活嗎?為什么?我覺得這個問題更偏向于找細節……然后他就需要從文中各處找到支撐回答的證據。這其實就是在設置理解文章大意或要點的問題。(2023年7月14日訪談)
我好像一直覺得我的評價能力比較匱乏,但是我覺得它很重要,我會需要用到評價……如果是遇到這樣的情況,我會給出怎樣的反饋、怎樣的評價?我不知道遇到這種情況時要怎么做……如果是這樣(課堂情境)的話,我們應該用怎么樣的評價方法?(2023年3月17訪談)
接著,C老師又提出了認為自己評價素養匱乏的原因。她提到自己目前關于課堂評價的培訓內容較為抽象,難以理解。由此可見,教師亟待更為專業化、更易操作的實踐性課堂評價培訓。
(培訓)老師每天給我們一些課堂教學評價的例子……然后通過這個例子總結出規律,這就是抽象的。我們平常要怎么用這個抽象的規律呢?就單看例子,雖然很形象,看完了之后我覺得知道了很多,但又沒有一個可以帶走的。(2023年3月17日訪談)
前測階段的試授課中,C老師指出自己并沒有基于單元整體進行教學目標的設計。而教學目標是完成課堂形成性評價過程中最中心的一環,所有的教學步驟都圍繞教學目標的實現而運轉(Gu,2021)。同時,C老師在公開課上的教案設計照搬模板,缺少個人思考。因此可以看出,C老師在前測階段并未重視課堂評價。
在公開課結束后的訪談中,研究者根據訪談文本編碼,從認知和情感兩個層面分析了C老師的評價觀念。在認知層面上,C老師對課堂評價有了更深入的價值判斷。
你會發現有一些老師在課堂上跟學生的對話沒有那么真實,只是為了語言的溝通。(2023年7月14日訪談)
同時,C老師認識到什么是正確的課堂評價方式,更加重視反饋和學生的產出,以便收集學生的學習證據。
正確的就是我剛剛前面說到的,就是作出一個正確的反饋;不正確的就比如說,我覺得最好就不要提那種yes or no的問題。(2023年7月14日訪談)
在情感層面上,C老師開始重視診斷測評的結果,并能有意識地將其運用至課堂實踐中。
學生寫作其實是給了我一些反饋,學生在語言運用和語法方面其實是比較弱的……我會讓學生做同伴互評,著重看語法有沒有錯。當時也是做了一段時間,堅持了很久……我們就知道這個東西(診斷結果)其實是挺有用的。(2023年7月14日訪談)
同時,C老師認可了課堂評價的重要性,開始反思自己的評價行為(如追問行為)。
這是一個非常即興的反饋,就比如說學生上課要接受我的一些追問……追問其實是非常能培養學生的思維品質的……這種反饋(開放、真實的追問)我覺得是一個非常好的評價。(2023年7月14日訪談)
更重要的是,C老師有了自己的評價偏好,如通過教師主導的課堂評價把握課堂流程和節奏等。這與多位學者的觀點不謀而合(如顧永琦、余國興,2018;Davison amp; Leung,2009)。究其根本,在分析診斷測評結果的基礎上,教師發現在課堂上與學生的互動也能訓練學生的弱項,從而有助于進行教學補救。課堂的有效互動使教師意識到課堂評價的重要性,并有意識地將日常教學中碎片化的評價活動有條理地融入課堂。
以上反映出診斷測評基礎下C老師的課堂評價素養觀念增強,但在課堂評價知識上的增長并不明顯。
C老師通過設計與教學目標匹配的教學活動和課堂評價,最終呈現出課堂評價實踐類型多、頻率高的特點。經統計,C老師在后續的公開課課堂中,課堂評價方式與工具的多元運用已較為突出(如表2所示)。
C老師基于診斷測評結果確定班級學生的弱項,在嚴格遵循課堂形成性評價步驟(Gu,2021)后,在課堂上的流暢度、對學生即時反饋的速度和質量,以及課堂環節的時間把控水平等方面均有明顯提升,調整后的課堂不僅能有效訓練學生的弱項微技能、加深他們對單元內容的理解,更有利于教師基于學生弱項實施課堂評價,體現了診斷測評結果對教師課堂評價實踐的促進作用。
課堂是實施“教—學—評”一體化重要的場所,改進課堂評價對于提高課堂教學效率有重要意義。本研究通過對一位初中英語教師進行個案分析,指出診斷測評有助于教師在課堂評價知識、評價觀念和評價實踐三方面獲得提升。教師以診斷測評的結果精準定位學情,有針對性地調整課堂教學活動、實施課堂評價,最終有效訓練了學生的弱項微技能,在實現以評促學的同時,也提升了自己的課堂評價素養。研究結果表明,診斷測評對教師的作用更多體現在教師課堂評價觀念和實踐的增強,教師在課堂評價知識的增長上并不明顯,還有待更專業和可操作化的培訓。同時,本研究仍存在一定不足,未能充分探討教師課堂評價知識增長的有效途徑,今后將會圍繞診斷測評與教師課堂評價素養之間的聯系做更深入的探究。總體來講,本研究對提高初中英語教師課堂評價素養有積極啟示。
* 本研究受“中國基礎教育外語測評研究基金”項目協同課題“基于‘優診學’平臺發展高中英語教師測評素養”(項目編號:FAR202101006)的資助。
參考文獻
Black, P. amp; William, D. 2009. Developing the theory of formative assessment [J]. Educational Assessment, Evaluation and Accountability, 21: 5—31.
Carless, D., Joughin, G. amp; Liu, N. F. 2006. How assessment supports learning: Learning-oriented assessment in action [M]. Hong Kong: Hong Kong University Press.
Davison, C. amp; Leung, C. 2009. Current issues in English language teacher-based assessment [J]. TESOL Quarterly, 43(3): 393—415.
Fulcher, G. 2012. Assessment literacy for the language classroom [J]. Language Assessment Quarterly, 9(2): 113—132.
Gu, Y. P. 2021. Classroom-based formative assessment [M]. Beijing: Foreign Language Teaching and Research Press.
Harlen, W. amp; Crick, R. D. 2002. A systematic review of the impact of summative assessment and tests on students’ motivation for learning (EPPI-Centre Review, version 1.1) [R]. In Research Evidence in Education Library (Issue 1) [C]. London: EPPI-Centre, Social Science Research Unit, Institute of Education.
Heritage, M. 2010. Formative assessment: Making it happen in the classroom [M]. Thousand Oaks, CA: Corwin Press.
Jin, Y. 2010. The place of language testing and assessment in the professional preparation of foreign language teachers in China [J]. Language Testing, 27(4): 555—584.
Lam, R. 2015. Language assessment training in Hong Kong: Implications for language assessment literacy [J]. Language Testing, 32(2): 169—197.
Lan, C. amp; Fan, S. 2019. Developing classroom-based language assessment literacy for in-service EFL teachers: The gaps [J]. Studies in Education Evaluation, 61: 112—122.
Xu, Y. amp; Brown, G. T. 2016. Teacher assessment literacy in practice: A reconceptualization [J]. Teaching and Teacher Education, 58: 149—162.
甘凌, 蔣昌盛. 2020. 教師測評素養國外研究述評[J]. 中國考試, (1): 72—78.
耿峰, 于書林. 2021. 外語教師課堂評價素養與實踐: 基于大學英語教學比賽參賽教案的文本分析[J]. 外語教學與研究, (2): 238—250.
顧永琦, 余國興. 2018. 如何研究課堂形成性評估——以“中國基礎教育外語測評研究基金”立項課題為例[J]. 英語學習, (10): 39—44.
郭茜, 楊志強. 2003. 試論形成性評價及其對大學英語教學與測試的啟示[J]. 清華大學教育研究, (5): 103—108.
胡潤. 2022. 促進學習的課堂評價在高中英語教學中的實踐探索[J]. 中小學外語教學(中學篇), (4): 30—35.
黃菊, 袁霜霜, 范可星. 2018. 診斷性測評應用于高中英語寫作教學, 促進教師測評素養發展[J]. 英語學習, (10): 32—34.
江進林. 2022. 外語教師課堂評價素養的提升路徑與結果探究——以線上研修班為例[J]. 外語測試與教學, (4): 44—53.
蔣京麗. 2022. 基于診斷測評提升教師的教學能力和評價素養[J]. 英語學習, (10): 26—31.
教育部. 2022. 義務教育英語課程標準(2022年版) [S]. 北京: 北京師范大學出版社.
李亮, 王薔. 2020. 外語教師課堂評價素養:概念構成、觀測體系及實踐啟示[J]. 外語測試與教學, (2): 20—27.
劉建達, 吳莎. 2019. 中國英語能力等級量表研究[M]. 北京: 高等教育出版社.
羅少茜, 黃劍, 馬曉蕾. 2015." 促進學習: 二語教學中的形成性評價[M]. 北京: 外語教學與研究出版社.
王譞. 2023. 《中國英語能力等級量表》對英語教師語言評價素養的影響研究[J]. 中國考試, (8): 65—74.
許悅婷. 2014. 教師如何計劃評估: 基于某教學比賽大學英語教師口頭教案的文本分析[J]. 外語測試與教學, (4): 27—37.
楊向東, 崔允漷. 2012. 課堂評價: 促進學生的學習和發展[M]. 上海: 華東師范大學出版社.
趙士果. 2013. 促進學習的課堂評價研究[D]. 上海: 華東師范大學.
蘇佼陽 西南大學教師教育學院2022級碩士研究生。
陳柏琪 浙江省溫州市第二中學英語教師。
黃菊 西南大學教師教育學院副教授,碩士生導師。