王少非

【主持人的話】前面幾期我們討論了如何收集學生學習信息或如何引出學生學習證據的問題,后面我們將討論如何運用這些信息或證據來支持教與學的改善。但在此之前,本期我們首先要討論評價結果的解釋問題。
【小明學得好嗎】
在生活中,常會看到這樣的情境:媽媽知道小明昨天考試了,也知道教師批改試卷很及時,所以小明一進家門,媽媽就問:“考了幾分啊?”小明答:“92分。”
媽媽的問題是否到此為止,不再有其他問題了呢?答案是否定的。現實生活中,媽媽一般還有其他問題要問,比如:最高分是多少啊?你的同桌(朋友)考了幾分啊?這次考試,你排名第幾啊?部分家長甚至還可能會問如下問題:班級平均分是多少啊?你哪里做錯了?因為什么才做錯的?
媽媽為何會問這些問題?其實幾乎所有的人,即使當年并非是一個“好學生”甚至接近于文盲的家長都知道:單一的分數是沒有意義的。家長之所以會問那些問題,其實是在嘗試對考試得來的這個沒有意義的分數進行解釋,嘗試著讓這個本來沒有意義的分數變得有意義。這也就闡述了一個道理:若想使評價結果有意義,就必須經過解釋。
那么,怎樣才能更好地解釋評價結果呢?作為教師,從專業性角度出發,該建議家長在這樣的情境里問哪些問題,或者從第二段所羅列的問題中明確哪些問法是有意義的。
如果將評價結果的解釋理解成為某個結果找個參照系,那么第二段所列的問題大致可以分成兩類,用專業的術語來說就是常模參照和標準參照。常模是一個心理測量學概念,指的是常模群體的平均表現水平以及表現狀況的離散程度,是一種相對評價。具體解釋起來稍稍有些復雜,教師只需要知道,常模參照就是拿一個學生的表現跟其他學生比,是一種相對評價。但標準參照卻不同,它是將教育評價從心理測量學中努力分離出來的結果,是將學生的表現與預先確定的某個標準進行比較,是一種絕對評價。舉個例子來說,班里的學生春游去爬山,班主任沒跟著,但很關心某個學生的情況,打電話給帶隊老師,結果得到兩個回答:一個是“他在隊伍中間”,另一個是“他到半山腰了”。前一個回答是常模參照,后一個回答是標準參照。
厘清了問題的分類,再來研究哪些問法更有意義。許多教師可能覺得考試排名是個好辦法,有激勵作用,常用“你看看人家小紅,又是99分”來刺激小明。但證據表明,這些做法的效果是不確定的:首先,常模參照的結果不只取決于當事學生的努力,有時學生做了很大的努力,結果相對表現反而更差了,更何況這種比較能否激發學生的努力還是個未知數。其次,即使這些做法能夠激勵學生做出努力,但只與他人做比較,即常模參照的解釋,無法讓學生明確努力的方向,對于改進沒有太大的幫助。由此可見,標準參照的解釋方式對于改進更有意義,也就是要明確學生表現與預定標準的具體差距。只有這樣,學生才能知道自己具體的問題,才有可能回答學習改進的三個必答問題:“我要去哪里?”“我現在在哪里?”“我怎樣才能從現在所在之處到達我要去之處?”
如果期望課堂評價能有效促進學生的學習,那就不要將學生與他人做比較,而要將他的表現與確定的標準比較。在這一方面,有很多有價值的做法,如描述性評價、雷達圖的應用、進步記錄表的運用,等等。
需要說明的是,除了以上這兩種結果解釋方式之外,還有一種解釋方式,即“個體內差參照”,簡單地說,就是自己跟自己比。這種解釋方式對于那些無須做出太大努力就可以達成目標且能處于班級前列的學生,以及那些盡管做了很大努力但離目標依然遙遠的學生特別有效。
【基于目標解釋結果的方法】
上文提及,相對于常模參照的結果解釋,標準參照的結果解釋更有利于改進。標準參照的本質就是關注學生當前表現與學習目標要求之間的吻合度,是要揭示學生當前表現與期望達成的學習目標之間的具體差距,也就是基于目標來解釋結果。那么,教師該如何基于目標解釋結果呢?
依然以小明這次的考試成績為例。小明的卷面成績為92分,與滿分差了8分。很湊巧,小明的同桌小強這次考試也得了92分。眾所周知,在這次測驗所涉及的主題上,小明和小強做對的或者所掌握的知識有很多共同之處,但他們所犯的錯誤卻可能完全不同。假設這次考試檢測的是ABCD四種能力(或知識點),小明所犯的錯集中在C能力上,而小強所犯的錯則集中在A能力上。這里所檢測的能力(或知識點)就是評價目標,將學生的測驗表現與評價目標直接做比較,就是一種基于目標的結果解釋。
基于目標的結果解釋不僅僅針對一份試卷,同樣也可以針對一道題。以一道小學數學試題為例:“我買了500克香蕉,一些蘋果,以及1千克牛肉。我總共買了6千克水果,那么我買了多少數量的蘋果?”A,B,C三個學生的答案分別是4.500千克、5.950千克、5.500克。通常情況下,三個學生每人都會得到一個“×”。但聯系這道題的三個檢測目標(對問題情境進行正確解讀;在問題情境中正確運用數學工具,如加減乘除、單位轉換等;答案的正確性)就能發現,這三個學生的錯誤各不相同:A將牛肉和水果混淆了,屬于沒有正確解讀問題情境;B是將500克換算成了0.05千克,是單位換算出了問題;C是將單位寫成了“克”,可能是粗心。用這樣的方式來解釋學生的表現結果,能針對性地解決學生的問題,對于他們的學習改進也就會更為有利。
基于目標的結果解釋還可以借助于不同的結果呈現方式來實現。例如,一位語文教師給出了一個評價任務,要求學生完成15個造句(包含肯定句、否定句、疑問句各五句),正確完成一個句子可以得1分。結果學生甲得了10分,學生乙得了9分。這是常規的結果呈現方式。如果教師換一種呈現方式,結果解釋就可能不同(見下表)。
[ 肯定句 否定句 疑問句 學生甲 5 5 0 學生乙 3 3 3 ]
這樣的呈現方式可能會改變教師對兩個學生的觀感:原先只看分數,無論如何都會認為乙不如甲好,但通過表格發現,“學生甲很好地掌握了肯定、否定兩種句式,但完全沒有掌握疑問句式;而學生乙基本上掌握了這三種句式,學生乙未必會比學生甲差”。更重要的是,這樣的呈現方式可以幫助教師和學生更清楚問題之所在。
這樣的呈現方式實際是一種描述性評價,即將學生表現與目標之間的差距具體地描述出來,而不是提供籠統的分數、等級,或者簡單的對錯符號。有很多研究證據表明,相較于提供分數等級,描述性評語對學生的學習改進效果要大得多。關于這一點,將會在后續的專題中繼續討論。
(臺州學院???317000)