現(xiàn)有的標(biāo)準(zhǔn)化測(cè)試并不能取代由通曉評(píng)價(jià)的教師進(jìn)行的日常的形成性評(píng)價(jià)。
最近一位學(xué)校的領(lǐng)導(dǎo)要求我們提供一個(gè)形成性評(píng)價(jià)的優(yōu)秀案例,然后展示這個(gè)案例在用于總結(jié)性評(píng)價(jià)時(shí)的區(qū)別。他希望將形成性評(píng)價(jià)和總結(jié)性評(píng)價(jià)的區(qū)別解釋給他的職員們。他的最終目標(biāo)是幫助教師們建立評(píng)價(jià)體系,在春季各州負(fù)責(zé)的測(cè)試之前,測(cè)量學(xué)生對(duì)內(nèi)容和目標(biāo)的掌握程度。
這位領(lǐng)導(dǎo)的要求反映了許多教育工作者都有的一種對(duì)形成性評(píng)價(jià)和總結(jié)性評(píng)價(jià)的混淆。這個(gè)混淆并不奇怪:形成性評(píng)價(jià)的定義不盡一致,這導(dǎo)致了多樣并且相互沖突的理解,并且由于這些多樣性的定義和觀點(diǎn),目前在學(xué)校中被稱為形成性評(píng)價(jià)的實(shí)踐活動(dòng)也不盡相同。
《不讓一個(gè)孩子落伍法》實(shí)施后的一個(gè)重要的現(xiàn)象就是學(xué)生的考試激增,其中許多是自發(fā)的,要比聯(lián)邦法律和各州評(píng)估系統(tǒng)要求的高出許多。許多學(xué)校學(xué)區(qū)舉行名為基準(zhǔn)評(píng)價(jià)、短期評(píng)價(jià)和中期評(píng)價(jià)來預(yù)測(cè)學(xué)生在高風(fēng)險(xiǎn)測(cè)試中的表現(xiàn),并找出那些需要額外幫助的學(xué)生。這一層次測(cè)試的日益流行,已使得形成性評(píng)價(jià)的概念范圍得到拓寬。
為逐漸增多的測(cè)試尋找支持的K-12教育平臺(tái)中的各個(gè)測(cè)試公司有時(shí)也會(huì)為“形成性評(píng)價(jià)”的產(chǎn)品做廣告。這加劇了大家認(rèn)為考試本身就是形成性評(píng)價(jià)的觀念。
實(shí)際上,這一層次的測(cè)試常常稍多于一些小型的總結(jié)性測(cè)試,并不總是與在課堂中講授的內(nèi)容密切聯(lián)系。在這些測(cè)試中,固有的形成性并不存在,他們或許會(huì)對(duì)教學(xué)產(chǎn)生改變,使得學(xué)生學(xué)習(xí)效果更好。
一、總結(jié)性評(píng)價(jià)與形成性評(píng)價(jià)的區(qū)別
那么,什么是形成性評(píng)價(jià)?首先,它不是一種產(chǎn)品。那是對(duì)想要一個(gè)優(yōu)秀的形成性測(cè)試項(xiàng)目案例的管理者的主要誤解。即使評(píng)價(jià)將繼續(xù)被冠以形成性和總結(jié)性的標(biāo)簽,但是評(píng)價(jià)究竟是形成性的還是總結(jié)性的,取決于如何使用評(píng)價(jià)的結(jié)果。
總結(jié)性評(píng)價(jià)的結(jié)果通常被用于作一些判斷,例如在班級(jí)分配中決定一個(gè)學(xué)生該被分到哪個(gè)年級(jí),測(cè)量項(xiàng)目的有效性,或者判斷一所學(xué)校是否達(dá)到年度適當(dāng)進(jìn)步。有時(shí)候總結(jié)性評(píng)價(jià)指的是對(duì)學(xué)習(xí)的評(píng)價(jià),其目的是測(cè)量學(xué)生、學(xué)校的水平或是項(xiàng)目成果。
另一方面,形成性評(píng)價(jià)在總結(jié)性評(píng)價(jià)之前的教學(xué)過程中反饋了一些重要信息。教師和學(xué)生都依據(jù)形成性評(píng)價(jià)的結(jié)果制定計(jì)劃,確定在下面的學(xué)習(xí)中擬采用何種活動(dòng)。形成性評(píng)價(jià)是一種實(shí)時(shí)的、動(dòng)態(tài)的、涉及到比頻繁的測(cè)驗(yàn)更多內(nèi)容的過程,對(duì)學(xué)生學(xué)習(xí)的測(cè)量只是其中的一項(xiàng)內(nèi)容。
二、使用形成性方法的總結(jié)性評(píng)價(jià)
幾乎任何的評(píng)價(jià)工具都可用于總結(jié)性或形成性的目的,但出于設(shè)計(jì)的原因,某些評(píng)價(jià)工具更適合總結(jié)性或形成性用途。例如學(xué)區(qū)測(cè)試,盡管其也具有些許形成性用途,但其是為了提供可解釋的數(shù)據(jù)以及供學(xué)校和地區(qū)進(jìn)行對(duì)比的目的而設(shè)計(jì)的。由于總結(jié)性是其主要目標(biāo),其結(jié)果或許不能以教師和學(xué)生易于理解操作的方式來理解,而且測(cè)試結(jié)果往往在管理部門進(jìn)行測(cè)試后的數(shù)個(gè)月之后發(fā)布。因此,這些階段性的測(cè)試通常不具備良好的形成性評(píng)價(jià)功能:并不能提供更多信息,以指導(dǎo)每日教學(xué)或?yàn)槊總€(gè)學(xué)生下一階段的學(xué)習(xí)決策提供幫助。
各學(xué)區(qū)無論從商家購(gòu)買還是本地開發(fā),基準(zhǔn)評(píng)估通常是指衡量各州或?qū)W區(qū)的內(nèi)容標(biāo)準(zhǔn)的進(jìn)展情況,并對(duì)大型總結(jié)性測(cè)試的未來實(shí)施作出預(yù)測(cè)。一個(gè)普遍的誤解是這一層次的評(píng)估無疑是形成性評(píng)估。雖然這些評(píng)估有時(shí)做形成性用途——為小組或個(gè)別學(xué)生作下一步的指引,但是如何使用測(cè)試結(jié)果才可擺脫這種意圖,教師和管理者們?nèi)狈φ_的理解。如果由教師掌控評(píng)估、報(bào)告結(jié)果并繼續(xù)以先前計(jì)劃作為指示,那么這些評(píng)估將不會(huì)產(chǎn)生形成性的益處——在某一特定時(shí)間內(nèi),教師計(jì)劃反饋大量的信息時(shí),這種情況很容易出現(xiàn)。
教師也可以選擇自行開發(fā)總結(jié)性評(píng)價(jià)——那些可看作是一種成績(jī)。與州和學(xué)區(qū)的測(cè)試相比,這些教室里的評(píng)估更易適于形成性用途,因?yàn)槠浣Y(jié)果利用更迅速,其學(xué)習(xí)目標(biāo)指向更為近期的教學(xué)。當(dāng)教師了解測(cè)驗(yàn)中每一個(gè)問題或任務(wù)測(cè)量的具體學(xué)習(xí)目標(biāo)是什么時(shí),他們可以用這些測(cè)驗(yàn)結(jié)果來篩選和重教學(xué)生還沒有掌握的部分課程。精心設(shè)計(jì)的普通評(píng)估也可以用于此法。
學(xué)生也可使用總結(jié)性測(cè)試的結(jié)果為將來的學(xué)習(xí)明確方向。如果評(píng)價(jià)題目與預(yù)期的學(xué)習(xí)目標(biāo)十分相配,教師們便可以在為找到諸如以下問題的正確答案時(shí)指導(dǎo)學(xué)生:
相對(duì)于標(biāo)準(zhǔn),我的優(yōu)勢(shì)是什么?
我已意識(shí)到的提高是什么?
哪些領(lǐng)域是我的弱點(diǎn)?
哪些是我沒有按要求去做的,如何可以做得更好?
在我的學(xué)習(xí)中,這些結(jié)果對(duì)下階段有何意義,如何為改進(jìn)做準(zhǔn)備?
然而,為使這些問題對(duì)學(xué)生將來的學(xué)習(xí)指導(dǎo)作用發(fā)揮到最大,教師必須計(jì)劃和需要時(shí)間去讓學(xué)生學(xué)習(xí)在總結(jié)性評(píng)測(cè)中沒有學(xué)到的知識(shí)和技能,并要重新進(jìn)行測(cè)試。缺少必要的學(xué)習(xí)時(shí)間是課堂總結(jié)性評(píng)價(jià)的形成性應(yīng)用的最大障礙之一。
三、為了學(xué)習(xí)的評(píng)價(jià)
當(dāng)老師為了純粹的形成性目的評(píng)價(jià)學(xué)生學(xué)習(xí)時(shí),評(píng)估簿中將沒有最終的成績(jī),也沒有總結(jié)性等級(jí)。相反,評(píng)估為學(xué)生實(shí)踐的服務(wù),就像家庭作業(yè)一樣必不可少,這是形成性評(píng)價(jià)最有價(jià)值的地方。這被稱作是為了學(xué)習(xí)的評(píng)價(jià),它通過以下兩種方式支持學(xué)習(xí):(1)教師可依據(jù)有根據(jù)的基礎(chǔ)來調(diào)整教學(xué),作出對(duì)學(xué)生學(xué)習(xí)產(chǎn)生即時(shí)效應(yīng)的變化和改進(jìn);(2)學(xué)生可借助目前進(jìn)程的根據(jù)積極管理和調(diào)整自身學(xué)習(xí)(Stiggins,Arter,Chappuis, Chappuis,2006)。
課堂中學(xué)習(xí)的評(píng)價(jià)可有不同形式,它由教師幫助學(xué)生回答三個(gè)問題組成。
1.我要達(dá)到什么目標(biāo)?
提供給學(xué)生一張學(xué)習(xí)目標(biāo)的單子,上面的學(xué)習(xí)目標(biāo)是他們應(yīng)該掌握的,用友好的語言寫出。
給學(xué)生展示匿名的優(yōu)劣案例,案例就是他們將要?jiǎng)?chuàng)作的各類作品或演示。學(xué)生使用評(píng)分指導(dǎo)判斷為什么那個(gè)是更好的。
2.我現(xiàn)在的學(xué)習(xí)情況如何?
在學(xué)習(xí)過程中管理不分年級(jí)的小測(cè)驗(yàn),用來幫助教師和學(xué)生明確各自在哪方面需要什么樣的工作。
通過得分上突出所反映的具體優(yōu)勢(shì)以及需要提高的地方。
利用得分的情況使學(xué)生分辨他們的優(yōu)勢(shì)和需要提高的地方所在。
讓學(xué)生有一個(gè)對(duì)課程學(xué)習(xí)目標(biāo)的清單,定期檢查已掌握的內(nèi)容。
3.如何縮短差距?
給予學(xué)生反饋信息,并用其制定目標(biāo)。
讓學(xué)生寫出或描述在具體學(xué)習(xí)目標(biāo)上的進(jìn)程。
請(qǐng)學(xué)生評(píng)價(jià)他們的進(jìn)步:已注意到哪些改變?哪些是曾經(jīng)很困難,現(xiàn)在容易的?作為學(xué)習(xí)者,他們對(duì)自身已有哪些了解?
當(dāng)學(xué)生依靠從教師給予的反饋學(xué)習(xí)如何自我評(píng)價(jià)和制定目標(biāo)時(shí),學(xué)生提高了對(duì)他們?nèi)〉玫某晒Φ哪芰ΑT谶@種類型的評(píng)價(jià)環(huán)境下,教師和學(xué)生合作于持續(xù)性的過程中,使用評(píng)價(jià)信息改善而非判斷學(xué)習(xí)。這全依賴于評(píng)價(jià)有為師生提供及時(shí)、易懂、描述性的反饋的能力。
四、反饋:關(guān)鍵的區(qū)別
對(duì)學(xué)習(xí)內(nèi)容進(jìn)行評(píng)價(jià)的反饋存在于依然有時(shí)間采取行動(dòng)的時(shí)候。類似于全球定位系統(tǒng),它的功能是提供與計(jì)劃學(xué)習(xí)目標(biāo)相關(guān)的工作、生產(chǎn)或是行為的描述性信息。避免評(píng)分或是評(píng)議成績(jī)的等級(jí),或者暗示學(xué)習(xí)過程結(jié)束。
計(jì)劃學(xué)習(xí),辨別具體的優(yōu)勢(shì),指出需要改進(jìn)的地方,為學(xué)生減小目前和目標(biāo)差距采取的一連串行動(dòng)提供建議,顧及學(xué)習(xí)者曾經(jīng)可依其行事的糾正反饋的數(shù)目,塑造當(dāng)學(xué)生們自我評(píng)價(jià)時(shí)會(huì)使用的思考形式,以上均是有效的描述性反饋所關(guān)注的。以下例子是描述性反饋:
已正確解釋圖形中的柱狀圖,但需確認(rèn)X、Y軸標(biāo)記的間隔是相等的。
因?yàn)檫@是一個(gè)預(yù)測(cè)性的解釋,所以所寫內(nèi)容只是一個(gè)假設(shè)。可以以“如果……那么……”句型加以改進(jìn)。
那些我們?cè)?jīng)讀過的優(yōu)秀小說都有開頭、發(fā)展和結(jié)局。你的小說和那些優(yōu)秀的一樣,已經(jīng)有了開頭和發(fā)展,能續(xù)寫一個(gè)結(jié)尾嗎?
論文中已對(duì)___和___的相似性進(jìn)行了清晰描述,已區(qū)分出關(guān)鍵的區(qū)別。繼續(xù)用文中具體的例子闡述這些區(qū)別。
相比之下,來自總結(jié)性評(píng)價(jià)(無論是班級(jí)使用還是大范圍使用)的反饋告訴師生們誰才是制定學(xué)習(xí)計(jì)劃和目標(biāo)的人。評(píng)價(jià)工具用到的反饋詞語,如B+、84%、達(dá)標(biāo)、優(yōu)秀的、精通的以及其他,并不能明確個(gè)別學(xué)生的優(yōu)劣所在。對(duì)課程修正的具體信息并未呈現(xiàn)。
五、班級(jí)形成性評(píng)價(jià)的優(yōu)點(diǎn)
雖然一切形成性評(píng)價(jià)實(shí)行起來都有增加學(xué)生學(xué)習(xí)量的潛在可能,然而在班級(jí)中對(duì)學(xué)習(xí)評(píng)價(jià)的優(yōu)點(diǎn)一目了然:
在課程進(jìn)行中,及時(shí)的評(píng)價(jià)結(jié)果使教師能迅速調(diào)整教學(xué)進(jìn)展。
參評(píng)的學(xué)生是班級(jí)形成性評(píng)價(jià)的受益人。
學(xué)生們可用評(píng)價(jià)結(jié)果調(diào)整和改進(jìn)自己的學(xué)習(xí)。
當(dāng)我們?cè)噲D提供一個(gè)類似一日三餐固定食譜似的現(xiàn)成的外部考試,以此監(jiān)督老師評(píng)估過程的時(shí)候,這些優(yōu)勢(shì)已經(jīng)蕩然無存。這些測(cè)驗(yàn)無法適用于每日形成性評(píng)價(jià),此類評(píng)價(jià)只有通曉評(píng)價(jià)的學(xué)者型教師可以進(jìn)行。形成性評(píng)價(jià)最重要的價(jià)值體現(xiàn)于在每輪評(píng)價(jià)中教師和學(xué)生利用評(píng)價(jià)結(jié)果改進(jìn)實(shí)時(shí)的教與學(xué)。
參考文獻(xiàn)
[1] Atkin, J. M., Black, P., Coffey, J. (2001). Classroom assessment and the national science standards. Washington, DC: National Academies Press.
[2] Chappuis, S. (2005). Is formative assessment losing its meaning? Education Week, 24(44), 38.
[3] Stiggins, R., Arter, J., Chappuis, J., Chappuis, S. (2006). Classroom assessment for student learning:Doing it right—using it well. Portland, OR: Educational Testing Service.
作者單位 美國(guó)教育考試服務(wù)中心(ETS)評(píng)價(jià)訓(xùn)練研究所
譯者單位 北京師范大學(xué)教育技術(shù)學(xué)院
譯文經(jīng)北京郵電大學(xué)宋倩老師校訂
(責(zé)任編輯 王永康)