●劉輝
促進學習的教師自編測試結果的處理
●劉輝
促進學習的評價應該被視為教師必須具備的一項專業技能,而目前大部分課堂教學活動中,教師促進學習的評價能力不足。在評價取向和技術上,促進學習的教師自編測試結果處理需要由終結性取向轉向形成性取向,由常模參照走向標準參照;促進學習的評價要求提高教師自編測試的標準參照屬性,運用有效的分析工具,施加合理的改進和干預措施。
促進學習評價;教師自編測試;結果處理;內涵;取向;技術
促進學習的評價作為一種新的評價范式逐漸成為主流。促進學習的評價是以改進為目的和指向的?!按龠M學習的評價將學生作為評價的主體和評價信息的重要用戶。它不僅讓教師了解學生的學習,而且讓學生也了解自己的學習;不僅要求學生全面參與評價,而且要有效運用評價信息來改善自己的學習;強調運用多種評價方法來收集關于學生學習的信息,持續地向學生、教師和家長提供學生在掌握學習標準上進步的證據?!盵1]布萊克和威廉等是從“以形成性評價促進學生學習”的實證研究中,得出多進行形成性評價可以提高學生成績的結論。他們所研究的課堂評價包括提問、課堂反饋、書面作業評價和教師自編測試等對課堂教學內容進行評價的評價方式。[2]
在日常教學中,由教師進行支配的課堂評價尤其是課堂層面的測試,是與學生學習關系最密切的評價。根據波帕姆的分類,在教育評價中存在兩類教育測試,這些測試有可能(或不能)幫助教師更好地開展教學活動。第一類是課堂測試,課堂測試是由授課教師編制試題來測試學生對某個單元內容的掌握程度的評價方式。[3]第二類是外界指定的測試,這些測試根據國家或者地區的規定,由專業人員命題,測試學生是否掌握了規定的必備技能。顯然,教師對自編測試更有支配權。因此,教師自編測試的結果處理應該指向促進學生學習,教師通過對課堂測試結果的分析、解釋,獲得學生學習的證據,以改進教學和幫助學生改善學習。
教師自編測試是判斷學生學習水平、促進學生掌握學習目標的重要手段,為后續的教與學改進提供科學決策證據。但教師自編測試似乎并未起到有效促進學生學習的作用。時常發生這樣的情況:測試結束后,教師向學生返還試卷,學生首先看一下測試的分數,然后就把試卷扔在一邊,有些平時成績就太好的學生,甚至連分數都不愿意去看。由于受傳統的應試教育取向和終結性評價方式的影響已久,成績定向的測試為學生提供的反饋信息主要是測試的分數,很少反饋關于學生學習情況的具體的描述性信息。如果再多花一點時間讓學生明白他們究竟什么學得好,什么學得不好,教師自編測試對學生的學習就會有正面影響。
如此頻繁發生的教師自編測試,卻沒有充分發揮促進學生學習的作用。要實現促進學生學習的目的,除了以有效的試卷編制為前提外,教師自編測試結果處理的取向和技術更是非常重要的。如何挖掘教師自編測試數據背后的信息,進而為改進教與學提供科學的依據,自然成為教師自編測試結果處理的關鍵問題。
實踐中,教師往往在單元或模塊教學結束后進行一次測試。但測試的目的是什么?很多教師并不明確,僅僅把測試作為學生學習的階段性總結。在他們看來,測試數據就是用來判斷學生學習的一個數據,分數高低代表了學生成績的高低,得到測試數據后,就可以展開新的一輪教學。至于測試數據分析與學生學習的關系就不去多加追問了。但問題在于,僅僅作為總結性評價,教師自編測試無法回答這些質疑:學生的學習問題到底是什么?又如何分析出原因所在?
教師自編測試給學生提供了一個測量儀來測量自己掌握的知識的深度和廣度,正如運動員通過激烈的競賽來了解自己的優勢和劣勢一樣。同樣,教練通過觀察運動員在競賽中的表現了解他們,教師則通過測驗了解自己的教學效果。一次精心設計的考試其實也是一種教學,因為它能激發學生用新的思維方式去思考概念、發現概念之間的新關系并達到新的認識。
為了促進學生學習的目的,在教學模塊最后進行的測驗其效果是微小的,對于學生學習來說,這種終結性取向的測試不能夠及時地向學生提供反饋信息,發現他們的學習困難,尋找戰勝學習困難的方法和機會。

表1 課堂測驗與反饋的時間與效應值的關系
一般而言,教師自編測試結果反饋耽擱的時間越久,成績改進得就越慢。請注意,在一個測驗題目之后立即給予反饋只有相當小的效應值(0.19),而在測驗結束后立即給予反饋卻有最大的效應值(0.72)。在學習后立即給予測驗,它對成績的效應簡直微不足道,而在學習過后一天給予測驗,效應似乎最為理想。[4]
因此,要發揮教師自編測試促進學生學習的作用,使得測試結果成為下一步教與學決策的重要依據,或者說教師自編測試要承擔起形成性評價角色。測試數據分析要以促進學生學習為指向,對數據背后反映的學生學習情況做深度的分析。測試數據分析不再是為了得到一個判斷學生成績好壞的結論,而是秉持改進教與學的形成性取向。
由于深受外部大規??荚嚨挠绊懀斍敖處熥跃帨y試基本以常模參照為依據,其結果導致了測試的數據僅僅發揮了甄別、排隊等有限的功能。常模參照是以個體的成績與同一團體的平均成績或常模相互比較,而確定其成績的適當等級的評價方法。常模參照評價以衡量被試在團體中的相對地位為目的。教師自編測試的常見的分析指標有班級平均分、難度,有時還有標準差或區分度。其目的是要通過這些數據來比較學生差異,并定出學生的分數排名。其數據分析方式成為了外部大規??荚嚨姆?,是常模參照的結果處理方式。常模參照的測試結果解釋無法明確出學生個體學習水平與學習標準要求之間的差距。
教師自編測試是小范圍內實施的低風險評價,目的并非計算難度或區分度,而在于診斷學生學習,并加以改進學生學習。要達到促進學生學習的目標,測試數據分析首先就要明確課程標準的要求,并以此作為分析學生學習水平的依據。如果處理合理的話,課程標準的要求應被分解為不同的表現水平。如此一來,測試數據分析時,對照標準,學生的學習水平及與學習目標之間的差距就比較容易明確了。這樣的測試數據分析就具有了標準參照(standard-referenced)①的性質。
標準參照測試成績解釋就是在和一組規定明確的能力標準對比之下,對被試的測試成績做出解釋。標準參照評分潛在的原則是學生的成績反映出學生本人的學習水平,與班里其他學生的表現無關。標準參照解釋測試結果是為了將被試的測試結果與既定的標準作比較,被試是否達到標準的要求,還有什么差距,而不在被試之間做比較。在標準參照的測試結果解釋中可以關注學生的個體差異,幫助學生反思自己學習中的問題。在對學生的測試結果進行具體解釋時,教師可以根據學生具體的表現對其學習情況進行較為具體、有針對性的解釋,這種差異化的測試結果解釋避免了籠統的、模糊的反饋,能夠更有效地促使學生改善學習。
測試對教學和學習產生的作用可稱為反撥效應。根據測試對教學和學習產生的積極或消極的影響,測試的反撥效應可分為正面效應和負面效應。正面效應對課程的完善、教材或教法的更新和學生學習的改進會起到積極的推動作用;而負面效應不僅不能對教與學起到推動作用,而且還可能會導致教與學走入歧途。[5]標準參照的教師自編測試結果解釋有助于提高測試的正面反撥效應,這是標準參照的測試結果解釋模式。
由于標準參照測試與課程目標或事先制定的標準相關聯,人們就需要依賴這些標準或目標,來判斷學生的學習成就。在這種情況下,分數并不代表某個學生在同一測試群體內的相對位置,而是表示對事先確定的知識或技能的掌握程度。標準參照的教師自編測試結果解釋的優點是:第一,標準具體化為“能做什么”和“能做到什么程度”,這樣對教師和學生都具有明確的解釋意義;第二,這些標準不是因人而異,每次測試的結果都以此為解釋依據;第三,這些標準可以促使學生通過努力學習來達到標準的要求。由此可見,當教學目標化作標準并用于測試結果的解釋時,它對教學產生的正面反撥效應是顯而易見的。學生將自己的測試結果與標準相對照之后,會發現學習問題或不足之處;這對他們明確今后的學習重點或努力方向,有積極的促進作用。對于教師來說,標準參照的解釋模式有助于他們了解學生學習狀況,以便指導學生反思、改善自己的學習和改進教學,提高教學質量。
人類思維是難以捉摸的,就連心理醫生甚至我們自己都會認同這個觀點。這個規律對于教師評價學生的過程也不例外。學生的學習目標的掌握是內隱的,教師必須思考如何發現這些隱藏的認知變量。“我們在教育中力求讓學生掌握的一切有價值的技能都不是顯性的。這些能力是看不見的,只能通過事實推斷出來。教育評價實質上就是一個做出判斷的過程。也就是我們通過證實渠道從顯性的測試成績中收集證據來準確推斷學生們對內隱變量的掌握情況。這些變量對教學的意義重大?!盵6]這一推斷過程如下圖所示:

圖1 教師根據測試做出推斷的過程
標準參照的測試要依據事先設置的目標等級標準,來解釋學生測試分數的實際含義。也就是說,分數提供的信息應表明學生是否達到預先設定的水平,達到的程度如何等。如何提高教師自編測試的標準參照屬性呢?
首先,在測試前我們應該根據課程目標設定具體的學習目標,明確界定學生預期達到的能力或“能做什么”和“能做到什么程度”。
其次,要合理解釋學生的成績。換句話說,作文得22分的學生是否達到目標?如果達到目標的話,程度如何確定?解釋分數要與事先設置的標準掛鉤,才能明確解釋學生達標的程度。歸根到底,解釋學生的成績牽涉到標準如何制定的問題。標準制定的第一類方法是及格/不及格方法,這種方法根據己定標準,將學生分成兩類:掌握課程內容或沒有掌握課程內容的。那么,根據這種標準解釋學生成績時,就可以得到相應的反饋信息:學生掌握了課程內容還是沒有掌握課程內容。標準制定的第二類方法是連續分類法。這種方法的前提假設是學生的測試分數通常出現在一個分數或等級連續體上。因此,測試分數的解釋應該考慮到不同分數所代表的等級或程度。例如,基于學生考試表現的連續分類法,通過分析學生成績來確定最低通過標準。最低標準以上的分數將賦予各級等級或程度的含義。
最后,只有使教師自編測試的結果具備解釋功能,可以表明學生達到標準的程度,才能使教師和學生從中得到有效的信息反饋,了解實際能力水準或問題所在,標準參照的教師自編測試才能在考試反撥效應中產生積極的推動作用。
教師自編測試是促進學生學習的重要途徑之一,對學生學習有著直接而深遠的影響。在促進學習的評價范式的理念指導下,測試的目的是通過激勵學生根據反饋信息改進學習,以促進他們的學習,而且如果教師能給予具體的指導和訓練,測試還能使學生更加集中精力學習、學習目標更明確。
(一)學生跟蹤自己的進步
學生是評價信息的使用者,需要理解學習目標,更需要全程參與評價,并監控自己的學習進步以及與教師交流自己的學習情況。教師應懂得如何幫助學生有效地利用每一個階段的評價信息,跟蹤學生的學習進步,作為自己教學決策的依據。同時,教師應懂得如何運用評價結果反思自己的教學與評價,了解教學中的問題與評價的質量,及時改進存在的不足。
學生運用圖表(表2)來展示自己的學習進步情況。[7]該折線圖中的各欄呈現出對學生學習測量主題——“概率”的6次不同評價。第一欄呈現該生第一次評價的得分,第二欄呈現第二次評價的得分,如此類推。這一方法可以給學生提供一個可視的成績表述,讓學生看見自己的進步。它還可以給學生提供一個確定自己的學習目標,不用在班上進行成績排名就可以判斷自己的學習是否成功的手段。這種跟蹤學生進步有助于促進學生的學習,在整個評價打分階段讓學生看見他們“學習知識的收獲”,可以激發他們的“內在動機”。
(二)運用錯誤分析策略
研究表明,考試這種評價手段不僅能檢測學生知識的掌握程度,還能改善學習。有研究對比了參加了考前預考的學生和未參加預考的學生在考試中的表現。結果表明前者的成績要優于后者,這說明學生可以從考試經驗中學到知識。[8]

表2 學生進步圖表
1.什么是錯誤分析
這是運用評價從元認知角度改善學生今后表現的一種系統方法。它包括兩個步驟,首先獲得關于錯誤的策略性元認知知識,然后循環運用該知識達到自我改善的目的。
2.在什么時候、出于什么原因使用該策略
錯誤分析有如下幾個好處。第一,它賦予學生掌握重要材料的第二次機會。第二,在學生評價考試表現、找出錯誤和潛在的錯誤模式、設計今后的改正路線時,該策略能幫助學生發展元認知能力,這樣,學生既掌握了策略性知識,又鍛煉了獨立的自我管理能力。例如,它能幫助學生預測今后可能發生的錯誤并及時改正,不讓錯誤出現在考試中。第三,它能讓學生用內因,也就是自身原因來解釋學習中的得失成敗。這樣,他們會認識到學習成果是來自自己的勤奮努力,來自所采取的行動,來自恰當的策略以及其他一些因素,總之一切盡在自己掌握之中。
3.如何運用錯誤分析策略
錯誤分析要求識別正確的信息、答案和方法,同時辨別錯誤、疏漏和其他問題,還要判斷它們發生的原因,計劃今后如何避免同類錯誤。運用錯誤分析時,學生應找出自己的錯誤答案以及正確答案(陳述性知識);判斷他們做錯題的原因(因果知識);擬定行動計劃,思考目前已對材料了解了多少、學會了多少,計劃今后如何記住信息(程序性知識)。在分析過程中,學生應始終把焦點放在涉及錯誤的具體內容上,而不應該關注導致錯誤的一般原因。下面的例子是生物考試中一道多項選擇題的錯誤分析。[9]

錯誤分析法旨在幫助學生從更廣的角度分析試卷問題,不僅僅是就題論題。教師要引導學生向自己提出諸如此類的問題:“當時我怎樣學習,考試時就會做出正確答案?”“當時我怎樣學就會知道什么樣的答案是錯誤的呢?”不要過分看重問題的對與錯,要多關注學習內容,這樣學生會更深入的理解材料,明白知識之間的相互關系,最終,學生將能掌握正確的思維策略,學會調節自己的學習。
獲得測試結果不僅是教與學的終點,而且是新一輪教與學的開始。教師應充分發揮自編測驗結果在診斷和改進方面的積極作用,有效利用評價信息來反思教學與評價行為,挖掘這些信息對改善教學與促進學生學習的意義。測試結果的處理不只是簡單地發布與告知,更側重于對結果的解釋與反饋,學生對自己學習的改善。教師自編測試其增值作用體現在“學習——評價——獲得評價結果——利用評價結果規劃再學習……”這一持續發展的過程中。
注釋:
①注:對于Criterion-referenced與Standard-referenced,目前學術界基本都把它們翻譯為標準參照,但一般意義上,Criterion-referenced與Norm-referenced相對應,Criterion-referenced與Standard-referenced在很大程度上包含的內涵是一樣的,主要區別在于Standardreferenced含有多種表現水平,而Standard的含義更具有課程標準的內涵(包括內容標準、表現標準),本文選擇了后者,主要原因就在于Standard-referenced所具有多種表現水平的內涵,而且更強調凸顯了測試數據分析以課程標準為依據的特點。
[1]Stiggins,Richard J.From Formative Assessment to Assessment for Learning:A Path to Success in Standards-based School[J].Phi Delta Kappan,2005(10).
[2]Black,P.&W iliam,D.(1998).Inside the black box:Raising standards through classroom assessment[J].Phi Delta Kappan,80(2),146.
[3]W.James Popham.(2003).Test Better,TeachBetter-The Instructional Role of Assessment[M].Associantion for Supervision and Curriculum Development(ASCD),3.
[4]Robert J.M arzano,DebraJ.Pickering.有效課堂——提高學生成績的使用策略[M].張新立譯.北京:中國輕工業出版社,2003:122.引用時稍做修改。
[5]Hughes,A.(1989).Testing for Language Teachers[M].Cambbridge:Cambridge University Press,1-2.
[6]W.James Popham.優化測試,優化教學[M].鄧小玲譯.北京:教育科學出版社,2009:3.
[7]Robert Marzano著.有效的課堂評價手冊[M].鄧妍妍譯.北京:教育科學出版社,2009:96.
[8][9]Neal A.Glasgow,Cathy D.Hichks著.成功教師全攻略[M].梁麗娜譯.北京:中國輕工業出版社,2008:85,87.
(責任編輯:張斌)
劉輝/上海市閔行區教育學院