【摘 要】測驗(yàn)法是最常用的教學(xué)評價(jià)手段之一,試卷作為測驗(yàn)的工具,蘊(yùn)藏著大量重要的信息,教師可以從正態(tài)性、信度、效度、難度、區(qū)分度等方面做試卷分析,挖掘數(shù)據(jù)資源。教師在分析考試數(shù)據(jù)的過程中,不僅要看到測驗(yàn)的鑒定功能,而且更需要重視其診斷和改進(jìn)作用,將試卷分析的信息充分地應(yīng)用于教學(xué)實(shí)踐之中,改進(jìn)教學(xué),不斷提高教學(xué)質(zhì)量。
【關(guān)鍵詞】試卷分析 試卷應(yīng)用 物理測驗(yàn)
考試在教學(xué)實(shí)踐中有著廣泛的應(yīng)用,除了選拔、鑒定功能之外,教師還要重視其對教學(xué)的指導(dǎo)和改進(jìn)功能。在查閱文獻(xiàn)的基礎(chǔ)上,結(jié)合自身的教學(xué)經(jīng)驗(yàn),我們認(rèn)為,試卷分析與應(yīng)用的基本思路為“采集數(shù)據(jù)—處理數(shù)據(jù)—指導(dǎo)教學(xué)—總結(jié)反思”四個(gè)環(huán)節(jié)。
一、采集數(shù)據(jù)
本文的研究數(shù)據(jù)選自陜西省延安市某中學(xué)高二年級一個(gè)班級44名學(xué)生的一次物理月考成績。考試試卷為教師自主編制,試卷共有22道題目,滿分為100分。
將該班所有考生本次測驗(yàn)中22個(gè)題目的得分逐個(gè)統(tǒng)計(jì)在Excel表格中,形成考試成績統(tǒng)計(jì)表,并導(dǎo)入Spss軟件中。
二、處理數(shù)據(jù)
數(shù)據(jù)處理工具是Excel及其Spss16.0統(tǒng)計(jì)分析軟件。
1.成績分布及統(tǒng)計(jì)分析
通過考試取得的數(shù)據(jù)往往是大量的,難以直接看出具體信息,需要對其做初步整理才能反映數(shù)據(jù)的整體概況。可以通過頻數(shù)分布表、頻數(shù)分布圖和一些特征值對數(shù)據(jù)做初步的處理。對44名學(xué)生考試成績作成績的頻數(shù)分布圖,并輔以正態(tài)擬合曲線,如圖1所示。
理論上,考試成績應(yīng)服從或近似服從正態(tài)分布,即成績中等水平的學(xué)生占大多數(shù),成績特別好和特別差的學(xué)生占少數(shù)。試卷分析首先必須檢驗(yàn)其考試結(jié)果的分布情況,通過正態(tài)擬合檢驗(yàn)發(fā)現(xiàn)本次考試的成績接近正態(tài)分布,且成績處于低分區(qū)人數(shù)較多,20分以下1人,成績在40~50分的頻數(shù)最大,達(dá)到12人,成績在80~90分的有5人。
對考試成績作基本統(tǒng)計(jì),情況如表1所示。
從表1可看到,考試成績的平均值為48.09分,中位數(shù)為43.50,標(biāo)準(zhǔn)差為19.32,表明各個(gè)成績偏離平均值的程度較大;最低分為19.00分,最高分為87.00分,該班級成績總和(sum)為2116分。四分位數(shù)(Percentiles)為:第一四分位數(shù)為32.25,表示有25%的考生成績低于32.25分;第二四分位數(shù)為43.50,表示有50%的考生成績低于43.25分;第三四分位數(shù)為60.00,表示有75%的考生成績低于60分。
2.考試試卷評價(jià)指標(biāo)分析
一份好的試卷,從總體上來說,就是準(zhǔn)確可靠、切實(shí)有效、難易適當(dāng)和鑒別力強(qiáng)。在實(shí)際的試卷質(zhì)量評價(jià)中,通常采用信度、效度、難度和區(qū)分度這幾個(gè)指標(biāo)來衡量。
(1)信度。信度是反映一份試卷的穩(wěn)定性和可靠性的指標(biāo),是分析試卷整體質(zhì)量的重要指標(biāo)之一。一般認(rèn)為,在0.80以上表示非常好,在0.60~0.80之間表示較好,低于0.60時(shí)不可信,應(yīng)對評價(jià)指標(biāo)進(jìn)行修訂。此次試卷檢測到的系數(shù)為0.870,表明該測驗(yàn)的內(nèi)在一致性信度非常好,說明測題的各部分都以同等程度測量著被試的同一種屬性,即本次考試成績的可靠性較高。
(2)效度。效度是反映試卷的準(zhǔn)確性和有效性的指標(biāo),同時(shí)也是評價(jià)試卷整體質(zhì)量的一項(xiàng)重要指標(biāo)。一般來說,效度數(shù)值越大,測題就越好。經(jīng)計(jì)算得到本次測驗(yàn)的效度系數(shù)。對效度系數(shù)做統(tǒng)計(jì)假設(shè)檢驗(yàn),樣本容量小于50,其檢驗(yàn)統(tǒng)計(jì)量t=2.34,即2.58>t≥1.96,表明效度系數(shù)在0.05水平上與總體零相關(guān)有顯著性差異,可以得出本次測驗(yàn)具有有效性的結(jié)論。
(3)區(qū)分度。區(qū)分度指測題對于被試反應(yīng)的區(qū)別程度和鑒別能力,一般用某題的得分與測驗(yàn)總分之間的相關(guān)系數(shù)來表示。經(jīng)計(jì)算,求得各題區(qū)分度如表2所示。
分析表2發(fā)現(xiàn),第7題區(qū)分度小于0.20,表示區(qū)分度很差;第1、第3、第5、第9、第10、第18等題區(qū)分度尚可,但是能修改則更好,其他題目區(qū)分度非常好。
(4)難度。難度是衡量試題與試卷難易程度的指標(biāo),以難度系數(shù)來衡量,一般情況下,試題的難度系數(shù)即為該試題的平均得分率,難度系數(shù)越大,試題越容易,反之越難。
在本次測試中,計(jì)算得到各題難度系數(shù)如表2所示。分析表2發(fā)現(xiàn),第7、第8、第11、第13、第14題難度系數(shù)小于0.4,為難題(p<0.4);第1、第2、第3、第4題為容易題(p>0.7),其余為中等難度(0.4
三、指導(dǎo)教學(xué)
在現(xiàn)行教學(xué)制度下,教與學(xué)的雙方及其管理者更加看重考試結(jié)果的評價(jià)功能。其實(shí)對于教與學(xué)雙方的可持續(xù)發(fā)展而言,考試的改進(jìn)功能都應(yīng)該是首要的。考試只有促進(jìn)學(xué)生發(fā)展和教師成長才能完成其終極目的并且體現(xiàn)其存在的根本價(jià)值。
1.發(fā)揮測驗(yàn)對學(xué)科知識的診斷—改進(jìn)功能
通過對測驗(yàn)的分析,師生可以對教學(xué)過程中存在的問題進(jìn)行揭示與研究,判斷導(dǎo)致困難與不足的原因,進(jìn)而改進(jìn)教學(xué)活動(dòng),即診斷—改進(jìn)。診斷—改進(jìn)功能是現(xiàn)代教育評價(jià)的主要功能,人的發(fā)展和教育活動(dòng)都是一個(gè)不斷變化的過程,只有不斷完善和改進(jìn)教學(xué)才能充分發(fā)揮考試的價(jià)值。
分析圖1發(fā)現(xiàn),50分以下考生達(dá)到28人,即有一半以上的考生成績低于平均成績,需要深入對這28名考生的試卷做詳細(xì)分析,尋找失分的原因,制定補(bǔ)救措施。
分析表2中的難度系數(shù)發(fā)現(xiàn),試卷第7、第8、第11、第13、第14題難度較大,說明大部分考生這些題都做錯(cuò)了,教師應(yīng)重視這一現(xiàn)象,診斷這一現(xiàn)象背后的深層原因是什么,做到透過現(xiàn)象看本質(zhì),從而制定相應(yīng)的措施解決問題。
2.重視測驗(yàn)對學(xué)生的心理影響
在考試中,考生都渴望自己學(xué)習(xí)的成果被認(rèn)可,這是一種普遍的心理現(xiàn)象。在教學(xué)實(shí)踐中必須重視這種心理現(xiàn)象,利用這一心理反應(yīng),盡可能維護(hù)學(xué)生的高成就動(dòng)機(jī)和高自我效能感。
(1)加強(qiáng)個(gè)體內(nèi)評價(jià)與相對評價(jià)相結(jié)合。相對評價(jià)是在一個(gè)團(tuán)體內(nèi),個(gè)體以自己所處的位置與他人相比較而進(jìn)行的評價(jià)。個(gè)體內(nèi)評價(jià)法是以被評價(jià)對象自身某一時(shí)期的發(fā)展水平為標(biāo)準(zhǔn),判斷其發(fā)展?fàn)顩r的評價(jià)方法。個(gè)體內(nèi)評價(jià)是把被試的過去和現(xiàn)在比較,或者將評價(jià)對象的不同方面進(jìn)行比較評價(jià),評價(jià)對象只和自身相比較,充分體現(xiàn)了尊重個(gè)體差異的原則,適當(dāng)?shù)販p輕了被評價(jià)對象和其他人對比的壓力,可以提高被評價(jià)對象的自信心和學(xué)習(xí)熱情。教師在處理考試結(jié)果時(shí),特別是對成績不理想的考生,要多采取個(gè)體內(nèi)評價(jià)。
在本次測驗(yàn)中,某個(gè)考生考試成績?yōu)?4分(見表3),在班級中排名為第14名,如果僅僅對他的第四次考試成績做相對評價(jià),可能會(huì)使其對學(xué)習(xí)喪失信心。但是如果將個(gè)體內(nèi)評價(jià)與相對評價(jià)結(jié)合起來,讓學(xué)生通過和自己以往的成績相比較,使其清楚地認(rèn)識到自己的進(jìn)步,不要輕易否定自己,那么就能提高學(xué)生的自我效能感。
(2)注重量化評價(jià)與質(zhì)性評價(jià)相結(jié)合。書面測驗(yàn)的規(guī)則是把考試的結(jié)果數(shù)值化,從而對評價(jià)對象作出評判。其優(yōu)點(diǎn)是邏輯性強(qiáng),標(biāo)準(zhǔn)和精確化程度高,能對教學(xué)現(xiàn)象的因果關(guān)系作出精確分析,對考生的行為特征作出準(zhǔn)確描述,結(jié)論較為客觀和科學(xué)。但是量化的成績不能反映教學(xué)過程中某些不可量化的因素。量化評價(jià)把復(fù)雜的教育現(xiàn)象加以簡化或數(shù)字化,容易丟失教育過程中一些很有意義的內(nèi)容,因此在對測驗(yàn)試卷的應(yīng)用過程中,不能局限于對具體數(shù)值的關(guān)注,對學(xué)生的評價(jià)要與質(zhì)性評價(jià)相結(jié)合,重視教學(xué)過程中的非智力因素,通過特定的方法(如與學(xué)生對話、交流等),關(guān)心學(xué)生的情感、態(tài)度、價(jià)值觀等因素。
四、總結(jié)反思
一套完整的測試試卷包括測驗(yàn)?zāi)繕?biāo)、測驗(yàn)時(shí)限、測驗(yàn)類型、測題數(shù)量、計(jì)分方法、測驗(yàn)的信度和效度等諸多要素,任何一套測驗(yàn)試卷的編制都不會(huì)是一勞永逸的,需要根據(jù)測試的結(jié)果對難度、區(qū)分度作出修正,使試卷組成不斷趨于完善。
從表2可以看出,本次考試區(qū)分度不合格(0.2以下者)有第7題,可以刪去,因?yàn)樗皇沁^難就是過易;第1、第3、第5、第9題區(qū)分度較低,應(yīng)該修正這些題目,提高區(qū)分度。分析難度系數(shù)發(fā)現(xiàn),容易的試題有4道,中等難度的題目有13道,較難的題目有5道,應(yīng)當(dāng)適當(dāng)削減難題數(shù)量,增加簡單題目數(shù)量,使試卷結(jié)構(gòu)更加趨于合理。
(作者單位:寧夏大學(xué)物理電氣信息學(xué)院,寧夏 銀川,750021)