摘 要: 考試是評價(jià)教育質(zhì)量和檢測教學(xué)效果的重要方法,考題的質(zhì)量是提高考試質(zhì)量的重要環(huán)節(jié)。本文作者從覆蓋系數(shù)、試題量系數(shù)、難度系數(shù)、區(qū)分度系數(shù)、信度系數(shù)、效度系數(shù)等評價(jià)指標(biāo)來分析考試試題,探討如何才能科學(xué)合理地評價(jià)考題,提高考試質(zhì)量。
關(guān)鍵詞: 評價(jià)指標(biāo) 考題評價(jià) 考試質(zhì)量
1.提出問題
盡管教育工作者一直在努力,可目前部分高校還是有忽視考試評價(jià)的現(xiàn)象存在。例如:教師評閱試卷后直接上交成績,對學(xué)生考試情況不進(jìn)行評講和分析;學(xué)生無從獲得標(biāo)準(zhǔn)答案,只會關(guān)注及格沒有。教師與學(xué)生都把考試作為一門課程的終結(jié),忽略其中最重要的考試分析。
考試分析具有很重要的作用,對考試試題進(jìn)行科學(xué)合理的評價(jià),不僅可以檢測教師出題水平,挑選出最佳試題組織考試,而且可以通過評價(jià)考試試題了解學(xué)生的掌握情況,從而使教師的教學(xué)更具有針對性。因此,本文從六個(gè)評價(jià)指標(biāo)探討如何科學(xué)合理地對考題進(jìn)行分析評價(jià),提高考試質(zhì)量。
2.考題評價(jià)指標(biāo)
2.1覆蓋系數(shù)。
覆蓋系數(shù)評價(jià)指標(biāo)是指試題涉及的基本知識點(diǎn)對于教學(xué)大綱要求掌握的知識點(diǎn)的覆蓋程度。
計(jì)算公式可以這樣表示:I=。
I指覆蓋系數(shù),U指考試試題涉及的知識點(diǎn),R指教學(xué)大綱要求的知識點(diǎn)。
通常情況下,試題知識點(diǎn)覆蓋系數(shù)0
2.2試題量系數(shù)。
試題量系數(shù)是指學(xué)生答題所用的時(shí)間與考試要求時(shí)間的一項(xiàng)評價(jià)指標(biāo)。
計(jì)算公式可以這樣表示:T=。
T指試題量系數(shù),U指考試學(xué)生做完試題時(shí)間,K指考試規(guī)定答題時(shí)間。
通常情況下,考試試題量系數(shù)0 2.3難度系數(shù)。 難度系數(shù)是用來衡量試題難易程度的評價(jià)指標(biāo)。 計(jì)算公式可以這樣表示:P=。 P為難度系數(shù),x指所有考生的平均成績,X指考試試卷滿分計(jì)算。 通常情況下,考試試題難度系數(shù)0 2.4區(qū)分度系數(shù)。 區(qū)分度系數(shù)是試題區(qū)分能力的評價(jià)指標(biāo),衡量考試是否具有區(qū)分學(xué)生成績高低的功能。計(jì)算公式可以這樣表示:D=。 D指區(qū)分度系數(shù),x指考試排名前25%的平均分,x指考試排名后25%的平均分,W指考試滿分成績計(jì)算。 通常情況下,區(qū)分度系數(shù)0 2.5信度系數(shù)。 信度系數(shù)是衡量考試穩(wěn)定性和可靠性的評價(jià)指標(biāo),考試客觀性和結(jié)果穩(wěn)定性的反映。計(jì)算公式可以這樣表示:A=1-。 A指信度系數(shù),N指試題數(shù)目,S指考試中某試題得分方差,S指考試試卷得分方差。 通常情況下,試題信度系數(shù)00.8認(rèn)為試題穩(wěn)定性很好。 2.6效度系數(shù)。 考試達(dá)到考試目的程度的目標(biāo)量,從準(zhǔn)確性和有效性來衡量考試結(jié)果對考試目標(biāo)實(shí)現(xiàn)程度的指標(biāo)。計(jì)算公式可以這樣表示:E=。 E指效度系數(shù),N指試題的總數(shù)目,D指第I題的區(qū)分度。 通常情況下,效度系數(shù)E≥0.4才認(rèn)為采用的試題有效地實(shí)現(xiàn)了考試目標(biāo)。 3.考題評價(jià)的實(shí)例分析 以我校05級行政管理專業(yè)學(xué)生參加2008年大學(xué)英語六級考試為例,本次英語考試試卷是由教育部考試中心和全國大學(xué)英語委員會制定的,考試時(shí)間為140分鐘,參加本次六級考試的有18人,對本次考試成績的統(tǒng)計(jì)和分析如下: 3.1覆蓋系數(shù):I===0.78, 0.78>0.7,表示試題的知識點(diǎn)覆蓋是合格的。 3.2試題量系數(shù):T===1, T=1>0.8,表示試題量很大。 3.3難度系數(shù):P===0.617, 0.617≤0.75,表示本次考試試題難易程度適中。 3.4區(qū)分度系數(shù):D===0.270141, 0.2≤0.270141≤0.3,試題區(qū)分程度尚可。 3.5信度系數(shù):A=1-=1.002191, 試題信度系數(shù)1.002191>0.8,表示試題的穩(wěn)定性很好, 3.6效度系數(shù):E==0.256143。 試題效度系數(shù)0.256143<0.4,表示從準(zhǔn)確性和有效性的角度來講,試題并沒有很好地達(dá)到考試目的,N指試題的總數(shù)目,D指第I題的區(qū)分度。 通過上述計(jì)算得出的數(shù)據(jù),我們可以看出這套六級外語試題知識點(diǎn)覆蓋程度合格,但是試題量很大。試題的難易程度適中,但是難度系數(shù)接近0.75,遠(yuǎn)離0.25,相當(dāng)于接近試題難度偏低,遠(yuǎn)離試題難度偏高,直接會影響試題的區(qū)分度。這些都可能導(dǎo)致不能實(shí)現(xiàn)檢測學(xué)生六級英語水平的考試目標(biāo)。 4.對考題評價(jià)的建議和思考 4.1重視高校考試,真正發(fā)揮出考題的診斷、反饋和激勵(lì)的功能。 考試是教學(xué)工作中的指揮棒,教師出什么樣試題,將會直接影響學(xué)生學(xué)習(xí)的方向,反映教學(xué)的方向。因此,科學(xué)而合理地?cái)M定考題具有非常重要的意義。對于考題的擬定,我們應(yīng)當(dāng)以教學(xué)大綱和教材內(nèi)容為依據(jù),認(rèn)真分析學(xué)生的實(shí)際情況,注重因材施考,真正發(fā)揮出考題的診斷、反饋和激勵(lì)的功能,對教學(xué)工作起到積極的促進(jìn)作用。 4.2重視考試試題試卷的評價(jià),充分發(fā)揮考試效能。 考試結(jié)束后要對考試成績進(jìn)行分析,若發(fā)現(xiàn)成績不符合教學(xué)的現(xiàn)象,應(yīng)對試卷進(jìn)行分析,認(rèn)真統(tǒng)計(jì)分析其覆蓋系數(shù)、題量系數(shù)、效度系數(shù)、信度系數(shù)、難度系數(shù)和區(qū)分度系數(shù)。針對存在的問題,應(yīng)認(rèn)真查找原因,找出薄弱環(huán)節(jié),以便在今后的教學(xué)中有的放矢地進(jìn)行糾正和改進(jìn)。 4.3利用現(xiàn)代科學(xué)技術(shù),研究和開發(fā)高校試卷試題評估分析系統(tǒng)。 我國學(xué)者在教育測量中對高校試卷試題的分析評價(jià)僅停留在經(jīng)典理論框架下的應(yīng)用探討,部分院校的試卷分析研究還停留在手工統(tǒng)計(jì),未利用計(jì)算機(jī)技術(shù);已應(yīng)用計(jì)算機(jī)技術(shù)開發(fā)的系統(tǒng)功能還不夠強(qiáng)大,在今后的教學(xué)工作中,我們應(yīng)充分發(fā)揮現(xiàn)代科學(xué)技術(shù)、計(jì)算機(jī)技術(shù)對考題評價(jià)的重要作用。 參考文獻(xiàn): [1]錢伯海.統(tǒng)計(jì)學(xué)[M].成都:四川人民出版社,1992. [2]張敏強(qiáng).教育測量學(xué)[M].北京:人民教育出版社,1997:10-14. [3]左任俠.教育與心理統(tǒng)計(jì)學(xué)[M].華東師范大學(xué)出版社,1982. [4]潘懋元.高等教育學(xué)[M].福建:人民教育出版社,1984.