[收稿日期]2009年8月25日
[作者簡(jiǎn)介]牛海成:河南理工大學(xué)土木工程學(xué)院。何軍:河南理工大學(xué)土木工程學(xué)院。
[摘 要]利用教育測(cè)量與統(tǒng)計(jì)分析理論,對(duì)學(xué)院2006級(jí)本科生《鋼結(jié)構(gòu)》期末考試試卷進(jìn)行了包括分?jǐn)?shù)成績(jī)總體分布、試卷難度、區(qū)分度、信度等方面的分析研究,為科學(xué)出好試卷提供了依據(jù)。同時(shí),闡述了考試成績(jī)與試卷質(zhì)量的關(guān)系,提出考試后要及時(shí)對(duì)考試成績(jī)及試卷進(jìn)行合理分析,總結(jié)反饋信息,尋找教學(xué)中存在的問題,篩選優(yōu)良考題,不斷完善試題庫(kù)建設(shè)。
[關(guān)鍵詞]試卷分析 難度 區(qū)分度 信度
[中圖分類號(hào)]G64 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1009-5489(2009)11-0030-03
考試是教學(xué)過程中的一個(gè)重要環(huán)節(jié),是衡量教學(xué)效果的重要手段。完備的考試總結(jié)對(duì)于改進(jìn)教學(xué)、優(yōu)化教學(xué)效果起著至關(guān)重要的作用,而詳細(xì)的試卷分析在考試總結(jié)中的作用更是舉足輕重,對(duì)于提高命題水平和考試質(zhì)量尤為關(guān)鍵。但是目前我們廣泛采用的是傳統(tǒng)的試卷分析方法,即:劃分分?jǐn)?shù)段,統(tǒng)計(jì)各段人數(shù),計(jì)算各段人數(shù)占總?cè)藬?shù)的百分比,計(jì)算平均分、及格率、優(yōu)秀率等。實(shí)踐證明,這些傳統(tǒng)的試卷分析方法只是對(duì)試卷的初步分析,要使分析結(jié)果具有科學(xué)性、客觀性、準(zhǔn)確性,還應(yīng)對(duì)試卷進(jìn)行進(jìn)一步的分析。本文結(jié)合我校2006級(jí)鋼結(jié)構(gòu)考試結(jié)果的分析,闡明試題及試卷分析在考試總結(jié)中的重要作用,并就具體分析指標(biāo)的含義和使用作了詳細(xì)說明,以使廣大教師及教學(xué)管理人員加深對(duì)試題及試卷分析重要性的認(rèn)識(shí),并在量化分析的基礎(chǔ)上作好考試總結(jié),從中發(fā)現(xiàn)問題、尋找并提出解決辦法,充分發(fā)揮考試的反饋?zhàn)饔茫瑑?yōu)化教學(xué)效果,提高教學(xué)質(zhì)量。
一、試卷分析內(nèi)容
圖1 學(xué)生成績(jī)直方圖
根據(jù)我院2008—2009學(xué)年度第二學(xué)期2006級(jí)《鋼結(jié)構(gòu)》期末考試試卷,按照試卷分析的各項(xiàng)指標(biāo),從考試成績(jī)分布,試卷的難度、信度指數(shù)、區(qū)分度等多方面進(jìn)行分析。
2006級(jí)《鋼結(jié)構(gòu)》期末考試有兩個(gè)班參加,考試總?cè)藬?shù)為54人。試卷的成績(jī)直方圖如圖1所示。從圖中可以看出,試卷成績(jī)大致呈正態(tài)分布。
1.試卷難度
難度是指試題的難易程度,用符號(hào)P表示。試題的難度是相對(duì)的,除了與考生自身水平,所測(cè)內(nèi)容本身的難易程度有關(guān)外,還與命題、組卷及考生的知識(shí)經(jīng)驗(yàn)、適應(yīng)程度等因素有關(guān)。
試卷難度可用下面公式計(jì)算:
Pj=1-jaj(1)
P=1100∑nj=1ajPj(2)
式中:j—第j題的平均值,aj—第j題滿分分?jǐn)?shù),Pj—第j題難度。
P表示試卷難度。試卷P以0.2~0.5之間為宜,P>0.5為難題,P<0.2為易題。
2006級(jí)《鋼結(jié)構(gòu)》期末考試的各題型難度分析如表1所示。
表1 試卷難度計(jì)算
題型分值aj平均分j難度值PjP
單選題2015.110.24450.3096
填空題2013.440.32800.3096
簡(jiǎn)答題3524.830.29060.3096
計(jì)算題2515.260.38960.3096
從上表可以看出,試卷各題難度差別較小,其中計(jì)算題較難,試卷整體難度適宜,可以較好地反映學(xué)生的實(shí)際水平。
2.試卷區(qū)分度
區(qū)分度(D)也稱鑒別力,是反映試題效用高低的參數(shù),是評(píng)價(jià)試題質(zhì)量、篩選試題的主要指標(biāo)與依據(jù),它能反映出各檔次學(xué)生對(duì)所學(xué)知識(shí)的掌握程度,即能拉開學(xué)生成績(jī)優(yōu)劣的層次。試題的區(qū)分度是指某道試題對(duì)不同水平的考生加以區(qū)分的能力。區(qū)分度高的試題,能將不同水平的考生區(qū)分開來;區(qū)分度低的試題,則無此功能。總的說來,試題太難或太易,其區(qū)分度都低,中等難度的試題,其區(qū)分度最強(qiáng)。
區(qū)分度的計(jì)算方法一般采用高低分組法進(jìn)行計(jì)算,將全體考生按總分從高到低排序,根據(jù)美國(guó)測(cè)驗(yàn)專家L#8226;Ebel推薦,取前27%名學(xué)生作為高分組,后27%名學(xué)生作為低分組,然后分別計(jì)算高分組的平均分和低分組的平均分,高分組的平均分減去低分組的平均分再除于試題的總分即為該題區(qū)分度的值。2006級(jí)《鋼結(jié)構(gòu)》期末考試總?cè)藬?shù)54人,所以高分組和低分組的人數(shù)都為54*0.27≈15人,經(jīng)過排序后取前15位的學(xué)生作為高分組,取后15位的學(xué)生作為低分組。表2為各題型的區(qū)分度計(jì)算結(jié)果。
表2 試卷各題區(qū)分度計(jì)算
題型總分高分組總分高分組平均分低分組總分低分組平均分區(qū)分度
單選題2026417.600018812.53330.2533
填空題2024416.26671489.86670.3200
簡(jiǎn)答題3544129.400030020.00000.2686
計(jì)算題2528819.200018012.00000.2880
試卷區(qū)分度計(jì)算公式D=1100∑nj=1ajPj=0.2867
式中:Dj—第j題試題區(qū)分度,aj—第j題滿分分?jǐn)?shù)。
區(qū)分度對(duì)題目性能的評(píng)價(jià)標(biāo)準(zhǔn)如表3所示:
表3 試題區(qū)分度評(píng)價(jià)標(biāo)準(zhǔn)
區(qū)分度值試題評(píng)價(jià)
D≥0.4優(yōu):試題質(zhì)量非常好
0.3≤D<0.4良:試題質(zhì)量較高,能改進(jìn)更好
0.2≤D<0.3中:試題質(zhì)量一般,需要改進(jìn)
D<0.2差:試題質(zhì)量非常差,必須淘汰或修改
從以上區(qū)分度分析數(shù)據(jù)可以看出,整份試卷的區(qū)分度為0.2867,說明試題質(zhì)量一般,需進(jìn)一步改進(jìn)。
3.試卷信度
信度(B)是指試卷的穩(wěn)定性和可靠性程度,即將同一份試卷,對(duì)同一組參加考試者進(jìn)行反復(fù)測(cè)驗(yàn),所得結(jié)果一致,那么這份試卷就具有很高的信度。所以,信度是衡量試卷質(zhì)量的一項(xiàng)重要指標(biāo)。信度取值范圍為0—1,其值越大,信度越高。一般認(rèn)為大于0.9可靠性較好,但對(duì)高校課程的合格性考試,由于區(qū)分度要求降低,對(duì)信度的要求也可適當(dāng)放寬,0.5以上即可,即說明可以有若干道題學(xué)生都能答對(duì),這樣可使大部分的學(xué)生的考試成績(jī)均在及格以上。
測(cè)定信度的方法有重測(cè)法、等卷法、對(duì)半法等,以對(duì)半法最常用,求信度系數(shù)最為簡(jiǎn)單。目前,使用最廣泛的計(jì)算信度的方法是克朗巴赫系數(shù)法,其計(jì)算公式為:
B=nn-1(1-∑nn-1S2jS2)(3)
式中:S2j—各題分?jǐn)?shù)的方差;S2—試卷總分的方差;n—試題的數(shù)目。
表4 試題方差計(jì)算
題型單選題填空題簡(jiǎn)答題計(jì)算題信度B
方差2.33072.66444.04493.09230.8753
通過信度系數(shù)計(jì)算,試卷信度較高,因此測(cè)試是真實(shí)的,較好反映了學(xué)生的實(shí)際水平。
二、結(jié)論
通過以上計(jì)算可以對(duì)試卷得出以下結(jié)論:
(1)從試卷總體分析數(shù)據(jù)結(jié)果可以看出,學(xué)生成績(jī)分布是非常符合正態(tài)分布的,從而反映出該試卷總體上是很合理的,也就是說,試卷是符合科學(xué)出卷的總體要求的。
(2)難度上比較適中。各題難度及試卷整體難度均在適宜的范圍之內(nèi),但缺少難題,應(yīng)適當(dāng)增加試題難度。
(3)區(qū)分度一般,除填空題D>0.3,其他各題D值略小于0.3,須進(jìn)一步改進(jìn)。
(4)具有較好的信度,每一個(gè)題的得分高低與整個(gè)試卷的得分高低較好地相一致。
總之,從上面的討論我們可以得出結(jié)論:一份好的試卷,應(yīng)該是難度適中,區(qū)分度好,能客觀反映學(xué)生的實(shí)際水平,具有較高的信度,并且經(jīng)考試后,學(xué)生的成績(jī)呈現(xiàn)正態(tài)分布。因此,在編制試題時(shí)應(yīng)精心考慮。欲使考試完成它所賦有的使命,必須不斷提高試題質(zhì)量,欲使考試試題質(zhì)量符合各項(xiàng)指標(biāo)要求,須做到幾個(gè)方面:
(1)試題的選擇要有覆蓋面,對(duì)課程的主要內(nèi)容一定要覆蓋到,這樣的抽樣才具有代表性。
(2)試題中難度適中的題目要占絕對(duì)優(yōu)勢(shì),但應(yīng)難易結(jié)合。
(3)試題數(shù)量要盡可能多——增大樣本含量,減少抽樣誤差。這樣可使每個(gè)題目上的隨機(jī)誤差相互抵消,從而提高信度。
(4)檢查評(píng)分標(biāo)準(zhǔn),評(píng)分標(biāo)準(zhǔn)要統(tǒng)一,盡量采用流水作業(yè)式評(píng)卷方法。
(5)每次考試的結(jié)果要進(jìn)行統(tǒng)計(jì)分析,以積累好的題目,剔除差的題目,逐步形成一定數(shù)量的高質(zhì)量試題,從而完成建立試題庫(kù)的任務(wù)。
[參考文獻(xiàn)]
[1]黃光揚(yáng):《教育測(cè)量與評(píng)價(jià)》,華東師范大學(xué)出版社2002年版。
[2]黃瓊麗:《我國(guó)遠(yuǎn)程醫(yī)學(xué)教育的改革和發(fā)展》,《中華醫(yī)學(xué)科研管理》2001年第3期。
[3]陳熙、吳成秋、賀棟梁:《試卷分析與評(píng)價(jià)的指標(biāo)體系及其應(yīng)用》,《西北醫(yī)學(xué)教育》2006年第5期。
[4]白曉明、陳國(guó)明、葉成華等:《考試命題與試卷分折》,寧波出版社2003年版。
[5]郭懷蘭、王建洲、劉長(zhǎng)俊等:《預(yù)防醫(yī)學(xué)考試試卷分析與評(píng)價(jià)》,《西北醫(yī)學(xué)教育》2004年第1期。
[6]黃穎、林端宜:《試卷分析研究現(xiàn)狀綜述》,《西北醫(yī)學(xué)教育》2005年第1期。
[7]曾桂興、黃裕勝:《高校課程考試科學(xué)化的探討》,《華南師范大學(xué)學(xué)報(bào)》1995年(專集)。
[8]王孝玲:《教育統(tǒng)計(jì)學(xué)》,華東師范大學(xué)出版社2001年版。
[9]梅林、李華江、梁穎等:《生理學(xué)分階段考試試題難度、區(qū)分度和試卷信度分析》,《醫(yī)學(xué)教育》1999年第2期。