劉蓉 唐婷 李興杰 楊佳
摘要:本文主要應用數理統計相關知識,通過試卷的難度、效度、區分度、信度和覆蓋度等質量指標,來分析試卷。并在研究探討課程考試試卷質量分析的測評指標及其計算公式的基礎上, 結合評價方法,對我校2017級高等數學考試試卷質量進行了分析。
關鍵詞:質量分析;數理統計;分析試卷
試卷質量的分析是評價考試質量,檢驗考試有效性的基本方法。運用數理統計的方法,通過分析學生的成績,計算此套試卷的難度,效度,區分度,信度,覆蓋度,從而推斷此套試卷的合理性。
一、試卷質量分析指標
(一)難度
難度是指試卷或試題的難易程度。可以用學生在某一道題的錯誤率來反應試題的難度,即難度系數(0< <1)。難度系數越大,即錯的人數越多,該題難度越大。數學試卷上的選擇填空題答案唯一屬于客觀題, =答錯該題人數/總人數;計算題解法多樣,一般按步驟計分屬于主觀題: ( 指考生在某一考題得分的平均值; 指該題的滿分值)。
一套試卷試題偏難,應該用于選拔考試,難題的比例可以拉開分值。試卷試題偏簡單,難以判斷學生對知識的掌握情況,也無法評估教學效果。試題的難度直接影響考試成績的分布形態和離散度。過難,總體考試成績偏低,呈正偏態分布;過易,總體考試成績偏高,呈負偏態分布。一般應用于學校測試的高質量試卷的難易程度應該適中,平均難度系數控制在0.5左右,即難、中、易試題的比例2:6:2。
(二)效度
效度是指評價考試結果的有效性與正確性的指標。
(三)區分度
區分度是區別被測對象對于該測試學科理解掌握程度高低的指標,它反映出被測對象水平的高低。如果對于某道題,水平高的同學得高分,水平低的同學得低分,那么就說明該題目的區分度高,如果所有的同學全得滿分或者全不得分,說明該題目區分度低。一般區分度高于0.3,說明該題目質量不錯。下面我們用公式準確計算。
計算區分度的方法有很多,不同的方法所得結果不同,其中最常用的是極端分組法,即將學生按照第j題所得的分數從高到低排列,前27%的學生組成高分組,后27%的學生組成低分組,那么第 題的區分度為 。其中 表示高分組在第 題的總得分, 表示低分組在第 題的總得分, 表示第 題應得滿分乘以單組人數之和。一般區分度 > 0.4說明區分度高,題目質量非常好, 在0.2~0.4說明題目質量一般, < 0.2說明題目區分度非常差,需要修改或淘汰。試卷的區分度 ,其中當 > 0.4,試卷整體區分度為優; < 0.2為差。
(四)信度
信度是評價試卷質量的一項重要指標。信度表示的是該試卷測試結果的可靠性,即能否真實地反映應試者的真實水平。當一份試卷多次測驗,應試者所答相同時,那么我們說該試卷的可信度高,質量是可靠的,能反應出考生的真實水平。
信度可采用克朗巴赫系數公式計算, 其中, 表示第 題的方差, 表示試卷的總方差, 表示試卷中的題目個數。因此,信度的最大值是1,最小值是-1。反映信度大小的量是方差,各題的方差小,則試卷的信度高,反之則信度低。一般標準化考試要求 >0.9。
(五)覆蓋度
覆蓋度是指該試卷的考點與檢測周期內知識點之比,一份試卷考察的知識點越廣泛,覆蓋度則越高,試卷的質量越好。覆蓋度是難易度、區分度、置信度、校度作為衡量試卷質量指標的有效前題,覆蓋度越高,指標的有效性越好。一份試卷一定要有廣泛的覆蓋度,對于重要的知識點要面面俱到,這樣考察才具有代表性。
覆蓋度不能直接計算出來,一般用各題得分之間的相關系數矩陣 表示,公式如下: ,其中 越大,說明題目之間的相關性越大,考點越相似,試卷的覆蓋度越小,所以 越小,試卷的覆蓋度越廣泛,質量越好。一般要求 < 0.2,反之說明試卷考察范圍太單一,應及時修改試卷內容。
二、試卷指標實例分析
應用上述指標對某班高等數學期末試卷進行分析,該班參加測試人數為59人,試卷共5大題,通過計算結果如下:
在所選實例試卷的各項數據系數中,①在難度這一欄,各大題難度系數的平均值為0.344,說明該試卷試題難度偏易,同學們錯誤率較低,難度系數在0.3附近其中第三、四、五大題相對比較容易,第一、二題難度相對較大。②此次所選試卷效度為0.7542,達到0.4以上,說明此試題能夠真實有效的反應出學生的學習水平。③從各大題的區分度來看,都大于0.4,各大題的區分度有明顯差距,但總體來看是合理的,這些試題的質量對很好,可以很好的區分出學生的水平④此次試卷的信度為0.71,信度一般,小于0.9沒有達到標準試卷的信度要求,信度受到影響的因素有很多,比如考場監考情況、學生考試態度等等。⑤從覆蓋度的矩陣中看, < 0.2的居多說明此份試題的覆蓋面大,所涉及到的知識點很全面。
綜上所述,該套試卷整體難度偏低,試卷試題偏簡單,可以適當地提高試卷難度,有利于更好地評估教學效果。其它指標良好,說明該試卷考點分布合理,考查面廣,考核較全面。
參考文獻:
[1]盛聚, 等.概率論與數理統計[M]. 北京: 高等教育出版社,1989.
[2]郭述平,王景英.教育測量[M].長春:東北師范大學出版社,1987
[3]張玲,基于數理統計方法的試題,質量的科學評價與分析[J],理論與實踐2018.(1):23-25
[4]萬金鳳. 關于試卷質量的分析方法[J]. 山西師范大學學報: 自然科學報,2006,20(1):22-24.
[5]熊德云,張東軍.概率論與數理統計及其應用[M].科學出版社,2005.
[6]朱德全, 宋乃慶.現代教育統計與測評技術[ M] .重慶:西南師范大學出版社, 1998 .