◆許小紅
(陸軍步兵學院教學考評中心)
隨著在線考試、網上閱卷等考試軟件的應用,對于成績的統計分析也不在局限于總分,平均分,各分數段人數及比率的統計,人們提到越來越多的是難度、區分度、信度、效度等。通過考試軟件,我們得到這些參數指標的一個個具體數據,但這些數據到底怎樣來的,文中通過一個具體實例來講述各指標參數在試卷質量分析中的具體應用。
1.難度
難度P:指試題或試卷的難易程度,它是衡量試卷質量的一個重要指標參數。它和區分度共同影響并決定試卷的鑒別性。
難度值在0至1之間,一般情況下,難度適中的試題更能客觀地反映出學生的學習效果。大部分試題平均難度控制在0.3~0.8之間較為合適,選拔性的考試P值為0.5左右為宜,通常以期末考試為目的的參照性的考試,P值可適當偏高,全卷的平均難度以0.7左右宜,0.6~0.8為正常。
2.區分度
區分度D:區分度是區分應試者能力水平高低的重要指標,區分度高低可以反映出應試者的水平差異。
區分度計算公式采用鑒別指數法:D=PH-PL。
PH:高分數組(以總分高分段27%考生為代表)在該題上的得分率。
PL:低分數組(以總分低分段27%考生為代表)在該題上的得分率。
區分度D在-1至+1之間,一般要求試題的區分度在0.3以上,當D>=0.4時,說明該題目能起到很好的區分作用;D<=0.2時,說明該題目的區分性很差。D值為負數時,說明試題或答案有問題。
試題的區分度也與應試者的水平密切相關,試題難度只有等于或略低與應試者的實際能力,其區分性才能充分顯現處理。
3.信度
信度是指測得結果的一致性或穩定性,穩定性越大,意味著測評結果越可靠。Cronbacha信度系數是一套常用的教育測驗可靠性的方法,依一定公式估量測驗的內部一致性。

K:試題數
Si2:第i題得分的方差
Sx2:全部題項總得分的方差。
文中以200名考生《高等數學》的期末考試成績為例,重點講述了如何通過Excel公式函數來計算試卷難度、區分度、信度等評價參數。200份試卷分兩組,一組100份,分別計算其難度、區分度、信度。用到函數公式有計算平均分函數AVERAGE(B:B),計算高分組前27%平均用到的數組公式:
{=AVERAGE(LARGE(B:B,ROW(INDIRECT(“1:”&ROUND(COUNT(B:B)*0.27,0)))))},低分組27%平均與上相同只需更改LARGE為SMALL,計算標準差函數STDEVP(B:B),計算方差函數SUMSQ(),具體數據見圖表1。

從圖表1中可以看出,抽樣樣本中計算出該套試卷每題難度控制在0.3~0.8之間,每題區分度都大于0.3,尤其應用題和證明題區分度都高于0.4,說明這兩題有很好的區分性,能很好地反映不同學生的水平差異。從圖表中還可以看出,難度、區分度之間不存在線性相關性。