摘要: 本文運用數理統計的方法對試卷質量進行分析,通過對原始分數的處理和解釋,力求能對試卷的質量做出較科學的比較和評價。項目分析著重分析了試卷的難度和區分度。
關鍵詞: 試卷質量 項目分析 難度 區分度
在考試結束以后,對試卷進行分析,不但可以對試卷和考試做出適當的評價,為試卷的編制積累經驗,提高教師編制試卷的水平,為修改試題和給題庫遴選試題提供依據,而且有助于充分地獲得考試提供的教學反饋信息,為改進教學提供依據,為考試講評準備材料。這里我采用數理統計項目分析的方法來分析試卷質量。
項目分析的目的是對考試結果進行統計分析,估計試題的難度、區分度。
1.試題的難度分析
試題的難度是表示試題難易程度的指標,通常用P來表示,其計算方法是以學生答對某題的比率來進行的。一般試題可分為兩種情況:像選擇題、填空題這樣只有答對和答錯兩種情況的,我們不妨稱其為二值題;還有像計算題及證明題這類需要分步得分的試題,我們可以稱其為多值題。這兩種試題的難度計算方法如下表:

一般來說,試題的P值應以0.2-0.8為宜。由于P值無等距性,所以無法對試題的難度差異作精確比較,也不能用于計算平均難度,為了對各試題作比較,通常要把P值轉換成標準難度Z,使之等距化。設U為與答錯率Q(Q=1-P)相對應的標準分數,標準難度的計算公式是:Z=4U+13。具體做法如下:
(1)求出試題的答錯率Q。
(2)由Q值對照“正態分布函數表”,查出Q對應的標準分數U。
(3)將查到的數據帶入Z公式計算。
當P>0.5,Q<0.5,U<0,則Z<13;當P=0.5,Q=0.5,U=0,則Z=13;當P<0.5,Q>0.5,U>0,則Z>13。當Z=13時,試題的難度屬于中等水平。為了方便地由P值得出其所對應的Z值,我做了下表:

例如,某題難度為0.35,那么,由表3可查得,其標準難度為14.54。
2.試題的區分度分析
試題的區分度也是評估試題質量的重要指標,通常用D來表示。考試的目的是為了將不同知識和能力水平的考生加以區分,每一試題都對考生有所區分,試題的區分度正反映了這種區分能力的大小。區分度高的試題能將不同水平的考生區分開來,也就是說,試題的區分度高,水平較高(總分較高)的考生該題的得分也較高;反之,區分度低的試題不能對考生進行很好的鑒別,使得水平高和水平低的考生得分差不多。兩端分組法是一種簡單普遍的求區分度法,它把總人數分出高分組和低分組(比例各占25%-33%),其計算方法見下表:

除了兩端分組法之外,通常還可以采用弗拉南根查表法:根據占總人數27%的高分組的答對率P高和占總人數27%的低分組的答對率P低,從專門的表中查得題目的區分度。

例如對某一題,高分組的答對率為74%,低分組的答對率為46%,那么,由表5可查得,其區分度為0.3。
對區分度的評價見下表:

一般來說,當D<0.20時,試題的區分度太低,必須淘汰或加以修改;當D≥0.40時,試題的區分度就非常好;通常試題的區分度在0.2-0.4之間。影響區分度的因素較多,其中最主要的是難度。假如,某試題的通過率是1.0或0,則說明高分組和低分組在通過率上不存在差異,從上面的計算公式來看,此時D=0;假如某題的通過率是0.5,則可能是高分組的所有人都通過了,而低分組無人通過,這樣區分度的最大值就可能達到1.0。由此看出,難度越接近0.5,試題的潛在區分度就越大;難度越接近1.0或0時,試題的潛在區分度就越小。
通過對試卷的分析,從而發現教師、學生以及命題等方面的成功與不足之處,并針對存在問題提出改進意見,提高教學效率,這也是本文的目的。
參考文獻:
[1]魏宗舒.概率論與數理統計教程.北京:高等教育出版社,1983年10月第一版.
[2]沈永歡,梁在中,許履瑚.實用數學手冊.北京:科學出版社,1992年8月第一版.
[3]劉錦萼,楊喜壽,俞純權,房俊嶺.概率論與數理統計.北京:科學出版社,2001年8月第一版.