張宇堯


【摘 要】本文選取河南省某市一重點中學某次期末考試的初一數學卷。同時根據經典測量理論中抽樣要有代表性和項目反應理論中樣本量要大、被試范圍要廣等要求,隨機抽取530名考生的數學試卷,對題型、總分、每題得分進行了統計。
【關鍵詞】試卷質量;經典測量理論;SPSS
經典測量理論要求全部測試所用參數從考生樣本中獲得。在一組樣本中實際測量的分數稱為觀測分數,大多情況下真分數模型中的假設能夠借助實驗數據得到驗證,這種理論建立在隨機抽樣理論的基礎 上,測驗結果可信度高,較普遍化。真分數模型是經典測 量理論的基礎模型,根據真分數的假設可以延伸出與其 相關聯的假設定理,即經過足夠多次數的測試,觀測 分數會無限接近于真分數,那么隨機誤差就會被無限縮小化,真分 數就等于測量實際得到分數的期望值,因此在數學上可以認定測量上被試的觀測分數就是真分數。可用下式表示:
T=E(X) (2-1)
式中的X為被試在測驗上的實得分數,E代表期望,T代表被試的真分數[1]。如果按數學上定義的真分數來求解的話發現這里的真分數不能夠被直接測量,因為這里的真分數是在經過足夠多次重復試驗以后得到的平均觀測分數。由于任何測驗都存在不可避免的誤差,因此在經典測量理論的假設中規定觀測分數應等于真分數與隨機誤差之和,這也使得觀測分數不是某一固定值,而是會在一定范圍內上下波動,如果從信息論的角度理解可知在眾多的信息當中包含著有用信息和無用信息,而教育測量的目的是排除干擾信息,保留有用信息,在經典測量理論中前者稱為誤差,后者稱為真分數。
一、典測量理論的相關指標
(一)難度
難度從字面上理解就是難易程度,難度的計算實質上就是計算題目的得分率。由于難度是一個相對的指標,會 因為樣本的不同所得出的難度值也會不一致。試題難度的計算方法很多,本文將試題分為客觀題和主觀題,采用如下兩種計算公式:
(1)客觀性試題難度P計算公式:P=K/N
K為答對該題的人數,N為參加考試的總人數。
(2)主觀性試題難度P計算公式:P=X/M
X為試題平均得分,M為試題滿分。
(二)區分度
區分度是指 測試題目對水平不同的學生的區分程度或 鑒別能力。具有良好區分度的考試,實際水平高的被試應 得高分,水平低的被試應得低分。它是測驗是否有效的“指示器”,被作為評價試題質量,篩選試題的主要 指標。計算區分度的方法很多,比較普遍的一種 方法是兩端分組法。該方法比較得分在高、低兩端的被試通過該題的比率得到區分度。假設PH和PL分別為高分組和低分組通過某個題目的百分比,則下式即為區分度的計算方法:
D=PH-PL
二、試題的難度分析
本試卷共有22道試題,根據抽樣的數據,顯示試題難度如圖1所示:
一般地說,試題的難度測量可參照表1進行評價,
整卷難度發展變化 的總體趨勢是從易到難,從每種題型分開來看,同樣呈由易到難的趨勢;總體來說,試題的難度偏低,試題難度值大部分在0.66~0.83之間,試卷整體難度平均值為0.75,說明試卷較為簡單,但由于本試卷為期末考試試卷,通常期末考試試卷為目標參照性考試,平均難度在0.7左右為宜。
三、試題的區分度分析
本文采取一種較 方便的方法。對于客觀題,使用等級相關分析,使用斯皮爾曼等級相關分析,即求總分與每個試題得分間的相關系數;對主觀題,看成是非等間距測度的連續變量,并且樣本數大于30,采用皮爾遜相關分析來對試題進行分析,即求總分與每個試題得分間的積差相關系數作為實體的區分度[2]。對區分度的評價如下表所示:區分度D?艸0.4很好,0.3?艽D<0.4良好,如能改進更好;0.2?艽D<0.3尚可,需改進;D<0.2差,需淘汰。
在本文使用的樣本中,第1~8題為客觀題,第9~22題為主觀題利用SPSS對區分度進行分析,輸出結果的最后一行每小題與總分之間的相關系數即為區分度,輸出整理結果如下表:
由各題的區分度表可以看出,只有第1題的區分度不夠,需要淘汰,第4、5、12題的區分度需改進,其余題目的區分度均在良好水平以上,這說明該試卷的整體區分度良好,對水平不同的學生具有較好的鑒別能力。
四、結論及建議
在本文中,以經 典測量理論為理論指導對試卷的分析得到了大體一致的結論,即樣本試 卷區分度一般。同時,本文表明,簡單將學生的總分看成能力的指標是不夠 科學嚴 謹的。在 很多人的觀念中,分數是一個評價學生能力的最有效指標。但事實上,分數并不能承載這么多的內涵。考試分數在一定程度上可以反映學生對書本知識掌握的情況,但不一定能反映學生的實際 能力;單一按照總分得到的排名也不能作為衡量學生的綜合能力的唯 一標準,而只能作為一個參考。因而,我們應采用一種更客觀的參數來代替分數,能更公 正地反映學生的真實水平。試卷的質量分析不僅要對所命制試題是 否 符合命題規則和考核目標等方面進行定性分析,同時也需要根據考生的作答情 況進行量化分析。
參考文獻:
[1]梁晶.基于經典測量理論的試卷分析系統的設計與實現[D].內蒙古大學,2013.
[2]董喆.利用統計軟件SPSS進行試卷質量分析[J].中國科技信息,2009,15:100