馬功平
(慈溪市楊賢江中學,浙江慈溪 315300)
美國教育心理學家布盧姆認為,評價是一種獲取和處理用以確定學生水平和教學有效性的證據的方法.測試則是評價的有利工具,高質量的試卷能檢驗教學效果和反映學生的學習能力,從而體現評價的科學性,有效地對教學加以監督和調整.鑒于目前多數教師憑借經驗出題,不僅不能保證試卷應有的質量,不能全面客觀地檢測學生的學習效果,而且由于缺乏必要的簡單統計知識,對考試結果不能做出正確的解釋,致使考試結果中蘊藏的大量信息白白浪費.全面的試卷分析往往考試人數眾多,指標算法繁瑣,工作量大,目前尚無較好的試卷分析軟件.本文嘗試使用SPSS統計軟件進行試卷分析,其具有實用、簡單、可操作性強等特點,能滿足試卷分析全部指標的分析計算,以期拋磚引玉.
SPSS(Statistic Package for the Social Science)是由美國SPSS軟件公司開發的大型社會科學統計軟件包,它集數據整理、分析和結果輸出等功能于一身,是世界上最早的統計分析軟件之一.目前該軟件的版本數據管理和分析功能強大,界面友好,操作簡單,全部為視窗菜單式操作、編輯,具有靈活的變量變換和文件交換系統,多種統計圖表的結果輸出,并與Microsoft Office軟件兼容等特點,已經廣泛應用于醫學、心理學、人文學、生物學、教育學等領域.
根據教育評價理論,試卷分析包括試卷成績分析和試卷質量分析兩個部分,結合試卷分析要求和自身的實踐,試卷分析具體指標主要包括以下幾個方面.
涉及指標有學生總數、參加考試人數,最高分、最低分,平均分與標準差,優秀、良好、及格與不及格的人數分布及百分比等.以上指標要求按班級、年級對試卷成績及總評成績進行分析.
定量指標:難度指數 P、區分度D、信度 r、效度等.
定性指標:試卷覆蓋面、內容效度、卷面失分原因分析;試題的表述是否科學、正確;名詞術語是否準確;選擇題備選答案設計是否合適、排列是否隨機;參考答案是否正確、卷中內容是否對答案有提示等.
在進行試卷分析時,不能孤立地去看每個班的成績.有必要比較不同班級的成績,不同班級間成績等級分布,從而有助于分析班級間存在的差異.涉及的指標有獨立樣本的T檢驗及 χ2檢驗等.
選取了慈溪市某高中2010學年同一任課教師任教的高一兩個平行班的物理期末成績為樣本,淺析SPSS軟件在物理試卷分析中的具體應用.
3.1.1 課程基本情況及試卷結構(如表 1,表2所示).

表1 課程基本情況

表2 試題分值分布

圖1 數據定義
3.1.2 數據錄入
數據文件的建立可選用Excel、dBase、SPSS等軟件進行,Excel、dBase數據文件可以轉換到SPSS數據文件.本文選用SPSS軟件建立數據文件,行為記錄,列為變量.單擊Variable view 標簽,在Name標題下定義:學號、姓名、題號……期末成績等.其中各題和期末成績均定義成Numeric類型,Decimals(小數點后長度)為0,其余各項使用默認(見圖1).再單擊Data View標簽,逐個錄入每個記錄數據,即學生信息和每題得分.
3.2.1 成績的基本描述性統計
考試成績的基本描述統計量包括均值(mean)、標準差(Standard Deviation:Std Dev)、偏度(Skewness)和峰度(Kurtosis)等.均值代表數據的集中趨勢;標準差可用來描述數據的離散程度,標準差越大說明數據間的差異越大;偏度和峰度用來描述數據分布是否對稱,偏斜程度如何,分布陡緩程度等.
以年級為單位,對試卷進行成績的基本描述性統計.步驟如下:①單擊 Analyze→Descriptive Statistics→Descriptives;②將需計算的變量“期末成績”移入Variable(s)框中;③再單擊Options按鈕,選上mean、Std Deviation、Skew ness、Kurtosis四個指標;④最后點擊OK 按鈕(見圖 2).操作完畢即可得表3的結果.

圖2

表3 總體成績基本描述性統計
以班為單位,對試卷進行成績的基本描述性統計.拆分文件:單擊 Data→Spilt File→Organize Output by Groups,將“班級”變量移入Groups Based框中,再單擊 OK按鈕,即可將數據按“班級”拆分.再按上述步驟可完成對不同班級的成績的基本描述性統計.(見圖3)

圖3 班級拆分對話框
3.2.2 成績等級比率統計
在進行試卷分析時往往還要統計成績等級的人數及所占的比例,比如90分以上的,70-80分數段之間有多少人等.步驟如下:①將百分制分數轉換成優秀(≥80分),良好(79~70),及格(69~60),不及格(<60)4個等級;②單擊Transform→Recode→Intodifferent variables;③將“期末成績”變量移入Numeric Variable→Output Variable框中,并在Output Variable框中輸入“期末成績等級”;④在Name框中單擊Old and New Values按扭,選擇 Range,在其下框中輸入相應的分數范圍,在New Value欄中Value的框中輸入相對應的分數等級,單擊Add逐個添入;⑤單擊Continue及OK按鈕;⑥單擊 Analyze→Descriptive Statistics→Crosstabs,將行變量“班級”移入到 Row(s)框中,將列變量“期末成績等級”移入到Column(s)框中;⑦單擊Cells按鈕,在Percentages框中選擇 Row、Column和 Total(見圖 4),操作完畢即可得表4.

圖4 成績轉換為分數段對話框

表4 各班物理成績等級分布
本卷統計發現,學生較多集中在及格(30.5%)和不及格(36.9%)段,優秀和良好段分布相對較少(占32.6%),說明本試卷適中.
3.3.1 試卷的難度系數

表5 各大題難度系數
通過試卷各題的難度表可以看出,試卷難度程度為0.65,難易適中,基本能客觀地反映出學生的學習效果.其中題 1、2、3、5、13、16、21題偏易,需適當增加難度,而題 9、11、23偏難,期末考試不是選拔性考試,應適當降低難度.
3.3.2 試卷的區分度
區分度是指某次測驗對考生實際水平的區分程度,用符號D表示,其數值范圍為[-1.00,+1.00].一般情況下,D≥0.4,具有較好的區分度;0.3≤D<0.4,良好,如能改進更加理想;0.2≤D<0.3,區分度尚可,但還需加以改進;D<0.2,區分度較差,該試題需淘汰.
區分度的計算方法很多,對于主觀題來說,使用等級相關分析即采用Serarman相關分析;對于客觀題來說,看成是非等間距測度的連續變量,采用皮爾遜(Pearson)相關分析.在SPSS中單擊Analyze→Correlate→Bivariate,把計算相關分析的系數的期末成績,單1、單2等變量選到Variables,選擇Pearson相關系數.輸出結果的每小題與期末成績之間的相關系數即為區分度.
經整理可知本卷客觀題區分度一般,題2、3、5、13、16、21的區分度不夠,需要淘汰或調整.但整張試卷的區分度適中,學生之間的實際差別,學生之間的差距基本拉開,學生所掌握的知識范疇及對知識的理解程度、鞏固程度和運用能力就能得到了充分體現.
3.3.3 試卷的信度
信度是指同一個測試對同一組測試兩次或多次得分的一致程度,它通常反映了考試的可靠性.在SPSS軟件中一般采用科隆巴赫(Cronbach)α系數,其取值范圍為 0~1,值越大,信度越高.一般認為標準化能力測試或升學測試信度應在0.90以上,對于教師自編測試信度達到 0.60即可.步驟如下:①單擊Analyze→Scale→Reliability Analysis;②在對話框中將所有表示題目的字段全部移入Items框中;③在Model欄中選擇Alpha方法.操作完畢即可得分析結果Alpha=0.689,可見本次考試的信度一般.為了提高試卷的信度,可以適當提升試題的質量,保持試題的難度接近正態分布,提高試題的區分度,嚴格監考和按評分標準給分等.
在進行試卷分析時,對于同一個教師執教的平行班的成績差異,除了與兩個班的平均分有關,還與標準差和樣本數有關.如果要判斷兩個班級的成績差異是否顯著,就需要進行均值的差異性統計檢驗——獨立樣本t檢驗.其步驟如下:①單擊Analyze→Compare→Independent-Samples T Test;②將檢驗變量“期末成績”移入 Test Varibles(s)框中;③將總體標志變量“班級”移入Grouping Variables框中;④單擊Define Groups按鈕定義“班級”的標志值(見圖 5).操作完畢即可得表6.

圖5 兩個班級的獨立樣本t檢驗

表6 兩個班級的期末成績獨立樣本t檢驗結果
通過獨立樣本t檢驗結果顯示,Sig.(2-tailed):p=0.10>0.05,說明兩者之間并無顯著差異,由此不難分析出盡管兩班之間的平均分相差2.01分,但兩班成績無顯著差異.
綜合分析是在上述統計分析和檢驗結果的基礎上定出的總體定性結論.通過利用SPSS軟件得出了該次期末試卷與成績的初步評價,試卷基本上覆蓋了《物理》必修1教材中的主要知識點,且各章節所占的分數基本上與各章的課時所占的比重成正比,分布合理.本次考試的平均分是65.34分,標準差是14.67,成績基本上符合正態分布.試卷的難度系數是0.65,相對比較合理,區分度適中,基本能區別學生的真實水平,另外信度系數為0.689,信度一般.再則通過兩個班級的期末成績獨立樣本t檢驗表明兩個班級學生對知識的掌握程度并無顯著差異.總之,本次物理考試的試卷符合新課標的要求,題型合理、題量適中、難度一般、區分度適中,有利于激勵學生的積極性,能促進教師完善教學手段和方法.