摘要: SPSS軟件是數據統計分析的一個重要的工具。本文作者利用SPSS軟件對考試數據的相關性、檢驗假設進行了統計分析,介紹了使用SPSS進行統計分析的一般方法和步驟,文中的方法對考試研究人員具有一定的指導意義。
關鍵詞: SPSS軟件 考試數據 統計分析 操作步驟
1. 引言
一份好的試卷須有好的測量指標來表明它的優良程度,試題有難度和區分度指標,試卷有效度和信度指標,這些是評價考試最主要的測量指標,但是僅有這些指標不足以反映一份試卷的實際測量效果,考試研究人員希望從考生的試卷統計分析中獲取更多的信息來評價一份試卷。在計算機未普及的年代,考試成績統計主要依靠人工閱卷,考試數據無法電子化存儲,對考試數據分析統計難以實現。隨著計算機的普及和信息化的推廣,各種分析數據的軟件應運而生,這些軟件中匯集了統計學和測量學的分析工具,使得應用電子信息技術分析統計考試成績數據成為可能,這些統計信息可以為教研部門、考試行政部門進行行政決策等提供非常重要的幫助。在眾多的統計分析軟件當中,SPSS是應用最多、影響最廣泛的分析工具之一。在本文中,我們以SPSS軟件為工具,對教育招生考試成績的數據進行統計分析,分析主要著重于考試數據的相關性、假設檢驗等幾個方面。
2. SPSS分析軟件簡介
“SPSS統計分析軟件”的英文名稱為“Statistical Package for the Social Science”,中文名稱為“社會科學統計軟件包”,它是世界著名的統計分析軟件之一,在自然科學、社會科學的各個領域均有非常廣泛的應用。SPSS是一個組合式軟件包,它集數據整理、分析于一身,主要功能包括數據管理、統計分析、圖表分析、輸出管理等,該軟件的統計分析過程包括描述性統計、均值比較、一般線性模型、相關分析、回歸分析、對數線性模型、聚類分析、數據簡化、生存分析、時間序列分析、多重響應等幾大類。
下面我們利用SPSS軟件對考試數據的相關性、檢驗假設進行統計分析,介紹使用SPSS進行統計分析的一般方法和步驟。
3. 相關性分析
教育考試中,考試結果的信度,試題的區分度,每個題目得分與試卷總分的關系,以及題目之間的關系,等等,都是考試研究的重要內容,最主要的研究方法就是數據的相關性分析。在眾多的教育考試數據的相關性分析方法中,Pearson相關系數法、Spearman相關系數法和Cronbach α信度系數法是比較常用的幾種方法。
Pearson相關系數法計算公式:
式中x為第i個考生第j題的得分,y為第i個考生第k題的得分,為第j題的平均分,為第k題的平均分,n為測試樣本量。該公式既可以計算兩個連續變量之間的相關性,又可以計算一個雙歧變量與一個連續變量之間的相關性。
Spearman相關系數法計算公式:
r=1-(2)
式中D為兩個變量的秩序之差,n為樣本容量。
Cronbach a信度系數法計算公式:
α= 1-(3)
式中n為試題數,s為第i題的標準差,s為總分的標準差。該公式實際上就是將考試中所有試題間相關系數的平均值(又稱內部一致性)作為α信度系數。
對于給定的一組考生成績數據,利用SPSS統計分析軟件可以非常容易地定量分析考生某學科試卷總分和該學科某道題的相關性,以及各個題目之間的相關性。我們以Pearson相關系數分析為例,利用SPSS軟件進行統計分析。
數據統計分析的對象是某省高考數學6道解答題的得分情況(不是整張試卷),數據源于該省的高考數據成績。研究的目的是測量6道解答題每兩個題目之間的相關性。
我們以SPSS 13.0版本的軟件為例,介紹利用SPSS進行數據統計分析的步驟(以Pearson相關系數法為例):
(1)將考試數據導入SPSS軟件,在SPSS數據窗口中,順序點擊【Analyze】→【Correlate】→【Bivariate...】,系統彈出變量相關系數設置對話框。
(2)在該對話框中,將待計算的變量從左側的變量列表中導入到右側的“Variables”變量列表中,在本例中導入t1、t2、t3、t4、t5、t6共6個變量(t1—t6是6道解答題的變量名稱)。在“Correlation Coefficients”相關系數選項中,選取“Pearson”復選框。
(3)在該對話框的“Test of Significance”設置區域,可以點選“Two-tailed”選項或者“One-tailed”,我們采用系統默認值。
(4)對話框中的其它選項取軟件系統的默認值,點擊【OK】,開始相關系數計算,系統彈出新的窗體輸出運算的結果。本次輸出的情況如下:
上表的統計結果可用于題目之間相關性的分析。表中的大部分題目的相關系數都比較適中,但題目T4和題目T5之間的相關程度遠高于其它幾個題目,我們可以確信這兩者之間一定存在著比其他題目之間更緊密的關系,這是我們通過分析獲取的重要信息,該信息表明這兩個題目之間的相關性高于其他幾個題目之間的相關性,這在大規模考試中是不應該出現的,需要在以后的命題考試中加以改進。
Spearman相關系數分析方法和上述分析方法類似,只需要在上述SPSS操作的第二個驟中選取“Pearson”復選框,程序就會按Pearson相關系數法進行統計分析,如果同時選中“Spearman”和“Pearson”復選框,程序將會同時計算按兩種分析方法統計分析的數據,并會以不同的圖表進行顯示,而Cronbach a信度系數法計算方法與上述方法略有不同,其操作步驟如下:
(1)在SPSS數據窗口中,順序點擊【Analyze】→【Scale】→【Reliability Analysis...】,系統彈出“Reliability Analysis”信度分析設置對話框。
(2)將待計算的變量從左列的變量列表中導入到右側的“items”變量中,在左下列的“model”選擇項的下拉列表中確保選中“Alpha”(信度系數),點擊“Statistics”選擇項可以進行更為詳細的參數設置,我們采用系統的默認值即可。
(3)參數設置完畢之后,點擊【OK】,軟件開始相關系數計算并輸出運算結果。
4. 選擇題的選項分析
在目前的教育招生考試中選擇題是一種較常見的題型,考試研究人員關注較多的是對選擇題基本特征、測量功能及其優缺點的理論探討[1][2],對選擇題干擾項的設計及其施測后的實際效果關注甚少,事實上施測后對題目各選項的有效性作出判斷可為評價試題質量提供重要參考依據。我們利用統計中χ檢驗假設,對試卷中常見的選擇題選擇項進行統計分析。
教育考試的單項選擇項一般設置為4個,其中僅有1個選擇項是正確的。命題人員在設計選擇項時,應當也必然對每道題目所有的選擇項(正確選擇項和干擾選擇項)的考生作答情況作出預測,對考生作答的分布情況作出預估。考試結束后,研究人員應該對實測的情況與命題教師預測的情況進行對比分析,以檢驗考試效果是否達到了預測的目標。這和χ擬合度檢驗的思想具有一致性,因此可以嘗試使用χ檢驗假設進行分析。
我們依據文獻[3][4]的方法來介紹χ檢驗假設在考試數據分析中應用的基本原理,設變量E是命題者對某道試題的期望值,E=nP,n為樣本容量,P為期望的相對頻率,引入以下統計量:∑(O-E)/E,其中O為觀察頻數。
我們需要進行的假設檢驗是:零假設H:選項的實測分布與期望分布相同;非零假設H:選項的實測分布與期望分布不同。
檢驗假設的思想:擬合度檢驗的統計量在確定的某種顯著性水平下如果零假設是真,則檢驗統計量∑(O-E)/E呈近似χ分布,其自由度為研究變量的可能值減1;如果實測分布與期望的分布相當吻合,就不排除零假設,否則就排除零假設;最后對檢驗假設的結果進行解釋。
數據分析的目的是判斷考生實際的應答結果(實測數據)與命題期望的選擇概率(期望數據)是否一致。我們隨機抽取某省5542個高考考生的數學有效數據構成分析樣本,利用SPSS進行統計分析。
SPSS數據統計分析的步驟如下:
(1)將考試數據導入SPSS軟件,依次點擊【Analyze】→【Nonparametric Tests】→【Chi-Square...】,彈出“Chi-Square Tests”對話框。
(2)將變量列表中待分析的題目序號導入到“Test Variables List”(檢驗變量列表)中,本例中題目的序號為t7。
(3)將對選擇試題的每個選項的期望值依次輸入到“Expected Values”所屬的方框,具體操作方法是選中單選框“Values”,輸入具體的期望數值,點擊“Add”按鈕,依次重復上述的步驟直至所有的選項的期望值輸入完畢。
(4)點擊【OK】,輸出軟件運算結果。
我們需要進行的假設檢驗,H:選項的實測分布與期望分布相同;H:選項的實測分布與期望分布不同。
假設檢驗的顯著性水平為α=0.05,χ=∑(O-E)/E,自由度為df=4-1=3,查χ分布表或利用相關軟件可得P=0.0626,由于P>α,因此不能拒絕零假設,即選項的實測分布與期望分布相同。因此,檢驗結果在0.05顯著性水平時,沒有足夠的證據拒絕零假設,即可認為本題選項的實測分布與期望分布相同,也就是說本題的實際測試效果與命題教師預測的效果是一致的,命題教師準確地估計了考生的實際水平,這是分析獲得的很重要的結論。
5. 結語
SPSS軟件在考試數據統計分析中應用廣泛,但大部分是集中在試題難度、均值、方差統計、考試數據的圖表顯示等幾個方面,本文從一個新的角度利用SPSS軟件對考試數據的相關性、檢驗假設等幾個方面進行了嘗試性統計分析,介紹了使用SPSS進行統計分析的一般方法和步驟。從上述分析來看,軟件操作步驟和統計分析過程十分簡單、快捷,對于測量學和統計學基礎不太好的數據分析統計人員來說,只要遵循一定的操作步驟,就可以進行分析。
參考文獻:
[1]王孝玲.教育測量(修訂版)[M].上海:華東師范大學出版社,2006.
[2]雷新勇.大規模教育考試:命題與評價[M].上海:華東師范大學出版社,2006.
[3]李偉明,馮伯麟,余仁勝.考試的統計分析方法[M].北京:高等教育出版社,1990.
[4]雷新勇.考試數據的統計分析和解釋[M].上海:華東師范大學出版社,2007.