馬明建
摘要:文章運用多元統計分析中的因子分析,根據試卷的量化指標難度、區分度、信度以及學生對教師的評價等數據指標建立多元統計模型,利用SAS統計分析軟件進行建模分析。通過因子分析運行結果,進一步分析影響教學效果、教學評價、教學質量的因素,為提高教學質量提供參考。
關鍵詞:多元統計分析;因子分析;難度;區分度;信度;態度
試卷質量的統計分析是檢驗學生學習成果、提高教學效果、改進教學方式的重要途徑。過去很多研究大多就試卷質量量化指標進行計算和分析,僅得到了一些關于試卷質量的數據。而本文以教育統計和測量為理論基礎,計算出試卷質量的量化指標,運用多元統計分析知識,建立因子模型,根據因子分析的結果,簡要分析教師的教學效果和學生的學習狀況,對教學質量得出綜合評價。
一、試卷量化的指標
試卷分析數量化是教育測量科學化的重要內容,衡量試卷質量的主要檢驗指標有難度、區分度、信度、效度四項指標,這些指標的概念和計算方法如下(本文所要分析的試卷中不含有選擇、是非題)。
大量統計資料表明,考試成績的分布一般服從正態分布或近似正態分布。于是我們可以作如下假設:評分以100分制,每題滿分為aj(j=1,2,…,n),其中xj、S表示第j題的均值、方差。
(一)可靠性分析
可靠性是指考試結果的可信程度,用于考察試卷的總體質量。從教育測量學的角度來看,學生的考試成績應來自正態分布或近似正態分布,否則該次考試的成績就是不合理的。
(二)難度分析
試卷難度可根據Pi=計算出每一題的難度,然后再根據P=ajPj來計算出試卷總體難度。一般大規模標準化考試難度控制0.4~0.7之間,但學科結業考試一般控制在0.5~0.85之間為宜。
(三)區分度分析
試題區分度是考量試題是否能將學識不同的學生區分開的指標。第j道題的區分度為δj=,Hj,Lj分別表示高低分組第j題的平均分,高低分組各占樣本總量的25%~30%為宜,試卷的總區分度δ=ajδj,一般試題的區分度應在0.3以上。
(四)信度分析
信度是評估分數與考生真實水平一致性的指標。通常大規模標準化考試要求信度在0.9以上,自編試卷的信度應大于0.4,計算公式:rx=(1-)=(1-)。
二、具體試卷指標計算
現有某學校某專業學生(58人)的五門課程,其中,前兩門課程為同一位老師教授,后三門課程的授課教師均為互不相同的教師。另外,根據問卷調查,得到了學生對五門專業課授課教師的教學評價的平均值,滿分為100分。在對學生的調查中發現,學生對教師的評價較低,則相應的學生的學習積極性不高,學習態度差;而對評價高的課程,學生的學習積極性高,學習態度良好。因此,將教學評價可以看作學生的學習態度(見表1)。
(一)可靠性檢驗
由于樣本容量n≤200,將采用SAS軟件中的Shapiro-Wilks的W統計量來檢驗正態性。經檢驗,此次考察的五門課程均符合正態分布,數據可靠,可以進行數據統計分析。
(二)試卷量化分析的各項指標的計算
按照上述所提供的試卷各項指標計算公式可得到結果如表1所示。
三、正交因子模型及因子分析
建立因子分析數學模型的目的不僅要找出公共因子以及對變量進行分組,更重要的是要知道每個公共因子的意義,以便對實際問題做出科學的分析。
下面以表1作為數據源,編寫程序,輸出結果如表2、表3。
由表2可看出,前兩個因子的累計貢獻率超過90%,故公因子的個數為2。由表3可以看到第一公因子中主要載荷為x2(區分度)、x4(態度)、x1(難度),這都是影響學生考試成績的指標,且可看到學生的對老師態度起了很大的作用,可以稱之分數因子;第二個公因子中,起主要作用的是x3(信度),可稱之為穩定性因子。
四、結果分析
通過上述的試卷質量指標的計算,以及因子分析的結果,可以得到以下分析結果。
第一,雖然學生對前兩門課程的同一位任課教師的評價很低,但是該授課教師試卷質量符合要求,反映了教師的教學大綱完成情況正常,說明了課程考試從一定意義上有效的檢驗了學生的學習效果及教師課堂教學效果;其次,學生對教師的評價的主觀性較強,這些評價數據也反映學生對待授課教師、該門課程的學習態度情況。接下來,通過因子分析來進一步判斷學生的態度對考試結果的影響。

第二,SAS軟件統計分析課程試卷與時間序列統計分析課程試卷相比較,前者的試卷量化指標顯然要比后者質量高,以此來看,前者的教學效果及教學質量要比后者強,同一位老師教授的同一批學生的不同課程,存在較為明顯的差異。從SAS軟件中利用成對組檢驗,也可以得出這樣的結論,即兩次考試存在顯著性差異。另外需要說明的是,前者是第六學期考試科目,后者是第七學期的必修課,而全國碩士研究生入學考試就是在第七學期。可以看到,在出題者和答題者不變的情況下,前后兩次考試存在顯著性差異,除了試卷質量本身的差異性,另一個非常重要的原因應該是學生的學習態度。
第三,學生的學習態度是否影響考試結果,在因子分析中這個問題得到了解答。按照因子分析的理論,影響考試成績的因素可以綜合為少數的幾個,并且可以根據因子載荷矩陣來判斷,哪個因素的影響較大。經因子分析后,影響成績的指標綜合為兩個:分數因子和穩定性因子。其中可以看到學生態度的載荷為0.94309,表明態度是影響成績非常重要的因素。
通過上面的分析,大多數學生都忙于準備考研,沒有認真的準備考試,因此,在第七學期的《時間序列分析》考試與上學期的考試存在顯著性差異,其中一部分原因是由學生的學習態度造成的。