張喜娟,丁釗鵬
(北京聯合大學 商務學院,北京 100025)
因子分析在學生成績影響因素調查結果中的應用
張喜娟,丁釗鵬
(北京聯合大學 商務學院,北京 100025)
因子分析基本思想是通過對多個原始變量提取主成分,經過正交旋轉,可以找出主要的獨立影響因素。通過對學生的多因素多樣本問卷調查,將因子分析應用于教育教學數據分析之中,從而找出影響學生學習成績的主要原因,為進一步的教育教學改革提供了一定的理論依據。
主成分;因子分析;正交旋轉
在實踐中,往往收集到的數據是多指標的。各指標之間通常不是獨立的,或多或少存在著一定程度的關系。因子分析的目的是通過少數幾個變量去描述這眾多變量間的協方差關系。這少數幾個變量是潛在的,但不能觀察,我們稱之為因子。
在所收集到的眾多變量中,必定存在某些是高度相關的,把這些高度相關的變量組成各組。這樣,同一組內變量具有高度相關,而與其他的各組變量卻只有較小的相關或是不相關。這些組內高度相關的變量可以設想是一個共同的東西在影響著它們而導致高度相關。這個共同的東西稱之為公共因子。如前所述,這些公共因子是潛在但不能觀測的。
因子分析法是利用著名的統計軟件 SPSS,對收集到的大量數據進行統計分析,用較少的相互獨立的因子變量代替原來變量的大部分信息。
設有樣本容量為 n的 p個變量,通過變換,將原變量Xi轉換成主成分(用F表示)。主成分是原變量的線性組合,且具有正交特征,即將X1,X2,…,Xp綜合成 k(k

這樣確定的綜合變量 F1,F2,…,Fk分別稱作原變量的第 1、第 2、…、第 k個主成分,且 F1,F2,…,Fk在總方差中占的比例依次遞減。
下面,我們就以學生成績影響因素調查為例,闡述因子分析法在具體事例中的應用。

表1 觀測數據
影響學生學習效果的因素錯綜復雜,本文從學習興趣、學習態度、學習方法、自學能力、努力程度、數學基礎、文理差異、教師授課效果、學習風氣、他人評價、家庭影響、課程搭配等12個方面進行了問卷調查和嚴謹的統計分析。
為了調查影響學生成績的主次因素,我們對上述可能的12個影響因素做出一張調查表,進行全面調研。每種因素從0~1依次分為6個等級,分別是0/0.2/0.4/0.6/0.8/1,所選影響因素分數越高,則代表學生認為此項因素對學習的影響越大。從所得的調查表結果中剔除一些明顯的極端值,共得到152組觀測數據。
首先看一下各變量的描述性統計量(數學期望和標準差),結果如表2所示。

表2 數學期望和標準差
各因素的標準差大體一致,說明離散程度(對各因素認同的離差)大體一致,而其中均值比較大的依次有教師授課效果(0.689)、學習態度(0.657)、努力程度(0.646)、學習方法(0.628)、自學能力(0.626)。但是,調查表中的各變量往往不是獨立存在的,各變量之間總是或多或少地存在相關關系,比如說學習方法與自學能力之間一般就是相輔相成的,自學能力強的同學往往能摸索出一套較好的學習方法,學習方法優良的同學其自學能力自然也更強一些。從上面的調查表中,我們不妨對學習方法與自學能力進行Pearson correlations相關分析,可以得到這兩個變量之間的相關系數為0.515。結果說明,僅就以上的描述性統計量得出教師授課效果是學生認為的第一影響因素的結論(因其均值最大)還言之過早。
目前,比較理想的變量降維的方法就是主成分分析與因子分析。這兩種方法同時可以用較少的綜合性指標分別綜合存在于各變量中的各類信息。在這里,我們采用SPSS for Windows社會科學統計軟件包,通過FACTOR過程進行因子分析。
在FACTOR過程中,選取學習興趣等上述12個變量作為分析變量,選擇Principal components主成分分析法,初步結果如表3所示。
既然有12個變量,自然就有12個成分(Component),位于上表第1列,在第2列Initial Eigenvalues中列出了各成分的特征方程的根,它是確定主成分數目之根據。這些特征值從大到小依次排列,根據方差的定義,第i個成分的方差是總方差在各成分上從新分配后在第i個成分上的分配結果,它恒等于第i個成分的特征值。在Initial Eigenvalues列同時也列出了各成分的貢獻率(%of Variance)與累積貢獻率(Cumulative%),它們表示了各成分能包含總信息的百分比和累積百分比。在此,我們選取12個主成分中的前8個作為主成分,這8個成分能解釋原數據當中87.932%的信息。從下面的Scree Plot碎石圖當中(見圖1),也能看出各成分所包含信息之大小。表4中列出了成分矩陣,可以由它寫出每個原始變量的因子表達式,如:
學習態度=0.714F1+(-0.392)F2-0.025F3+0.187F4-0.186F5+0.136F6-0.253F7+0.140F8
上式的F1~F8正是上面提到的8個主成分Component,在此也稱為共性因子,其前面的系數表示該因子對變量的影響程度,即變量在因子上的負荷。
為了給共性因子命名,通過Varimax方差最大旋轉(一種正交旋轉方法),可以得到表5的因子轉換矩陣,由原來的8個共性因子通過此矩陣的旋轉得到另外8個正交因子。

圖1 碎石圖

表3 主成分分析法

表4 成分矩陣

表5 因子轉換矩陣
表6是旋轉后的因子(主成分)矩陣,此表給出了旋轉后的因子負荷矩陣,可以看出,經過旋轉后,負荷系數已經明顯地分化了。
第1個主成分對努力程度、學習態度有絕對值較大的正負荷系數,可稱之為學習積極性因子,解釋了原始信息中的14.754%;
第2個主成分對學習興趣、學習方法有絕對值較大的正負荷系數,可稱之為學習方向性因子,解釋了原始信息中的12.812%;
第3個主成分對課程搭配、家庭影響有絕對值較大的正負荷系數,可稱之為學習后備因子,解釋了原始信息中的12.224%;
第4個主成分對數學基礎、學習風氣有絕對值較大的正負荷系數,可稱之為學習動力因子,解釋了原始信息中的10.778%;
第5個主成分對教師授課效果有絕對值較大的正負荷系數,可稱之為學習引導性因子,解釋了原始信息中的9.876%;
第6個主成分對自學能力有絕對值較大的正負荷系數,可稱之為學習能力因子,解釋了原始信息中的9.488%;
第7個主成分對他人對你評價有絕對值較大的正負荷系數,可稱之為外界評價因子,解釋了原始信息中的9.185%;
第8個主成分對文理差異有絕對值較大的正負荷系數,可稱之為學習差異性因子,解釋了原始信息中的8.814%。
從表6中可以寫出每個原始變量的因子表達式,比如:

表7是有關因子得分的信息,可以根據因子得分系數和原始變量的標準化計算每個觀測量的各因子得分數,可以寫出旋轉后的因子表達式,比如

在數據編輯窗口中,可以以新的變量保存因子得分信息,新的8個正交因子變量得分數據如表8所示。
通過 Hierarchical Cluster聚類分析,對觀測量進行兩類聚類,因觀測量過多,細節就不在此羅列。
結果表明,在兩類聚類中,唯有第113個觀測量落在第2類,其他151個觀測量均落在第1類,從而說明這152個觀測量共性很大。
從分析的結果可以看出,影響學習成績的首要因素是學習的積極性(努力程度和學習態度),其次是學習的方向性(學習興趣、學習方法)。雖然課程搭配、家庭影響、數學基礎、學習風氣、教師授課效果、自學能力、他人評價、文理差異各個因素都依次有不同程度的影響,但是首要的問題是學生自身的努力程度、學習態度、學習興趣和學習方法。

表6 因子(主成分)矩陣

表7 因子得分系數

表8 得分信息
[1] 何曉群.現代統計分析方法與應用[M].北京:中國人民大學出版社,1998:281-332.
[2] 于秀林,任雪任.多元統計分析[M].北京:中國統計出版社,1999:154-197.
[3] 盧紋岱.SPSS for Windows統計分析[M].2版.北京:電子工業出版社,2002.
[4] 趙新.層次分析法在教學質量綜合評價中的應用[J].寧夏醫學院學報,2002,24(2):155-156.
[5] 楊德芹.教學質量評價模型及案例分析應用研究[D].武漢:華中師范大學,2008.
The Application of Factor Analysis to a Study of Student’s Grades
ZHANG Xi-juan,DING Zhao-peng
(Business college of Beijing Union University,Beijing 10025,China)
Factor analysis obtains the main independent factors by principal components picking and orthogonal rotation from the original variables.This method analyzes the data obtained from the students’questionnaire survey and to find the main factor influencing their achievements.
principal components;factor analysis;orthogonal rotation
O 29
A
1005-0310(2010)01-0077-05
2009-11-26
張喜娟(1965—),女,河北省順平縣人,北京聯合大學商務學院講師,碩士,研究方向為數學教學與研究。
(責任編輯 李亞青)