999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高校學生成績及教師教學效果SAS統計分析

2017-07-19 11:38:41董小剛佟知真王純杰李純凈張倩倩
長春工業大學學報 2017年3期
關鍵詞:分析教師學生

董小剛, 佟知真, 王純杰, 李純凈, 張倩倩

(長春工業大學 基礎科學學院, 吉林 長春 130012)

?

高校學生成績及教師教學效果SAS統計分析

董小剛, 佟知真, 王純杰*, 李純凈, 張倩倩

(長春工業大學 基礎科學學院, 吉林 長春 130012)

以某高校同一學期不同專業學生期末考試成績作為參考數據,利用多元統計方法進行分析,使用SAS宏程序對學生成績進行批量處理并對教師教學效果進行評價。

主成分分析; 因子分析; 聚類分析; 典型相關分析; SAS

0 引 言

高等教育規模迅速擴大,使我們在較短時間內迅速提升了我國人力資源的開發水平,推動經濟社會的持續快速發展,也帶動了綜合國力與國際競爭力的持續提高,使我國在未來國際的科技、教育與人才競爭中搶占了有利位置。滿足了廣大人民群眾想要接受到好的教育的迫切愿望,有力地促進了教育的公平公正。

就目前的高校管理來看,特別是對于學生的考試試卷的管理工作中,普遍都存在著不能對試卷成績數據合理分析與利用的問題[1]。簡而言之,考試本身是一種檢驗教學效果與質量的重要方法,而成績所能反應出來的信息不僅僅是顯示在簡單的層面上,需要對它進行更深入的理性分析,找到各方面的成效與得失以及影響學生成績的相關因素。幫助教師及時地發現教學中存在的一些問題及薄弱環節,使教師可以及時地調整教學方案與內容,更好地指導教師在教學中的工作。

1 模型介紹

1.1 主成分分析法[2]

主成分分析是數學上對數據降維的一種方法。其基本思想是設法將原來眾多的具有一定相關性的指標x1,x2,…,xp(p個指標)重新組合成一組較少個數的互不相關的綜合指標Fm來代替原來的指標。

主成分分析的具體步驟如下:

1)計算相關系數矩陣;

2)求出相關系數矩陣的特征值以及相應的正交化單位特征向量;

3)選擇主成分;

4)計算主成分得分。

1.2 因子分析法

因子分析法就是從研究變量內部相關的依賴關系出發,把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統計分析方法。這樣可以對原始的數據進行分類歸并,將相關比較密切的變量分別歸類,歸納出多個綜合性指標,這些綜合指標互不相關,即它們所綜合的信息互相不重疊。這些綜合指標就成為因子或公共因子。

因子分析法的基本思想是將觀測變量進行分類,將相關性較高,即聯系比較緊密的分在同一類中,而不同類變量之間的相關性則較低,那么每一類變量實際上就代表了一個基本結構,即公共因子。對于所研究的問題就是試圖用最少個數不可測的所謂公共因子的線性函數與特殊因子之和來描述原來觀測的每一分量。這樣能相對容易地以較少的幾個因子反映原資料的大部分信息,從而達到濃縮數據,以小見大,抓住問題本質和核心的目的。

因子分析法的核心是對若干個綜合指標進行因子分析并提取公共因子,再以每個因子的方差貢獻率作為權數與該因子的得分乘數之和構造得分函數。因子分析法的數學表示為:X=AF+B,即:

模型中,X=(x1,x2,x3,…,xp)是可觀測隨機向量,即原始觀測變量。

F=(f1,f2,…,fk)是X=(x1,x2,…,xp)的公共因子,即各個原觀測變量的表達式中共同出現的因子,是相互獨立的、不可觀測的理論變量。B=(β1,β2,…,βp)是X=(x1,x2,…,xp)的特殊因子,是不能被前k個公共因子包含的部分,這種因子也是不可觀測的。各特殊因子之間以及特殊因子與所有公共因子之間都是相互獨立的。

1.3 聚類分析[3]

聚類分析方法是按樣品(或變量)的數據特征把相似的樣品或(變量)傾向于分在同一類中,把不相似的樣品(或變量)傾向于分在不同類中。聚類分析根據分類對象不同分為Q型和R型聚類分析。距離和相似系數這兩個概念反映了樣品(或變量)之間的相似程度。相似程度越高,一般兩個樣品之間的距離就越小。系統聚類法是最常用的一種聚類方法,常用的系統聚類法有最短距離法、最長距離法、中間距離法、類平均法、重心法、離差平方和法、可變法、可變類平均法等。在許多應用中,類平均法和離差平方和法的聚類效果相對較好。

1.4 典型相關分析

典型相關分析(Canonical Calcorrelation Analysis)就是利用綜合變量對之間的相關關系來反映兩組指標之間的整體相關性的多元統計分析方法。它的基本原理是:為了從總體上把握兩組指標之間的相關關系,分別在兩組變量中提取有代表性的兩個綜合變量U1和V1(分別為兩個變量組中各變量的線性組合),利用這兩個綜合變量之間的相關關系來反映兩組指標之間的整體相關性。

2 實證分析

2.1 數據及變量情況

文中數據來源為某高校2014級學生2014-2015學年第一學期期末考試成績。數據真實可靠,其中有54 077個觀測數據和18個變量。

2.2 教師教學效果分析

文中以數學老師為例進行分析。對原始數據進行處理,其中x1~x12分別代表平均值、中位數、最高分、最低分、90分以上人數、80~90分人數、70~80分人數、60~70分人數、40~60分人數、40分以下人數、平均課時數及所教學生人數。

2.2.1 主成分分析

對經過插補處理后的數據標準化[4-5],之后對數據進行主成分分析。SAS程序如下:

proc princomp data=work.b

out=out1 outstat=stat1 prefix=z; /*對數據進行主成分分析*/

var x1-x12;

run;

proc print data=out1;

title 'outpur:out1';

run;

表1 特征值、貢獻率、累計貢獻率

由累計貢獻率可知,只需要取前3個主成分即可。通過觀察可知第一主成分中各個變量的系數都為正值,且大小相差不多,我們認為第一主成分值代表了對全部變量的一個綜合信息的呈現。其中,x6得分最多,說明該教師所教學生綜合成績最好。主成分分析方法和計算方法如下:

第一主成分:

z1= 0.25x1+0.27x2+0.33x3+0.11x4+

0.39x5+0.4x6+0.3x7+0.15x8+

0.23x9+0.18x10+0.24x11+0.38x12

第二主成分:

z2= -0.458x1-0.425 3x2-0.214x3-

0.151 4x4-0.066x5-0.053 2x6+

0.200 7x7+0.481 1x8+0.146x9+

0.411 4x10+0.163x11+0.210 6x12

第二主成分的大小則主要取決于x1、x2、x8和x10,它們分別為平均值、中位數、60~70分成績的人數和成績在40分以下的人數。并且前兩個變量的系數為負值,當平均值及中位數越高時,第二主成分的值相對越低,而60~70分與40分以下的人數越多,第二主成分值越高,我們可以就此理解為這是一個負向相關的主成分,即平均成績越低、低分人數越多時,該名教師的第二主成分值越高。

第三主成分:

z3= -0.021 4x1-0.131 7x2-0.314x3+

0.564 5x4+0.139 4x5+0.154x6+

0.002 8x7+0.247 2x8+0.239 2x9-

0.312 2x10-0.533 3x11+0.145 7x12

第三主成分的大小通過觀察可知主要取決于x3、x4、x10和x11,它們分別為最高分、最低分、40分以下人數和平均課時數。當最高分越低而最低分越高時,第三主成分越高,這可以理解為該名教師所教學生的分數差距較少。40分以下人數越少,第三主成分分數越多這一點也可體現出當學生成績主要分布于中等、學生高分和低分差距越不明顯,第三主成分得分越高,則可以將第三主成分看作是表明學生成績均勻程度的一個主成分。

在第一主成分中,得分越高說明該教師所教學生綜合成績越好,第二主成分得分越高說明該教師所教學生平均成績低,低分學生多;第三主成分得分越高說明該教師的學生成績水平越接近,班級總體成績越均勻。

2.2.2 因子分析

對標準化后的數學教師信息再進行因子分析。文中使用的因子旋轉方法[6]是最大方差正交旋轉法。SAS程序如下:

proc factor data=b1 rotate=varimax reorder SCORE OUTSTAT=OUTF; /*進行因子分析*/

var x1-x12;

run;

proc score data=b1 score = outf out= outs;

run;

proc sort data=outs;

by descending Factor1 ;run;

proc print data=outs;run;

表2 因子載荷表

旋轉后的因子載荷在通過最大方差正交旋轉后,得到了12個指標在3個因子上的新的因子載荷。通過觀察可以看出,因子F1支配的指標有x5、x6、x7、x8、x9和x12,它們代表的是各分數段人數和總人數,我們將它理解成成績分布因子,因子F2支配的指標是x1、x2和x3,它代表的是平均成績因子;因子F3支配的指標是x4、x10和x11。

表3 整理后因子得分排序

由整理出的因子得分排序表可以看出,4號教師的F1得分最高,意味著他的學生成績分布最均勻,其他老師按得分依次排列;7號教師的F2得分最高,這就意味著他所教學生的平均值中位數等指標值最高,意味著他的學生總體平均成績最好;而對于F3,我們可以看出10號教師的得分值最高,也就意味著他的學生中低分成績的人數較多。

2.2.3 聚類分析

對標準化后的教師信息數據進行聚類分析[7]。文中選取重心法和最小值法兩種方法同時進行分析,并比較分析結果。聚類分析SAS程序如下:

proc cluster data=b1 method=sin pseudo; /*進行聚類分析*/

id tno;

proc tree horizontal;

id tno;

proc cluster data=b1 method=cen pseudo;

id tno;

proc tree horizontal;

id tno;

run;

教師分類兩種樹狀圖如圖1所示。

圖1 教師分類兩種樹狀圖

由圖1可大致將數學老師分成3個類別:第一類是第1、3、5、9、11和12號教師,第二類是第6、7和13號教師,最后一類是第2、4、8和10號教師。

2.3 學生成績分析

2.3.1 對班級和科目進行多因素的方差分析[8]

選取一個學院里考試科目相同的所有學生成績,按照班級進行分類。由數據可知,我們選取了4個班級共計132人11科的考試成績。科目分別為:大學生計算機基礎、大學外語、高等數學、軍事技能訓練、軍事理論、思想道德修養與法律基礎、體育、無機化學、無機實驗、心理健康教育和學科概論。我們用x1~x11分別代表這11個學科。對數據進行多因素的方差分析時,選擇使用SAS軟件中的GLM過程步,在使用GLM過程進行方差分析時,各語句和ANOVA過程基本一致。

datayhuasheng; /*建立數據集*/

inputabgrade@@;

cards;

1 1 66

1 1 80

1 1 87

1 1 75

1 1 89

1 1 76

1 1 75

. . .

. . .

4 11 80

4 11 80

4 11 70

4 11 80

;

%macrocalc(xueyuan,am,bm); /*對數據進行多因素方差分析*/

procglmdata=&xueyuan;

class&am&bm;

modelgrade=&am&bm;

run;

%mendcalc;

%letxueyuan=yhuasheng;

%letam=a;

%letbm=b;

%calc(yhuasheng,a,b)

表4 總體方差分析

表5 方差分析

因為方差分析F=30.51,P<0.000 1,可見拒絕原假設H0,說明模型具有統計意義。對于a,F=4.83,P=0.002 4,可見拒絕原假設H0,說明不同班級對學生成績具有顯著性差異。對于b,F=38.21,P≤0.000 1,可見拒絕原假設H0,說明不同科目對學生也具有顯著性的統計意義。可以看出,以班級學生的平均成績進行方差分析時,班級間的差異性并不明顯,只有對班級內每個學生的成績進行分析時,才能看出班級間的顯著性差異,這說明了學生個體間的差異性較大,平均成績不能完全代表這個班級的綜合信息。

2.3.2 對同一專業學生成績進行因子分析

對班級內學生成績進行因子分析時,選用的數據是某班級34名同學全部11科(科目同2.3.1)的成績,共有374個數據。仍然用x1~x11分別代表這11個學科。程序[9]SAS如下:

%macrocalc(yxueyuan,hxueyuan,fm2,fm1407,fs1407,xm1,xm11); /*對數據進行因子分析*/

procstandarddata=sasuser.&yxueyuan;

out=&hxueyuanmean=0std=1;

var&xm1-&xm11;

run;

procfactordata=&hxueyuanrotate=varimaxreorderSCOREOUTSTAT=out&fm2;

var&xm1-&xm11;

run;

procscoredata=&hxueyuanscore=out&fm1407out=out&sm1407;

run;

%mendcalc;

%letyxueyuan=yhuasheng;

%lethxueyuan=hhuasheng;

%letfm2=f2;

%letfm1407=f1407;

%letsm1407=s1407;

%letxm1=x1;

%letxm11=x11;

%calc(yhuasheng,hhuasheng,f2,f1407,s1407,x1,x11)

表6 特征值、貢獻率、累計貢獻率

因此,我們選取前4個因子進行分析。輸出的因子載荷見表7, 通過觀察分析可以看出,因子F1支配的指標有x1、x2、x3、x5、x8和x11,分別是大學生計算機基礎、大學外語、高等數學、軍事理論、無機化學和學科概論,它們是理論型課程,所以我們把F1稱作是理論型因子;因子F2支配的指標是x4和x9,分別是軍事技能訓練和無機實驗,是需要動手實踐的兩門課程,因此,把F2稱作是動手能力因子;因子F3支配的指標是x7和x10,分別是體育和心理健康教育,他們都是個人綜合素質層面上的指標,所以我們認為F3是個人綜合因子;因子F4支配的是x11,代表的是思想道德修養和法律基礎,它代表的是政治思想因子。

表7 因子載荷表

由整理出的因子得分排序表可以看出,F1得分高低意味著理論型課程成績的好壞;F2得分的高低意味著動手實踐能力的強弱;F3得分的高低代表著個人綜合的身心素質的高低;F4得分的高低代表著政治思想的高低。

2.3.3 對學科間相關性進行典型相關分析[10]

從實際角度出發,我們知道不同專業的學生所學基礎課程是大體相同的,但所學專業知識不盡相同。有些同學喜歡專業知識,有的同學卻對基礎性理論知識感興趣。于是,針對同一專業的學生進行專業學科與基礎學科成績的典型相關分析,來判斷兩種性質的學科間是否存在某些相關性。

選取某年級4個班的132名學生成績進行分析,其中專業課為:無機化學x8、無機實驗x9和學科概論x11;公共課為:大學生計算機基礎x1、大學外語x2、高等數學x3、軍事技能訓練x4、軍事理論x5、思想道德修養與法律基礎x6、體育x7和心理健康教育x10。

我們對4個班的總成績進行典型相關分析。其中變量x8、x9和x11一組,其余變量為一組。SAS程序[11]如下:

%macro calc(dxueyuan,dgonggong,dzhuanye); /*對數據進行典型相關分析*/

proc cancorr all data=sasuser.&dxueyuan

vprefix=&dgonggong vname='公共課'

wprefix=&dzhuanye vname='專業課';

var x1-x7 x10;

with x8 x9 x11;

run;

%mend calc;

%let dxueyuan=dhuasheng;

%let dgonggong=gonggong;

%let dzhuanye=zhuanye;

%calc(dhuasheng,gonggong,zhuanye)

表8 均值和標準偏差

表9 兩組變量間的相關系數表

表10 典型變量檢驗表

由表8和表9給出了兩組課程變量的基本信息之間的相關系數,可以粗略看出,這些課程之間有著不同程度的相關性。表10給出了兩組課程變量的典型相關系數。 第一對典型相關系數達到0.738 9,可見公共課和專業基礎課之間的相關系數很大。表11輸出結果顯示3對特征值所占方差信息量的比例分別是0.839 3、0.109 0和0.051 7,通過假設檢驗的p值,我們也可以看出前兩對典型變量均是顯著的。選取前兩對典型變量。

表11 典型相關分析貢獻率表

4種檢驗方法對各典型相關系數為零的假設檢驗,可以看出4種檢驗方法均通過。見表12。

表12 4種檢驗方法

表13 公共課組典型系數

表14 專業課組典型系數表

通過表13和表14可以看出,不論是公共課的8個變量還是專業課的3個變量與第一典型變量的相關系數皆為正。

公共課典型相關表與專業課典型相關表分別見表15和表16。

表15 公共課典型相關表

表16 專業課典型相關表

由表15和表16可知,在公共課組變量的組內變異表示第一典型變量能解釋變量組0.245 1的組內變異;而表示來自第二個組的第一典型變量可以解釋第一個組0.133 8的組內變異。對于專業課組,它們的組內變異表示第一典型變量能解釋變量組0.373 5的組內變異;還表示來自第一個組的第一典型變量可以解釋第二個組的0.204的組內變異。

可以從相關系數的角度解釋典型變量,見表17。

表17 原始變量與典型變量的樣本相關系數表

根據表17典型相關系數,公共1主要代表了學生的大學外語和高等數學兩個變量,其他的變量顯得并不是那么重要,而專業1主要是代表了學生的無機化學這個變量。無機化學變量與第一典型變量公共1有著很大的聯系。故公共1可以解釋為專業基礎變量。這與基于典型系數的解釋基本相一致。而專業1主要代表了無機化學變量,專業1主要解釋了基礎公共課外語和數學對無機化學的影響。這與基于典型系數的解釋基本一致。可見專業課和公共基礎課之間有一定程序的相關性。

3 結 語

通過實證分析,利用SAS軟件對數據進行分析,對教師教學效果評價提供了有利的思路和工具;也減少對學生綜合評價的主觀因素,以客觀的方式來了解學生的綜合成績,為教師有針對性地指導學生,真正實施因材施教提供理論指導。

[1] 朱琳,閆霏霏.基于SAS的高校學生成績抽樣及統計推斷:以東華理工大學期末試卷抽樣為例[J].東華理工大學學報:社會科學版2015,34(3):280-283.

[2] 王學民.應用多元分析[M].3版.上海:上海財經大學出版社,2009.

[3] 王純杰,李群,董小剛,等.基于K-均值聚類的多值有序Logistic回歸模型在信用卡信用評級中的應用研究[J].吉林師范大學學報:自然科學版,2016,37(3):72-81.

[4] 馬燕.主成分分析法在學生成績評價中的應用[J].樂山師范學院學報,2007,24(1):131-133.

[5] 汪海波,羅莉.SAS統計分析與應用從入門到精通[M].北京:人民郵電出版社,2013.

[6] 黃培麗.多元統計在高校學生成績統計分析中的應用研究[D].西安:西安建筑科技大學,2013.

[7] 譚慶.基于K-means聚類算法的試卷成績分析研究[J].河南大學學報:自然科學版,2009,39(4):412-415.

[8] 張瓊.利用SAS軟件包對學生的考試成績做統計分析[J].成功(教育),2011(12):204.

[9] 姚鑫鋒,王薇.SAS統計分析實用寶典[M].北京:清華大學出版社,2013.

[10]KuiyuanLi,JosaphatUvah,RaidAmin.PredictingStudents’PerformanceinElementsofStatistics[C]//US-ChinaEducationReviewA10,2012:875-884.

[11] 劉洪亮,汪明杰.SAS軟件在學生成績相關性分析中的應用[J].林區教學,2012(4):16-18.

SAS statistical analysis for college student achievements and teaching effect

DONG Xiaogang, TONG Zhizhen, WANG Chunjie*, LI Chunjing, ZHANG Qianqian

(School of Basic Sciences, Changchun University of Technology, Changchun 130012, China)

Taking the student’s final examination results from a college in different major at same semester as references, the multivariate statistical method is used, with SAS macro program, to batch process the examination results and evaluate the teaching effect.

principal component analysis; factor analysis; cluster analysis; canonical correlation analysis; SAS.

2017-02-15

高等學校大學數學教學研究與發展中心項目(2014); 吉林省高等教育教學改革研究課題(2015); 吉林省教育廳十三五科學技術研究項目(吉教科合字[2016]第316號)

董小剛(1961-),男,漢族,吉林長春人,長春工業大學教授,博士,主要從事數理統計方向研究,E-mail:dongxiaogang@ccut.edu.cn. *通訊作者:王純杰(1978-),女,漢族,遼寧遼陽人,長春工業大學副教授,博士,主要從事統計學和教學方法研究,E-mail:wangchunjie@ccut.edu.cn.

10.15923/j.cnki.cn22-1382/t.2017.3.01

O 213.9

A

1674-1374(2017)03-0209-09

猜你喜歡
分析教師學生
最美教師
快樂語文(2021年27期)2021-11-24 01:29:04
隱蔽失效適航要求符合性驗證分析
教師如何說課
甘肅教育(2020年22期)2020-04-13 08:11:16
未來教師的當下使命
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
趕不走的學生
學生寫話
電力系統及其自動化發展趨勢分析
學生寫的話
圓我教師夢
吐魯番(2014年2期)2014-02-28 16:54:42
主站蜘蛛池模板: 国产欧美成人不卡视频| 五月天综合网亚洲综合天堂网| 2020最新国产精品视频| 国产美女自慰在线观看| 一级成人a做片免费| 国产最新无码专区在线| 免费毛片视频| 国产精品3p视频| 在线播放91| 超碰精品无码一区二区| 亚洲综合狠狠| 精品综合久久久久久97超人该| 99999久久久久久亚洲| 国产成人亚洲无码淙合青草| 日韩麻豆小视频| 亚洲一区二区三区国产精华液| 就去吻亚洲精品国产欧美| 成人伊人色一区二区三区| av无码久久精品| 国产无码高清视频不卡| 黄色网站在线观看无码| 免费视频在线2021入口| 亚洲人成网线在线播放va| 久久综合丝袜长腿丝袜| 亚洲IV视频免费在线光看| 国产成人1024精品下载| 91无码人妻精品一区二区蜜桃| 亚洲欧洲日产无码AV| 免费无遮挡AV| 国产一级精品毛片基地| 毛片基地视频| 波多野结衣视频一区二区| 亚洲黄网在线| 亚洲视频在线网| 久久人搡人人玩人妻精品| 日韩高清欧美| 中国国产高清免费AV片| 欧美色综合久久| 国产网站一区二区三区| 欧美成人怡春院在线激情| 色噜噜狠狠色综合网图区| 91精品啪在线观看国产60岁| 99这里只有精品免费视频| 亚洲综合专区| 免费不卡在线观看av| 99热线精品大全在线观看| 一级毛片免费播放视频| 国产又粗又猛又爽视频| 特级精品毛片免费观看| 超清无码一区二区三区| 国产欧美亚洲精品第3页在线| 国产成人在线无码免费视频| 免费高清毛片| 亚洲综合婷婷激情| 亚洲综合九九| 国产精品亚洲一区二区在线观看| 人妻免费无码不卡视频| 亚洲欧洲日韩国产综合在线二区| 国产精品亚洲专区一区| 动漫精品中文字幕无码| 四虎影视库国产精品一区| 中文字幕有乳无码| 青青草一区| 亚洲色图另类| 国产欧美日韩va另类在线播放| 成人第一页| 亚洲aaa视频| 欧美日韩在线国产| 亚洲中文在线视频| 日本91在线| 亚洲综合色婷婷中文字幕| 国产69囗曝护士吞精在线视频| 欧美天堂久久| 97国产精品视频人人做人人爱| 黄色污网站在线观看| 欧美亚洲另类在线观看| 国产精品无码AV中文| 黄色一级视频欧美| 老司机aⅴ在线精品导航| 亚洲欧美在线看片AI| 一本视频精品中文字幕| 欧美黄网站免费观看|