999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于學生成績多變量數據挖掘的學習行為分析

2019-04-04 05:48:40王藝嵐張家華
文化創新比較研究 2019年6期
關鍵詞:數據挖掘分析課程

單 耀 王藝嵐 張家華

(華北科技學院, 北京 101601)

隨著大數據時代的來臨,從數據獲得結論對社會的生產和生活產生了深遠的影響。大數據技術大致可以分為兩個部分,其一為大量數據的獲取與管理,其二為數據的統計分析與數據挖掘。通過數據挖掘技術,可以得到表面上不易得到的深層次規律,為系統決策提供支持。這項技術可以應用于學生學習成績的分析。一方面由于學生的基礎,學習習慣與方法,課程特點的不同,導致考試的成績呈現一定的規律性。另一方面,學生的學習成績是一個典型的多變量數組,應用數據挖掘技術可以有效地分析。借助計算機分析的手段,可以快速準確地對學生的成績進行分析,從而指導教與學水平的提高[1-2]。從國內相關研究來看,數據挖掘技術應用于學生學習成績分析的案例呈現上升的趨勢,未來可能成為一種學生學習效果評價,學習方法評價與提高的新手段。數據挖掘技術手段多樣,目標各異,如回歸[3],決策樹[4-5],支持向量機[6],K-最近鄰[7]等。本文以主成分分析為切入點及手段對學生的學習成績進行了分析,回答了成績共生組合與學習習慣等問題,為提高教與學質量的分析提供了基礎。

1 研究方法

選取樣本為我校采礦工程系卓培班與普通班大一的考試成績,其中卓培班34人,普通班19人。由于開設課程略有差別,卓培班參與分析的課程有計算機基礎、C語言、大學語文、大學數學、采礦工程導論等16門課,普通班參與分析的課程有17門課。作為示例,表1是普通班一部分課程的考試成績。

主成分分析法是一種非監督分析方法。通過將相關性較高的變量用較少變量來表示,達到減少變量,分析變量間共生組合關系,以及樣品間共生組合關系的目的。在計算的過程中,按照數據按列歸一化,計算協方差矩陣,計算相關系數矩陣特征值與貢獻率的順序進行計算。特征值按照降序進行排列,代表了方差變化較大的方向,從而達到降維的目的。每一個變量在特征值上有荷載值。在某一特征值上荷載值高的一些變量具有相似的變化趨勢,從而可以找到其中的共生組合關系。

表1 普通班部分課程考試成績

特征值在原數據空間中所指向的方向作為新的變量。經過主成分分析法計算后的變量個數小于原變量的個數。具體數值的選取可以根據具體問題,并參考累計貢獻率來確定。累計貢獻率達到總方差的80-85%,即可認為代表了絕大多數方差的變化。

原變量在特征值上的載荷可以在圖上表示。具有類似變化規律的變量在載荷圖上表現出聚類的特征。為計算這一聚類特征,應用高斯混合模型的方法進行計算。相比較于較常用的K-means計算方法,高斯混合模型可以計算每一個點歸屬不同類別的概率,用“軟邊界”將數據分類,比K-means方法更加接近實際。

2 結果與討論

這一計算過程可用R語言來實現。卓培班成績最大的三個特征值分別為4.07,2.24和1.92,累計貢獻率為82%,因此用三個特征值可以代表卓培班考試成績矩陣。在這一基礎上計算每個變量在三個特征值上的載荷,并進行聚類。聚類的結果如圖1(A)所示。在圖中,圓形(第一組)表示了計算機基礎,法律基礎,大學英語(一,二),采礦工程導論,國防教育與C語言程序設計七門課,三角形(第二組)表示了高等數學(一,二),大學物理,線性代數,理論力學五門課,十字形(第三組)代表了兩個學期的體育課,正方形(第四組)代表了大學語文與物理實驗兩門課。

圖1 兩個班級大學生考試成績主成分分析與聚類分析結果

從各門課在三個維度的載荷來看,第一組在RC1上的載荷較高,其它三組載荷接近為零;第二組在RC3上的載荷較高,同時其它三組載荷接近為零;第三組在RC2上的載荷較高,第四組在RC2上有一定的負值,其它兩組的載荷接近為零。計算結果顯示了各門課在成績分布上的聚類關系。這種關系代表了課程的特點,學生的學習習慣與效果。RC1維度上顯示了記憶對課程的影響,說明大學英語,計算機基礎等課程記憶的重要性,而其它課程受記憶的影響相對較小。RC3維度顯示了理解對課程的影響。這一結果與一般的理解相近,即數學,物理,力學偏重理解的特征,同時對其它課程的影響較小。

應用同樣的方法對普通班的成績進行了分析。普通班成績最大的三個特征值分別為5.80,2.99和1.86,累計貢獻率為93%。用三個特征值可以代表普通班考試成績矩陣。計算每門課在三個特征值的載荷,并進行聚類,結果如圖1(B)所示。在圖中,圓形(第一組)表示了C語言程序設計,高等數學(一,二),大學物理,物理實驗,兩個學期的體育課;第二組(三角形)表示了線性代數,計算機基礎,法律基礎,心理健康與國防教育五門課;第三組(正方形)表示了大學語文,大學英語(一,二),采礦工程導論四門課。

從各門課在三個維度的載荷來看,第一組在RC1上的載荷較高,其它兩組的載荷接近于零。第二組在RC2上的載荷較高,其它兩組的載荷接近于零。第三組在RC3上哦載荷較高,其它愛那個組的載荷接近于零。第一組包含一些理解能力要求較高的課程,如高等數學與大學物理,物理實驗等。與卓培班不同的是,C語言程序設計與體育課與數學與物理的相關性較高,被劃分為一組。第二組主要包含了一些記憶性要求較高的課程,如法律基礎和心理健康等,與卓培班分析結果不同的是,線性代數表現出較強的相關性,被劃分到這一組。第三組的四門課程也表現出較強的記憶要求。

兩個班級的考試成績表現出一些相同的規律,但同時也表現出一些個性特點。這些特點可能會受到以下因素的影響:課程的特點,如課程的內容,前后課程的關系等;教學的過程,如教學的方法,講授的內容,學習的要求,考試的要求等;學習的方法,如個人學習習慣與學習方法的建立,個人精力投入,班級的學風等。這些因素共同影響了學生的學習成績,要想切實提高教與學的質量,提高學生學習的效率,主成分分析與聚類應是一個切入點。另一方面,這項工作是一項復雜的系統工程,需要更加深入的研究。

3 結論

通過對學生成績的數據挖掘,得出了兩個班級基礎課學習效果的共生組合關系。發現:

(1) 在學習的課程中有明顯的共生組合關系,說明學生的學習效果,以及學習的過程,學習的方式有其規律性;

(2) 不同的班級表現出了不同的規律,說明學生的學習效果受到一些內部與外部因素的影響,通過找到這些規律就可以找到提高學生學習效果的方法。

猜你喜歡
數據挖掘分析課程
數字圖像處理課程混合式教學改革與探索
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
軟件設計與開發實踐課程探索與實踐
計算機教育(2020年5期)2020-07-24 08:53:38
為什么要學習HAA課程?
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統及其自動化發展趨勢分析
一種基于Hadoop的大數據挖掘云服務及應用
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 国产91线观看| 久久性妇女精品免费| 亚洲天堂视频在线观看免费| 亚洲AV永久无码精品古装片| 日韩在线2020专区| 精品久久久久久成人AV| 亚洲精品你懂的| 国产幂在线无码精品| 久久国产精品麻豆系列| 无码AV日韩一二三区| 青青青国产视频手机| 国产理论一区| 精品久久久久久久久久久| 日韩av电影一区二区三区四区| 亚洲成在人线av品善网好看| 成年A级毛片| 中国精品久久| 五月激情综合网| 午夜三级在线| 国产成人精品午夜视频'| 精品国产网站| 在线国产欧美| 国产美女免费| 久久6免费视频| 午夜一级做a爰片久久毛片| 欲色天天综合网| 欧美综合中文字幕久久| 中文字幕欧美日韩高清| 国产网站黄| 免费jjzz在在线播放国产| www.youjizz.com久久| 国产在线无码一区二区三区| 国产精品夜夜嗨视频免费视频| 久久国产亚洲欧美日韩精品| 久精品色妇丰满人妻| 国产成人在线小视频| 亚洲国产综合第一精品小说| 日日拍夜夜嗷嗷叫国产| 欧美a√在线| h网址在线观看| 久久久久青草线综合超碰| 国产成人亚洲无吗淙合青草| 亚洲人成高清| 国产欧美精品专区一区二区| 久久亚洲国产一区二区| 免费黄色国产视频| 国产极品美女在线| 免费在线色| 国产91精品调教在线播放| a级毛片毛片免费观看久潮| 国产女人18水真多毛片18精品| 免费毛片视频| 国产成人乱码一区二区三区在线| 国内精自线i品一区202| 国产第一页第二页| 亚洲欧美日韩视频一区| 亚洲AV无码乱码在线观看裸奔 | 国产福利一区二区在线观看| 久久亚洲中文字幕精品一区| 伊人福利视频| 久久一级电影| 国产伦精品一区二区三区视频优播 | 天堂网国产| 欧美国产日产一区二区| 成人欧美日韩| 青青网在线国产| 国产欧美日韩视频怡春院| 99视频在线免费观看| 日韩在线欧美在线| 日韩欧美中文| 国产成人一二三| 国产精品区网红主播在线观看| 成人永久免费A∨一级在线播放| 久视频免费精品6| 中文字幕av一区二区三区欲色| 亚洲国产精品无码AV| 国产一二视频| 色成人综合| 国产成人精品2021欧美日韩| 欧亚日韩Av| 欧美激情视频一区二区三区免费| 欧美有码在线|