賀路路 阮曉龍



摘? 要: 分析學生成績有利于優化課程設置,有利于提升教學質量。由于學生成績具有多主體性和時序性等特征,大多數分析工具和展示方式均存在分析因子難以結合,異常數據分析缺乏針對性等現象。因此,本文提出從課程、學生和教師等任意主體出發,采用真實教學數據進行分析。即,設計分析模型并邀請教學人員對其進行修正,再利用可視化圖表庫ECharts對分析結果進行直觀展示。通過對近五年的學生成績進行分析與可視化展示,可直觀地看到學生學習過程中以及教學過程中存在的優勢與不足。
關鍵詞: 成績分析; 課程教學; 教學質量; ECharts; 教學數據
中圖分類號:G642.1? ? ? ? ? ? 文獻標志碼:A? ? ?文章編號:1006-8228(2019)09-50-03
Research on data analysis model and visualization of college students'examination achievements
He Lulu, Ruan Xiaolong
(College of Information Technology, Henan University of Traditional Chinese Medicine, Zhengzhou City, Henan Province, 450046)
Abstract: The analysis of students' scores is conducive to optimizing the curriculum and improving the quality of teaching. Due to the multi-subjectivity and time series of students' performance, most of the analysis tools and display methods are difficult to combine the analysis factors and lack of pertinence in the analysis of abnormal data. Therefore, starting from any subject such as curriculum, student and teacher, this paper uses real teaching data to analyze. That is, design the analysis model and inviting the teaching staff to revise it, and then display the analysis results intuitively with charting and visualization library ECharts. Through the analysis and visualization of students' achievements in the past five years, the advantages and disadvantages of students' learning process and teaching process can be seen intuitively.
Key words: score analysis; curriculum teaching; teaching quality; ECharts; teaching data
0 引言
高校畢業生出現與其能力、素質不匹配的問題日漸突出[1],對其成績分析不足,挖掘不夠的問題也大量存在。如何展現這些數據所蘊含的價值,是教學信息化的重要研究方向之一[2]。
對成績的分析多采用Excel等簡單工具,僅獲得平均分、標準差、方差等內容,并未對學生成績進行深入挖掘。結果簡單,很難促進教學進步,指導進一步教學進程。因此,建立一套能夠促進學生成長、促進素質提高的制度迫在眉睫,也已成為本科教學改革的重要任務。
結合我院實際情況,本文擬通過交叉分析模型來科學展示學生的成績,期望能夠幫助院系管理者發現學生成績的特點,更全面地展示教學效果、促進我院學生綜合素質得到進一步的發展。
1 數據可視化技術
1.1 什么是數據可視化
簡單的說,數據可視化就是按照既定方式對數據進行挖掘處理,并按照一定的方式/方法將數據呈現出來,幫助管理者更好地發現問題、解決問題,體現數據的巨大價值。
1.2 數據可視化的優點
⑴ 高速信息傳播
人腦接收視覺信息的速度通常比文字信息快10倍。相比那些紛繁復雜的報告、電子表格,使用圖形化方式來總結、展示復雜數據中所蘊含的重要信息,可有效提升信息展示效果,直觀查看數據的內在聯系,可視化可以更快地幫助管理者理清事務本質,緊抓工作內涵。
⑵ 多維數據顯示
數據地可視化,可以是二維,也可以是三維,對之進行排列、組合、分析、挖掘即可發現數據中隱含的規律及價值[3]。
⑶ 直觀信息呈現
數據可視化,通常使用較少的圖形來展示復雜的邏輯關系,甚至單個圖形也可深入挖掘數據內涵。豐富且有意義的圖形有助于教師了解學生狀態,可更有針對性地幫助學生,同時也可減輕教師的工作量,使之管理效率得到提高。
2 數據預處理
本分析中的學生成績來源于河南中醫藥大學信息技術學院近10年的積累,其中存在許多缺失數據、不規范數據、不標準數據[4],因此對數據進行預處理,特別是缺失值、異常值、冗余值等內容操作很有必要,這樣的清洗過程,有利于保證成績數據的真實性和可用性。
預處理操作如下,首先將學生成績中標記“沒寫”、“缺考”、“入伍”、“休學”、“緩考”、“無理論成績”等進行格式化,并清除無效數據。之后再對數據得含義進行解讀,數據中的字段內容如表1所示。
基于河南中醫藥大學信息技術學院的學生成績數據與數據含義創建數據存儲模型,并將清洗后的數據存儲至數據庫中。
3 學生成績的總體分析
本數據分析中參與學生1927名,參與專業8個,參與年級10個,參與班級39個,參與課程433個,共50萬余條。本文從不同角度對學生成績數據進行分析后,建立了多個角度、多個體系地分析模型,可全面呈現本院系的學生成績。
3.1 學生成績整體分析
⑴ 分析方式
學生成績整體分析的目的是了解學生最終考試的整體情況。首先將成績劃分為0-59分,60-69分,70-79分,80-89分,90-100分五個區間,然后統計每個區間、每個人、每個課程成績,得到學生成績的最終區間分布。
⑵ 分析結果
整體分析的結果如圖1所示,可以看出學生成績呈正態分布,符合教學規律,多數處在70-79分和80-89分的區間內,80-89分區間內的學生最多,為32974人課,0-59分區間內學生最少,為2623人課。
3.2 各年級學生平均分分析
⑴ 分析方式
從各年級學生成績平均分中,可看出每個年級的整體情況,與其他年級對比后,可查看院系各專業課程的教學情況。
⑵ 分析結果
學生成績平均分歷年變化不大,在78.68分上下,略有浮動;專科學生平均分歷年變化較本科生來大,在76.07分上下,如圖2所示。
3.3 各年級學生成績分布分析
⑴ 分析方式
從各年級學生成績,可獲取優秀、良好、中等、及格、不及格人數的分布情況,有利于了解各年級學生的綜合素質。
⑵ 分析結果
通過分析,可看出各年級學生成績呈正態分布,集中在中等、良好部分。同時各年級的優秀率相對高于不及格率,如圖3所示。
3.4 所有學生成績分布分析
⑴ 分析方式
對所有學生的成績進行分析匯總后,可利用散點圖繪制出學生成績的分布區間。
⑵ 分析結果
通過分析可看出,學生成績多分布在75分-85分之間,絕大部分學生的成績大于60分,在75分-85分之間,極少部分學生成績小于60分,如圖4所示。
4 學生成績的專業分析
4.1 各專業學生成績分布分析
⑴ 分析方式
從各專業學生成績分布中,可看出每個專業的教學質量[5]。統計各專業的人數、總分、課程數,算出每個專業的優秀、良好、中等、及格、不及格人數,對展示各專業的學習效果來講也很重要[6]。
⑵ 分析結果
可以看出,各專業學生成績的分布類似,各專業相差不大,較多的學生分布在中等、良好部分,少數學生不及格,少數學生優秀,如圖5所示。
4.2 各專業成績優秀率分析
⑴ 分析方式
從各專業成績優秀率分析當中,可看出各專業的優秀情況。先統計出各個專業的學生人數,再統計出優秀學生人數,就可進行簡單計算。
⑵ 分析結果
通過分析可知,計算機網絡技術專業成績優秀率達0.27,其他專業優秀率都在0.13左右,計算機信息管理專業優秀率最低。如圖6所示。
5 結束語
利用可視化技術,將數據挖掘分析的思想與信息技術學院實際情況相結合后,為教學工作提供了大量有用信息。所使用分析模型均根據信息技術學院的教學特點來設計,所呈現的分析結果具有較高的參考意義[7],這可為教學改革與教學質量提升提供了有力數據支撐。從分析結果可以看出,目前學院學生在學習過程中以及教師在教學過程中存在的優勢與不足[8],這也是本次研究的重要意義所在。
參考文獻(References):
[1] 方錦雯,姚壹壹,蔡軍偉,鞏學梅.學生成績分析中最優試卷樣本量確定的研究[J].寧波工程學院學報,2018.3:63-68
[2] 范雙南,趙輝煌,肖四喜,鄒祎.基于主成分分析的《計算機基礎》課程學生平時成績綜合評價[J].輕工科技,2018.10:175-176
[3] 張濠天,張文卿,王元元,施月霞,曾南焱.關聯規則挖掘在成績分析中的應用[J].中國高新區,2018.10:47.
[4] 龔玉玲,徐曉棟.基于SAS的學生成績混合正態分布的研究[J].江蘇科技信息,2018.35(1):69-71
[5] 陳卓.基于SPSS的學生成績影響因素分析[J].電子制作,2017.20:43-44,54.
[6] 閆波,趙德成,王璐環.哪些因素在影響中國學生學習成績?——基于PISA2015中國四?。ㄊ校W生數據的多水平分析[J].中小學管理,2017.10:9-12
[7] 劉鐘情.數據挖掘在體育院校計算機等級考試成績分析中的應用研究[J].江漢大學學報(自然科學版),2016.44(4):377-381
[8] 張維國.基于數據挖掘的在線考試系統設計與實現[J].計算機時代,2015.12:41-44