楊彩 侯峰



摘? 要: 從海量的大數據中挖掘出潛在的有價值的信息并進行可視化分析已成為研究的熱點。文章根據成績大數據,從班級、課程等多維度進行成績可視化分析,為教學管理者提供學生學習情況分析服務。經研究發現,成績的可視化分析不僅能為管理者提供精準的教學支持,還能使學生及時發現學業問題。
關鍵詞: 大數據; 多維度; 可視化分析; 精準; 教學支持
中圖分類號:TP391.9????????? 文獻標識碼:A? ???文章編號:1006-8228(2021)01-54-03
Research on the big data based visualized analysis of achievement
Yang Cai1, Hou Feng2
(1. Information Management Center, Zhengzhou University of Light Industry, Zhengzhou, Henan 450000, China;
2. School of Energy and Power Engineering, Zhengzhou University of Light Industry)
Abstract: Mining potential valuable information from massive big data and making visualized analysis has become a research hotspot. According to the achievement big data, this paper makes visualized analysis on students' learning achievement from the dimensions of class, curriculum and the others, so as to provide teaching managers with the analyzing service of students' learning situation. It is found that the visualized analysis of achievement can not only provide precision teaching support for managers, but also enable students to find problems in learning timely.
Key words: big data; multi-dimensional; visualized analysis; precision; teaching support
0 引言
“大數據”是指大量的結構化和非機構化的數據,它無法用常規的軟件進行處理,需要新的處理手段來處理這些海量的、高速增長的數據[1]。
大數據技術主要包括海量數據的獲取以及數據統計分析和挖掘兩部分內容[2]。大數據在各行各業發揮著重要作用,而如何利用大數據技術來提高高校教學管理者的教學管理水平是高校面臨的一個重大課題。運用大數據技術可以挖掘出現實生活中不易察覺的較為深層次的信息,通過這些信息,進而為人們提供決策支持[3]。
大數據技術[4]可運用在學生成績的分析過程中,通過大數據技術,可快速準確地對學生成績進行可視化分析,從而對學生的學業提供幫助及指導。同時,根據可視化分析,可為教學管理者提供教學管理依據。截至到目前,將大數據技術運用在學生可視化成績分析的學者越來越多,其已成為學習方法評價的有效手段。以往的學習成績分析往往是根據傳統的統計知識進行簡單的統計圖分析,或者采用常見分析工具SPSS、SAS等進行分析[5]。本文依據大數據技術,從班級、課程等多維度進行成績的相關性、詞云分析等其他指標分析,通過一系列的可視化分析進而為教學管理者及學生提供服務基礎。
1 數據準備
1.1 數據抽取
本文所采用的數據選取某高校一個學院全部本科生的期末成績作為基礎數據集。從教務系統中抽取某學院在2018-2019學年第二學期的期末考試必修課成績數據信息,數據信息包括:學生基本信息表、班級信息表、課程成績信息表。其中,涵蓋了該校某學院的15級、16級、17級、18級學生,共1227個學生,24個班級,30門課程,46名教師信息。學生課程成績基本信息主要包括各個考試科目的平時成績、期末卷面成績,總評成績等信息。
1.2 數據預處理
對抽取的數據進行探索分析,發現抽取的數據集存在缺失值數據,數據缺失的原因一方面可能是授課老師還未在教務系統中錄入學生成績,另一方面可能是在數據抽取過程中而導致的缺失,缺失值往往不能忽略處理,而處理缺失值最常用的方法有三大類:刪除記錄、數據插補和不處理[6]。本文采用拉格朗日插值法對抽取的缺失值數據集進行差值處理,補全缺失數據。
2 數據可視化分析
本文實驗采用BI分析平臺,從各個維度對學生成績進行分析,具體分析內容為:分別以學院的班級、課程為指標對平時成績、期末卷面成績、總評成績進行可視化分析;另外,對總評成績的不及格率按照課程為粒度做詞云分析,通過分析進而為學生學業提供指導建議,為教學管理者提供決策支持。
2.1 分析不同班級成績評定情況
通常,課程的總評成績包括平時成績和考試成績兩部分,一般情況下總評成績是二者的加權之和。用[total]表示總評成績,[tp]表示平時成績,[tk]表示考試成績,[wp]和[wk]分別表示[tp]和[tk]的權重,其中[wp+wk=1],那么,總評成績的公式表示如下[7]:
[total=wp*tp+wk*tk]
為了更直觀的分析課程成績評定特點,本文引用了學生成績評定指標,用[pk]表示,用平時成績與期末考試成績的比值作為評定指標的依據,如以下公式所示:
[pk=tptk]
若[pk=1],表示平時成績與考試成績基本相同;若[pk>1],表示平時成績明顯高于考試成績,若[pk<1],表示平時成績明顯低于考試成績,[pk]越小,表示平時成績越低于考試成績[7]。
將學生的平時成績、期末考試成績、總評成績進行歸一化處理(即將平時成績、期末考試成績、總評成績除以一百),在引入學生成績評定指標時,分析不同學生班級的成績評定情況,如圖1所示。
從圖1可看出,每個班級的成績評定指標基本都大于1,說明平時成績普遍高于期末考試成績,且大多數班級的成績評定指標介于1.4至1.6之間,還有少部分班級的成績評定指標介于1.2至1.4之間。從歸一化的成績亦可反映上述問題,平時成績的趨勢線高于總評成績高于期末成績。圖1可以清晰的反映每個班級的成績評定指標規律。
2.2 基于雷達圖分析不同課程的成績分析趨勢
以每個課程的成績作為樣本畫雷達圖,得到雷達圖如圖2所示,從雷達圖的橫縱軸兩個維度進行分析,橫向比較不同課程成績的分布區域,了解每門課程的教學狀態;縱向可看出平時、期末、總評成績的走勢,便于任課老師針對性的開展教學工作。
從圖2可以看出,雖然平時成績高于總評成績,但是總評成績的走勢基本和期末成績的走勢保持一致,說明期末成績在總評成績中占據重要部分,學生在注重平時成績的同時,更應該重視期末成績。
2.3 以課程為粒度分析期末卷面成績和總評成績間的關系
以課程為粒度比較不同課程間的總評成績和期末卷面成績間的關系如圖3所示。其中,橫軸是課程期末卷面成績,縱軸是課程總評成績,對兩者進行相關性分析,用實線標示二者之間的關系。同時,分別標示出期末卷面成績和總評成績的最低值、平均值、最高值及及格線。
從圖3的對角實線可以看出,總評成績隨著期末成績的增大而增大,即總評成績與課程期末卷面成績呈線性相關性,因此,教師可以此鼓勵學生重視期末成績。根據圖5中期末成績和總評成績的及格線可發現,期末成績不及格而總評成績及格的課程,如圖3中三角形狀標示的課程,針對這部分課程,教學管理者可考慮,看該課程是否存在放水可能。對于總評成績和卷面成績在均值以下或以左的課程表示這些課程的成績低于全部課程的整體均值水平,針對這些課程的教學管理者也應重點關注,教學管理者甚至可采取相應的措施來提升這些課程的成績。
2.4 基于詞云的課程不及格率分析
假設某班級學生總人數為[Ni],其總評成績不及格的人數為[Bi],那么該班級總評成績不及格率[Pi]可用公示表示如下:
[Pi=NiBi]
以班級為粒度將總評成績不及格率用詞云進行呈現,如圖4,其中字體越大越明顯的班級表示不及格率越高,字體越小越不明顯的班級表示不及格率越小。
從圖4可直觀的反映出,字體較大較明顯的即為不及格率較高的班級,對于不及格率相對較低的班級字體較小。通過詞云可視化分析,教學管理者針對不及格率較高的班級可有的放矢的采取教學管理策略,積極采取應對措施,提高教學質量。
3 結束語
本文通過對學生成績可視化分析,教學管理者可找出班級低于平均分的班級,對這些班級負責人進行適當提示,班級負責人采取給學生談話、做思想工作等措施,形成良好的學習氛圍;教學管理者還可找到課程低于平均分的任課老師,可采取某些激勵措施,爭取提高其所代課程的成績;還可以使教學管理者更好的了解學生的學業情況,使學生的學業管理工作順利開展。同時,讓學生對自己的學業情況有所了解,能促進學生及時、積極的應對學業問題。對于教學管理者如何制定長期有效的措施來促進教學和學生的學業發展還需要進一步研究。
參考文獻(References):
[1] 劉祥鵬.基于學生過去的學習成績預測并改善未來學習成績的大數據服務[J].科技展望,2015.27.
[2] 陸萬萬.一種基于大數據的案件信息智能分析系統[J].計算機應用與軟件,2018.9:153-156
[3] 吳雪峰,馬路.數據挖掘技術及在制造業的應用[J].計算機應用與軟件,2017.10:77-83
[4] 何琰.大數據技術在審計中的應用[J].鄭州輕工業學院學報(社會科學版),2016.17(3):67-71
[5] 余水發,張惠鋒,傅海婷等.基于統計圖表的學生考試成績可視化分析[J].教育教學論壇,2015.8:77-79
[6] 黃炎,王紫玉,黃方亮.數據挖掘技術在高校學生成績分析中的應用與研究[J].蘭州文理學院學報(自然科學版),2016.29(3):64-68
[7] 苑俊英,陳海山,常超等.高級語言程序設計課程成績分析[J].教育現代化,2019.17:86-90
收稿日期:2020-08-24
基金項目:河南省科技攻關項目(202102310232)
作者簡介:楊彩(1990-),女,河南南陽人,碩士,初級工程師,主要研究方向:教育信息化、數據挖掘、計算機技術。