代愛妮 王蕊






關(guān)鍵詞:計算機教育;Python;線上教學評估;學習成績分析
1 引言
高校在線教學涉及學生規(guī)模大,學生學習情況難以跟蹤和把握,一定程度上影響了教學質(zhì)量,也給高校教學帶來了前所未有的挑戰(zhàn)。機遇與挑戰(zhàn)共存,在線教學平臺也同時提供了大量的可供我們參考利用的在線教學數(shù)據(jù),在當前信息時代的新工科背景下,眾多學者利用大數(shù)據(jù)分析方法及人工智能算法對教學數(shù)據(jù)進行分析并建立了教學預警模型,引導學生開展了線上自主學習和師生線上自主合作研討的教學模式。學者馬玉玲研究了基于機器學習的高校學習成績預測方法,其中提出了一種基于課程關(guān)聯(lián)性的“課前”學生成績預測方法,能夠預測下學期成績不及格風險[1]。學者張源設計了基于隨機森林的線上教學智能學業(yè)預警模型,對學生行為和教師行為制定了精準干預措施[2];梁偉等學者基于Python大數(shù)據(jù)對在線教學情況進行了數(shù)據(jù)可視化分析與研究[3];黃家琦等學者建立了廣義回歸神經(jīng)網(wǎng)絡預測模型對學生成績進行了預測,可識別不及格學生進行提前干預與教學輔導[4]。宋曉磊等學者采用了4種機器學習算法對教育數(shù)據(jù)進行分析,然后篩選出最相關(guān)的數(shù)據(jù)特征建立了多種預測模型對學業(yè)成績進行預警[5]。此外,還有很多學者也相繼利用大數(shù)據(jù)及人工智能算法對學習數(shù)據(jù)進行分析及預測,為高校課程學習成績的數(shù)據(jù)分析及預測提供了參考[6-10]。
綜上,如何利用人工智能算法對在線教學數(shù)據(jù)進行數(shù)據(jù)分析與應用是當前值得研究的熱點方向之一。為有針對性地總結(jié)和輔助我校線上教學,揭示教學影響因素,實現(xiàn)教師及高校管理部門客觀評價課程教學效果,本研究特選取《Python與人工智能》線上教學部分作為研究對象,通過收集該課程教學數(shù)據(jù),基于Py?thon語言和數(shù)據(jù)分析技術(shù),對該課程按不同特征匯總的數(shù)據(jù)分布情況、各教學行為特征與成績相關(guān)性進行了分析,并建立了相關(guān)性矩陣,最后篩選得出影響高校線上教學成績最相關(guān)的學習行為特征,實現(xiàn)了學習行為特征降維。本文相關(guān)研究成果為后續(xù)本研究進行數(shù)據(jù)聚類及建立教學預測模型提供了基礎,也可為高校混合式教學模式的改革和教學指導提供了一定參考。
2 研究方法
《Python與人工智能》課程具有操作性和實踐性較強的特點。本研究針對疫情期間開展在線教學特點,利用超星學習通收集的課堂教學數(shù)據(jù),采用基于Python的數(shù)據(jù)分析方法,對教學數(shù)據(jù)分布情況進行了分析;其次對課堂內(nèi)外教學核心環(huán)節(jié)各特征與成績進行了相關(guān)性分析;最后給出了相關(guān)性分析矩陣,對選擇什么樣的特征數(shù)據(jù)進行了教學模塊設計,為篩選強特征建立教學預測模型提供了重要參考。
3 數(shù)據(jù)采集
本文選取青島某高校2019-2020第二學期超星學習通線上教學課程數(shù)據(jù),涉及通信工程(物聯(lián)網(wǎng))和電信兩個專業(yè)四個班級共107條學生的學習行為數(shù)據(jù)。數(shù)據(jù)集具體情況及各字段類型如表1所示,主要包括描述學生信息的“學生序號”“專業(yè)”“班級”“性別”四個特征,類型為object類型。數(shù)據(jù)分析時,本研究將專業(yè)、班級和性別進行了離散化處理。其他“課程視頻”“章節(jié)測驗”“討論”“作業(yè)”“章節(jié)學習次數(shù)”“簽到”“課程互動”“任務點完成百分比”“期末成績”共11個學生行為特征數(shù)據(jù)為在線采集的最終轉(zhuǎn)換為百分制表示的學習數(shù)據(jù)。學生成績分布主要有A、B、C、D四個等級,分別代表的分數(shù)區(qū)間為[90,100]、[80,90)、[65,80)、[0,65)。此外,將數(shù)據(jù)集中期末成績小于75分的給予不及格預警,用目標值0代替;而將考試成績無不及格預警風險的數(shù)據(jù),用目標1代替。
4 數(shù)據(jù)分布分析
為了更好地服務于教學質(zhì)量的提升,構(gòu)建高校在線學習成績預測模型,跟蹤高校學生線上教學及學生的學習情況,本研究首先對本學期數(shù)據(jù)分布情況進行了分析與歸納。
圖1給出了各數(shù)值類型字段的總體箱型分布,從中可以看出,數(shù)據(jù)分布最集中的為課程視頻得分,分布最分散的為章節(jié)學習次數(shù)和討論得分。說明大部分同學能按要求看完視頻,得分值差別不大,而課堂互動得分差異較大,說明有的學生互動比較積極,但有的學生參與積極性不夠。
圖2中左圖反映了數(shù)據(jù)集平衡性分布情況,可以看出該數(shù)據(jù)集的學生學習成績等級基本呈現(xiàn)正態(tài)分布。圖2中右圖反映了性別等級分布情況,可以看出男女比例差別較大,其中,性別為男性的數(shù)據(jù)占比為77.6%,性別為女性的數(shù)據(jù)占比為22.4%。
圖3為按專業(yè)等級分布情況,從圖中可以看出電信專業(yè)學生選學本課程人數(shù)為67人,占比為61.6%,通信(物聯(lián)網(wǎng)外包)專業(yè)為40人,占比為37.4%。從成績等級分布來看,成績等級為A的同學全部在電信專業(yè),而且等級為B的同學占比也高于通信(物聯(lián)網(wǎng)外包)專業(yè)。因此,專業(yè)學生學習基礎對學生學習成績有一定影響,今后教學中可以針對不同專業(yè)學生制定不同教學策略,或者在教學中加強教學內(nèi)容的核心教研,制定適合各專業(yè)的教學策略。如果是不同專業(yè)共同上這一門課程,則應該針對基礎較弱的專業(yè)班級加強監(jiān)督和學習輔導。
5 特征與成績相關(guān)性分析
下面分析不同性別情況下,各學習特征與成績等級相關(guān)性。圖4為四級制等級與各學習行為特征之間的關(guān)系柱狀圖,可以看出,成績等級A的同學在討論、章節(jié)測驗、作業(yè)、課程互動等學習環(huán)節(jié)中得分均較高,反之較低。由于在線教學過程中該課程的學習視頻允許學生拖動,因此,從圖4中也可以看出課程視頻、任務點完成百分比分與各成績等級變化對學生成績的影響區(qū)別不大,可根據(jù)實際教學情況取消這兩個指標,或設置不同權(quán)重合理使用該模塊對學生學習情況進行分析。
圖5反映了課程內(nèi)學習互動與成績等級關(guān)系。從圖5可以看出,成績等級越高的同學,參與課堂互動和討論的分數(shù)越高,說明課堂互動指標和討論可有效促進學習效果,提高學生學習成績。圖6反映了章節(jié)學習次數(shù)與章節(jié)測驗、討論與作業(yè)、作業(yè)與期末成績、章節(jié)測驗與期末成績之間的關(guān)系。可以看出,大多數(shù)章節(jié)學習次數(shù)多的同學,章節(jié)測驗分數(shù)也相對高;大部分課堂參與討論多的同學,作業(yè)完成的分數(shù)也相對較高;此外,作業(yè)和章節(jié)測驗分數(shù)高,大部分期末成績也較好。因此,從以上分析可以看出,課堂內(nèi)外學習情況與學習成績有較大的相關(guān)性,今后教學過程中對在這些環(huán)節(jié)中得分較低的一部分同學應加強監(jiān)督和督促,從而有效降低課程期末成績不及格風險率,更好地促進教學效果。
6 特征選擇
為充分利用各種學習特征,本研究也同時考慮了專業(yè)、班級和性別三個特征,并在相關(guān)分析之前對這三個特征進行了離散化數(shù)值處理。本研究利用Py?thon中皮爾森相關(guān)系數(shù)方法進行了不同特征相關(guān)性的分析,規(guī)定相關(guān)性系數(shù)大于0.70的學習行為特征為強相關(guān),介于0.5到0.70之間為顯著相關(guān),介于0到0.5之間為弱相關(guān),小于0為不相關(guān)。圖7為各學習特征與期末成績的相關(guān)性矩陣圖。
從圖7中可以看出章節(jié)測驗、討論、作業(yè)、章節(jié)學習次數(shù)4個學習行為特征為強相關(guān);課程互動、班級和簽到3個學習行為特征為顯著相關(guān);課程視頻與任務點完成百分比2個學習行為特征為弱相關(guān);專業(yè)與性別為不相關(guān)特征。在預測及預警分析中,可對強相關(guān)的學習行為指標重點監(jiān)測或賦予較大的權(quán)重值,而對弱相關(guān)和不相關(guān)的特征可考慮去掉相關(guān)特征,實現(xiàn)特征篩選。因此,本研究篩選得出強相關(guān)和顯著相關(guān)的7個特征變量作為影響高校線上教學成績最相關(guān)的學習行為特征,分別為班級、章節(jié)測驗、討論、作業(yè)、章節(jié)學習次數(shù)、簽到和課程互動,并作為后續(xù)研究建立預警模型奠定基礎。
此外,本研究不僅研究了各學習行為特征與成績的相關(guān)性數(shù)據(jù),同時也研究了不同特征之間的相關(guān)性值,從中發(fā)現(xiàn)相關(guān)教學規(guī)律,為制定正確的教學策略提供參考。圖8為各學習特征之間的相關(guān)性矩陣熱力圖。從圖8中可以看出,討論與課程視頻的相關(guān)系數(shù)值僅為0.21,說明一個能把課程視頻看完的同學,不一定會在課堂上參與討論;此外,從圖8中可以看出班級與期末成績?yōu)閺娤嚓P(guān)、討論分別與班級、章節(jié)學習次數(shù)及課程互動也均為顯著相關(guān),與期末成績?yōu)閺娤嚓P(guān),說明所在班級風氣好的同學更愿意參與討論、其學習主動性更高,課堂互動性也好,期末相對也能取得更好成績,因此,可有針對性地對某些班級進行教學督促和管理,提高教學效果。另外,也可以看出章節(jié)學習次數(shù)與章節(jié)測驗、討論為顯著相關(guān),與作業(yè)為強相關(guān)等,說明章節(jié)學習次數(shù)多的同學,通常章節(jié)測驗分數(shù)也相對較高,作業(yè)完成率好,從而最后期末也能取到更好的成績,因此,平時教學過程中,課程教師可以對章節(jié)次數(shù)少的同學給予教學干預,協(xié)助監(jiān)督這部分同學有質(zhì)量地完成章節(jié)學習,從而有效提高學生的期末考試成績。
7 結(jié)論
本研究通過收集線上教學平臺數(shù)據(jù),采用Python數(shù)據(jù)分析方法,對線上教學課程分布及學生的學習行為影響因素進行了分析,并篩選得出學生學習行為特征與學習成績的相關(guān)性矩陣,對學習成績影響因素最相關(guān)的學習行為特征進行了分析,該研究對提高線上教學效果及線上教學內(nèi)容的設計有一定的指導和參考價值。研究結(jié)論總結(jié)如下:
(1) 從圖1、圖4和圖5分析可以看出,課堂互動和討論環(huán)節(jié)參與多的同學,最終成績也較好,所以教學過程中可以恰當?shù)卦O計教學互動環(huán)節(jié),促進課程教學效果;而對于章節(jié)學習次數(shù)與章節(jié)測驗、討論與作業(yè)、作業(yè)與期末成績、章節(jié)測驗等學習環(huán)節(jié)中得分較低的一部分同學應加強監(jiān)督和督促,從而有效降低課程期末成績不及格風險率,更好地促進教學效果。
(2) 不同專業(yè)學生應制定不同教學策略。從圖2可以看出,電信專業(yè)基礎相對于物聯(lián)網(wǎng)專業(yè)學生基礎好一些,所以,電信專業(yè)平均成績優(yōu)于物聯(lián)網(wǎng)專業(yè),說明以后教學可針對性地對于基礎較弱的專業(yè)應加強監(jiān)督和督促,有效提高整體教學水平。
(3) 圖7與圖8分析了各行為特征與學習成績的相關(guān)性,給出了弱相關(guān)、強相關(guān)和顯著相關(guān)的學習行為特征數(shù)據(jù)。建立綜合考評教學模型時,對于課堂內(nèi)外學習情況與學習成績相關(guān)性不大的學習行為特征,例如“課程視頻”“任務點完成百分比”“專業(yè)”“性別”可以設置較小的權(quán)重或不考慮,而對于那些與最終學習成績相關(guān)性很大的學習行為特征應重點考慮。本研究結(jié)合各行為特征與期末成績相關(guān)性分析,給出“班級”“章節(jié)測驗”“討論”“作業(yè)”“章節(jié)學習次數(shù)”“簽到”和“課程互動”作為后續(xù)研究建立預警模型的特征數(shù)據(jù),同時教學過程中也應該對這些教學環(huán)節(jié)加強監(jiān)督和管理,制定相應教學策略,對該部分環(huán)節(jié)得分低的同學進行教學干預。