李鈺,莊文密
(1.昆明理工大學管理與經濟學院,云南昆明 650093;2.山東大學控制科學與工程學院,山東濟南 250061)
新冠疫情影響下,高校無法正常開展線下教學,因此對新型教學模式的需求更加強烈,網絡課程已在高校得以廣泛推廣。網絡課程提供了全新的教學方式和參與形式,并且擁有多方面、多類型的基本信息。對于繁多的信息量,要求學生在了解本校網絡課程后進行合理選擇。在新時期的全國高校教學教育改革工作中,網絡教學也可以促進教學方法、教學內容以及管理結構方面的創新性改革。網絡課程建設中存在課程資源利用率較低、課程平臺互動性較弱和學生對課程設計的滿意度有待提高等問題,這對高校教育教學改革提出了挑戰。目前,網絡課程教學形式也不斷被國內眾多高校所采用,但是依舊有高校在此方面做得不夠完善。因此,對網絡課程進行綜合分析并對高校提供案例應用支持尤為重要。
已有研究表明,案例分析方法是一種常見方式。劉豫洲等以具體課程為例進行探討,對網絡教學的優勢及不足進行分析,但缺乏對其科學方法的分析;龔永康等同樣以課程案例分析為主,從考核方法與結果等方面對網絡教學模式進行設計與研究,但未利用結果數據進行關聯性分析。同時,問卷調查方法也在網絡課程效果研究中被廣泛應用。姜玉麗等采用問卷調查法對學生反饋進行統計,這樣的方式使得調查內容存在局限;唐衛民等在問卷調查設計方面作進一步細化,并給出具體統計結果,但分析深入程度不足。此外,利用數學模型的分析方法在近年來也得到了更多重視,李斐等運用交叉分析對網絡課程的滿意程度進行評價并提出相關改進建議,但在數據可視化方面稍有欠缺;徐志平分析MOOC技術對于課程建設過程中的一些局限性,提出相應的解決方法,但缺少實際案例。饒雪峰等針對教學方案的不足,進行改革探索,但對網絡課程的自身影響分析較少。綜上所述,本文研究基于某高校的教育教學實踐,基于Python技術實現數據處理并對學生網絡課程現狀進行可視化分析,在了解學生網絡課程學習情況后,再采用逐步回歸分析法,得出影響學生網絡課程學習成績的各項因素,保證了研究方法的有效性、客觀性。
本文采到的原始數據均來自于2018-2019第一學期某高校所有年級學生的《創新思維訓練》《個人理財規劃》等25門網絡課程選修成績,是根據超星雅爾公司反饋的學生網絡課程學習情況表篩選、匯總得到。在百分制的總成績中,課程視頻得分占比35%,課程測驗得分占比25%,討論得分占比5%,考試得分占比35%,總占比課程視頻得分=考試得分>課程測驗得分>討論得分。
學生成績按百分制劃分為5個等級,綜合成績90~100分之間為A,綜合成績80~90分為B,綜合成績70~80分為C,綜合成績60~70分為D,綜合成績小于60分為E,即成績不及格。根據Python中的pandas庫計算后可得出,學生選修網絡課程的總人數為3 198,綜合成績等級為A的學生有993名,綜合成績等級為B的學生有1 167名,綜合成績等級為C的學生有598名,綜合成績等級為D的學生有209名,綜合成績等級為E的學生有231名。
在進行數據挖掘之前,不可或缺的一個過程就是數據預處理。本文以學生網絡課程選修情況和學習成績為研究的目標模型,具體數據內容以CSV文件格式存儲在相關原始數據文件中,其屬性包括課程名、學號、姓名、院系、課程視頻得分、課程測驗得分、討論得分、考試得分、成績等級、各項成績完成進度等。
特征相關性性分析目的主要是從多方面研究影響學生網絡選修課程總分的主要因素,查看每個特征的相關性,屬于直觀分析的第一階段。通過圖1可以看出,針對綜合成績,課程視頻得分的影響值為0.83,課程測驗得分的影響值為0.83,討論得分的影響值為0.22,考試得分的影響值為0.86,因此,最有可能影響綜合得分的特征是課程視頻得分、課程測驗得分、考試得分,而對比之下,影響相對較小的特征是討論得分。

Fig.1 Feature correlation analysis圖1 特征相關性分析
由圖2可見,綜合成績為B的人數最多,超過選修網絡課程總人數的1/3。綜合成績等級為A和B的人數相接近,而綜合成績等級為D和E的人數相對較少,但也存在。這反映出學生選修的網絡課程成績情況普遍較好,成績優秀者居多,僅有一小部分人最終綜合成績不通過。

Fig.2 Comprehensive scores grade distribution圖2 綜合成績等級分布
根據圖3可以直觀看出,網絡課程的課程視頻得分分數段普遍集中在滿分35分,這表明絕大多數學生均能完成課程視頻的學習,但仍有極少部分學生并未觀看課程視頻。
課程測驗得分分數段集中在15-25分,仍有近100名學生課程測驗得分為0分,而滿分25分者只有200余人,這表明多數學生網絡課程的學習效率較低,學習情況較差。
討論得分的分數段普遍集中在0分和5分,且0分居多,這表明由于討論得分在綜合成績中占比較低,多數學生忽視了學習過程中的討論互動,不重視討論得分。
考試得分分數段集中在15-35分,且有較大部分學生的考試得分為0分,這表明有部分學生并未參加最終考試。由于前期學習較好的學生綜合成績已經能夠合格,導致只有極少數學生考試得分為滿分35分。

Fig.3 Scoresegment frequency圖3 得分分數段頻率
逐步回歸分析是一種研究隨機變量與已知數據之間存在何種關系的常見的數據相關性分析方法。它通過挑選對學生網絡課程綜合成績影響較大的物理量進行回歸建模,并與實測值比較,以判別學生成績情況。
逐步回歸的基本特征是要在模型中逐個添加變量。解釋變量每次被引入后,F檢驗將被執行,并依次對所選解釋變量進行t檢驗。引入的解釋變量會隨著后面解釋變量的引入而改變。如果它們變得不再顯著,則可以刪除它們。在插入每個新變量之前,確保回歸方程中只包含重要的變量。這是一個迭代的過程,直到回歸方程中沒有選擇顯著的解釋變量,或者回歸方程中沒有剔除不顯著的解釋變量,以確保最后一組解釋變量集是最優的。
根據逐步回歸分析,計算結果為[[0.687 150 69 0.689 721 38 0.050 477 96 0.737 546 67]]。這表示第4個變量的方差貢獻最大,即考試成績對綜合成績的高低影響最大。而第1個變量和第2個變量的方差貢獻保留3位小數后分別為0.687和0.690,幾乎接近.因此課程視頻成績和課程測驗成績對綜合成績的高低影響相近。第3個變量的方差貢獻保留3位小數后為0.050,影響較小,可以忽略不計。
Y
,X
...,X
),i=1,…,n
,假設回歸子Y
和回歸量X
…X
之間的關系是除X的影響外,還有其他的變數存在。加入一個誤差項ε
也是一個隨機變量)捕獲除X
…X
外任何對Y
的影響。因此,一個多變量線性回歸模型可表示為如式(1)所示形式。
由圖4可以看出,課程視頻得分越高,綜合成績及格率越高。但是如果課程視頻得分不高,綜合成績一定不高。由此可見,有些學生可能在看完課程視頻后并未進行課程測驗或最終考試;有一小部分學生并未觀看課程視頻,因此綜合成績為0分;而有一部分學生即使課程視頻得分為滿分35分,綜合成績仍達不到60分及格分,并且此類學生不在少數。
課程測驗得分與綜合成績總體呈正相關趨勢,即課程測驗得分越高,綜合成績越高。盡管課程測驗得分占比僅25%,不是最多的部分,但課程測驗分數越高,綜合成績及格人數越多。
討論得分與綜合成績總體沒有太多相關性,尤其是綜合成績的及格率與討論得分沒有直接聯系。大部分學生的討論得分均為0分,但不影響他們綜合成績的及格率。
考試得分越高,綜合成績越高,及格率也越高。有部分學生并未參加最終考試,相比于參加最終考試的學生,未參加最終考試學生的及格率相對較低,幾乎不能及格。最終考試分數較低的學生也有一小部分綜合成績不能及格。大部分高分學生考試成績都相對較高。因此,考試得分對綜合成績存在較大影響。

Fig.4 Effect of grades on passing圖4 得分對是否及格的影響
綜上所述,課程視頻成績和考試成績對綜合成績起決定性影響,即課程視頻成績和考試成績越高,綜合成績越高。課程測驗成績決定綜合成績高低,即課程測驗成績越高,綜合成績有可能越高。而評論成績幾乎不影響他們的綜合成績,并無明顯趨勢。
本文針對高校網絡教學的真實反饋數據進行深入研究,利用Python實現大數據處理與可視化,結合多種回歸方法對影響網絡課程教學效果的多種因素進行分析,從科學、客觀的角度挖掘出網絡課程學習中存在的問題,并提出合理化建議。
本文回歸分析結果表明,課程視頻得分、課程測驗得分和考試得分是影響學生網絡課程最終得分的重要因素,三者共同促進了網絡課程建設,但實際教學實施中學生重視程度不一,導致最終教學效果達不到預期。對此,可通過優化課程考核機制突出各項內容的重要性,促使學生明確課程學習的全面推進目標。此外,分析發現網絡教學過程中的討論得分對綜合成績的影響較小,容易造成參與學生積極性不高,可適當提高討論得分的重要程度從而促進學生參與感,進而提升教學效果。
通過對學生課程成績影響因素的分析與研究,能更客觀地展現網絡教學的規律性,有助于高校進行專業方向調整、教學資源合理配置和教學質量改進,同時也為高校學生樹立端正的學習態度和選擇適當的網絡課程提供參考。