楊杉



摘要:以四川省某高校的網(wǎng)絡(luò)教學(xué)平臺為研究對象,對該平臺的學(xué)生在線學(xué)習(xí)數(shù)據(jù)進(jìn)行學(xué)習(xí)行為畫像。采用python、dycharts、圖表秀,對不同任務(wù)點(diǎn)(視頻)學(xué)習(xí)情況下學(xué)生章節(jié)測驗(yàn)平均分、不同作業(yè)平均分下學(xué)生的章節(jié)測驗(yàn)平均分、不同網(wǎng)絡(luò)測評成績下學(xué)生網(wǎng)絡(luò)學(xué)習(xí)狀況進(jìn)行了畫像。畫像結(jié)果能直觀看出任課老師對于課程設(shè)置的情況、學(xué)生學(xué)習(xí)的各項基本情況、各學(xué)院對于學(xué)生學(xué)習(xí)管理的長處和短處,從而更有針對性地進(jìn)行改善和提高。
關(guān)鍵詞:大數(shù)據(jù);網(wǎng)絡(luò)學(xué)習(xí);畫像研究;行為研究
中圖分類號: TP311.13? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2021)07-0237-05
Abstract: Taking the online teaching platform of a university in Sichuan Province as the research object, the students' online learning data on this platform is used to profile the learning behavior. Using python, dycharts, and chart shows, the average scores of students' chapter tests under different task points (video) learning conditions, the average scores of students' chapter tests under different homework average scores, and the students' online learning status under different network test scores were portrayed. The result of the portrait can directly see the teacher's situation of the curriculum, the basic situation of students' learning, and the strengths and weaknesses of the colleges for student learning management, so as to make more targeted improvements and improvements.
Keywords: big data; network learning; portrait research; behavior research
1 引言
隨著互聯(lián)網(wǎng)教育的發(fā)展,各種網(wǎng)絡(luò)媒體也日新月異。新時代、新技術(shù)、新趨勢使在線教育形式也越來越豐富,同時也成為未來教育的重要組成部分[1]。尤其是今年疫情以來,網(wǎng)絡(luò)教學(xué)成為各大高校疫情期間教學(xué)的主要形式[2],在特殊時期發(fā)揮了不可忽視的作用,同時也累積了大量的學(xué)生在線學(xué)習(xí)數(shù)據(jù),為研究學(xué)生的在線學(xué)習(xí)行為提供了豐富的素材[3]。
目前網(wǎng)絡(luò)教學(xué)平臺是眾多高校普遍采用的一種教學(xué)輔助手段,也是學(xué)生在平時學(xué)習(xí)生活中使用頻率最多的學(xué)習(xí)平臺。任課老師將學(xué)習(xí)任務(wù)點(diǎn),作業(yè),以及章節(jié)測驗(yàn)考試等布置在此平臺上,通過課后完成的情況反饋,更好地了解學(xué)生對知識點(diǎn)的掌握情況,從而更有針對性地進(jìn)行教學(xué)[4],學(xué)校管理層也可通過此平臺對老師的工作情況進(jìn)行監(jiān)督和了解[5]。通過對網(wǎng)絡(luò)在線上導(dǎo)出的學(xué)生信息數(shù)據(jù)進(jìn)行畫像[6],能夠直觀地看出任課老師對于課程設(shè)置的情況、學(xué)生學(xué)習(xí)的各項基本情況、各學(xué)院對于學(xué)生學(xué)習(xí)管理的長處和短處,從而更有針對性地進(jìn)行改善和提高[7]。
2 研究思路
以四川省某高校的網(wǎng)絡(luò)教學(xué)平臺為研究對象,對該平臺于2020.3.1-2020.6.30的學(xué)生在線學(xué)習(xí)數(shù)據(jù)進(jìn)行學(xué)生在線學(xué)習(xí)行為畫像。采用python、dycharts[8]、圖表秀[9],對不同任務(wù)點(diǎn)(視頻)學(xué)習(xí)情況下學(xué)生章節(jié)測驗(yàn)平均分、不同作業(yè)平均分下學(xué)生的章節(jié)測驗(yàn)平均分、不同網(wǎng)絡(luò)測評成績下學(xué)生網(wǎng)絡(luò)學(xué)習(xí)狀況進(jìn)行了畫像。
3 數(shù)據(jù)說明
3.1 數(shù)據(jù)來源
數(shù)據(jù)來源于四川省某高校在線學(xué)習(xí)平臺,覆蓋了2020.3.1-2020.6.30各個學(xué)院的學(xué)生在線學(xué)習(xí)數(shù)據(jù),數(shù)據(jù)表中包含了學(xué)生姓名、學(xué)生賬號、院系、專業(yè)、行政班、學(xué)生狀態(tài)、入學(xué)年級、章節(jié)測驗(yàn)完成數(shù)、作業(yè)平均分、考試平均分等52個字段共50000條數(shù)據(jù),37M。
3.2 數(shù)據(jù)清洗
數(shù)據(jù)表中,很多數(shù)據(jù)對于我們研究學(xué)生成績狀態(tài)以及學(xué)生畫像時沒有用的,因此對數(shù)據(jù)進(jìn)行了數(shù)據(jù)預(yù)處理[10],篩選出了我們需要的數(shù)據(jù),把不需要的數(shù)據(jù)進(jìn)行了剔除,其中主要使用了任務(wù)點(diǎn)完成數(shù)、章節(jié)測驗(yàn)完成數(shù)、章節(jié)測驗(yàn)平均分、作業(yè)平均分等字段的數(shù)據(jù)進(jìn)行分析和探索。刪除無效字段:該字段列值為空或字段值一樣或?qū)Ψ治鰩椭陀绊懖淮?。刪除異常記錄:作業(yè)完成數(shù)數(shù)量極少,但平均分過高的異常值。
4 學(xué)生畫像
4.1不同任務(wù)點(diǎn)學(xué)習(xí)情況下學(xué)生章節(jié)測驗(yàn)平均分畫像
4.1.1統(tǒng)計指標(biāo)計算
由圖1可知:任務(wù)點(diǎn)完成數(shù)的均值為27.22;視頻任務(wù)點(diǎn)觀看時長為214.29;章節(jié)測驗(yàn)平均分58.80;根據(jù)均值對數(shù)據(jù)進(jìn)行劃分。任務(wù)點(diǎn)完成數(shù):>=27、<27; 視頻任務(wù)點(diǎn)觀看時長:>=214、<214; 章節(jié)測驗(yàn)平均分:>=30、<30。
4.1.2數(shù)據(jù)可視化展示
根據(jù)圖2可知:任務(wù)點(diǎn)完成數(shù)>=27個的學(xué)生,有15498人占總體的29.44%,<27個的學(xué)生,有37138占總體的70.56%; 視頻觀看時長>=214min的學(xué)生,有14551人占總體的27.64%,>214min的學(xué)生,有38085人占總體的72.36%;章節(jié)測試平均分>=30分的學(xué)生,有18076人占總體的34.34%,<30分的學(xué)生,有34560人占總體的65.66%。總體上說,學(xué)生普遍任務(wù)點(diǎn)完成數(shù)量較少,視頻觀看時長較短,章節(jié)測試平均分較低。
由圖3可知:
根據(jù)數(shù)據(jù)學(xué)生任務(wù)點(diǎn)完成情況可分為4類:1—任務(wù)完成數(shù)少,章節(jié)測試分低(31412人);2—任務(wù)完成數(shù)少,章節(jié)測試分高(5726人);3—任務(wù)完成數(shù)多,章節(jié)測試分低(3148人);4—任務(wù)完成數(shù)多,章節(jié)測試分高(12350人)。
根據(jù)視頻觀看時長可分為4類: 1—觀看時間短,章節(jié)測試分?jǐn)?shù)低(29999人);2—觀看時間短,章節(jié)測試分?jǐn)?shù)高(8086人);3—觀看時間長,章節(jié)測試分?jǐn)?shù)低(4561人);4—觀看時間長,章節(jié)測驗(yàn)分?jǐn)?shù)高(9990人)。
任務(wù)點(diǎn)完成數(shù)較少的學(xué)生,普遍測驗(yàn)成績都偏低,完成數(shù)較多的學(xué)生,普遍測驗(yàn)成績都偏高;視頻觀看時長短的學(xué)生,普遍測驗(yàn)成績都偏低,視頻觀看時長長的學(xué)生,普遍測驗(yàn)成績偏高。
根據(jù)上圖可知:任務(wù)點(diǎn)完成數(shù)<27的學(xué)生,其章節(jié)平均分為13.66、>=27的學(xué)生,其平均分為69.77。觀看時長<214的學(xué)生,其章節(jié)平均分為18.47、>=214的學(xué)生,其平均分為60.84。
由此得出結(jié)論:學(xué)生任務(wù)點(diǎn)(視頻)的完成情況對于章節(jié)測驗(yàn)的影響較大,普遍存在學(xué)生任務(wù)點(diǎn)(視頻)完成情況越好,章節(jié)測驗(yàn)的平均成績越高,反之則越低。任課老師需要更加注重學(xué)生平時任務(wù)點(diǎn)(視頻)的學(xué)習(xí)情況,設(shè)定一些考核,除了能夠更好地督促學(xué)生的學(xué)習(xí),也能夠讓學(xué)生的學(xué)習(xí)質(zhì)量得到很大程度上的提升。
4.2不同作業(yè)平均分下學(xué)生的章節(jié)測驗(yàn)畫像
4.2.1統(tǒng)計指標(biāo)計算
根據(jù)圖5可知:作業(yè)平均分的均值為58.8。根據(jù)均值進(jìn)行劃分,作業(yè)平均分:>=60,<60。
4.2.2數(shù)據(jù)可視化展示
由圖6可知:作業(yè)平均分>=60的學(xué)生有32606人,占比61.95%;<60的學(xué)生有20030人,占比38.05%。
由圖7可知:根據(jù)作業(yè)平均分可分類4類:作業(yè)平均分低,章節(jié)測試成績低——13447人;作業(yè)平均分低,章節(jié)測試成績高——6583人;作業(yè)平均分高,章節(jié)測試成績低——21113人;作業(yè)平均分高,章節(jié)測試成績高——11493人。作業(yè)平均分低的學(xué)生普遍章節(jié)測驗(yàn)成績低,作業(yè)平均分高的學(xué)生普遍章節(jié)測驗(yàn)成績也比較低,說明可能存在平時作業(yè)抄襲或者使用同組作業(yè)上交的情況,或者老師作業(yè)打分標(biāo)準(zhǔn)比較寬松,給分較高。
由圖8可知:作業(yè)平均分<60的學(xué)生章節(jié)測驗(yàn)平均分為29.52;>=60的學(xué)生章節(jié)測驗(yàn)平均分為30.59。
由此可以得出如下結(jié)論:作業(yè)平均分的高低對于章節(jié)測驗(yàn)分?jǐn)?shù)的高低影響不大。存在普遍的作業(yè)平均分高但章節(jié)測驗(yàn)分?jǐn)?shù)低的情況,任課老師應(yīng)要提高對學(xué)生作業(yè)質(zhì)量的要求、作業(yè)打分的標(biāo)準(zhǔn)以及加強(qiáng)對學(xué)生作業(yè)的監(jiān)管,減少抄襲以及渾水摸魚的情況,使得學(xué)生能夠更好地對所學(xué)知識進(jìn)行運(yùn)用,老師也能夠從中確切的了解學(xué)生的學(xué)習(xí)情況,更有針對性地進(jìn)行教學(xué),從而取得更好的成績。
4.3不同任務(wù)點(diǎn)學(xué)習(xí)情況下學(xué)生章節(jié)測驗(yàn)平均分畫像
數(shù)據(jù)分析目的:針對線上平臺的學(xué)習(xí)數(shù)據(jù)對學(xué)生網(wǎng)絡(luò)學(xué)習(xí)的狀況進(jìn)行分析,目的在于調(diào)查網(wǎng)絡(luò)學(xué)習(xí)的教學(xué)方法是否能夠幫助到學(xué)生的學(xué)習(xí),同時為教學(xué)方法的不斷完善和改進(jìn)提供一定的思路。
數(shù)據(jù)分析方法:主要采用聚類分析的方法對不同的網(wǎng)絡(luò)測評成績下學(xué)生網(wǎng)絡(luò)學(xué)習(xí)狀況進(jìn)行分析,從而幫助校方在不清楚數(shù)據(jù)屬性等的前提下對數(shù)據(jù)進(jìn)行整理、歸類,最后根據(jù)數(shù)據(jù)整理出的學(xué)生網(wǎng)絡(luò)測評特征等分出網(wǎng)絡(luò)學(xué)習(xí)狀況好和差的學(xué)生。
使用的特征變量:考試平均分:教師在網(wǎng)絡(luò)在線上使用考試的平均分,但是使用次數(shù)較少;章節(jié)測驗(yàn)平均分:教師在網(wǎng)絡(luò)在線上使用測驗(yàn)的平均分,使用次數(shù)較少;作業(yè)平均分:各課教師在網(wǎng)絡(luò)在線上所布置的作業(yè)的平均分。
使用分析工具:Spss modeler、dycharts。
4.3.1分析過程
如圖9所示,從總體上來看萬羅測驗(yàn)中考試和章節(jié)測驗(yàn)都有超過一半多,而作業(yè)為0分的則是將近有1/4,由此可以看出有2種情況:1、教師布置,而學(xué)生未完成;2、教師未使用考試、測驗(yàn)的方式進(jìn)行網(wǎng)絡(luò)測驗(yàn)。針對情況2的原因可能是網(wǎng)絡(luò)測驗(yàn)其測驗(yàn)的真實(shí)性無法保證;網(wǎng)絡(luò)測試時間等不好協(xié)調(diào);教師不太擅長使用網(wǎng)絡(luò)教學(xué)的方式發(fā)布測評任務(wù)。
如圖10所示,從分析預(yù)測的3個變量中我們可以看出其重要性3個變量都達(dá)到了100%,因此說明在對網(wǎng)絡(luò)學(xué)習(xí)狀況測評的聚類中,三個變量分?jǐn)?shù)都對該聚類產(chǎn)生重要影響,而整個聚類的模型分為2個類別,其輪廓系數(shù)達(dá)到0.7,其聚類效果好。
從圖11可以看出,從聚類的大小和聚類的人數(shù)來看,可以看出聚類1與聚類2兩者相差10%左右,聚類1略小于聚類2。
從圖12可以看出:
聚類1:考試平均成績?yōu)?7,且大部分?jǐn)?shù)據(jù)較高水平,在章節(jié)測驗(yàn)成績上平均分?jǐn)?shù)為45.5分,其數(shù)據(jù)大部分屬于中等,而在作業(yè)平均分上則是69.9分左右,且數(shù)值偏低。學(xué)生的網(wǎng)絡(luò)測驗(yàn)成績與總體相比較,其考試平均分明顯高于總體水平,章節(jié)測驗(yàn)平均分略與總體相比其差距更大且中位數(shù)高于總體,其作業(yè)的平均分中位數(shù)與總體中位數(shù)相比,略高于總體且數(shù)據(jù)更向高分集中。
聚類2:考試平均成績幾乎為0,且大部分?jǐn)?shù)據(jù)較低水平,在章節(jié)測驗(yàn)成績上平均分?jǐn)?shù)為18分,其數(shù)據(jù)大部分屬于低分,少部分高分,而在作業(yè)平均分上則是50分左右,且數(shù)值偏高。其考試平均分、章節(jié)測驗(yàn)平均分的中位數(shù)與總體中位數(shù)相比都屬于非常低,而作業(yè)平均分與總體相比略低于總體的中位數(shù)。
4.3.2聚類結(jié)果
聚類一,網(wǎng)絡(luò)學(xué)習(xí)狀況好(44.76%),其特點(diǎn)如圖13所示;聚類二,網(wǎng)絡(luò)學(xué)習(xí)狀況差(55.24%)其特點(diǎn)如14所示。
總體上來看,網(wǎng)絡(luò)學(xué)習(xí)狀況差的學(xué)生略高于網(wǎng)絡(luò)學(xué)習(xí)狀況較好的學(xué)生,因此在大部分課程上要提高其網(wǎng)絡(luò)在線學(xué)習(xí)平臺的利用率,以及完善網(wǎng)絡(luò)測評的環(huán)境以便能夠更好地進(jìn)行網(wǎng)絡(luò)測驗(yàn)。
5 結(jié)論及建議
視頻觀看時長和作業(yè)、章節(jié)測驗(yàn)、考試成績成正比。根據(jù)學(xué)生在線學(xué)習(xí)的數(shù)據(jù)可視化展示走向,各類型成績平均分和視頻觀看時長走向近乎一致。可以表明,視頻觀看時長對成績的影響較大,平時占比建議對學(xué)生視頻觀看時長嚴(yán)格要求,可以起到提升學(xué)生成績的作用。
參考文獻(xiàn):
[1] 馮廣,何雅萱,賀敏慧.基于校園大數(shù)據(jù)的學(xué)生畫像系統(tǒng)應(yīng)用研究[J].軟件,2020,41(8):40-42.
[2] 嚴(yán)正宇.用“大數(shù)據(jù)+微服務(wù)”構(gòu)建學(xué)生綜合畫像[J].信息系統(tǒng)工程,2019(12):105-106.
[3] 黃山.學(xué)生畫像技術(shù)在高校學(xué)生事務(wù)精準(zhǔn)管理的運(yùn)用[J].科學(xué)咨詢(教育科研),2019(12):37.
[4] 王堅,張媛媛,柴艷妹.基于因子分析和聚類分析的學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為研究[J].中國教育技術(shù)裝備,2019(18):3-5.
[5] 趙建偉,彭成圓.教育大數(shù)據(jù)背景下大學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為實(shí)證研究[J].當(dāng)代教育實(shí)踐與教學(xué)研究,2019(15):34-35.
[6] 程澤凱,佘星星,謝寧宇.網(wǎng)絡(luò)教學(xué)平臺學(xué)生學(xué)習(xí)數(shù)據(jù)分析[J].常州工學(xué)院學(xué)報,2019,32(2):77-80.
[7] 張海華.基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)的大學(xué)生選課推薦模型研究[J].信息系統(tǒng)工程,2019(4):105-106.
[8] 吳林靜,勞傳媛,劉清堂,等.網(wǎng)絡(luò)學(xué)習(xí)空間中的在線學(xué)習(xí)行為分析模型及應(yīng)用研究[J].現(xiàn)代教育技術(shù),2018,28(6):46-53.
[9] 張海華,郭田友,張非.基于校園大數(shù)據(jù)構(gòu)建大學(xué)生畫像的技術(shù)實(shí)現(xiàn)[J].電子技術(shù)與軟件工程,2019(3):152-153.
[10] 李光耀,宋文廣,謝艷晴.智慧校園學(xué)生畫像方法研究[J].現(xiàn)代電子技術(shù),2018,41(12):161-163,167.
【通聯(lián)編輯:王力】