林龍 沈海青
摘 要:學(xué)生在在線學(xué)習(xí)平臺(tái)上的學(xué)習(xí)表現(xiàn)數(shù)據(jù)類型較多,不能從單一角度對(duì)學(xué)生學(xué)習(xí)狀況進(jìn)行評(píng)價(jià)監(jiān)測,需要綜合多維度評(píng)價(jià)學(xué)生的學(xué)習(xí)狀況,從而給出相對(duì)全面客觀的學(xué)習(xí)表現(xiàn)評(píng)價(jià)。建立基于SVDD算法的監(jiān)測模型,將直播觀看時(shí)長、作業(yè)完成狀況、課堂參與互動(dòng)次數(shù)、出勤率等多維數(shù)據(jù)作為考量指標(biāo),對(duì)所有數(shù)據(jù)進(jìn)行PCA分析,通過SVDD算法進(jìn)行學(xué)習(xí)行為和效果異常監(jiān)測,從而實(shí)現(xiàn)表現(xiàn)異常學(xué)生的學(xué)業(yè)預(yù)警。
關(guān)鍵詞:SVDD算法 學(xué)業(yè)預(yù)警 大數(shù)據(jù) 線上教育
Construction and Research of Early Academic Warning Monitoring Model based on SVDD Algorithm[
Lin Long,Shen Haiqing
Abstract:There are many types of students' learning performance data on online learning platforms, and it is not possible to evaluate and monitor students' learning status from a single perspective. It is necessary to comprehensively evaluate students' learning status from multiple dimensions to give a relatively comprehensive and objective learning performance evaluation. The paper establishes a monitoring model based on the SVDD algorithm, which takes multidimensional data such as live viewing time, homework completion status, classroom participation and interactions, and attendance rate as consideration indicators, and performs PCA analysis on all data, and monitors learning behavior and effect abnormalities through SVDD algorithm so as to realize the academic warning of abnormal students.
Key words:SVDD algorithm, academic warning, big data, online education
在信息化浪潮沖擊下,教育與信息技術(shù)走向深度融合,在線教育大規(guī)模興起。與此同時(shí),大數(shù)據(jù)(big data)理論與方法被逐步應(yīng)用到教育領(lǐng)域,學(xué)習(xí)分析、數(shù)據(jù)挖掘等分析方法為在線學(xué)習(xí)過程、學(xué)習(xí)效果等提供了有效分析手段[1]。
尤其在疫情期間,教學(xué)方式發(fā)了翻天覆地的變革,所有課堂被迫從線下搬到線上,教師從現(xiàn)場授課化身網(wǎng)絡(luò)主播,學(xué)生從教室學(xué)習(xí)變成打開手機(jī)等移動(dòng)端屏幕學(xué)習(xí)。信息技術(shù)已經(jīng)全面融入教師教學(xué)和學(xué)生管理的日常。
每個(gè)學(xué)生在學(xué)習(xí)過程中的行為數(shù)據(jù)和學(xué)習(xí)效果數(shù)據(jù)通過網(wǎng)絡(luò)教育技術(shù)被完整的記錄保存下來,這些信息組成了學(xué)生的學(xué)業(yè)表現(xiàn)。每個(gè)學(xué)生的個(gè)性不同,網(wǎng)絡(luò)課堂的參與度、學(xué)習(xí)表現(xiàn)也不盡相同,對(duì)于學(xué)生的評(píng)價(jià)數(shù)據(jù)往往是立體多維度的,各個(gè)學(xué)生的維度長短板也不太,如何實(shí)現(xiàn)網(wǎng)課表現(xiàn)異常學(xué)生的學(xué)習(xí)行為綜合評(píng)價(jià)和監(jiān)測,是現(xiàn)階段的教育數(shù)據(jù)挖掘和學(xué)習(xí)分析存在的一大難點(diǎn)。王常青[2]提出基于數(shù)據(jù)驅(qū)動(dòng)的學(xué)情分析預(yù)警機(jī)制研究與實(shí)踐,但其數(shù)據(jù)分析需要人工進(jìn)行,較為繁瑣;于繁華等人[3]提出基于離群檢測的教學(xué)預(yù)警模型,通過規(guī)則檢測與離群檢測建立了交互式教學(xué)系統(tǒng)中的預(yù)警模型,實(shí)現(xiàn)了基于學(xué)習(xí)行為分析的自動(dòng)干預(yù)和主動(dòng)干預(yù)。廖鵬等[4]構(gòu)建了一個(gè)檢測、統(tǒng)計(jì)學(xué)生課堂異常行為的輔助教學(xué)管理系統(tǒng),通過基于VGG預(yù)訓(xùn)練網(wǎng)絡(luò)模型遷移學(xué)習(xí),來提取學(xué)生課堂異常行為特征,實(shí)現(xiàn)對(duì)玩手機(jī)、睡覺等異常行為的檢測分析。湖北第二師范學(xué)院楊鶴等人[5]發(fā)明一種異常網(wǎng)絡(luò)學(xué)習(xí)行為的方法,對(duì)網(wǎng)絡(luò)學(xué)習(xí)行為進(jìn)行采樣,計(jì)算不同學(xué)習(xí)行為的變化作為危險(xiǎn)信號(hào),構(gòu)造人工抗原提呈細(xì)胞對(duì)多種學(xué)習(xí)行為的變化進(jìn)行融合,檢測學(xué)習(xí)行為的異常。陳彥釗等[6]基于深度學(xué)習(xí)技術(shù)建立了大學(xué)生課堂行為分析模型,并構(gòu)建了大學(xué)生課堂行為分析系統(tǒng),實(shí)現(xiàn)了課堂考勤和課堂專注度分析。
本文基于機(jī)器學(xué)習(xí)的支持向量描述(SVDD)算法,綜合網(wǎng)課平臺(tái)的多維度評(píng)價(jià)數(shù)據(jù),構(gòu)建學(xué)習(xí)表現(xiàn)模型,對(duì)異常表現(xiàn)的學(xué)生進(jìn)行監(jiān)測分析,從而實(shí)現(xiàn)學(xué)業(yè)表現(xiàn)異常學(xué)生的及時(shí)預(yù)警。
1 指標(biāo)構(gòu)建及數(shù)據(jù)采集
基于釘釘直播平臺(tái)進(jìn)行教學(xué),基于藍(lán)墨云平臺(tái)進(jìn)行學(xué)習(xí)行為數(shù)據(jù)監(jiān)測及收集。利用因子分析方法構(gòu)建多維度學(xué)習(xí)表現(xiàn)監(jiān)測模型,具體包括學(xué)習(xí)行為指標(biāo)和學(xué)習(xí)效果指標(biāo)。按照線上和線下完成時(shí)間為界限,進(jìn)行劃分,構(gòu)建指標(biāo)并設(shè)置權(quán)重如下表1。
以《汽車售后服務(wù)接待》課程為例,收集該課程網(wǎng)課教學(xué)過程中8個(gè)教學(xué)項(xiàng)目的學(xué)生學(xué)習(xí)行為和學(xué)習(xí)效果數(shù)據(jù),學(xué)習(xí)行為數(shù)據(jù)包括:釘釘直播觀看時(shí)長、藍(lán)墨云課堂參與互動(dòng)次數(shù)、出勤率。學(xué)習(xí)效果數(shù)據(jù)包括:藍(lán)墨云作業(yè)完成次數(shù)、作業(yè)完成分?jǐn)?shù)。每個(gè)學(xué)生可形成5個(gè)維度的學(xué)業(yè)模型數(shù)據(jù)。下表1為售后服務(wù)課程里篩選的5位學(xué)生的學(xué)習(xí)行為數(shù)據(jù),該數(shù)據(jù)從藍(lán)墨云和釘釘上導(dǎo)出獲取并進(jìn)行了簡單的處理。其中學(xué)習(xí)行為和結(jié)果數(shù)據(jù)正常的用綠色標(biāo)記,與正常偏離較大通過紅色進(jìn)行標(biāo)記。由表1可知,一方面,對(duì)各個(gè)指標(biāo)進(jìn)行分析,發(fā)現(xiàn)統(tǒng)計(jì)的五類指標(biāo)存在關(guān)聯(lián)和冗余,需要通過PCA提取主成分進(jìn)行分析。例如,出勤率和直播觀看時(shí)間是成正相關(guān)的,基本上出勤率100%的學(xué)生其直播觀看時(shí)長也達(dá)標(biāo),少數(shù)學(xué)生存在看了直播沒簽到的現(xiàn)象,分析原因,這部分學(xué)生可能存在掛線播放,人離開或者開小差的情況,需要進(jìn)行提醒;作業(yè)參與次數(shù)和成績總分也成正相關(guān),特殊情況是參與次數(shù)多但是成績總分低的學(xué)生,這種現(xiàn)象說明學(xué)生存在有積極性但是知識(shí)點(diǎn)掌握不好,或者應(yīng)付答題情況。另一方面,對(duì)表現(xiàn)情況進(jìn)行分析,對(duì)于表現(xiàn)優(yōu)秀的學(xué)生其各類狀態(tài)指標(biāo)數(shù)據(jù)均較好,而表現(xiàn)良好的學(xué)生主要是其中某個(gè)數(shù)據(jù)指標(biāo)不夠理想,而對(duì)于表現(xiàn)一般的學(xué)生存在1-2項(xiàng)的數(shù)據(jù)指標(biāo)未達(dá)標(biāo)準(zhǔn),表現(xiàn)較差的學(xué)生其大部分的數(shù)據(jù)指標(biāo)均較差,而表現(xiàn)異常的學(xué)生則各項(xiàng)指標(biāo)均與正常偏離較大,因此需要對(duì)這類學(xué)生進(jìn)行重點(diǎn)關(guān)注和預(yù)警。
2 基于SVDD算法的學(xué)習(xí)狀態(tài)異常監(jiān)測模型構(gòu)建
2.1 數(shù)據(jù)預(yù)處理
學(xué)習(xí)行為和學(xué)習(xí)效果數(shù)據(jù)屬性不同,需要對(duì)各個(gè)指標(biāo)維度類別的數(shù)據(jù)進(jìn)行統(tǒng)一度量,因此,對(duì)采集的大數(shù)據(jù)進(jìn)行歸一化處理。為了數(shù)據(jù)處理方便,歸一化時(shí)把數(shù)據(jù)映射到0~1范圍之內(nèi)處理。
本文采用的歸一化方法通過遍歷feature vector里的每一個(gè)數(shù)據(jù),將Max和Min的記錄下來,并通過Max-Min作為基數(shù)(即Min=0,Max=1)進(jìn)行數(shù)據(jù)的歸一化處理:
2.2 支持向量描述算法
支持向量描述(SVDD)是一種單分類器,常用于數(shù)據(jù)的離群或者野值點(diǎn)檢測。支持向量描述的基本思想是可以找出一個(gè)超球體來描述給定的目標(biāo)數(shù)據(jù)集{xi,i=1,2,…,N},該超球可以以最小的半徑包含所有的目標(biāo)數(shù)據(jù)。落在超球面上的數(shù)據(jù)點(diǎn)就稱為支撐向量。
由于這種描述方法對(duì)目標(biāo)數(shù)據(jù)集中偏離大部分?jǐn)?shù)據(jù)較遠(yuǎn)的野值點(diǎn)比較敏感,這些點(diǎn)的存在可能使描述數(shù)據(jù)的球體過大,增加了異類點(diǎn)落入球內(nèi)的機(jī)會(huì),從而影響分類的效果。為此引入一個(gè)松弛變量ξi ,允許部分野點(diǎn)落在球外。根據(jù)以上思想,給出SVDD的目標(biāo)函數(shù):
R和a分別為最小超球的半徑和球心,P為懲罰參數(shù),起到控制對(duì)錯(cuò)分樣本懲罰程度的作用。ξi 為松弛因子,ξi≥0( ξi≥0 對(duì)應(yīng)位于超球體外部的非目標(biāo)類對(duì)象) 。
這是一個(gè)二次優(yōu)化問題,結(jié)合約束條件,構(gòu)造拉格朗日函數(shù),可以得到該優(yōu)化問題的對(duì)偶形式:
ai為拉格朗日乘子,l為樣本數(shù)。
通過引入核函數(shù)K(x,y),實(shí)現(xiàn)樣本從低維空間映射至高維空間,就可以將非線性問題轉(zhuǎn)化為線性問題。當(dāng)核函數(shù)滿足Mercer條件時(shí),它就對(duì)應(yīng)于某一變換空間的內(nèi)積[9]:K(x,y)=φ(x)Tφ(y),φ為核映射;核函數(shù)滿足:K(x,y)=exp{-//x-y//2/σ}。
引入核函數(shù)后,上述公式轉(zhuǎn)變?yōu)槿缦滦问剑?/p>
根據(jù)Kuhn-Tucker條件,可求解以上優(yōu)化問題得到ai的值。通過分析ai的大小來判斷樣本點(diǎn)的位置:當(dāng)0 計(jì)算球心至任意一個(gè)支持向量點(diǎn)的距離就能求得球體的半徑R。 對(duì)應(yīng)新來的樣本Z,如果滿足 則Z屬于目標(biāo)樣本,否則為非目標(biāo)樣本。 2.3 建立學(xué)習(xí)狀態(tài)異常監(jiān)測模型 基于SVDD算法,可以建立學(xué)習(xí)狀態(tài)離群監(jiān)測模型,如下圖1所示。首先收集學(xué)生的網(wǎng)課學(xué)習(xí)行為和效果數(shù)據(jù),然后進(jìn)行人工篩選,獲取一批表現(xiàn)良好的學(xué)生數(shù)據(jù),對(duì)多維度數(shù)據(jù)進(jìn)行PCA分析,將這些學(xué)生的數(shù)據(jù)作為已知訓(xùn)練集,在訓(xùn)練過程中得到處于SVDD超球邊界狀態(tài)下的支持向量數(shù)據(jù),以此即可建立基于學(xué)習(xí)表現(xiàn)良好的學(xué)生樣本的數(shù)據(jù)描述模型。此后,針對(duì)表現(xiàn)未知的學(xué)生數(shù)據(jù),可將其輸入學(xué)習(xí)狀態(tài)監(jiān)測模型進(jìn)行判定,當(dāng)其數(shù)據(jù)處于描述邊界內(nèi)時(shí),則判定為正常,當(dāng)其數(shù)據(jù)處于描述邊界外時(shí),則對(duì)其進(jìn)行學(xué)業(yè)預(yù)警,提醒班主任、任課老師、輔導(dǎo)員三方進(jìn)行干預(yù)跟蹤。 3 學(xué)業(yè)預(yù)警監(jiān)測實(shí)例分析 將上述方法運(yùn)用《汽車售后服務(wù)接待》課程中3個(gè)班級(jí)的學(xué)生的學(xué)習(xí)行為數(shù)據(jù)分析和然后對(duì)其中某個(gè)班級(jí)的學(xué)生學(xué)業(yè)表現(xiàn)進(jìn)行預(yù)測。首先根據(jù)歷史數(shù)據(jù),人為篩選出該門課程所有班級(jí)中表現(xiàn)中等以上的學(xué)生數(shù)據(jù),篩選的方法是將學(xué)生按照觀看時(shí)長、藍(lán)墨云課堂參與互動(dòng)次數(shù)、出勤率、作業(yè)完成次數(shù)、作業(yè)完成分?jǐn)?shù)進(jìn)行排序,統(tǒng)計(jì)出30人作為正常的測試數(shù)據(jù)集合。設(shè)置核函數(shù)中的參數(shù)σ=2.5,將這些學(xué)生的數(shù)據(jù)先進(jìn)行PCA降低維數(shù)至2維,進(jìn)行訓(xùn)練得到正常的超球模型,最后選擇其中一個(gè)班級(jí)中的6位未知學(xué)業(yè)表現(xiàn)的學(xué)生,將其數(shù)據(jù)導(dǎo)入進(jìn)行訓(xùn)練,得到結(jié)果如下圖所示。圖中標(biāo)有三角符號(hào)的為異常點(diǎn)(-5.6,0.03),查看其標(biāo)簽為34號(hào)學(xué)生,其網(wǎng)課數(shù)據(jù),見表3。 4 總結(jié) 學(xué)生在網(wǎng)課學(xué)習(xí)過程中積累的學(xué)習(xí)行為和學(xué)習(xí)效果數(shù)據(jù)維度較多,較難進(jìn)行人為判斷區(qū)分,根據(jù)SVDD 的單值分類特點(diǎn),利用大量已知的學(xué)習(xí)表現(xiàn)正常的學(xué)生行為數(shù)據(jù)構(gòu)建訓(xùn)練樣本集,則最小超球體邊界將包含大部分的正常樣本點(diǎn)。接著通過正常的描述邊界對(duì)未知學(xué)習(xí)狀態(tài)的數(shù)據(jù)樣本進(jìn)行預(yù)判斷,得出落在超球體之外的樣本,即偏離正常群體的學(xué)生學(xué)習(xí)數(shù)據(jù),然后針對(duì)異常數(shù)據(jù)進(jìn)行信息指標(biāo)分析判斷。因此本文所提方法可應(yīng)用于學(xué)習(xí)行為異常的學(xué)生學(xué)業(yè)預(yù)警監(jiān)測。 基金項(xiàng)目:2019年臺(tái)州市教育規(guī)劃課題“教育大數(shù)據(jù)整合理念下的學(xué)生學(xué)業(yè)表現(xiàn)模型研究”階段性成果(gg20054);2019年度校級(jí)高等教育教學(xué)改革研究項(xiàng)目(Tkyjg201920);2020年臺(tái)州科技職業(yè)學(xué)院基于“云班課”信息化教學(xué)課程項(xiàng)目(Tkbk2020047)。 參考文獻(xiàn): [1]宋平平,孫皓.基于大數(shù)據(jù)的在線學(xué)習(xí)監(jiān)測預(yù)警模型構(gòu)建研究[J].管理觀察,2018(32):108-109. [2]王常青,于欣. 基于數(shù)據(jù)驅(qū)動(dòng)的學(xué)情分析預(yù)警機(jī)制研究與實(shí)踐——以浙江大學(xué)寧波理工學(xué)院為例[J]. 現(xiàn)代職業(yè)教育, 2018(2):18-19. [3]于繁華,姚亦飛,逯啟榮.教育大數(shù)據(jù)下基于離群檢測的教學(xué)預(yù)警模型[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2018,36(04):459-464. [4]廖鵬,劉宸銘,蘇航,李啟芳,韓延巾.基于深度學(xué)習(xí)的學(xué)生課堂異常行為檢測與分析系統(tǒng)[J].電子世界,2018(08):97-98. [5]楊鶴,鄭幸.基于人工免疫危險(xiǎn)模式理論的異常學(xué)習(xí)行為發(fā)現(xiàn)方法[P]. 中國專利:CN105787555A,2016-07-20. [6]陳彥釗,朱雪穎,黃瑾,莊涵智,郭春婷,劉家浩.基于深度學(xué)習(xí)的大學(xué)生課堂行為分析系統(tǒng)研究[J].齊魯工業(yè)大學(xué)學(xué)報(bào),2020,34(01):13-18. [7]馬漢達(dá),劉相濤. 基于Bagging_BP算法的在線學(xué)習(xí)行為分析方法 [P]. 中國專利:CN110751289A,2020-02-04.