999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學生在線學習行為分類融合方法的研究與應用

2022-12-02 06:12:14李菲曹陽顧問
電腦與電信 2022年8期
關鍵詞:特征評價模型

李菲 曹陽 顧問

(三江學院計算機科學與工程學院,江蘇 南京 210012)

1 引言

學生學習成績預測一直是教育界研究的熱點,尤其在當前疫情期間,居家學習和在線教學成為常態,如何有效利用信息技術,加強學生學習效果識別和預測,是教育領域的難點和重點。學生成績預測幫助老師及時調整教學方法、監督和提醒學生,從而提高學生的最終學習成績。

在線教學借助中國大學慕課MOOC、超星、騰訊課堂等平臺,使用騰訊會議、QQ教室等工具,相比傳統教學,形式更靈活、學生學習行為更多樣化,這對教師的教學方法提出更高要求。劉茜萍等[1]在疫情期間,根據課程特點,綜合應用多種不同的教學平臺設計互動教學方案,提高教學質量。陳逸菲等[2]利用SPOC課程教學的學習行為數據,從中找到對成績影響最大的學習行為,實現數據驅動的混合式教學方式。除了改進教學方法外,機器學習方法、神經網絡技術也應用在線教學數據分析中,幫助預測學習成績,提升學習效果。鄧天平等[3]采用聚類技術,結合慕課堂線上學習數據和線下考試成績,對學生進行聚類并分析各學習行為和成績之間的相關性。郎波等[4]根據學習平臺上的日常學習數據,選取影響因子,采用BP神經網絡和遺傳算法,對學生成績進行預測。曹洪江等[5]分析學生歷史成績的時序性,結合學習過程的遺忘特點,引入LSTM網絡進行建模,成績預測取得了較好的準確性。另外,考慮學生對課程的主觀情感因素,葉俊民等[6]針對學習社區的短文本情感特征,訓練深度學習模型。以上研究方法大多采用單一的神經網絡模型,即輸入學生的知識結構和學習情感,沒有從線上教學實際出發,考慮學生學習行為的多樣性,因此本文分析學生在線學習的行為特點,提出融合LSTM網絡和感知機MLP的預測模型:

(1)根據學生在線學習的周期特點,將學習特征分為每周學習特征和整學期學習特征兩大類;

(2)對每周學習特征,使用長短期記憶神經網絡建模,模擬學生周期性學習過程,對整學期學習特征,采用MLP網絡建模;

(3)將LSTM網絡和MLP網絡融合,完成學生成績預測。

2 融合模型

學生學習成績預測,通常使用學習過程中學生的若干行為特征,構建合適的學習模型。學習成績預測模型可以用數學符號表示如下:

(1)學生課程成績按照5個等級記錄,分別為優秀、良好、一般、及格和較差,記為y∈[0,1,2,3,4],y(i)=3表示第i個學生的成績及格。

(2)學生每周學習行為,記為Pikj∈Rq,k∈{1,…,k},k代表一個學期的學習周數,q代表每周的學生行為數據的維度[7],例如學生Si在k周(共16周)產生的學習行為特征序列為Pi=[Pi1,Pi2,…,Pik]。學生的每周學習行為有明顯時序特點,可通過長短期記憶時間網絡LSTM訓練。

(3)學生學期學習行為,記為E=[ec,ez,eg,ep],ec為單元測驗成績、ez為單元作業成績、eg為結課成績、ep為課程評價。

對學生學習效果進行預測,整個過程由采集學生學習數據、提取學習行為特征、構建學習模型和模型效果評價。(1)從中國大學MOOC平臺、騰訊會議收集學生在線學習數據;(2)提取每周學習行為和學期整體學習行為,并進行數據優化和清理;(3)對每周學習行為建立LSTM模型,并融合學期整體學習特征,構建學習效果預測模型;(4)通過常見的性能評價指標對預測模型進行評價。預測模型框架及處理流程如圖1所示。

圖1 預測模型框架

2.1 數據源信息采集

課題數據來源于三江學院計算機學院軟件工程專業和計算機科學技術450名學生在軟件測試課程的學習數據,每個學生數據分別從中國大學慕課MOOC在線開放課程、慕課堂、騰訊會議記錄中獲取,并結合線下學習情況:(1)在線開放課程記錄包括單元測驗、單元作業、結課成績、討論區發言個數、獲贊數、課程評價;(2)慕課堂記錄包括考勤、點名、隨堂練習成績、討論次數、優秀發言次數、視頻觀看次數、視頻觀看個數、視頻觀看時長;(3)騰訊會議學習記錄包括入會情況、課堂表現,課堂表現可認為是線上課程的學習積極性,在實際教學中設置為“網課活躍度”行為特征,以量化學生線上學習參與程度。授課教師采用騰訊會議的投票功能,投票主題為知識點問題,學生對各選項進行投票選擇,實踐表明線上教學中學生不會主動參與話題討論,但大部分學生能積極投票,因此網課活躍度反映學生的參與程度,學生每參與一次投票活動,增加一個網課活躍度;(4)線下學習主要數據為期末考試成績和實驗成績,期末考試成績作為預測目標數據。

利用這些學習記錄,從線上線下多個維度綜合體現學生的學習情況,反應學生的主動學習態度和實際知識掌握程度,是學習成績預測的主要依據。

2.2 數據處理及歸類

學生學習數據采集后需要進行分析,處理學習記錄中缺失、重復的異常情況,對學生的課程評價完成情感分析,具體操作如下:

(1)部分學生的學習記錄有缺失。個別學生沒有加入學校在線開放課程,單元測驗和單元考試學習記錄為空,只有慕課堂記錄和線下成績。對這部分學生的缺失數據以0計算。

(2)部分學生的學習記錄有重復。有部分學生使用多個賬號登錄學習,產生多組學習數據,例如學生使用微信掃碼登錄慕課堂,使用認證賬號登錄在線開放課程,因此有兩組數據,需要教師手工合并為同一組數據。

(3)學生課程評價情感分析。學生對課程評價屬于主觀感受,且非實名評論,因此對這部分數據要進行處理:首先學生評價時采用昵稱,教師從后臺數據庫關聯學生學號姓名;其次,并非所有學生都給出評價,參與評價的學生約占總人數的2/3;另外還存在一些無效評價、重復評價;最后,有的學生評價比較隱晦,沒有明確表達自己對課程的情感。綜上,我們在刪除重復和無效評價基礎上,采用自然語言處理技術,對學生評價短文本處理,獲取學生的課程情感,設定為中立、消極、積極三個等級。

學生課程評價,采用SnowNLP進行情感分析。Snow NLP是使用Python編寫的開源情感分析程序,其本質是貝葉斯分類[8],通過pip3 install snownlp安裝,該庫計算語句情感sentiments,分值范圍為0~1,分值越高表示其越正向,我們設定sentiments>0.5為積極,=0.5為中立,<0.5為消極。

SnowNLP來源于電商評價,泛化能力存在一定局限性,因此我們結合結巴分詞,使用textrank關鍵詞提取,強化分詞,以提高情感評價準確性[9]。例如有學生評價:“雖然我學的不是軟件專業,但是這門課還是教會了我很多東西”。SnowNLP評價sentiments值為0.61,判斷為積極情感,但通過結巴分詞textrank后,sentiments為0.73,進一步加強了情感導向。

學生原始數據處理后,根據學習數據特點,將這些數據按時間維度分為每周學習記錄、學期整體記錄兩大類,如慕課堂中每周簽到、隨堂練習記錄歸為周數據,一學期軟件測試課程教學周期為16周,因此每個學生有16次周數據。分類后的學生學習行為特征如下:

表1 學期整體學習行為特征

表2 每周學習行為特征

學生數據經過清洗處理后,還需要根據特征類型進行優化處理,針對標簽類型的學習特征,采用one-hot編碼,將標簽分類轉換為啞變量(Dummy Variable);針對數字類型的學習特征,采用歸一化處理,通過最小-最大標準化映射到[0,1]區間,公式如下:

2.3 建模

當前在學生學習領域的研究,往往使用獨立輸入的神經網絡模型[5,6,10],即網絡只有一個輸入和一個輸出,而且網絡是層的線性堆疊。學生學習成績預測問題,包含多維度學習行為特征,網絡模型需要多模態輸入,使用不同類型的神經層處理不同類型的數據。雖然可以訓練多個獨立的模型,對預測值做加權平均,但因為模型提取的信息存在冗余,因此針對本課題的實際情況,構建一個具有多輸入分支的網絡模型,學生周學習數據采用LSTM網絡,學生學期學習數據采用MLP網絡,用一個可以組合多個張量的層將這兩個不同的輸入分支合并。整個模型的結構如圖2所示。

圖2 學生學習成績預測融合模型結構

(1)學生每周學習情況具有時序特點,每周學習情況動態反映了學生的學習效果,對后續學習產生影響。LSTM能夠學習長期依賴關系,建立遠距離因果聯系,因此適合學生周期學習特征,輸入學生的時序數據,輸出具有代表性的行為特征,體現學生在不同時刻的學習狀態。

在LSTM網絡中,用門的開關程度來決定對哪些信息進行讀寫或清除,有遺忘門、更新門、輸入門。LSTM通過遺忘門的Sigmoid激活函數實現遺忘不重要的信息,例如學生第一周的部分學習內容對第二周的學習幫助不大,因此學生在第二周的學習會丟棄這部分內容。遺忘門公式為:

LSTM通過輸入門將有用的新信息加入到記憶單元,計算公式為:

LSTM的輸出門,從當前狀態中選擇重要的信息作為輸出,輸出門ot(s)得到當前時間步的學生學習狀態,即輸出ht(s),計算公式為:

以上公式中W是權值矩陣,B是偏置,?表示點積。

(2)學生的學期學習特征,由單元測驗成績、單元作業成績、開放課程結課考試成績、學生課程評價情感4個特征組成,代表學生在該學期中的整體表現,設定為MLP網絡,作為學生評價模型的另一個輸入,和每周學習的LSTM模型實現融合。

把學期整體情況的輸出端和每周學習情況的輸出端合并起來,采用keras自帶的concatenate函數,形成融合模型的輸入,再接上一個全連接層,完成整個模型構建。全連接層采用激活函數ReLu,模型優化器為rmsprop,損失函數為categorical_crossentropy,迭代次數Epoch為500輪,輸出層采用softmax預測學生最終成績等級。

3 實驗結果與分析

實驗數據集為2.2節處理后的學生課程數據,評估指標采用精確率(Precision)、召回率(Recall)、F值(F1-Score)進行模型分類預測性度量。精確率是模型正確分類的正例樣本數與總的正例樣本總數的比值;召回率是模型正確分類的正例樣本數與分類正確的樣本總數的比值;F1值是準確率與召回率的調和平均,綜合體現精確率和召回率,F1值越高,分類效果越好。

其中,TP表示學生標簽為正例,被分類為正例;FN表示學生標簽為正例,被分類為反例;FP表示學生標簽為反例,被分類為正例;TN表示學生標簽為反例,被分類為反例。

為了展示本文模型的整體性能,將本文提出的融合網絡和支持向量機SVM、邏輯回歸LR、多層感知機MLP進行對比實驗。實驗結果如表3所示。

表3 實驗對比結果

從表3的實驗結果可見,LSTM+MLP融合的網絡模型,在精確率、召回率和F值上取得最優值。對比實驗中其他算法預測準確率不高的原因,分析可能對所有的特征信息進行隨機分類訓練,在訓練時沒有區別性對待各屬性特征對學生成績的重要程度,LSTM捕獲了學生的序列信息,考慮每周的行為信息,加強了重要屬性特征提取,結合學期學習行為,大大提高了模型的預測分類效果。

4 結語

本文針對在線教學現狀,提出了一種LSTM和MLP融合的學生成績預測方法,將學生學習數據分為周期性和整學期兩種類型,周學習數據采用LSTM網絡建模,學期數據采用MLP建模,這兩種模型融合使得預測能力更強,有效提高學生成績分類的準確性。在本校軟件測試課程上進行實驗,實驗結果表明,本文提出的融合模型取得較好的預測效果。未來的工作主要對學生學習行為之間的關系、學習行為與最終課程成績之間的關系采用更先進的神經網絡表達,著重分析各類關系及關系權重,提高預測結果,準確反應學生的主動學習態度和實際知識掌握程度。

猜你喜歡
特征評價模型
一半模型
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
基于Moodle的學習評價
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 不卡的在线视频免费观看| 伊人久久精品亚洲午夜| 91精品啪在线观看国产60岁| 国产精品久久久久久搜索 | 狠狠亚洲五月天| 不卡无码网| 欧美激情,国产精品| 国产av色站网站| 青青久久91| 日本高清免费不卡视频| 美女被躁出白浆视频播放| 亚洲日韩Av中文字幕无码| 国产一区二区三区夜色| 永久成人无码激情视频免费| 午夜毛片福利| 久久99热这里只有精品免费看| a网站在线观看| 伊人中文网| 国产乱子伦无码精品小说| 亚洲精品制服丝袜二区| 亚洲国产在一区二区三区| 手机精品福利在线观看| 免费不卡视频| 欧美成人亚洲综合精品欧美激情 | 亚洲综合极品香蕉久久网| 欧美日韩精品一区二区视频| 亚洲—日韩aV在线| 午夜丁香婷婷| 精品视频福利| 亚洲AV无码一区二区三区牲色| 久久五月天国产自| 亚洲天堂啪啪| 国产69囗曝护士吞精在线视频| 国产传媒一区二区三区四区五区| 国产微拍一区| 国产人人射| 欧美精品亚洲二区| 区国产精品搜索视频| 久久a级片| 免费人成视网站在线不卡| 久久国产精品国产自线拍| 免费看a级毛片| 毛片网站观看| 青青网在线国产| 在线毛片网站| www精品久久| 久久五月视频| 91久久青青草原精品国产| 亚洲日韩Av中文字幕无码 | 欧美午夜在线观看| 香蕉色综合| 真人高潮娇喘嗯啊在线观看| 精品一区二区三区自慰喷水| 全午夜免费一级毛片| 尤物特级无码毛片免费| 72种姿势欧美久久久大黄蕉| 亚洲精品另类| 第九色区aⅴ天堂久久香| 91在线视频福利| 啦啦啦网站在线观看a毛片| 亚洲欧洲综合| 亚洲人成在线精品| 亚洲Av综合日韩精品久久久| 国产网站免费看| 成人字幕网视频在线观看| 91视频日本| 国产欧美日韩另类| 免费精品一区二区h| 亚洲国产第一区二区香蕉| 亚洲精品第一在线观看视频| 亚洲床戏一区| 国产成人免费手机在线观看视频| 国产成人AV综合久久| 久久亚洲中文字幕精品一区| 欧美日韩在线第一页| 欧美激情综合| 欧美在线国产| 国产手机在线小视频免费观看| 另类欧美日韩| 国产精品美女免费视频大全| 国模沟沟一区二区三区| 免费看a级毛片|