999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

在線教育考試成績(jī)預(yù)測(cè)與評(píng)估研究

2020-07-04 20:28:28徐洪峰
現(xiàn)代信息科技 2020年3期
關(guān)鍵詞:機(jī)器學(xué)習(xí)

摘? 要:研究機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)下的大數(shù)據(jù)與在線教育的預(yù)測(cè)和評(píng)估結(jié)果,對(duì)評(píng)估在線教育的學(xué)習(xí)效果和在線教育改革與發(fā)展具有重要的現(xiàn)實(shí)意義。以貴州某學(xué)院學(xué)生成績(jī)的數(shù)據(jù)為基礎(chǔ),通過對(duì)五種機(jī)器學(xué)習(xí)模型方法進(jìn)行比對(duì),驗(yàn)證了機(jī)器學(xué)習(xí)算法的準(zhǔn)確率與原有方法相比有較大的提升,促進(jìn)了在線教育學(xué)習(xí)效果的提高,有利于對(duì)學(xué)生的客觀評(píng)價(jià)和在線教育的發(fā)展。

關(guān)鍵詞:在線教育;機(jī)器學(xué)習(xí);成績(jī)預(yù)測(cè)

中圖分類號(hào):TP311.5;G434? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2020)03-0028-03

Abstract:It is of great practical significance to study the prediction and evaluation results of big data and online education under machine learning and neural network for evaluating the learning effect of online education and the reform and development of online education. In this paper,student performance of an adult education college in Guizhou is taken as the data. Through comparison of five machine learning model methods,it is verified that the accuracy of machine learning algorithm is greatly improved compared with the original method. It promotes the improvement of the learning effect of online education,and is conducive to the objective evaluation of students and the development of online education.

Keywords:online education;machine learning;predict performance

0? 引? 言

2015年是中國(guó)的教育大數(shù)據(jù)元年[1],相關(guān)研究機(jī)構(gòu)和科研學(xué)者都開始關(guān)注教育大數(shù)據(jù),在教育教學(xué)環(huán)節(jié)和教學(xué)活動(dòng)中產(chǎn)生了大量的相關(guān)教育數(shù)據(jù),這些數(shù)據(jù)對(duì)教育評(píng)價(jià)和教學(xué)效果有著直接的影響,尤其是在線大數(shù)據(jù)、海量教育大數(shù)據(jù)對(duì)相關(guān)教育產(chǎn)業(yè)、教育機(jī)構(gòu)的影響。教育大數(shù)據(jù)產(chǎn)生于各種教育實(shí)踐活動(dòng),既包括受教育者在校園內(nèi)的教學(xué)數(shù)據(jù),也涵蓋由此產(chǎn)生的相關(guān)數(shù)據(jù);同時(shí)還包括網(wǎng)絡(luò)環(huán)境下的遠(yuǎn)程的教育教學(xué)活動(dòng)。

在線教育也稱網(wǎng)絡(luò)教育,是指在互聯(lián)網(wǎng)環(huán)境下,以現(xiàn)代教育思想和學(xué)習(xí)理論為指導(dǎo),充分發(fā)揮互聯(lián)網(wǎng)環(huán)境下豐富的教育教學(xué)資源優(yōu)勢(shì),向受教育者和學(xué)習(xí)者提供一種網(wǎng)絡(luò)化教和學(xué)的環(huán)境,利用數(shù)字化的語音、視頻和教育教學(xué)平臺(tái),開展以學(xué)習(xí)者為重的非面授教育活動(dòng)。在線教育是遠(yuǎn)程教育的現(xiàn)代化表現(xiàn),也是一種同時(shí)異地或者異時(shí)異地進(jìn)行教育的形式。

總的來說,在線教育數(shù)據(jù)主要有以下三大特點(diǎn):(1)數(shù)據(jù)間聯(lián)系緊密;(2)數(shù)據(jù)存儲(chǔ)存在異構(gòu)性且處理困難;(3)在線數(shù)據(jù)分布廣泛。但在目前的互聯(lián)網(wǎng)環(huán)境下,海量在線數(shù)據(jù)分布的廣泛性會(huì)提高數(shù)據(jù)收集和檢索的難度,原有的很多不相關(guān)數(shù)據(jù)在深入剖析數(shù)據(jù)之間深層次的關(guān)系后,會(huì)發(fā)現(xiàn)大量數(shù)據(jù)之間依然存在一定的關(guān)系。

1? 在線教育大數(shù)據(jù)面臨的問題

在互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代,在線教育平臺(tái)和在線教育機(jī)構(gòu)不斷增加,社會(huì)所擁有的教育資源也越來越多,每個(gè)教育平臺(tái)、教育機(jī)構(gòu)所擁有的數(shù)據(jù)都是獨(dú)立的、非共享的。各種數(shù)據(jù)之間的格式、含義、表示等都有差異,雖然這些異構(gòu)的大數(shù)據(jù)很多都具有相同的表征含義,但對(duì)于教育機(jī)構(gòu)和很多研究者而言,它們之間都沒有本質(zhì)的關(guān)聯(lián),大量數(shù)據(jù)存在但沒有得到有效利用。因此,高效利用大量的在線教育資源面臨著巨大挑戰(zhàn):如何對(duì)互聯(lián)網(wǎng)中看似不相關(guān)、紛亂無序的教育大數(shù)據(jù)進(jìn)行有效的管理和利用[2,3],如何提升教育資源已獲得更為優(yōu)化的服務(wù)模式,以及如何有效評(píng)價(jià)服務(wù)模式的效率和性能已經(jīng)成為急需解決的關(guān)鍵問題。

2? 基于機(jī)器學(xué)習(xí)算法的在線教育成績(jī)?cè)u(píng)價(jià)模型

在大數(shù)據(jù)分析的技術(shù)背景下,以貴州某大學(xué)成人教育學(xué)院的真實(shí)學(xué)生數(shù)據(jù)和網(wǎng)絡(luò)爬蟲爬取到的相關(guān)數(shù)據(jù)為基礎(chǔ),去構(gòu)建一個(gè)大數(shù)據(jù)環(huán)境下的機(jī)器學(xué)習(xí)預(yù)測(cè)回歸算法,分析該方法應(yīng)用于在線學(xué)習(xí)結(jié)果預(yù)測(cè)評(píng)價(jià)中,以期提高在線成人教育的教學(xué)效果。為此我們選擇了五種常見的分類算法進(jìn)行對(duì)比:邏輯回歸(Logistic Regression,LR)、支持向量機(jī)(Support Vector Machine,SVM)、決策樹(Decision Tree,DT)、樸素貝葉斯(Na?ve Bayes,NB)和反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)[4]。

2.1? 特征向量的選取

考慮到數(shù)據(jù)之間的異構(gòu)性,首先將無效信息刪除,同時(shí)對(duì)于原始信息中屬性中的丟失率超過20%的特征和無效特征刪除后,得到有效的原始數(shù)據(jù)。其次,可以進(jìn)一步將異構(gòu)數(shù)據(jù)進(jìn)行處理和合并刪除相同語義的數(shù)據(jù),由此構(gòu)建特征向量。最后,將網(wǎng)絡(luò)爬蟲爬取到的文本信息進(jìn)行分詞后獲取情感信息,利用情感詞庫構(gòu)建情感特征向量,將兩者特征向量進(jìn)行歸一化之后進(jìn)行級(jí)聯(lián),得到如表1所示的學(xué)生特征屬性名稱和特征描述表。

考慮到每種特征值的取值有很大的差異性,因此在特征空間量化的過程中,我們采用正則化的方法將所有的特征向量值都統(tǒng)一到[-1,1]的空間內(nèi)。這樣有利于后續(xù)的模型進(jìn)行處理。

2.2? 模型數(shù)據(jù)集和評(píng)價(jià)指標(biāo)的選取

考慮到實(shí)際樣本數(shù)量的采集,將數(shù)據(jù)集的70%和80%分別作為實(shí)驗(yàn)的訓(xùn)練數(shù)據(jù)集,10%的數(shù)據(jù)作為實(shí)驗(yàn)的驗(yàn)證集,剩余的20%和10%作為兩次實(shí)驗(yàn)的測(cè)試集。采用的評(píng)價(jià)指標(biāo)主要有準(zhǔn)確率(Precision)、F1-Measure、精確度(Accuracy)和召回率(Recall)[5]。主要的評(píng)價(jià)指標(biāo)計(jì)算公式分別為:

2.3? 學(xué)習(xí)成績(jī)預(yù)測(cè)框架設(shè)計(jì)

學(xué)習(xí)預(yù)測(cè)框架包括原始數(shù)據(jù)合并與處理、訓(xùn)練模型和預(yù)測(cè)應(yīng)用三個(gè)階段:(1)原始數(shù)據(jù)合并與處理階段:首先需要對(duì)數(shù)據(jù)源進(jìn)行選取,將原始數(shù)據(jù)清理之后進(jìn)行采用主成分分析方法(Principal Component Analysis,PCA)進(jìn)行特征提取,將提取后的特征和情感數(shù)據(jù)特征進(jìn)行融合,構(gòu)成最終的特征向量。并按照一定的比例將數(shù)據(jù)劃分為訓(xùn)練集數(shù)據(jù)、驗(yàn)證集數(shù)據(jù)和測(cè)試集數(shù)據(jù)三類;(2)訓(xùn)練模型階段首先將數(shù)據(jù)重抽樣,利用合成少數(shù)類過采樣技術(shù)[6](Synthetic Minority Oversampling Technique,SMOTE)對(duì)不平衡數(shù)據(jù)進(jìn)行處理使數(shù)據(jù)類型平衡,再使用機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,將訓(xùn)練好的模型利用驗(yàn)證集數(shù)據(jù)進(jìn)行模型驗(yàn)證后,對(duì)得到的模型使用測(cè)試數(shù)據(jù)測(cè)試,不斷地調(diào)整模型的參數(shù)和性能,直到最終完成模型;(3)在預(yù)測(cè)階段,將測(cè)試數(shù)據(jù)輸入訓(xùn)練好的模型進(jìn)行預(yù)測(cè),得到在線學(xué)習(xí)期末成績(jī)趨勢(shì)的預(yù)測(cè)結(jié)果。在線學(xué)習(xí)期末成績(jī)預(yù)測(cè)模型框架圖如圖1所示。

2.4? 模型結(jié)果分析

實(shí)驗(yàn)結(jié)果證明,與使用70%重采樣的結(jié)果相比,選擇80%重采樣的數(shù)據(jù)集進(jìn)行五種機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,我們可以發(fā)現(xiàn)精確度和召回率有大幅度的提升。比較與其他四種方法,Logistic Regression獲得了最好的實(shí)驗(yàn)結(jié)果。最終的Logistic Regression得到擬合模型表達(dá)式為:

在上式中,GPA_COURSE表示所有已完成課程的平均成績(jī)/績(jī)點(diǎn),COURSE_COUNT表示已完成的課程數(shù),STUDENT_LEVEL表示學(xué)生類別,PASS_COURSE_TIME表示通過課程的平均學(xué)習(xí)時(shí)長(zhǎng),COURSE_TIME表示課程所用時(shí)間,CHAPER_TEST表示課程章節(jié)測(cè)試成績(jī),HW_SCORE表示平時(shí)作業(yè)成績(jī)。

從模型中我們可以看到作業(yè)成績(jī)對(duì)于在線學(xué)習(xí)的成績(jī)影響非常小,當(dāng)采用后的數(shù)據(jù)量非常大的情況下,在實(shí)際測(cè)試過程中可以考慮刪除該權(quán)重向量對(duì)預(yù)測(cè)的影響,以減少計(jì)算的復(fù)雜度和模型的開銷。

此外,由于數(shù)據(jù)量的采集依然存在問題,由于學(xué)生的情感評(píng)價(jià)打分有一定的缺陷,沒有有效利用情感等分進(jìn)行模型訓(xùn)練,導(dǎo)致深度學(xué)習(xí)算法在現(xiàn)有樣本數(shù)量下,訓(xùn)練模型的效果不佳,因此對(duì)于測(cè)試集最后的預(yù)測(cè)精度不高。當(dāng)樣本數(shù)量進(jìn)一步增大,深度學(xué)習(xí)模型的預(yù)測(cè)結(jié)果將進(jìn)一步提升。

3? 結(jié)? 論

隨著社會(huì)的不斷進(jìn)步,遠(yuǎn)程教育、在線教育將促進(jìn)每個(gè)人知識(shí)的不斷獲取和技能的不斷提升。面對(duì)海量數(shù)據(jù)環(huán)境下的在線教育的預(yù)測(cè)和評(píng)估也將隨著時(shí)代的不斷發(fā)展而變得越來越充滿挑戰(zhàn)性。

此外,原有的、單一的評(píng)估模式和評(píng)估方法僅將學(xué)生的考試成績(jī)作為唯一的評(píng)判標(biāo)準(zhǔn),將其變換成多方法、多模型的在線教育的評(píng)估方法,兼顧學(xué)習(xí)時(shí)間、學(xué)習(xí)效率、學(xué)習(xí)態(tài)度的同時(shí)也充分考慮學(xué)生的個(gè)人學(xué)習(xí)能力等因素,用更客觀的評(píng)測(cè)權(quán)重來得到最后的期末綜合總分,這樣才能有利于在線教育的長(zhǎng)遠(yuǎn)發(fā)展以及對(duì)學(xué)生的有效評(píng)價(jià)。

參考文獻(xiàn):

[1] 楊現(xiàn)民,唐斯斯,李冀紅.教育大數(shù)據(jù)的技術(shù)體系框架與發(fā)展趨勢(shì)——“教育大數(shù)據(jù)研究與實(shí)踐專欄”之整體框架篇 [J].現(xiàn)代教育技術(shù),2016,26(1):5-12.

[2] LANE J. Big Data:The Role Of Education and Training [J]. Journal of Policy Analysis and Management,2016,35(3):722-724.

[3] ALEKSANDRA K M,MIRJANA I,ZORAN B. Data science in education:Big data and learning analytics [J]. Computer Applications in Engineering Education,2017,25(6):1006-1078.

[4] 李航.統(tǒng)計(jì)學(xué)習(xí)方法 [M].北京:清華大學(xué)出版社,2012.

[5] SANDEEP M J,ERIK W M,EITEL J M L,et al. Early Alert of Academically At-Risk Students:An Open Source Analytics Initiative [J]. Journal of Learning Analytics,2014(1):6-47.

[6] CHAWLA N V,BOWYER K W,HALL L O,et al. SMOTE:Synthetic Minority Over-sampling Technique [J]. Journal of Artificial Intelligence Research,2002,16(1):321-357.

作者信息:徐洪峰(1977-),男,漢族,江西上饒人,副教授,碩士,研究方向:機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、企業(yè)信息化。

猜你喜歡
機(jī)器學(xué)習(xí)
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
前綴字母為特征在維吾爾語文本情感分類中的研究
下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計(jì)算模型
基于樸素貝葉斯算法的垃圾短信智能識(shí)別系統(tǒng)
基于圖的半監(jiān)督學(xué)習(xí)方法綜述
機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
極限學(xué)習(xí)機(jī)在圖像分割中的應(yīng)用
主站蜘蛛池模板: 亚洲综合专区| 亚洲男人天堂2020| 香蕉视频在线精品| 玩两个丰满老熟女久久网| 国产亚洲欧美日韩在线一区| 尤物在线观看乱码| 国产成人综合亚洲网址| 国产在线观看91精品亚瑟| 国产又粗又猛又爽视频| 人妻精品全国免费视频| 精品少妇人妻av无码久久| 国产极品美女在线播放| A级全黄试看30分钟小视频| 亚洲αv毛片| 国产美女丝袜高潮| 波多野吉衣一区二区三区av| 亚洲福利网址| 亚洲国产AV无码综合原创| 亚洲动漫h| 国产亚洲男人的天堂在线观看| 国产99精品视频| 国产一在线| 欧美日韩精品一区二区在线线| 亚洲国产午夜精华无码福利| 国产男女XX00免费观看| 国产欧美日韩在线一区| 91免费国产高清观看| 国产午夜精品鲁丝片| 日韩第一页在线| 日本欧美一二三区色视频| 成人国产精品视频频| 国产久草视频| 亚洲水蜜桃久久综合网站| 精品视频在线观看你懂的一区| 四虎国产精品永久一区| 在线观看国产精品一区| 国产在线观看99| 日本高清免费一本在线观看 | 欧美日韩理论| 国产美女精品人人做人人爽| 午夜国产在线观看| 国产主播福利在线观看| 亚洲色图欧美在线| 国产亚洲欧美另类一区二区| 黄色一及毛片| 欧洲亚洲一区| 亚洲无码37.| 玖玖免费视频在线观看| 无码啪啪精品天堂浪潮av| 欧美黄网在线| 久久精品无码一区二区国产区| 国产亚洲高清视频| 日本久久免费| 一级在线毛片| 日韩区欧美国产区在线观看| 欧美日韩高清在线| 亚洲欧洲日韩国产综合在线二区| 国产成人久久综合777777麻豆| 欧美色伊人| 四虎永久免费网站| 成人在线亚洲| AV在线天堂进入| 国产一区二区三区精品欧美日韩| 国产一区二区免费播放| 91午夜福利在线观看| 午夜视频日本| 97色伦色在线综合视频| 欧美日本激情| 国产精选自拍| 女人18毛片水真多国产| 看国产一级毛片| 亚洲AV电影不卡在线观看| 午夜精品区| 欧美成人免费| 伊人成人在线| 国产午夜一级毛片| 亚洲精品欧美日本中文字幕| 三上悠亚精品二区在线观看| 久久国语对白| 亚洲,国产,日韩,综合一区| jizz在线观看| 国产精品手机在线播放|