999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數(shù)據(jù)挖掘技術(shù)的教學平臺研究探索

2022-05-26 02:12:06陶佳妮李旭朱林姚林宇
電子制作 2022年8期
關(guān)鍵詞:數(shù)據(jù)挖掘用戶分析

陶佳妮,李旭,朱林,姚林宇

(東南大學成賢學院 電子與計算機工程學院,江蘇南京,210000)

0 引言

后疫情時代,為了防止新型冠狀病毒肺炎向校園蔓延而影響學生的學習教師的工作,“停課不停學”的政策很快落實。教育部統(tǒng)籌整合國家,覆蓋各地的優(yōu)質(zhì)網(wǎng)上教學資源,全力保障教師們在網(wǎng)上教,學生們在網(wǎng)上學習。隨著疫情在我國逐步得到強有力的控制,各地學校陸續(xù)復學,教學也在常態(tài)化疫情防控的狀態(tài)下進行。疫情與后疫情時代,線上教學成為了主流的學習模式之一,在這種情況下,可以通過數(shù)據(jù)挖掘技術(shù),做到深入了解學生的知識掌握情況,分析出接下來,老師們應該講解的方向,調(diào)整后續(xù)的教學,使得老師與學生,雖然距離遙遠卻能和在教室中一樣。線上教學為教育注入了新的活力,提高了課程質(zhì)量,打破了學習的時空局限,能夠更好的促進學生與教師之間的師生互動,減少了教師的在線工作量,同時也在一定程度上解決了教育公平問題。

1 App 數(shù)據(jù)挖掘概述

■1.1 APP 內(nèi)涵與特征

通過數(shù)據(jù)挖掘技術(shù)能夠從學生在網(wǎng)絡上查找的一系列數(shù)據(jù)和信息中獲得可用于教學的知識,并有效的指導教師改善教學活動和網(wǎng)站結(jié)構(gòu)。同時可通過基于數(shù)據(jù)挖掘的網(wǎng)絡教學系統(tǒng)用于教務管理,管理采集到的相關(guān)教務信息,這樣可以使教務管理效率大大提高,在提高了安全性能的同時優(yōu)化存儲量。

■1.2 現(xiàn)有數(shù)據(jù)挖掘主要技術(shù)

在對數(shù)據(jù)進行研究與挖掘時,我們首先要知道數(shù)據(jù)是屬于龐大的信息資源庫,分析其中的所需要的資源信息,可以幫助發(fā)現(xiàn)和掌握其中的某些特點與規(guī)律,現(xiàn)有的方法主要有:

(1)關(guān)聯(lián)性的分析形式。萬物都是相關(guān)聯(lián)的,同樣數(shù)據(jù)之間也是相互關(guān)聯(lián)的。由于數(shù)據(jù)信息量相對偏大,我們在進行檢索信息時,如果對其關(guān)聯(lián)性進行尋找將會耗費大量時間,其次,檢索屬于相應明確數(shù)據(jù)間規(guī)律、關(guān)系是相當艱難的。合理的借助關(guān)聯(lián)性分析形式開展工作,從而更好的提升尋找數(shù)據(jù)關(guān)聯(lián)性的效率性以及準確性等,為了滿足幫助人們提升工作效率與質(zhì)量的要求,可以借助有效的數(shù)據(jù)分辨的任務形式予以解決。因這一方法具有較強目的性,因此對數(shù)據(jù)準確度要求高的信息管理工作中應合理的運用該方法開展工作。

(2)聚類分析形式。聚類分析形式就是把不同的數(shù)據(jù)進行歸類和分組,將已有的零碎數(shù)據(jù)整理為有條理的數(shù)據(jù)信息。聚類分類并不是傳統(tǒng)意義上進行簡單的分類,在數(shù)據(jù)組找尋具有已有的數(shù)據(jù)信息,是在不清楚對象的情況下進行的。這里就體現(xiàn)出了該方法的缺點,想要精確把數(shù)據(jù)信息進行分類是很困難的,因此該方法一般運會用到心理學、數(shù)據(jù)識別等領(lǐng)域中。

(3)特征分析形式。在信息數(shù)據(jù)泛濫的當代,分類數(shù)據(jù)將結(jié)合數(shù)據(jù)自身特征、類型開展工作,特征分析方法就是結(jié)合數(shù)據(jù)特征進行數(shù)據(jù)的挖掘、匯總。一般是通過計算機,對數(shù)據(jù)開展虛擬數(shù)據(jù)的分類工作,借助明確的數(shù)據(jù)和數(shù)據(jù)間特征所得出分析的結(jié)果,進行開展分類工作。

(4)人工神經(jīng)網(wǎng)絡體系。人工神經(jīng)網(wǎng)絡體系是通過特征性分析,對大量的數(shù)據(jù)進行相應的處理,然后將大量的數(shù)據(jù)建立成網(wǎng)絡模型,通過神經(jīng)網(wǎng)絡對成為網(wǎng)絡模型的數(shù)據(jù)開展分析工作。首先,在一些國內(nèi)外研究成果中已經(jīng)給出了對網(wǎng)絡教育的概念定義、特征分析、數(shù)據(jù)采集、結(jié)果評價及相關(guān)反饋模型的規(guī)范研究,不斷完善其體系結(jié)構(gòu)。其次,能夠用來指導和建立網(wǎng)絡用戶的特征及屬性等信息,國內(nèi)外已經(jīng)有許多基于數(shù)據(jù)挖掘的網(wǎng)絡教學系統(tǒng)可供借鑒參考。

■1.3 教育數(shù)據(jù)挖掘分析的教與學本位

在傳統(tǒng)教學中,老師經(jīng)常用分數(shù)來評價學生的學習效率,但在學生成績分析中卻沒有定量分析,這使得教學評價的作用的效果大打折扣。目前,采取數(shù)據(jù)挖掘技術(shù)對學生進行成績分析,主要從兩個方面入手。一方面,從學生這邊的信息著手分析。學生在考試或者測試之后,往往對自己的成績、名次非常關(guān)心,而對知識點的理解卻難以深入分析。通過數(shù)據(jù)挖掘技術(shù)對學生的歷次成績和每個知識點的得分狀況進行分析,從而一目了然的知道其學習效率、進步障礙、每個考點和知識面的掌握情況等等。另一方面,從學生的成績?nèi)胧址治觥Mㄟ^數(shù)據(jù)挖掘技術(shù)對試卷進行分析,利用關(guān)聯(lián)規(guī)則通過對試卷數(shù)據(jù)庫中相關(guān)考試屬性進行分析來獲取信息,從而給出相關(guān)分析評價。一般結(jié)合所要測試的內(nèi)容來進行的,也可給出一個班級基于某門課程的成績的數(shù)據(jù)可視圖,也可給出這門課程的綜合統(tǒng)計分析。學生登錄后,系統(tǒng)可自動查詢學生各時間段相應成績,還可給出在本學年院系排名,使學生了解本學年綜合表現(xiàn)排名。

■1.4 數(shù)據(jù)體系及挖掘分析的目的

在移動學習系統(tǒng)的實際應用中,不同的用戶所對應的需求不同,所以我們?yōu)椴煌挠脩籼峁┎煌姆眨婧腿诵曰墓δ苡欣谙到y(tǒng)的推行實施。在學生端的學習主頁面,有收藏,課件,課程表,下載,我的課程,我的專欄等選項;用戶界面有我的學校,我的班級,我的課表,我的成績等選項。首先,根據(jù)用戶填寫的學校班級,及時推送學習向的新聞,例如專業(yè)考研信息,專業(yè)考證信息,專業(yè)就業(yè)前景等等。接下來,根據(jù)學生的成績,有針對性的推送該生弱項課程的視頻課和習題,記錄下學生每一次的成績變化,將學生的知識掌握情況可視化,同時這份知識掌握的情況可視化表也會傳給該生的老師查看,老師可以根據(jù)她教導的每一個學生的掌握情況來更改教學內(nèi)容,學生可以根據(jù)自己的知識掌握情況來查漏補缺。這樣,就可以利用好每一次的測驗,挖掘到有用的信息。最后就是討論環(huán)節(jié),學生在每次上完課完成測驗后,都可以在討論組里面討論,挖掘討論內(nèi)容,反饋給老師課程的內(nèi)容是否需要改進。學生小組的討論也會被提取關(guān)鍵信息記錄下來,以供之后的回顧討論使用。

2 基于數(shù)據(jù)挖掘的教學平臺設計

如果對于學生成績分析上沒有量化分析,教師只是通過分數(shù)對學生學習效果進行評價,從而使得教學評價的作用并沒有得到有效發(fā)揮。對學生進行成績分析我們采取數(shù)據(jù)挖掘技術(shù),主要通過以下兩個方面進行。一方面,學生分析。學生在考試或者測試之后,只關(guān)心自己的分數(shù)多少、名次排在第幾,難以對知識點的把握深入進行分析經(jīng)常發(fā)生。通過數(shù)據(jù)挖掘技術(shù)對學生的歷次成績和每個知識點得分狀況進行匯總分析,從而達到快速知道其學習效率、進步障礙、每個考點和知識面的對錯率等等,其中包括利用分數(shù)對應曲線圖對學生同時進行的各科目測試成績進行的橫向比較、利用分數(shù)對應曲線圖及二列相關(guān)系數(shù)的分析對學生分數(shù)在歷次測驗中進行的縱向比較、利用成績分布曲線得出學生成績頻數(shù)分布圖等。另一方面,成績分析。利用關(guān)聯(lián)規(guī)則,通過數(shù)據(jù)挖掘技術(shù)對試卷數(shù)據(jù)庫中相關(guān)考試屬性進行分析來獲取考試的得分區(qū)間分布、可信度和有效性等信息,從而給出相對客觀的相關(guān)分析評價??赏ㄟ^給出一個班級基于某門課程的成績分布均標準誤、偏度、百分比、最值、平峰度、及格率等數(shù)據(jù),也可給出這門課程的綜合統(tǒng)計分析,但一般結(jié)合所要測試的內(nèi)容、條件、用途來進行評價。學生登錄系統(tǒng)后,系統(tǒng)不僅可自動查詢學生各時間段相應成績,還可給出在本學年院系排名。使學生一目了然的了解本學年綜合表現(xiàn)情況。

圖1

3 數(shù)據(jù)挖掘分析技術(shù)原理

面對大量的學習資料,客戶在使用的過程不得不花費大量的時間和經(jīng)歷去篩選和過濾,從而降低了用戶學習的效率,所以我們打造我們的app 就是為了給用戶做出個性化的推薦的學習平臺。為了讓用戶接觸到更好,更優(yōu)秀的學習材料,我們使用了基于物品協(xié)同過濾的算法,通過觀測出用戶行為的行為記錄評判出用戶之間的相似度,尋找到行為相似的用戶,互推他們收藏或者喜愛的學習材料。

■3.1 數(shù)據(jù)的采集和預處理

使用python 的爬蟲功能,獲取后面可以用來分析處理的數(shù)據(jù)。到視頻的原站獲取其中視頻的類型,點贊及收藏的人數(shù),視頻的播放量,獲得好評的次數(shù)等重要的潛在挖掘數(shù)據(jù)信息。由于爬取的大量的數(shù)據(jù)中會出現(xiàn)不同層次的噪音,比如視頻類型與算法模型要求的類型不匹配,缺失值的出現(xiàn)等等,都會在不同層度上,影響著后期數(shù)據(jù)的使用的效果,甚至對挖掘目的造成影響。所以在開始階段,我們需要對這些不完整的數(shù)據(jù)進行預處理。

■3.2 計算出學習資料之間的相似度

ItemCF 物品相似度的計算模型,其中|N(i)|表示喜歡視頻i 的用戶數(shù)量,|N(j)|表示喜歡視頻j 的用戶數(shù)量,表示了同時喜歡視頻i 和視頻j 的用戶數(shù)量。從公式中我們可以觀察出,因為共同喜歡兩個視頻的人數(shù)越多,物品的相似度越高。

然后,需要對基于物品的協(xié)同過濾推薦算法的用戶偏好進行計算。公式如下:

其中N(u)是用戶產(chǎn)生行為的物品集合,S(j,k)是與j 相似度最高的K 個物品的集合。Wij 物品i 和物品j 的相似度,Rui 是用戶u 對物品i 的喜好程度。從公式中可以得出結(jié)論:待推薦的物品與用戶歷史行為中的物品相似度很高的話,則這個待推薦的物品被推薦給用戶的可能性就越高。

這種將用戶的歷史行為作為推薦學習資料的依據(jù)的方式,具有更好的解釋性,與用戶的行為進行了更好的溝通,更加能容易被用戶接受和學習。

■3.3 算法的優(yōu)化

將ItemCF 相似矩陣按照最大值進行歸一化,可以大大提高推薦的準確度。不僅如此,還可以提高推薦的覆蓋率和多樣性。

4 主要功能及關(guān)鍵代碼

■4.1 教師模塊

教師模塊的主要功能:上傳上課所需要的學習資料,課后的作業(yè),以及課程結(jié)束的考試內(nèi)容等內(nèi)容。其中最重要的內(nèi)容是:上傳課程所需的視頻。本項目獲取B 站的熱點學習視頻,由于網(wǎng)站的特殊性,音頻和視頻是分開的,所以我們在獲取到視頻文件和音頻文件,還需要額外的軟件去合并,形成完整的視頻。

(1)利用正則表達式,取出音頻和視頻文件存儲的playinfo 源代碼— html_data,將其字符串形式轉(zhuǎn)化成json 數(shù)據(jù),然后對數(shù)據(jù)進行解析,得到該源代碼中的視頻和音頻的網(wǎng)址。

(2)分別對視頻和音頻的網(wǎng)址進行訪問并獲取里面的內(nèi)容audio_content和video_content利用ffmepg合并MP4 和MP3 文件,合并一個完整的視頻文件,由教師模塊上傳,供學生反復學習,獲得知識。

■4.2 學生模塊

由教師方上傳學習資料后,學生可以根據(jù)自己的實際情況進行選擇性的學習,但為了給學生提供更高效的學習方式,提供更有價值的學習內(nèi)容,在學生模塊中,添加了學習視頻推薦算法,此算法是基于物品的協(xié)同過濾算法,通過對視頻的點贊量,播放量,收藏量,評論的數(shù)量等一些關(guān)鍵的信息量來作為算法的參數(shù)來進行推薦。

(1)與上文類似,獲取網(wǎng)站的源代碼,并且將字符串類型轉(zhuǎn)換成json 類型,然后獲取里面的元素:學習的視頻的標題,視頻的作者,視頻的id,視頻類型,點贊的人數(shù),視頻的播放量,視頻的收藏量,視頻的評論數(shù),并將這些數(shù)據(jù)存儲到相應的csv 文件當中去。

(2)根據(jù)上面的爬取的數(shù)據(jù)信息,分析得到用戶—物品之間的矩陣的雛形,然后通過分析過濾得到用戶和物品之間的矩陣data_matrix,計算出視頻的余弦相似度矩陣item_similarity,從而獲取該視頻的余弦相似度的數(shù)組,返回前k 個最高相似度的索引位置video_similarity_index,最終排完序之后,可以從中獲取相應的推薦學習的視頻。

5 總結(jié)

本文闡述了數(shù)據(jù)挖掘技術(shù)在教學平臺上的使用,借助這一技術(shù)來分析教師課程與學生知識掌握情況的數(shù)據(jù),可以將在線學習的優(yōu)勢更大化。不僅提高師生線上互動效率,更能順應歷史潮流,推進教學的網(wǎng)絡化、信息化。對于數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域中的實現(xiàn),能夠讓教師更好的掌握和了解學生的信息,明確學生成績、優(yōu)點以及學習情況等,也能對學生各個方面開展分析,這樣教師才能對學生開展更為有效的幫助和教學。同時,教務管理可通過基于數(shù)據(jù)挖掘的網(wǎng)絡教學系統(tǒng),采集相關(guān)教務信息進行相應管理,這樣大大提高教務管理效率、安全性能以及存儲量。

本文基于我們的大學生創(chuàng)新創(chuàng)業(yè)項目的內(nèi)容寫下,樣本量有限,本文提出的方法需要在更大的范圍內(nèi)驗證。并且數(shù)據(jù)挖掘的內(nèi)容之于教學平臺還有更多的發(fā)展空間。

猜你喜歡
數(shù)據(jù)挖掘用戶分析
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
隱蔽失效適航要求符合性驗證分析
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
電力系統(tǒng)及其自動化發(fā)展趨勢分析
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
如何獲取一億海外用戶
主站蜘蛛池模板: 日日噜噜夜夜狠狠视频| 视频二区亚洲精品| av大片在线无码免费| 2021国产精品自产拍在线观看| 欧美三级视频在线播放| 国产小视频a在线观看| 国产亚洲精品精品精品| 国产日韩丝袜一二三区| 国产精品30p| 天天做天天爱夜夜爽毛片毛片| 亚洲国产精品日韩av专区| 伊人精品视频免费在线| 亚洲国产中文精品va在线播放| 无码中文AⅤ在线观看| 中文字幕 91| 国产拍在线| 欧美成人h精品网站| 国产一区二区网站| 9cao视频精品| 热re99久久精品国99热| 国产爽歪歪免费视频在线观看| Jizz国产色系免费| 国产亚洲精品自在久久不卡| 亚洲精品不卡午夜精品| 99热这里只有精品5| 亚洲第一天堂无码专区| 一区二区三区成人| 伊人狠狠丁香婷婷综合色| 久草视频中文| 激情国产精品一区| 亚洲天堂免费| 青青操视频免费观看| 亚洲va在线观看| 女人18毛片久久| 国产农村1级毛片| 毛片免费观看视频| 国产一在线观看| 国产人免费人成免费视频| 美臀人妻中出中文字幕在线| 色播五月婷婷| 在线观看亚洲成人| 日韩精品久久久久久久电影蜜臀| 久久久噜噜噜久久中文字幕色伊伊 | 久久熟女AV| 视频二区亚洲精品| 国产精品无码制服丝袜| 国产又粗又猛又爽| 国产成人无码综合亚洲日韩不卡| 亚洲成人动漫在线观看| 久久超级碰| 青青草国产免费国产| 日本欧美一二三区色视频| 久久伊人操| 亚洲精品无码抽插日韩| 久久夜色撩人精品国产| 亚洲有码在线播放| 亚洲天堂.com| 精品综合久久久久久97超人| 日韩精品无码免费专网站| 国产激情无码一区二区三区免费| 亚洲色图在线观看| 国产在线欧美| 九九九九热精品视频| 在线观看网站国产| 国产亚洲精品yxsp| 日本福利视频网站| 1769国产精品视频免费观看| 亚洲第一成年网| 99er精品视频| 国产精品尤物铁牛tv | 在线观看国产网址你懂的| 欧美在线视频不卡第一页| 国产成人久视频免费| 天天综合网色| 日韩不卡高清视频| 日本成人福利视频| 午夜综合网| 亚洲日韩AV无码精品| 婷婷成人综合| 国产69精品久久| 亚洲第七页| 国产亚洲欧美在线人成aaaa |