999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能基礎(chǔ)算法實(shí)訓(xùn)課程教學(xué)案例研究

2024-10-09 00:00:00席菁
中國教育信息化 2024年9期
關(guān)鍵詞:教學(xué)案例人工智能

摘" "要:為解決現(xiàn)有人工智能課程中多個核心算法實(shí)驗(yàn)內(nèi)容相互脫節(jié)、連貫性差等問題,研究者設(shè)計(jì)了融合多種基礎(chǔ)算法的英語知識點(diǎn)畫像系統(tǒng)實(shí)驗(yàn)教學(xué)案例。該案例以英語學(xué)科為切入點(diǎn),基于教育領(lǐng)域所存在的若干有價(jià)值數(shù)據(jù)(培養(yǎng)過程數(shù)據(jù)、學(xué)習(xí)成績數(shù)據(jù)等),從“基礎(chǔ)知識水平—學(xué)習(xí)投入程度—知識掌握水平”三個角度出發(fā),分別利用決策樹分類、K-means聚類等方法對多屬性標(biāo)簽進(jìn)行生成,并對算法進(jìn)行性能對比。實(shí)訓(xùn)框架綜合多種機(jī)器學(xué)習(xí)算法對畫像系統(tǒng)進(jìn)行生成,形成了涵蓋“系統(tǒng)設(shè)計(jì)—編碼—分析—展示”的綜合性實(shí)訓(xùn)教學(xué)案例。幾輪教學(xué)實(shí)踐表明,引入實(shí)際項(xiàng)目貫穿實(shí)驗(yàn)環(huán)節(jié),能夠在一定程度上提升學(xué)生的創(chuàng)新實(shí)踐能力和算法的綜合運(yùn)用能力。

關(guān)鍵詞:畫像系統(tǒng);人工智能;決策樹;初高中英語教學(xué);教學(xué)案例

中圖分類號:G434" " " " "文獻(xiàn)標(biāo)志碼:A" " " " "文章編號:1673-8454(2024)09-0120-09

DOI:10.3969/j.issn.1673-8454.2024.09.012

作者簡介:席菁,蘇州市教育科學(xué)研究院教研員,高級教師(江蘇蘇州 215123)

基金項(xiàng)目:蘇州市教育科學(xué)“十四五”規(guī)劃2022年度一般立項(xiàng)課題“義務(wù)教育階段信息科技課程教評測一體化研究”(編號:2022/LX/02/183/11)

一、引言

隨著智能時代的到來,人工智能在多個領(lǐng)域日益發(fā)揮著重要的應(yīng)用價(jià)值,也加劇了人工智能應(yīng)用人才需求。然而目前學(xué)校人工智能課程還停留在理論傳授層面,輔助若干實(shí)驗(yàn),尚未達(dá)到人才儲備的高質(zhì)量要求。人工智能課程的核心部分是機(jī)器學(xué)習(xí)算法。分類方法是使用已知的數(shù)據(jù)集(訓(xùn)練集)得到相應(yīng)的模型,通過該模型可以劃分未知數(shù)據(jù),是一種有監(jiān)督學(xué)習(xí)。常見的分類算法如K近鄰算法(KNN)、支持向量機(jī)、決策樹、隨機(jī)森林等。聚類方法是直接使用聚類算法將未知數(shù)據(jù)分為兩類或者多類,得到數(shù)據(jù)之間的聯(lián)系,是一種無監(jiān)督學(xué)習(xí)。常見的聚類算法如K均值(K-means)、均值聚類、均值漂移聚類等。

機(jī)器學(xué)習(xí)算法種類繁多,具有理論性強(qiáng)、技術(shù)更迭快等特點(diǎn),如何讓學(xué)生更直觀地理解算法并將其用于解決實(shí)際問題是課程的難點(diǎn)。北京郵電大學(xué)張平院士等通過剖析通信工程和人工智能學(xué)科交叉復(fù)合的學(xué)情現(xiàn)狀與存在的問題,在課程中提出網(wǎng)絡(luò)行為預(yù)測、智能無線傳輸?shù)葌€性化課堂內(nèi)容,試圖構(gòu)建“無線通信中的人工智能”高新課程。華東理工大學(xué)的蔣翠玲等在新工科建設(shè)背景下,基于華為“智能基座”項(xiàng)目,提出以人工智能導(dǎo)論與基礎(chǔ)算法實(shí)訓(xùn)課程結(jié)合的課程建設(shè)方法,在課程中通過“不同含量果汁飲料的聚類”對K-means聚類方法進(jìn)行實(shí)踐和掌握;通過“交通擁堵預(yù)測”對KNN算法進(jìn)行學(xué)習(xí)和掌握;通過“玩轉(zhuǎn)摳圖”對支持向量機(jī)分類算法進(jìn)行掌握。

從中可以看出,通過引入實(shí)際問題構(gòu)建面向人工智能的課程體系已廣泛應(yīng)用于教學(xué)實(shí)踐中。然而,如何引入實(shí)際問題來理解算法應(yīng)用,合理優(yōu)化人工智能課程的實(shí)訓(xùn)環(huán)節(jié),仍是人工智能課程所面臨的挑戰(zhàn)。基于此,本文引入畫像系統(tǒng),將機(jī)器學(xué)習(xí)的基礎(chǔ)算法貫穿于系統(tǒng)的整體開發(fā)過程,設(shè)計(jì)并實(shí)現(xiàn)面向英語知識點(diǎn)的學(xué)習(xí)者畫像系統(tǒng)實(shí)訓(xùn)框架,提高課程教學(xué)質(zhì)量。

二、相關(guān)研究

用戶畫像最早由交互設(shè)計(jì)之父艾倫·庫伯(Alan Cooper)提出[1],是一種根據(jù)用戶的個體屬性、行為習(xí)慣等數(shù)據(jù)生成一系列標(biāo)簽,來對用戶行為偏好和個體特征進(jìn)行刻畫的方法,對用戶進(jìn)行準(zhǔn)確認(rèn)知。在對學(xué)習(xí)者進(jìn)行畫像時,需要建立學(xué)習(xí)過程的整體屬性標(biāo)簽,主要包括:學(xué)生原有的知識基礎(chǔ)水平、學(xué)習(xí)投入程度、最終的學(xué)習(xí)效果等。

在已有的典型畫像系統(tǒng)中,北京中醫(yī)藥大學(xué)的王若佳等[2]通過在線健康社區(qū)用戶的交互參與情況(發(fā)帖、回帖、交流時間等)進(jìn)行統(tǒng)計(jì),并通過K-means等方法構(gòu)建在線健康社區(qū)用戶的行為畫像,并基于此對中醫(yī)用戶流失情況進(jìn)行分析。浙江大學(xué)的張紫微等[3]對大學(xué)生學(xué)習(xí)過程中非認(rèn)知能力進(jìn)行畫像,在其構(gòu)建過程中通過線上學(xué)習(xí)情況進(jìn)行統(tǒng)計(jì),通過頁面停留時間、登錄次數(shù)等數(shù)據(jù)創(chuàng)建學(xué)生在非認(rèn)知能力方面的畫像系統(tǒng),并基于此分析學(xué)習(xí)者的投入度、恒毅力等非認(rèn)知能力對學(xué)習(xí)成功的影響。武慧娟等[4]針對數(shù)字閱讀平臺,基于用戶的數(shù)字閱讀行為進(jìn)行閱讀者的消費(fèi)能力畫像,以此分析用戶的支付意愿,分別定義經(jīng)濟(jì)型用戶、編輯型用戶、沉默型用戶等類型,在此基礎(chǔ)上分析用戶行為,為數(shù)字閱讀平臺的發(fā)展和定位提供一定的借鑒。

在教育領(lǐng)域,機(jī)器學(xué)習(xí)方法更多地應(yīng)用于對學(xué)業(yè)水平進(jìn)行分析,針對志愿推薦[5]、高考趨勢[6][7]進(jìn)行預(yù)測等工作。在學(xué)習(xí)行為刻畫方面,翟鳴宇等[8]給出基于聚類的學(xué)生教育畫像系統(tǒng),從生活消費(fèi)、生活規(guī)律等維度,將學(xué)生劃分為思想積極型、規(guī)律作息型、節(jié)儉好學(xué)型,為學(xué)校的學(xué)工管理提供相應(yīng)的決策支持。凌玉龍等[9]針對學(xué)生消費(fèi)數(shù)據(jù)進(jìn)行挖掘,通過K-means方法進(jìn)行聚類分析,將其應(yīng)用于西安某高校3個月的學(xué)生消費(fèi)數(shù)據(jù)集,得到其消費(fèi)畫像,能夠?qū)W(xué)校的精準(zhǔn)資助提供輔助。張雪等[10]針對以慕課為代表的開放在線課程進(jìn)行學(xué)生類別畫像及學(xué)習(xí)行為分析,通過學(xué)習(xí)表現(xiàn)、瀏覽行為和論壇交互,將學(xué)生分為成績較好但不積極、成績較差且不積極、成績較好且積極、旁觀者四類,通過LASSO回歸進(jìn)行數(shù)據(jù)挖掘,該方法提出通過大數(shù)據(jù)對學(xué)習(xí)行為進(jìn)行畫像的有效指導(dǎo)。

綜上所述,通過大數(shù)據(jù)理論對特定領(lǐng)域的用戶行為進(jìn)行畫像已有相關(guān)研究與實(shí)踐,然而較少有針對學(xué)科知識點(diǎn)進(jìn)行細(xì)粒度畫像的相關(guān)研究。基于此,本文構(gòu)建針對英語學(xué)科知識點(diǎn)進(jìn)行學(xué)習(xí)者畫像,并以此創(chuàng)建人工智能課程實(shí)訓(xùn)框架。該實(shí)訓(xùn)框架包含5個主體內(nèi)容,通過無監(jiān)督學(xué)習(xí)的決策樹方法對學(xué)生知識基礎(chǔ)水平進(jìn)行分類(內(nèi)容1),繼而獲取學(xué)生的在線學(xué)習(xí)行為數(shù)據(jù),通過K-means方法對學(xué)生的學(xué)習(xí)投入程度進(jìn)行聚類(內(nèi)容2),在得到若干結(jié)果后,對學(xué)生的學(xué)習(xí)效果進(jìn)行線性分析(內(nèi)容3),并對結(jié)果進(jìn)行分析與展示(內(nèi)容4),以及對算法性能進(jìn)行對比(內(nèi)容5),最終得到整體的畫像標(biāo)簽。

三、系統(tǒng)模型

系統(tǒng)模型描述學(xué)生畫像系統(tǒng)應(yīng)包含的靜態(tài)(姓名、年齡、成績等)及動態(tài)(提交作業(yè)、下載課件等)屬性,具體可分為學(xué)生域和行為域兩個方面。

(一) 學(xué)生域

學(xué)生域可以看作是對畫像系統(tǒng)中學(xué)習(xí)者靜態(tài)屬性的刻畫,本文將學(xué)生域定義為如下結(jié)構(gòu):

其中,sji描述了通過某屬性(年齡、年級等)對學(xué)生進(jìn)行分類的標(biāo)簽,i描述了學(xué)生個體,j描述了年齡屬性(或年級),結(jié)合不同類型的學(xué)生定義,可以劃分為一年級(6歲)、二年級(7歲)、三年級(8歲)等,或可將學(xué)生劃分為不同年齡段:小于17歲、18—24歲、25—34歲、35—54歲、大于55歲。如s一年級

0011描述為學(xué)號是0011的一年級學(xué)生。通過標(biāo)簽可以區(qū)分不同學(xué)習(xí)者的靜態(tài)屬性,并進(jìn)一步挖掘?qū)W習(xí)者的畫像特征。

(二)行為域

行為域是對學(xué)習(xí)者動態(tài)行為的建模,與在線學(xué)習(xí)活動相關(guān)。本文挖掘并分析了在線學(xué)習(xí)者的特征,用以理解學(xué)習(xí)者的效率及偏好。因此,行為主要包括網(wǎng)上學(xué)習(xí)過程的具體操作,如課程點(diǎn)擊次數(shù)、頁面瀏覽次數(shù)、視頻播放量、課程資料下載量等。點(diǎn)擊和下載行為是學(xué)習(xí)過程的兩個重要操作。本文將學(xué)習(xí)畫像中的行為集刻畫為:

B={bi|b1,b2,...,bn}

其中,bi描述學(xué)習(xí)行為的類型,如在線學(xué)習(xí)、在線完成習(xí)題、記錄筆記等。時間屬性也是用于評估學(xué)習(xí)效果的一個重要參數(shù),反映了學(xué)習(xí)行為的專注程度,本文將學(xué)習(xí)的時間段屬性描述為:

T={ti|t1,t2,...,tn}

其中,ti描述了不同時間段的屬性,可以將其劃分為不同的時間段:1—10分鐘、10—20分鐘、20—30分鐘、30—40分鐘、40—50分鐘等。

基于此,通過上述系統(tǒng)模型的定義,可以將學(xué)生的動態(tài)和靜態(tài)屬性進(jìn)行結(jié)合為si·bi,例如,s1·bi描述了s1同學(xué)bi的行為特征,△b=s1·bi-s2·bi是兩位同學(xué)在行為bi上的差異。

系統(tǒng)模型給出一種學(xué)生畫像系統(tǒng)的基本結(jié)構(gòu),基于此結(jié)構(gòu)可以進(jìn)行數(shù)據(jù)的采集、收集、整理和分析,這是建立畫像系統(tǒng)的基礎(chǔ)工作。

四、學(xué)生畫像系統(tǒng)

本文構(gòu)建畫像系統(tǒng)的基本實(shí)現(xiàn)架構(gòu)(見圖1),該過程包括數(shù)據(jù)采集與數(shù)據(jù)處理,在此基礎(chǔ)上從三個方面(學(xué)習(xí)基礎(chǔ)、學(xué)習(xí)投入、學(xué)習(xí)效果)進(jìn)行學(xué)習(xí)者畫像的創(chuàng)建。

(一)英語學(xué)科的知識點(diǎn)分類

實(shí)訓(xùn)框架中所給出的英語知識點(diǎn)分類依據(jù)來源為:權(quán)威語法書籍和百度百科。其中,權(quán)威語法書籍包括《外研社英語語法大全》、商務(wù)印書館出版的《現(xiàn)代英語語法》,以及百度百科中的語法詞條。對信息進(jìn)行統(tǒng)計(jì)歸類,英語知識點(diǎn)主要包括詞法及句法。其中,詞法包括情態(tài)動詞:373,連詞:381,冠詞:397,動詞語態(tài):168,動詞時態(tài):344,副詞與形容詞:441等;句法包括虛擬語氣:107,祈使句:146,強(qiáng)調(diào)句:108,名詞性從句:172,句子成分:242,簡單句:194等,其前面為知識點(diǎn),后面數(shù)字為綜合大量試題后的各題型中所包含知識點(diǎn)數(shù)量的統(tǒng)計(jì)結(jié)果。題型涉及完形填空、閱讀理解、翻譯、作文等。將其進(jìn)行重點(diǎn)類型劃分,可得到不同題型中的知識點(diǎn)分類及相應(yīng)分值,如表1所示。

(二)實(shí)訓(xùn)內(nèi)容一:學(xué)生的知識基礎(chǔ)模型

對成績進(jìn)行不同區(qū)間分類,可以直觀辨別學(xué)生的知識基礎(chǔ)水平。已有一些工作通過樸素貝葉斯、邏輯回歸、隨機(jī)森林等方法來構(gòu)建分類模型。為了構(gòu)建典型的人工智能課程實(shí)訓(xùn)框架,本文選取決策樹方法對學(xué)習(xí)者的英語知識點(diǎn)基礎(chǔ)水平進(jìn)行分類,按照掌握程度可將知識點(diǎn)基礎(chǔ)水平分為一般(等級為C)、較好(等級為B)與優(yōu)秀(等級為A)三類,進(jìn)而對學(xué)習(xí)者的英語能力水平進(jìn)行細(xì)粒度描述。

在建立決策樹模型過程中,首先對學(xué)生上一學(xué)年的英語成績進(jìn)行整理,通過對成績進(jìn)行特征選取得到有效干凈的數(shù)據(jù)集。然后,排除數(shù)據(jù)中存在的異常值,剔除與目標(biāo)值無關(guān)或相關(guān)性較低的特征,提升數(shù)據(jù)挖掘的效率。過程中共收集5所市屬初中3782條英語成績數(shù)據(jù),在原始數(shù)據(jù)中存在著若干缺失值和異常值的情況,這些“噪聲”數(shù)據(jù)影響著學(xué)生分類及學(xué)生畫像的質(zhì)量,因此需要對數(shù)據(jù)進(jìn)行清理操作。

本文采用如下方法對數(shù)據(jù)進(jìn)行過濾:對缺失值較多的成績數(shù)據(jù)將其刪除,較多知識點(diǎn)成績?yōu)?的學(xué)生,成績采用均值處理則影響較大,可將其刪除;對缺失值較少的成績,數(shù)據(jù)通過計(jì)算平均值進(jìn)行填充。

各知識點(diǎn)得分量綱不同,如聽力滿分30分,單項(xiàng)選擇滿分20分,量綱不同會影響學(xué)生分類過程的精確程度,因此將數(shù)據(jù)按百分制進(jìn)行統(tǒng)一量綱的歸一化處理,再將成績進(jìn)行折算,分?jǐn)?shù)lt;80(標(biāo)記為C),80≤分?jǐn)?shù)lt;90(標(biāo)記為B),分?jǐn)?shù)≥90(標(biāo)記為A)。

由于某些知識點(diǎn)分?jǐn)?shù)與學(xué)生的入學(xué)水平相關(guān)性較低,該類知識點(diǎn)成績的引入降低了模型訓(xùn)練的速度,需要在對得分進(jìn)行歸一化后,依據(jù)特征的重要性進(jìn)行篩選。本文構(gòu)建的框架通過計(jì)算成績方差來進(jìn)行評估,將方差值接近或等于零的特征進(jìn)行剔除。同時,通過Python中提供的第三方開源庫sklearn,對各特征的權(quán)重值進(jìn)行計(jì)算。依據(jù)決策樹方法,某個特征在構(gòu)建決策樹過程中被使用次數(shù)越多,則其重要性越高,即通過計(jì)算成績樣本的信息增益來進(jìn)行評估,具體如下:

信息熵:Ent(D)=-log2公式1

信息增益:Gain(D,A)=Ent(D)-Ent(Di)公式2

信息熵是一種信息的度量方式,描述某個屬性區(qū)分?jǐn)?shù)據(jù)樣本的能力。簡而言之,在學(xué)生知識點(diǎn)畫像系統(tǒng)里描述了每個知識點(diǎn)的成績變化對整體成績的影響。該值越大,則該知識點(diǎn)對學(xué)生整體成績的影響越大,表明該特征(知識點(diǎn))對于畫像系統(tǒng)更為重要。

在上述公式中,D為樣本總數(shù)量(學(xué)生成績優(yōu)秀、較好、一般的總數(shù)),Dk為樣本中不同特征(知識點(diǎn))所得到的學(xué)生不同評估結(jié)果的數(shù)量(分別為取得優(yōu)秀、較好、一般的個數(shù))。在對數(shù)據(jù)清理后,得到3751名學(xué)生的成績,依據(jù)最終的分類進(jìn)行決策樹的構(gòu)建,獲得重要性的屬性值。

首先依據(jù)特征進(jìn)行計(jì)算,如特征為“單項(xiàng)選擇”時,可以得到三個子集:D1(單項(xiàng)選擇=詞匯運(yùn)用),D2(單項(xiàng)選擇=句型),D3(單項(xiàng)選擇=時態(tài))。在此基礎(chǔ)上分別計(jì)算不同子集中每個分類的值(概率)。其中,

Ent(D)=-∑K

k=1 log2=-( log2+log2+log2)=0.446

同時計(jì)算如下:

Ent(D1)=-(log2+log2+log2)=0.448

Ent(D2)=-(log2+log2+log2)=0.401

Ent(D3)=-(log2+log2+log2)=0.459

則得出特征為“單項(xiàng)選擇”的信息增益值為:

Gain(D,單項(xiàng)選擇)=Ent(D)-Ent(Di)

=0.446-(×0.448+×0.401+×0.459)

=0.446-(0.083+0.190+0.155)

=0.018

在得到不同特征的重要性分值后,同樣需要考慮時間因素,即時間投入對不同知識點(diǎn)所得分?jǐn)?shù)的影響。基于上述方法,分別得到成績重要性和時間重要性兩個指標(biāo)值。從中可知,影響學(xué)生分類結(jié)果的主要因素有:閱讀理解情況、聽力情況、作文情況等。在所有特征中,閱讀理解的成績重要性數(shù)值為0.790、時間重要性數(shù)值為0.681,而聽力在時間屬性上重要性數(shù)值最高(0.837)。據(jù)此可得出最大信息增益率是閱讀理解,選擇其為根節(jié)點(diǎn)不斷進(jìn)行屬性分裂,可得到用于對學(xué)習(xí)者知識點(diǎn)基礎(chǔ)水平進(jìn)行分類的決策樹模型。

(三)實(shí)訓(xùn)內(nèi)容二:學(xué)習(xí)的投入水平模型

學(xué)習(xí)投入水平模型是描述學(xué)習(xí)者針對學(xué)習(xí)的投入程度。為了避免“表面參與式學(xué)習(xí)”的現(xiàn)象,本文綜合考慮最終成績與學(xué)習(xí)投入兩方面因素來評估學(xué)習(xí)投入程度,并以網(wǎng)絡(luò)行為的若干屬性值作為主要評估依據(jù)。在實(shí)現(xiàn)過程中,通過網(wǎng)絡(luò)技術(shù)獲得相關(guān)數(shù)據(jù),具體包括如下屬性:UserID(登錄時間)、LIT(登錄時間)、LOT(退出時間)、CN(每頁瀏覽次數(shù))、TPP(每頁瀏覽時長)、LT(總時長),DC(學(xué)習(xí)資料的下載次數(shù))、HST(提交時間)、NHR(作業(yè)訂正次數(shù))。

首先,將時間數(shù)據(jù)進(jìn)行離散化處理,把登錄時間描述為0/1/2(表征上午/下午/晚上)。將頁面停留時間進(jìn)行離散化,標(biāo)注為[0,10],[10,20],...,[50,60],[60,+∞],單位為分鐘。再通過k-means方法對預(yù)處理后的數(shù)據(jù)進(jìn)行聚類。為了獲得最佳聚類參數(shù),本文通過輪廓系數(shù)來衡量簇的分散程度。輪廓系數(shù)是計(jì)算向量與簇內(nèi)部各點(diǎn)距離的均值,評估簇內(nèi)部的緊湊性,再計(jì)算與簇外部所有點(diǎn)的距離均值,其計(jì)算過程如下所示:

S(i)=公式3

其中,a(i)描述樣本點(diǎn)的內(nèi)聚度,b(i)描述樣本點(diǎn)的分離度,輪廓系數(shù)S的取值范圍為[-1,1],該值越大則聚類效果越好。實(shí)驗(yàn)中在Python下通過silhouette_ score()函數(shù)進(jìn)行處理,該函數(shù)能夠計(jì)算不同k參數(shù)聚類時的系數(shù)值。基于此,得到學(xué)習(xí)者學(xué)習(xí)投入行為的聚類結(jié)果(見圖2)。從中可以看出,k=3時,其輪廓系數(shù)值最大(0.687),此時聚類的效果最佳。進(jìn)一步將學(xué)習(xí)投入分類標(biāo)簽定義為淺度學(xué)習(xí)、適度學(xué)習(xí)、深度學(xué)習(xí)。在此基礎(chǔ)上,可得到學(xué)習(xí)者在不同學(xué)習(xí)投入程度下的最終學(xué)習(xí)效果。在對學(xué)習(xí)投入行為進(jìn)行聚類后,可得到各特征的聚類中心(見圖3),在此基礎(chǔ)上可對學(xué)生的學(xué)習(xí)投入程度進(jìn)行劃分。

(四) 實(shí)訓(xùn)內(nèi)容三:知識點(diǎn)的掌握模型

考試成績是對知識點(diǎn)掌握情況最直接的評價(jià)。學(xué)習(xí)時間也是另一個重要特征,當(dāng)成績越好并且投入的學(xué)習(xí)時間越短時,則該知識點(diǎn)的學(xué)習(xí)效果越好。基于此,在實(shí)驗(yàn)中將學(xué)習(xí)時長作為一種度量參數(shù),并通過公式4—7對學(xué)習(xí)效果進(jìn)行評價(jià):

學(xué)生學(xué)習(xí)效率:spsi=公式4

知識點(diǎn)分值:ρi=公式5

知識點(diǎn)權(quán)重:weight_ρi=ρi /ρi公式6

知識點(diǎn)整體分值:sps_totali=(spsi×weight_ρi)公式7

SPSi描述學(xué)生每分鐘所得成績的平方值,是學(xué)生知識點(diǎn)掌握水平的評估數(shù)據(jù),其中,si為學(xué)生該知識點(diǎn)所得分?jǐn)?shù),ti為該學(xué)生在該知識點(diǎn)上所用學(xué)習(xí)時間。αi為該知識點(diǎn)的重要性數(shù)值,βi為該知識點(diǎn)在所用時間屬性上的重要性數(shù)值。通過前面對各知識點(diǎn)進(jìn)行預(yù)測已經(jīng)得到各知識點(diǎn)特征的重要性權(quán)重值,以及時間重要性的權(quán)重值。在此基礎(chǔ)上可以得到每個知識點(diǎn)的權(quán)重值(見公式4、5)。基于此,可以得出每個學(xué)生在各知識點(diǎn)占整體模塊(如聽力、閱讀理解等多個知識點(diǎn))的權(quán)重值(見公式6),繼而得到每一個模塊的總體掌握水平(見公式7)。如某學(xué)生的“完形填空”模塊包含兩個知識點(diǎn),一是名詞單復(fù)數(shù)、代詞、形容詞,二是動詞時態(tài)。因此,需要分別計(jì)算上述兩個知識點(diǎn)的SPS值,再將其進(jìn)行累加得到模塊整體水平的SPS值。

(五) 實(shí)訓(xùn)內(nèi)容四:學(xué)習(xí)者畫像結(jié)果分析及可視化

英語知識點(diǎn)畫像系統(tǒng)的標(biāo)簽主要由知識基礎(chǔ)水平、學(xué)習(xí)投入水平、知識掌握水平三個維度組成。在實(shí)訓(xùn)內(nèi)容1中,通過決策樹分類方法建立入學(xué)水平模型;在內(nèi)容2中,通過K-means聚類方法得到學(xué)習(xí)投入水平模型;在內(nèi)容3中,通過線性加權(quán)等統(tǒng)計(jì)方法確定學(xué)生英語知識點(diǎn)的掌握水平模型。基于此,可得到學(xué)生英語知識點(diǎn)的畫像系統(tǒng)。

在實(shí)現(xiàn)中,對5所市屬初中學(xué)生的英語學(xué)習(xí)情況進(jìn)行收集,得到有效樣本3751份,樣本具有一定代表性。對英語知識點(diǎn)的掌握情況進(jìn)行分析,得到表2所示結(jié)果。其中,將英語分為五個考核類型:聽力、單項(xiàng)選擇、完形填空、閱讀理解、寫作。同時,劃分不同類型題中不同知識點(diǎn)類型。如針對閱讀理解中“理解短文主旨”知識點(diǎn)進(jìn)行分析,18.67%的學(xué)生為一般,21.90%的學(xué)生為較好,59.43%的學(xué)生為優(yōu)秀。經(jīng)過不同程度(淺度、適度、深度)的學(xué)習(xí)投入后,對學(xué)習(xí)效果進(jìn)行分類,61.20%的學(xué)生在知識點(diǎn)掌握程度的評價(jià)為優(yōu)秀,19.00%的學(xué)生評價(jià)為較好。

通過對五個考核類型的綜合評估,將3751份樣本分別標(biāo)注為淺度學(xué)習(xí)類型、適度學(xué)習(xí)類型和深度學(xué)習(xí)類型,具體分析如下:

淺度學(xué)習(xí)類型(8.57%):標(biāo)簽為淺度學(xué)習(xí)的有321人,該類型學(xué)習(xí)者線上學(xué)習(xí)的存在感較弱,表現(xiàn)為平均0.74次的視頻學(xué)習(xí)觀看次數(shù)。在每次作業(yè)布置后,平均1.78次的作業(yè)提交訂正提交次數(shù)(基本流程為:提交—批改—訂正—再提交)。

適度學(xué)習(xí)類型(65.35%):標(biāo)簽為適度學(xué)習(xí)的有2451人,該類學(xué)習(xí)者在線上學(xué)習(xí)的過程中存在感較為適中,對于每個學(xué)習(xí)視頻的觀看次數(shù)平均為1.076次。同時在每次作業(yè)布置后,提交作業(yè)的次數(shù)為1.34次,相較淺度學(xué)習(xí)的投入,適度學(xué)習(xí)的學(xué)生在觀看視頻時長上增長約15.7%。

深度學(xué)習(xí)類型(26.08%):標(biāo)簽為深度學(xué)習(xí)的有979人,該類學(xué)習(xí)者對于網(wǎng)絡(luò)學(xué)習(xí)的熱情最高,能夠更為主動地參與整體學(xué)習(xí)過程,對于學(xué)習(xí)視頻的觀看次數(shù)平均為1.32次。在布置作業(yè)后,提交作業(yè)平均為1.05次,相較淺度學(xué)習(xí)的投入,適度學(xué)習(xí)在觀看學(xué)習(xí)視頻時長上增長20.9%,相較適度投入,觀看視頻時長增加8.4%。

通過上述方法可以得到學(xué)習(xí)者的最終成績,并再次將其聚類分為三種標(biāo)簽:一般、較好、優(yōu)秀,最終得到整合后的學(xué)習(xí)者畫像整體標(biāo)簽值,如表3所示。

(六)實(shí)訓(xùn)內(nèi)容五:機(jī)器學(xué)習(xí)方法的性能分析

性能分析也是人工智能系統(tǒng)開發(fā)過程的重要部分。為了評估性能,本文將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。基于訓(xùn)練集分別構(gòu)建決策樹、隨機(jī)森林、樸素貝葉斯等分類模型,同時采用十折交叉驗(yàn)證方法計(jì)算相關(guān)評估指標(biāo)(見圖4)。其中,決策樹的分類器生成方法在本文場景下效果相對較優(yōu),其精確率、召回率和F1值分別達(dá)0.8712、0.8855和0.8832。相比于決策樹算法,梯度提升集成學(xué)習(xí)算法可以有效提高模型的預(yù)測效果,但在測試過程中易產(chǎn)生泛化能力不強(qiáng)等問題。極端隨機(jī)樹和樸素貝葉斯算法整體性能較差。隨機(jī)森林和邏輯回歸方法均有不同程度的指標(biāo)上升,F(xiàn)1值可提升1.8個百分點(diǎn)。而對于算法整體而言,本文所給方法能夠獲得更優(yōu)的性能,其F1值為88.32%。

五、總結(jié)

為了解決人工智能課程中基礎(chǔ)算法學(xué)習(xí)過程相對枯燥、難于理解等問題,本文構(gòu)建了一種面向英語學(xué)科知識點(diǎn)的畫像系統(tǒng)實(shí)訓(xùn)框架。通過有監(jiān)督的分類、線性統(tǒng)計(jì)分析、無監(jiān)督的聚類方法等建立畫像標(biāo)簽,并給出畫像的可視化展示。本文的主要貢獻(xiàn)在于針對英語學(xué)科知識點(diǎn)的學(xué)生畫像系統(tǒng)進(jìn)行具體實(shí)現(xiàn),給出多維度畫像標(biāo)簽的生成方法。同時,結(jié)合幾所初中學(xué)校教學(xué)數(shù)據(jù)進(jìn)行實(shí)例佐證。經(jīng)過近兩年的教學(xué)實(shí)踐表明,實(shí)訓(xùn)內(nèi)容設(shè)置能夠讓學(xué)生直觀地了解機(jī)器學(xué)習(xí)基礎(chǔ)算法的特性,幫助學(xué)生深入理解和掌握相關(guān)理論知識。

本文所提出的實(shí)訓(xùn)框架在樣本多樣性、數(shù)據(jù)量、框架復(fù)雜性方面仍存不足,未來計(jì)劃通過更多渠道收集不同區(qū)域、不同學(xué)校的學(xué)生信息數(shù)據(jù),豐富數(shù)據(jù)量的同時強(qiáng)化算法,進(jìn)一步提升系統(tǒng)的正確率,積極拓展畫像系統(tǒng)在不同行業(yè)上的應(yīng)用。

參考文獻(xiàn):

[1]李康熙,孔夢婷,孫冬云.智慧教學(xué)環(huán)境下的英語學(xué)習(xí)者畫像研究[J].中國教育信息化,2023(8):84-93.

[2]王若佳,嚴(yán)承希,郭鳳英,等.基于用戶畫像的在線健康社區(qū)用戶流失預(yù)測研究[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2022,6(Z1):80-92.

[3]張紫徽,林子涵,廖會心,等.面向?qū)W習(xí)成功的非認(rèn)知能力學(xué)生畫像可視化[J].現(xiàn)代教育技術(shù),2021,31(12):94-102.

[4]武慧娟,趙天慧,孫鴻飛,等.基于支付意愿的數(shù)字閱讀用戶畫像聚類研究[J].情報(bào)科學(xué),2022,40(5):118-127,136.

[5]王柏琦,付立軍,周曉磊,等.新高考志愿推薦算法研究[J].中國教育信息化,2023(4):112-120.

[6]張莉,盧星凝,陸從林,等.支持向量機(jī)在高考成績預(yù)測分析中的應(yīng)用[J].中國科學(xué)技術(shù)大學(xué)學(xué)報(bào),2017,47(1):1-9.

[7]田鈺.基于多元特征感知網(wǎng)絡(luò)的高考成績預(yù)測[J].計(jì)算機(jī)集成制造系統(tǒng),2021,27(9):2741-2748.

[8]翟鳴宇,程建,王蘇桐,等.基于K-prototype聚類的學(xué)生教育畫像分析[J].大連理工大學(xué)學(xué)報(bào)(社會科學(xué)版),2021,42(6):22-31.

[9]凌玉龍,張曉,李霞,等.改進(jìn)kmeans算法在學(xué)生消費(fèi)畫像中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展, 2021,31(10):122-127.

[10]張雪,檀悅穎,羅恒.在線學(xué)習(xí)非母語學(xué)習(xí)者群體研究:類別畫像與行為特征分析[J].現(xiàn)代遠(yuǎn)距離教育,2019(1):18-26.

Case Study on the Teaching of Artificial Intelligence Basic Algorithm Training Course

Jing XI

(Suzhou Academy of Educational Sciences, Suzhou 215123, Jiangsu)

Abstract: In order to solve the problems of disjointed and poorly coherent experimental content of multiple core algorithms in existing artificial intelligence courses, this paper designs an experimental teaching case of an English knowledge profiling system that integrates multiple basic algorithms. The case, based on several valuable data existing in the education field (such as training process data, learning performance data, etc.), takes the English subject as the breakthrough point, starting from the three perspectives of “basic knowledge level-learning engagement level-knowledge mastery level”, using decision tree classification, K-means clustering and other methods to generate multi-properties labels, and comparing the performance of the algorithms. The training framework integrates multiple machine learning algorithms to generate profiling systems, forming a comprehensive training teaching case covering “system design-coding-analysis-display”. Several rounds of teaching practice have shown that introducing projects throughout the experimental process can, to some extent, enhance students’ innovative practical ability and comprehensive application ability.

Keywords: Profiling system; Artificial Intelligence; Decision tree; Junior middle school English teaching; Teaching cases

編輯:李曉萍" "校對:王天鵬

猜你喜歡
教學(xué)案例人工智能
我校新增“人工智能”本科專業(yè)
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
教學(xué)案例的內(nèi)涵及其應(yīng)用意義
充分整合教材資源 優(yōu)化歷史課堂教學(xué)
小學(xué)數(shù)學(xué)課堂導(dǎo)入技巧及案例分析
考試周刊(2016年88期)2016-11-24 13:49:44
反轉(zhuǎn)課堂模式與數(shù)學(xué)教學(xué)案例
促進(jìn)初中化學(xué)定量觀建構(gòu)的教學(xué)案例
小學(xué)數(shù)學(xué)“反思型” 教學(xué)的探索與實(shí)踐
考試周刊(2016年76期)2016-10-09 09:08:16
主站蜘蛛池模板: 国产成人调教在线视频| 国产一级毛片高清完整视频版| 亚洲中文字幕av无码区| 老色鬼欧美精品| 婷婷激情亚洲| 欧美色伊人| 国产区在线看| 一本大道香蕉久中文在线播放 | 一级爱做片免费观看久久| 久久久久亚洲av成人网人人软件| 午夜精品一区二区蜜桃| 亚洲精品图区| 爆操波多野结衣| 中文字幕欧美日韩高清| 亚洲视频在线青青| 四虎影视国产精品| 国产二级毛片| 精品视频一区二区观看| 国产成人成人一区二区| 国产无码高清视频不卡| 精品久久久久成人码免费动漫| 国产午夜一级毛片| 无码电影在线观看| 国产精品一线天| 亚洲精品在线观看91| 97视频精品全国在线观看| 成人在线天堂| 天堂岛国av无码免费无禁网站| 8090午夜无码专区| 无码内射在线| 国产成人精品男人的天堂下载| 999国产精品永久免费视频精品久久| 久久久成年黄色视频| 香蕉蕉亚亚洲aav综合| 色噜噜在线观看| 少妇精品久久久一区二区三区| 欧美a级完整在线观看| 福利在线不卡| 欧美日韩在线亚洲国产人| 久久免费视频6| 亚洲AV成人一区国产精品| 日韩毛片免费| 99中文字幕亚洲一区二区| 国产无吗一区二区三区在线欢| 亚洲黄色视频在线观看一区| 国产免费精彩视频| 国产激爽大片在线播放| 国产福利在线免费| 天堂在线www网亚洲| AV在线天堂进入| 看你懂的巨臀中文字幕一区二区| 国产超碰在线观看| 亚洲一区二区三区国产精华液| 第一区免费在线观看| 凹凸国产分类在线观看| 亚洲人精品亚洲人成在线| 青青草原偷拍视频| 美女一级毛片无遮挡内谢| 欧美天堂久久| 狼友av永久网站免费观看| 看国产一级毛片| 暴力调教一区二区三区| 18禁黄无遮挡免费动漫网站| 国产精彩视频在线观看| 凹凸国产熟女精品视频| 国产精品爽爽va在线无码观看| 国产大片喷水在线在线视频| 亚洲精品大秀视频| 99免费在线观看视频| 日韩av无码精品专区| 午夜少妇精品视频小电影| 国产精品亚洲片在线va| 狠狠干欧美| 国产福利免费在线观看| 精品剧情v国产在线观看| 欧美第九页| 久久久波多野结衣av一区二区| 国产精品自在拍首页视频8| 国产无人区一区二区三区| 人禽伦免费交视频网页播放| 免费看美女毛片| 成人午夜视频网站|