999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘技術(shù)在學(xué)生成績管理系統(tǒng)中的應(yīng)用

2012-10-13 14:31:02郭慧
關(guān)鍵詞:數(shù)據(jù)挖掘作業(yè)分析

郭慧

(山西華澳商貿(mào)職業(yè)學(xué)院,山西 太原 030031)

數(shù)據(jù)挖掘技術(shù)在學(xué)生成績管理系統(tǒng)中的應(yīng)用

郭慧

(山西華澳商貿(mào)職業(yè)學(xué)院,山西 太原 030031)

將數(shù)據(jù)挖掘技術(shù)引入到學(xué)生成績管理系統(tǒng)中,能夠?qū)逃龥Q策和教學(xué)評價提供強(qiáng)大的理論支持,提高教師“教”和學(xué)生“學(xué)”的質(zhì)量。論文以學(xué)生成績分析表為數(shù)據(jù)集建立挖掘模型,使用決策樹ID3算法完成構(gòu)建模型,并對模型的準(zhǔn)確性進(jìn)行了必要的評估。通過分析,得到相關(guān)屬性與學(xué)生成績之間的關(guān)系,并從中挖掘出學(xué)生成績的好壞與哪些因素有關(guān)、它們之間存在怎樣的關(guān)系等。

成績管理;數(shù)據(jù)挖掘;決策樹;ID3

作為決策支持過程的最新技術(shù),數(shù)據(jù)挖掘能夠深層次地對數(shù)據(jù)進(jìn)行挖掘和分析,其無疑會對教學(xué)決策和教學(xué)評價提供強(qiáng)大的理論支持。在學(xué)生成績管理系統(tǒng)中,數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以深入分析學(xué)生成績與各因素之間潛在的關(guān)聯(lián)。譬如,經(jīng)過對學(xué)生成績的相關(guān)分析,數(shù)據(jù)挖掘技術(shù)可以解決諸如“學(xué)生成績的好壞與哪些因素有關(guān)”、“它們之間又是怎樣的關(guān)系”的問題,其評價結(jié)果對于教與學(xué)的改進(jìn)及提高意義重大。

在傳統(tǒng)的教學(xué)過程中,習(xí)慣采用數(shù)據(jù)庫查詢的方法實(shí)現(xiàn)對數(shù)據(jù)信息的處理。筆者將采用數(shù)據(jù)挖掘技術(shù)中的ID3算法實(shí)現(xiàn)對數(shù)據(jù)的處理,并形成分類規(guī)則,從而更深入地分析此數(shù)據(jù)。

一、數(shù)據(jù)挖掘的流程

(1)明確挖掘?qū)ο蠹澳繕?biāo):定義好要解決的問題。此處以山西華澳商貿(mào)職業(yè)學(xué)院計(jì)算機(jī)2009級軟件班學(xué)生,共有60名學(xué)生、12門課程、三個學(xué)期為例,希望根據(jù)學(xué)生的考試成績,分析出學(xué)生成績的好壞與哪些因素有關(guān),并以此所得結(jié)果來指導(dǎo)并促進(jìn)教師“教”和學(xué)生“學(xué)”。

(2)數(shù)據(jù)準(zhǔn)備:從學(xué)生成績管理系統(tǒng)的數(shù)據(jù)庫中提取相應(yīng)的數(shù)據(jù),并進(jìn)行預(yù)處理,如去除噪聲、對丟失數(shù)據(jù)進(jìn)行填補(bǔ)及刪除無效數(shù)據(jù)等。

(3)數(shù)據(jù)挖掘:數(shù)據(jù)經(jīng)過預(yù)處理后,根據(jù)數(shù)據(jù)功能的類型和特點(diǎn)選擇相應(yīng)的算法對其進(jìn)行數(shù)據(jù)挖掘。

(4)結(jié)果分析:對挖掘的結(jié)果要進(jìn)行必要的解釋和評價,使其轉(zhuǎn)換為易于用戶理解的知識。

(5)知識運(yùn)用:教師可以將分析所得知識運(yùn)用到教學(xué)環(huán)節(jié)中,如進(jìn)行教學(xué)決策,從而達(dá)到教學(xué)指導(dǎo)的目的。

二、數(shù)據(jù)倉庫的建立

基于本數(shù)據(jù)挖掘的目標(biāo)是分析學(xué)生成績的好壞與哪些因互素有關(guān),而學(xué)生成績管理系統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)必然存在大量的冗余問題,此處必須對庫的信息進(jìn)行提取以便形成相關(guān)數(shù)據(jù)表。之后,還必須對數(shù)據(jù)進(jìn)行相關(guān)性操作。

(1)數(shù)據(jù)集成

數(shù)據(jù)集成決不是簡單的數(shù)據(jù)合成,而是在原始數(shù)據(jù)的基礎(chǔ)上經(jīng)過轉(zhuǎn)換、提煉,形成規(guī)范化的、統(tǒng)一的、可挖掘的數(shù)據(jù)。此處針對數(shù)據(jù)庫技術(shù),將收集到的相關(guān)數(shù)據(jù)庫文件進(jìn)行利用SQL語句實(shí)現(xiàn)表的連接操作,從而生成“成績分析”表,其數(shù)據(jù)結(jié)構(gòu)為:學(xué)號、姓名、性別、作業(yè)、參加活動、平均成績等。由于針對的是專業(yè)能力基本信息收集,一些無關(guān)屬性應(yīng)被剔除,如學(xué)生的出生日期、家庭住址等。集成后的數(shù)據(jù)如下:

表1 學(xué)生成績集成后數(shù)據(jù)表

(2)數(shù)據(jù)清理

由于數(shù)據(jù)倉庫中的數(shù)據(jù)是面向某一主題的,數(shù)據(jù)可能從幾個表中抽取出來,數(shù)據(jù)庫中的數(shù)據(jù)類型不同,必然出現(xiàn)一些數(shù)據(jù)不完整、數(shù)據(jù)錯誤、數(shù)據(jù)重復(fù)等各種問題。

在該課題中,學(xué)生成績數(shù)據(jù)庫中的數(shù)據(jù)都非常重要,且是經(jīng)過多次復(fù)查才得到的,所以錯誤數(shù)據(jù)和不一不致性一般不會存在。但是,可能會出現(xiàn)另外的情況。比如,有的學(xué)生有些課程缺考或休學(xué),需要對數(shù)據(jù)進(jìn)行置“0”的處理。且這些數(shù)據(jù)對成績的分析是無意義的,故可以剔除,以免影響分析結(jié)果。

(3)數(shù)據(jù)歸約

數(shù)據(jù)歸約,其目的是縮小數(shù)據(jù)規(guī)模。經(jīng)過數(shù)據(jù)預(yù)處理后,根據(jù)聚類評價模型,把每個學(xué)生劃分到相應(yīng)的簇中,對學(xué)生形成定性的評價,再根據(jù)數(shù)據(jù)轉(zhuǎn)化規(guī)則,得到如表2的數(shù)據(jù):

分析如下:

①學(xué)生記錄共60個;

②性別字段為男或女;

③對“作業(yè)”提交情況進(jìn)行離散化處理,結(jié)果為:0表示經(jīng)常不交作業(yè);1表示偶爾不交;2表示全交;

④對“參加活動”情況進(jìn)行離散化處理,結(jié)果為:0表示不參加活動;1表示偶爾參加;2表示經(jīng)常參加活動。

表2 學(xué)生成績歸約后數(shù)據(jù)表

三、模型的實(shí)現(xiàn)

為了尋找學(xué)生學(xué)習(xí)成績的好壞和哪些因素有關(guān)、它們之間又存在怎樣的關(guān)系,論文基于決策樹算法建立數(shù)據(jù)模型,首先對學(xué)生成績數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行處理,然后應(yīng)用決策樹算法建立相應(yīng)的決策樹,并通過分析,得到相關(guān)屬性與學(xué)生成績之間的關(guān)系。

論文以學(xué)生成績分析表為數(shù)據(jù)集建立挖掘模型,使用決策樹算法中經(jīng)典的ID3算法完成構(gòu)建模型,具體過程如下:

首先,對成績分析表中的各屬性計(jì)算其信息熵;其次,把計(jì)算得到的信息增益最大的屬性作為決策樹根結(jié)點(diǎn),再進(jìn)行數(shù)據(jù)子集劃分;

最后,劃分得到的每個子集遞歸進(jìn)行,直到所有屬性都劃分完為止。

根據(jù)上述步驟,詳細(xì)過程如下:

(1)根據(jù)定義的信息熵,計(jì)算分類屬性的信息量

以上的訓(xùn)練集中,共有60個樣本。經(jīng)過聚類后,得到的簇是“優(yōu)”的樣本有12個,“良”的有16個,“中”的有17個,“差”的有15個。為計(jì)算每個屬性的信息增益,首先給定樣本分類所需的信息熵:

根據(jù)信息熵計(jì)算公式得到:I(s1,s2,s3,s4)=I(12,16, 17,15)=1.988394308

(2)依次計(jì)算每個屬性的信息熵

例如:計(jì)算“性別”屬性,該屬性有兩個值,需要對每個值所劃分的子集計(jì)算信息量。

對于“性別”=“男”和“性別”=“女”而言,樣本分布如表:

表3 “性別”=“男”的樣本分布表

根據(jù)公式得每個屬性的信息熵計(jì)算得到:

E(性別)=48/60×I(24,13,11)+12/60×I(7,2,3)=1.474880232

表4 “性別”=“女”的樣本分布表

E(作業(yè)情況)=31/60×I(12,12,6,1)+15/60×I(0,3,9,3) +14/60×I(0,1,2,11)=1.39741438

E(參加活動)=19/60×I(5,5,2,7)+21/60×I(5,6,8,2) +20/60×I(2,5,7,6)=1.87711283

根據(jù)公式Gain(A)=Info(D)-InfoA(D),計(jì)算得到:

Gain(性別)=I(s1,s2,s3,s4)-E(性別)=1.39741438

Gain(作業(yè)情況)=I(s1,s2,s3,s4)-E(作業(yè)情況) =0.590979928

Gain(參加活動)=I(s1,s2,s3,s4)-E(參加活動) =0.111281478

根據(jù)以上各屬性的信息增益,選擇信息增益最大的屬性作為根結(jié)點(diǎn),即將“作業(yè)”屬性的信息增益最大,故以作業(yè)決策樹的根結(jié)點(diǎn),并且根據(jù)該屬性的三個值分為三支,如下:

圖1 初生成的決策樹

遞歸上述過程,計(jì)算出性別、參加活動屬性的信息增益,經(jīng)過計(jì)算,“參加活動”的信息增益最大,將它作為“作業(yè)”的子節(jié)點(diǎn),引出三個分支,再遞歸。

經(jīng)過剪枝等處理后,最終生成的決策樹為:

圖2 最終生成的決策樹

根據(jù)以上決策樹,通過分析,得到如下結(jié)論:

①經(jīng)常不交作業(yè)的學(xué)生成績往往不好。

②性別不能決定學(xué)習(xí)成績的好壞。

③學(xué)生的學(xué)習(xí)成績和參加活動是可以相互促進(jìn)的,如果學(xué)生能很好地調(diào)控二者的時間,完全可以相互促進(jìn)。

四、模型準(zhǔn)確性評估

通過研究與測試數(shù)據(jù)分析,確定以上模型的準(zhǔn)確率閾值為85%。將預(yù)測集數(shù)據(jù)利用決策樹模型驗(yàn)證結(jié)果與實(shí)際學(xué)生學(xué)習(xí)成績的情況相比較,并與相關(guān)的教師進(jìn)行論證,確認(rèn)本模型的準(zhǔn)確率為90%,超過預(yù)定的準(zhǔn)確率閾值,能夠反映學(xué)生成績與影響因素的關(guān)系。

其結(jié)論為:學(xué)生成績的好壞與學(xué)生作業(yè)的完成情況及學(xué)生是否能合理分配參加活動時間有關(guān)。因此,教師在教學(xué)中要合理引導(dǎo)學(xué)生安排活動與學(xué)習(xí)時間,并及時督促學(xué)生及時完成作業(yè),學(xué)生也應(yīng)學(xué)會自我調(diào)控,提高學(xué)習(xí)效率。

[1]韓家煒.?dāng)?shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2007.

[2]漢德.?dāng)?shù)據(jù)挖掘原理[M].北京:機(jī)械工業(yè)出版社,2003,1-2.4.

TN

A

1673-0046(2012)5-0180-02

猜你喜歡
數(shù)據(jù)挖掘作業(yè)分析
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
隱蔽失效適航要求符合性驗(yàn)證分析
快來寫作業(yè)
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統(tǒng)及其自動化發(fā)展趨勢分析
作業(yè)
故事大王(2016年7期)2016-09-22 17:30:08
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究
我想要自由
主站蜘蛛池模板: 亚洲高清在线天堂精品| 欧美天天干| 最新亚洲人成无码网站欣赏网 | 欧美特黄一免在线观看| 在线观看av永久| 国产成人精品男人的天堂| 色婷婷亚洲十月十月色天| 女人18毛片久久| lhav亚洲精品| 国产一级毛片yw| 天天爽免费视频| 亚洲精品无码AV电影在线播放| 欧美三級片黃色三級片黃色1| 美女裸体18禁网站| 欧美另类精品一区二区三区| 特级精品毛片免费观看| 毛片大全免费观看| 国产拍在线| 77777亚洲午夜久久多人| 国产精品三区四区| 成人免费视频一区二区三区| 国产欧美日韩资源在线观看| 欧美曰批视频免费播放免费| 中文字幕日韩欧美| 国产成人1024精品| 国产视频a| 久久久精品国产SM调教网站| 宅男噜噜噜66国产在线观看| 亚洲精品动漫在线观看| 欧美一区精品| 99热这里只有精品国产99| 免费无码AV片在线观看国产| 欧美日韩高清在线| 亚洲人成日本在线观看| 欧美日本中文| 中国黄色一级视频| 婷婷色中文网| 欧美日韩高清| 日本一区二区三区精品国产| 亚洲成年人片| 欧美亚洲欧美| 国产91色| 亚洲第一黄片大全| 午夜福利免费视频| 国模极品一区二区三区| 极品av一区二区| 国产成人午夜福利免费无码r| 99re视频在线| 青青草原偷拍视频| www.av男人.com| 久久精品这里只有精99品| 欧美日韩导航| 亚洲色图欧美视频| 国产91丝袜在线播放动漫| 精品偷拍一区二区| 国产精品爽爽va在线无码观看| 国产精品主播| 亚洲国产综合精品一区| 999精品免费视频| 99视频全部免费| av一区二区无码在线| 欧美精品黑人粗大| 青青草国产在线视频| 中国成人在线视频| AV片亚洲国产男人的天堂| 亚洲视频色图| 国产美女无遮挡免费视频| 最新国产你懂的在线网址| 久久毛片免费基地| 国产九九精品视频| 国产精品漂亮美女在线观看| 成人福利在线免费观看| 午夜三级在线| 国产自在线播放| 天堂网亚洲系列亚洲系列| 香蕉久久国产超碰青草| 久久五月天综合| 99偷拍视频精品一区二区| 四虎亚洲精品| 中文字幕免费在线视频| 国产亚洲欧美日韩在线一区| 天堂在线亚洲|