999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯規則Apriori算法的學生成績分析

2018-01-24 21:27:22王成勇
價值工程 2018年5期
關鍵詞:數據挖掘

王成勇

摘要:關聯規則挖掘是數據挖掘領域研究的熱點問題,其中Apriori算法是經典的關聯規則算法。將關聯規則Apriori算法應用到學生成績分析中,挖掘出課程與課程之間的相互關系,尋找各方面影響學生成績的因素,發現隱藏在數據背后有價值的信息,從而為學生選課和教師教學以及教學管理工作等提供輔助性的建議與決策。

Abstract: Association rule mining is a hot topic in the field of data mining. Apriori algorithm is a classical association rule algorithm. This paper applies the association rule apriori algorithm to analyze student achievement data, digs out the relationship between the course and the curriculum, finds out the factors that affect the student achievement in all aspects, and finds the hidden information behind the data, so as to provide supplementary advice and decision-making for student course selection, teacher teaching and teaching management.

關鍵詞:學生成績分析;數據挖掘;關聯規則技術;Apriori算法

Key words: student achievement analysis;data mining;association rule technique;Apriori algorithm

中圖分類號:TP311.1 文獻標識碼:A 文章編號:1006-4311(2018)05-0171-03

0 引言

近年來隨著信息技術的飛速發展,數據資源變得越來越豐富,在高校的教學管理系統中存儲了大量的學生成績數據信息,但由于缺乏必要的技術手段,因此只能對這些數據信息進行簡單的統計、備份和查詢。隱藏在這些大量成績數據背后的信息不能得到有效的利用,不利于人才的培養和教學質量的提高,因而迫切需要有更新的技術方法對這些數據進行處理分析。

關聯規則挖掘[1-2]就是一門從歷史數據集中發現隱含模式,從海量數據集中發現潛在的有價值信息的技術方法,它反映了一個事件與其他事件直接依賴或關聯的知識,這幾年已經成為數據挖掘技術研究領域的熱門話題[3]。本文運用關聯規則Apriori算法挖掘學生成績數據,可以挖掘出課程與課程之間的相互關系、影響學生成績的因素等一些有價值的信息,這些信息可為教學及管理工作提供支持性的建議,同時也為更加合理的制定人才培養方案和提高教育教學質量提供科學依據。

1 關聯規則基本理論

2 關聯規則挖掘算法

2.1 尋找頻繁項目集

在對學生成績數據進行關聯規則分析時,這里采用了Apriori算法來尋找全部的頻繁項目集。Apriori算法是一種重要的關聯規則挖掘算法,它使用了一種被稱為逐層搜索的迭代算法,k-項集用于搜索(k+1)-項集。首先需要掃描事物數據庫,累積每個項的計數,然后收集滿足最小支持度的項,從而找出頻繁1-項目集的集合L1。L1用于尋找頻繁2-項目集的集合L2,而L2用于尋找頻繁3-項目集的集合L3,如此下去,直至不能找到頻繁k-項目集Lk為止[4]。

運用頻繁k-項集用于搜索(k+1)-項集是Apriori算法的核心,該步驟分為連接步和剪枝步:

①連接步驟:為了尋找Lk,在k(k>1)次掃描數據庫時,通過Lk-1與自身連接產生候選k-項集的集合Ck。

②剪枝步驟:由于Ck是Lk的超集,即Ck的成員可能是也可能不是頻繁的。需要掃描全部的事務數據庫,確定Ck中每個候選的計數,判斷是否大于或者等于最小支持度計數,如果是,那么便認為該候選是頻繁的。為了壓縮Ck,可以運用Apriori性質:任何一個頻繁項集的全部非空子集也一定是頻繁的,若某個候選的非空子集不是頻繁的,那么該候選項集肯定也不是頻繁的,從而可以將其從Ck中刪去。

Apriori算法描述如下[5-6]:

輸入:數據庫D;最小支持度min_Support

輸出:D中的頻繁項目集L

方法:

L1=find_frequent_1-itemsets(D);;

for(k=2;Lk-1≠Φ;k++){

Ck=apriori_gen(Lk-1,min_Support)

for each transaction t∈D{

Ct=subset(Ck,t);

for each candidate c∈Ct

c.count++;

}

Lk={c∈Ck|c.count?叟min_Support}

}

return L=UkLk

2.2 生成強關聯規則

對于上面得到的每個頻繁項目集L,生成強關聯規則的步驟如下:

①生成L的所有非空子集;

②對于L的每個非空子集S,令R=L-S。

如果有

?叟Min_Confidence

即S?圯R滿足最小置信度閾值,那么輸出關聯規則S?圯R。又因為這個規則是從頻繁項目集L中生成的,因此一定滿足最小支持度閾值,所以這個規則為強關聯規則。根據上面的兩個步驟,就可以得出事物數據庫D的全部強關聯規則。endprint

3 應用Apriori算法分析學生成績

3.1 挖掘目標與流程

關聯規則挖掘必須具有針對性,也就是說挖掘目標要明確,本文希望通過對學生成績數據信息進行研究,找到滿足最小支持度和最小置信度的強關聯規則,挖掘出課程與課程之間的相互關系,并期望以此結果來指導教育教學工作。其中關聯規則挖掘的具體過程如圖1所示。

3.2 數據采集

關聯規則挖掘需要豐富的數據信息作為基礎。本研究選取學生成績數據庫中8門專業課程作為研究對象,選取1000條數據,用以挖掘課程之間的關聯性。學生成績信息數據如表1所示。其中Xuehao為學號,A~H分別代表8門課程。

3.3 數據的處理

通過對原始數據進行簡單的泛化處理,可以得到更加豐富的數據信息[7-8]。在這部分將對成績數據進行離散化,成績達到90分及以上的代表“優秀”、成績在80分(包括80分)到90分之間的代表“良好”、成績在70分(包括70分)到80分之間的代表“中等”、成績在60分(包括60分)到70分之間的代表“及格”、成績在60分以下的代表“不及格”,其中“優秀、良好、中等、及格、不及格”分別用數字“1、2、3、4、5”表示,離散化后的數據如表2所示。

3.4 挖掘關聯規則

這一步的關鍵是選擇恰當的關聯規則挖掘算法對數據進行分析處理。這里采用關聯規則Apriori算法對離散化后的學生成績數據信息進行挖掘。設定最小支持度為25%、最小置信度為60%。運行關聯規則Apriori算法程序后,得到的部分實驗結果如表3所示。

3.5 結果分析

對于挖掘得到的強關聯規則,需要對結果進行分析。根據表3可知,規則1和2說明了學好B課程對于學好G課程有著重要的影響,在安排課程的時候,要將B課程排在前面,同時教師在教學過程中要督促學生學好B課程。

規則3說明如果A課程和C課程學的好,那么F課程也就學的好一些。從規則3的置信度來分析,其置信度為87%,說明A、C課程與F課程的關聯程度比較強。在課程的設置方面,A、C課程需要排在F課程的前面。

規則4和5說明了D、E、H三門課程關聯比較緊密,并且D課程是最關鍵的,教師在講解時要仔細講解,讓學生打好基礎。從表3中還可以得出,這三門課程的開課順序應該為D、H、E,同時盡量要將課程安排在連續的三個學期。其它規則的分析方法也是如此,決策者可以根據具體的實際情況借鑒參考。

4 結論

關聯規則挖掘技術是一種非常有用的技術工具,可以廣泛的應用于教學管理過程中,它能夠挖掘出學生各門課程成績之間的影響程度,找到教學中各方面影響學生學習成績的因素,發現隱藏在成績背后的潛在規律,幫助我們更好地了解課程的設置順序以及課時安排是否科學合理,從而為提高學校的教學管理和人才培養質量起到積極的促進作用。

參考文獻:

[1]梁循.數據挖掘算法與應用[M].北京大學出版社,2006.

[2]Liu J, Liu B, Liu J. Association Rule Mining Algorithm Based On Fuzzy Association Rules Lattice and Apriori[J]. Journal of Convergence Information Technology, 2013, 8(8):399-406.

[3]Chen W, JiaNan. Teaching analysis based on association rule mining[C]// Conference Anthology, IEEE. IEEE, 2013:1-3.

[4]韓天鵬.關聯規則挖掘算法研究及其應用[D].中南民族大學,2008.

[5]Cheng M, Xu K, Gong X. Research on audit log association rule mining based on improved Apriori algorithm[C]// IEEE International Conference on Big Data Analysis. IEEE, 2016:1-7.

[6]Yang Q. The Application of Apriori Algorithm in the Analysis of Excel Skill Test Results[J]. Guide of Science & Education, 2013.

[7]李忠嘩,王鳳利,何丕廉,等.關聯規則挖掘在課程相關分析中的應用[J].河北農業大學學報,2010,33(3):116-119.

[8]黃秋勇.基于關聯規則挖掘的課程設置合理性分析[J].智能計算機與應用,2010(5):57-59.endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 成人免费午夜视频| 国产欧美日韩视频一区二区三区| 国产Av无码精品色午夜| 国产又粗又猛又爽视频| 丰满少妇αⅴ无码区| 国产 在线视频无码| 国产成人综合亚洲网址| 欧美α片免费观看| 最新亚洲av女人的天堂| 真人高潮娇喘嗯啊在线观看| 国产成人精品视频一区二区电影 | 国产制服丝袜无码视频| 国产草草影院18成年视频| 国产美女91视频| 亚洲日韩国产精品无码专区| 亚洲资源站av无码网址| 麻豆AV网站免费进入| 三区在线视频| 国产aaaaa一级毛片| 日本手机在线视频| 亚洲最大福利视频网| 欧美激情首页| 老熟妇喷水一区二区三区| 亚洲啪啪网| 中文字幕天无码久久精品视频免费| 一级毛片视频免费| 无码综合天天久久综合网| 欧美日韩中文字幕在线| 欧美午夜视频在线| 亚洲婷婷在线视频| 国产一区二区三区精品欧美日韩| 午夜一级做a爰片久久毛片| 国产二级毛片| 一级毛片中文字幕 | 国产欧美在线观看一区| 久久久亚洲色| 国产成人精品一区二区| 欧美视频免费一区二区三区| 亚洲一区网站| 免费人成视网站在线不卡| 91年精品国产福利线观看久久 | 国产乱人伦AV在线A| 国产精品尤物铁牛tv| jijzzizz老师出水喷水喷出| 精品偷拍一区二区| 国产成人啪视频一区二区三区| 亚洲综合中文字幕国产精品欧美| 欧美笫一页| 精品夜恋影院亚洲欧洲| 青草娱乐极品免费视频| 一级在线毛片| 1级黄色毛片| 91丨九色丨首页在线播放| 97久久免费视频| 国产成人综合网在线观看| 国产精品林美惠子在线播放| 国产男人的天堂| 亚洲精品国偷自产在线91正片| 欧美一区二区啪啪| 热思思久久免费视频| 欧美成人看片一区二区三区 | 在线亚洲精品福利网址导航| 色哟哟色院91精品网站| 国产精品欧美激情| 中文成人无码国产亚洲| 一级毛片在线播放| 欧美一级夜夜爽| 国产99视频精品免费观看9e| 国产精品冒白浆免费视频| 国产精品久久国产精麻豆99网站| 久久狠狠色噜噜狠狠狠狠97视色| 国产无码高清视频不卡| 日本人又色又爽的视频| 国产chinese男男gay视频网| 日韩欧美中文字幕在线精品| 喷潮白浆直流在线播放| 国产在线观看91精品亚瑟| 91成人免费观看在线观看| 亚洲福利视频网址| 日本一本在线视频| 亚洲日韩高清无码| 99精品视频九九精品|