999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Apriori算法的高校學(xué)生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析

2016-12-26 12:55:09周興旺
電子技術(shù)與軟件工程 2016年22期

摘 要

高校在長期的教學(xué)管理過程中積累了海量的學(xué)生成績信息,但是普遍的對于成績的分析處理工作還停留在簡單的查詢、分析和統(tǒng)計(jì)階段。本文利用關(guān)聯(lián)規(guī)則Apriori算法,以學(xué)生成績數(shù)據(jù)為研究對象,挖掘課程之間的相互關(guān)系,為科學(xué)的制定人才培養(yǎng)方案,提高高校人才培養(yǎng)質(zhì)量進(jìn)行了積極地探索與研究。

【關(guān)鍵詞】成績分析 關(guān)聯(lián)規(guī)則 Apriori算法

1 數(shù)據(jù)挖掘

數(shù)據(jù)挖掘其實(shí)就是從大量、有噪聲、隨機(jī)性、不完全、模糊的應(yīng)用數(shù)據(jù)中,提取并隱藏在應(yīng)用數(shù)據(jù)中心、人們不知道但是有價(jià)值的信息和知識的過程,通過數(shù)據(jù)挖掘系統(tǒng)能夠自動(dòng)分析原有數(shù)據(jù),并作出歸納總結(jié),挖掘出數(shù)據(jù)原有的模式,為決策者提供參考價(jià)。數(shù)據(jù)挖掘包括數(shù)據(jù)倉庫、預(yù)處理、分類聚類、關(guān)聯(lián)分析等。關(guān)聯(lián)分析是數(shù)據(jù)挖掘最貼近我們生活的一部分了,登錄亞馬遜網(wǎng)站,當(dāng)我們挑選一本《Android4高級編程》時(shí),網(wǎng)站會不失時(shí)機(jī)的列出你可能還會感興趣的書籍,如Android游戲開發(fā)、Cocos2d-x引擎等,讓我們的購物車變得更充實(shí),而錢包又空了些。

數(shù)據(jù)挖掘是一門綜合了統(tǒng)計(jì)學(xué)、信息技術(shù)、人工智能等多項(xiàng)技術(shù)。其中數(shù)據(jù)挖掘聚類和決策樹則是機(jī)器學(xué)習(xí)理論知識。關(guān)聯(lián)性規(guī)則挖掘技術(shù)對數(shù)據(jù)挖掘技術(shù)具有非常重大的意義,它進(jìn)一步擴(kuò)展了數(shù)據(jù)挖掘的研究,到如今已經(jīng)成為了數(shù)據(jù)挖掘領(lǐng)域中的一個(gè)分支。關(guān)聯(lián)性規(guī)則不僅體現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián),更為重要的是關(guān)聯(lián)系規(guī)則的表達(dá)簡潔,便于理解,近年來已經(jīng)成為數(shù)據(jù)挖掘技術(shù)研究領(lǐng)域的熱點(diǎn)話題。

2 關(guān)聯(lián)規(guī)則Apriori算法

Apriori算法是關(guān)聯(lián)規(guī)則算法之一。Apriori算法的第一遍僅僅計(jì)算每個(gè)項(xiàng)目的具體指的數(shù)量,以確定大型1項(xiàng)集。隨后的遍歷,第k次遍歷,包括兩個(gè)階段。首先,使用在第(k-1)次遍歷中找到的大項(xiàng)集Lk-1和Apriori-gen函數(shù)產(chǎn)生候選項(xiàng)集。接著掃描數(shù)據(jù)庫,計(jì)算中候選的支持度,從而得到中的支持度不小于最小支持度的k階大項(xiàng)集。重復(fù)以上步驟,直到某一階的大項(xiàng)集為空時(shí),算法停止。

Apriori算法指導(dǎo)我們,如果要發(fā)現(xiàn)強(qiáng)關(guān)聯(lián)規(guī)則,就必須先找到頻繁集。所謂頻繁集,即支持度大于最小支持度的項(xiàng)集。如何得到數(shù)據(jù)集合D中的所有頻繁集呢?

用一種非常原始的辦法來分析,就是對于數(shù)據(jù)集D,遍歷每一條記錄T,可以得到T的所有子集,然后計(jì)算每一個(gè)子集的支持度,最后再將結(jié)果與最小支持度比較。我們暫且不管數(shù)據(jù)集D中有多少條記錄,就說每一條記錄T的子集個(gè)數(shù),{1,2,3}的子集有{1},{2},{3},{1,2},{2,3},{1,3},{1,2,3},即如果記錄T中含有n項(xiàng),那么它的子集個(gè)數(shù)是-1。計(jì)算量是非常大的,很明顯這種方法是不可取的。

因此,Aprior算法提出了一個(gè)逐層搜索的方法,如何逐層搜索呢?包含兩個(gè)步驟:

(1)自連接獲取候選集。第一輪的候選集就是數(shù)據(jù)集D中的項(xiàng),而其他輪次的候選集則是由前一輪次頻繁集自連接得到(頻繁集由候選集剪枝得到)。

(2)對于候選集進(jìn)行剪枝。如何剪枝呢?候選集的每一條記錄T,如果它的支持度小于最小支持度,那么就會被剪掉;此外,如果一條記錄T,它的子集有不是頻繁集的,也會被剪掉。

算法的終止條件是,如果自連接得到的已經(jīng)不再是頻繁集,那么取最后一次得到的頻繁集作為結(jié)果。

3 教務(wù)管理系統(tǒng)中的學(xué)生成績數(shù)據(jù)挖掘

學(xué)生的考試成績不僅體現(xiàn)了學(xué)生階段性的學(xué)習(xí)效果,而且是檢驗(yàn)學(xué)校教學(xué)效果的重要依據(jù)。為了提高學(xué)校教學(xué)質(zhì)量,所以必須對學(xué)生的考試成績進(jìn)行數(shù)據(jù)挖掘,挖掘出學(xué)生考試成績背后的關(guān)鍵性因素,可以從學(xué)生的性別、專業(yè)、課程、入學(xué)成績、老師對學(xué)生的考核評價(jià)等因素為切入點(diǎn),分析這些因素對學(xué)生成績產(chǎn)生的影響,并找出各個(gè)要素之間的潛在規(guī)律,從而分析出影響學(xué)生考試成績的主要因素,并預(yù)測學(xué)生哪一部分成績還需要進(jìn)一步加強(qiáng)。采用關(guān)聯(lián)系規(guī)則對學(xué)生成績進(jìn)行數(shù)據(jù)挖掘,通過數(shù)據(jù)倉庫查看各個(gè)專業(yè)學(xué)生課程成績單,并分析各個(gè)課程與其他課程之間的關(guān)聯(lián)和影響,從而制定專業(yè)的人才培養(yǎng)計(jì)劃。在制定計(jì)劃的時(shí)候,依次從公共課、專業(yè)課到拓展課等方面設(shè)置相關(guān)課程。不同的專業(yè)開設(shè)課程的時(shí)間不同,開課時(shí)間次序?qū)W(xué)生學(xué)習(xí)后續(xù)課程會產(chǎn)生一定的影響。但是過去很多高校在課程安排上比較隨意,通常都是高校教務(wù)處的人根據(jù)過去的教學(xué)經(jīng)驗(yàn)和主觀認(rèn)知,安排學(xué)生的課程時(shí)間。然而每一門課程都有它的特點(diǎn),比如體育課學(xué)生可能需要大量的運(yùn)動(dòng),消耗的體能比較多,運(yùn)動(dòng)過后學(xué)生無論精神上還是身體上都比較疲憊,這個(gè)時(shí)候上課的效果就不太好,所以在安排課程的時(shí)候,盡量將體育課安排到下午的時(shí)間段,這樣不會學(xué)校其他課程的教學(xué)效果。通過關(guān)聯(lián)性分析,找出每一門課程的影響因素,合理安排課程的先后順序,為人才方案制定者提供科學(xué)的決策依據(jù)。

我們從教務(wù)管理系統(tǒng)中選取1000名軟件技術(shù)專業(yè)學(xué)生的成績,根據(jù)學(xué)生成績進(jìn)行數(shù)據(jù)挖掘,部分成績數(shù)據(jù)如表1所示。

根據(jù)學(xué)生考試成績表,分析學(xué)生不及格科目之間的關(guān)系,60分以下的設(shè)置最小支持度為0.04。設(shè)置關(guān)聯(lián)規(guī)則的參數(shù),將成績范圍設(shè)定為0至59,最小支持度為0.04。

使用Aprior算法對數(shù)據(jù)倉庫中的相關(guān)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析,結(jié)果如表2所示。

通過對1000名軟件技術(shù)專業(yè)的學(xué)生60分以下成績進(jìn)行數(shù)據(jù)挖掘,發(fā)現(xiàn)學(xué)生的電路分析和高等數(shù)學(xué)兩門科目的置信度是0.51,C++程序設(shè)計(jì)這門課程的置信度是0.40。根據(jù)圖表各個(gè)課程的置信度可以得出結(jié)論。如果學(xué)生在大一階段的基礎(chǔ)課程如高等數(shù)學(xué)學(xué)習(xí)成績比較差,那么學(xué)生的電路分析和C++程序設(shè)計(jì)兩門科目的學(xué)習(xí)成績也會不太好,不及格的概率比較大。相對來說,如果高等數(shù)學(xué)和電路分析兩門課程的置信度達(dá)到了0.35,那么對學(xué)生的電路分析和C++程序設(shè)計(jì)兩門科目的學(xué)習(xí)成績影響不大。那么可以得出這樣的結(jié)論,電路分析課程開設(shè)在高等數(shù)學(xué)這門課程之后。通過以上分析,我們可以得出,將一些基礎(chǔ)課程作為專業(yè)課程的前導(dǎo)課程,能夠?yàn)閷W(xué)生后期學(xué)習(xí)打下堅(jiān)實(shí)的基礎(chǔ);如果學(xué)生的基礎(chǔ)知識學(xué)習(xí)不好,那么對專業(yè)課程的影響也很大,專業(yè)課程的學(xué)習(xí)和基礎(chǔ)課程有直接關(guān)系。研究影響學(xué)生成績優(yōu)秀的課程之間的關(guān)系,80分以上設(shè)置最小支持度為0.04。設(shè)置關(guān)聯(lián)規(guī)則的參數(shù),設(shè)定分?jǐn)?shù)范圍80至100,最小支持度為0.04。

利用關(guān)聯(lián)規(guī)則產(chǎn)生如表3所示的數(shù)據(jù)挖掘結(jié)果。

通過對軟件技術(shù)專業(yè)考試成績在80分以上學(xué)生進(jìn)行數(shù)據(jù)挖掘,發(fā)現(xiàn)專業(yè)英語和大學(xué)英語兩門課程的置信度是0.62,從中我們可以得出結(jié)論,如果學(xué)生的英語基礎(chǔ)成績比較好,那么學(xué)生的大學(xué)英語成績也相對來說沒有什么問題,學(xué)生的專業(yè)英語成績分?jǐn)?shù)也相對比較高。數(shù)據(jù)結(jié)構(gòu)和C++程序設(shè)計(jì)兩門課程是計(jì)算機(jī)專業(yè)的專業(yè)基礎(chǔ)課堂,兩門課程的置信度是0.64,從課程的置信度可以看出這兩門課程對專業(yè)學(xué)習(xí)數(shù)據(jù)結(jié)果的影響,如果學(xué)生的數(shù)據(jù)結(jié)構(gòu)這門課程學(xué)習(xí)成績比較好,那么學(xué)生C++程序設(shè)計(jì)這門課程的學(xué)習(xí)成績也比較好。從以上分析來網(wǎng)頁設(shè)計(jì)和制作與photoshop圖像處理兩門課程的置信度是0.68,從中可以看出photoshop圖像處理課程對網(wǎng)頁設(shè)計(jì)和制作有很大影響。網(wǎng)頁制作的時(shí)候,需要photoshop圖形圖像處理軟件對圖片進(jìn)行處理和調(diào)整。所以photoshop圖像處理課程可以設(shè)置在網(wǎng)頁制作課程之前,以便學(xué)生在學(xué)習(xí)網(wǎng)頁制作的時(shí)候,能夠用photoshop軟件對圖片進(jìn)行處理。

從上述內(nèi)容我們可以看出,高校專業(yè)課程之間的關(guān)聯(lián)性很強(qiáng),從學(xué)生考試成績就可以看出,因此在學(xué)校開設(shè)課程的時(shí)候,一定要考慮課程關(guān)聯(lián)性影響,按照對學(xué)生影響大小制定開設(shè)課程的次序,并作為學(xué)校培養(yǎng)人才的重要依據(jù)。

此外在對學(xué)生成績進(jìn)行數(shù)據(jù)挖掘的時(shí)候,還要考慮到學(xué)生入學(xué)成績和整體考試成績,經(jīng)學(xué)生的入學(xué)成績錄入系統(tǒng),并對學(xué)生所有課程考試成績綜合分析,算出平均成績,按照平均成績劃分優(yōu)秀、良、差等不同等級,將入學(xué)成績也分為優(yōu)、良、差等不同等級,挖掘出入學(xué)成績和考試成績之間的關(guān)聯(lián)。

成績關(guān)聯(lián)性數(shù)據(jù)挖掘結(jié)果如表4所示。

4 結(jié)論

從上述結(jié)果得出,如果學(xué)生的入學(xué)成績差和考試成績優(yōu)的置信度是0.41,這就表明如果學(xué)生的基礎(chǔ)比較差,那么在大學(xué)的考試成績好的可能性不大。如果學(xué)生的入學(xué)成績差和考試成績優(yōu)的置信度是0.65,那就表明基礎(chǔ)成績差的學(xué)生也可以考出良等的考試成績,這樣就能推翻過去傳統(tǒng)理論上入學(xué)考試成績好的學(xué)生,在大學(xué)的學(xué)習(xí)成績也會很好,如果入學(xué)成績不好的學(xué)生,在大學(xué)的成績肯定不好的這種理論。通過關(guān)聯(lián)性分析,可以看出學(xué)生入學(xué)成績的好壞與學(xué)生大學(xué)成績的好壞并沒有必然的聯(lián)系。大學(xué)自由的學(xué)習(xí)氣氛給學(xué)生的學(xué)習(xí)創(chuàng)造了良好的環(huán)境,如果學(xué)生抓住這個(gè)機(jī)會,自主學(xué)習(xí),那么就能獲得好的成績,如果還是秉承按照高中階段的學(xué)習(xí)思維,那么可能學(xué)生不利于學(xué)生的學(xué)習(xí)。

參考文獻(xiàn)

[1]王少華等.關(guān)聯(lián)規(guī)則在高校系統(tǒng)中的應(yīng)用[J].福建電腦,2007(12):153-156.

[2]王能斌等.大學(xué)課表調(diào)度系統(tǒng)UTSS[J].計(jì)算機(jī)學(xué)報(bào),1984(05):383-389.

[3]何炎樣.關(guān)聯(lián)規(guī)則的幾種開采算法及其比較[J].小型微型計(jì)算機(jī)系統(tǒng),2001(09).

[4]趙俏.高職院校教務(wù)管理中的數(shù)據(jù)挖掘[J].科技信息,2008(11):80,95.

[5]楊克松.論關(guān)聯(lián)規(guī)則在高校選課系統(tǒng)中的應(yīng)用[J].福建電腦,2007(10):166-168.

[6]周培德.算法設(shè)計(jì)與分析[M].北京:機(jī)械工業(yè)出版社,1996.

作者簡介

周興旺(1979-),男,江蘇省揚(yáng)州市人。工學(xué)碩士學(xué)位?,F(xiàn)為南通科技職業(yè)學(xué)院講師。主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)挖掘、教育教學(xué)管理等。

作者單位

南通科技職業(yè)學(xué)院 江蘇省南通市 226007

主站蜘蛛池模板: 精品视频一区在线观看| 亚洲婷婷丁香| 麻豆AV网站免费进入| 一级做a爰片久久毛片毛片| 国产成人高清在线精品| 国产青榴视频在线观看网站| 欧美一级一级做性视频| 人妻91无码色偷偷色噜噜噜| 国产女人综合久久精品视| 欧美怡红院视频一区二区三区| 日韩视频精品在线| 欧美亚洲国产精品第一页| 久久a级片| 精品国产免费第一区二区三区日韩| 2021天堂在线亚洲精品专区| 亚洲日韩高清在线亚洲专区| AV无码一区二区三区四区| 波多野结衣第一页| 精品伊人久久大香线蕉网站| 免费毛片全部不收费的| 97狠狠操| 22sihu国产精品视频影视资讯| 91色爱欧美精品www| 国产丝袜精品| 国产成人1024精品下载| 一区二区三区在线不卡免费| 国产凹凸视频在线观看| 亚洲精品大秀视频| 国产原创演绎剧情有字幕的| 国产91在线|中文| 亚洲中久无码永久在线观看软件| 青青青国产视频| 日韩在线播放中文字幕| 成人午夜网址| 国产特一级毛片| 婷婷中文在线| 99精品欧美一区| 国产一区二区人大臿蕉香蕉| 国产男女免费完整版视频| 乱人伦99久久| 国产成人综合久久| 蜜桃臀无码内射一区二区三区| 扒开粉嫩的小缝隙喷白浆视频| 国产中文一区a级毛片视频| 精品国产99久久| 久久99精品国产麻豆宅宅| 在线播放国产一区| 女人18毛片水真多国产| 亚洲,国产,日韩,综合一区| 日韩av高清无码一区二区三区| 国产电话自拍伊人| 丰满人妻中出白浆| 久久国语对白| 国产乱人免费视频| P尤物久久99国产综合精品| 色天天综合| 中文字幕啪啪| 国产中文一区二区苍井空| 免费国产无遮挡又黄又爽| 99热这里只有精品5| 久久久久夜色精品波多野结衣| 一级毛片基地| 四虎永久在线视频| 四虎综合网| 国产丝袜一区二区三区视频免下载| 日本免费福利视频| 农村乱人伦一区二区| 美女国产在线| 国产微拍一区二区三区四区| 亚洲黄网在线| 九月婷婷亚洲综合在线| 91午夜福利在线观看| 婷婷伊人五月| 亚洲日韩精品伊甸| 亚洲精品免费网站| 香蕉久久国产超碰青草| 中国特黄美女一级视频| 高清大学生毛片一级| 色偷偷男人的天堂亚洲av| 久久99这里精品8国产| 扒开粉嫩的小缝隙喷白浆视频| 丰满少妇αⅴ无码区|