999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Apriori算法在三二分段成績分析中的應用

2016-07-10 05:09:20蘇偉斌
電子技術與軟件工程 2016年7期
關鍵詞:數據挖掘

蘇偉斌

本文介紹了Apriori算法的基本概念并以本人所在的中職學校計算機專業為例,介紹了使用Apriori算法來挖掘數據之間關聯性的方法,找出規律,分析結果,為實際教學工作提供理論支持。

【關鍵詞】Apriori算法 成績分析 數據挖掘

隨著校園信息化的發展,很多學校都已經建立了各種信息管理系統,在這些系統中往往存儲著大量的數據。我們可以通過數據挖掘技術分析這些數據,找出規律為教學工作提供指導。常用的數據挖掘技術有關聯規則Apriori算法。

1 Apriori算法概述

1.1 基本概念

Apriori算法是一種挖掘數據之間關聯性和依賴性的算法。其基本概念有以下幾個:

事務:一個事務包含一個唯一的事務標識符(trans_ID)以及一個組成事務的項的列表。由事務組成的集合稱為事務數據庫(D)。

項:組成事務的各項成員我們通常稱為項或者項目,通常用I={i1,i2,i3,……in}來表示所有項的集合;由K個項目組成的集合又稱為K-項集。

支持度:指事務A和事務B在D中同時出現的概率,記作,它的計算公式可以表達如下:sup(AB)=P(A∩B),通常只有支持度大于或等于一定的值才能使研究有意義,這個值稱為最小支持度閾值min_sup。

置信度:指在D中,當出現事務X時,事務Y出現的概率,記作,表示如下:conf(AB)=P(A|B),通常只有置信度大于或等于一定的值才能使研究有意義,這個值稱為最小置信度閾值min_conf。

關聯規則:指的是形式如下的邏輯蘊涵式:AB 其中AI,BI,且A∩B≠ 。

頻繁項集:指頻繁地在數據集中出現的項的集合,如果K-項集的支持度大于等于min_sup,該集合稱為頻繁K項集,記作Lk。

1.2 頻繁項集的生成

Apriori算法使用基于先驗知識的逐層搜索的迭代方法來產生頻項集。K-項集由(K-1)-項集產生,其過程如下:

定義min_sup的值,掃描數據庫D,找出滿足min_sup的項,產生頻繁1項集L1,通過迭代,由L1產生L2直到不能產生更大的頻繁項集。為了提高效率,當搜索Lk(K>1)時要進行連接和剪枝。

Apriori算法假設項集中的項是按字典排序的,所以要求LK-1中的每個子項有l[1]

根據頻繁項集的所有子集都是頻繁項集這一特性把非頻繁的K項集刪除,得到頻繁集LK。

1.3 強關聯規則的產生

找到最大頻繁項集后就可以由它來產生關聯規則,對于每個頻繁集l的所有非空子集s,只要滿足sup(l)/sup(s)>=min_conf,則輸出規則,對于同時滿足最小支持度和最小置信度的關聯規則我們又稱其為強關聯規則,由于前述關聯規則是由最大頻繁項集推導出來的,所以它們自然滿足最小支持度,是強關聯規則。

2 Apriori算法在三二分段成績分析中的應用

2.1 確定挖掘對象

本文通過研究挖掘本校11、12和13級計算機專業學生的《計算機基礎》、《程序設計》、《網頁制作》、《計算機英語》、《數據庫技術》、《動畫制作》、《圖像處理》的學業成績,找出影響學生三二分段考試成績最重要的影響因素。本次研究所采用的成績數據為751條,全部來源于本校教務系統。

2.2 數據處理

由于不是每個學生都參加了三二分段考試,所以在清理數據時首先要把沒有參加的剔除,另外還有部分學生因各種原因導致某個科目缺考的也一并把他的記錄刪除。最后整理出來的數據表包含了學號、科目和“三二分段結果”9個字段,共705條記錄。

2.3 數據轉換

為了方便進行挖掘,要對學生的各科成績進行規范化轉換,把散落在一定范圍的成績轉換為一個邏輯值。結合本次挖掘的目的,我們把《計算機基礎》、《程序設計》、《網頁制作》、《計算機英語》、《數據庫技術》、《動畫制作》和《圖像處理》分別用A、B、C、D、E、F、和G來表示,對于單科成績大于等于60分的,用數字1表示;否則用數字0表示。三二分段考試結果用isPasswed來表示,通過用1表示,否則用0表示。轉換后的數據表樣式如表1。

2.4 算法描述

2.5 結果分析

經過反復調整和測試,把最小支持度設定為25%,最小置信度設定為60%,產生強關聯規則12條,排除與本實驗目的相關性不大的規則,得出如表2的結果。

規則1說明,有60.1%的學生同時通過了《計算機基礎》和三二分段考試,如果《計算機基礎》通過了,則通過三二分段考試的機率是80.3%;規則2說明,有50.8%的學生同時通過了《網頁制作》和三二分段考試,如果《網頁制作》通過了,則通過三二分段考試的機率是75.1%;規則3說明,有40.2%的學生同時通過了《動畫制作》和三二分段考試,如果《動畫制作》通過了,則通過三二分段考試的機率是68.3%;規則4說明,有28.5%的學生同時通過了《程序設計》和三二分段考試,如果《程序設計》通過了,則通過三二分段考試的機率是62.8%;

通過以上分析可以看到,對三二分段考試成績影響最大的科目是《計算機基礎》、《網頁制作》、《動畫制作》和《程序設計》。因此,要提高三二分段考試的通過率我們可以加強這些科目的學習。

3 結束語

本文介紹了使用Apriori算法分析本人所在中職學校計算機專業學生的學業考試成績數據,找到了影響三二分段考試成績的最重要的科目,為提高三二分段考試成績提供方向性的支持。

參考文獻

[1]楊巍巍.Apriori算法在學生成績分析中的應用[J].電腦知識與技術2013(13):59-61.

[2]譚慶.關聯規則Apriori算法在試卷成績分析中的應用研究[J].信陽師范學院學報:自然科學版.2009(2):22.

[3]趙輝.數據挖掘技術在學生成績分析中的研究及應用[D].大連:大連海事大學,2007.

作者單位

東莞理工學校 廣東省東莞市 523000

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 免费无码网站| 69国产精品视频免费| 国产96在线 | 国产麻豆精品久久一二三| 欧美日韩精品在线播放| 免费无遮挡AV| 无码丝袜人妻| 国内精品免费| 国产波多野结衣中文在线播放| 最新加勒比隔壁人妻| 国产凹凸视频在线观看| AV熟女乱| 日韩第一页在线| 久久人搡人人玩人妻精品| 久久久久亚洲Av片无码观看| 91免费国产高清观看| 国产国语一级毛片在线视频| 无码中文字幕乱码免费2| 亚洲国产第一区二区香蕉| 日韩a级片视频| 9久久伊人精品综合| 午夜国产理论| 狠狠色香婷婷久久亚洲精品| 国产91丝袜| 色综合网址| 91久久国产综合精品| 蝴蝶伊人久久中文娱乐网| 日韩区欧美区| 夜夜操天天摸| 在线观看无码a∨| 色有码无码视频| 国产极品美女在线播放| 国产chinese男男gay视频网| 日韩国产一区二区三区无码| 无码日韩人妻精品久久蜜桃| 丁香五月激情图片| www.日韩三级| 大香网伊人久久综合网2020| 午夜小视频在线| 亚洲av无码成人专区| 试看120秒男女啪啪免费| 国产白浆视频| 在线日韩日本国产亚洲| 制服丝袜一区| 欧美精品1区2区| 国产亚洲男人的天堂在线观看| 91在线视频福利| 欧美成人影院亚洲综合图| 国产精品开放后亚洲| 亚洲成年人网| 精品国产自在在线在线观看| 欧美成一级| 伊人成色综合网| 日韩经典精品无码一区二区| 国产在线第二页| 午夜a级毛片| 欧美成人一级| 性色生活片在线观看| 国产门事件在线| 国产成人高清在线精品| 91青草视频| 日韩在线播放中文字幕| 亚洲精品国产首次亮相| 在线网站18禁| 91久久大香线蕉| 丝袜国产一区| 99精品热视频这里只有精品7| 亚洲午夜福利在线| 黄色免费在线网址| 亚洲综合专区| 久久综合亚洲色一区二区三区| 国产高清无码第一十页在线观看| 中文字幕精品一区二区三区视频| 狠狠色噜噜狠狠狠狠奇米777| 欧洲成人在线观看| 国产又粗又猛又爽视频| 九九热免费在线视频| 亚洲无码高清一区| 成人午夜免费观看| 亚洲日本www| 1024你懂的国产精品| 日韩欧美成人高清在线观看|