999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于二進制的關聯規則挖掘算法

2007-12-31 00:00:00梁家榮李天志鞏建閩
計算機應用研究 2007年8期

摘要:將二進制引入關聯規則求解中,充分利用二進制操作方便、運算速度快、節省空間的優勢。在求解事務項集真子集和支持度時,對事務數據庫中相同事務只求解一次,并給出了真子集的具體求解算法。本算法一次掃描數據庫可以挖掘出所有頻繁集,而且可以根據需求對最小支持度和最小置信度進行修改,修改后不需要再次掃描數據庫即可求出頻繁項集,大大提高了挖掘效率。

關鍵詞:二進制; 關聯規則; 頻繁集; 真子集

中圖分類號:TP301.6文獻標志碼:A

文章編號:1001-3695(2007)08-0079-02

0引言

數據挖掘是從已有的海量數據中發現未知的、具有潛在應用價值的信息或模式。此概念一提出就立即引起了科技界的廣泛關注。關聯規則算法則是數據挖掘的一個重要研究方向。其側重于確定數據庫中不同領域間的聯系,找出滿足給定支持度和可信度的多個域之間的相互關系。它由R.Agrawal等人首先提出。國內外很多學者對這一課題做了大量的研究工作[1~4],為數據挖掘的發展作出了很大的貢獻。傳統的關聯規則挖掘方法大多是在R.Agrawal提出的Apriori算法的基礎上進行研究和改進的。 Apriori算法最大的缺陷就是需要多次掃描數據庫,影響了運行效率。雖然后來很多人對其進行了改進,但效率仍然不是很高。文獻[1,2]提出的關聯規則挖掘方法可以在一次掃描事務數據庫的情況下發現所有頻繁集,但是需要對每一個事務都求出其所有真子集。求集合的所有真子集是很麻煩、費時的,因此應該盡量減少子集的求解次數。本文提出的基于二進制的關聯規則挖掘算法,在文獻[2]的基礎上進行了改進,對事務數據庫中相同事務只需求解一次真子集,并且給出了真子集求解的二進制實現算法。

1關聯規則挖掘基本知識

3基于二進制的關聯規則挖掘算法

3.1算法結構體設計

本算法需要如下數據結構:

typedef struct pset

{int location[];

int value;

}Pset;

用每個Pset節點代表一個事務;location屬性記錄事務項集中元素在對應二進制數中的位置;location[0]為事務項集中的元素數;value記錄事務數據庫中與此事務相同的事務數目。

3.2事務項集真子集求解

本算法首先掃描數據庫,獲得每個事務的項集下標,并對相同事務進行計數,也就是求出事務項集的支持量;最后,根據掃描得到的事務項集支持量以及事務中項目元素與事務項集下標的對應關系,求解每種事務項集的真子集支持量。

要求解某個事務項集的真子集支持量,首先要求出每個真子集對應的事務項集的下標。為此在掃描數據庫時,需要記錄每個事務中各個項目元素在對應事務項集下標中的位置(存放在location數組中);然后,對每個事務項集求出本項集自身的局部真子集二進制表示;最后,根據此局部真子集二進制表示以及每個元素在對應事務項集下標中的位置,得到事務項目集的所有真子集下標。

從以上描述可以看出,Armab算法能夠方便地求出頻繁項集。在最小支持度改變時不用再掃描事務數據庫,只需重新掃描PC數組即可,而且對事務項集的真子集求解方法也很簡單。沒有使用傳統的遞歸操作,使用了運算速度最快的位運算,可以節省空間和運算時間,提高挖掘效率。

4結束語

本文將二進制引入到關聯規則挖掘中,通過預先掃描數據庫,將事務分類并計數,得到事務項集的支持量;然后再求解每種事務項集的真子集。這樣既實現了一次掃描數據庫得到所有頻繁集,又避免了對同一種事務多次求解其真子集的弊端。真子集的求解不是采用傳統的遞歸分算法,而是利用位運算,大大提高了運算速度。

參考文獻:

[1]周海巖.適合于高效更新的關聯規則挖掘算法[J].小型微型計算機系統,2004,25(4):4634-4637.

[2]閆煒,崔杜武,付長龍.基于冪集的關聯規則挖掘算法研究[J]. 計算機工程與應用,2004,40(1):192-193.

[3]TSAY Y J, CHIANG J Y.CBAR: an efficient method for mining association rules[J].KnowledgeBased Systems,2005,18(2-3):99-105.

[4]AGRAWAL R, IMIELINSKI T, SWAMI A, Mining association rules between sets of items in large databases[C]//Proc of the ACM SIGMOD Int’l Conference on Management of Data. Washington D C:[s.n.], 1993:207-216.

[5]李天志, 梁家榮, 范平. 基于二進制的集合運算研究[J].計算機工程與應用,2005,41(33):100102.

[6]李天志, 梁家榮, 范平,等.基于二進制的粗糙集基本運算研究[J].廣西科學,2006,13(2):109112.

注:“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”

主站蜘蛛池模板: 久久综合色88| 欧美人与动牲交a欧美精品| 亚洲啪啪网| 高清免费毛片| 丝袜国产一区| julia中文字幕久久亚洲| 欧美区一区| 欧美激情综合| 亚洲色大成网站www国产| 国产精品美乳| 尤物视频一区| 五月婷婷导航| 国产福利不卡视频| 成人中文字幕在线| 亚洲欧美在线看片AI| 日本不卡在线播放| 97国产一区二区精品久久呦| 免费无遮挡AV| 亚洲人成影院在线观看| 幺女国产一级毛片| 在线观看免费人成视频色快速| 久久综合伊人77777| 亚洲国产精品一区二区第一页免| 国内精自线i品一区202| 色综合久久久久8天国| 婷婷六月综合网| 中文字幕 日韩 欧美| 国产精品视频白浆免费视频| 男人的天堂久久精品激情| 亚洲高清中文字幕在线看不卡| 免费国产黄线在线观看| 久久久亚洲色| 毛片大全免费观看| 好紧太爽了视频免费无码| 99久久精品无码专区免费| 日韩专区欧美| 22sihu国产精品视频影视资讯| 国产福利小视频在线播放观看| 国产96在线 | 真实国产乱子伦视频| 99久久99这里只有免费的精品| 国产中文一区二区苍井空| 五月综合色婷婷| 久久久国产精品无码专区| 成人午夜视频在线| 国内精品九九久久久精品| 4虎影视国产在线观看精品| 激情成人综合网| 自拍偷拍欧美日韩| 五月婷婷综合在线视频| 伊人激情久久综合中文字幕| 国产精品粉嫩| 久久99这里精品8国产| 久草性视频| 免费播放毛片| 3344在线观看无码| 国产成人一区二区| 色呦呦手机在线精品| 国产亚洲视频在线观看| 欧美日韩中文字幕二区三区| 六月婷婷精品视频在线观看 | 伊人狠狠丁香婷婷综合色| 呦视频在线一区二区三区| 欧美亚洲国产精品久久蜜芽| 青青草国产在线视频| 中日韩一区二区三区中文免费视频| 天堂va亚洲va欧美va国产| 亚洲女同欧美在线| 91青青草视频在线观看的| 国产黄网永久免费| 久热中文字幕在线| 好久久免费视频高清| 国产专区综合另类日韩一区| 成人午夜精品一级毛片| 国产91av在线| 免费Aⅴ片在线观看蜜芽Tⅴ | 亚洲男人在线天堂| 国产a在视频线精品视频下载| 亚洲福利视频网址| 热99精品视频| 超清人妻系列无码专区| 无码又爽又刺激的高潮视频|