999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Apriori優化算法評測

2021-11-07 01:53:08楊豐源梁燕陶以政唐定勇李龔亮
電腦知識與技術 2021年25期
關鍵詞:數據挖掘優化

楊豐源 梁燕 陶以政 唐定勇 李龔亮

摘要:Apriori算法是第一個被提出的關聯規則挖掘算法,也是數據挖掘十大算法之一。從其誕生至今眾多研究者致力于從不同角度改進Apriori算法,以提高挖掘關聯規則的效率。為了深入比較各優化算法的特性,選取自頂向下、I-Apriori和T-Apriori等三種應用廣泛的Apriori改進算法,詳細介紹其優化的依據和方法。通過實驗證明三種優化算法相較于經典Apriori算法取得了更優的挖掘效率,對比分析了三種算法優化效果和使用場景。

關鍵詞:Apriori算法;優化;關聯規則;自頂向下;數據挖掘

中圖分類號:G642? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)25-0044-04

Abstract:Apriori algorithm is the first association rule mining algorithm proposed and one of the top ten algorithms for data mining. Since its birth, many researchers have devoted themselves to improving the Apriori algorithm from different perspectives to improve the efficiency of mining association rules. Three widely used Apriori improved algorithms, top-down, I-Apriori and T-Apriori, are selected, and the basis and methods of their optimization are introduced in detail. Experiments show that the three optimization algorithms have achieved better mining efficiency than the classic Apriori algorithm. The optimization effects and usage scenarios of the three algorithms are compared and analyzed.

Key words: Apriori algorithm; optimization; association rule; top-down; data mining

關聯規則挖掘理論與Apriori算法是由R.Agrawal等[1]在1994年同時提出的。經過20多年的發展,關聯規則挖掘已經是數據挖掘一個重要的分支領域,大量研究人員將關聯規則應用到了其他領域[2,8],或是利用關聯規則改進協同過濾,精準推薦等算法[3]。

關聯規則挖掘算法主要是從給定的事務數據集中找出形如A→B的關聯規則。該過程又可以被分解為兩個子過程:首先從事務數據集中找出所有滿足閾值的頻繁項目集;再利用頻繁項目集生成關聯規則。其中,耗費時間更多的往往是第一步從數據集中挖掘出頻繁項集。因此,更多的研究關注于優化挖掘頻繁項目集的過程,也提出了一些非常經典的算法,如完全不同于Apriori算法思想的FP-growth算法。但Apriori算法作為關聯規則挖掘的第一個算法,仍然在關聯規則挖掘領域具有非常重要的地位,被IEEE會議選為數據挖掘十大算法之一。盡管Apriori算法如此經典,依然有它的局限性,不斷有Apriori算法的優化方法被提出[4-7]。本文對Apriori經典算法及該算法的幾種優化算法詳細描述,并通過實驗對比分析其優化效果和適應場景。

1 Apriori算法

設項的全集為I=(I1,I2,… ,Im),數據集為D,其中的每個事務T有唯一的主鍵標識自己,記為TID。

1.1 相關概念

定義1? 設A、B為項集,并且是I的非空子集,則形如A→B的式子就是一條關聯規則。

對于每條關聯規則,我們定義了如下的支持度和置信度來衡量關聯的強度。

定義2? 對于一條關聯規則,它的支持度s是數據集的事務中包含所有項集的比例,如A→B的支持度就是D中事務包含A∪B的概率,即

support(A→B)=P(A∪B)=count(A∪B)/count(D)

置信度c則是D中包含A的事務同時包含B的比例P(B|A),即

confidence(A→B)=P(B|A)

= support(A∪B)/support(A) =count(A∪B)/count(A)

對支持度大于閾值min_sup且置信度大于閾值min_conf的關聯規則,稱為強關聯規則。

包含k個項的集合被稱為k-項集。滿足最小支持度的項集被稱為頻繁項集。若一個頻繁項集內部只包含k-項集,則該頻繁項集被稱為頻繁k-項集或k-頻繁項集。對于頻繁項集,有以下幾條性質。

性質1? 任何頻繁項集的非空子集是頻繁項集, 非頻繁項集的超集是非頻繁項集。

性質2? 如果頻繁k-項集還能產生頻繁k+1-項集, 則頻繁k-項集中的項集的個數必大于k。顯然,若頻繁2-項集中只包含{(I1,I2)},則不可能形成頻繁3-項集;若是包含{(I1,I2),(I2,I3)}則有可能生成頻繁3-項集{(I1,I2,I3)}。

性質3? 支持頻繁項集Lk的任意一條事務至少支持Lk-1中的k個k-1項集。

猜你喜歡
數據挖掘優化
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
由“形”啟“數”優化運算——以2021年解析幾何高考題為例
探討人工智能與數據挖掘發展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
基于低碳物流的公路運輸優化
現代企業(2015年2期)2015-02-28 18:45:09
主站蜘蛛池模板: 日韩在线观看网站| 国产精品白浆在线播放| 国产亚洲男人的天堂在线观看| 日韩欧美综合在线制服| 欧美午夜在线播放| 91在线精品麻豆欧美在线| 亚洲精品制服丝袜二区| 青青草原国产av福利网站| 国产美女91呻吟求| 国产偷倩视频| 伊人久久影视| 欧美一区日韩一区中文字幕页| 亚洲综合18p| 波多野结衣一区二区三区四区 | jizz国产在线| 亚洲精品午夜无码电影网| 久久99国产精品成人欧美| 中文字幕欧美成人免费| 色哟哟精品无码网站在线播放视频| av在线无码浏览| 区国产精品搜索视频| 日韩一级毛一欧美一国产| av在线5g无码天天| 精品伊人久久久久7777人| 99人体免费视频| 91福利免费| 91精品国产91久无码网站| 国产日韩精品欧美一区喷| 91久久夜色精品国产网站| 久久福利片| 成人无码区免费视频网站蜜臀| 亚洲国产黄色| P尤物久久99国产综合精品| 国产精品国产主播在线观看| 亚洲成人高清无码| 精品无码日韩国产不卡av| 亚洲av无码专区久久蜜芽| 国产精品久线在线观看| 鲁鲁鲁爽爽爽在线视频观看| 国产黑丝一区| 国产精品亚洲αv天堂无码| 欧美精品色视频| 亚洲国产精品日韩欧美一区| 久草视频中文| 无码人妻免费| 亚洲精品成人7777在线观看| 国产欧美专区在线观看| 久久青草热| 高清乱码精品福利在线视频| 亚洲欧美自拍视频| 亚洲精品自产拍在线观看APP| 久久亚洲国产最新网站| 国产乱子精品一区二区在线观看| 国产精品女人呻吟在线观看| 福利国产微拍广场一区视频在线| 小蝌蚪亚洲精品国产| 亚洲Av激情网五月天| 99在线视频网站| 91久久偷偷做嫩草影院| 在线视频亚洲色图| 国产人前露出系列视频| 91久久偷偷做嫩草影院电| 欧美激情综合| 久久99精品久久久大学生| 日韩AV无码免费一二三区| 97成人在线观看| 天天躁狠狠躁| 欧美亚洲另类在线观看| 国产在线观看91精品亚瑟| 91精品人妻一区二区| 国产在线啪| 女人一级毛片| 免费视频在线2021入口| 2021国产精品自拍| 欧美视频在线不卡| 国内嫩模私拍精品视频| 欧美色视频日本| 久久婷婷色综合老司机| 一本久道热中字伊人| 国内丰满少妇猛烈精品播| 亚洲综合国产一区二区三区| 亚洲精品天堂自在久久77|