999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關聯規則算法的計算效率優化研究

2019-02-13 19:18:43劉建花
數字通信世界 2019年12期
關鍵詞:排序關聯規則

劉建花

(晉中師范高等專科學校,晉中 030600)

1 引言

關聯規則在數據挖掘中是非常重要的一個技術,主要用于在數據庫中尋找各個不同方面間的關聯度,即在頻率盡可能低的限制下從數據庫中尋找頻繁項集。

2 Apriori 算法

Apriori 算法在關聯規則算法中占了很大比重。Apriori 算法通常情況下分兩步進行:第一步,滿足使用者要求的頻繁項目集,在全部的數據庫中挑選出大于使用者約定的最小支持度臨界值的頻繁項目集。第二步,在使用頻繁項目集的過程中總結出滿足預期的關聯規則。置信度一定要大于等于使用者約定的最小置信度總臨界值,這是找出關聯規則的最根本條件。

Apriori 算法:

輸入:總數據庫;最小支持度臨界值

輸出:數據庫中的頻繁項目集

方法:

①從數據庫中產生頻繁項目集;②命令條件:For(k=2;1k-1 ≠null,k + +);③得出k-1 個頻繁集新產生的k-1 個候選集;④確認總數據庫中的每一個候選集的支持度;⑤得出特定事務的候選集;⑥確認特定事務的候選集中每個候選集的支持度;⑦c.count+ +;⑧};⑨返回L=∪kLk

Procedure apriori_gen(LK-1:frequent(k-1)-itemsets;

Min sup:min nimum suo port threshold)

(1) For each itemset I1∈Lk-1

(2) For each itemset I2∈Lk-1

(3) If(I1[1]=I2[1]∩I1[2]=I2[2]∩... ∩I1[k-2]=I2[K-2])∩I1[k-1]=I2[k-1])then

(4){c=I1∞I2;

(5)If has_inf requent_subset(c,Lk-1)then

(6)Delete c

(7)Else add c to CK

(8){

(9)Return Ck

Pr oxedure has_inf requent_subset(c:candiate k - itemet;frequent(k-1)-itemset)

(1)for each (k-1)-subset s of c

(2)If not (s ∈Lk-1)then

(3)Return TRUE

(4)Return FALSE

Apriori_gen 函數包含兩部分內容:連接和剪枝。連接部分是步驟(1)-(4),把有可能產生候選集的部分對Lk-1 和Lk-1進行連接。剪枝部分是步驟(5)-(7),利用Apriori 算法的性質對含有不是頻繁子集的候選集進行刪除。has_inf requent_subset函數的作用檢測不是頻繁子集的候選集。

此算法中不足的地方:會產生數量龐大的候選集會造成占用內存多的結果;通過反復對總數據進行掃描的方式來對比檢測數據量大的候選集會耗廢大量時間[3]。

3 優化算法

為了解決Apriori 算法存在的對支持度計算的耗時問題,得出的方案是減少候選集的數量,把尋找頻繁項目集改為尋找最大頻繁項目集。提出了一種新的算法MFLA:在頻繁模式樹Fp-tree的基礎上尋找最大頻繁項目集。新算法可以不必重復匹配數據庫,僅需一次就足夠,因此使運行效率得到了提升。

3.1 構造Fp-tree 算法

(1)僅對總數據庫進行一次掃描,得出頻繁項目集和與之對應的支持度。根據得出的支持度按從大到小的順序進行排序,列出頻繁項目集的數據表。

(2)建立Fp-tree 的根節點NULL 將總數據庫中的每件事物進行如下操作:

按已經列出的頻繁項目集進行排序,將數據庫中的每個數據都進行排序,將排列后的結果記作為[p │P],p 為項目的第一個,P 為其余剩下的項目的列表;然后對inset_tree(p │P ],T)進行調用;當出現P 的列表中不是空的的情況,遞歸調用inset_tree(P,N) 緊接著完成接下來的操作。假如T 存在子女N 能夠使N.node_name=name,那么 的計數將增到:新建立一個節點N,同時把名稱 (node_name) 和計數(node_count) 設為P、L 使父指針節點(node_count) 與父節點 相連,最后經過節點鏈(node_link) 使之與名稱相同的節點進行連接。

運用了Fp-tree 的MFLA 算法,將長頻繁模式轉換為短模式,緊跟著連接后綴。后綴改為不頻繁項能夠為搜索提供高效的選擇,進而降低耗費。因為是在作用了 Fp-tree 的基礎上進行的新算法構造,所以無論在長頻模式還是在短頻模式,新算法都有效。

3.2 選取數據庫中最大頻繁項集算法

輸入:數據庫中的頻繁模式樹Fp-tree;頻繁項目頭表;最小支持度臨界值;數據庫中的頻繁項目數據

輸出:數據庫中的最大頻繁項目集

(1) MFCID=NULL

(2)確定MFCID 為數據庫中的最大頻繁項目集

(3)當條件為MFCID ≠NULL 時

(4)進行條件循環 or(i=k;i>0;i ——)

(5) 最后一個項目為MFIi

(6)MFCID= MFCID - MFCI

(7)進行調用,計算項目集在總數據庫中的支持度

(8)for all m ∈ MFCII

(9)If(m.supd≥min sup)MFCID ∪m

(10)else

(11)for all item e ∈m

(12)m-{e} MFCID MFCID= MFCID ∪{e}

(13)計算 MFCII 的項目集在總數據庫里的支持度,基于前面步驟已經將其項目集中的羨慕按順序排列,使接下來確定路徑數時更加高效,此時僅需將父指針向根節點搜索即可。

(14) 搜索項目頭表的項目名稱域,設 head[ql ┛.item=I

(15)根據head[ql ┛.item=I 尋找tree 中i 名稱的節點 nd1,nd2,...ndh

(16)根據nd1,nd2,...ndh 和前綴節點的指針區域找出有的全部路徑p1,p2...ph

(17)for all m ∈ MFCII

(18)如果路徑Pj 內含有 m,則m 的支持度增長

4 結束語

在實際中,各領域的數據庫都相當龐大,需要找出一種更高效的算法去解決現實問題。MFIA 算法是對Apriori 算法的優化,提高了效率。

猜你喜歡
排序關聯規則
撐竿跳規則的制定
排序不等式
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
恐怖排序
節日排序
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
主站蜘蛛池模板: 日本91视频| 九九热精品在线视频| 久久免费视频6| 精品视频一区在线观看| 婷婷激情亚洲| 亚洲丝袜第一页| 日韩精品毛片| 成人午夜天| 老熟妇喷水一区二区三区| 亚洲无码高清视频在线观看| 久久精品国产精品一区二区| 亚洲综合18p| 啊嗯不日本网站| 日韩天堂在线观看| 国产乱子伦一区二区=| 成人免费午夜视频| 免费高清a毛片| 不卡的在线视频免费观看| 在线精品亚洲一区二区古装| 无码高潮喷水专区久久| 首页亚洲国产丝袜长腿综合| 亚洲Aⅴ无码专区在线观看q| 91无码人妻精品一区| 91蝌蚪视频在线观看| 国产精品所毛片视频| 国产91全国探花系列在线播放| 无码精品福利一区二区三区| 日本不卡免费高清视频| 欧美日韩资源| 丁香五月亚洲综合在线| 国内精品免费| 国产自在自线午夜精品视频| 午夜福利视频一区| 国产女人在线| 亚洲精品国产成人7777| 日本免费一级视频| 色一情一乱一伦一区二区三区小说 | 老司机精品一区在线视频| 国产精品部在线观看| 久一在线视频| 欧美中文字幕在线播放| 福利在线一区| 91极品美女高潮叫床在线观看| 亚洲精品图区| 日韩在线永久免费播放| 日韩精品久久久久久久电影蜜臀| 91色国产在线| 亚洲三级网站| 中国国产A一级毛片| 亚洲精品视频网| 国产精品久久久久久久久kt| 一级成人欧美一区在线观看| 91外围女在线观看| 亚洲国产欧洲精品路线久久| 欧美影院久久| 欧美一区精品| 99热这里只有精品国产99| 欧美一区二区三区国产精品| 国产1区2区在线观看| 欧美h在线观看| 国产在线麻豆波多野结衣| 国产门事件在线| 熟妇丰满人妻| 欧美精品二区| 亚洲二区视频| 精品自窥自偷在线看| 天天爽免费视频| 久久久久青草大香线综合精品 | 免费jjzz在在线播放国产| 欧美天堂久久| 国产精品自在在线午夜| 亚洲综合色吧| 国产玖玖玖精品视频| 亚洲一级毛片| 亚洲国产精品无码久久一线| 国产特级毛片aaaaaaa高清| 中文毛片无遮挡播放免费| 欧美中文字幕一区| 97青草最新免费精品视频| 欧美黄网在线| 97青青青国产在线播放| 亚洲综合精品第一页|