999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種改進關聯分類算法的研究

2018-03-02 08:04:06苗世強鄭曉勢
智能計算機與應用 2018年1期
關鍵詞:關聯定義規則

苗世強, 鄭曉勢

(齊魯工業大學 信息學院, 濟南 250353)

引言

關聯分類算法是數據分析的一個領域,代表的算法有:CBA[1]、CMAR[2]、CPAR[3]等。這里,本文將對關聯分類CBA算法展開如下詳述與分析。首先,要通過對頻繁項集的挖掘,找到頻繁項集,而后在此基礎上進行關聯分類。分類原則就是按照給定已知屬性,再借此判斷屬于哪一類別。

1 基本定義與關聯分類算法

1.1 概念介紹

設數據集合I={i1,i2,…,im},有事務集合transaction-D,D中每項事務T是數據集I的子集,則有T?I。其中,單個事務T都關聯對應著一個TID。為方便后續研究,首先探討本次研究中的重點概念定義如下。

定義1頻繁項集 就是在某些集合中,一些事務集中出現了相同的數據項,這些數據項的出現頻率是非常高的。在這些集合中,滿足一定閾值的集合可稱為頻繁項集。

定義2支持度 在某個集合中既出現項集A又出現B的概率,即:

Support(A→B)=P(A∪B)

(1)

定義3置信度 就是假設數據項A出現的同時,數據項B有多大幾率出現,即:

Confidence(A→B)=P(A|B)

(2)

1.2 CBA算法

CBA算法是建立在關聯規則上的分類算法,主要分為CBA-RG和CBA-CB兩個過程。過程內容可分述如下。

1.2.1 CBA-RG

CBA-RG算法的核心思想是采用迭代方法,從候選集中來產生頻繁項集。具體步驟如下:

(1)設定最小的支持度。

(2)掃描整個數據庫中的事務集數據,產生候選集合,同時生成了候選一項集C1。

(3)從候選一項集中,找出滿足大于設定最小支持度的數據,保留得到頻繁一項集K1,并刪除不滿足的數據。

(4)利用得到的L1去生成候選集合C2。

(5)根據設定的最小支持度生成頻繁項集K2。

(6)迭代生成頻繁項集K,直至不能再繼續為止。

1.2.2 CBA-CB

該算法主要通過如下步驟來構造其分類器。對其可得闡釋解析如下。

(1)選取高置信度的規則優先插入到分類器中,同時刪除前規則、連同其覆蓋的數據對象。假設該規則沒有覆蓋任何對象,則不進入分類器。

(2)將該分類器中不能繼續增加準確率的規則開展剪枝處理,生成最后的分類器規則。

2 一種改進的關聯分類算法ACW設計

研究中,假設數據庫中存在事務F={F1,F2,F3,…,Fn},類L={l1,l2,l3,…,ln},數據條目D={D1,D2,…,Dn}。其中,每個數據D={D1,D2,…,Dn}在類L中都有一個從屬類別。單數據對應的類L可能有多個。事務F對應的數據條目總數為{n1,n2,n3,…,nk}。

對于數據條目D1,分屬的類別可能包含有{l1,l2,l3,…,ln}。研究時將D1∈l1的次數設為a1。D2∈l2的次數設為a2。以此類推到an。同時,將這些數據條目出現的次數記為A={t1,t2,t3,…,tn},再設sum={t1+t2+t3+…+tn},則D1∈{l1,l2,l3,…,ln}的類權重表示為{t1/sum,t2/sum,t3/sum,…,tn/sum},并記作s1。將D2∈{l1,l2,l3,…,ln}的類權重表示為{t1/sum,t2/sum,t3/sum,…,tn/sum},并記作s2。以此類推,Dn∈{l1,l2,l3,…,ln}的類別集合權重為{t1/sum,t2/sum,t3/sum,…,tn/sum}記作sn。最后,集合L={l1,l2,l3,…,ln}權重可推斷設置為{(s1+s2+…+sn)/n1,(s1+s2+s3+…+sn)/n2,…,(s1+s2+s3+…+sn)/nk}。將計算得到的結果記為w{wi1,wi2,wi3,…,win},同時,把所有數據條目權重設為a,其中0

定義4數據條目D={D1,D2, …,Dn}的加權支持度[4]為:

(3)

定義5形如規則X?Y的加權支持度為:

(4)

定義6規則X?Y的加權置信度為:

(5)

(1)先不考慮數據庫中數據條目的權重,利用CBA-RG產生出所有的最大屬性的方法,在數據庫中找到所有大于設定的最小加權支持度數據。由于加權支持度小于支持度,很容易知道這些屬性集合是大加權屬性集合的超集。

(2)根據公式(3)~(5)計算超集中所有數據條目及類的加權支持度,同時乘以相應的數據權重。刪除了加權支持度低于最小加權支持度的數據,生成所有加權屬性大的數據集。

(3)生成最終關聯分類數據條目。輸入相關數據條目,并依據運行結果,得到最終類別。

3 實驗數據分析

該算法使用的硬件環境配置為:CPU為Core i5-7500、3.4 GHz,內存為2 GB,硬盤500 GB。系統環境為Window7。研究時,從UCI上下載了樣本數據集。本程序采用Java運行實現。該程序的測試樣本數據flare是從UCI數據集下載。實驗中,涉及到的類別數據內容可見表1。

表1 樣本數據集合介紹Tab. 1 Introduction of sample data set

過程中,在未執行算法前,對一些數據進行了預處理,把一些連續數據離散化,同時刪除了部分干擾數據。隨后啟動算法運行,分別從算法執行準確度和運行時間進行了分析,最終運行效果如圖1、圖2所示。

圖1 設定不同最小支持度的準確度Fig. 1 The accuracy with different minsupport settings

圖2 設定不同最小支持度的運行時間Fig. 2 Running time with different minsupport settings

4 結束語

本文針對現有的關聯分類算法,設計提出了一種基于類權重改進的ACW算法。結合UCI上的數據,并對算法性能進行了測試。實驗表明,改進后的ACW算法是一種有效的、穩定的關聯分類算法。

[1] LIU Bing,HSU W, MA Yiming. Integrating classification and association rule mining[C]//Proceedings of the fourth international conference on knowledge discovery and data mining. New York: ACM, 1998:1-7.

[2] LI Wenmin, HAN Jiawei, PEI Jian. CMAR: Accurate and efficient classification based on multiple class-association rules[C]//Data Mining, 2001. ICDM 2001, Proceedings IEEE International Conference on. San Jose, CA, USA:IEEE, 2001: 369-376.

[3] YIN Xiaoxin, HAN Jiawei. CPAR: Classification based on predictive association rules[C]//Proceedings of the 2003 SIAM International Conference on Data Mining. San Francisco, CA, USA:Society for Industrial and Applied Mathematics, 2003: 331-335.

[4] 李成軍,楊天奇. 一種改進的加權關聯規則挖掘方法[J]. 計算機工程,2010,36(7):55-57.

[5] 陳曉云,胡運發. 基于自適應加權的文本關聯分類[J]. 小型微型計算機系統,2007,28(1):116-121.

[6] 張健,王蔚. 基于支持度與置信度閾值優化技術的關聯分類算法[J]. 計算機應用,2007,27(12):3032-3034,3038.

[7] 蔡永泉,晉月培,葛安生,等. 基于關聯分類的中文短信分類[J]. 北京工業大學學報,2015,41(7):1020-1027.

猜你喜歡
關聯定義規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
山的定義
公務員文萃(2013年5期)2013-03-11 16:08:37
主站蜘蛛池模板: 一本无码在线观看| 国产高清色视频免费看的网址| 欧美第九页| 成人字幕网视频在线观看| 欧美成人手机在线观看网址| 国产精品蜜臀| 亚洲日本中文综合在线| 99尹人香蕉国产免费天天拍| 97久久精品人人做人人爽| 精品视频在线一区| 国产91久久久久久| 国产91视频观看| 一级毛片免费不卡在线| 好吊色妇女免费视频免费| 无码一区二区三区视频在线播放| 手机永久AV在线播放| 亚洲欧美成人在线视频| 国产成人精品一区二区不卡| 久久伊人久久亚洲综合| 久久精品人妻中文视频| 久久6免费视频| 91精品aⅴ无码中文字字幕蜜桃| 国产精品大尺度尺度视频| 亚洲精品亚洲人成在线| 日本午夜精品一本在线观看| 亚洲第一黄色网址| 国内精品自在欧美一区| 亚洲日韩精品综合在线一区二区| 一本色道久久88| 久草网视频在线| 996免费视频国产在线播放| 国产一区二区三区在线精品专区| 国产精品va| 一级做a爰片久久免费| 国产国产人成免费视频77777| 久久久久免费看成人影片| 91视频区| 久久久久88色偷偷| 中文字幕无码av专区久久| 久久这里只有精品66| 九色综合视频网| 黄色网在线免费观看| 人妻无码一区二区视频| 一区二区三区高清视频国产女人| 色哟哟国产精品一区二区| 欧美亚洲中文精品三区| 亚洲AV无码不卡无码| 国产浮力第一页永久地址| 国产一线在线| 一区二区偷拍美女撒尿视频| 国内精品九九久久久精品| 狠狠五月天中文字幕| 精品福利一区二区免费视频| 久久婷婷综合色一区二区| 国产欧美精品午夜在线播放| 色噜噜狠狠色综合网图区| 99九九成人免费视频精品| 极品国产在线| 日韩精品免费一线在线观看| 国产精品一区二区在线播放| 色久综合在线| 米奇精品一区二区三区| 亚亚洲乱码一二三四区| 青青网在线国产| 婷婷综合缴情亚洲五月伊| 国产精品久久久久久久久kt| 久久这里只有精品2| 91九色最新地址| 欧美成人免费午夜全| 无码免费的亚洲视频| 亚洲欧美一级一级a| 国产真实二区一区在线亚洲| 国产成人综合网| 国产在线视频福利资源站| 亚洲乱伦视频| 国产乱子伦精品视频| 福利视频久久| 欧美a级在线| 欧美精品H在线播放| 亚洲 成人国产| 国产第一色| 精品色综合|