999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法研究

2014-04-17 09:12:21韋麗紅
佳木斯職業(yè)學院學報 2014年1期
關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則

韋麗紅 陳 松

(呼倫貝爾學院計算機科學與技術(shù)學院 內(nèi)蒙古海拉爾 021008;

呼倫貝爾市人力資源和社會保障局 內(nèi)蒙古海拉爾 021008)

數(shù)據(jù)挖掘技術(shù)與關(guān)聯(lián)規(guī)則挖掘算法研究

韋麗紅 陳 松

(呼倫貝爾學院計算機科學與技術(shù)學院 內(nèi)蒙古海拉爾 021008;

呼倫貝爾市人力資源和社會保障局 內(nèi)蒙古海拉爾 021008)

探討數(shù)據(jù)挖掘在現(xiàn)今關(guān)聯(lián)規(guī)則算法中的使用情況,提出目前研究關(guān)聯(lián)規(guī)則的研究現(xiàn)狀,針對現(xiàn)狀,總結(jié)出一種新的研究分析關(guān)聯(lián)方法,指出關(guān)聯(lián)規(guī)則算法在今后的出路以及進一步的研究方向。利用分析文獻查詢和比較分析方法,闡述各種方法對典型關(guān)聯(lián)的影響,其中作為一個為基點是以核心Apriori的算法。結(jié)論是Apriori算法仍然有一些不能消除的缺點,這有待進一步研究,同時指出今后的研究方向需要提高大量數(shù)據(jù)的運算效率,并且能夠與OLAP相互結(jié)合生產(chǎn)結(jié)果的可視化。

Apriori算法;研究;DM;技術(shù)

數(shù)據(jù)挖掘(DM)是在大量未知的、無規(guī)則的、偶然的現(xiàn)實數(shù)據(jù)當中提煉出隱含的關(guān)聯(lián)信息或知識,這就是關(guān)聯(lián)規(guī)則挖掘。關(guān)聯(lián)規(guī)則挖掘是在20世紀90年代提出來的[1],這個問題提出了以后,很多研究人員和科學家對關(guān)聯(lián)規(guī)則問題進行了深入的研究,從不同思考問題的角度提出了數(shù)十種關(guān)聯(lián)規(guī)則挖掘算法,Apriori是最著名的關(guān)聯(lián)規(guī)則算法,這個是由一個非常著名的美國統(tǒng)計學家提出的,Apriori算法影響了之后很多算法的建立。在很多科學家和研究人員的繼承和發(fā)揚這個關(guān)聯(lián)規(guī)則算法之后,現(xiàn)今的關(guān)聯(lián)規(guī)則算法逐漸完善了以前的缺陷。

一、關(guān)聯(lián)規(guī)則的種類

1.按照需要的數(shù)據(jù)變量進行處理分類,關(guān)聯(lián)規(guī)則分為布爾型和數(shù)值型。布爾型[2]顯示數(shù)據(jù)變量之間的關(guān)系,它無法處理關(guān)聯(lián)規(guī)則中的連續(xù)的變量;而可以結(jié)合多維關(guān)聯(lián)的是數(shù)值型的關(guān)聯(lián)規(guī)則(或者多層關(guān)聯(lián)),然后對數(shù)值型的數(shù)據(jù)進行處理,然后進行動態(tài)分析。

2.按照關(guān)聯(lián)規(guī)則中的抽象層次,可以分為單層關(guān)聯(lián)規(guī)則和多層關(guān)聯(lián)規(guī)則。現(xiàn)實數(shù)據(jù)中單層關(guān)聯(lián)規(guī)則對所有的變量都不考慮這些單層因素;而多層關(guān)聯(lián)規(guī)則是會考慮現(xiàn)實數(shù)據(jù)中的多層因素,并且對多層進行了充分的考慮。

3.按照規(guī)則中涉及多的數(shù)據(jù)維數(shù),可以分為單維關(guān)聯(lián)規(guī)則和多維關(guān)聯(lián)規(guī)則。如果數(shù)據(jù)只設(shè)計到一個維數(shù),那就屬于單維關(guān)聯(lián)規(guī)則,反之則屬于多維關(guān)聯(lián)規(guī)則。在單維關(guān)聯(lián)規(guī)則中,我們只處理單個屬性,關(guān)系明了簡單。在多維關(guān)聯(lián)規(guī)則中則需要處理不同屬性之間的某些聯(lián)系,處理的關(guān)系較復雜。

二、關(guān)聯(lián)規(guī)則中經(jīng)典頻集方法的算法

在20世紀90年代,挖掘交易數(shù)據(jù)中集間的關(guān)聯(lián)規(guī)則問題是由一位非常著名的明國科學家首選提出的[3],頻集理論的方法是當時的核心推算方法,之后所有研究數(shù)據(jù)挖掘方面的研究人員和科學家都在頻集理論的方法上進一步優(yōu)化。隨著時代變遷,隨機采樣、并行等理論引進頻集理論,然后對關(guān)聯(lián)規(guī)則的應用進一步推廣。

經(jīng)典頻集方法的核心算法分為兩步:尋找頻集的規(guī)則屬于第一步,第二步的步驟如下。如一個給定的已知頻集X=T1T2…Tn,n≥2,只有集合{T1T2…Tn}中的項的所有規(guī)則(最多n條)就產(chǎn)生了,其中每一條規(guī)則的右部只有一項。為了使所有的頻集能夠產(chǎn)生,接下來就使用遞推的運算方法進行計算。

在經(jīng)典頻集方法中仍然有很多不足,所以后來的研究人員在經(jīng)典頻集的基礎(chǔ)上進行了優(yōu)化,優(yōu)化是多方面的,主要在以下幾個方面進行,如基于棧變換的算法;基于劃分的方法;減少冗余規(guī)則的算法;基于采樣的方法;基于Hash的方法等。在進行一系列的優(yōu)化之后,經(jīng)典頻集方法得到完善和推廣應用。

三、衡量關(guān)聯(lián)規(guī)則價值的方法

1.系統(tǒng)方面。“支持度-可信度”的結(jié)構(gòu)能夠適用于很多算法,但是這種框架有時候會產(chǎn)生錯誤的信息。比如某些結(jié)果雖然更精確,但是支持度和可信度都較低。如果我們設(shè)置支持度和可信度的時候程度較低,這樣就可能得到兩個相互矛盾的結(jié)果。但是如果設(shè)置的過高,我們就無法得到準確的關(guān)聯(lián)規(guī)則,不利于結(jié)果分析。所以,僅僅通過“支持度-可信度”這個準則來判斷是不夠準確的。從很多記錄看出,支持度是很多用戶信任的重要因素,如果把支持度設(shè)置足夠低,不會丟失任一有意義的結(jié)果,但是計算效率可能不是很高,從用戶觀點上,這是可行的規(guī)則。

2.用戶方面。一項規(guī)則有沒有用,很重要一點是否取得用戶的信任,用戶的體驗感受是很重要的。當用戶覺得有效和可行,這個規(guī)則才可以繼續(xù)存在和發(fā)展。所以在現(xiàn)實中,我們不僅考慮系統(tǒng)運算的結(jié)果,同時也要結(jié)合用戶的需求。

四、討論

關(guān)聯(lián)規(guī)則的各種方法在數(shù)據(jù)挖掘的運用上已經(jīng)逐漸成熟,如今很多大型IT公司或者金融公司的很多大型項目已經(jīng)運用了關(guān)聯(lián)規(guī)則中的某些研究成果,關(guān)聯(lián)規(guī)則算法的應用前景可以說是非常的廣泛。綜上所述,在關(guān)聯(lián)規(guī)則方面的數(shù)據(jù)挖掘,今后幾年可以在關(guān)聯(lián)規(guī)則相結(jié)合的問題、提高處理大量數(shù)據(jù)效率問題以及結(jié)果可視化方面進行研究和突破。

[1]李銘.關(guān)聯(lián)規(guī)則的多支持度挖掘在銷售數(shù)據(jù)中的應用[J].計算機工程,2012,29(8):92-93.

[2]李哲,楊兆中,龐炳章.大型數(shù)據(jù)庫中關(guān)聯(lián)規(guī)則的向量法挖掘[J].計算機工程,2010,32(5):47-49.

[3]惠曉濱,張鳳鳴,虞健飛.一種基于棧變換的高效關(guān)聯(lián)規(guī)則算法[J].計算機研究與發(fā)展,2011,40(2):30-35.

Data mining techniques and algorithms for mining association rules

Wei Li-hong, Chen Song

(Computer Science and Technology Institute, Hulunbeier University, Hailar Inner Mongolia, 021008, China;
Hulunbeier Human Resources and Social Security Bureau, Hailar Inner Mongolia,021008, China)

To explore the data used in the algorithm of association rules mining, proposes the research status, sums up a new research association analysis method according to the present situation, points out the algorithm of association rules in the future and further work. Using the analysis of literature search and comparative analysis method, to discuss the influence of various methods of typical connection, which serves as a basis for the Apriori algorithm. Conclusion still has some cannot eliminate the disadvantages of Apriori algorithm, which need further research, and points out the direction of future research to improve the computation efficiency of large amounts of data, can produce the visualization of results combined with OLAP.

Apriori algorithm; research; DM; technology

P413

A

1000-9795(2014)01-0498-01

[責任編輯:陳懷民]

2013-11-27

韋麗紅(1982-),女,黑龍江人,講師,從事語義web、文本挖掘、信息處理方向的研究。陳 松(1985-),男,內(nèi)蒙古人,助理工程師,從事計算機科學與技術(shù)方向的研究。

猜你喜歡
數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則
撐竿跳規(guī)則的制定
“苦”的關(guān)聯(lián)
當代陜西(2021年17期)2021-11-06 03:21:36
數(shù)獨的規(guī)則和演變
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
奇趣搭配
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規(guī)則對我國的啟示
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
主站蜘蛛池模板: 精品三级网站| 五月婷婷综合色| 国产一区免费在线观看| 亚洲日本一本dvd高清| 国产欧美亚洲精品第3页在线| 日韩欧美中文字幕在线韩免费| 无码免费视频| 亚洲精品无码专区在线观看| 欧美一级在线播放| 国产日韩欧美在线视频免费观看| 日本久久久久久免费网络| 波多野结衣在线一区二区| 久久伊人操| 人人爱天天做夜夜爽| 日韩天堂在线观看| 亚洲av日韩综合一区尤物| 久久综合婷婷| 欧美三级自拍| 久久婷婷五月综合97色| 中文字幕调教一区二区视频| 区国产精品搜索视频| 国产精品手机在线观看你懂的| 国产国模一区二区三区四区| 五月婷婷导航| 亚洲侵犯无码网址在线观看| 精品久久久久成人码免费动漫| 精品一区二区三区四区五区| 在线观看免费国产| 国产av一码二码三码无码| 88av在线看| 亚洲国产综合精品中文第一| A级全黄试看30分钟小视频| 日本91视频| 女人18毛片一级毛片在线| 尤物成AV人片在线观看| 天天综合亚洲| 亚洲成人播放| 午夜毛片免费看| 无码久看视频| a毛片免费在线观看| 欧美午夜在线视频| 国产婬乱a一级毛片多女| 一级香蕉人体视频| 亚洲日韩图片专区第1页| 啊嗯不日本网站| 国产一级二级三级毛片| 视频一区亚洲| 国产欧美精品一区二区| 中文字幕久久波多野结衣| 久久综合色视频| 欧洲欧美人成免费全部视频| 免费Aⅴ片在线观看蜜芽Tⅴ| 中文字幕伦视频| 91精品aⅴ无码中文字字幕蜜桃| 亚洲国产一区在线观看| 中文字幕人妻av一区二区| 色婷婷成人| 国产玖玖玖精品视频| aaa国产一级毛片| 5555国产在线观看| 九色综合伊人久久富二代| 欧美a在线视频| 国产在线自乱拍播放| 欧美日一级片| 精品在线免费播放| 黄色网页在线播放| 国产主播喷水| 99re经典视频在线| 欧美一区国产| 亚洲三级色| 久久永久精品免费视频| 欧美日韩v| 国产99免费视频| 制服丝袜一区二区三区在线| 动漫精品中文字幕无码| 亚洲国产清纯| 在线国产毛片| 欧洲av毛片| 成人福利在线免费观看| 欧美在线导航| 三上悠亚在线精品二区| 99r在线精品视频在线播放|