999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

應(yīng)用Aprion算法實現(xiàn)大規(guī)模數(shù)據(jù)庫關(guān)聯(lián)規(guī)則挖掘的技術(shù)研究

2016-07-09 15:39:25郝海濤馬元元
現(xiàn)代電子技術(shù) 2016年7期

郝海濤 馬元元

摘 要: 隨著信息技術(shù)的發(fā)展,大數(shù)據(jù)時代的到來,在這種環(huán)境下必須進行數(shù)據(jù)挖掘工作。從大量的應(yīng)用數(shù)據(jù)中將潛在的有價值的知識和信息挖掘出來,以便將其應(yīng)用在實際工作的改進中。目前,數(shù)據(jù)挖掘的方法有很多,其中關(guān)聯(lián)規(guī)則挖掘技術(shù)應(yīng)用比較廣泛,這種數(shù)據(jù)挖掘方式利用Aprion算法,挖掘出置信度和支持度均比較高的關(guān)聯(lián)信息,反映出數(shù)據(jù)庫中的數(shù)據(jù)相互之間的復(fù)雜性和有趣性,進而挖掘出數(shù)據(jù)之間的有益關(guān)聯(lián),促進大規(guī)模數(shù)據(jù)庫信息挖掘技術(shù)的發(fā)展,主要從Aprion算法方面分析大規(guī)模數(shù)據(jù)庫關(guān)聯(lián)規(guī)則挖掘的技術(shù)。

關(guān)鍵詞: Aprion算法; 大規(guī)模數(shù)據(jù)庫; 關(guān)聯(lián)規(guī)則挖掘; 置信度; 支持度

中圖分類號: TN911?34 文獻標(biāo)識碼: A 文章編號: 1004?373X(2016)07?0124?03

Abstract: With the development of information technology and coming of big data era, it is necessary to perform data mining work in this environment. The potential and valuable knowledge and information should be mined from the massive application data to apply it in the improvement of practical work. The methods of data mining are numerous at present, in which the association rule mining technology is widely used. The Aprion algorithm is used in this data mining way to mine the correlation information with high confidence coefficient and support degree, which can reflect the complexity and interestingness among the data in database. And then the useful correlation among the data is mined to promote the development of large?scale database information mining technology. The association rule mining technology of large?scale database is analyzed in the aspect of Aprion algorithm.

Keywords: Aprion algorithm; large?scale database; association rule mining; confidence coefficient; support degree

0 引 言

數(shù)據(jù)挖掘(Data Mining)主要是指在大型數(shù)據(jù)庫中從大量的原始數(shù)據(jù)中挖掘出一些具有未知潛在應(yīng)用價值的信息。數(shù)據(jù)挖掘是解決信息技術(shù)迅速發(fā)展下數(shù)據(jù)豐富而信息匱乏的一種有效解決方式。在眾多的數(shù)據(jù)挖掘方法中關(guān)聯(lián)規(guī)則是一種比較重要的挖掘技術(shù)方式,對關(guān)聯(lián)規(guī)則挖掘算法——Aprion算法進行詳細(xì)分析,進一步研究大規(guī)模數(shù)據(jù)庫關(guān)聯(lián)規(guī)則挖掘的技術(shù),促進數(shù)據(jù)庫挖掘技術(shù)的發(fā)展。

1 Aprion算法概述

數(shù)據(jù)關(guān)聯(lián)是信息技術(shù)發(fā)展模式下各種軟件數(shù)據(jù)庫中存在的一縱橫能夠反映一個或其他事件之間依賴性和關(guān)聯(lián)性的一種信息。2個或者2個以上的數(shù)據(jù)之間存在的一種規(guī)律性,通過對這種規(guī)律性的分析,建立數(shù)據(jù)關(guān)聯(lián)規(guī)則,進而挖掘出隱藏在數(shù)據(jù)之間的相互關(guān)系,并將這種關(guān)聯(lián)進行有效分析。而關(guān)聯(lián)規(guī)則挖掘Aprion算法是一種比較全面的分析模式算法,它能夠發(fā)現(xiàn)記錄中不同數(shù)據(jù)屬性之間的關(guān)聯(lián)性,而且能夠反映出給定數(shù)據(jù)集中特征屬相鑒定的關(guān)聯(lián)性,發(fā)現(xiàn)每條信息記錄中不同特征屬相之間的相互依賴關(guān)系??梢哉fAprion算法是一種最經(jīng)典、最具影響力的關(guān)聯(lián)規(guī)則挖掘算法。

Aprion算法主要計算模式原理是利用一種稱作逐層迭代的候選集進行測試的一種定點,利用頻繁[k]項集搜索候選(k+1)項集。產(chǎn)生1?頻繁項目集[L1,]而后是2?頻繁項目集[L2,]一直到不能再擴展頻繁項目集的元素數(shù)據(jù)時才會停止算法;在Aprion算法的第[k]次循環(huán)中會產(chǎn)生k?候選項目集的集合Ck,而后實施數(shù)據(jù)庫掃描程序,以便生成支持度并測試產(chǎn)生k?候選項目集Lk,利用頻繁項目集產(chǎn)生關(guān)聯(lián)規(guī)則。然后結(jié)合頻繁項目集的向下封閉性特點實施進一步的分析,這就是常說的頻繁項目集,同時也正是因為這個特點使得Aprion算法產(chǎn)生一種檢驗方法使分析過程中的數(shù)據(jù)進行有效壓縮,無限縮小候選集,提高Aprion算法性能。

Aprion算法在計算的過程中使用逐層搜索方法,k項集主要用于探索(k+1)?項集。在這個算法分析過程中首先找到頻繁1?項集,然后找到頻繁2?項集集合,以此類推便能夠有效提高Aprion算法的分析效率,壓縮其搜索空間。Aprion算法的性質(zhì)主要表現(xiàn)在以下幾個方面:

(1) 如果項集I不能夠滿足最小支持度閾值,那么I不是頻繁的,只有I出現(xiàn)頻繁的頻率時才被看做是其性質(zhì)的一種表現(xiàn);

(2) 如果項A被添加到項I中,項I會生成一種項集IUA的集合項,IUA項也不是頻繁的,此性質(zhì)屬于反單調(diào)性質(zhì),也就是說如果一個集合不能通過測試,那么它所有的超集也不能通過相同的測試。

這種算法具有較高的效能性,能夠利用大項集合的封閉性達到縮小計算最小支持度頻繁項集數(shù)量的目的,也就是說具有避免計算不可能成為大項集的數(shù)量和候選集項,進而促進算法效能的提高。

2 Aprion算法比較分析

Aprion算法在數(shù)據(jù)分析的過程中能夠產(chǎn)生大量的項集,而且在分析的過程中需要重復(fù)掃描數(shù)據(jù)庫信息,其他算法在數(shù)據(jù)庫信息分析中一般采取分而治之的策略,然后將數(shù)據(jù)庫壓縮到頻繁模式樹中,將其分為條件數(shù)據(jù)庫,以便減少后續(xù)數(shù)據(jù)掃描時間,同時又能夠采取頻繁模式增長的方法將候選項集剔除在外,以便使其挖掘過程數(shù)據(jù)庫中不存在新事務(wù)和需要解決的問題。

另外,通過對數(shù)據(jù)庫信息中典型數(shù)據(jù)集的分析和實驗,并進行相應(yīng)的結(jié)果對比分析,發(fā)現(xiàn)對一些比較稀疏的數(shù)據(jù)集來說,數(shù)據(jù)挖掘分析中要求的最小支持度比0.2稍微大些,或者對于一些稠密的數(shù)據(jù)集在分析的過程中要求其支持度大于0.5,這種情況下采用Aprion算法比較合適,如果支持度不在這個范圍內(nèi)可以考慮其他形式算法的實施,以便最大限度的提高數(shù)據(jù)庫分析效能。

3 關(guān)聯(lián)分析規(guī)則的應(yīng)用

3.1 數(shù)據(jù)關(guān)聯(lián)規(guī)則的生成

數(shù)據(jù)挖掘工具中有很多集成了典型數(shù)據(jù)挖掘算法的模型,Aprion算法是其中之一,這種模型算法可以通過設(shè)置不同的最小置信度/支持度和關(guān)聯(lián)規(guī)模。制定事務(wù)項屬性在關(guān)聯(lián)規(guī)則中的位置,進而優(yōu)化關(guān)聯(lián)規(guī)則。所以Aprion算法應(yīng)用于關(guān)聯(lián)數(shù)據(jù)的挖掘中能夠有效提高算法效率。

3.2 算法應(yīng)用舉例分析

比如分析一個病例關(guān)聯(lián)數(shù)據(jù),首先針對病例系統(tǒng)產(chǎn)生的數(shù)據(jù)事務(wù)建立病例數(shù)據(jù)關(guān)聯(lián)模型,然后過濾病歷號、姓名等對疾病無關(guān)緊要的數(shù)據(jù),然后剔除嗜煙嗜酒等對病例關(guān)聯(lián)性不強的數(shù)據(jù),然后將左側(cè)設(shè)置為診斷外事項,將右側(cè)設(shè)置為最后診斷之間的關(guān)聯(lián)規(guī)則和因素。這時產(chǎn)生的關(guān)聯(lián)規(guī)則數(shù)據(jù)比較多,但是有很多規(guī)則價值性不大;必須通過模型進行重新設(shè)置,增加最小支持度和最小置信度,此時事務(wù)數(shù)據(jù)庫中最小支持度和最小置信度分別為40%,60%,如表1所示,然后根據(jù)以上數(shù)據(jù)庫生成FP?tree。

4 結(jié) 語

在當(dāng)今這個大數(shù)據(jù)信息量時代,數(shù)據(jù)挖掘技術(shù)顯得尤為重要,挖掘方法也比較多,但是必須選擇合適的挖掘方法,提高數(shù)據(jù)挖掘效率,在數(shù)據(jù)關(guān)聯(lián)性分析過程中要充分利用Aprion算法,使數(shù)據(jù)挖掘的效率提高。

參考文獻

[1] 王祥瑞.數(shù)據(jù)挖掘技術(shù)中關(guān)聯(lián)規(guī)則挖掘的應(yīng)用研究[J].煤炭技術(shù),2011,30(8):205?207.

[2] 于延,王建華,付偉,等.基于改進的Apriori算法的入侵檢測系統(tǒng)研究[J].計算機工程與科學(xué),2010,32(9):23?26.

[3] 張梅峰,張建偉,張新敬,等.基于Apriori的有效關(guān)聯(lián)規(guī)則挖掘算法的研究[J].計算機工程與應(yīng)用,2003,39(19):196?198.

[4] 藍祺花.動態(tài)的關(guān)聯(lián)規(guī)則挖掘算法研究[D].廈門:廈門大學(xué),2009.

[5] 丁艷輝.大規(guī)模數(shù)據(jù)庫關(guān)聯(lián)規(guī)則挖掘算法研究[D].濟南:山東師范大學(xué),2007.

[6] MEYER C G, PAPASTAMATIOU Y P, HOLLAND K N. Seasonal, diel, and tidal movements of green jobfish (aprion virescens, lutjanidae) at remote Hawaiian atolls: implications for marine protected area design [J]. Marine biology, 2007, 151(6): 2133?2143.

[7] 劉海蓉,閆仁武.一種改進的加權(quán)關(guān)聯(lián)規(guī)則挖掘算法[J].現(xiàn)代電子技術(shù),2011,34(12):51?54.

[8] 王玨.基于關(guān)聯(lián)規(guī)則的醫(yī)生診療數(shù)據(jù)挖掘系統(tǒng)的實現(xiàn)[J].現(xiàn)代電子技術(shù),2013,36(19):124?126.

主站蜘蛛池模板: 成人永久免费A∨一级在线播放| 亚洲,国产,日韩,综合一区| 一级福利视频| 欧美曰批视频免费播放免费| 热伊人99re久久精品最新地| 香蕉色综合| 精品1区2区3区| 国模私拍一区二区| 精品少妇人妻一区二区| 国产特级毛片| 亚洲无码高清免费视频亚洲| 欧美精品另类| 日韩无码黄色| 久久国产精品影院| 亚洲国产精品一区二区第一页免| 欧美人与性动交a欧美精品| 国产黑丝一区| 日韩精品一区二区三区swag| 国产成人8x视频一区二区| 精品国产成人高清在线| 99精品免费欧美成人小视频| 欧美国产三级| 久久情精品国产品免费| 亚洲福利一区二区三区| 国产精品久久久久久搜索| 在线人成精品免费视频| 九九九久久国产精品| 国产丝袜无码精品| 首页亚洲国产丝袜长腿综合| 青青草国产精品久久久久| 538国产视频| 成人在线欧美| 日韩福利在线观看| 亚洲一级色| 久久人人97超碰人人澡爱香蕉 | 久久国语对白| 中文字幕一区二区人妻电影| 国产高清不卡| 日韩欧美国产中文| 久久人妻xunleige无码| 青青国产成人免费精品视频| 色悠久久久久久久综合网伊人| 99热国产这里只有精品9九 | 98精品全国免费观看视频| 国产成人精品2021欧美日韩| 奇米影视狠狠精品7777| 欧美亚洲国产日韩电影在线| 伦精品一区二区三区视频| 国产精品片在线观看手机版| 国产精品林美惠子在线播放| 九九视频免费在线观看| 欧美成人手机在线观看网址| 熟妇丰满人妻| 97久久精品人人做人人爽| 制服丝袜国产精品| 亚洲一区二区三区麻豆| 在线免费a视频| 亚洲国产欧美自拍| 精品免费在线视频| a色毛片免费视频| 亚洲精品无码在线播放网站| 成·人免费午夜无码视频在线观看| 草逼视频国产| 视频一本大道香蕉久在线播放| 一本一道波多野结衣一区二区 | 国产尤物在线播放| 亚洲伊人电影| 亚洲高清中文字幕| 亚洲人成成无码网WWW| 黄色污网站在线观看| 精品国产一二三区| 国产成人资源| 国内99精品激情视频精品| 99久久精品无码专区免费| 国产无码精品在线播放| 综合天天色| 99re在线视频观看| 国产情侣一区二区三区| 日本午夜网站| 国产97公开成人免费视频| 成人亚洲天堂| 国产精品无码久久久久AV|