摘要:關(guān)聯(lián)規(guī)則反映了大量數(shù)據(jù)中項集之間的相互依存性和關(guān)聯(lián)性。文章介紹了關(guān)聯(lián)規(guī)則挖掘方法的原理,然后對關(guān)聯(lián)挖掘及其典型算法進行分析,指出了Apriori算法的局限性在于會產(chǎn)生大量冗余的候選集并頻繁掃描數(shù)據(jù)庫。接下來給出一種改進的Apriori算法,通過減少對數(shù)據(jù)庫搜索的次數(shù),從而減少數(shù)據(jù)挖掘過程中的I/O開銷。實踐證明,用改進后的算法進行關(guān)聯(lián)挖掘,效率優(yōu)于傳統(tǒng)的方法。
關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法;頻繁頂集