摘要:為解決P2P網(wǎng)絡(luò)頻繁項(xiàng)集挖掘中存在的全體頻繁項(xiàng)集數(shù)量過(guò)多和網(wǎng)絡(luò)通信開銷較大這兩個(gè)問(wèn)題,提出了一種在P2P網(wǎng)絡(luò)中挖掘最大頻繁項(xiàng)集的算法P2PMaxSet。首先,該算法只挖掘最大頻繁項(xiàng)集,減少了結(jié)果的數(shù)量;其次,每個(gè)節(jié)點(diǎn)只需與鄰居節(jié)點(diǎn)進(jìn)行結(jié)果交互,節(jié)省了大量的通信開銷;最后,討論了網(wǎng)絡(luò)動(dòng)態(tài)變化時(shí)算法的調(diào)整策略。實(shí)驗(yàn)結(jié)果表明,算法P2PMaxSet具有較高的準(zhǔn)確率和較少的通信開銷。
關(guān)鍵詞:數(shù)據(jù)挖掘;P2P網(wǎng)絡(luò);最大頻繁項(xiàng)集;關(guān)聯(lián)規(guī)則
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2010)09-3490-03