摘要:P2P(peer-to-peer)網絡分布式聚類算法是利用P2P網絡上各個節(jié)點的計算、存儲能力以及網絡的帶寬,將算法的時間復雜度和空間復雜度平攤到各個節(jié)點,使處理和分析海量分布式數據成為可能,從而克服傳統(tǒng)基于單個服務器的集中式聚類算法在數據處理能力等方面的限制。提出一種基于節(jié)點置信半徑的分布式K-means聚類算法,該算法通過計算節(jié)點上數據分布的密度,找到同一類數據在節(jié)點的稠密和稀疏分布,從而確定聚類置信半徑并指導下一步的聚類。實驗表明,該算法能夠有效地減少迭代次數,節(jié)省網絡帶寬;同時聚類結果也接近集中式聚類算法的結果。