周 兵 沈鈞毅 彭勤科
摘要:在分析BIRCH算法不足的基礎上,提出了一種基于隨機抽樣和聚類特征的聚類算法(CLAP).該算法采用隨機抽樣技術,從數據庫中抽取一部分數據進行聚類的預處理過程,這樣大大降低了運行時間.CLAP通過設立索引樹的葉節點的直徑和聚類直徑,提高了聚類的精度,并采用全局搜索和局部搜索相結合的方式,消除了輸入順序對聚類質量的影響.測試結果表明,CLAP算法不僅提高了聚類速度,而且改善了聚類質量.
關鍵詞:聚類;BIRCH算法;隨機抽樣
中圖分類號:TP31l文獻標識碼:A文章編號:0253—987X(2003)12—1234—04