摘要:分析了目前基于目標函數(shù)聚類算法的不足,面對形狀復雜且非重疊的樣本聚類問題,定義了最鄰近距離和生長樹的概念。隨機選取生長樹初始種子點,以最鄰近距離作為生長樹生長的方向和樣本劃分依據(jù),以最終生長樹大小為聚類目標函數(shù),引入遺傳算法,提出基于生長樹的遺傳聚類算法,并通過實例進行了算法測試和比較。算法測試表明:基于生長樹的遺傳聚類算法對于形狀復雜且非重疊樣本的聚類是完全可行和有效的。
關鍵詞:聚類算法; 數(shù)據(jù)挖掘; 生長樹; 遺傳算法
中圖法分類號:TP393.3
文獻標識碼:A
文章編號:1001-3695(2006)07-0062-03