摘要:目前的聚類算法如K-means、DBSCAN等,采用全局參數而難以發現數據的自然聚類,提出一種新的分級聚類算法CIUFNC,能夠在數據空間中發現內部聚類特征。該算法的參數包括網格大小、噪聲閾值和神經節點數量。算法首先根據參數對數據空間劃分網格,接著使用高斯影響函數計算每個單元的場強,然后針對網格位置和網格的場強使用SOM進行聚類,最后使用Chameleon算法對SOM聚類得到的神經網絡節點的權值進行聚類,并把聚類結果映射回原始數據空間以得到最終聚類結果。理論分析和實驗結果證明,該算法能夠發現數據空間內更自然的聚類,而且具有較高的執行效率。 關鍵詞:數據挖掘;聚類;神經網絡;網格;動態模型 中圖分類號:TP301.6 文獻標志碼:A 文章編號:1001-3695(2009)08-2871-03