摘要:研究現(xiàn)有的迭代優(yōu)化聚類的初始化方法:即采樣法,距離優(yōu)化法以及密度估計(jì)法,分析它們的優(yōu)缺點(diǎn)。提出一種新的基于距離的初始化方法,它不需要設(shè)定門限,不受數(shù)據(jù)集的順序影響,它使得聚類過程有良好的速度和迭代次數(shù),且初始化運(yùn)算時(shí)間較短。對孤立點(diǎn)和噪聲有較強(qiáng)的抑制作用。它適用于較大規(guī)模數(shù)據(jù)的聚類初始化。
關(guān)鍵詞:數(shù)據(jù)挖掘;聚類;聚類有效性;聚類初始化;分類屬性
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A