譚成兵,劉 源,徐 健,3
(1.亳州職業(yè)技術(shù)學(xué)院 智能工程系,安徽 亳州 236813;2.桂林醫(yī)學(xué)院 信息中心,廣西 桂林 541001;3.桂林電子科技大學(xué) 機(jī)電工程學(xué)院,廣西 桂林 541004)
聚類作為數(shù)據(jù)分析的常用方法,在多個行業(yè)得到了深度應(yīng)用,特別是基于大數(shù)據(jù)分析時,通過對大規(guī)模數(shù)據(jù)的聚類,可以完成多種看似無關(guān)聯(lián)的數(shù)據(jù)的歸類,從而降低了大規(guī)模數(shù)據(jù)管理和分析的難度。基于聚類分析的應(yīng)用場景非常多,在電商領(lǐng)域,可根據(jù)用戶消費(fèi)數(shù)據(jù)進(jìn)行分類來制定合適的營銷方案[1];在線服務(wù)行業(yè)中,可以根據(jù)用戶使用習(xí)慣實現(xiàn)用戶聚類[2],為不同類別用戶推薦合適服務(wù)等。在基于互聯(lián)網(wǎng)的數(shù)據(jù)分析平臺中,隨處可見聚類技術(shù)的影子。
當(dāng)前,關(guān)于聚類挖掘的研究成果較多,主要集中在聚類算法的研究方面。余勝輝和李玲娟采用層次聚類算法來實現(xiàn)聚類[3],為了提高大規(guī)模數(shù)據(jù)的聚類性能,他們應(yīng)用spark平臺完成并行聚類研究,節(jié)省了聚類時間;陶瑩等采用K均值聚類算法實現(xiàn)大規(guī)模樣本數(shù)據(jù)聚類[4],并研究了不同K值情況下的聚類性能;雷濤等采用模糊聚類算法應(yīng)用于圖像類樣本的聚類[5],實現(xiàn)了從文本到圖像聚類的轉(zhuǎn)變,開拓了聚類算法的新應(yīng)用對象。這些算法實現(xiàn)了不同規(guī)模和類型的數(shù)據(jù)聚類,取得了較好的聚類準(zhǔn)確率,本文采用K-medoids聚類,通過布谷鳥算法來進(jìn)行優(yōu)化,提高聚類準(zhǔn)確率;在聚類時間方面采用了多節(jié)點的并行聚類方法,提高聚類效率[6]。
設(shè)鳥群共有N只布谷鳥,鳥巢被宿主發(fā)現(xiàn)概率為Pa,鳥群的初始位置分布為X0,計算初始適應(yīng)度,選擇較好的鳥巢和對應(yīng)最優(yōu)解集合分別為。……