摘要:weka4wS采用WSRF技術(shù)用于執(zhí)行遠(yuǎn)程的數(shù)據(jù)挖掘和管理分布式計(jì)算,支持分布式數(shù)據(jù)挖掘任務(wù)。基于weka4ws和網(wǎng)格環(huán)境,嘗試了一種新的分布式聚類方法,并成功地將其嵌入到Weka4WS框架中,借助we—ka Libmly實(shí)現(xiàn)分布式數(shù)據(jù)挖掘算法,同時(shí)引入了距離代價(jià)和混合概率的概念,將網(wǎng)格與web服務(wù)技術(shù)融合.以分布式問題求解環(huán)境和開源數(shù)據(jù)挖掘類庫weka為底層支持環(huán)境,構(gòu)建了網(wǎng)格環(huán)境下面向服務(wù)的分布式數(shù)據(jù)挖掘體系,并以基于weka4ws的分布式聚類算法驗(yàn)證了算法的有效性和體系結(jié)構(gòu)的可行性。
關(guān)鍵詞:網(wǎng)格;分布式;聚類;數(shù)據(jù)挖掘
中圖分類號:TP311 文獻(xiàn)標(biāo)志碼:A 文章編號:1001-3695(2010)11-4072-04