999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

K-means算法概述

2021-12-18 20:38:34宋慶蘭

宋慶蘭

隨著經(jīng)濟(jì)、科技的發(fā)展產(chǎn)生了大量的數(shù)據(jù)和爆炸的信息,傳統(tǒng)的處理方法已不能高效快速地對(duì)這龐大的數(shù)據(jù)進(jìn)行分析,云計(jì)算和大數(shù)據(jù)應(yīng)運(yùn)而生。當(dāng)前大數(shù)據(jù)已經(jīng)滲透到了人們生活的各個(gè)領(lǐng)域,比如:金融行業(yè),醫(yī)學(xué)行業(yè)和管理行業(yè)等,其中以IT行業(yè)最為明顯,大數(shù)據(jù)分析最常用的分析方法就是聚類分析。聚類分析的方法大部分可以應(yīng)用于所有對(duì)象,簇內(nèi)的對(duì)象相似度越高,聚類的效果就越好,聚類算法為了得到改進(jìn),試圖將相似的對(duì)象歸入同一簇,不相似的對(duì)象歸到不同簇。很明顯,我們需要一種合適的相似度計(jì)算方法,目前已經(jīng)知道的相似度的計(jì)算方法有歐氏距離、余弦距離以及漢明距離等,在應(yīng)用中要根據(jù)實(shí)際情況選擇合適的相似度計(jì)算方法。當(dāng)然,任何一種算法都存在一定的缺陷,K-means算法也有它的不足之處,但是可以通過一些方法處理后得到更好的聚類結(jié)果。

K-means算法

隨機(jī)從樣本數(shù)據(jù)中輸入聚類個(gè)數(shù),還有數(shù)據(jù)庫(kù),此數(shù)據(jù)庫(kù)包含個(gè)數(shù)據(jù)對(duì)象,然后輸出滿足方差最小標(biāo)準(zhǔn)個(gè)聚類,就是K-means算法。K-means算法接受輸入量;為了滿足所獲得的聚類,將個(gè)數(shù)據(jù)對(duì)象劃分為個(gè)聚類:相似度較高的為同一聚類中的對(duì)象;而不同聚類中的對(duì)象相似度較小。

K-means聚類算法的具體流程:

(1)任意選取個(gè)對(duì)象作為初始聚類中心;

(2)計(jì)算各個(gè)對(duì)象與中心對(duì)象的距離;并根據(jù)最小距離對(duì)這些對(duì)象重新進(jìn)行劃分;

(3)計(jì)算那些重新劃分的對(duì)象;

(4)計(jì)算標(biāo)準(zhǔn)測(cè)度函數(shù),當(dāng)滿足一定條件時(shí)算法終止;否則返回到(2)。

K-means算法的研究現(xiàn)狀和發(fā)展動(dòng)態(tài)

傳統(tǒng)的K-means算法存在的缺點(diǎn)有:對(duì)網(wǎng)頁(yè)處理不足的;在文本聚類中有一定的局限性;中心值的個(gè)數(shù)難以確定、孤立點(diǎn)和噪聲也會(huì)有較大影響等。傳統(tǒng)K-means算法處理的數(shù)據(jù)僅限于數(shù)值型數(shù)據(jù),但在實(shí)際生活中,我們要處理并非只有數(shù)值型數(shù)據(jù),還有可能要處理類屬型的數(shù)據(jù),甚至是混合屬性特征的數(shù)據(jù)。這時(shí),傳統(tǒng)的K-means算法不能夠得到有效的結(jié)果,K-means算法可以對(duì)類屬性和混合型屬性的對(duì)象集進(jìn)行聚類。

基于初始聚類中心優(yōu)化的K-means算法,主要是通過計(jì)算對(duì)象相互之間的距離產(chǎn)生密度參數(shù),非常好地優(yōu)化了傳統(tǒng)K-means算法的缺點(diǎn)。K-means動(dòng)態(tài)聚類算法也考慮到聚類過程中的信息變化,在數(shù)據(jù)量龐大的情況下,通過假定終止條件來減少迭代次數(shù),降低時(shí)間復(fù)雜度,刪除冗余信息來減少聚類過程中的干擾等方法,K-means動(dòng)態(tài)聚類算法聚類效果得到一定的提高,這就是傳統(tǒng)K-means算法和K-means動(dòng)態(tài)聚類算法的區(qū)別。此外,為了可以獲得數(shù)據(jù)的基本情況,聚類分析被作為其他算法的預(yù)處理步驟,利用聚類對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,在此基礎(chǔ)上,要想獲得更深層次的、更有用的信息,還要進(jìn)行特征抽取或分類以提高精確度和挖掘效率,或者對(duì)聚類結(jié)果做進(jìn)一步分析,這也更加適應(yīng)現(xiàn)代社會(huì)的需要。

針對(duì)K-means算法存在受初始值影響大的缺點(diǎn),本文提出了一種新的K-means++算法。

K-means++算法的改進(jìn)在于初始聚類中心的選擇。K-means++算法選取初始聚類中心時(shí),按照聚類中心之間的距離盡可能遠(yuǎn)的原則,選擇個(gè)初始聚類中心。K-means++算法選擇初始聚類中心的主要思想是:假如已經(jīng)選擇了(0< <)個(gè)初始聚類中心;再選擇第+1個(gè)聚類中心時(shí),距離個(gè)聚類中心越遠(yuǎn)的對(duì)象,越有可能被選作第1個(gè)聚類中心。

經(jīng)過研究表明,雖然足夠多的實(shí)驗(yàn)次數(shù)和足夠大的迭代次數(shù),都能使K-means算法和K-means++算法收斂至全局最小值,但K-means++算法的收斂速度更快、效果更好。也證明改進(jìn)后的K-means++算法降低了初始聚類中心對(duì)K-means影響,提高了算法的效率和準(zhǔn)確性。

本文主要對(duì)K-means算法的研究現(xiàn)狀和發(fā)展?fàn)顟B(tài)進(jìn)行了闡述,并分析了聚類算法中比較有代表性的K-means算法;如何對(duì)K-means算法的缺點(diǎn)進(jìn)行改進(jìn);K-means算法的精簡(jiǎn)優(yōu)化;以及如何選擇合適的初始聚類中心,以減少初始值對(duì)K-means算法的影響,從而提高算法效率。

主站蜘蛛池模板: 国产精品第页| 人妖无码第一页| 免费在线色| 真人免费一级毛片一区二区| 国产精品欧美在线观看| 亚洲无码免费黄色网址| 成人一级免费视频| 国产女人爽到高潮的免费视频| 国产毛片高清一级国语 | a色毛片免费视频| 国产欧美日韩精品综合在线| 99在线小视频| 精品国产www| 亚洲日韩精品欧美中文字幕| 国产成人免费手机在线观看视频 | 看国产一级毛片| 国产精品自拍合集| 青青极品在线| 国产chinese男男gay视频网| 欧美人人干| 乱系列中文字幕在线视频 | 国产免费高清无需播放器| 国产99久久亚洲综合精品西瓜tv| 欧美视频在线播放观看免费福利资源 | 片在线无码观看| 免费看的一级毛片| 国产精品久久久久鬼色| 亚洲精品手机在线| 国产欧美日韩在线在线不卡视频| 亚洲一区二区黄色| 国产精品香蕉在线| 91小视频在线观看免费版高清| 久久久国产精品免费视频| 99一级毛片| 高h视频在线| 欧美h在线观看| 91精品国产情侣高潮露脸| 日韩第一页在线| 国产浮力第一页永久地址| 多人乱p欧美在线观看| 久久精品人人做人人综合试看| 国产精品永久免费嫩草研究院 | 欧美日本激情| 国产内射一区亚洲| 五月婷婷综合在线视频| 中文字幕色在线| 99久久成人国产精品免费| 亚洲福利片无码最新在线播放 | 中文字幕精品一区二区三区视频| 日韩专区第一页| 免费人成视网站在线不卡| 日韩A∨精品日韩精品无码| 色视频国产| 亚洲天堂网在线播放| 手机在线免费不卡一区二| h网站在线播放| 无码又爽又刺激的高潮视频| 欧美成人午夜视频免看| 中文字幕亚洲电影| 精品午夜国产福利观看| 国产原创第一页在线观看| 国产精品视频第一专区| 国产真实二区一区在线亚洲| 成人在线综合| 人妻精品久久无码区| 免费不卡视频| 国产精品美女网站| 都市激情亚洲综合久久| 国产成人精品视频一区视频二区| 99精品福利视频| 亚洲人成在线精品| 欧日韩在线不卡视频| AV不卡无码免费一区二区三区| 99国产在线视频| 国产小视频在线高清播放| 波多野结衣无码中文字幕在线观看一区二区| 亚洲男人的天堂视频| 成人精品免费视频| 亚洲天堂色色人体| 成人在线观看不卡| 欧美日韩综合网| 麻豆精品在线视频|