999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

K-means算法概述

2021-12-18 20:38:34宋慶蘭

宋慶蘭

隨著經(jīng)濟(jì)、科技的發(fā)展產(chǎn)生了大量的數(shù)據(jù)和爆炸的信息,傳統(tǒng)的處理方法已不能高效快速地對(duì)這龐大的數(shù)據(jù)進(jìn)行分析,云計(jì)算和大數(shù)據(jù)應(yīng)運(yùn)而生。當(dāng)前大數(shù)據(jù)已經(jīng)滲透到了人們生活的各個(gè)領(lǐng)域,比如:金融行業(yè),醫(yī)學(xué)行業(yè)和管理行業(yè)等,其中以IT行業(yè)最為明顯,大數(shù)據(jù)分析最常用的分析方法就是聚類分析。聚類分析的方法大部分可以應(yīng)用于所有對(duì)象,簇內(nèi)的對(duì)象相似度越高,聚類的效果就越好,聚類算法為了得到改進(jìn),試圖將相似的對(duì)象歸入同一簇,不相似的對(duì)象歸到不同簇。很明顯,我們需要一種合適的相似度計(jì)算方法,目前已經(jīng)知道的相似度的計(jì)算方法有歐氏距離、余弦距離以及漢明距離等,在應(yīng)用中要根據(jù)實(shí)際情況選擇合適的相似度計(jì)算方法。當(dāng)然,任何一種算法都存在一定的缺陷,K-means算法也有它的不足之處,但是可以通過一些方法處理后得到更好的聚類結(jié)果。

K-means算法

隨機(jī)從樣本數(shù)據(jù)中輸入聚類個(gè)數(shù),還有數(shù)據(jù)庫(kù),此數(shù)據(jù)庫(kù)包含個(gè)數(shù)據(jù)對(duì)象,然后輸出滿足方差最小標(biāo)準(zhǔn)個(gè)聚類,就是K-means算法。K-means算法接受輸入量;為了滿足所獲得的聚類,將個(gè)數(shù)據(jù)對(duì)象劃分為個(gè)聚類:相似度較高的為同一聚類中的對(duì)象;而不同聚類中的對(duì)象相似度較小。

K-means聚類算法的具體流程:

(1)任意選取個(gè)對(duì)象作為初始聚類中心;

(2)計(jì)算各個(gè)對(duì)象與中心對(duì)象的距離;并根據(jù)最小距離對(duì)這些對(duì)象重新進(jìn)行劃分;

(3)計(jì)算那些重新劃分的對(duì)象;

(4)計(jì)算標(biāo)準(zhǔn)測(cè)度函數(shù),當(dāng)滿足一定條件時(shí)算法終止;否則返回到(2)。

K-means算法的研究現(xiàn)狀和發(fā)展動(dòng)態(tài)

傳統(tǒng)的K-means算法存在的缺點(diǎn)有:對(duì)網(wǎng)頁(yè)處理不足的;在文本聚類中有一定的局限性;中心值的個(gè)數(shù)難以確定、孤立點(diǎn)和噪聲也會(huì)有較大影響等。傳統(tǒng)K-means算法處理的數(shù)據(jù)僅限于數(shù)值型數(shù)據(jù),但在實(shí)際生活中,我們要處理并非只有數(shù)值型數(shù)據(jù),還有可能要處理類屬型的數(shù)據(jù),甚至是混合屬性特征的數(shù)據(jù)。這時(shí),傳統(tǒng)的K-means算法不能夠得到有效的結(jié)果,K-means算法可以對(duì)類屬性和混合型屬性的對(duì)象集進(jìn)行聚類。

基于初始聚類中心優(yōu)化的K-means算法,主要是通過計(jì)算對(duì)象相互之間的距離產(chǎn)生密度參數(shù),非常好地優(yōu)化了傳統(tǒng)K-means算法的缺點(diǎn)。K-means動(dòng)態(tài)聚類算法也考慮到聚類過程中的信息變化,在數(shù)據(jù)量龐大的情況下,通過假定終止條件來減少迭代次數(shù),降低時(shí)間復(fù)雜度,刪除冗余信息來減少聚類過程中的干擾等方法,K-means動(dòng)態(tài)聚類算法聚類效果得到一定的提高,這就是傳統(tǒng)K-means算法和K-means動(dòng)態(tài)聚類算法的區(qū)別。此外,為了可以獲得數(shù)據(jù)的基本情況,聚類分析被作為其他算法的預(yù)處理步驟,利用聚類對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,在此基礎(chǔ)上,要想獲得更深層次的、更有用的信息,還要進(jìn)行特征抽取或分類以提高精確度和挖掘效率,或者對(duì)聚類結(jié)果做進(jìn)一步分析,這也更加適應(yīng)現(xiàn)代社會(huì)的需要。

針對(duì)K-means算法存在受初始值影響大的缺點(diǎn),本文提出了一種新的K-means++算法。

K-means++算法的改進(jìn)在于初始聚類中心的選擇。K-means++算法選取初始聚類中心時(shí),按照聚類中心之間的距離盡可能遠(yuǎn)的原則,選擇個(gè)初始聚類中心。K-means++算法選擇初始聚類中心的主要思想是:假如已經(jīng)選擇了(0< <)個(gè)初始聚類中心;再選擇第+1個(gè)聚類中心時(shí),距離個(gè)聚類中心越遠(yuǎn)的對(duì)象,越有可能被選作第1個(gè)聚類中心。

經(jīng)過研究表明,雖然足夠多的實(shí)驗(yàn)次數(shù)和足夠大的迭代次數(shù),都能使K-means算法和K-means++算法收斂至全局最小值,但K-means++算法的收斂速度更快、效果更好。也證明改進(jìn)后的K-means++算法降低了初始聚類中心對(duì)K-means影響,提高了算法的效率和準(zhǔn)確性。

本文主要對(duì)K-means算法的研究現(xiàn)狀和發(fā)展?fàn)顟B(tài)進(jìn)行了闡述,并分析了聚類算法中比較有代表性的K-means算法;如何對(duì)K-means算法的缺點(diǎn)進(jìn)行改進(jìn);K-means算法的精簡(jiǎn)優(yōu)化;以及如何選擇合適的初始聚類中心,以減少初始值對(duì)K-means算法的影響,從而提高算法效率。

主站蜘蛛池模板: 丁香六月激情婷婷| 夜夜操国产| 亚洲全网成人资源在线观看| 网久久综合| 国产亚洲一区二区三区在线| 亚洲综合经典在线一区二区| 扒开粉嫩的小缝隙喷白浆视频| 四虎永久在线| 国产精品久久久久久影院| 真实国产乱子伦高清| 午夜福利无码一区二区| 欧美亚洲激情| 欧美在线一二区| 1024你懂的国产精品| 亚洲一区二区约美女探花| 亚洲视频欧美不卡| 久久国语对白| 国产精品页| 免费a在线观看播放| 国产精品网址你懂的| 国产久操视频| 日韩成人免费网站| 亚洲精品桃花岛av在线| 亚洲三级色| 久久永久精品免费视频| 日韩国产高清无码| 国产精品自在拍首页视频8| 色偷偷av男人的天堂不卡| 国产精品成| 欧美人与动牲交a欧美精品| 福利视频一区| 久久天天躁夜夜躁狠狠| 无码一区二区三区视频在线播放| 国产又黄又硬又粗| 亚洲综合天堂网| 久久一级电影| 亚洲天堂区| 免费无码AV片在线观看国产| 欧美色综合网站| 91亚洲精选| 亚洲精品制服丝袜二区| 国产一级毛片高清完整视频版| 色一情一乱一伦一区二区三区小说| 亚洲a级在线观看| 色爽网免费视频| 亚洲男人的天堂在线观看| 国产啪在线91| 91小视频在线| 91青草视频| 丰满的熟女一区二区三区l| 在线欧美国产| 国产精品精品视频| 免费国产黄线在线观看| 国产高清无码麻豆精品| 欧美亚洲综合免费精品高清在线观看| 亚洲一级毛片| 国产成人精品三级| 在线观看无码a∨| 91午夜福利在线观看精品| 青青草综合网| 欧美亚洲欧美区| 国产精品香蕉| 国产高清在线精品一区二区三区 | 亚洲国产综合精品一区| 久久五月视频| 99久久人妻精品免费二区| 欧美在线视频a| 免费一级全黄少妇性色生活片| 日韩在线2020专区| 日本三区视频| 欧美激情成人网| 老司国产精品视频| 国产十八禁在线观看免费| 免费在线成人网| 中美日韩在线网免费毛片视频| 久久中文无码精品| 久久久久中文字幕精品视频| 国产精品综合久久久| 69av免费视频| 国产丝袜丝视频在线观看| 午夜精品久久久久久久99热下载 | 毛片久久网站小视频|