999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聚類分析算法的分析與評價

2019-11-30 02:24:03李芝峰張妍
電子技術(shù)與軟件工程 2019年7期
關(guān)鍵詞:方法模型

文/李芝峰 張妍

1 引言

在信息時代存儲人類活動的文本、視頻、圖像和音頻數(shù)據(jù)龐大,把數(shù)據(jù)對象有效的區(qū)分開是一個熱門的研究課題。

聚類分析算法是深度學(xué)習(xí)中的一個常用的算法,它根據(jù)對象差異,把不同類的對象區(qū)分開。聚類分析算法的目標是把混雜在一起的數(shù)據(jù)盡可能的分隔開,使同一類對象的相似程度盡可能大,使不同對象的相似程度盡可能的小。聚類分析算法是一種無監(jiān)督學(xué)習(xí)的模式。目前聚類方法大體有以下類別:基于層次聚類算法、基于劃分聚類算法、基于密度聚類算法、基于網(wǎng)格聚類算法、基于模型聚類算法、基于模糊聚類算法。隨著理論研究的不斷深入,聚類分析算法已經(jīng)在語音分離、視頻人臉檢測、圖像皮膚檢測以及其他領(lǐng)域取得了不錯的研究結(jié)果。

2 聚類分析算法

聚類方法分類不是很明確,聚類方法大體可以分為:基于層次聚類算法、基于劃分聚類算法、基于密度聚類算法、基于網(wǎng)格聚類算法、基于模型聚類算法、基于模糊聚類算法。聚類方法包含著其他幾種聚類分析算法,存在的每一種聚類分析算法都有這自己長處和短處。

2.1 劃分法

劃分法保持簇內(nèi)對象相似性高,簇外對象差異高。該方法的劃分大多是基于距離的,其原理是:首先選擇K個初始聚類中心點;然后數(shù)據(jù)加入到距離中心點最近中;其次重新計算新類中心點,并作為新的中心點。

基于劃分聚類算法有K-means算法、k-modes算 法、k-prototypes算 法、k-medoids算 法、CLARA算 法、CLARANS算 法、Focused CLARAN算法、PCM算法等其他算法。這類算法的優(yōu)點是實現(xiàn)簡單、時間復(fù)雜度和空間復(fù)雜度低,缺點是容易出現(xiàn)局部最優(yōu)、對噪聲很敏感、對初始中心點選取敏感、不能解決非凸數(shù)據(jù)。

2.2 層次法

層次法是對數(shù)據(jù)對象進行分解,可以是自上而下的策略,也可以是自下而上的策略,目前自下而上的聚合策略使用較多。該方法可以是基于距離或者密度或者連通性,自下而上的原理是:首先將給定的N個對象分為N類;然后計算兩個類距離最小并進行合并;其次重新計算類之間的距離。

基于層次聚類算法有CURE算法、ROCK算法、變色龍算法CHEMALOEN算法、SBAC算法、BIRCH算法、BUBBLE算法、BUBBLE-FM算法等其他算法。這類算法的優(yōu)點時是可解釋性好、可以解決非球形簇,缺點是時間復(fù)雜度高、并且不能更正以前計算錯誤。

2.3 密度法

密度法是為了解決不規(guī)則形狀的聚類方法。該方法是將密集的滿足條件的點歸類起來,并使合并起來的高密度區(qū)域劃分為密度相連點最大集合的簇。該方法是基于密度的,其原理是:首先找到一個數(shù)據(jù)核心點;然后找到以該數(shù)據(jù)核心點為中心的密度相連的其他數(shù)據(jù)點,進行下一步的區(qū)域擴充。

基于密度聚類算法有基于密度的噪聲應(yīng)用空間聚類DBSCAN、DBLASD算法等其他算法。這類算法的優(yōu)點是對噪聲點出現(xiàn)不敏感、可以識別多種規(guī)則形狀的聚類,缺點是輸入?yún)?shù)會很大程度上影響聚類結(jié)果、對較稀的聚類和密度較大且離得較近的類區(qū)分不是很有效。

2.4 網(wǎng)格法

網(wǎng)格法是將數(shù)據(jù)對象轉(zhuǎn)化成一定數(shù)目的單元格并會形成網(wǎng)狀結(jié)構(gòu)。該方法是基于密度的,其原理是:首先采用降維措施,將N維空間降維成單維空間并分割成等長的段;然后根據(jù)網(wǎng)格單元中含有數(shù)據(jù)量的閾值,將大于閾值的視為高密度單元,否則視為低密度單元;其次將相連的高密度單元識別為同一個簇。

基于網(wǎng)格聚類算法有小波聚類算法WaveCluster、基于密度和網(wǎng)格聚類算法CLIQUE等其他算法。這類算法的優(yōu)點是時間復(fù)雜度低,缺點是算法對輸入的參數(shù)很敏感、區(qū)分不規(guī)則分布的數(shù)據(jù)很困難、維度災(zāi)難。

2.5 模型法

模型法是一個模型一個類,然后使用合適的數(shù)據(jù)集去不斷的訓(xùn)練這個認為合適的模型,這樣訓(xùn)練出來的模型可能很符合數(shù)據(jù)的密度分布函數(shù)。在使用到的數(shù)據(jù)集是由概率分布所組成的前提下,該方法才能有效進行下去。

現(xiàn)在基于模型聚類算法有統(tǒng)計方案和神經(jīng)網(wǎng)絡(luò)方案兩種方案,其中統(tǒng)計學(xué)方案算法有COBWEB算 法、CLASSIT算 法、AutoClass算法等其他算法;神經(jīng)網(wǎng)絡(luò)方案算法有SOMs算法等其他算法。這類算法的優(yōu)點是劃分類以概率形式展現(xiàn)出來,缺點是執(zhí)行效率不高。

2.6 模糊法

模糊法是采用了模糊集合的理論,是為了克服非此即彼的分類缺點,該算法假設(shè)了數(shù)據(jù)是以概率的形式屬于其中一個聚類。

基于模糊聚類算法有FCM算法。這類算法優(yōu)點是能夠得到一個參考樣本分類結(jié)果可能性的計算方法,缺點是算法性能過渡依賴初始聚類中心的選擇。

3 結(jié)束語

本文中的聚類算法能夠較好的實現(xiàn)數(shù)據(jù)的分類。存在的每一種聚類算法都是為了更好的解決現(xiàn)實中的分類問題而存在。每一種聚類算法都是有自己的適應(yīng)場景,也都有自己的優(yōu)缺點。聚類算法雖然能夠?qū)?shù)據(jù)進行分類,但是還是存在聚類數(shù)目是否自動問題,聚類算法優(yōu)點不能夠充分利用的問題,以及大規(guī)模數(shù)據(jù)和高維度數(shù)據(jù)處理能力的問題等其他問題。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
學(xué)習(xí)方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲第一在线播放| 国产aⅴ无码专区亚洲av综合网 | 国产网站一区二区三区| 99精品在线看| 四虎精品国产AV二区| 婷婷丁香在线观看| 日韩欧美在线观看| 久久久亚洲色| www亚洲天堂| 伊人久久久久久久| 亚洲精品视频免费看| 婷婷亚洲最大| 精品人妻无码中字系列| 特黄日韩免费一区二区三区| 久久综合丝袜长腿丝袜| 日本一区二区不卡视频| 久久精品中文字幕免费| 99久久无色码中文字幕| 色综合激情网| 国产凹凸视频在线观看| 一本大道视频精品人妻 | 亚洲国产在一区二区三区| 青青青国产视频手机| 国产高清国内精品福利| 国产福利一区二区在线观看| 国产黄色免费看| 国产成人亚洲无码淙合青草| h视频在线播放| 熟妇无码人妻| 久久久久亚洲av成人网人人软件 | 亚洲天堂精品在线| 热re99久久精品国99热| 在线色国产| 中文字幕在线视频免费| 日韩精品一区二区三区免费在线观看| 亚洲Aⅴ无码专区在线观看q| 黑人巨大精品欧美一区二区区| 亚洲91在线精品| 国产青青操| 久热这里只有精品6| 亚洲αv毛片| 亚洲国产中文在线二区三区免| 人妻一区二区三区无码精品一区| 久久这里只有精品66| 国产男人天堂| 亚洲天堂2014| 久久精品无码中文字幕| 狠狠躁天天躁夜夜躁婷婷| 任我操在线视频| 一区二区三区高清视频国产女人| 成人一级免费视频| 91午夜福利在线观看| 毛片久久网站小视频| 欧美三级自拍| 欧洲成人免费视频| 在线观看视频一区二区| 国产激情无码一区二区APP| 中文字幕欧美日韩高清| 欧美成人h精品网站| 亚洲午夜福利精品无码不卡 | 欧美成人综合视频| 日本高清免费不卡视频| 欧美a在线看| 国产精品视频免费网站| 国产亚洲精品97AA片在线播放| 国产精品成人观看视频国产 | 国模粉嫩小泬视频在线观看| 欧美激情视频一区| 91在线无码精品秘九色APP| 91麻豆精品国产91久久久久| 亚洲自偷自拍另类小说| 亚洲日韩国产精品无码专区| 亚洲精品手机在线| 91免费精品国偷自产在线在线| 嫩草影院在线观看精品视频| 色吊丝av中文字幕| 最新国语自产精品视频在| 亚洲欧美色中文字幕| 国产一区二区福利| 国产在线一区视频| 不卡午夜视频| 亚洲黄色网站视频|