999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聚類算法綜述

2015-03-23 21:04:41宋坤
河南科技 2015年22期
關鍵詞:數據挖掘分類方法

宋坤

(重慶交通大學 信息科學與工程學院,重慶 400074)

聚類算法綜述

宋坤

(重慶交通大學 信息科學與工程學院,重慶 400074)

聚類是將物理或抽象對象的集合組成為由類似的對象組成的多個類的過程,是研究數據間邏輯上或物理上的相互關系的技術,是數據挖掘技術中的重要組成部分。結合國內研究現狀,論文介紹各類主要的聚類算法及其應用領域。

數據挖掘;相互關系;聚類

1 背景及意義

數據挖掘中聚類算法的應用很廣泛。在商務上,聚類能幫助市場分析人員從客戶基本庫中發現不同的客戶群。 在生物學上,聚類能用于基因和蛋白質的分類,獲得對種群中固定結構的認識[1]。聚類在地球觀測數據中相似地區的確定發揮作用。聚類也能用來對web上的文檔進行分類,以發現有用的信息。聚類分析能作為一種獨立的工具來獲得數據分布的情況,觀察每個簇的特點,并對某些特定的節點進一步分析。此外,聚類還可以作為其他方法的預處理步驟。

作為統計學的一個分支,聚類分析已經被廣泛地研究若干年,主要集中在基于距離的聚類分析。

2 聚類算法簡介

聚類是一個將數據集劃分為若干組或簇的過程,使得同一類的數據對象之間的相似度較高,而不同類的數據對象之間的相似度較低。聚類問題的關鍵是把相似的事物聚集在一起。

2.1傳統聚類算法

2.1.1層次方法

層次法對給定的數據對象集合進行層次似的分解。按層次分解的形成方式,層次法可分為凝聚和分裂兩大類。凝聚的方法,也稱為自底向上的方法,一開始將每個對象作為單獨的一個類,然后相繼地合并相近的類,直到所有的類合并為一個(層次的最上層),或者達到一個終止條件為止。層次方法 (Hierarchical Method)中代表算法BIRCH、CURE、ROCK、CHAMELEON 算法等[2]。

2.1.2劃分方法

給定一個包含n個數據對象的數據集,劃分法構建數據的k個劃分,每個劃分表示一個類,并且k ≤ n。同時滿足如下的要求:①每個組至少包含一個對象;②每個對象屬于且僅屬于一個組。其代表算法有K-MEANS、K-MEDOIDS、大型數據庫劃分方法(CLARANS)等。

2.1.3密度方法

該方法主要思想是:只要鄰近區域的密度(對象或數據點的數目)超過某個閾值,就繼續聚類。也就是說,對給定類中的每個數據點,在一個給定范圍的區域內必須至少包含某個數目的點。其代表算法有DBSCAN、OPTICS和DE NCLUE等[3]。

2.2新發展的聚類算法

2.2.1基于模糊的聚類方法

基于目標函數的模糊聚類方法,該方法把聚類歸結成一個帶約束的非線性規劃問題,通過優化求解獲得數據集的模糊劃分和聚類。該方法設計簡單,解決問題的范圍廣,還可以轉化為優化問題而借助經典數學的非線性規劃理論求解,并易于在計算機上實現。因此,隨著計算機的應用和發展,基于目標函數的模糊聚類算法成為新的研究熱點。在基于目標函數的聚類算法中,FCM 類型算法的理論最為完善、應用最為廣泛。

2.2.2基于粒度的聚類方法

如果從信息粒度的角度來看,就會發現聚類和分類的相通之處:聚類操作實際上是在一個統一粒度下進行計算的;分類操作是在不同粒度下進行計算的。在粒度原理下,聚類和分類的相通使得很多分類的方法也可以用在聚類方法中。作為一個新的研究方向,雖然目前粒度計算還不成熟,尤其是對粒度計算語義的研究還相當少,但是相信隨著粒度計算理論本身的不斷完善和發展。

2.2.3量子聚類

該方法把聚類問題看作一個物理系統,其很好的例子就是基于相關點的 Pott 自旋和統計機理提出的量子聚類模型。并且許多算例表明,對于傳統聚類算法無能為力的幾種聚類問題,該算法都得到了比較滿意的結果[4]。

2.2.4譜聚類

為了能在任意形狀的樣本空間上聚類,且收斂于全局最優解,學者們開始研究一類新型的聚類算法,稱為譜聚類算法(Spectral Clustering Algorithm)。譜聚類算法最初用于計算機視覺、VLSI設計等領域,最近才開始用于機器學習中,并迅速成為國際上機器學習領域的研究熱點[5]。

3 結語

數據聚類正在蓬勃的發展,有貢獻的領域包括數據挖掘,統計學,機器學習,空間數據庫技術,生物學以及市場營銷。現在數據聚類分析已經成為一個非常活躍的研究課題。

[1]田野,劉大有,楊博. 復雜網絡聚類算法在生物網絡中的應用[J]. 計算機科學與探索,2010,04:330-337.

[2]Amineh Amini,Teh Ying Wah,Hadi Saboohi. On Density-Based Data Streams Clustering Algorithms: A Survey[J]. Journal of Computer Science & Technology,2014,01:116-141.

[3]Local and global approaches of affinity propagation clustering for large scale data[J]. Journal of Zhejiang University(Science A:An International Applied Physics & Engineering Journal),2008,10:1373-1381.

[4]王玉瑛. 量子聚類及其在社團檢測中的應用[D].西安電子科技大學,2014.

[5]蔡曉妍,戴冠中,楊黎斌. 譜聚類算法綜述[J]. 計算機科學,2008,07:14-18.

TP311.13

A

1003-5168(2015)11-254-01

宋坤(1989.07- ),男,河南新鄉人,重慶交通大學信息科學與工程學院2013級碩士研究生,軟件工程專業,研究方向:數據挖掘。

猜你喜歡
數據挖掘分類方法
分類算一算
探討人工智能與數據挖掘發展趨勢
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
一種基于Hadoop的大數據挖掘云服務及應用
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 国产成人精品一区二区| 欧美日本激情| 波多野结衣一区二区三区四区视频| 欧美在线一二区| 国产精品男人的天堂| 午夜免费视频网站| 又黄又湿又爽的视频| 91系列在线观看| 一级做a爰片久久免费| 999国产精品永久免费视频精品久久| 国内精品久久久久久久久久影视| 欧美69视频在线| 日韩一级二级三级| 亚洲首页在线观看| 丝袜美女被出水视频一区| 99视频有精品视频免费观看| 性视频久久| 婷婷激情亚洲| 久久国产精品嫖妓| 国产成人91精品免费网址在线| а∨天堂一区中文字幕| 亚洲一区二区无码视频| 国产高清又黄又嫩的免费视频网站| 婷婷成人综合| 亚洲一区精品视频在线| 国产资源免费观看| 国产sm重味一区二区三区| 在线国产欧美| 人人爽人人爽人人片| 亚洲精品久综合蜜| 国产福利观看| 久久中文字幕2021精品| 久久久久无码国产精品不卡| 亚洲码一区二区三区| 人妻一本久道久久综合久久鬼色| 本亚洲精品网站| 免费人成黄页在线观看国产| 免费无码AV片在线观看中文| 日韩精品无码免费一区二区三区| 国产成人精品视频一区二区电影 | 国产真实二区一区在线亚洲| 国产精品无码影视久久久久久久| 又污又黄又无遮挡网站| 免费黄色国产视频| 波多野结衣一区二区三视频| 亚洲中文字幕av无码区| 久操中文在线| 特级aaaaaaaaa毛片免费视频| 少妇精品久久久一区二区三区| 狠狠综合久久久久综| 69av免费视频| 欧美一级高清免费a| 精品成人一区二区三区电影| 午夜视频免费试看| 免费在线看黄网址| 韩国v欧美v亚洲v日本v| 三级毛片在线播放| 在线观看国产小视频| 一级片免费网站| 538国产在线| 一级毛片在线播放| 亚洲综合天堂网| 亚洲人精品亚洲人成在线| 欧美日韩精品综合在线一区| 亚洲第一视频区| 亚洲精品爱草草视频在线| 亚洲国产精品成人久久综合影院| 欧美黄色a| 亚洲精品欧美日本中文字幕| 国产高潮流白浆视频| 大香伊人久久| 亚洲第一香蕉视频| 国产成人精品高清在线| 波多野结衣的av一区二区三区| 国产在线观看第二页| 成人综合在线观看| 四虎成人精品| 欧美精品亚洲精品日韩专区va| 国产成人乱无码视频| 亚洲精品国产成人7777| 国外欧美一区另类中文字幕| 精品色综合|