999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聚類算法綜述

2015-03-23 21:04:41宋坤
河南科技 2015年22期
關鍵詞:數據挖掘分類方法

宋坤

(重慶交通大學 信息科學與工程學院,重慶 400074)

聚類算法綜述

宋坤

(重慶交通大學 信息科學與工程學院,重慶 400074)

聚類是將物理或抽象對象的集合組成為由類似的對象組成的多個類的過程,是研究數據間邏輯上或物理上的相互關系的技術,是數據挖掘技術中的重要組成部分。結合國內研究現狀,論文介紹各類主要的聚類算法及其應用領域。

數據挖掘;相互關系;聚類

1 背景及意義

數據挖掘中聚類算法的應用很廣泛。在商務上,聚類能幫助市場分析人員從客戶基本庫中發現不同的客戶群。 在生物學上,聚類能用于基因和蛋白質的分類,獲得對種群中固定結構的認識[1]。聚類在地球觀測數據中相似地區的確定發揮作用。聚類也能用來對web上的文檔進行分類,以發現有用的信息。聚類分析能作為一種獨立的工具來獲得數據分布的情況,觀察每個簇的特點,并對某些特定的節點進一步分析。此外,聚類還可以作為其他方法的預處理步驟。

作為統計學的一個分支,聚類分析已經被廣泛地研究若干年,主要集中在基于距離的聚類分析。

2 聚類算法簡介

聚類是一個將數據集劃分為若干組或簇的過程,使得同一類的數據對象之間的相似度較高,而不同類的數據對象之間的相似度較低。聚類問題的關鍵是把相似的事物聚集在一起。

2.1傳統聚類算法

2.1.1層次方法

層次法對給定的數據對象集合進行層次似的分解。按層次分解的形成方式,層次法可分為凝聚和分裂兩大類。凝聚的方法,也稱為自底向上的方法,一開始將每個對象作為單獨的一個類,然后相繼地合并相近的類,直到所有的類合并為一個(層次的最上層),或者達到一個終止條件為止。層次方法 (Hierarchical Method)中代表算法BIRCH、CURE、ROCK、CHAMELEON 算法等[2]。

2.1.2劃分方法

給定一個包含n個數據對象的數據集,劃分法構建數據的k個劃分,每個劃分表示一個類,并且k ≤ n。同時滿足如下的要求:①每個組至少包含一個對象;②每個對象屬于且僅屬于一個組。其代表算法有K-MEANS、K-MEDOIDS、大型數據庫劃分方法(CLARANS)等。

2.1.3密度方法

該方法主要思想是:只要鄰近區域的密度(對象或數據點的數目)超過某個閾值,就繼續聚類。也就是說,對給定類中的每個數據點,在一個給定范圍的區域內必須至少包含某個數目的點。其代表算法有DBSCAN、OPTICS和DE NCLUE等[3]。

2.2新發展的聚類算法

2.2.1基于模糊的聚類方法

基于目標函數的模糊聚類方法,該方法把聚類歸結成一個帶約束的非線性規劃問題,通過優化求解獲得數據集的模糊劃分和聚類。該方法設計簡單,解決問題的范圍廣,還可以轉化為優化問題而借助經典數學的非線性規劃理論求解,并易于在計算機上實現。因此,隨著計算機的應用和發展,基于目標函數的模糊聚類算法成為新的研究熱點。在基于目標函數的聚類算法中,FCM 類型算法的理論最為完善、應用最為廣泛。

2.2.2基于粒度的聚類方法

如果從信息粒度的角度來看,就會發現聚類和分類的相通之處:聚類操作實際上是在一個統一粒度下進行計算的;分類操作是在不同粒度下進行計算的。在粒度原理下,聚類和分類的相通使得很多分類的方法也可以用在聚類方法中。作為一個新的研究方向,雖然目前粒度計算還不成熟,尤其是對粒度計算語義的研究還相當少,但是相信隨著粒度計算理論本身的不斷完善和發展。

2.2.3量子聚類

該方法把聚類問題看作一個物理系統,其很好的例子就是基于相關點的 Pott 自旋和統計機理提出的量子聚類模型。并且許多算例表明,對于傳統聚類算法無能為力的幾種聚類問題,該算法都得到了比較滿意的結果[4]。

2.2.4譜聚類

為了能在任意形狀的樣本空間上聚類,且收斂于全局最優解,學者們開始研究一類新型的聚類算法,稱為譜聚類算法(Spectral Clustering Algorithm)。譜聚類算法最初用于計算機視覺、VLSI設計等領域,最近才開始用于機器學習中,并迅速成為國際上機器學習領域的研究熱點[5]。

3 結語

數據聚類正在蓬勃的發展,有貢獻的領域包括數據挖掘,統計學,機器學習,空間數據庫技術,生物學以及市場營銷。現在數據聚類分析已經成為一個非常活躍的研究課題。

[1]田野,劉大有,楊博. 復雜網絡聚類算法在生物網絡中的應用[J]. 計算機科學與探索,2010,04:330-337.

[2]Amineh Amini,Teh Ying Wah,Hadi Saboohi. On Density-Based Data Streams Clustering Algorithms: A Survey[J]. Journal of Computer Science & Technology,2014,01:116-141.

[3]Local and global approaches of affinity propagation clustering for large scale data[J]. Journal of Zhejiang University(Science A:An International Applied Physics & Engineering Journal),2008,10:1373-1381.

[4]王玉瑛. 量子聚類及其在社團檢測中的應用[D].西安電子科技大學,2014.

[5]蔡曉妍,戴冠中,楊黎斌. 譜聚類算法綜述[J]. 計算機科學,2008,07:14-18.

TP311.13

A

1003-5168(2015)11-254-01

宋坤(1989.07- ),男,河南新鄉人,重慶交通大學信息科學與工程學院2013級碩士研究生,軟件工程專業,研究方向:數據挖掘。

猜你喜歡
數據挖掘分類方法
分類算一算
探討人工智能與數據挖掘發展趨勢
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
一種基于Hadoop的大數據挖掘云服務及應用
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 精品成人一区二区| 99视频免费观看| 99尹人香蕉国产免费天天拍| 99激情网| 国产免费羞羞视频| 在线免费不卡视频| 亚洲第一区欧美国产综合| 多人乱p欧美在线观看| 女高中生自慰污污网站| 青草免费在线观看| 欧美一级在线看| 在线无码av一区二区三区| 国产成人免费观看在线视频| 丁香婷婷激情综合激情| 国产欧美视频综合二区| 国产毛片片精品天天看视频| 91在线国内在线播放老师| 国产va免费精品观看| 国产精品男人的天堂| 久久久亚洲色| 呦系列视频一区二区三区| 欧美色亚洲| 色婷婷在线影院| 香蕉色综合| 动漫精品啪啪一区二区三区| 国产视频 第一页| 国产精品13页| 日韩在线中文| 国产精品吹潮在线观看中文| 天堂成人av| 三级视频中文字幕| 亚洲无码高清免费视频亚洲| 91精品亚洲| 日本一区二区三区精品视频| 国产日韩欧美精品区性色| 精品黑人一区二区三区| 四虎永久免费地址在线网站| 国产偷倩视频| 亚洲欧美成aⅴ人在线观看| 免费jizz在线播放| 三上悠亚在线精品二区| 国产高清又黄又嫩的免费视频网站| 好久久免费视频高清| 午夜国产理论| 在线人成精品免费视频| 小13箩利洗澡无码视频免费网站| 精品国产www| 国产正在播放| 在线高清亚洲精品二区| 欧美亚洲欧美| 福利在线不卡一区| 国产亚洲精久久久久久无码AV| 亚洲中文字幕国产av| 国产导航在线| 国产高清在线精品一区二区三区| 国产爽妇精品| 成人午夜视频免费看欧美| 91在线中文| 九九线精品视频在线观看| 日本一本正道综合久久dvd| 久久免费观看视频| 色婷婷在线播放| 尤物成AV人片在线观看| 五月天福利视频| 一区二区三区成人| h网址在线观看| 国产新AV天堂| 国产美女自慰在线观看| 欧美国产综合色视频| 免费人成在线观看成人片| 在线a网站| 色老二精品视频在线观看| 国产成+人+综合+亚洲欧美| 国产精欧美一区二区三区| 国产网站在线看| 亚洲天堂网在线视频| 九色综合视频网| 激情视频综合网| 在线播放真实国产乱子伦| 奇米精品一区二区三区在线观看| 国产成人8x视频一区二区| 国产网站一区二区三区|