999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

譜聚類中基于熵排序的特征向量選擇方法

2016-05-14 21:38:50李志偉
數(shù)字技術(shù)與應用 2016年7期

李志偉

摘要:Ng-Jordan-Weiss(NJW)是使用最廣泛的譜聚類算法之一。對于一個K類問題,該算法使用數(shù)據(jù)集標準化的親合矩陣的最大的K個特征向量來劃分數(shù)據(jù)。已經(jīng)證明,K-way劃分的譜放松解決方法在于對這K個最大的特征向量子空間的劃分。然而,從大量實驗表明,前K個最大的特征向量并不總能檢測得出真實的模式識別問題的數(shù)據(jù)結(jié)構(gòu)。所以,譜聚類中特征向量的選取變得很有必要。

關(guān)鍵詞:譜聚類 特征向量選擇 熵排列

中圖分類號:TP301.6 文獻標識碼:A 文章編號:1007-9416(2016)07-0043-01

1 簡介

聚類方法一直是模式識別和人工智能研究的重要焦點之一。聚類的目的在于將數(shù)據(jù)劃分成預期的結(jié)果。比如,數(shù)據(jù)的聚類就是將相似的樣本劃分為一類,不相似的樣本歸到不同類中。在過去的幾十年里,許多聚類算法得到了快速發(fā)展,這主要包括基于層次的聚類(如單鏈接、多鏈接等)和基于劃分的聚類(如K-means、高斯融合模型、密度估計和模式選擇等)。當數(shù)據(jù)集變的十分龐大,很多維數(shù)對應的屬性對于聚類而言就經(jīng)常變得不相關(guān)。為了克服這一問題,子空間學習算法被提出,用于將原始高維空間中的樣本映射到低維空間中,得到一種更能夠很好反應出原始數(shù)據(jù)樣本的新屬性。子空間學習應用已經(jīng)應用到了很多研究領域,比如:費希爾線性降維分析擴展、流型學習、譜分析、核機器、張量機等領域。

譜分析方法已經(jīng)成功用于解決大數(shù)據(jù)聚類和圖像分割問題。近年來,由于譜聚類對于數(shù)據(jù)聚類具有高性能且具有使用簡單的優(yōu)點,吸引了越來越多的研究者的興趣。這種方法已經(jīng)成功應用于并行計算、VLSI設計、圖像分割、語音分離等方面。譜聚類方法使用數(shù)據(jù)標準化的親合矩陣的特征向量來劃分數(shù)據(jù)。而NJW方法是最廣泛使用的譜聚類算法之一。對于K個聚類問題,該方法使用數(shù)據(jù)集標準化的親合矩陣的K個最大的特征向量劃分數(shù)據(jù)。盡管標準割的譜放松解決方法在于對子空間中的特征向量的劃分。但不能保證這K個最大的特征向量總能檢測得出數(shù)據(jù)的結(jié)構(gòu)。

基于熵排列的特征向量選擇方法是根據(jù)特征向量對聚類的重要性對它們按序排列,然后從排列列表中得到合適的特征向量組合。在排列列表中選擇特征向量時,有兩種策略。其一,直接從排列列表中選擇前K個特征向量。盡管這種方法使用了K個最重要的特征向量,但仍不是總能很好地檢測出數(shù)據(jù)的結(jié)構(gòu)。所以,這種方法的性能比NJW方法優(yōu)越不多。由于譜聚類中選擇的特征向量應該是一個組合優(yōu)化問題,所以另外一種選擇策略,即在排列列表中選擇前Km(Km>K)特征向量的最優(yōu)特征向量組合?;谠谠S多情況下,對于一個數(shù)據(jù)樣本的抽樣能夠保留原始聚類的信息這種假設,這種策略先對原始數(shù)據(jù)集描繪出一種訓練數(shù)據(jù)集,在排列列表的前Km(KM>K)特征向量中提取對應的訓練數(shù)據(jù),并使用一種特征向量組合評價標準找出合適的特征向量組合,這種策略稱為間接特征向量選擇策略。

2 基于熵排序的特征向量選擇

假設K類數(shù)據(jù)集合,通過特征分解可以得到X的標準化的親合矩陣L的特征向量。那么,基于熵的特征向量排序方法如下:

根據(jù)信息熵理論,Dash等人提出一種使用熵排序來反應數(shù)據(jù)的特征。設表示X的標準化的親合矩陣L的所有的n個特征向量。將V視作包含具有n個特征的n個樣本的數(shù)據(jù)集,V的第i行表示第i個樣本數(shù)據(jù),表示數(shù)據(jù)點的第j個特征。從熵理論得知,V的熵被定義為:

(1)

其中,表示樣本的概率。實際應用中我們不可能獲得每個樣本的概率。此時,我們將通過相似度替代概率來計算熵。

(2)

其中,為樣本和樣本之間的相似性。,為樣本和樣本之間的距離,計算公式如下:

(3)

其中,和分別表示第k個特征向量的最大值和最小值,所以表示第k個特征向量的最大區(qū)間。

根據(jù)對的定義,若和相距越近,則它們之間的相似性就越高;反之,相似性就越低。但若較低或較高時,熵就越?。环粗瑒t大。因此,若除去特征向量要比除去更能導致樣本的無序,且熵滿足,則要比的對譜聚類更重要。為了得到特征向量的排序,每個特征向量都要被移除并計算對應的熵。用表示排序后(降序)的特征向量。并將樣本集合作為實例,若5個特征向量的熵滿足時,則熵的排列列表為。所以,在這5個特征向量中第4個特征向量是最重要的。

在得到特征向量排序列表后,其中一個簡單的特征向量選擇方法就是直接選擇列表中的前K個特征向量參與譜聚類。與NJW方法中的選取最大的K個特征向量有所不同,這K個特征向量而是通過熵排列得到的對聚類有重要作用的K個向量,稱這種特征向量選取為直接選擇策略。

另外一種選擇策略是根據(jù)特征向量排序列表尋找合適的向量組合。眾所周知,一個數(shù)據(jù)集的所有的數(shù)據(jù)點可看作是隨即抽取的。所以,隨即抽樣的數(shù)據(jù)多數(shù)情況下都保留著原始聚類的信息。而實際應用中,獲取某個數(shù)據(jù)的真實標記信息是可能的。因此,本文首先描述原始數(shù)據(jù)集的帶有真實標記信息的訓練數(shù)據(jù),然后在排序列表中抽取對應訓練數(shù)據(jù)集的前Km(Km>K)個特征向量,并借助特征向量組合評價指標在所有可能的向量組合中找出最佳的向量組合。我們認為這個最佳的特征向量在子空間中映射到的訓練集合中的數(shù)據(jù)點能夠反應得出原始數(shù)據(jù)的潛在數(shù)據(jù)結(jié)構(gòu)。

排列列表中的前Km()個特征向量被認為是對聚類最重要的特征向量。所以,我們的目的就在于在這Km個特征向量中獲取K個最佳的特征向量組合。當K不大時(如),對數(shù)據(jù)聚類至關(guān)重要的這Km個特征向量就會更少,所以,在Km=10個特征向量中能夠足夠找出一個較好的特征向量組合。

3 結(jié)語

本文介紹的熵排列的特征向量選取方法是一種簡單的特征排列方法,也可以選擇一種多套特征向量排列方法用于特征向量的排序。本文旨在通過熵排序的特征向量選取方法,獲取能夠表征信息的最優(yōu)特征。在將來的工作中將進一步在這個方向上研究。

參考文獻

[1]Zhao F,Jiao L C,Liu H Q,et al. Spectral clustering with eigenvector selection based on entropy ranking[J]. Neurocomputing,2010,73(10):1704-1717.

主站蜘蛛池模板: 在线观看国产黄色| 成人国内精品久久久久影院| 国产精品成| 国产日产欧美精品| 狠狠色香婷婷久久亚洲精品| 国产乱人伦精品一区二区| 日韩资源站| 天天做天天爱天天爽综合区| 日韩高清中文字幕| 伊人久久大线影院首页| 日韩美一区二区| 999在线免费视频| 性欧美久久| 99久久精品免费看国产免费软件| 97久久精品人人| 手机精品视频在线观看免费| 大香网伊人久久综合网2020| 久草中文网| 美女啪啪无遮挡| 色婷婷在线影院| 精品午夜国产福利观看| 永久免费无码日韩视频| 欧美日本在线观看| 人妻中文久热无码丝袜| 亚洲IV视频免费在线光看| 国产超碰一区二区三区| 国产99欧美精品久久精品久久| 亚洲日韩国产精品无码专区| 国产成人在线无码免费视频| 91在线一9|永久视频在线| 成人字幕网视频在线观看| 精品福利视频导航| 亚洲美女视频一区| 久久久久久国产精品mv| 激情午夜婷婷| 久久这里只有精品国产99| 在线免费a视频| 不卡无码h在线观看| 91丝袜美腿高跟国产极品老师| 免费看美女毛片| 欧美在线综合视频| 91亚瑟视频| 高清国产在线| 婷婷五月在线| 亚洲欧洲自拍拍偷午夜色| 91探花在线观看国产最新| 午夜福利免费视频| 国产成人免费手机在线观看视频| 人人看人人鲁狠狠高清| 青草91视频免费观看| 亚洲第一黄片大全| 男女男精品视频| 国产午夜人做人免费视频| 国产免费久久精品99re丫丫一| av无码一区二区三区在线| 日本高清免费不卡视频| 日韩色图区| 亚洲精品麻豆| 亚洲av无码成人专区| 国产欧美亚洲精品第3页在线| 91精品人妻一区二区| 久久九九热视频| 天天摸夜夜操| 久久黄色影院| 无码福利日韩神码福利片| 国产成人亚洲无吗淙合青草| 免费在线a视频| 久久网欧美| 91亚洲精品国产自在现线| 丝袜美女被出水视频一区| 亚洲国产欧美目韩成人综合| 亚洲大学生视频在线播放| 浮力影院国产第一页| 国内精品久久久久鸭| WWW丫丫国产成人精品| 制服丝袜国产精品| 亚卅精品无码久久毛片乌克兰| 高清国产在线| 蜜桃视频一区| 香蕉久久国产超碰青草| 欧美怡红院视频一区二区三区| 欧美国产日本高清不卡|