面向多視圖聚類(lèi)的低秩張量表示學(xué)習(xí)

2022-07-13 01:56:50杜世強(qiáng)宋金梅

計(jì)算機(jī)工程與應(yīng)用 2022年13期

關(guān)鍵詞：方法

余瑤，杜世強(qiáng)，宋金梅

1.西北民族大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院，蘭州 730030

2.西北民族大學(xué) 中國(guó)民族信息技術(shù)研究院，蘭州 730030

聚類(lèi)是計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域中最基本的任務(wù)之一，旨在沒(méi)有先驗(yàn)信息，不需要訓(xùn)練的情況下，將無(wú)標(biāo)簽數(shù)據(jù)根據(jù)樣本相似性合理的劃分為不同的子集，每個(gè)子集可稱(chēng)為一個(gè)簇。由于大數(shù)據(jù)背景下，獲取有標(biāo)簽數(shù)據(jù)是一個(gè)耗時(shí)耗力成本高昂的工作，所以聚類(lèi)作為一種重要的無(wú)監(jiān)督學(xué)習(xí)方法變得非常重要。在過(guò)去的幾十年里，各種各樣的聚類(lèi)方法相繼被提出，K-means[1]是最常用的聚類(lèi)方法，目的是學(xué)到一個(gè)聚類(lèi)中心，使得簇內(nèi)的數(shù)據(jù)距中心較近；標(biāo)準(zhǔn)譜聚類(lèi)（SPC）[2]首先根據(jù)樣本之間的相似度構(gòu)造一個(gè)相似矩陣，然后建立一個(gè)無(wú)向加權(quán)圖，最后利用圖拉普拉斯算子的性質(zhì)學(xué)習(xí)相似矩陣。現(xiàn)有的大多數(shù)聚類(lèi)算法來(lái)源于SPC，其中最重要的一步是構(gòu)造數(shù)據(jù)點(diǎn)間的相似度矩陣，根據(jù)構(gòu)造方式的不同，基于SPC 的聚類(lèi)方法主要分為兩類(lèi)，包括基于自表示的子空間聚類(lèi)方法[3-4]和基于圖的聚類(lèi)方法。

基于自表示的方法是將樣本點(diǎn)表示為同一子空間內(nèi)其他點(diǎn)的線(xiàn)性組合，然后通過(guò)系數(shù)矩陣構(gòu)造相似度矩陣。文獻(xiàn)[5]提出低秩子空間聚類(lèi)（LRR），在自表示矩陣上施加低秩約束來(lái)捕獲全局結(jié)構(gòu)，但聚類(lèi)的精度需要在子空間獨(dú)立并且數(shù)據(jù)充足的情況下才能保證，這種假設(shè)條件對(duì)于現(xiàn)實(shí)數(shù)據(jù)集來(lái)說(shuō)過(guò)于嚴(yán)苛。文獻(xiàn)[6]等放寬約束條件，引入稀疏性準(zhǔn)則提出了稀疏子空間聚類(lèi)（SSC）算法，將每個(gè)數(shù)據(jù)點(diǎn)表示為其他數(shù)據(jù)點(diǎn)的稀疏線(xiàn)性組合來(lái)捕獲數(shù)據(jù)的局部結(jié)構(gòu)。文獻(xiàn)[7]利用低秩和稀疏約束的互補(bǔ)度量子空間聚類(lèi)里的自表示系數(shù)，用得到的系數(shù)矩陣來(lái)計(jì)算相似度矩陣進(jìn)而執(zhí)行譜聚類(lèi)得到最終結(jié)果。基于圖的聚類(lèi)方法重點(diǎn)是如何學(xué)習(xí)到一個(gè)高質(zhì)量的圖，然后在該圖上使用譜聚類(lèi)算法來(lái)獲得最終結(jié)果。文獻(xiàn)[8]提出一種魯棒圖學(xué)習(xí)（RGC）算法，自適應(yīng)的去除原始數(shù)據(jù)中的噪聲，從真實(shí)數(shù)據(jù)中學(xué)習(xí)精確的圖。

另外，現(xiàn)實(shí)世界中充滿(mǎn)著各種復(fù)雜多樣的數(shù)據(jù)，獲取數(shù)據(jù)的來(lái)源也各不相同。例如，一個(gè)客觀對(duì)象可以由文字、圖像、音頻或視頻來(lái)描述。多視圖信息的充分利用更能夠提升聚類(lèi)性能，因此許多多視圖聚類(lèi)方法從這些流行的單視圖方法中衍生出來(lái)。多視圖子空間學(xué)習(xí)方法主要基于自表示來(lái)探索樣本之間的關(guān)系，文獻(xiàn)[9]提出了多視圖子空間聚類(lèi)（MVSC）方法，對(duì)每個(gè)視圖的系數(shù)矩陣進(jìn)行譜聚類(lèi)以獲得不同視圖間共同的聚類(lèi)結(jié)構(gòu)。文獻(xiàn)[10]利用系數(shù)矩陣的稀疏性和不同視圖間的互補(bǔ)信息提出了排他性一致性多視圖子空間聚類(lèi)。文獻(xiàn)[11]將低秩稀疏子空間聚類(lèi)（LRSSC）[4]算法拓展到多視圖領(lǐng)域提出了多視圖低秩稀疏子空間聚類(lèi)算法（MLRSSC），不僅能從多個(gè)視圖中學(xué)習(xí)到更精確的圖，還能捕獲數(shù)據(jù)的全局和局部結(jié)構(gòu)。但有些多視圖聚類(lèi)方法僅探索視圖間的一致性而忽視了每個(gè)視圖的局部結(jié)構(gòu)，文獻(xiàn)[12]提出為不同的特征分配權(quán)重并在各個(gè)視圖特定的自表示空間中獲取局部信息進(jìn)而提高聚類(lèi)性能。基于圖學(xué)習(xí)的多視圖聚類(lèi)方法中，文獻(xiàn)[13]提出以歐式距離為度量標(biāo)準(zhǔn)，自適應(yīng)的構(gòu)造一個(gè)關(guān)系矩陣，稱(chēng)為自適應(yīng)近鄰學(xué)習(xí)（ANGL）。通過(guò)ANGL 融合多個(gè)視圖的原始矩陣，得到一個(gè)共識(shí)關(guān)系圖，從而提出自適應(yīng)近鄰多視圖學(xué)習(xí)（MLAN）[14]算法。由于大多算法假設(shè)不同特征重要性相同，而在現(xiàn)實(shí)中這一假設(shè)并不完全適用，文獻(xiàn)[15]提出了自適應(yīng)近鄰加權(quán)聚類(lèi)算法（SWCAN），為不同特征分配權(quán)重，在學(xué)習(xí)相似圖的同時(shí)將樣本劃分為多個(gè)簇。現(xiàn)實(shí)數(shù)據(jù)中，有些圖摻雜了較大的噪聲，這會(huì)降低聚類(lèi)性能，所以文獻(xiàn)[16]提出一種基于低秩和稀疏分解的馬爾可夫鏈方法用于魯棒多視圖譜聚類(lèi)（RMSC）來(lái)克服這一缺陷。RMSC 先在每個(gè)單視圖上構(gòu)造轉(zhuǎn)移概率矩陣，然后用從這些矩陣中恢復(fù)出的低秩轉(zhuǎn)移概率矩陣作為標(biāo)準(zhǔn)馬爾可夫鏈聚類(lèi)方法的輸入。

上述多視圖聚類(lèi)方法已經(jīng)取得了良好的效果，但還是沒(méi)有有效地利用多視圖數(shù)據(jù)間的互補(bǔ)信息，忽視了多視圖數(shù)據(jù)的高階相關(guān)性。針對(duì)這一問(wèn)題，文獻(xiàn)[17]提出了基于Tucker 分解的低秩張量約束多視圖子空間聚類(lèi)（LTMSC），但Tucker分解并不是秩函數(shù)的凸松弛，所以文獻(xiàn)[18]進(jìn)一步提出了基于張量奇異值分解的多視圖子空間聚類(lèi)，通過(guò)基于t-SVD的核范數(shù)對(duì)張量施加一種新型的低秩約束，確保了多個(gè)視圖之間的一致性。但大多基于張量核范數(shù)最小化的聚類(lèi)方法同等的對(duì)待每一個(gè)奇異值，限制了處理問(wèn)題的靈活性，所以文獻(xiàn)[19]充分利用奇異值的先驗(yàn)信息，提出了基于張量加權(quán)核范數(shù)的多視圖聚類(lèi)方法。文獻(xiàn)[20]提出了本質(zhì)張量學(xué)習(xí)的多視圖譜聚類(lèi)（ETLMSC），主要學(xué)習(xí)一個(gè)具有低秩約束的本質(zhì)張量，然后將其作為基于馬爾科夫鏈的譜聚類(lèi)的輸入。文獻(xiàn)[21]進(jìn)一步提出了基于截?cái)嗪朔稊?shù)的低秩張量分解的多視圖譜聚類(lèi)算法。

基于上述研究發(fā)現(xiàn)多視圖聚類(lèi)算法中相似矩陣和圖的質(zhì)量至關(guān)重要，但部分算法構(gòu)造的圖由于受噪聲和異常值的影響而不具有魯棒性且無(wú)法充分利用多視圖的互補(bǔ)信息，而基于張量的算法又通常使用原始數(shù)據(jù)構(gòu)造張量且計(jì)算復(fù)雜度高。針對(duì)以上問(wèn)題，本文提出一種面向多視圖聚類(lèi)的低秩張量表示學(xué)習(xí)（LRTRL-MVC）算法，主要貢獻(xiàn)為：

（1）將魯棒圖學(xué)習(xí)擴(kuò)展到多視圖數(shù)據(jù)，在去除噪聲和異常值影響的同時(shí)進(jìn)一步利用多視圖的互補(bǔ)信息，獲得更加精確揭示樣本之間關(guān)系的親和圖，提升聚類(lèi)性能。

（2）利用各視圖數(shù)據(jù)獲得的魯棒圖構(gòu)造3 階張量，挖掘多視圖數(shù)據(jù)間的高階相關(guān)性。

（3）選用基于張量奇異值分解（t-SVD）的核范數(shù)來(lái)保持本質(zhì)張量的低秩性質(zhì)，以便更好地捕獲多視圖共用的類(lèi)別信息。

（4）提出了一種基于交替方向乘子法（ADMM）的優(yōu)化算法來(lái)求解目標(biāo)函數(shù)。與其他相關(guān)的最好多視圖聚類(lèi)算法相比，提出的方法在4個(gè)不同的數(shù)據(jù)集上取得了最好的聚類(lèi)效果。

1 相關(guān)符號(hào)和定義

表1 相關(guān)符號(hào)Table 1 Summary of notations

定義1（f-對(duì)角張量[21]）對(duì)于一個(gè)3 階張量，若其所有正面切片都是對(duì)角矩陣，則稱(chēng)為f-對(duì)角張量。

定義2（單位張量[21]）對(duì)于張量I∈?n×n×n3，第一個(gè)正面切片是大小為n×n的單位矩陣，其他所有正面切片均為0矩陣。

定義3（張量積t-product[22]）假設(shè)張量A∈?n1×m×n3，B∈?m×n2×n3，則張量積A?B 是一個(gè)大小為n1×n2×n3的張量，且：

2 面向多視圖聚類(lèi)的低秩張量表示學(xué)習(xí)

本文提出的算法由兩部分組成，第一部分將魯棒圖學(xué)習(xí)擴(kuò)展到多視圖中，利用魯棒主成分分析[23]（RPCA）的思想，將多視圖數(shù)據(jù)的每個(gè)視圖矩陣分解成低秩矩陣和稀疏矩陣，并在干凈的低秩矩陣上利用自適應(yīng)近鄰法構(gòu)造魯棒圖。第二部分用第一部分得到的圖作為輸入，計(jì)算出相應(yīng)的轉(zhuǎn)移概率矩陣，再堆疊構(gòu)建一個(gè)3階張量并將張量沿第三維旋轉(zhuǎn)，然后對(duì)張量進(jìn)行t-SVD 分解，得到一個(gè)低秩張量和一個(gè)噪聲張量，最后在低秩張量上執(zhí)行馬爾可夫譜聚類(lèi)得到最終的聚類(lèi)結(jié)果，本文算法框架如圖1所示。

圖1 LRTRL-MVC算法框架Fig.1 Framewok of LRTRL-MVC algorithm

2.1 多視圖魯棒圖學(xué)習(xí)

2.1.1 目標(biāo)函數(shù)

2.1.2 目標(biāo)函數(shù)求解

2.2 基于馬爾可夫鏈的譜聚類(lèi)

2.3 低秩張量學(xué)習(xí)

2.3.1 目標(biāo)函數(shù)

根據(jù)算法2，在基于馬爾可夫鏈的譜聚類(lèi)方法[28]中，轉(zhuǎn)移概率矩陣直接影響著聚類(lèi)性能。同樣對(duì)于面向多視圖聚類(lèi)的馬爾可夫鏈譜聚類(lèi)方法[16，19，29]，轉(zhuǎn)移概率矩陣對(duì)聚類(lèi)結(jié)果也具有重要的影響，因此如何基于多視圖來(lái)學(xué)習(xí)譜聚類(lèi)的轉(zhuǎn)移概率矩陣是要解決的主要問(wèn)題。其中一個(gè)代表性方法RMSC[16]將每個(gè)視圖下的轉(zhuǎn)移概率矩陣Pi分解為共享概率矩陣Z和視圖特定的噪聲矩陣Ei，以此來(lái)獲取共享信息。但是該方式忽略了每個(gè)視圖中包含的對(duì)聚類(lèi)有用的特殊信息，所以，將每個(gè)Pi分成兩部分，即Pi=Zi+Ei，然后分別收集堆疊所有的Zi和Ei來(lái)構(gòu)造3階張量Z 和E，進(jìn)而在張量形式下揭示不同視圖之間的高階相關(guān)性。由于不同視圖是同一對(duì)象的不同表示形式，因此，不同視圖下的低秩部分Zi通常具有相同的類(lèi)別屬性。另外，樣本類(lèi)別數(shù)目通常比樣本數(shù)目少的多，所以，由不同視圖下的低秩部分Zi構(gòu)成的張量Z 具有低秩結(jié)構(gòu)，使用基于t-SVD 的張量核范數(shù)|| ||?來(lái)度量。此外對(duì)于噪聲項(xiàng)，由于噪聲樣本一般是稀疏的，所以用對(duì)異常值和噪聲具有較強(qiáng)魯棒性的?2,1范數(shù)來(lái)度量。不直接使用轉(zhuǎn)移概率張量P∈?n×n×m，而是將其沿第三維即特征維旋轉(zhuǎn)，這種旋轉(zhuǎn)操作在Mtalab 中可以通過(guò)fft 功能輕松實(shí)現(xiàn)，且沿特征維的快速傅里葉變換不僅保持了視圖之間的關(guān)系，還大大降低了優(yōu)化求解中的計(jì)算復(fù)雜度。得到張量形式的目標(biāo)函數(shù)為：

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)設(shè)置

3.1.1 數(shù)據(jù)集

為驗(yàn)證算法的有效性，在4 個(gè)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)，分別是BBCSport、Newsgroups data set（NGs）、Yale 和MSRCv1。

BBCSport[20]（http：//mlg.ucd.ie/datasets/bbc.html）數(shù)據(jù)集總共有2種不同的視圖，包含來(lái)自英國(guó)廣播公司體育網(wǎng)站的737 份文件，對(duì)應(yīng)于田徑、板球、足球、橄欖球和網(wǎng)球5個(gè)熱門(mén)領(lǐng)域的體育新聞。

NGs（http：//qwone.com/～jason/20Newsgroups）是20個(gè)新聞組數(shù)據(jù)集的子集，共有3 個(gè)視圖。由500 個(gè)新聞組文檔組成。每個(gè)原始文檔都用3 種不同的特征提取方法進(jìn)行預(yù)處理。

Yale（http：//vision.ucsd.edu/datasets/yale_face_dataset_original）人臉數(shù)據(jù)庫(kù)包含3 個(gè)視圖，有15 個(gè)人的165 張灰度圖像。每個(gè)主題包括11個(gè)不同的表達(dá)和配置的圖像。本文提取了3種類(lèi)型的特征。

MSRCv1[10]數(shù)據(jù)集有5 個(gè)視圖，包含由7 個(gè)類(lèi)別組成的210 幅圖像，并且本文對(duì)于每幅圖像選擇5 個(gè)特征向量。

3.1.2 評(píng)價(jià)指標(biāo)

為了綜合評(píng)估聚類(lèi)的性能，本文采用3個(gè)常用的評(píng)價(jià)指標(biāo)對(duì)結(jié)果進(jìn)行度量，分別是精確度[18]（ACC）、純度[18]（Purity）和歸一化互信息[18]（NMI）。對(duì)于所有指標(biāo)，值越高表示性能越好。

3.1.3 對(duì)比算法

為了說(shuō)明提出算法的有效性，我們將在實(shí)驗(yàn)數(shù)據(jù)集上與下列5個(gè)相關(guān)算法進(jìn)行對(duì)比：

（1）低秩表示（LRRbest）[5]，對(duì)每個(gè)視圖采用低秩表示算法，選擇最優(yōu)結(jié)果。

（2）魯棒圖學(xué)習(xí)（RGCbest）[8]，自適應(yīng)的去除原始數(shù)據(jù)中的噪聲和異常值，從每個(gè)視圖中學(xué)習(xí)到最可靠的圖進(jìn)行聚類(lèi)，選擇最優(yōu)結(jié)果。

（3）基于自適應(yīng)近鄰的多視圖學(xué)習(xí)（MLAN）[14]，同時(shí)進(jìn)行多視圖聚類(lèi)、半監(jiān)督分類(lèi)和局部流形結(jié)構(gòu)學(xué)習(xí)，得到最優(yōu)圖直接劃分聚類(lèi)。

（4）同時(shí)學(xué)習(xí)特征權(quán)重和局部結(jié)構(gòu)的多視圖子空間聚類(lèi)（JFLMSC）[12]，將特征的自適應(yīng)局部學(xué)習(xí)、自表示學(xué)習(xí)和權(quán)重學(xué)習(xí)結(jié)合到一個(gè)框架中，利用每個(gè)視圖的全局和局部結(jié)構(gòu)進(jìn)行多視圖子空間聚類(lèi)。

（5）本質(zhì)張量學(xué)習(xí)用于多視圖譜聚類(lèi)（ETLMSC）[20]，學(xué)習(xí)一個(gè)本質(zhì)張量用于基于馬爾可夫鏈的譜聚類(lèi)，揭示多視圖表示的高階相關(guān)性。

3.2 實(shí)驗(yàn)結(jié)果與分析

3.2.1 實(shí)驗(yàn)結(jié)果

分別在4個(gè)數(shù)據(jù)集上對(duì)5個(gè)算法和本文提出的算法進(jìn)行實(shí)驗(yàn)，為減小實(shí)驗(yàn)的誤差，對(duì)不同的算法單獨(dú)調(diào)整參數(shù)直至最優(yōu)，不同數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果分別如表2～5所示，最優(yōu)結(jié)果加粗表示。

表2 數(shù)據(jù)集BBCSport上的實(shí)驗(yàn)結(jié)果Table 2 Experimental results on BBCSport

表3 數(shù)據(jù)集NGs上的實(shí)驗(yàn)結(jié)果Table 3 Experimental results on NGs

表4 數(shù)據(jù)集Yale上的實(shí)驗(yàn)結(jié)果Table 4 Experimental results on Yale

表5 數(shù)據(jù)集MSRCv1上的實(shí)驗(yàn)結(jié)果Table 5 Experimental results on MSRCv1

從表2～5中可以看出，4個(gè)數(shù)據(jù)集中，本文提出的算法都取得了最佳聚類(lèi)性能。例如在Yale人臉數(shù)據(jù)集上，與相應(yīng)的次優(yōu)算法MLAN相比，本文提出的方法在3個(gè)評(píng)價(jià)指標(biāo)ACC、NMI和Purity上分別提升了17、13和22個(gè)百分點(diǎn)。所提算法的純度在4 個(gè)數(shù)據(jù)集上相比于ETLMSC 方法，分別提高了1、12、20 和7 個(gè)百分點(diǎn)。提出的算法與單視圖的LRR、RGC算法相比，在性能上均取得了較大的提升，主要是由于單視圖聚類(lèi)算法僅僅利用了單個(gè)視圖的信息，即使選擇最優(yōu)的視圖進(jìn)行聚類(lèi)，在性能上也無(wú)法取得更好的結(jié)果。與在原始數(shù)據(jù)上直接學(xué)習(xí)圖的多視圖聚類(lèi)算法MLAN 相比，本文算法是在干凈的低秩數(shù)據(jù)上學(xué)習(xí)圖，使得聚類(lèi)效果有了進(jìn)一步的提升。與JFLMSC算法相比，通過(guò)構(gòu)造張量進(jìn)一步探索到多視圖數(shù)據(jù)的高階相關(guān)性，使得聚類(lèi)準(zhǔn)確性更高。與基于張量的方法ETLMSC 相比，本文方法仍體現(xiàn)出優(yōu)越性，主要?dú)w功于轉(zhuǎn)移概率矩陣構(gòu)造的可靠性以及高階相關(guān)性的有效探索。由上述實(shí)驗(yàn)可以發(fā)現(xiàn)，與其他傳統(tǒng)算法相比，本文算法在不同類(lèi)型數(shù)據(jù)集和不同評(píng)價(jià)指標(biāo)上都有更優(yōu)異的表現(xiàn)。

3.2.2 參數(shù)分析

圖2 參數(shù)β 和λ 對(duì)BBCSport數(shù)據(jù)集的影響Fig.2 Influence of β and λ values on BBCSport dataset

3.2.3 復(fù)雜度分析

本文提出的算法的主要計(jì)算量來(lái)自低秩張量學(xué)習(xí)每次迭代過(guò)程中Z和E 的求解，優(yōu)化求解張量E 的時(shí)間復(fù)雜度為O(mn2)。而對(duì)于張量Z，一方面，沿第3維的傅里葉變換和逆傅里葉變換時(shí)間復(fù)雜度為O(mn2lbn)，另一方面，在傅里葉域計(jì)算每個(gè)正面切片奇異值分解的時(shí)間復(fù)雜度為O(mn2)，所以求解計(jì)算Z的總時(shí)間復(fù)雜度為O(mn2+mn2lbn) 。通常視圖數(shù)m遠(yuǎn)遠(yuǎn)小于樣本n，那么m≤lbn，所以相較于不進(jìn)行張量旋轉(zhuǎn)所需要的計(jì)算復(fù)雜度O(m2n2lbn)，張量旋轉(zhuǎn)操作降低了計(jì)算復(fù)雜度。其次算法復(fù)雜度還涉及到多視圖魯棒圖學(xué)習(xí)和基于馬爾可夫譜聚類(lèi)中的奇異值分解和矩陣求逆的操作，一般他們的計(jì)算復(fù)雜度為O(n3)。記迭代次數(shù)為t，提出的算法總的計(jì)算復(fù)雜度為O(n3+tmn2(m+lb(n)))。

表6顯示了提出的算法和5種對(duì)比算法的時(shí)間復(fù)雜度以及在4 個(gè)數(shù)據(jù)集上運(yùn)行10 次的平均時(shí)間，其中dv表示第v個(gè)視圖特征向量的維數(shù)，m和n分別為視圖數(shù)和樣本數(shù)，r是樣本數(shù)據(jù)矩陣的秩，平均運(yùn)行時(shí)間以s 為計(jì)量單位。雖然MLAN 和ETLMSC 算法所需運(yùn)行時(shí)間較短，但其聚類(lèi)性能不如本文提出的算法。與比較算法中運(yùn)行時(shí)間較長(zhǎng)的兩個(gè)算法RGC 和JFLMSC 相比，提出算法的運(yùn)行時(shí)間在BBCSport 和MSRCv1 數(shù)據(jù)集上多于RGC 和JFLMSC，但是在NGs 和Yale 數(shù)據(jù)集上顯著少于RGC 和JFLMSC。在實(shí)際應(yīng)用中，提出的LRTRL-MVC 能夠在可接受的時(shí)間范圍內(nèi)達(dá)到更好聚類(lèi)效果。

3.3 可視化結(jié)果

為了更直觀地看到聚類(lèi)結(jié)果，將面向多視圖聚類(lèi)的低秩張量表示學(xué)習(xí)算法與其他對(duì)比算法在MSRCv1 數(shù)據(jù)集上的聚類(lèi)結(jié)果進(jìn)行可視化。先通過(guò)tSNE方法將高維特征映射到二維子空間，再利用算法得到的聚類(lèi)結(jié)果對(duì)映射后的二維數(shù)據(jù)進(jìn)行著色，由此直觀地顯示出算法的聚類(lèi)性能。從圖3中可以觀察到，本文提出的算法能有效地將相似樣本聚集到一個(gè)簇中，體現(xiàn)出優(yōu)越的聚類(lèi)性能。

圖3 MSRCv1數(shù)據(jù)集上算法可視化結(jié)果Fig.3 Visualization results of algorithm on MSRCv1 dataset

4 結(jié)論

本文提出了一種面向多視圖聚類(lèi)的低秩張量表示學(xué)習(xí)算法，通過(guò)把魯棒主成分分析和自適應(yīng)近鄰學(xué)習(xí)融合到一個(gè)框架將魯棒圖學(xué)習(xí)擴(kuò)展到多視圖，充分利用了多視圖數(shù)據(jù)的互補(bǔ)信息。然后利用精確的魯棒圖計(jì)算轉(zhuǎn)移概率矩陣進(jìn)而構(gòu)造3 階張量。通過(guò)基于張量奇異值分解的核范數(shù)約束低秩張量來(lái)揭示多視圖間的高階相關(guān)性，最后利用馬爾可夫譜聚類(lèi)獲得最終的聚類(lèi)結(jié)果。在BBCSport、NGs、Yale 和MSRCv1 數(shù)據(jù)集的聚類(lèi)實(shí)驗(yàn)中，與算法LRR、SPC、MLAN、JFLMSC和ETLMSC相比，不論是數(shù)值指標(biāo)還是可視化結(jié)果，本文提出的算法都獲得了更好的聚類(lèi)結(jié)果。