999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

組學數據的核主成分聚類分析的可視化方法*

2010-03-11 14:01:34哈爾濱醫科大學衛生統計學教研室150086
中國衛生統計 2010年6期
關鍵詞:可視化效果

哈爾濱醫科大學衛生統計學教研室 (150086) 孫 萌 張 濤 李 康

采用核主成分分析法(kernel p rincipal component anal

ysis,KPCA)。近幾年,核主成分分析法受到越來越多的重視,本文在簡要介紹 KPCA原理的基礎上,通過對模擬數據和實際數據的運算考核其可視化效果,并且對 PCA和 KPCA兩種方法進行了比較。

基本原理

核主成分分析法是將核函數與主成分分析法結合,通過事先確定的非線性映射函數φ,將輸入向量 Xk(k=1,2,…,m)映射到特征空間 H:φ(Xk)中,然后在該特征空間 H中對數據進行主成分分析〔1,2〕。通常情況下,我們并不了解變量間真正的關系,采用不當的非線性函數,反而使結果不理想,并可能引起維數災難。核函數則可以避免上述問題,它把非線性變換后的高維空間的內積運算轉換為原始空間中的核函數計算,不需要明確給出φ的具體形式,而是通過計算核函數K(Xi,Xj)的值來計算內積。核主成分分析方法不是基于變換后的特征空間的協方差矩陣來計算特征向量,而是先求出輸入向量的核矩陣,在此核矩陣的基礎上算得其特征向量和特征值,從而避免了直接在變換后的高維空間求特征向量的運算,大大減小了計算量。

KPCA法進行數據可視化分析的基本計算步驟簡述如下:

(1)選定核函數,并以此來計算輸入向量的核矩陣K;

(2)將 K矩陣中心化;

(3)按公式λiαi=Kαi計算矩陣 K的特征向量αi和特征值λi;

(4)為了確保原樣本的非線性相關系數矩陣的特征向量為單位向量,還需將相應的αi通過進行規范化;

針對具體數據,核函數的選擇是一個重要的問題,采用不同的核函數,可以構造原始變量不同類型的關系。任何一個函數只要滿足M ercer條件,就可以作為核函數,常用核函數有多項式核函數、徑向基核函數(RBF)、平方核函數和 Sigm oid核函數〔1,2〕。其中徑向基核函數 (RBF)被認為是一個較為穩健的核函數。計算軟件可以使用M atlab7.6.0核主成分分析工具包等程序。

模擬試驗

模擬試驗的目的是,在類間可分的情況下,考察核主成分聚類分析的可視化效果,并在相同條件下對PCA和 KPCA兩種方法的可視化效果進行比較。

1.模擬實驗 1

由圖 1(a)和圖 1(b)可見,當對分類有作用的差異變量間存在非線性關系時,KPCA的聚類可視化結果明顯優于 PCA的結果。KPCA的分析結果不僅能夠準確地反映兩組的分類情況,而且組間的樣品點相距較遠,而 PCA兩類的樣品卻混在一起無法分辨。

圖 1 PCA和徑向基 KPCA的兩種可視化方法比較

2.模擬實驗 2

在模擬實驗 1的基礎上,分別混入 m′=50,200,500,1000個與分類無關的正態變量作為干擾變量,PCA和 KPCA分析結果如圖 2。結果顯示,加入 50、200和 500個對分類不起作用的無差異變量時,KPCA仍具有顯著的分類可視化效果,但隨著無差異變量數目的增加 (如 m′=1000),其聚類效果會明顯變差。

圖 2 加入不同數目正態干擾變量時徑向基 KPCA的可視化結果比較 (σ=8)

實 例

為進一步研究核主成分分析法對高維數據的可視化效果,現選取一個真實的實驗數據。實驗分為對照組、服用營養素兩組,每組各 10只小鼠,對其尿液的代謝組分用超高效液相色譜 -質譜聯用儀進行檢測,其中具有 886個代謝組分。在保持所有代謝組數據未進行變量篩選情況下,采用徑向基函數作為核主成分分析法的核函數,比較 KPCA與 PCA的效果,結果見圖3。結果顯示,PCA的分析結果不夠理想,但徑向基KPCA分析結果則較好地表示出了兩組的分類情況,說明其中可能含有具有生物學意義的代謝組成分。

小 結

與主成分分析法不同,核主成分分析法能夠解決變量間的非線性相關問題,其適用性更廣。用核主成分進行聚類分析時,需要設置的參數很少,改變這些參數可以得到更好的效果,本文用模擬試驗和實例說明了使用核主成分進行可視化分析的有效性。由于設定不同核函數的參數會產生不同的可視化效果,因此實際應用中需要確定最合適的核函數和參數。如果在作核主成分分析前,有針對性地對變量進行篩選,能夠獲得更好的可視化效果。

圖 3 營養代謝組實驗數據 PCA和 KPCA(RBF)的可視化結果比較

1.Sch?lkopf B,Burges C,Sm ola A.A dvances in kernel methods:support vector learning.Cam bridge:The M IT Press,1999.

2.Sch?lkopf B,Smola A,Müller KR.Nonlinear component analysis as a kernel eigenvalue p roblem.Neural Computation,1998,10(5):1299-1319.

猜你喜歡
可視化效果
自然資源可視化決策系統
北京測繪(2022年6期)2022-08-01 09:19:06
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
按摩效果確有理論依據
自然資源可視化決策系統
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
迅速制造慢門虛化效果
抓住“瞬間性”效果
中華詩詞(2018年11期)2018-03-26 06:41:34
模擬百種唇妝效果
Coco薇(2016年8期)2016-10-09 02:11:50
主站蜘蛛池模板: 欧美在线一二区| 欧美亚洲国产精品久久蜜芽| 亚洲精品天堂自在久久77| 国产特级毛片| 日本在线欧美在线| 久久天天躁夜夜躁狠狠| 国产一区亚洲一区| 亚洲欧美另类色图| 毛片手机在线看| 在线免费a视频| 国产在线一区视频| 自慰网址在线观看| 国产精品女人呻吟在线观看| 一区二区午夜| 看看一级毛片| 啪啪永久免费av| 亚洲第一视频免费在线| 国产亚洲现在一区二区中文| 日韩欧美中文字幕在线精品| 国产精品专区第1页| 国产精品香蕉| 久久99精品国产麻豆宅宅| 久久综合成人| 国产成人综合久久精品尤物| 999精品在线视频| 日韩国产黄色网站| 91久久青青草原精品国产| 人妻一区二区三区无码精品一区| 天天综合亚洲| 麻豆a级片| 中文无码精品A∨在线观看不卡| 一级在线毛片| 中文字幕乱码二三区免费| 国产精品亚洲一区二区三区在线观看| 日本黄色a视频| JIZZ亚洲国产| 刘亦菲一区二区在线观看| 国产精品久久久精品三级| 中日韩一区二区三区中文免费视频| 狠狠色噜噜狠狠狠狠色综合久| 久久综合色天堂av| 看av免费毛片手机播放| 免费国产小视频在线观看| 67194亚洲无码| 黄色成年视频| 久无码久无码av无码| 亚洲精选无码久久久| 久久精品人人做人人| 国产欧美在线观看一区| 亚洲AⅤ永久无码精品毛片| 久久久久无码国产精品不卡| 97在线碰| 一级毛片在线免费看| 久久国产亚洲欧美日韩精品| 色久综合在线| 免费无码网站| 97狠狠操| 欧美国产精品不卡在线观看 | 亚洲av色吊丝无码| 91在线高清视频| 福利在线免费视频| 国产剧情一区二区| 国产精品无码久久久久AV| 亚洲国产成人超福利久久精品| 久久久久国产精品免费免费不卡| 毛片在线播放a| 91精品国产自产在线老师啪l| 国产亚洲精品自在线| 91色综合综合热五月激情| 国产经典在线观看一区| 高h视频在线| 日韩免费毛片视频| 青草娱乐极品免费视频| 色网在线视频| 午夜三级在线| 国产18在线播放| 多人乱p欧美在线观看| 亚洲天堂日韩av电影| 久久亚洲综合伊人| 精品视频福利| 国产精品视频导航| 亚洲一区二区三区在线视频|