999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

非負矩陣分解在數據優化中的研究

2019-08-10 06:36:17甘井中黃恒杰
電腦知識與技術 2019年17期

甘井中 黃恒杰

摘要:文章在闡述非負矩陣分解內涵和原理的基礎上,將其應用到生物信息學領域能夠幫助學者更好的解釋和研究隱藏的生物資源,旨在進一步揭示隱藏在大量數據背后的生物奧秘,促進生物學領域發展。

關鍵詞:非負矩陣分解在;數據優化;研究應用

中圖分類號:TP311? ? ? ? 文獻標識碼:A

文章編號:1009-3044(2019)17-0012-02

開放科學(資源服務)標識碼(OSID):

在現代科技和信息網絡的快速發展下,矩陣作為一種高維數據信息處理分析形式,在大數據應用領域得到了廣泛應用,具體表現在文檔管理、診斷數據優化、多媒體數據集成等方面。但是在大量、眾多數據信息面前,數據信息處理任務龐大,且對各類數據信息的綜合處理效率較低,最終導致高緯度數據信息的缺失。為了解決這個問題,矩陣分解被人們提出,在矩陣分解的不斷優化下出現了非負矩陣分解。將非負矩陣分解能夠實現對各類復雜數據信息的高效化處理,并最終對處理之后的數據做出有效的解釋,充分發揮出數據信息在社會生產領域的作用。

1 非負矩陣分解概述

非負矩陣分解是由兩位學者在《Nature》雜志上提出的一種新的矩陣分析方法,該方法的使用最早可以追溯到前人的研究工作。大數據信息時代下,傳統的矩陣分解工具,比如PCA和SVD等分解效果不理想,且負元素在實際問題的應用中缺乏科學的解釋。

NEF可以被應用在多變量數據的統計分析中,給定一組多元n維數據向量,將向量放置在nm矩陣V列中,其中,m是數據集中的示例數,之后將矩陣近似分解為nr矩陣W和em矩陣H。在r

從實際操作情況來看,對于龐大規模的數據分析都需要采取矩陣分析的形式來處理,在這個過程中容易出現數據信息處理偏差,為了能夠解決這個問題,在科學技術的發展下提出了一種新的數據信息處理分析方式,即NMF分解算法。NMF分解算法相較于傳統的一些算法而言,具有實現上的簡便性、分解形式和分解結果解釋性強、占用存儲空間少等諸多優點。

2 非負矩陣分解在基因表達數據聚類分析中的應用

2.1 基因表達數據聚類分析

在DNA芯片的快速發展下,芯片處理分析領域對數據信息處理提出了更高的要求,在這樣的發展要求下DNA技術在識別癌癥類和子類基因等方面起著十分重要的作用。從實踐操作情況來看,基因分析方法的應用反向和基本形式是聚類,通過使用這種方式能夠實現對各類事物存在有效信息的有效處理。

基因芯片所產生的基因表達數據矩陣具有規模大、復雜程度高的特點,在使用的過程中隊數據處理和信息的獲取提出了更高的要求。在信息科技的快速發展下,基因芯片在數據處理方面得到了廣泛的應用,其中,經典統計分析是一種常用的統計分析方法。微列陣的聚類算法是生物信息學中的一個活躍領域,它的應用基于這樣的假設:具有類似表達模式的基因具有類似的生物學行為。通過對基因或者樣本的聚類能夠發現在一個生物過程中共表達的基因組群以及與之對應的樣本,僅僅對基因或者樣本進行聚類的被稱作是單向聚類,同時對二者進行聚類的被稱作是雙向聚類。

在進行單向聚類分析的時候如果對行向量聚類,那么每一類的相關性將不會受到列的影響,特別是在不相干列數比較多的情況下,對列向量進行聚類操作的方法類似。雙向聚類操作目的是尋找數據矩陣子矩陣集,使得每個子矩陣的行列都體現出相關性的特點,每一個樣本會同時進行多個生物過程。雙向聚類允許類和類之間出現重疊,由此對基因芯片數據分析來講具有十分重要的意義。

2.2 非負矩陣分解算法的聚類分析

在NMF模型中,任意給定一個 非負基因表達數據矩陣A=【aij】=【a1,a2,....,an】,能夠分解為兩個非負矩陣F=【fik】=【f1,....,fk】和P=【pkn】=【p1,P2,....,Pn】,使得A≈FP,其中,A是一個非負矩陣,橫向m代表基因在n個樣本中的應用水平,縱向代表樣本基因的總體表達水平。F是一個mk的非負矩陣,包含m個基因k個樣本,P是一個kxn的非負矩陣或者向量,被稱作是基矩陣。

2.3 實驗結果分析

在對數據分類和選擇適合的分析方法之后,為了能夠更好地評估出數據信息的聚類分析結果,對所選擇的癌癥數據信息進行聚類處理,兩類癌癥數據信息其中一類包含人體中樞神經系統的腫瘤數據,另外一類則是包含個體白血病的數據。聚類精準度的測量采用以下公式,如(1)所示。

(n代表樣本的數目;I(ji)代表樣本的聚類正確度;如果樣本聚類分配是正確的,那么I(ji)=1,否則I(ji)=0)在以往的文獻中有學者證明了NMF聚類穩定度和精準度要優于HC和SOM的方法,針對稀疏性的NMF聚類分析不斷提升。應用GNMF分析中樞神經系統腫瘤數據集和白血病數據。

2.3.1 中樞神經系統腫瘤數據集

這類數據信息由42個樣本和m=5579個基因組成,包含五種類型的中樞神經系統腫瘤,代表了五個不同的類別形態。中樞神經系統腫瘤的五種形態和樣本髓母細胞瘤、惡性神經膠質瘤、橫紋肌樣瘤、正常的小腦、原始神經外胚層腫瘤分別對應的數字為10、10、10、4、8。k取2-5對應GNMF一致性矩陣D的樣本重構圖如圖一所示。圖一利用GNMF聚類的k值從2到5變化時,一致性劇本D的樣本重構圖,樣本聚在同一類的可能性為0,深藍色代表數值0的色彩,深紅色代表數值1的色彩,圖1中的色彩變化對應一致性矩陣元素從0到1的變化。在k取2/3/4/5和6的時候,GNMF能夠很好地將細胞樣本和腫瘤樣本區分。

2.3.2 白血病數據集

白血病數據集m=5000和38個樣本組成,這38個樣本大體上分為兩類,分別是AML和ALL,其中,ALL代表的是急性淋巴細胞白血病,AML是急性骨髓性白血病,數據集對應的樣本數目如下所示:B型急性淋巴細胞白血病數字為19、T型急性淋巴細胞白血病數字為8、急性骨髓性白血病對應的數字為11。結合臨床和組織病理學證明這個數據集的38個樣本分配到三種類型的亞型中,具有很高的可信度,數據集應用具有很強的可行性。k取2-5對應GNMF一致性矩陣D的樣本重構圖如圖2所示。在k取2或者3的時候,GNMF聚類效果最為穩定。

3 結束語

綜上所述,非負矩陣分解是一種用來處理大變量數據的方法,文章以醫學領域的癌癥病變為基本研究對象,在NMF算法的支持下對基因表達數據進行了研究,特別是對癌癥基因數據進行了聚類分析,同時對NMF進行改進,獲取優良基因,取得了良好的成效。可見,非負矩陣分解算法和其他特征提圖像處理方法相比具有算法效率高的特點,在未來需要相關學者對其進行做出更深入的思考。

參考文獻:

[1] 李孟杰,謝強,丁秋林.基于正交非負矩陣分解的K-means聚類算法研究[J].計算機科學,2016,43(5):204-208.

[2] 路成.稀疏約束非負矩陣分解方法及其應用研究[D].安徽大學,2017.

[3] 栗茂林,梁霖,陳元明,等.基于聚類優化的非負矩陣分解方法及其應用[J].中國機械工程,2018(4).

[4] 張鳳斌,葛海洋,楊澤.非負矩陣分解在免疫入侵檢測中的優化和應用[J].計算機工程,2016, 42(5):173-178.

[5] 趙艷萍,徐勝超.基于云計算與非負矩陣分解的數據分級聚類[J].現代電子技術,2018(8).

【通聯編輯:唐一東】

主站蜘蛛池模板: 国产丝袜无码精品| 黄色在线网| 日韩欧美中文字幕在线精品| 欧美三級片黃色三級片黃色1| 尤物在线观看乱码| 国产在线八区| 亚洲无线一二三四区男男| 亚洲视频一区在线| 久久亚洲黄色视频| 久久综合成人| 欧美福利在线| 亚洲成a人在线观看| 亚洲色欲色欲www网| 综合色88| 国产毛片高清一级国语| 国产系列在线| 毛片最新网址| 日韩免费毛片视频| 91丨九色丨首页在线播放| 欧美在线导航| 国产美女无遮挡免费视频| 天天躁夜夜躁狠狠躁躁88| 国产在线91在线电影| 国产日韩欧美视频| 国产一区二区丝袜高跟鞋| 欧美激情视频在线观看一区| 亚洲天堂色色人体| 天天做天天爱天天爽综合区| 偷拍久久网| 尤物午夜福利视频| 国产内射一区亚洲| 一级全黄毛片| 99九九成人免费视频精品 | 国产欧美综合在线观看第七页| 久久天天躁狠狠躁夜夜躁| 国产亚洲高清在线精品99| 久久人人爽人人爽人人片aV东京热| 精品国产一区二区三区在线观看| 老司机精品久久| 国产成人精品男人的天堂下载 | 国产三级韩国三级理| 狠狠综合久久久久综| 亚洲永久视频| 中日韩一区二区三区中文免费视频| 日韩av手机在线| 99久久精品免费观看国产| 国产男人的天堂| 日韩天堂在线观看| 成人91在线| 色综合天天娱乐综合网| 狠狠做深爱婷婷久久一区| 亚洲一区二区在线无码| 欧美成人二区| 日本精品影院| 国产三级毛片| 国产日本视频91| 四虎永久在线| 久久6免费视频| 99这里只有精品免费视频| 久久99热66这里只有精品一| 国产玖玖玖精品视频| 日韩亚洲高清一区二区| 国产精品视频免费网站| 欧美国产在线看| 亚洲精品不卡午夜精品| 国产av一码二码三码无码| 亚洲一区二区日韩欧美gif| 日本草草视频在线观看| 一区二区三区成人| 91破解版在线亚洲| 四虎成人在线视频| 欧美黄网站免费观看| 国产AV无码专区亚洲A∨毛片| 国产草草影院18成年视频| 国产自在自线午夜精品视频| 一级高清毛片免费a级高清毛片| 欧洲av毛片| 狠狠躁天天躁夜夜躁婷婷| 五月天丁香婷婷综合久久| 99热最新网址| 亚洲欧洲国产成人综合不卡| 国产网站免费看|