999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高維隨機(jī)矩陣的癌癥基因網(wǎng)絡(luò)識(shí)別方法

2021-11-17 03:56:56任喜梅鐘春曉王錦麗
計(jì)算機(jī)仿真 2021年3期
關(guān)鍵詞:肝癌特征

李 蓉,任喜梅,鐘春曉,王錦麗

(華東交通大學(xué)理工學(xué)院,江西 南昌 330100)

1 引言

癌癥由多階段的多基因共同參與而生成、發(fā)展,并與基因變化有著緊密聯(lián)系,癌癥的發(fā)生、促進(jìn)、發(fā)展以及轉(zhuǎn)移,大部分都跟原癌基因[1]活化、抑癌基因[2]失活等基因突變密切相關(guān)。具有挖掘隱含生物學(xué)信息功能的微陣列數(shù)據(jù),可以依據(jù)基因間的性能模塊中已知基因預(yù)測(cè)未知基因,但因其維數(shù)較高,存在較少數(shù)量與癌癥相關(guān)的基因。高維隨機(jī)矩陣?yán)碚?Random Matrix Theory,RMT)通過對(duì)比隨機(jī)的高維、多維序列屬性特征,發(fā)現(xiàn)實(shí)際數(shù)據(jù)與隨機(jī)因素之間的偏離程度,提取數(shù)據(jù)內(nèi)的總體相關(guān)行為特征。

為此,本文將高維隨機(jī)矩陣與癌癥基因融合,提出一種癌癥基因網(wǎng)絡(luò)識(shí)別方法,將系數(shù)矩陣右邊增加一列,擴(kuò)增隨機(jī)矩陣,提升隨機(jī)矩陣特征擬合度;通過規(guī)范化、中心化以及標(biāo)準(zhǔn)化隨機(jī)矩陣,提升矩陣適用性能;以互信息作為度量標(biāo)準(zhǔn),依據(jù)各隨機(jī)矩陣奇異值矢量與初始特征奇異值矢量的差值,優(yōu)化特征選擇;利用癌癥基因表達(dá)矩陣特征根的最近鄰間隔分布與高斯正態(tài)分布、泊松分布的標(biāo)準(zhǔn)誤差比值計(jì)算,增加有效信息的保留數(shù)量,增強(qiáng)噪聲濾除性能。

2 高維隨機(jī)矩陣下癌癥微陣列數(shù)據(jù)預(yù)處理

2.1 高維隨機(jī)矩陣構(gòu)建

將維度較高的隨機(jī)變量作為矩陣組成元素,即可構(gòu)成高維隨機(jī)矩陣,依據(jù)隨機(jī)矩陣?yán)碚摵x,設(shè)定某一高維隨機(jī)矩陣為M,表達(dá)式如下所示

(1)

(2)

式中,隨機(jī)矩陣M的極大、極小特征值分別用λmax和λmin來表示,相應(yīng)表達(dá)式如下所示

(3)

(4)

綜上所述,利用隨機(jī)矩陣M與相關(guān)矩陣C具有的屬性特征,劃分矩陣C為符合隨機(jī)矩陣M部分與差異部分,即隨機(jī)噪聲U與真實(shí)信息V,通過優(yōu)化相關(guān)矩陣C,即可去除其中所含噪聲。

2.2 癌癥微陣列數(shù)據(jù)特征選擇優(yōu)化

基因表達(dá)網(wǎng)絡(luò)[3]受實(shí)驗(yàn)條件影響,一般會(huì)存在一些隨機(jī)因素:當(dāng)實(shí)驗(yàn)時(shí)間與樣本條件發(fā)生變化時(shí),基因表達(dá)水平也將隨之改變;若實(shí)驗(yàn)樣本有限,則有可能產(chǎn)生測(cè)量噪音。而此類隨機(jī)因素生成的虛假信息,會(huì)對(duì)真實(shí)信息造成干擾,影響識(shí)別結(jié)果的可靠性與準(zhǔn)確性,因此,應(yīng)在初始階段去除可能產(chǎn)生的隨機(jī)因素。

已知矩陣D是一個(gè)初始的數(shù)據(jù)矩陣,由特征集合F={f1,f2,…,ft}與類集合S={s1,s2,…,sk}架構(gòu)而成,其中,t、k分別表示特征個(gè)數(shù)與類別數(shù)量,高維隨機(jī)矩陣M的構(gòu)建公式如下所示

(5)

下列矩陣即為所得矩陣M的表達(dá)式

(6)

若上式中的k值較小,則無法理想地滿足隨機(jī)矩陣特征,所以,應(yīng)在系數(shù)矩陣右邊增加一列,擴(kuò)增[4]隨機(jī)矩陣M,復(fù)制m次后,得到下列表達(dá)式

M=[M,m(M)]

(7)

式中的m可通過下列計(jì)算公式完成求解,令初始的行列比值不發(fā)生改變

(8)

為確保該隨機(jī)矩陣M并非一種特例,可以代表大多數(shù)的普遍情況,采用下列式(9)與(10),規(guī)范化、中心化以及標(biāo)準(zhǔn)化隨機(jī)矩陣M,得到不失一般性的隨機(jī)矩陣Md

(9)

(10)

利用得到的隨機(jī)矩陣Md,推導(dǎo)出t×t的特征相關(guān)矩陣C表達(dá)式,如下所示

(11)

再通過下列奇異值分解[5]式,完成相關(guān)矩陣C的奇異值分解

C=UΛV

(12)

Cnew=UΛnewV

(13)

任意兩特征與初始類別的關(guān)聯(lián)程度,用Unew中含有的各項(xiàng)元素Kij來描述,各特征與新類別的關(guān)聯(lián)程度,用Vnew中含有的各項(xiàng)元素Eij來描述。通過對(duì)去噪的相關(guān)矩陣進(jìn)行特征選擇,可去除冗余以及與類別不存在關(guān)聯(lián)性的特征。因?yàn)槿ピ牒罅舸媪薺-1個(gè)奇異值,且選取特征數(shù)量與奇異值剩余個(gè)數(shù)相同,所以,特征選擇個(gè)數(shù)是j-1,各特征的重要程度計(jì)算公式如下所示

(14)

式中,第i個(gè)特征的重要程度為F(i),集合是F={f1,f2,…,fi},按照從大到小的順序降序排列F(i)后,得到重要程度最高的前j-1個(gè)特征,完成特征選取。

采用隨機(jī)矩陣進(jìn)一步優(yōu)化選擇的n個(gè)特征,各特征均是一個(gè)隨機(jī)變量,利用隨機(jī)特征矩陣與初始特征矩陣奇異值矢量的相關(guān)系數(shù),描述特征與隨機(jī)變量的關(guān)聯(lián)度,相關(guān)系數(shù)越大,關(guān)聯(lián)度越高,所以,應(yīng)留存較小的相關(guān)系數(shù)特征。

已知特征集合F={f1,f2,…,fn},類別數(shù)量為k個(gè),計(jì)算初始特征矩陣M的奇異值過程中,以互信息[6]作為度量標(biāo)準(zhǔn),采用式(5)和(6)架構(gòu)互信息矩陣D,再依據(jù)式(9)~(12),逐步實(shí)施規(guī)范化、標(biāo)準(zhǔn)化、相關(guān)矩陣運(yùn)算以及奇異值分解等操作,最終得到矩陣M的奇異值矢量e,該矢量的組成部分為n個(gè)奇異值,其中所含元素表示為εk;在求取隨機(jī)特征矩陣奇異值矢量階段,將隨機(jī)變量用各個(gè)特征表示,構(gòu)建數(shù)量為n的隨機(jī)矩陣(M1,M2,…,Mn)。按照初始特征矩陣奇異值矢量計(jì)算流程,解得各隨機(jī)矩陣Mi(1≤i≤n)奇異值矢量ei,其中所含各元素用εik表示。關(guān)于各隨機(jī)矩陣奇異值矢量ei與初始特征奇異值矢量e的差di,可利用下列計(jì)算公式解得,通過取整差值di,并保留di≠0情況下的fi,實(shí)現(xiàn)特征選擇優(yōu)化

(15)

3 癌癥基因網(wǎng)絡(luò)識(shí)別

3.1 降噪點(diǎn)確定

利用隨機(jī)矩陣?yán)碚撆c下列皮爾森相關(guān)系數(shù)[7]公式,轉(zhuǎn)換癌癥基因微陣列數(shù)據(jù)為相關(guān)基因矩陣,使矩陣中含有全部基因之間的關(guān)聯(lián)程度:

(16)

假設(shè)高維隨機(jī)矩陣?yán)碚摰慕翟雲(yún)?shù)是q,取值范圍為(0,1),將參數(shù)q值慢慢增大,去除較小的相關(guān)系數(shù),求解對(duì)應(yīng)于各降噪?yún)?shù)q的特征根NNSD(Nearest-neighbour Spacing Distribution,最近鄰間隔分布)。在不斷增大參數(shù)q值、去除相關(guān)矩陣的較小相關(guān)系數(shù)過程中,相關(guān)矩陣特征根最近鄰間隔分布形式由高斯正態(tài)分布過渡至泊松分布[8]。

通過標(biāo)準(zhǔn)誤差方法,可以準(zhǔn)確、科學(xué)地確定癌癥基因特征根分布形式過渡至泊松體系的轉(zhuǎn)變點(diǎn)對(duì)應(yīng)q值,所以,設(shè)定癌癥基因表達(dá)矩陣特征根的最近鄰間隔分布與高斯正態(tài)分布的標(biāo)準(zhǔn)誤差為SDGOE(q),與泊松分布的標(biāo)準(zhǔn)誤差為SDpoisson(q),利用下列兩項(xiàng)標(biāo)準(zhǔn)誤差界定公式,計(jì)算分布形式過渡的臨界點(diǎn)與降噪?yún)?shù)

(17)

(18)

式中,第i點(diǎn)對(duì)應(yīng)特征根的最近鄰間隔分布是p(i),該點(diǎn)對(duì)應(yīng)高斯正態(tài)分布與泊松分布特征根的最近鄰間隔分布分別用PGOE(i)、Ppoisson(i)表示。

如果兩個(gè)標(biāo)準(zhǔn)誤差值相同,特征根的最近鄰間隔分布體系元素相互效用較強(qiáng),相關(guān)程度較大,相似性較高,多數(shù)為真實(shí)相關(guān)信息,極少數(shù)為隨機(jī)信息;如果標(biāo)準(zhǔn)誤差比值較大,分布體系則更趨近于泊松分布,偏離高斯正態(tài)分布,在留存有效信息的同時(shí),充分濾除噪聲。因此,降噪點(diǎn)即為最大標(biāo)準(zhǔn)誤差比值的對(duì)應(yīng)點(diǎn)。將降噪?yún)?shù)q從0逐漸增大至1,去除癌癥相關(guān)矩陣含有的隨機(jī)噪聲,才能得到真實(shí)的癌癥基因網(wǎng)絡(luò)。

3.2 癌癥基因網(wǎng)絡(luò)架構(gòu)

依據(jù)癌癥基因初始數(shù)據(jù)與不同實(shí)驗(yàn)條件的所有基因表達(dá)水平,采用cluster tree view軟件構(gòu)建描述基因相互效用的層次樹形圖,該圖在聚合有相關(guān)性基因的同時(shí),展現(xiàn)出層次結(jié)構(gòu)的連接形式。基于明確的降噪點(diǎn),選取出與其它基因相關(guān)系數(shù)不小于降噪?yún)?shù)q的基因,構(gòu)建新的癌癥基因表達(dá)矩陣,并聚類分析經(jīng)過噪聲濾除的癌癥基因。

假設(shè)新建癌癥基因表達(dá)矩陣的留存基因數(shù)量為361,且新矩陣的基因內(nèi)涵蓋其中的所有信息,則該癌癥基因網(wǎng)絡(luò)樹形圖如圖1所示。

圖1 癌癥基因網(wǎng)絡(luò)樹形圖

樹形圖1中,基因之間的相關(guān)性用連線表示,相關(guān)程度的強(qiáng)弱用樹枝長(zhǎng)度表示;連線與相關(guān)程度成反比。

4 實(shí)例分析

4.1 實(shí)驗(yàn)數(shù)據(jù)采集

實(shí)驗(yàn)環(huán)節(jié)以肝癌[9]為例,從http:∥ genome-www.stanford.edu hcc supplement.shtml.斯坦福微陣列數(shù)據(jù)庫中,挑選肝癌基因微陣列初始數(shù)據(jù),得到的研究數(shù)據(jù)為基于82個(gè)HCC(Hepatocellular Carcinoma,肝細(xì)胞性肝癌)樣本1648個(gè)肝癌基因的微陣列數(shù)據(jù),樣本基因信息如表1所示。

表1 肝癌基因數(shù)據(jù)統(tǒng)計(jì)表

4.2 降噪點(diǎn)獲取

從0到1逐漸增大高維隨機(jī)矩陣?yán)碚摰慕翟雲(yún)?shù)q,圖2所示為參數(shù)q取不同數(shù)值時(shí),肝癌基因特征根的最近鄰間隔分布情況,圖中泊松分布用虛線表示,高斯正態(tài)分布用實(shí)線表示,最近鄰間隔分布用點(diǎn)線表示。

圖2 不同參數(shù)值的最近鄰間隔分布變化

通過圖2的曲線走勢(shì)可以看出,參數(shù)q在數(shù)值到達(dá)0.64后(見圖2(c)),基因特征根最近鄰間隔分布變化趨勢(shì)開始趨于泊松分布,經(jīng)過標(biāo)準(zhǔn)誤差值運(yùn)算,發(fā)現(xiàn)參數(shù)q在取值是0.67時(shí)(見圖2(d)),標(biāo)準(zhǔn)誤差比值為極大值,因此,1648×82肝癌微陣列數(shù)據(jù)的降噪點(diǎn)參數(shù)取值為0.67。

4.3 癌癥基因網(wǎng)絡(luò)識(shí)別結(jié)果

去噪后保留820個(gè)肝癌基因,并得到820×82的微陣列數(shù)據(jù),利用Cluster 3.0軟件層次聚類肝癌基因,采用斯皮爾曼相關(guān)系數(shù)度量基因之間的相似性,通過cluster tree view軟件呈現(xiàn)的肝癌基因樹形圖,如圖3所示。

圖3 基因樹形圖

圖3的基因表達(dá)譜中,基因表達(dá)量上調(diào)用紅色表示,下調(diào)則用綠色表示。當(dāng)基因被劃分為一類時(shí),相同肝癌樣本的表達(dá)量上、下調(diào)一致。經(jīng)分析得到的團(tuán)簇分別是增殖簇、B淋巴細(xì)胞簇、細(xì)胞周期調(diào)控簇、基質(zhì)細(xì)胞簇以及脂類酒精代謝簇,如圖4所示。

圖4 肝癌基因團(tuán)簇分類示意圖

以關(guān)聯(lián)程度較強(qiáng)的B淋巴細(xì)胞簇為例,分析肝癌基因團(tuán)簇,圖5所示為B淋巴細(xì)胞簇的基因樹形圖。從B淋巴細(xì)胞團(tuán)簇中分別識(shí)別出B淋巴細(xì)胞的增長(zhǎng)因子WNT4與編碼mRNA前剪接調(diào)控因子SLU7兩個(gè)基因。在團(tuán)簇內(nèi)層,兩基因緊密連通,該基因與B淋巴細(xì)胞免疫過程相關(guān),說明淋巴細(xì)胞正浸潤(rùn)肝組織。

圖5 B淋巴細(xì)胞簇基因及其層次樹圖

為了驗(yàn)證本文方法識(shí)別的有效性,采用基因網(wǎng)絡(luò)模塊劃分方法[10],得到圖6所示的肝癌基因處理結(jié)果。

圖6 基因網(wǎng)絡(luò)模塊劃分方法下肝癌基因模塊圖

經(jīng)過對(duì)比圖5和圖6可以看出,基因網(wǎng)絡(luò)模塊劃分方法識(shí)別出的肝癌基因中,只有1個(gè)基因在本文方法構(gòu)建的樹形圖分支上與對(duì)應(yīng)的主分支有所偏離,其它相同模塊的基因均與本文樹形圖所屬分支一致,說明本文方法能夠識(shí)別出基因的真實(shí)模塊,且相似度較高。

5 結(jié)論

癌癥作為一種復(fù)雜性疾病,對(duì)人類健康存在嚴(yán)重威脅,只有及時(shí)查出癌癥發(fā)生的相關(guān)基因,發(fā)現(xiàn)互相關(guān)聯(lián),才能防止癌癥惡化,因此,本文針對(duì)癌癥基因的微陣列數(shù)據(jù),以高維隨機(jī)矩陣為數(shù)據(jù)預(yù)處理策略,提出一種癌癥基因網(wǎng)絡(luò)識(shí)別方法,并制定出今后的研究探索方向:在過渡至泊松分布的過程中,最近鄰間隔分布體系仍有可能存在噪聲干擾,需設(shè)計(jì)出一個(gè)更加優(yōu)化的降噪點(diǎn)判定方法,使噪聲能夠去除完全;為便于基因的后續(xù)調(diào)控,需量化模塊之間的連接大小與調(diào)控關(guān)系,并進(jìn)一步研究基因之間相互調(diào)控的形式與力度,以及基因間相互影響程度。該方法對(duì)癌癥的生成檢測(cè)、惡化控制與治療,有著重要的現(xiàn)實(shí)意義。

猜你喜歡
肝癌特征
抓住特征巧觀察
新型冠狀病毒及其流行病學(xué)特征認(rèn)識(shí)
如何表達(dá)“特征”
LCMT1在肝癌中的表達(dá)和預(yù)后的意義
不忠誠的四個(gè)特征
抓住特征巧觀察
結(jié)合斑蝥素對(duì)人肝癌HepG2細(xì)胞增殖和凋亡的作用
中成藥(2016年8期)2016-05-17 06:08:14
microRNA在肝癌發(fā)生發(fā)展及診治中的作用
Rab27A和Rab27B在4種不同人肝癌細(xì)胞株中的表達(dá)
3例微小肝癌MRI演變回顧并文獻(xiàn)復(fù)習(xí)
主站蜘蛛池模板: 四虎AV麻豆| 91麻豆精品国产91久久久久| 亚洲色图综合在线| 日韩二区三区| 亚洲欧洲日产无码AV| 国产成人精品2021欧美日韩| 亚洲高清资源| 99久久国产综合精品2023| 国产成人8x视频一区二区| 亚洲高清在线播放| 欧美日韩另类在线| 亚洲伦理一区二区| 99久久婷婷国产综合精| 欧美一级一级做性视频| 欧美专区日韩专区| 亚洲aaa视频| 国产精品私拍99pans大尺度| 97超级碰碰碰碰精品| 亚洲天堂成人| 国产不卡网| 狠狠色婷婷丁香综合久久韩国| 欧美成a人片在线观看| 色综合久久无码网| 色色中文字幕| 狠狠色噜噜狠狠狠狠奇米777| 欧美精品v日韩精品v国产精品| 在线中文字幕日韩| 亚洲an第二区国产精品| 99精品国产高清一区二区| 精品久久久久成人码免费动漫| www亚洲天堂| 99伊人精品| 国产成人精品高清在线| 午夜久久影院| 亚洲日韩久久综合中文字幕| 亚洲乱亚洲乱妇24p| 国产杨幂丝袜av在线播放| 精品国产成人av免费| 91精品情国产情侣高潮对白蜜| 欧美激情成人网| 国产成人毛片| 999精品色在线观看| 日韩精品成人在线| 国模视频一区二区| 欧美丝袜高跟鞋一区二区| 一级成人a毛片免费播放| 中国一级特黄视频| 亚洲男人的天堂在线观看| 手机精品福利在线观看| 四虎成人免费毛片| 午夜丁香婷婷| 2024av在线无码中文最新| 亚洲AV无码久久精品色欲| 国产探花在线视频| 天天做天天爱夜夜爽毛片毛片| 国产91无码福利在线| 亚洲国产中文精品va在线播放| 免费一级成人毛片| 国产成人永久免费视频| 午夜人性色福利无码视频在线观看| 美女无遮挡拍拍拍免费视频| 亚洲精选高清无码| 伊人激情综合| 色久综合在线| 亚洲精品综合一二三区在线| 国产制服丝袜91在线| 国产成人无码Av在线播放无广告| 亚洲成a人片在线观看88| 亚洲va视频| 在线观看91精品国产剧情免费| 免费看一级毛片波多结衣| 伊人久综合| 国产精品页| 女人一级毛片| 91青青草视频| 亚洲香蕉在线| 色婷婷在线播放| 免费在线色| 久操中文在线| 亚洲高清在线天堂精品| 天天综合网色| 亚洲综合一区国产精品|