999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于DCIO-DNN和遷移學(xué)習(xí)的基因表達(dá)回歸預(yù)測(cè)模型

2021-01-15 08:30:34薛艷鋒高永強(qiáng)
關(guān)鍵詞:深度實(shí)驗(yàn)模型

薛艷鋒 李 春 高永強(qiáng)

1(山西大學(xué)復(fù)雜系統(tǒng)研究所 山西 太原 030006) 2(呂梁學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)系 山西 呂梁 033000) 3(太原理工大學(xué)信息與計(jì)算機(jī)學(xué)院 山西 太原 030024)

0 引 言

基因表達(dá)譜數(shù)據(jù)可被用于基因功能預(yù)測(cè)、作物優(yōu)化、疾病相關(guān)基因發(fā)現(xiàn)和藥物篩選等[1-4],但獲取過(guò)程繁雜、成本極高,難以開(kāi)展大規(guī)模全基因組表達(dá)譜分析。人類(lèi)基因組中包含約2萬(wàn)到2.5萬(wàn)個(gè)基因,利用表達(dá)之間的關(guān)聯(lián)性,可確定調(diào)節(jié)因子和target基因構(gòu)建基因調(diào)控網(wǎng)絡(luò)[5]。由于大約有1 000個(gè)基因擁有80%CMap 數(shù)據(jù)的信息,所以測(cè)量這1 000個(gè)基因(命名為landmark基因)的表達(dá)譜可以預(yù)測(cè)剩余基因(命名為target基因)的表達(dá)[6]。文獻(xiàn)[6]采用線性回歸(LR)預(yù)測(cè)模型,雖然LR具有極高的泛化性能,但無(wú)法建模landmark和target基因之間固有的非線性關(guān)系[7]。核函數(shù)方法已被應(yīng)用于非線性模型的構(gòu)建中[8],然而隨著數(shù)據(jù)維度升高及數(shù)據(jù)增加,其泛化性能急劇下降。

深度神經(jīng)網(wǎng)絡(luò)可以建模非線性關(guān)系[9]。Peng等[10]在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上增加了輸入層與輸出層的直接連接建模了兩者之間的線性和非線性映射關(guān)系。Pao等[11]在輸入層與輸出層之間增加隨機(jī)向量可迭代獲得最優(yōu)解。

基于此,本文首先提出一種基于直連輸入輸出的深度神經(jīng)網(wǎng)絡(luò)和遷移學(xué)習(xí)的基因表達(dá)回歸預(yù)測(cè)模型——直連輸入輸出的深度神經(jīng)網(wǎng)絡(luò)基因預(yù)測(cè)模型(Direct Connect Input and Output-Deep Neural Network Gene predict Model,DCIO-DNN_GM),直連輸入輸出的具體含義為在經(jīng)典神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu)上,輸入層與輸出層之間有連邊連接。該模型可同時(shí)建模landmark和target基因的線性和非線性映射關(guān)系,利用遷移學(xué)習(xí)和正則化技術(shù)在GTEx小數(shù)據(jù)集上訓(xùn)練模型,并驗(yàn)證和比較DCIO-DNN_GM模型的跨平臺(tái)預(yù)測(cè)能力。最后以多指標(biāo)、多角度分析不同模型的預(yù)測(cè)效果;結(jié)果表明:DCIO-DNN_GM模型的各項(xiàng)指標(biāo)更高。

1 相關(guān)工作

1.1 深度神經(jīng)網(wǎng)絡(luò)

深度神經(jīng)網(wǎng)絡(luò)(DNN)的層與層之間是全連接的,第k層第j個(gè)神經(jīng)元的計(jì)算公式為:

(1)

1.2 遷移學(xué)習(xí)策略

遷移學(xué)習(xí)[12-13]的思想是為任務(wù)A開(kāi)發(fā)的模型MA被重用為任務(wù)B模型的起點(diǎn),具體在深度學(xué)習(xí)中,固定模型MA前面部分權(quán)重或參數(shù)再利用任務(wù)B的數(shù)據(jù)繼續(xù)訓(xùn)練,其核心是找到任務(wù)A與B的相似性或某種映射關(guān)系[14]。

2 模型設(shè)計(jì)

2.1 基因表達(dá)譜數(shù)據(jù)預(yù)處理

Gene Expression Omnibus(GEO)數(shù)據(jù)集[15]和Genotype-Tissue Expression(GTEx)數(shù)據(jù)集[16]來(lái)自不同的平臺(tái),如表1所示,且兩平臺(tái)測(cè)量的單位及量綱不同,因此調(diào)用Python庫(kù)Sklearn[17]的MinMaxScaler方法進(jìn)行數(shù)據(jù)歸一化預(yù)處理,進(jìn)而達(dá)到相同的表達(dá)水平。

表1 數(shù)據(jù)集信息

2.2 基因表達(dá)回歸模型構(gòu)建

傳統(tǒng)的DNN網(wǎng)絡(luò)模型包括輸入層、輸出層和若干隱藏層,其中輸入層的節(jié)點(diǎn)取決于數(shù)據(jù)的特征個(gè)數(shù),輸出層的節(jié)點(diǎn)取決于問(wèn)題本身,隱藏層通過(guò)調(diào)整權(quán)重實(shí)現(xiàn)特征數(shù)據(jù)到標(biāo)簽數(shù)據(jù)的逼近。本文提出的DCIO-DNN_GM模型,如圖1所示。其輸出層的結(jié)果不但經(jīng)過(guò)了隱藏層的非線性映射,而且融入了輸入層的線性組合。所以DCIO-DNN_GM可以建模輸入數(shù)據(jù)與輸出數(shù)據(jù)的線性和非線性映射。

圖1 DCIO-DNN_GM的網(wǎng)絡(luò)結(jié)構(gòu)

DCIO-DNN_GM模型的學(xué)習(xí)過(guò)程為隱含層的輸出C和輸出層的輸出O:

C=f(∑W1X+α)

(2)

O=∑W3X+∑W2C+γ

(3)

式中:f表示隱藏層的雙曲正切激活函數(shù);W1表示隱藏層與輸入層的權(quán)重;X表示輸入數(shù)據(jù);α表示隱藏層的偏置向量;W3表示輸入層與輸出層權(quán)重(圖1中虛線部分);W2表示輸出層與隱藏層權(quán)重;γ表示輸出層的偏置向量。

3 實(shí) 驗(yàn)

3.1 實(shí)驗(yàn)環(huán)境與誤差衡量

本文所有實(shí)驗(yàn)都采用損失函數(shù)為均方誤差(MSE),性能指標(biāo)包括平均絕對(duì)值誤差(MAE)、歸一化均方根誤差(NRMSE)以及決定系數(shù)(R2),計(jì)算公式分別如下:

(4)

(5)

(6)

(7)

3.2 實(shí)驗(yàn)結(jié)果與分析

本文實(shí)驗(yàn)分別對(duì)應(yīng)線性模型(LR)、傳統(tǒng)深度神經(jīng)網(wǎng)絡(luò)模型(D-GM)、本文模型(DCIO-DNN_GM)在誤差性能、跨平臺(tái)預(yù)測(cè)能力和擬合效果三方面的對(duì)比分析。

實(shí)驗(yàn)一:對(duì)比LR、D-GM和DCIO-DNN_GM在GEO數(shù)據(jù)上的MAE和NRMSE,結(jié)果如表2所示。本文模型不同參數(shù)組在GEO驗(yàn)證集的誤差如表3所示。

表2 不同回歸模型在GEO驗(yàn)證集的誤差

表3 DCIO-DNN_GM模型不同參數(shù)組在GEO驗(yàn)證集的誤差

“±”后的值是所有target基因MAE的標(biāo)準(zhǔn)偏差。如表2所示,LR模型分別采用L1和L2正則化技術(shù),D-GM和DCIO-DNN_GM模型采用Dropout技術(shù)且參數(shù)配置相同(只包含一層隱藏層)。如表3所示,依據(jù)MAE和NRMSE最小的原則,選擇神經(jīng)元數(shù)量與Dropout率的最優(yōu)組合進(jìn)行后續(xù)比較分析,結(jié)果如表4所示。

表4 不同回歸預(yù)測(cè)模型在GEO測(cè)試集上的實(shí)驗(yàn)誤差

由表4可知,相比于LR-L1和D-GM,DCIO-DNN_GM在兩個(gè)指標(biāo)上都有所降低,提升了誤差性能。

實(shí)驗(yàn)二:采用遷移學(xué)習(xí)方法解決GTEx數(shù)據(jù)集小樣本(如表1所示)無(wú)法直接訓(xùn)練模型的難題。

表5給出了不同模型在GTEx測(cè)試集上的實(shí)驗(yàn)結(jié)果,其中LR-L1模型僅使用GTEx數(shù)據(jù)擬合,D-GM和DCIO-DNN_GM模型使用遷移學(xué)習(xí)技術(shù)。具體方法為:首先將GTEx數(shù)據(jù)分成GTEx訓(xùn)練集和GTEx測(cè)試集,在實(shí)驗(yàn)一的基礎(chǔ)上結(jié)合遷移學(xué)習(xí)的微調(diào)策略,將D-GM和DCIO-DNN_GM模型隱藏層的前兩層權(quán)重參數(shù)固定,然后使用GTEx訓(xùn)練集數(shù)據(jù)訓(xùn)練D-GM和DCIO-DNN_GM模型,最后使用GTEx測(cè)試集數(shù)據(jù)檢驗(yàn)不同模型在GTEx數(shù)據(jù)集上的預(yù)測(cè)能力。相比于LR-L1和D-GM,DCIO-DNN_GM在MAE指標(biāo)上有所降低,提升了跨平臺(tái)預(yù)測(cè)能力。

表5 不同模型在GTEx測(cè)試集數(shù)據(jù)上的實(shí)驗(yàn)誤差

綜上,本文提出的DCIO-DNN_GM模型誤差更小,可遷移性更高,通過(guò)5組GEO測(cè)試集中target基因表達(dá)值的真實(shí)值和預(yù)測(cè)值的箱線圖對(duì)比(如圖2所示),證明了DCIO-DNN_GM模型可以預(yù)測(cè)target基因表達(dá)值。

圖2 target基因真實(shí)表達(dá)值與預(yù)測(cè)表達(dá)值對(duì)比箱線圖

實(shí)驗(yàn)三:使用決定系數(shù)(R2)比較LR-L1、D-GM和DCIO-DNN_GM模型的擬合能力。

表6給出了三種回歸模型預(yù)測(cè)9 520個(gè)探針的target基因R2分布情況。由表6可知,在[0.8,1.0)區(qū)間內(nèi),DCIO-DNN_GM模型分別是LR-L1和D-GM模型的1.92倍和1.74倍。在[0,0.6) 區(qū)間內(nèi),LR-L1和D-GM模型分別是DCIO-DNN_GM模型的1.57倍和1.49倍。結(jié)果證明DCIO-DNN_GM擬合效果更好。

表6 決定系數(shù)R2分布情況

4 結(jié) 語(yǔ)

針對(duì)基因表達(dá)譜數(shù)據(jù)高維度、少樣本和非線性的現(xiàn)實(shí)問(wèn)題,本文提出DCIO-DNN模型并獲得更低的MAE和NRMSE,然后提出DCIO-DNN_GM解決了GTEx數(shù)據(jù)集小樣本無(wú)法訓(xùn)練的問(wèn)題。再通過(guò)箱線圖比較了該模型可以預(yù)測(cè)target基因表達(dá)值,最后通過(guò)R2分布區(qū)間說(shuō)明該模型的擬合數(shù)據(jù)能力更強(qiáng)。

然而該模型是數(shù)據(jù)驅(qū)動(dòng)建模,整個(gè)過(guò)程都是利用深度神經(jīng)網(wǎng)絡(luò)擬合數(shù)據(jù)的能力而未考慮基因表達(dá)本身的機(jī)理,結(jié)合基因表達(dá)本身的機(jī)理與神經(jīng)網(wǎng)絡(luò)擬合數(shù)據(jù)的能力建模是未來(lái)研究的方向。

猜你喜歡
深度實(shí)驗(yàn)模型
一半模型
記一次有趣的實(shí)驗(yàn)
深度理解一元一次方程
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
深度觀察
深度觀察
深度觀察
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产精品久久久久久久伊一| www.精品国产| 天天综合亚洲| 在线观看无码av免费不卡网站 | 欧美不卡视频一区发布| 欧美成人看片一区二区三区| 欧美一区日韩一区中文字幕页| 国产www网站| 92午夜福利影院一区二区三区| 国产一区亚洲一区| 一级毛片不卡片免费观看| 色播五月婷婷| 精品一区国产精品| 午夜视频免费一区二区在线看| 亚洲综合第一页| 婷婷激情五月网| 日韩一级毛一欧美一国产| 欧美国产中文| 婷婷综合色| 亚洲日韩在线满18点击进入| 精品欧美一区二区三区在线| 欧美日韩资源| 欧美性久久久久| 777国产精品永久免费观看| 亚洲无限乱码一二三四区| 色妞www精品视频一级下载| 国产高清不卡视频| 国产精品永久久久久| 91无码人妻精品一区二区蜜桃| 一本无码在线观看| 亚洲欧美日韩中文字幕一区二区三区 | 尤物精品国产福利网站| 熟女日韩精品2区| 国产69精品久久久久孕妇大杂乱 | 久久国产免费观看| 无码国产伊人| 91久久偷偷做嫩草影院免费看| 萌白酱国产一区二区| 91午夜福利在线观看精品| 国产网友愉拍精品| 香蕉网久久| 国产精品一线天| 午夜日b视频| 超清人妻系列无码专区| 97视频在线精品国自产拍| 国产精品自在在线午夜区app| 一本久道热中字伊人| 在线观看国产精美视频| 在线观看无码av免费不卡网站| 无码AV日韩一二三区| 色老二精品视频在线观看| 91精品国产情侣高潮露脸| 亚洲欧美综合精品久久成人网| 一本大道AV人久久综合| 亚洲天堂在线视频| 久久综合一个色综合网| 五月综合色婷婷| 漂亮人妻被中出中文字幕久久| 无码综合天天久久综合网| 福利片91| 强乱中文字幕在线播放不卡| 亚洲有无码中文网| 国产一区二区精品高清在线观看| 99在线国产| 亚洲综合经典在线一区二区| 久久国产香蕉| 亚洲天堂首页| 色久综合在线| 伊人激情综合网| 国产黑人在线| 26uuu国产精品视频| 色综合中文| 国产麻豆福利av在线播放 | 国产精品露脸视频| 台湾AV国片精品女同性| 日韩欧美国产中文| 欧美a级完整在线观看| 毛片在线播放a| 亚洲精品无码AⅤ片青青在线观看| 日韩二区三区| 亚洲看片网| 在线视频一区二区三区不卡|