999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

DNA 4mC 甲基化修飾位點預測的研究進展

2020-06-30 02:48:14許召春劉華軍
科學技術創(chuàng)新 2020年17期
關鍵詞:物種特征模型

許召春 劉華軍

(景德鎮(zhèn)陶瓷大學信息工程學院,江西 景德鎮(zhèn)333403)

最常見的DNA 甲基化修飾分別是N6- 甲基腺嘌呤(6mA)、5- 甲基腺嘌呤(5mC)、N4- 甲基胞嘧啶(4mC)。DNA 6mA 和5mC 位點廣泛存在于原核生物和真核生物中,而DNA 4mC 位點只存在于原核生物中[1]。4mC 于1983 年被發(fā)現(xiàn),是細菌DNA中最不常見的甲基化DNA 堿基[2]。DNA 4mC 在限制性修飾體系中起著重要作用[3]。為了更好地理解它們的功能機制,識別4mc修飾是非常重要的。DNA 4mC 位點的實驗篩選是耗時、費力和昂貴的。因此,開發(fā)生物信息學工具大規(guī)模準確高效地識別4mC 位點是濕實驗的有效補充。近年來研究者們基于機器學習方法研發(fā)了一系列高效的4mC 位點高通量識別方法,本文就4mC 位點預測研究進行綜述,并對此提出展望。

1 現(xiàn)有4mC 預測器

1.1 iDNA4mC

iDNA4mC[4]是最早由陳偉與林昊兩個團隊利用機器學習方法共同提出的預測4mC 修飾位點的預測工具。含4mC 位點的陽性樣本是從MethSMRT 數(shù)據(jù)庫中獲取,涉及線蟲、果蠅、擬南芥、大腸桿菌、嗜堿菌和地桿菌六個物種,最終采用滑窗法(最優(yōu)窗口長度為41bp)構(gòu)建了高質(zhì)量的平衡數(shù)據(jù)集(表1)。

表1 基準數(shù)據(jù)集物種正樣本及負樣本數(shù)量分布

DNA 樣本序列由核苷酸物理化學屬性和核苷酸密度進行編碼,每個核苷酸被轉(zhuǎn)化為4 維離散型向量,采用支持向量機作為分類器,在六種物種數(shù)據(jù)上執(zhí)行jackknife 交叉驗證,主要的性能評價指標ACC 與MCC 值見表2。

1.2 4mCPred

4mCPred[5]預測器是由鄒權(quán)團隊開發(fā),沿用了iDNA4mC 預測器的訓練樣本數(shù)據(jù),為了充分提取基準數(shù)據(jù)集中的信息,利用三核苷酸的位置特異性偏好和電子- 離子相互作用的偽電位值將DNA 序列轉(zhuǎn)化為數(shù)值向量。為了獲得更好的泛化預測模型,采用最優(yōu)特征選擇技術(F-score)來選擇最優(yōu)特征子集。作者嘗試了不同的分類算法,包括樸素貝葉斯、KNN、隨機森林及SVM,最終基于SVM構(gòu)建了具有更好性能的分類模型,jackknife交叉驗證結(jié)果見表2,結(jié)果表明,相比于iDNA4mC 預測器,4mCPred 預測器的整體性能有一定程度提高。

表2 六種物種數(shù)據(jù)集上各類預測器交叉驗證結(jié)果

1.3 4mcPred-SVM

在前兩個預測器的基礎上,鄒權(quán)團隊充分利用基于序列信息的特征表示算法提出了新的預測器4mcPred-SVM[6],用于DNA 4mC 位點的全基因組檢測。為了提高特征表示能力,作者采用了兩步特征優(yōu)化策略,從而獲得最具代表性的特征。利用所得到的特征和支持向量機(SVM)自適應地訓練不同物種的最優(yōu)模型,結(jié)果詳見表2。對6 個物種的基準數(shù)據(jù)集的比較結(jié)果表明,與最先進的預測器相比,預測器4mcPred-SVM 能夠在預測4mC 位點方面獲得更好的性能。重要的是,基于序列的特征能夠可靠而穩(wěn)健地預測4mC 位點,有助于發(fā)現(xiàn)潛在的重要序列特征,用于預測4mC 位點。

1.4 Meta-4mCpred

Manavalan 等人[7]采用了一種特征表示學習方案,基于4 種不同的機器學習算法和7 種不同的特征編碼,生成了56 個概率特征,涵蓋了不同的序列信息,包括成分信息、物理化學信息和位置特定信息。然后,利用概率特征作為支持向量機的輸入,最終建立Meta-4mCpred 預測器。交叉驗證結(jié)果表明來自上述6 個不同的物種的Meta-4mCpred 的總體平均準確率為84.2%,這比現(xiàn)存最好的預測器高出大約2%-4%(見表2)。

1.5 4mCCNN

KHANAL 等人[8]基于上述六種物種的相同基準數(shù)據(jù)集,采用較為流行的one-hot 編碼,利用卷積神經(jīng)網(wǎng)絡開發(fā)了4mCCNN預測模型。性能最好的超參數(shù)是通過使用網(wǎng)格搜索方法獲得,交叉驗證結(jié)果顯示,4mCCNN 預測器性能相比前幾個預測器更加良好(見表2),這也意味著深度學習算法在特征表征方面更具優(yōu)勢。

1.6 4mCpred-EL

雖然基于機器學習方法在其他物種中有很好的4mC 鑒定前景,但是目前還沒有一種方法可以用于檢測小鼠基因組中的4mC 位點。Manavalan[9]提出了一種新計算方法,稱為4mCpred-EL,是識別小鼠基因組中4mC 位點的第一個方法,其中使用了四種不同的機器學習算法和七個特征編碼方法。然后將這些特征編碼的預測概率值作為特征向量,再一次輸入到機器學習算法中,將相應的模型通過集成學習進行融合決策,結(jié)果見表3。

表3 其他物種基準數(shù)據(jù)集上預測器性能

1.7 iEC4mC-SVM

雖然上述基于機器學習的DNA 4mC 位點的預測器總體性能較好,能提供研究者對4mC 修飾的生物學功能和機制更深入的了解,但是,現(xiàn)有的識別大腸桿菌4mC 位點的分類器性能仍然有待提高。為此,一種新的基于SVM的4mC 位點預測模型iEC4mC-SVM被LV 等人提出,該模型采用多特征融合,并結(jié)合光梯度增強機特征選擇技術(LGBM)選擇最優(yōu)特征子集,結(jié)果比最新的大腸桿菌性能更高,具體度量值見表3。

1.8 i4mC-ROSE

MehediHasan 提出了一種新的預測因子i4mC-ROSE,用于確定薔薇科中F. vesca 和R. chinensis 基因組中的4mC 位點。首先,利用隨機森林(RF)算法分別聯(lián)合k- 空間光譜核苷酸組成(KSNC)、電子- 離子相互作用偽電位(EIIP)、k-mer 組成(Kmer)、二進制編碼(BE)、二核苷酸理化性質(zhì)(DPCP)和三核苷酸理化性質(zhì)(TPCP)特征表示方法,生成六個概率分值。其次,將六種概率得分與線性回歸模型相結(jié)合,提高預測性能。文獻表明,i4mC-ROSE 是第一個預測薔薇科基因組中4mC 位點的計算工具。

為了方便廣大研究學者進行DNA 4mC 修飾位點預測分析,除了iEC4mC-SVM 預測器沒有在線預測功能,基本每個研究團隊都開發(fā)了用戶友好的在線預測器,用戶可通過表4 所提供的鏈接直接免費訪問在線預測器。

表4 在線預測器訪問鏈接

2 展望

最近幾年,DNA 4mC 修飾位點預測方面已做了大量的研究工作,并取得了相當不錯的成績,但是仍然存在一些局限性,主要體現(xiàn)在以下幾個方面。首先,用于模型構(gòu)建的訓練樣本沒有更新,大多數(shù)預測器仍然是基于首套數(shù)據(jù)而構(gòu)建。其次,所采用的分類算法大體還是以傳統(tǒng)分類算法SVM為主,只有4mCCNN采用了深度學習中的卷積神經(jīng)網(wǎng)絡CNN。再者,從預測結(jié)果上看,預測結(jié)果還有一定的提升空間。未來這方面的工作可圍繞著這些問題開展,擴大數(shù)據(jù)集規(guī)模,增加物種數(shù)量,創(chuàng)建新的特征表示方法,利用深度學習算法進一步提高4mC 位點預測精度,以更好地理解4mC 位點的功能機制。

猜你喜歡
物種特征模型
一半模型
吃光入侵物種真的是解決之道嗎?
英語世界(2023年10期)2023-11-17 09:18:18
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
回首2018,這些新物種值得關注
電咖再造新物種
汽車觀察(2018年10期)2018-11-06 07:05:26
抓住特征巧觀察
3D打印中的模型分割與打包
主站蜘蛛池模板: 高h视频在线| 国产福利一区二区在线观看| 福利片91| 狼友视频国产精品首页| 成人年鲁鲁在线观看视频| 久久久久九九精品影院 | 色老头综合网| 亚洲第一成年人网站| 欧类av怡春院| 国产免费人成视频网| 极品av一区二区| 国产精品自在在线午夜| av在线无码浏览| 中国国产A一级毛片| 国产一级裸网站| 国产成年女人特黄特色大片免费| 香蕉视频国产精品人| 免费三A级毛片视频| 国产97视频在线| 99久久精品国产自免费| 免费看美女自慰的网站| 色妞www精品视频一级下载| 国产91全国探花系列在线播放| 又黄又湿又爽的视频| 成人噜噜噜视频在线观看| 午夜无码一区二区三区在线app| 国产成人1024精品下载| aⅴ免费在线观看| 色婷婷丁香| 成人福利在线观看| 久久免费视频6| 日本精品一在线观看视频| 午夜影院a级片| 午夜啪啪福利| 欧日韩在线不卡视频| 丰满人妻久久中文字幕| 狠狠色丁香婷婷综合| 欧美成人A视频| 超清无码熟妇人妻AV在线绿巨人| 午夜三级在线| 亚洲水蜜桃久久综合网站 | 自拍偷拍欧美| 国产XXXX做受性欧美88| 国产va在线| jizz在线免费播放| 在线看片免费人成视久网下载| 看国产一级毛片| 亚洲免费福利视频| 少妇露出福利视频| 欧洲日本亚洲中文字幕| 91青青视频| 成人在线不卡| 乱系列中文字幕在线视频 | 国产91精选在线观看| 91亚洲精品第一| 青青草原国产免费av观看| 日本精品αv中文字幕| 欧美啪啪视频免码| 免费国产高清视频| 亚洲精品无码高潮喷水A| 欧美激情视频二区三区| 亚洲综合一区国产精品| 都市激情亚洲综合久久| 国产极品美女在线观看| 国产美女在线免费观看| 欧美中出一区二区| 国产va欧美va在线观看| 九月婷婷亚洲综合在线| 国产区网址| 国产一级二级三级毛片| 性色生活片在线观看| 久久青草视频| 亚洲日韩精品伊甸| 亚洲欧洲日本在线| 国产在线观看精品| 日本午夜三级| 久久久亚洲色| 五月婷婷激情四射| 91色国产在线| 偷拍久久网| 久久精品人人做人人爽电影蜜月| 日韩精品高清自在线|