999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

染色體三維結構的預測方法研究

2018-12-13 01:56:50牟錦郭亞茹黃月月劉珂
科技創(chuàng)新與應用 2018年29期

牟錦 郭亞茹 黃月月 劉珂

摘 要:目前基因組學領域中染色體三維結構重建是熱點研究問題。已有相關文獻表明,基因組的DNA突變、復制、胚胎的發(fā)育和轉錄長鏈非編碼RNA的傳播等跟染色質(zhì)的三維結構有著密切的關聯(lián)。Hi-C實驗提供基因組位點之間的接觸頻率的全基因組圖譜,推測反映其染色體的平均空間組織。文中通過在Hi-C數(shù)據(jù)基礎上對染色體三維結構重建的相關文獻進行分析,總結了目前重建染色體三維空間結構的經(jīng)典算法原理和性能,以期能更深入地研究染色體三維結構重建算法,并系統(tǒng)的掌握三維染色體空間結構預測算法的發(fā)展方向。

關鍵詞:染色體三維結構重建;Hi-C數(shù)據(jù)集;算法分析

中圖分類號:Q343.2 文獻標志碼:A 文章編號:2095-2945(2018)29-0004-03

Abstract: At present, the three-dimensional structure reconstruction of chromosome is a hot research issue in the field of genomics. It has been shown that genomic DNA mutation, replication, embryonic development and transmission of long strand noncoding RNA are closely related to the three-dimensional structure of chromatin. The Hi-C experiment provides a genome-wide map of the contact frequency between genomic sites, presumably reflecting the average spatial organization of its chromosomes. In this paper, based on the analysis of the related literatures on chromosome 3D structure reconstruction based on Hi-C data, the principle and performance of the classical algorithms for chromosome 3D structure reconstruction are summarized. With a view to more in-depth study of chromosome three-dimensional structure reconstruction algorithm, and systematically grasp the development direction of three-dimensional chromosome space structure prediction algorithm.

Keywords: three-dimensional (3D) chromosome structure reconstruction; Hi-C data set; algorithm analysis

引言

重建染色體三維結構即是通過染色質(zhì)的二維交互頻率數(shù)據(jù)來預測其三維空間的結構。已有相關文獻表明,基因組的表達,調(diào)控及DNA突變、復制、胚胎的發(fā)育和轉錄長鏈非編碼RNA的傳播以及維護基因組穩(wěn)定性等跟染色質(zhì)的三維結構有著密切的關聯(lián)[1-6]。目前通過Hi-C技術[7],能高通量地獲取多個物種的全基因組的交互作用信息,再對生成的二維接觸矩陣[8]進行處理,并用于預測染色體的三維結構[9]。目前的預測算法可根據(jù)模型原理不同分為概率約束和距離約束[10]兩類。這些預測模型算法有助于人們對染色體三維折疊空間結構有更清晰的認識,也為了解其調(diào)控以及對基因組穩(wěn)定性功能和解析相關的生物過程提供了理論結構依據(jù)。

1 染色體三維結構重建的經(jīng)典算法原理

1.1 ShRec3D算法原理

ShRec3D算法是一種距離約束優(yōu)化模型算法,它通過兩步來建立預測模型。首先將接觸頻率歸一化并轉換為空間距離信息,然后用Shortest distance algorithm[11]重新分配片段間的空間距離并填充距離矩陣中的缺失值,調(diào)整對應的不同接觸頻率的距離權重,將Multidimensional Scaling算法與ShRec3D相結合來可以有效地重建染色體三維模型[12],減少時間復雜度,避免了算法在迭代優(yōu)化過程中遇到的局部收斂問題,在稀疏和噪聲的接觸映射問題中有較強的適用性。

1.2 Chrome SDE算法原理

Chrome SDE(Chromosome semi-definite embedding)也是一種距離約束模型算法。采用semi-define programming約束將空間距離矩陣信息轉化為染色體片段的三維空間坐標矩陣信息。從理論上證明了semi-define programming[13]算法能夠無噪聲地唯一恢復三維空間結構。在Chrome SDE中,將變參數(shù)引入到接觸頻率與空間距離轉換函數(shù)中[14],并采用黃金分割算法在一定區(qū)域中尋找最優(yōu)轉換參數(shù)。黃金分割算法除要求函數(shù)是單峰外再無限制,因此它有廣泛的應用。

1.3 基于變參數(shù)流形優(yōu)化方法VMBO原理

變參數(shù)流行優(yōu)化方法(variable parameter manifold based optimization, VMBO)是在基于流形的優(yōu)化(manifold based optimization, MBO)基礎上引入指數(shù)可變的轉換函數(shù)得到的,通過Euclidean distance matrix的低秩特征并利用距離冗余推斷出矩陣中缺失的距離值[15]。再將最短路徑距離與權重相結合,在優(yōu)化過程中對估算的距離(即較長的距離)取較小的加權值,以這種形式解決極小化問題,該方法在三維結構重建中的權值可以取任意非負值(不僅僅是0和1)[16],使得VMBO算法可以預測不同分辨率下的數(shù)據(jù)集的結構。

2 算法比較

李更建等將VMBO算法與Chrome SDE和ShRec3D對老鼠胚胎干細胞(mouse embryonic stem cells, mESC)細胞系和GM06990細胞系做了實驗預測并通過斯皮爾曼相關系數(shù)(即distance spearman correlation coefficient, dSCC數(shù)值越接近1性能越好)進行比較:對于老鼠胚胎干細胞(mouse embryonic stem cells, mESC)細胞系,VMBO算法dSCC數(shù)值為0.988相對于ShRec3D算法的0.982和Chrome SDE算法的0.974都高,這些數(shù)值都很高說明三種算法的預測性能都很好。而對于GM-HicNorm數(shù)據(jù)集,VMBO算法的dSCC為0.874優(yōu)于ShRec3D算法的0.836卻低于Chrome SDE算法的0.952[17]。因此VMBO算法對于GM細胞系的結構預測性能優(yōu)于ShRec3D方法,但是低于Chrome SDE方法。兩個數(shù)據(jù)集中Chrome SDE方法的平均dSCC數(shù)值都大于ShRec3D,因此總的來說,Chrome SDE比ShRec3D方法預測性能更好,而Chrome SDE對GM細胞系的預測性能最好。

3 結合幾種經(jīng)典方法提出新的方法

在Chrome SDE算法中,輸入不一樣的細胞系或不同分辨率的Hi-C數(shù)據(jù)時通過接觸頻率轉化為相對應的空間距離值的轉換函數(shù)中的參數(shù)是變化的,再用semi-define programming方法準確的定位每個染色體片段所在的三維空間坐標;而ShRec3D方法用了Shortest-distance算法,在距離矩陣中填補了空缺的元素值,調(diào)整染色體片段間的空間距離,并增加接觸頻率值高的染色體片段的權重值,卻不能對不同的Hi-C數(shù)據(jù)對轉化參數(shù)進行變化調(diào)整,降低了ShRec3D算法的適用性,因此將Chrome SDE方法的這一優(yōu)點與ShRec3D算法相結合提出一種隨不同Hi-C數(shù)據(jù)變化函數(shù)參數(shù)的算法,即ShRec3D+算法,再通過黃金分割算法迭代得到最優(yōu)參數(shù)值。接觸距離矩陣轉化為空間距離矩陣的函數(shù)[18]為Dijt=Fij-?琢,F(xiàn)ij>0∞,otherwise,經(jīng)過實驗分析后得出參數(shù)值取?琢∈(0,1.2)最佳[16]。

3.1 算法流程

ShRec3D+算法的流程見圖1所示。

其中函數(shù)error(F,?琢)的計算過程如下:已知某個?琢值,利用(1/F)?琢求出D,再使用Multidimensional Scaling方法將D轉化成X,基于X計算出任意片段的歐氏距離D',再根據(jù)(1-D')?琢算出F',再計算|Fij'-Fij|。

3.2 性能比較

3.2.1 準確性比較。張衛(wèi)等對有噪聲的Helix結構數(shù)據(jù)集進行了實驗模擬,設置轉換參數(shù)為1.0,而采用點數(shù)為100。實驗得出在小于0.3的噪聲值時,Chrome SDE、ShRec3D和ShRec3D+算法都能有效的構造Helix模擬結構[16],并且Chrome SDE的預測性能要比ShRec3D+算法的性能好,能在無噪音下準確預測三維空間結構折疊情況。在Multidimensional Scaling計算過程中,轉化為其對應的坐標值時,只取了最大的三個特征值和相應的特征向量,致使ShRec3D+無法預測出唯一的三維結構。但在噪聲增強的情況下,ShRec3D+算法比Chrome SDE算法的預測性能要好。這兩種算法都需要迭代尋找最佳的轉換參數(shù),因此可以對兩者的建模效率進行比較。然而在大規(guī)模的問題中,ShRec3D+算法比Chrome SDE算法效率要高,semi-define programming算法在理論上計算時間復雜度較高,因此不適宜處理大規(guī)模數(shù)據(jù)問題。

張衛(wèi)等將Chrome SDE算法中可變參數(shù)的思想用在ShRec3D算法上提出了ShRec3D+算法。并針對Hi-C數(shù)據(jù)集,使用ShRec3D+算法對染色體三維結構進行了實驗預測。

實驗得出,ShRec3D+算法在mESC細胞系中dSCC為0.994較Chrome SDE的Dscc0.974和ShRec3D中的0.982都要高一點,雖三種方法都能有較好的預測性能,但ShRec3D+算法的結構預測效果要更好一些,然而在GM細胞系數(shù)據(jù)中,Chrome SDE算法的dSCC值為0.857比ShRec3D算法的0.687和ShRec3D+算法的0.789都高,其預測性能是最好的[16]。

3.2.2 時間性能比較。從張衛(wèi)等的實驗結果得出在1MB分辨率下的mESC細胞系Hind3和NcoI兩種限制性內(nèi)切酶作用下的Hi-C數(shù)據(jù)集中,ShRec3D+算法所花的時間分別為627s和639s,Chrome SDE方法卻需要4528s和4485s,而ShRec3D算法所需時間僅為105s和109s。ShRec3D+算法的效率遠遠高于Chrome SDE算法,卻不及ShRec3D算法效率高。在GM細胞系Hind3和NcoI兩種限制性內(nèi)切酶作用下的Hi-C數(shù)據(jù)集中,ShRec3D+算法所需的時間為569s和697s,Chrome SDE方法卻需要4286s和4218s,而ShRec3D算法所需時間僅為64s和66s[16]。其原因是由于semi-define programming算法效率低下,不能直接求解大規(guī)模問題,但ShRec3D算法不需要迭代參數(shù)進行優(yōu)化,效率則高于ShRec3D+算法。

4 結束語

該綜述對染色體三維結構重建的經(jīng)典距離算法模型的原理進行了總結介紹,并對Hi-C數(shù)據(jù)集下方法的預測性能進行了討論。將幾種方法取長補短提出了一種新的預測方法,并對預測性能結果進行討論。使我們能更準確系統(tǒng)的掌握染色體三維結構重建問題的發(fā)展方向。為后期染色體三維結構重建研究方向奠定了理論基礎,有利于進一步深入學習和探討。

參考文獻:

[1]陶婧芬,謝婷,鄭覺非,等.基于染色質(zhì)交互數(shù)據(jù)的基因組組裝方法[J].生物技術通報,2015,31(11):43-50.

[2]Misteli T. Spatial positioning; a new dimension in genome function [J]. Cell, 2004,119(2):153-156.

[3]Frederick W. Alt, Zhang Y, Meng F L, et al. Mechanisms of Programmed DNA Lesions and Genomic Instability in the Immune System[J]. Cell, 2013, 152(3):417-429.

[4]Fraser P, Bickmore W. Nuclear organization of the genome and the potential for gene regulation.[J]. Nature,2007,447(7143):413-417.

[5]Miele A, Dekker J. Long-range chromosomal interactions and gene regulation. [J]. Molecular Biosystems, 2008,4(11):1046-1057.

[6]Dekker J. Gene Regulation in the Third Dimension.[J]. Science, 2008,319(5871):1793-1794.

[7]Reza Kalhor, Haritanto Tjong, et al, Genome Architectures Revealed by Tethered Chromosome Conformation Capture and Population-based Modeling. [J]. Nature Biotechnology, 2012,30:90-98.

[8]胡文橋,侯越,張峰,等.染色質(zhì)構象解析技術——Hi-C及染色質(zhì)構象信息提取[J].基因組學與應用生物學,2015,34(11):002319-2327.

[9]彭城,李國亮,張紅雨,等.染色質(zhì)三維結構重建及其生物學意義[J].中國科學:生命科學,2014(8):794-802.

[10]SERRA F, DI STEFANO M, SPILL Y G, et al. Restraint based three-dimensional modeling of genomes and genomic

domains. [J]. FEBS Letter, 2015,20(589):2987-2995.

[11]項榮武,劉艷杰,胡忠盛.圖論中最短路徑問題的解法[J].沈陽航空工業(yè)大學學報,2004,21(2):86-88.

[12]Buja A, Swayne D F, Littman M L, et al. XGvis: Interactive Data Visualization with Multidimensional Scaling[J]. Journal of

Computational & Graphical Statistics, 2001,17(2):444-472.

[13]Leung, N., and Toh, K. An SDP-based Divide-and-Conquer Algorithm for Large-Scale Noisy Anchor-Free Graph Realization[J]. SIAM Journal on Scientific Computing, 2009,31:4351-4372.

[14]Lesne A, Riposo J, Roger P, et al. 3D genome reconstruction from chromosomal contacts[J].Nature Methods,2014,11(11):1141.

[15]Paulsen J, Gramstad O, Collas P. Manifold Based Optimization for Single-Cell 3D Genome Reconstruction [J]. Plos Computational Biology, 2015,11(8):e1004396.

[16]張衛(wèi).基于Hi-C數(shù)據(jù)的預測染色體三維結構的方法研究[D].北京工業(yè)大學,2016.

[17]李建更,張衛(wèi),李曉丹.基于參數(shù)優(yōu)化的染色體三維結構預測算法VMBO[J].北京工業(yè)大學學報,2018,44(2):207-214.

[18]Zhang Z, Li G, Toh K C, et al. 3D chromosome modeling with semi-definite programming and Hi-C data[J]. Journal of Computational Biology A Journal of Computational Molecular Cell Biology,2013,20(11):831.

主站蜘蛛池模板: 99视频在线精品免费观看6| 666精品国产精品亚洲| 黄色网页在线播放| 亚洲欧美另类久久久精品播放的| 国产精品lululu在线观看| 奇米影视狠狠精品7777| 国产91视频免费观看| 91亚洲视频下载| 国产丝袜丝视频在线观看| 亚洲日韩AV无码精品| 亚洲视频免| 国产欧美精品一区二区| 孕妇高潮太爽了在线观看免费| 国产一级毛片yw| 亚洲国产日韩在线观看| 国产精鲁鲁网在线视频| 亚洲bt欧美bt精品| 国产乱子伦手机在线| 91久久大香线蕉| 亚洲中文字幕国产av| 第一区免费在线观看| 日韩最新中文字幕| 77777亚洲午夜久久多人| 手机精品视频在线观看免费| 久久鸭综合久久国产| 国产主播在线一区| 国内精品一区二区在线观看| 狠狠色综合网| 亚洲精品福利网站| 亚洲,国产,日韩,综合一区| 国产精品美人久久久久久AV| 欧美a在线视频| 日韩中文精品亚洲第三区| 特级做a爰片毛片免费69| 在线观看亚洲精品福利片| 亚洲va精品中文字幕| 欧美精品色视频| 亚洲国产精品日韩欧美一区| 国产成人精品2021欧美日韩| AV天堂资源福利在线观看| 91亚洲精选| 一级高清毛片免费a级高清毛片| 久久综合丝袜日本网| 国产xxxxx免费视频| 丁香综合在线| 欧美97色| 无码精品国产dvd在线观看9久| 色婷婷亚洲综合五月| 国产男女免费视频| 久久一色本道亚洲| 97超爽成人免费视频在线播放| 精品久久香蕉国产线看观看gif| 91香蕉国产亚洲一二三区| 国产成人欧美| 天天摸天天操免费播放小视频| 天天综合色天天综合网| 三上悠亚在线精品二区| 日韩精品毛片人妻AV不卡| 天天色综合4| a级毛片免费在线观看| 欧美第一页在线| 亚洲精品爱草草视频在线| 波多野结衣第一页| 欧美在线中文字幕| 视频二区中文无码| 毛片免费高清免费| 久久一日本道色综合久久| 在线观看免费国产| 国产精品夜夜嗨视频免费视频| 国产在线观看91精品| 一本色道久久88| 再看日本中文字幕在线观看| 精品少妇人妻av无码久久| 日韩欧美成人高清在线观看| 亚洲日本在线免费观看| 免费午夜无码18禁无码影院| 国产欧美日韩综合在线第一| 成人小视频网| 91在线视频福利| 国产福利影院在线观看| 欧美一级高清片久久99| 久久综合伊人77777|