999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于RNA—Seq數(shù)據(jù)識別外顯子跳躍事件的方法研究綜述

2016-05-03 02:46:06白楊王亞東
智能計算機與應(yīng)用 2016年2期

白楊 王亞東

摘 要:隨著高通量生物測序技術(shù)的產(chǎn)生及快速發(fā)展,從轉(zhuǎn)錄組高通量測序數(shù)據(jù)(RNA-Seq數(shù)據(jù))中準(zhǔn)確地識別選擇性剪接事件成為了當(dāng)前生物信息學(xué)研究的一個熱點課題。識別選擇性剪接事件對研究基因的功能、蛋白質(zhì)結(jié)構(gòu)的多樣性、細(xì)胞的分化、物種的進化、以及疾病的產(chǎn)生機制具有重要的意義。在人類基因組中最主要的選擇性剪接事件是外顯子跳躍事件(>40%)。本文綜述了基于RNA-Seq數(shù)據(jù)識別外顯子跳躍事件的識別方法,并對常用的識別方法進行了總結(jié)分析。

關(guān)鍵詞:選擇性剪接;RNA-Seq;外顯子跳躍事件

中圖分類號:TP391文獻標(biāo)識號:A文章編號:2095-2163(2016)01-

Areview of alternative splicing event detection from RNA-Seq data

BAI Yang, WANG Yadong

(School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)

Abstract: With the rapid development of next-generation sequencing technology, alternative splicing (AS) event detection from whole transcriptome shotgun sequencing (RNA-Seq) data is a popular research topic in biology. Identification AS events can help biologists to study to gene function, protein structure, cellular diversity, species evolution, and human disease. Exon skipping (ES) event is a major AS events in human genome (>40%).This paper reviews the methods onES events detection from RNA-Seq data, and provides an overview that could serve as an entry point for users who need to decide on a suitable tool for ES event detection.

Keywords: alternative splicing; RNA-Seq; exon skipping event

0 引言

隨著高通量測序技術(shù)在分子生物學(xué)、遺傳學(xué)、臨床醫(yī)學(xué)等研究領(lǐng)域中的廣泛應(yīng)用,特別是轉(zhuǎn)錄組高通量測序技術(shù)(RNA-Seq)在基因表達(dá)以及轉(zhuǎn)錄組表達(dá)上的全面運用,使得對應(yīng)的高通量的RNA-Seq數(shù)據(jù)越來越豐富。轉(zhuǎn)錄組高通量測序技術(shù)的發(fā)展,將從事選擇性剪接事件識別的研究者從低通量的生物學(xué)實驗中解放出來,進而轉(zhuǎn)到使用高通量的RNA-Seq數(shù)據(jù)來識別選擇性剪接事件。有別于傳統(tǒng)的實驗方法只能研究某一個基因的選擇性剪接情況,高通量的RNA-Seq數(shù)據(jù)是在全基因組范圍內(nèi)研究各個基因的選擇性剪接情況,因而具有定量準(zhǔn)確、可重復(fù)性高、檢測范圍廣、可靠性高等特點,使其更具有代表性和統(tǒng)計學(xué)意義。由此,利用已有的RNA-Seq數(shù)據(jù),快速、高效、準(zhǔn)確地通過計算手段識別選擇性剪接事件則已成為目前選擇性剪接識別研究的熱點問題。

選擇性剪接的模式主要有5種[1-4],包括:外顯子跳躍(Exon skipping)、選擇性5端(Alternative 5splice site)、選擇性3端(Alternative 3splice site)、外顯子互斥包含(Mutually

1 當(dāng)前基于RNA-Seq數(shù)據(jù)識別外顯子跳躍事件的研究現(xiàn)狀

為了更好地評估PSI的值,Kakaradov等人提出了三種方法去自動評估PSI的值,包括:樸素模型、高斯模型和自動混合模型[7]。模型中,考慮到了測序短片段映射到外顯子與外顯子連接區(qū)域存在的位置偏移信息。與MISO方法運行時間相比較,Kakaradov提出的三個方法運行時間都較少。

通過提取現(xiàn)在數(shù)據(jù)庫中注釋的外顯子區(qū)域、外顯子連接信息、外顯子邊界信息、內(nèi)含子區(qū)域和基因間的區(qū)域等特征,Griffith等人提出了ALEXA-Seq的方法[8]。該方法用于在不同條件下,比較特征與包含此特征的基因間差異性。實現(xiàn)過程中,提出了三種計算模型,其中, 和 分別代表不同的條件, 和 表示第 個特征的表達(dá)量, 和 表示第 個基因的表達(dá)量。

與ALEXA-Seq相似,SpliceSeq[9]也是使用SI算法,采用Fisher檢驗去識別外顯子跳躍這一剪接事件。此外,SpliceSeq還提供了一種可視化的方法,方便用戶直觀地查看外顯子跳躍這一剪接事件。

SOLAS方法[10],利用映射到外顯子內(nèi)部區(qū)域的測序短片段數(shù)作為特征,使用Z-score計算兩種不同條件下差異表達(dá)的外顯子。

Anders提出了DEXSeq的方法[11]。DEXSeq首先假設(shè)測序短片段在參考基因組片段上的分布服從否定二項分布,并利用此特性,構(gòu)建了一個線性回歸模型。該線性模型使用了可以發(fā)生跳躍的外顯子的表達(dá)量和包含該外顯子的基因的表達(dá)量。通過識別離群點(在兩種條件下,差異表達(dá)的外顯子),來識別外顯子跳躍事件。

Wang等人提出了DEGSeq方法[12]用于從RNA-Seq數(shù)據(jù)中識別不同表達(dá)的外顯子或者基因。與DEXSeq方法類似,DEGSeq也是使用了可以發(fā)生跳躍的外顯子的表達(dá)量和包含該外顯子的基因的表達(dá)量,通過識別離群點(不同條件下差異表達(dá)的外顯子)來識別外顯子剪接事件。但與DEXSeq的模型不同,DEGSeq的模式是基于測序短片段在參考基因組上的分布服從均一分布這一假設(shè)的。

MATS[13]使用了貝葉斯方法,用多變量均一分布作為先驗知識,使用了映射到外顯子內(nèi)部區(qū)域的測序短片段和支持連接兩個外顯子的測序短片段,來識別外顯子跳躍事件。上述實現(xiàn)中, 表示支持外顯子保留的、連接該外顯子與上游外顯子的測序短片段數(shù), 表示支持外顯子保留的、連接該外顯子與下游外顯子的測序短片段數(shù), 表示支持跳躍該外顯子的、連接該外顯子上游與下游外顯子的測序短片段數(shù)。

Pervouchine等人提出了一個改進的計算 的方法[14]。由于支持連接不同外顯子的測序短片段可能存在多種情況,所以Pervouchine使用公式14來評估 :

代表連接選擇性外顯子的上游外顯子和選擇性外顯子的測序短片段, 代表連接選擇性外顯子的下游外顯子和選擇性外顯子的測序短片段, 代表連接選擇性外顯子的上游外顯子和選擇性外顯子的下游外顯子的測序短片段, 代表支持跨越從5'剪接位點 到3'剪接位點 之間內(nèi)含子的測序短片段, 代表剪接到3'剪接位點 的、連接兩個外顯子的測序短片段, 代表從5'剪接位點 開始剪接的、連接兩個外顯子的測序短片段。

JuncBASE方法[15]僅使用了連接兩個外顯子的測序短片段,在兩種不同條件下使用Fisher檢驗,去識別外顯子跳躍事件。

JETTA[16]使用SeqMap[17]和rSeq[18]方法獲得基因、外顯子、連接兩個外顯子的測序短片段表達(dá)值來評估在兩種不同條件下所有外顯子保留率,從而識別外顯子跳躍事件。

AS detector[19]整合了兩種計算方法的比較結(jié)果來識別外顯子跳躍事件:一是在兩種條件下比較連接不同外顯子的、支持外顯子保留的測序短片段和連接不同外顯子的、支持該外顯子剪接的測序短片段的不同;二是在兩種條件下比較該選擇性外顯子的表達(dá)量和包含該外顯子的基因的表達(dá)量的不同。AS detector分別用Fisher檢驗對上述兩種比較進行統(tǒng)計顯著的分析,計算出每一種比較的p-value,再通過使用weighted arithmetic equation方法[20]對這兩個p-value進行校正,最終得到一個修正的p-value。對于修正后p-value值小于0.05的外顯子即為AS detector方法識別的外顯子跳躍事件。

2現(xiàn)有識別方法存在的問題

基于RNA-Seq數(shù)據(jù)識別外顯子跳躍事件的方法,都是使用映射到與外顯子跳躍事件相關(guān)位置的測序短片段作為特征,去構(gòu)建計算方法和模型。

與外顯子跳躍事件相關(guān)位置的測序短片段主要包括:映射到選擇性外顯子內(nèi)部區(qū)域的測序短片段( );映射到支持外顯子保留區(qū)域的、連接選擇性外顯子和其上游外顯子的測序短片段( );映射到支持外顯子保留區(qū)域的、連接選擇性外顯子和其下游外顯子的測序短片段( );映射到支持外顯子保留區(qū)域的測序短片段( );映射到支持外顯子跳躍區(qū)域的、連接選擇性外顯子的上游外顯子和選擇性外顯子的下游外顯子的測序短片段( );映射到選擇性外顯子上游和下游外顯子內(nèi)部區(qū)域的測序短片段( );映射到包含此選擇性外顯子的基因區(qū)域的測序短片段( )。

SOLAS方法只使用了映射到選擇性外顯子內(nèi)部區(qū)域的測序短片段;DEXSeq、DEGSeq、Splicing Index(SI)、Alexa-Seq使用了映射到選擇性外顯子內(nèi)部區(qū)域的測序短片段和映射到包含該選擇性外顯子的基因區(qū)域的測序短片段;JuncBASE、Kakaradov methods、Pervouchines method只使用了支持外顯子跳躍和保留的、映射到連接兩個外顯子區(qū)域的測序短片段;PSI、MATS使用了映射到支持選擇性外顯子保留和剪接區(qū)域的測序短片段;MISO使用了映射到支持選擇性外顯子保留和跳躍區(qū)域的測序短片段、以及選擇性外顯子的上游和下游外顯子內(nèi)部區(qū)域的測序短片段;JETTA和AS detector使用了映射到選擇性外顯子內(nèi)部區(qū)域的測序短片段、映射到包含該選擇性外顯子的基因區(qū)域的測序短片段和映射到支持外顯子跳躍和保留的、映射到連接兩個外顯子區(qū)域的測序短片段。現(xiàn)有外顯子跳躍事件識別方法及其用到的測序短片段特征,如表1所示。從表中可以看出,現(xiàn)有的方法都是利用了與外顯子跳躍事件相關(guān)的部分信息去構(gòu)建計算模型和方法。例如,SOLAS的方法沒有使用支持外顯子跳躍和保留的、映射到連接兩個外顯子區(qū)域的測序短片段、以及映射到包含該選擇性外顯子的基因的測序短片段信息。DEXSeq、DEGSeq、Splicing Index(SI)、Alexa-Seq沒有使用支持外顯子跳躍和保留的、映射到連接兩個外顯子區(qū)域的測序短片段信息。JuncBASE、Kakaradov's methods、Pervouchines method沒有使用映射到選擇性外顯子內(nèi)部區(qū)域的測序短片段、以及映射到包含該選擇性外顯子的基因的測序短片段信息。PSI、MATS、MISO沒有使用映射到包含該選擇性外顯子的基因的測序短片段信息。JETTA、AS detector沒有將選擇性外顯子剪接事件看成一個整體,沒有使用映射到支持選擇性外顯子保留區(qū)域的測序短片段信息。

當(dāng)前研究方法都是使用了與外顯子跳躍事件相關(guān)的部分信息去構(gòu)建計算模型和方法,而信息的過載和丟失會導(dǎo)致識別出具有假陽性和假陰性的結(jié)果,因此距離基于RNA-Seq數(shù)據(jù)準(zhǔn)確地識別外顯子跳躍事件的目標(biāo)還有很大差距。

3 今后的研究

針對當(dāng)前研究存在的問題,今后如何提高識別外顯子跳躍事件的準(zhǔn)確性;如何學(xué)習(xí)每一種與外顯子跳躍事件相關(guān)的特征對準(zhǔn)確識別外顯子跳躍事件的影響;如何針對單端和雙端測序數(shù)據(jù)的特性來構(gòu)建識別方法使其可以同時應(yīng)用到單端和雙端的轉(zhuǎn)錄組測序數(shù)據(jù)上;針對具有多個生物學(xué)重復(fù)數(shù)據(jù)的情況,如何選取恰當(dāng)?shù)挠嬎隳P秃徒y(tǒng)計方法來構(gòu)建識別方法;針對多個生物學(xué)重復(fù)數(shù)據(jù)來自不同測序批次的情況,如何選取恰當(dāng)?shù)挠嬎隳P秃徒y(tǒng)計方法來構(gòu)建識別方法;如何利用已經(jīng)被生物學(xué)實驗驗證過的外顯子跳躍事件的信息來構(gòu)建識別方法;如何結(jié)合現(xiàn)有的生物數(shù)據(jù)庫信息來構(gòu)建識別方法;如何驗證識別結(jié)果的準(zhǔn)確性;如何通過識別結(jié)果指導(dǎo)生物學(xué)家去做生物實驗;這些問題都是今后基于RNA-Seq數(shù)據(jù)識別外顯子跳躍事件研究的熱點問題。

4 結(jié)束語

基于RNA-Seq數(shù)據(jù)識別外顯子跳躍事件是一個新興的研究方向,盡管目前該領(lǐng)域的研究已經(jīng)取得了一定的進展,但現(xiàn)有研究仍然存在著一些問題。準(zhǔn)確地識別外顯子跳躍事件還需要許多熟悉生物科學(xué)和計算機科學(xué)的專家共同努力。隨著大量與癌癥相關(guān)的轉(zhuǎn)錄組被測序,以及精準(zhǔn)醫(yī)療的出現(xiàn),使得從癌癥RNA-Seq數(shù)據(jù)中識別外顯子跳躍越來越重要。希望有更好的計算模型和方法能夠應(yīng)用到該領(lǐng)域,從而使得基于RNA-Seq數(shù)據(jù)識別外顯子跳躍事件的精準(zhǔn)度越來越高。

參考文獻:

[1] PAN Q, SHAI O, LEE L J, et al. Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing [J]. Nature Genetics, 2008, 40(12):1413-1415.

[2] BLACK D L. Mechanisms of alternative pre-messenger RNA splicing [J]. Annual Review of Biochemistry, 2003, 72(1):291-336.

[3] MATLIN A J, CLARK F C W. Understanding alternative splicing: towards a cellular code [J]. Nature Reviews Molecular Cell Biology, 2005, 6(5):386-398.

[4] SAMMETH M, FOISSAC S, GUIGó R. A general definition and nomenclature for alternative splicing events[J]. Plos Computational Biology, 2008, 4(8):e1000147.

[5] WANG E T, SANDBERG R, LUO S, et al. Alternative isoform regulation in human tissue transcriptomes [J]. Nature,2008, 456(7221):470-476.

[6] KATZ Y, WANG E T, AIROLDI E M, et al. Analysis and design of RNA sequencing experiments foridentifying isoform regulation [J]. Nature Methods, 2010, 7(12):1009-1015.

[7] KAKARADOV B, YUAN X H, LEE L J, et al. Challenges in estimating percent inclusion of alternatively spliced junctions from RNA-seq data [J]. BMC Bioinformatics, 2012, 13 suppl 6(8):72-79.

[8] GRIFFITH M, GRIFFITH O L, MWENIFUMBO J, et al. Alternative expression analysis by RNA sequencing [J]. Nature Methods, 2010, 7(10):843-847.

[9] RYAN M C, CLELAND J, KIM R, et al. SpliceSeq: a resource for analysis and visualization of RNA-Seq data on alternative splicing and its functional impacts.[J]. Bioinformatics, 2012, 28(18):2385-2387

主站蜘蛛池模板: 欧美精品1区2区| www.精品国产| 婷五月综合| 欧美另类图片视频无弹跳第一页| 激情综合五月网| 久久永久免费人妻精品| 三区在线视频| 亚洲女同一区二区| 播五月综合| 伊人丁香五月天久久综合| 国产免费羞羞视频| 成人在线观看不卡| 精品视频第一页| 亚洲三级a| 久久精品一品道久久精品| 中文成人无码国产亚洲| 一级毛片在线免费视频| 精品国产一区91在线| 婷婷99视频精品全部在线观看| 污视频日本| 黄色a一级视频| www亚洲天堂| 热久久这里是精品6免费观看| 亚洲欧洲一区二区三区| 婷婷亚洲最大| 亚洲av日韩av制服丝袜| 综合色区亚洲熟妇在线| 青青草原偷拍视频| 1769国产精品视频免费观看| 亚洲视频三级| 国产免费高清无需播放器| 黄色福利在线| 亚洲激情99| 欧美国产日韩在线| 一区二区三区成人| 亚洲二三区| 666精品国产精品亚洲| 婷婷激情亚洲| 国产亚洲精品无码专| 国产精品人莉莉成在线播放| 97在线视频免费观看| 成人午夜天| 国产99免费视频| 国产成本人片免费a∨短片| 精品人妻一区无码视频| a级高清毛片| 欧美日韩中文国产| 99久久精品免费观看国产| 国产一区在线观看无码| 日韩国产亚洲一区二区在线观看| 四虎永久免费网站| 亚洲福利一区二区三区| 华人在线亚洲欧美精品| 国产成人你懂的在线观看| 国产一级在线观看www色| 欧美一级片在线| 亚洲精品图区| 中文字幕在线日韩91| 亚洲成人精品久久| 99re精彩视频| 老司机午夜精品视频你懂的| 97久久人人超碰国产精品| 91午夜福利在线观看精品| 亚洲日韩国产精品综合在线观看 | 中国国产A一级毛片| 无码日韩人妻精品久久蜜桃| 永久成人无码激情视频免费| 在线中文字幕日韩| 日本一区二区不卡视频| 免费在线国产一区二区三区精品| 国产一区二区三区免费观看 | 99热这里只有精品在线观看| 666精品国产精品亚洲| 欧美精品成人| 九九热精品免费视频| 青青久视频| 91福利国产成人精品导航| 国产91特黄特色A级毛片| 国产综合亚洲欧洲区精品无码| 专干老肥熟女视频网站| 亚洲人成在线免费观看| 国产精品美女网站|