夏世金 高 文 胡明冬 劉露梅 邰先桃
環狀RNA(circular RNA, circRNA)或稱環形RNA,是新近確認的一類特殊的非編碼RNA(non-coding RNA, ncRNA)分子,是繼microRNA(miRNA)后RNA家族的一顆極具發展潛力的正在升起的新星,也是RNA領域最新的研究熱點,方興未艾。通過與疾病關聯的miRNA相互作用,circRNA在疾病中發揮著重要的調控作用,有巨大潛力成為新型的臨床診斷標志物。
circRNA是一類主要由一個以上外顯子構成的環形RNA分子,大量存在于真核細胞,具有一定的組織、時序和疾病特異性。circRNA最先在植物類病毒中被發現[1],隨后在研究腫瘤抑制基因DCC、人Ets-1基因及小鼠Sry基因時,發現從核前體mRNA(precursor messenger RNA, pre-mRNA)加工而來的RNA呈環狀[2-5],表明真核細胞中也存在著非線性RNA: circRNA。早期,關于circRNA的文獻報道少,且表達水平低下,故在很長一段時間里,circRNA被認為是錯誤可變剪接(alternative splicing )而形成的副產品,屬于自然界中一種極罕見現象[5-6],甚至被當做遺傳意外或實驗人為因素所致,并未引起學術界重視。
隨著RNA測序(RNA sequencing, RNA-seq)和生物信息學等技術的快速發展,人們在大規模研究轉錄組數據時發現,circRNA并不像之前所認為的那樣是一種極罕見現象,反而大量存在于真核細胞中。Danan等[6]發現,circRNA在古生菌細胞普遍存在,并認為其極有可能具有生物學功能。同時,Salzman等[7]也證實circRNA在人類細胞基因表達中是一個普遍現象,并可能扮演著多種生物學功能的重要角色。Jeck等[8]采用高通量測序方法,在人成纖維細胞中檢測到超過25 000種circRNA,認為circRNA是RNA剪切后所形成的一類極穩定的保守性產物,此外還發現circRNA可被小型干擾RNA(small interfering RNA,siRNA)降解。Memczak等[9]研究證實circRNA參與轉錄后調控,Hansen等[10]的研究則揭示circRNA可作為miRNA海綿(miRNA sponge)來影響基因的調控與表達。盡管circRNA被發現已有30余年,但由于技術限制等原因,circRNA一直處于被學術界忽視的地位。但隨著近年有關circRNA的幾項突破性研究的發現,尤其是國際著名權威刊物Nature發表兩篇有關circRNA生物學功能的論文[9-10],震驚學術界,從此拉開揭開circRNA神秘面紗的序幕,circRNA已引起國內外學術界的關注,并將掀起研究熱潮。
1. circRNA的形成: 生命體的遺傳信息通過轉錄從DNA傳遞到RNA,再通過翻譯傳遞到蛋白質。通常情況下,真核生物基因在轉錄后通過前體mRNA剪接(pre-mRNA splicing)去除基因內的非編碼內含子序列,然后將含有蛋白編碼信息的外顯子序列順序地連接在一起,形成成熟的線形RNA分子。包括人在內的高等真核生物可以通過可變剪接,由一個基因產生多種不同功能的成熟RNA及其相應蛋白產物。前體mRNA可變剪接在基因組及蛋白質組功能多樣性中發揮重要作用,現已發現約90%的人類基因都存在前體mRNA可變剪接亞型[11]。
在真核生物中存在一種反向的可變剪接,使得基因的外顯子序列反向首尾連接形成環形RNA。circRNA由特殊的前體mRNA可變剪接產生,剪接形式具有多樣性,其形成方式可歸結為兩大類:外顯子環化(exon circularization)和內含子環化(intron circularization)。
Jeck等[8]提出了外顯子環化circRNA的兩種不同形成模型:套索驅動的環化(lariat-driven circularization)和內含子配對驅動的環化(intron-pairing-driven circularization)。前者與外顯子跳讀(exon skipping)有關,一個外顯子的3′剪接供體(splice donor)與另一個外顯子的5′剪接受體(splice acceptor)共價結合,即套索驅動的環化由外顯子組成的剪接供體和剪接受體共價結合,接著切除內含子,然后形成circRNA(圖1A①);后者則先由兩個內含子通過堿基互補配對形成環狀結構,再切除內含子,最后形成circRNA(圖1A②)。Jeck等[8]發現這兩種模型均包含有互補性ALU重復序列的長的側翼內含子(long flanking introns)。近期Zhang等[12]利用特殊核酸酶對環形RNA的富集,采用全新的計算分析流程,在人源胚胎干細胞H9中發現了近萬條環形RNA,并首次證明了內含子RNA互補序列介導的外顯子環化(環形RNA形成),證實外顯子環化依賴于兩側的內含子互補序列,為內含子配對驅動的環化模型提供了有力證據;還發現不同區域間內含子互補序列的競爭性配對,可以選擇性地產生線形RNA或是環形RNA。同時,在人類基因組內含子區域中蘊涵著大量的互補序列,這些互補序列的選擇配對及其動態調控使得同一個基因可產生多個環形RNA,這種現象可被稱為可變環化(alternative circularization);此前,Zhang等[13]提出了內含子自身環化所形成的circRNA(circular intronic RNA, ciRNA)模型,揭示circRNA也可來源于內含子(見圖1B) 。上述一系列研究的新發現為深入闡明circRNA的外顯子環化、內含子環化和可變環化的機制奠定了理論根基,以全新的理論視角揭示了基因表達在轉錄/轉錄后水平的復雜性和多樣性。


注:(A):外顯子環化形成circRNA的機制,①示套索驅動的環化,②示內含子配對驅動的環化;(B):內含子環化形成circRNA的機制
2. circRNA的特征: 根據目前的文獻報道,circRNA具有以下重要特征:(1)circRNA由特殊的可變剪切產生,大量存在于真核細胞的細胞質中[5],但少部分內含子來源的circRNA則存在于核酸內[12],具有一定的組織、時序和疾病特異性;(2)廣泛存在于人體細胞中,有時甚至超過它們線性異構體的10倍之多[7-8];(3)與傳統的線型RNA(linear RNA,含5'和3'末端)不同,circRNA分子呈封閉環狀結構,不易被核酸外切酶RNase R降解,比線性RNA更穩定[8,14-15];(4)具有高度保守性[7-8],部分具有快速的進化性改變[12-13];(5)大多數來源于外顯子,少部分由內含子直接環化形成;(6)circRNA分子富含miRNA應答元件(miRNA response element, MRE),可充當競爭性內源RNA(competing endogenous RNA, ceRNA),與miRNA結合,在細胞中起到miRNA海綿的作用,進而解除miRNA對其靶基因的抑制作用,上調靶基因的表達水平[10];(7)大部分是非編碼RNA[7]。circRNA的其他特征還有待闡明。
1. circRNA參與轉錄后調控功能: 小腦變性相關蛋白1反義轉錄物(antisense to the cerebellar degeneration-related protin 1 transcript, CDR1as)是一種circRNA,擁有至少60個與微小RNA-7(microRNA-7, miR-7)相結合的保守結合位點,從而充當miR-7海綿,有效影響miR-7靶基因活性[9-10]。CDR1as和miR-7在發育的中腦區域具有共同高表達的特點,在斑馬魚胚胎中,CDR1as的過表達造成中腦體積減少,且中腦體積的減少可通過注射miR-7前體得以部分恢復,這表明CDR1as的生物學效應至少部分通過其與miR-7相互作用而產生[10]。CDR1as是miR-7的環狀抑制劑,對miR-7起負調控作用[16],發揮天然miRNA海綿功能[17]。此外,Hansen等[10]研究發現,睪丸特異性基因Sry的circRNA具有16個微小RNA-138(microRNA-138, miR-138)的靶位點,可與miR-138相互作用,充當miR-138海綿。
circRNA充當miRNA海綿,競爭性抑制miRNA的轉錄調控,實際上代表了一類新型的ceRNA調節物(圖2A)。相較于其他類型的ceRNA,circRNA在細胞中表達量高且穩定性強,并具有更多與miRNA結合的位點,能夠更加快速、穩定地結合或釋放大量miRNA,高效發揮其調控miRNA的作用,比線性的ceRNA更具有突出的ceRNA活性。環狀RNA也可能是細胞外miRNA海綿,一些環狀RNA有可能存在病毒miRNA的結合位點,與病毒miRNA的結合,從而破壞免疫應答[9]。然而,circRNA作為miRNA海綿,與miRNA相互作用的具體機制仍有待進一步探明。
2. circRNA的其他功能: 除外作為miRNA的環狀抑制劑,circRNA也可能與RNA結合蛋白(RNA-binding protein, RBP)結合(圖2B),或者與其他RNA通過堿基互補配對[18-19](圖2C)。Zhang等[12]封閉內含子環化的circRNA-ci-ankrd52的表達,發現ankrd52 mRNA表達顯著減少,表明circRNA可正調控其自身基因的表達;還發現此類circRNA主要位于核內,不同于胞質內表達的circRNA,MRE較少,但能夠正調控RNA聚合酶Ⅱ的轉錄活性。此外,circRNA還能與阿格蛋白(argonaute, AGO)緊密結合,影響mRNA的轉錄翻譯[9-10](圖2B)。

注:(A):circRNA可作為miRNA的環狀抑制劑,充當miRNA海綿;(B):circRNA可與蛋白結合;(C):circRNA可與其他RNA通過堿基互補配對結合
通過與疾病關聯的miRNA相互作用,circRNA在疾病中發揮著重要的調控作用。人類全基因組關聯分析(genome-wide association study, GWAS)顯示,靠近基因INK4/ARF的染色質9p21.3與動脈粥樣硬化的易感性具有單核苷酸多態性(single nucleotide polymorphism, SNP),而有研究顯示,基因INK4/ARF可被多梳家族(polycomb group, PcG)復合物抑制[20]。circRNA cANRIL是基因INK4/ARF的反義轉錄物[21],可通過有差異的PcG募集來抑制INK4/ARF表達,從而影響動脈粥樣硬化的發生[22]。
Hansen等[23]已證實CDR1as與miR-7在小鼠大腦中共表達,可影響中腦發育[9]。Ghosal等[24]則發現CDR1as亦可能與帕金森病有關。Lukiw[25]發現,在ciRS-7(也被稱為CDR1as)的海綿功能缺失時,miR-7表達上調,極有可能下調阿爾茨海默病相關靶點蛋白表達,如泛素化蛋白連接酶A[26-27]。由于miR-7可調控一些致癌基因,因而CDR1as可通過調控miR-7以影響腫瘤的產生[16]。circRNA在疾病發生中的作用與機制研究,目前尚處在起步階段。
由于circRNA絕大部分由外顯子環化構成,故在此針對性介紹外顯子環化circRNA的檢測研究方法。
1. 分子生物學方法: circRNA相較于線性RNA沒有3′端,在凝膠中移動的速度比相同長度的線性RNA慢,這種效應可被增強型交聯凝膠法(increased gel cross-linking)放大[28]。然而,與同源基因形成的其他轉錄物相比較,circRNA包含有更少的總核苷酸序列,從而在弱交聯凝膠(low cross-linking gel)中移動較慢。基于此,我們可通過northern blot法來對circRNA進行鑒別[8,29]。經由核酸外切酶RNase H降解或單一水解后,circRNA可線性化成為大小可預測的單一產物[4, 30],因此,通過雙向凝膠電泳(two-dimensional gel electrophoresis)或瓊脂糖凝膠電泳(gel trap electrophoresis)方法可更進一步確認RNA的環化[23, 28, 31]。除以上幾種方法之外,酶法(enzymatic method)分析也可為circRNA的研究提供有力支持。核酸外切酶RNase R(RNase R exonuclease)[14]、煙酸磷酸酶(tobacco acid phosphatase)[10]、終止子核酸外切酶(terminator exonuclease)[10]可降解大部分線性RNA,但不能降解circRNA,用這3種酶對特定RNA進行處理,通過對處理前后的數據進行定量分析,可甄別circRNA。
套索RNA(lariat RNA)與circRNA一樣,均為環形結構,都對核酸外切酶不敏感[14]、比線性RNA移動更慢[28],但是,circRNA具有明顯的索尾插接序列(backsplice sequence),能輕易與套索RNA區分。此外,套索RNA在被核酸外切酶消化前,更易被脫支酶切除,因此區分二者并不難。
2. 基因組學方法: 目前基因組學方法有兩條途徑:一條是從目前已存在的轉錄物模型(transcript models)中選取候選接頭(candidate junctions)[7, 21],另一條是通過與基因組序列閱讀框匹配來識別接頭[32]。第一條途徑主要對來自單一cDNA片段另一端的末端配對閱讀序列(paired-end reads sequence)的獨立遺傳圖譜進行分析[7]。第二條途徑則是通過識別來自于從哺乳動物到線蟲的損耗型rRNA的RNA-seq資料中的索尾插接序列遺傳密碼,對此類損耗型rRNA文庫(rRNA-depleted libraries)進行分析統計以鑒別出circRNA[9]。此外,Danan等[6]及Jeck等[8]先用RNase R進行消化,然后采用高通量測序的方法對RNase R不敏感RNA進行分析,此種“CircleSeq”技術可深入分析circRNA,但需要大量的RNA輸入,且對核酸內切酶污染極度敏感。
3. 其他: 近期,Gla?ar等[33]建立了circRNA專用數據庫“circBase”,該數據庫對目前已發表的circRNA資料進行整合統一,同時提供已知的及新的circRNA測序資料,旨在為circRNA的研究提供一個較好的交流平臺。目前,Arraystar率先開發了世界上第一款商業化circRNA芯片,為系統探索不同生理及病理條件下circRNA的表達規律提供實驗研究平臺。circRNA的研究方法需要進一步完善。
目前,circRNA的命名尚未統一。“ciRS-7”表明其與miR-7結合,而“CDR1as”則表明其與CDR1基因有關,盡管是同一個circRNA,但由于研究者各自的研究角度不同而造成命名的不一致,Kosik[34]則建議將之統一命名為circR-1。因此,亟需構建一個更恰當的、適用的和公認的circRNA命名體系,以避免命名的混亂。
circRNA是RNA匣子里的一顆璀璨明珠,也是RNA家族中繼miRNA后又一顆冉冉升起的新星。盡管目前人們對circRNA的了解僅僅是冰山一角,闡明circRNA生物學功能與機制還相當遙遠,但天然生成的circRNA作為miRNA海綿,通過與miRNA相互作用從而調控miRNA靶基因的表達,這豐富了人們對動物自然進化的認知,顛覆了RNA僅僅是DNA與編碼蛋白之間的平凡使者的傳統理念,呈現出成為進化驅動者的潛能[33]。circRNA的組織特異性和穩定性使其有可能成為一種良好的生物標志物;circRNA與疾病發生的密切相關,通過與疾病關聯的miRNA相互作用,circRNA在疾病發生中發揮著重要的調控作用,可望成為新型的疾病臨床診斷標志物,在疾病的防治領域展現出光明的潛在的應用前景。
參 考 文 獻
1 Sanger HL, Klotz G, Riesner D, et al. Viroids are single-stranded covalently closed circular RNA molecules existing as highly base-paired rod-like structures[J]. Proc Natl Acad Sci U S A, 1976, 73(1): 3852-3856.
2 Nigro JM, Cho KR, Fearon ER, et al. Scrambled exons[J]. Cell, 1991, 64(3): 607-613.
3 Cocquerelle C, Daubersies P, Majerus MA, et al. Splicing with inverted order of exons occurs proximal to large introns[J]. EMBO J, 1992, 11(3): 1095-1098.
4 Capel B, Swain A, Nicolis S, et al. Circular transcripts of the testis-determining gene Sry in adult mouse testis[J]. Cell, 1993, 73(5): 1019-1030.
5 Cocquerelle C, Mascrez B, Hétuin D, et al. Mis-splicing yields circular RNA molecules[J]. FASEB J, 1993, 7(1): 155-160.
6 Danan M, Schwartz S, Edelheit S, et al. Transcriptome-wide discovery of circular RNAs in Archaea[J]. Nucleic Acids Res, 2012, 40(7): 3131-3142.
7 Salzman J, Gawad C, Wang PL, et al. Circular RNAs are the predominant transcript isoform from hundreds of human genes in diverse cell types[J]. PLoS One, 2012, 7(2): e30733.
8 Jeck WR, Sorrentino JA, Wang K, et al. Circular RNAs are abundant, conserved, and associated with ALU repeats[J]. RNA, 2013, 19(2): 141-157.
9 Memczak S, Jens M, Elefsinioti A, et al. Circular RNAs are a large class of animal RNAs with regulatory potency[J]. Nature, 2013, 495(7441): 333-338.
10 Hansen TB, Jensen TI, Clausen BH, et al. Natural RNA circles function as efficient microRNA sponges[J]. Nature, 2013, 495(7441): 384-388.
11 Wang ET, Sandberg R, Luo S, et al. Alternative isoform regulation in human tissue transcriptomes[J]. Nature, 2008, 456(1): 470-476.
12 Zhang XO, Wang HB, Zhang Y, et al. Complementary Sequence-Mediated Exon Circularization[J]. Cell, 2014, 159(1): 134-147.
13 Zhang Y, Zhang XO, Chen T, et al. Circular intronic long noncoding RNAs[J]. Mol Cell, 2013, 51(6): 792-806.
14 Suzuki H, Zuo Y, Wang J, et al. Characterization of RNase R-digested cellular RNA source that consists of lariat and circular RNAs from pre-mRNA splicing[J]. Nucleic Acids Res, 2006, 34(8): e63.
15 Suzuki H, Tsukahara T. A view of pre-mRNA splicing from RNase R resistant RNAs[J]. Int J Mol Sci, 2014, 15(6): 9331-9342.
16 Hansen TB, Kjems J, Damgaard CK. Circular RNA and miR-7 in cancer[J]. Cancer Res, 2013, 73(18): 5609-5612.
17 Hentze MW, Preiss T. Circular RNAs: splicing′s enigma variations[J]. EMBO J, 2013, 32(7): 923-925.
18 Wilusz JE, Sharp PA. Molecular biology. A circuitous route to noncoding RNA[J]. Science, 2013, 340(6131): 440-441.
19 Tay Y, Rinn J, Pandolfi PP. The multilayered complexity of ceRNA crosstalk and competition[J]. Nature, 2014, 505(7483): 344-352.
20 Jacobs JJ, Kieboom K, Marino S, et al. The oncogene and Polycomb-group gene bmi-1 regulates cell proliferation and senescence through the ink4a locus[J]. Nature, 1999, 397(6715): 164-168.
21 Salzman J, Chen RE, Olsen MN, et al. Cell-type specific features of circular RNA expression[J]. PLoS Genet, 2013, 9(9): e1003777.
22 Burd CE, Jeck WR, Liu Y, et al. Expression of linear and novel circular forms of an INK4/ARF-associated non-coding RNA correlates with atherosclerosis risk[J]. PLoS Genet, 2010, 6(12): e1001233.
23 Hansen TB, Wiklund ED, Bramsen JB, et al. miRNA-dependent gene silencing involving Ago2-mediated cleavage of a circular antisense RNA[J]. EMBO J, 2011, 30(21): 4414-4422.
24 Ghosal S, Das S, Sen R, et al. Circ2Traits: a comprehensive database for circular RNA potentially associated with disease and traits[J]. Front Genet, 2013, 4: 283.
25 Lukiw WJ. Circular RNA (circRNA) in Alzheimer′s disease (AD). Front Genet, 2013, 4: 307.
26 Bingol B, Sheng M. Deconstruction for reconstruction: the role of proteolysis in neural plasticity and disease[J]. Neuron, 2011, 69(1): 22-32.
27 Lonskaya I, Shekoyan AR, Hebron ML, et al. Diminished parkin solubility and co-localization with intraneuronal amyloid-beta are associated with autophagic defects in Alzheimer's disease[J]. J Alzheimers Dis, 2013, 33(1): 231-247.
28 Tabak HF, Van Der Horst G, Smit J, et al. Discrimination between RNA circles, interlocked RNA circles and lariats using two-dimensional polyacrylamide gel electrophoresis[J]. Nucleic Acids Res, 1988, 16(14A): 6597-6605.
29 Hurowitz EH, Brown PO. Genome-wide analysis of mRNA lengths in Saccharomyces cerevisiae[J]. Genome Biol, 2003, 5(1): R2.
30 Jeck WR, Sharpless NE. Detecting and characterizing circular RNAs[J]. Nat Biotechnol, 2014, 32(5): 453-461.
31 Schindler CW, Krolewski JJ, Rush MG. Selective trapping of circular double-stranded DNA molecules in solidifying agarose[J]. Plasmid, 1982, 7(3): 263-270.
32 Fonseca NA, Rung J, Brazma A, et al. Tools for mapping high-throughput sequencing data[J]. Bioinformatics, 2012, 28(24): 3169-3177.
33 Gla?ar P, Papavasileiou P, Rajewsky N. circBase: a database for circular RNAs[J]. RNA, 2014, 20(11): 1666-1670.
34 Kosik KS. Molecular biology: Circles reshape the RNA world[J]. Nature, 2013, 495(7441): 322-324.