靳 偉 張瑞芝 常翠芳
(河南師范大學生命科學學院 新鄉 453007)
在真核生物細胞中,編碼蛋白質的RNA (mRNA)只占基因組的2%左右,其余的為非編碼RNA (non-coding RNAs,ncRNA)。研究表明,ncRNA也參與調控機體生理過程中各種基因的表達,具有重要的生物學功能[1]。目前對包括微小RNA (microRNA,miRNA)和長鏈非編碼RNA (long non-coding RNA,lncRNA)在內的ncRNA的研究大部分集中于生理過程和常見疾病的分子機制。近年來,隨著RNA測序(RNA sequencing,RNA-seq)技術的發展和應用,一類廣泛存在于多種生物細胞、能調控基因表達的內源性非編碼環狀RNA(circular RNA, circRNA)逐漸受到廣泛關注,已經成為ncRNA研究的熱點[2]。
1.1 circRNA的發現 1976年,Kolakofsky等和Sanger等用電鏡等技術在感染植物的類病毒(viroids)及副流感病毒(sendai virus)顆粒中首次觀察到circRNA。之后,研究人員又在動物細胞和酵母中發現了circRNA,但鑒于當時生物技術的局限性和circRNA分子結構的特殊性,circRNA被認為是錯誤剪接或剪接過程中形成的副產物。直到2012年,Salzman等對circRNA進行了比較全面和系統的研究后,才開始重新認識并深入研究circRNA。近年來,隨著新一代高通量測序技術和分子生物學技術的不斷進步,陸續在人、小鼠、大鼠、斑馬魚、果蠅、線蟲、原生生物(瘧原蟲等)、植物(擬南芥等)和真菌(釀酒酵母等)等發現了大量保守而穩定的circRNA[3]。
1.2 circRNA的主要特征 circRNA有著特殊的結構和產生方式,主要特征包括: ①由特殊的可變剪切產生,大量存在于真核細胞的細胞質中,但少部分內含子來源的circRNA則存在于核內,具有一定的組織、時序和疾病特異性;②廣泛存在于真核細胞中,部分基因的circRNA表達水平甚至比mRNA高10倍以上;③與傳統的線性RNA (linear RNA)不同,circRNA分子呈封閉環狀結構,不具有5′末端帽子和3′末端poly(A)尾巴,比線性RNA更穩定,不易被核酸外切酶(RNase R)降解,其半衰期可超過48h,而mRNA平均只有10h[4]。
1.3 circRNA的類別 理論上,circRNA可以產生于基因組的任何區域。一個circRNA通常由1~5個外顯子和/或1~2個內含子組成,可能同時含有編碼區或非編碼區成分。根據組成不同可以將circRNA分為內含子環狀RNA (intronic circRNA)、外顯子環狀RNA (exon circRNA)、外顯子—內含子環狀RNA (exon-intron circRNA)和基因間區環狀RNA (intergenic circRNA)4個類別[5]。
隨著研究的深入,circRNA形成的機制逐步被揭示,產生了很多推測和假說。circRNA產生方式包括外顯子環化和內含子環化。
2.1 外顯子環化機制 真核細胞中的外顯子環狀RNA形成與反向剪接(back-splicing)密切相關。經典剪接是通過剪接體去除mRNA前體內的內含子,然后將外顯子進行拼接,形成有功能的線性mRNA。而反向剪接是將下游的5′剪接位點與上游的3′剪接位點通過共價鍵連接形成外顯子環狀RNA。雖然其具體的反向剪接環化機制尚未完全闡明,但目前提出了兩種公認的模型進行解釋: ①直接反向剪接。這種形成方式主要是5′內含子的一個分支點結合3′內含子的剪接供體,接著3′剪接供體通過結合5′剪接受體完成反向剪接,形成circRNA;②外顯子跳讀。這種方式主要是一個外顯子跳讀導致了包含一個外顯子的套索的形成,然后套索自身剪接,通過移除內含子序列產生circRNA[6]。
2.2 內含子環化機制 Zhang等提出了內含子自身環化產生環狀RNA模型,即內含子也可以獨立形成circRNA。Abdelmohsen等提出RNA結合蛋白(RNA binding protein,RBP)相互作用可以在側翼內含子之間形成RBP橋,使得剪接供體和剪接受體接近,形成circRNA。在某些古生菌中,circRNA來自于rRNA加工過程中的中間體或者tRNA內含子剪接產物[7]。
近年來,circRNA在生物體中的功能不斷被發現和證實,包括吸收miRNA的海綿作用、調節轉錄和剪接、與RBP相互作用、參與假基因形成等。以下分別對含有內含子序列和含有外顯子序列的circRNA的生物學功能進行敘述:
3.1 含有內含子序列的circRNA 這種circRNA主要分布在細胞核,可以與RBP結合影響親本基因表達。同時,在環狀RNA的形成過程中,內含子間競爭性互補配對可以與線性RNA分子之間形成平衡,能影響mRNA的表達,甚至蛋白質的翻譯[8]。
3.2 含有外顯子序列的circRNA 主要發揮吸收miRNA的海綿功能[9]。例如,Hansen等研究發現,小腦變性相關蛋白1反義轉錄物(antisense to the cerebellar degeration-related protein 1 transcript,CDR1as)環化形成circRNA,其序列包含73個miR-7的結合位點(seed binding sites),CDR1as通過結合位點與miR-7相互作用,調節miR-7靶標的表達水平。后來的研究發現,大多數circRNA并不像CDR1as那樣在序列上存在多個相同的某種miRNA結合位點,而是具有不同種類的miRNA結合位點,circRNA發揮海綿作用時,既可以與一種miRNA相互作用,也可以與多種miRNA相互作用。例如,Yang等研究證明,叉頭框O3環狀RNA(circular forkhead box O3,circ-FOXO3)可吸附8種不同miRNA,調節叉頭框O3(forkhead box O3,FOXO3)基因的活性,從而抑制腫瘤生長和血管生成[10]。
circRNA結構和功能研究發現,在某些疾病的發生發展過程中cincRNA起著重要的調控作用。目前有關circRNA與疾病關系的研究主要集中在circRNA與癌癥之間有何關聯方面,但也有相關文章報道circRNA與心血管疾病、糖尿病、朊病毒病、病毒性肝炎、神經系統疾病以及骨關節炎等密切相關[11]。最新研究顯示,circRNA與一些常見癌癥如胃癌、肝癌、結腸癌、食管癌、卵巢癌、腦膠質瘤、非小細胞肺癌、乳頭狀甲狀腺癌、急性髓系白血病、乳腺癌和食道癌等的形成有關,且與癌旁非腫瘤組織相比,circRNA在癌癥組織中表達異常[12]。這些異常表達的circRNA能通過干擾miRNA或參與其他生物學過程來影響癌癥的發生。例如,Li等研究發現,hsa_circ_002059作為一種典型的環狀RNA,其在胃癌組織中的表達水平低于癌旁非腫瘤組織,這種過低表達與胃癌轉移、腫瘤發展程度以及性別與年齡密切相關;Yu等發現一種經典miRNA“海綿”CDR1as在肝癌中高表達,并通過抑制其靶標miRNA-7促進癌癥進展;Hansen等已經證實CDR1as在小鼠腦組織中共表達時可影響中腦的發育[13];Ghosal等預測CDR1as也可能與帕金森病有關: 高表達的miRNA-7在神經元細胞中破壞可生成多巴胺的細胞結構,可導致帕金森病的發生;Xu等發現,CDR1as與miRNA-7結合后,可抑制miRNA-7的表達,導致胰島素分泌明顯增加,有利于糖尿病治療[14];Li等發現,外泌體中含有豐富且性質穩定的circRNA (exosome circRNA,exo-circRNA),癌癥患者和健康人血清中多種exo-circRNA的表達量具有明顯差異,可據此將患者和正常人區分開[15]。
近年來隨著生物測序技術的發展,越來越多的circRNA逐漸被發現,同時有關circRNA的起源、特征、作用以及其與疾病的關系方面的報道也越來越多,但是目前大部分相關研究還處于探索階段[16]。circRNA研究成為了ncRNA調控疾病和生理過程研究的熱點,以circRNA為基礎的診斷和疾病治療研究也必將成越來越多地受到學界的關注。