馬朝陽
摘要:選擇性剪接是真核生物轉錄水平上的一個重要環節。它是主要通過5種剪接模式,依靠剪接復合體刪減mRNA前體分子中內含子并拼接外顯子,形成成熟mRNA的一個過程。通過對不同剪接位點的選擇,產生不同類型的剪接產物,大大增加蛋白質的多樣性和基于表達的復雜程度。研究表明,植物體內的選擇性剪接參與生長發育過程,能夠調節機體生理功能的實現與否。
關鍵詞:選擇性剪接;剪接復合體;剪接因子;植物生長
1.選擇性剪接的發現
選擇性剪接,又稱可變剪接(alternative splicing),指通過不同的剪接方式從mRNA前體分子(pre-mRNAs)中切除被稱為內含子(intron)的非編碼區,并使基因中被稱為外顯子的(exon)的編碼區拼接為成熟mRNA的過程[1]。在RNA剪接過程中,機體如何正確識別內含子的剪切位點并進行剪接尤為重要。根據內含子的堿基序列和潛在折疊方式的差異,剪接方式可以分為3種方式:pre-mRNA剪接、Ⅰ類和Ⅱ類自剪接內含子。
從1977年,Sambrook 發現外顯子和內含子的間隔排列而成之后,人們認識到一個真核基因大多是斷裂的,必須去除內含子連接外顯子才能發揮基因的作用[2]。1978年Gilbert[3]明確提出選擇性剪接這一概念后,選擇性剪接成為人們廣泛的研究領域。隨后大量的研究表明,選擇性剪接是一個存在于多細胞生物的普遍現象,真核生物的基因中內含子所占比例很高,比如在人類萎縮性肌強直因子中超過99%。其中,植物前體mRNA選擇性剪接的研究最早追溯于1989年Wernekeetal.發現RCA基因在菠菜和擬南芥中均可發生選擇性剪接,以相同的剪切模式和剪接位點分別形成41、45kd和44、47kd兩個同源體[4]。
2.RNA可變剪接的模式
隨著人們對酵母和人類等的深入研究,了解到選擇剪接的模式主要分為以下5種:
①外顯子跳躍(exon skipping):指的是外顯子遺漏性剪接,即當一個外顯子連同它兩端的內含子一起被剪接,而不能在成熟mRNA中出現時,我們說這個外顯子被跳過,結果是機體最終的成熟mRNA刪除了一個或幾個外顯子。
②互斥外顯子(mutually exclusive exons):即相互排斥剪接,意思是一組外顯子只選擇其中之一剪接為成熟mRNA。
③5’端選擇性剪接(5’ Alternative splicing):指可變的5’剪接位點與內含子保守5’剪接位點相競爭,且能與該內含子的3’剪接位點相互作用發生選擇性剪接的過程。
④3’端選擇性剪接(3’ Alternative splicing):可變的3’剪接位點與內含子保守3’剪接位點相競爭,且能與該內含子的5’剪接位點相互作用發生選擇性剪接的過程。
⑤內含子保留剪接(Intron reserved splicing):在剪接過程中選擇性保留整個內含子或部分內含子序列,使其成為成熟 mRNA 的一部分[5]。
3.選擇性剪接的機制
3.1RNA序列決定剪接位點
比較不同真核生物基因的核苷酸序列,發現mRNA前體中內含子區域存在共同序列,意味著這些序列可能是mRNA前體發生剪接的信號。內含子的5’端剪接位點被稱為供體位點(donor site),3’端剪接位點被稱為受體位點(acceptor site)[6]。研究表明,細胞核mRNA前體內含子的5’端邊界序列為GU,3’端邊界序列為AG,這種保守序列被稱為GU-AG法則(又稱Chambon法則),在所有剪接位點類型中所占比例為99.24%。除此之外,生物體內也存在0.7%GC-AG型內含子和0.05%[7]GU-AG型內含子,兩者可能以相同的剪接機制參與剪接過程[4]。
進一步研究表明,外顯子與內含子的交界處序列,及內含子內部的部分序列也是保守序列,可能參與剪接位點的選擇。目前已知,3’端剪接位點AG附近有一段富含10—20個嘧啶核苷酸的區域(Py rich),5’端剪接位點GU附近有一保守序列(5’-GUPuAGU-3’)。同時,在距離3’端上游18-50個核苷酸處也存在一段保守序列,其中的腺嘌呤(A)在不同基因mRNA前體分子中都存在,且含有2’-OH,構成了剪接過程中的分支點[8]。
參與剪接過程的裝置識別mRNA前體分子的剪接位點后,需要經過兩步轉酯反應才能完成整個過程。第一步:位于分支點的保守腺苷酸殘基的2’-OH對5’剪接位點的鳥苷酸磷酸基團進行親核攻擊,使得游離出來的5’磷酸基團與2’-OH形成5’-2’磷酸二酯鍵,伴隨套索結構(lariat form)的形成。第二步:外顯子3’端核苷酸的-OH親核攻擊內含子3’端的磷酸基團,使得內含子在3’剪接位點斷裂,釋放套索結構,促使兩個外顯子成功連接[6]。這兩個環節重復一次,一個完整的內含子被切除,直至完成mRNA的剪接工作。
3.2剪接復合體的組分及功能
參與上述轉酯反應的裝置是剪接復合體(spliceosome),它是介導內含子剪接位點準確識別的保障,主要組分是核小RNA蛋白復合體(small nuclear ribonucleo-protein particle,snRNP)和其他多種蛋白質因子[9]。研究表明,剪接復合體包含約150種蛋白質和5種RNA,核小RNA蛋白復合體由U1、U2、U4/U6和U5的5種核小RNA(small nuclear RNA,snRNA)和與這些RNA相結合的蛋白質組成,每種snRNA長度大約100—300bp核苷酸[8]。除U6外,每個snRNA均含有一個3’端甲基鳥苷帽子結構,存在特定的保守序列[10]。
snRNP在剪接過程發揮著重要作用,其作用過程如下:U1snRNA以堿基互補配對的方式與5’端剪接位點結合,U2snRNA與3’端剪接位點上游的分支點結合,進而形成剪接前體(pre-spliceosome)。U2snRNA的結合需要輔助因子U2AF(U2 auxiliary factor)的引導,U2AF由分子量為65kDa和35kDa的兩個亞基組成,65kDa亞基結合在3’端剪接位點AG附近的富嘧啶區,35kDa亞基結合在3’端剪接位點AG保守序列處[11]。接著,剪接前體進一步與U4、U5、U6-snRNP三聚體相結合,組裝成60S的剪接復合體,從而通過兩步轉酯反應完成整個pre-mRNA的剪接過程。
3.3剪接因子調控選擇性剪接
除去核小RNA蛋白復合體,剪接復合體中的其他多種蛋白質因子都參與剪接因子的形成。這包括富含精氨酸和絲氨酸的蛋白(Ser-Arg rich protein,SR蛋白)、hnRNP、RNA螺旋酶、激酶等。
目前研究表明,SR蛋白家族十分龐大。高等生物體內參與剪接過程的具有RS結構域的蛋白約有50種,并且依據它們各自結構域的特征和功能,可以大致分為3類:①7種經典SR蛋白——此類蛋白C端為SR結構域,N端為1至2個RRM (RNA-recognition motif);②SR類似蛋白:③其他含有RS結構域的蛋白[12]。SR蛋白家族調控的機制是改變其在剪接復合體中的位置,選擇性識別和結合5’端和3’端剪接位點,從而調控選擇性剪接。過程基本如下:SR蛋白家族能夠與外顯子或內含子的順式作用元件識別,如外顯子剪接增強子( exon splicing enhancer,ESE)、內含子剪接增強子(intronic splicing enhancer,ISE)、外顯子剪接沉默子( exon splicing silencer,ESS)和內含子剪接沉默子(intronic splicing silencer,ISS),從而增強或減弱其對5’端和3’端剪接位點的識別的作用[13]。比如,SR蛋白結合到ESE上,不僅能夠促進U1snRNP 對mRNA前體5’端剪接位點的識別結合,還能加強與3’端剪接位點的U2AF的35kDa亞基的相互作用,促使U2snRNA的輔助因子U2AF 結合至3’端剪接位點,從而增強了U2snRNA對分支點的結合能力[14]。
核不均一核糖核蛋白(heterogeneous nuclear ribonucleoprotein,hnRNP)是由分子量為58kD的多聚嘧啶區域結合蛋白(PTB)和RNA組成,參與mRNA的剪接過程[15]。由于PTB能夠與U2AF競爭3’端剪接位點上游的富核苷酸的區域,使得hnRNP具有抑制剪接的作用。
4.選擇性剪接參與植物生長發育
植物中,選擇性剪接的具體功能涉及抗病及應對非生物環境壓力、發育調節等多個方面。以擬南芥為例,選擇性剪接體現在以下幾種生長發育的過程中:①參與春化誘導的開花過程和生物鐘調節過程;②對抗植物所處環境的高鹽、低溫、高溫、干旱、重金屬等非生物因素的脅迫;③防御機體免受各種病原體(包括病毒,真菌,細菌,昆蟲等)的生物攻擊;④參與半自主性細胞器葉綠體、線粒體種基因的選擇項剪接,發揮其特定功能。
具體來說,當外界環境發生變化時,植物由于自身固著生長的屬性,不能像動物那樣可以躲避或遷徙以規避各種逆境的傷害,所以在其進化的過程中形成了適應逆境的機制,選擇性剪接便是極為重要的一種。研究表明,選擇性剪接可以在信號轉導分子、轉錄因子、剪接因子和抗逆功能蛋白等4個層面相互協調,調控植物抗逆基因的表達。比如,與鹽脅迫相關的擬南芥SOS4(salt overly sensitive 4)基因以及水稻OsTM基因編碼的產物分別與調節Na+和 K+的動態平衡和清除活性氧有關,它們都可發生選擇性剪接產生2個轉錄本,2個轉錄本之間的含量比值受鹽脅迫的調控[16]。
除此之外,植物的生長發育各個階段都伴隨著選擇性剪接過程的發生,其中較為典型的是發揮生物鐘調節作用,因此選擇性剪接被又稱為植物體中的溫度計。比如,擬南芥的生物鐘受到多個基因的協同調控作用,其中CCA1/LHY 和TOC1是重要的三個調節基因[17]。
5.展望
選擇性剪接以剪接復合體為主要裝置,在剪接因子參與調控的背景下,通過兩步轉酯反應,形成5種選擇性剪接的模式,使一個基因可以產生多個轉錄本和多個蛋白產物,大大增加蛋白質的多樣性和基于表達的復雜程度。這是選擇性剪接的基本功能。但總體上看,比起對動物基因的研究遠遠不夠,自然界植物中僅有少量基因選擇性剪接功能比較清楚,很多未知的剪接變體尚未發現,已知剪接變體的具體功能也并不完全了解。隨著轉錄組測序技術水平的提高,越來越多的剪接變體將會被發現,認識到這些不同剪接變體的具體功能有助于理解基因功能多樣性,也是今后研究選擇性剪接參與植物生長發育過程功能的一個重要方向。
參考文獻:
[1]徐谷峰,周承亮,黃荷鳳.選擇性剪接調控的研究進展[J].上海交通大學學報(醫學版),2015,35(5):769-772.
[2]萬敬員,張力,葉篤筠.選擇性剪接調控機制的研究進展[J].國外醫學(分子生物學分冊),2003,(06):342-345.
[3]Ola Hansson, Zhou Yuedan,Renstr?m Erik, et al. Molecular Function of TCF7L2: Consequences of TCF7L2 Splicing for Molecular Function and Risk for Type 2 Diabetes[J]. Current Diabetes Reports,2010,(No.6):444-451.
[4]郭小勤,李德葆.植物前體mRNA的選擇性剪接[J].農業生物技術學報,2006,(05):809-815.
[5]董娜,張芳燕,張鵬,等.真核生物mRNA選擇性剪接發生的相關因素[J].科技經濟市場,2011,(04):10-12.
[6]魏金川,徐添翼,吳靜,等.真核生物基因組長內含子遞歸剪接事件的分子機制[J].遺傳,2019,41(02):89-97.
[7]M Burset,Seledtsov I-A,Solovyev V-V. Analysis of canonical and non-canonical splice sites in mammalian genomes[J]. Nucleic acids research,2000,28(21):4364-4375.
[8]朱玉賢,李毅,鄭曉峰,等.《現代分子生物學》(第4版)(雙色版)[J].生命世界,2013,(03):2.
[9]沈佳,張耀洲. mRNA前體的剪接因子[J].生命的化學,2007,(03):221-223.
[10]陳伶莉,胡雪峰.內含子的特異性識別與選擇性剪切[J].生物學通報,2018,53(12):12-15.
[11]章國衛,宋懷東,陳竺. mRNA選擇性剪接的分子機制[J].遺傳學報,2004,(01):102-107.
[12]邵偉,樊玉杰,徐永鎮. SR蛋白家族在RNA剪接中的調控作用[J].生命科學,2010,22(07):710-716.
[13]Soret J, J Tazi. Phosphorylation-Dependent Control of the Pre-mRNA Splicing Machinery[M].2003.
[14]Coté J, S Dupuis, Z Jiang, et al. Caspase-2 pre-mRNA alternative splicing: Identification of an intronic element containing a decoy 3' acceptor site.[J]. Proceedings of the National Academy of Sciences of the United States of America,2001,98(3).
[15]Oberstrass, C. F. Structure of PTB Bound to RNA: Specific Binding and Implications for Splicing Regulation[J]. Science,309(5743):2054-2057.
[16]曾紀晴,張明永.選擇性剪接在植物逆境相關基因表達調控中的作用[J].植物生理學通訊,2006,(06):1005-1014.
[17]徐張紅,趙曉剛,何奕昆.擬南芥生物鐘分子機制研究進展[J].植物學通報,2005,(03):341-349.
指導老師:金燕