徐 悅,王 希,申子萌,5
(1黑龍江大學現代農業與生態環境學院/中國農業科學院甜菜研究所,哈爾濱 150080;2黑龍江省普通高等學校甜菜遺傳育種重點實驗室/黑龍江省甜菜工程技術研究中心,哈爾濱 150080;3國家糖料改良中心/中國農業科學院北方糖料作物資源與利用重點開放實驗室,哈爾濱 150080;4上海信致醫藥科技有限公司,上海 200000;5中資藍天生態科技(北京)有限公司,北京 100083)
可變剪接又稱選擇性剪接(Alternative Splicing,AS),指在一個mRNA 前體中通過不同的剪接方式產生不同的mRNA 異構體的過程。它是真核生物中常見的生物學事件,是生物體產生多種蛋白質的一個重要機制。在高等真核生物中,可變剪接的基本機制是相似的,然而,植物和動物之間在基因結構、剪接和轉錄機制方面存在著大量的差異,與之相關的可變剪接的調控也是植物特有的[1],如誘導開花、響應非生物脅迫、節律現象等[2-4]。隨著高通量測序技術的發展,越來越多的可變剪接事件在高等植物中被發現。以植物為對象展開可變剪接的研究有助于幫助我們對花發育、脅迫響應、生理適應等多種過程的深入了解。我們可進一步了解其性狀及關鍵基因的分子機制,為研究植物可變剪接提供新的思路。本研究介紹了可變剪接的多樣性、基本機制、研究方法以及擬南芥、大豆、水稻、玉米、甘藍型油菜可變剪接的最新進展,發現了可變剪接與植物生長發育、晝夜節律等方面存在一定相關性,在基因調控、蛋白質多樣性和復雜性方面也發揮著重要作用,為未來深入研究植物可變剪接提供了幫助。
可變剪接在動植物細胞中都有發生,可分為7 種類型(圖1):內含子保留(Intron Retention,IR)、外顯子跳躍(Exon Skipping,ES)、互斥外顯子(Mutually Exclusive Exon,MEE)、5’端可變剪接(Alternative 5’splice Site,A5SS)、3’端可變剪接(Alternative 3’splice Site,A3SS)、首部外顯子可變剪接(Alternative First Exon,AFE)、尾部外顯子可變剪接(Alternative Last Exon,ALE)。植物中出現最多的類型是內含子保留,如水稻基因中內含子保留占可變剪接事件總數的47%以上[5],擬南芥基因中內含子保留事件的發生約為56%[6]。

圖1 可變剪接的類型
前體mRNA 的剪接對真核基因組編碼信息的準確表達起到關鍵作用。剪接過程包括識別剪接位點、形成剪接復合體、剪切內含子、連接外顯子及其產物、復合體解散。整個過程是由剪接體執行的,剪接體由5個小核糖核蛋白復合體(snRNPs)和非snRNP蛋白因子組成[7]。剪切位點的選擇不僅取決于核心剪接體成分,而且在很大程度上還取決于其他RNA 結合蛋白,主要是富含絲氨酸/精氨酸(SR)的蛋白質和異質核糖核蛋白(hnRNPs),它們與位于內含子或外顯子的順式調控元件結合,從而激活或抑制剪接。SR蛋白和hnRNPs都參與了除剪接之外的轉錄后調控的各個步驟[8-10]。
可變剪接的分析及鑒定方法主要有表達序列標簽(EST)[11-13]、cDNA微陣列技術、生物芯片法[14]、第二代測序[15]、單分子測序等。
用表達序列標簽可以發現新的可變剪接位點,但準確程度要依賴EST序列數據的質量,還要對結果進行生物學的分析驗證[16]。Modrek等[17]提出了EST數據預測可變剪接事件的局限性,如序列質量好壞不定,不能覆蓋全部基因等。Sablok等[18]使用表達序列標簽的方法,比較了蘋果、葡萄、甜橙和草莓不同果樹的可變剪接事件,分別鑒定到蘋果有2039 個可變剪接事件,葡萄有2454個,甜橙有1425個,草莓有444個。
cDNA 微陣列技術可大規模的進行可變剪接分析,并且剪接效率和準確性較EST 也有了大幅提升,但其設計過程和數據處理都比較復雜[19-21]。
基于生物芯片技術的研究方法主要有剪接連接點芯片技術和外顯子芯片技術兩種類型。利用外顯子與外顯子連接部分的片段作為探針而設計的芯片可以用來驗證特定可變剪接的發生,并研究其表達特性,適合全基因組范圍的研究[22]。
第二代測序技術具有定量更準確、可重復性更高、適用范圍更廣、分析更加可靠等優點,為基因組和轉錄組的深入硏究提供了可能[23-25]。全基因組測序的成本也隨著第二代測序技術的發展而逐步降低。轉錄組高通量測序對于研究可變剪接及其調節來說是一個強有力的實驗工具,但同時也必須要有特殊的分析方法和工具。RNA-Seq測序提供了深度的轉錄組數據,可以用于識別比對組之間差異的可變剪接事件。
單分子測序技術又稱第三代測序技術,測序速度極快,能夠直接對RNA 進行測序,不需要逆轉錄[26-29]。操作過程簡單,能夠較準確的預測可變剪接事件,但目前單分子測序技術的數據較少,很難得到廣泛的應用。
研究表明,60%的擬南芥內含子都經歷了可變剪接[30]。截至2004年,擬南芥中可變剪接的基因達到了291 個,共形成679 個轉錄本[31]。Werneke 等[32]最早發現RCA基因可以在擬南芥的葉片中發生可變剪接,形成了44 kd和47 kd兩個同源體,并且這兩個同源體都能夠催化Rubisco的活性。邢永強等[33]通過GEO數據庫的RNA-seq 數據,使用SUPPA2 等工具識別了擬南芥的種子、根、葉、花、花梗、節間、長角果7種組織的可變剪接事件,鑒定擬南芥不同組織的可變剪接事件,結果表明,內含子保留是可變剪接類型中占比最多的,而互斥外顯子占比最低,這也證實了內含子保留是植物可變剪接事件中發生最多的類型。花和花梗上發生的可變剪接事件最多,而節間和長角果只鑒定了少量的可變剪接事件,進一步分析出可變剪接可對擬南芥花器官的生長發育起到一定的調控作用,為研究可變剪接與植物基因生物學的關系提供了幫助。
Shen 等[34]使用高通量測序鑒定了28 個不同發育階段的大豆樣品,包括子葉、根、枝、葉、花、豆莢,還有處于不同發育階段的種子,最終發現超過63%的基因都經歷了可變剪接。在分析的154469 個可變剪接事件中,內含子保留是最豐富的類型,占所有事件的26.47%,而外顯子跳躍只占8.89%,這與擬南芥的觀察結果一致。可變剪接在較老發育階段的組織中發生的數量較低,多發生在較年輕發育階段的組織中。在剪接位點方面,GT-AG位點在所有可變剪接類型中所占比例最高,而GC-AG 是第二常見的剪接位點,這也與其他植物相一致[35-36]。通過計算分析表明,可變剪接的頻率和類型的變化與基因特征和基因轉錄水平的變化顯著相關。研究表明,基因結構和轉錄水平的變化可能在調控可變剪接中起重要作用。
Wei等[37]對節水抗旱水稻(WDR)保持系HuHan2B和輪回親本HanfengB 的轉錄組序列進行了可變剪接復雜性分析。內含子保留是水稻可變剪接的主要類型,占可變剪接觀察事件的42%。差異表達分析顯示,轉錄本在不同的品種和條件下會優先表達。根據基因本體論預測,HuHan2B干旱誘導轉錄產物的生物學功能在轉錄調控、葉綠體成分和非生物刺激反應等基因中顯著富集,而在生殖發育過程中主要富集于HanFengB。此外,一些基因被證實以干旱誘導的方式積累新的剪接轉錄本。這些結果表明,HuHan2B 和HanFengB具有相似的可變剪接特征,但在轉錄調控網絡中可變剪接含量增加的基因子集可能有助于通過育種提高水稻保持系HuHan2B 的抗旱性。研究結果表明,可變剪接的復雜性通過一個多外顯子基因的轉錄本的選擇性表達,促進了遺傳網絡的協同調控。
Lu等[38]報道了水稻中可變剪接的基因比例較高,58%的可變剪接相關基因具有多個可變剪接事件,導致單個基因產生大量轉錄本。他們還證明了水稻中59%的可變剪接事件是特異性的。對可變剪接基因的基因結構分析表明,水稻中76%的可變剪接事件發生在蛋白質編碼區。可變剪接在水稻基因調控、蛋白質多樣性和復雜性方面也起著重要作用。
玉米55.3%的基因都會受到可變剪接的影響[39]。Tian 等[40]在熱帶玉米系CML288 中鑒定了3 個ZmCCA1 剪接異變體,他們通過同源克隆和3’RACE技術證實了ZmCCA1 經歷了豐富的可變剪接。可變剪接可能受到組織類型、光周期和非生物脅迫的影響。通過克隆ZmCCA1剪接變異體,得到了一個高度保守的N末端和不同的C末端,它們受光周期、組織類型和干旱脅迫的影響。此外,ZmCCA1基因的可變事件可能發生物種特異性。因此,此研究為了解玉米ZmCCA1在玉米抗旱性中的作用奠定了基礎,為進一步揭示玉米赤霉病的晝夜節律、可變剪接和非生物脅迫提供了新的證據[41-42]。
可變剪接是調控植物對非生物脅迫反應的重要機制[43-46]。肖燕等[47]在研究甘藍型油菜響應低氮脅迫時發現,甘藍型油菜在經過3 h和72 h的低氮處理后,地上部和地下部都發生了可變剪接。這一發現說明甘藍型油菜可以利用可變剪接的調控積極適應低氮脅迫。
研究發現,甘藍型油菜生長發育對硼的需求遠高于其他品種。韓林宏等[48]和Gu 等[49]使用高效品種Qingyou10 和低效品種Westar10 進行對比實驗。2 個品種無論是在缺硼還是硼充足的情況下,內含子保留和3’端可變剪接都比其他類型的可變剪接多。在缺硼條件下,甘藍型油菜的可變剪接事件有明顯的上升,表明可變剪接可能是轉錄后調控基因表達的重要方式,可變剪接的增加可以提高分子的可塑性以適應非生物脅迫。
隨著生物信息學、轉錄組學、測序技術的不斷進步,越來越多的剪接體被發現,植物的可變剪接也取得了一些新的成果。深入研究植物基因的可變剪接,將會為提高植物抗逆性、農作物產量等提供幫助。可變剪接數據庫也在更新豐富,研究者應結合基因特征提高預測可變剪接事件的準確度。雖然目前已經發現了很多剪接異變體,但對其生理功能卻知之甚少,值得進一步研究。