馬博涵,姚 丹,焦蘇淇,魯中爽,李澤遠,張愛晶,何浩博,張家野
(吉林農業大學生命科學學院,吉林 長春 130118)
早在20世紀,人們就開始研究非編碼RNA(non-coding RNAs,ncRNAs),但是直到基因組時代的到來,ncRNAs才逐漸受到重視。隨著近年來轉錄組測序技術的發展,越來越多新的ncRNAs逐漸浮出水面,這些新ncRNAs的調控機制已經成為當前生命科學研究的熱點之一。
ncRNAs是一類不編碼蛋白且具有催化活性的RNA分子,廣泛存在于各種生物體中。由于結構不同,ncRNAs可分為線性ncRNAs(linear ncRNAs)和環形 ncRNAs(circRNAs),其中linear ncRNAs包括小ncRNAs如(microRNAs miRNAs)和長鏈 ncRNAs(lncRNAs)。植 物miRNAs在近些年研究較多,其能夠降解或者抑制靶標mRNA的翻譯、抑制目的基因的表達,進而影響生物過程;lncRNAs在動物醫學方面研究比較深入,而通過這兩年在植物中的研究發現,lncRNAs具有順式或者反式調節因子、調控基因的功能;circRNAs是一種新型的ncRNAs,它與miRNAs之間的海綿機制一直是人們研究的熱點,XING等[1]系統分析了我國非編碼RNA研究的主要現狀。2000年以前,國內還未見非編碼RNA相關的文章,但到了2015年,非編碼RNA的文章高達600余篇,占世界此類研究文總數的1/2,表明我國非編碼RNA研究的速度驚人。WANG等[2]研究表明,這些ncRNAs對植物生長發育尤其是在應激反應過程中起著重要的調控作用;YE等[3]對環形非編碼RNA進行研究,發現其在植物生長發育過程中起著重要的調控作用。本研究簡述了ncRNAs的分類及相關功能,總結了近年來植物中幾種主要ncRNAs(miRNAs、lncRNAs、circRNAs)的研究進展,包括這些ncRNAs的特征、鑒定、功能以及相關數據庫等,重點總結了在植物應激反應機制的研究現狀,并展望了未來植物ncRNAs的研究方向,為進一步深入研究這些植物ncRNAs的作用機理提供理論依據。
miRNAs是由內源基因編碼的一類非編碼單鏈小RNA分子,其長度約為22個核苷酸,大多數miRNAs具有高度的保守性和組織特異性[4]。早在1993年,LEE等[5]首次在秀麗隱桿線蟲中發現了第1個miRNA基因lin-4;在隨后的2000年,REINHART等[6]在果蠅體內發現了第2個miRNA基因let-7。與動物相比,雖然植物miRNAs的研究相對較晚,但后期發展迅速。REINHART等[7]在模式植物擬南芥中發現miRNAs基因并鑒定出20種miRNAs;WANG等[8]從水稻中鑒定出20種miRNAs;隨著對植物miRNAs研究的深入,截至2011年,已在植物中發現72種miRNAs。至今,已經在擬南芥(Arabidopsis thaliana L.)、 大 豆(Glycine max L.)、水稻(Orza sativa L.)、煙草(Nicotiana tabacum L.)、玉米(Zea mays L.)、小麥(Triticum aestivum L.)等多種植物中發現許多不同類型的miRNAs[9-13],為今后研究植物中的 miRNAs提供參考。
2012年,KHRAIWESH等[14]報道了miRNAs的生物合成途徑(圖1),在RNA聚合酶Ⅱ(RNA Pol Ⅱ)的作用下,首先由miRNAs轉錄產生初級轉錄物pri-miRNAs,接著Dicer-like1酶(DCL1)將植物初級轉錄物pri-miRNAs剪切加工形成雙鏈 的 pre-miRNAs(precursor miRNAs),premiRNAs為成熟miRNA的前體;然后DCL1酶進行第2次切割形成由pre-miRNAs與成熟miRNAs的互補片段所組成的雙鏈miRNAs,并借助于HST(轉運蛋白Exportin-5在植物中的同源類似物)將miRNAs轉運出細胞核,最終經酶切后在細胞質中形成成熟的miRNAs。成熟的miRNAs進入核糖核蛋白復合體(RNA-induced silencing complex,RISC)并在其中發揮作用。

圖1 植物miRNAs的主要生物合成途徑(改自文獻[15])Fig.1 Major biogenesis pathways of plant miRNAs (Change from reference[15])
通過近10年的研究,一些植物miRNAs的功能已經被鑒定,這些小分子miRNAs在真核基因表達調控中有著廣泛的作用,它們通過抑制靶基因的表達進而調控植物生長發育、株型變化以及器官分化等過程(表1)。

表1 植物miRNAs在信號通路中的作用Table 1 Role of plant miRNAs in signaling pathways
植物miRNAs通過抑制靶mRNA間接地調控目的基因的表達,從而影響植物的生長發育,因此,如何鑒定植物miRNAs的靶基因,成為生物學研究的難點。迄今為止,常用一些生物信息學工具對植物miRNA作用的靶基因進行預測,目前有許多miRNAs數據庫,如miRBase[39]從已經鑒定的不同生物實驗計算收集miRNAs;PmiRKB[40]植物miRNAs信息庫是眾所周知的植物特異性miRNAs的注釋數據庫;miRTarBase[41]是常見的miRNAs與靶標相互作用數據庫;miRPlant[42]、miRanalyzer[43]、miRA[44]、miRDeep-P[45]可用于預測新的miRNAs,miRU[46]、psRNATarget[47]和 TAPIR[48]都可以用來預測植物miRNAs的靶標。但是,通過生物信息學預測靶基因以后,還需要采用如q-PCR、測序等生物學實驗進一步驗證植物miRNA靶基因的準確性,為后續實驗做準備。
lncRNAs是一類長度大于200 nt的ncRNAs,具有啟動子結構和polyA尾巴,存在組織特異性與時空特異性,在不同植物組織之間的lncRNAs表達量不同[49]。ncRNAs最初被認為是轉錄“噪音”,因為它們具有較低的表達水平和序列保守性,但隨著近些年的研究發現,lncRNAs是細胞過程中的關鍵調節因子,可作為基因表達的順式或反式調節因子在轉錄水平發揮作用,具有調控植物生長發育的功能。
近年來,植物lncRNAs的研究突飛猛進,目前在擬南芥[50]、小麥[51]、水稻[52]、獼猴桃[53]、玉米[54]、桃樹[55]、黃瓜[56]等鑒定出了大量lncRNAs,而對lncRNAs功能的研究是目前生物學研究的熱點和難點之一,探究植物lncRNAs的作用機制有助于更加深入地理解其特征及相關生物學功能。雖然lncRNAs不能編碼蛋白,與已知編碼蛋白的基因類似,一些植物lncRNAs可以充當ceRNAs,通過靶標靶向調控miRNAs,從而阻斷miRNA與其靶標之間的相互作用,影響植物的生長發育,如BARDOU等[57]報道了擬南芥中低磷誘導的lncRNAs IPS1采取模擬靶基因的方法,解除了miR399對靶基因PHO2的抑制,因此調控磷反應過程進而達到穩定狀態;WANG等[58]報道了幾種lncRNAs被鑒定為響應番茄黃葉卷曲病毒(TYLCV)感染的番茄miRNA的靶標模擬物;最近一項研究報道,有13種lncRNAs被預測為96種miRNAs的前體,這些miRNAs參與了對甘藍型油菜菌核病菌的感染過程[52];針對小麥的一項研究報道了3種lncRNAs作為miR-2004和miR-2066的前體,16種lncRNAs作為97種siRNAs響應白粉病感染的前體[59]。雖然已經有lncRNAs作用機制及功能的相關報道,但其在植物上的研究還不夠深入,因此還有待于進一步研究植物中不同類型lncRNAs的特征,這對作用機制的研究具有很大幫助。
為了鑒定lncRNAs及其生物學特征,已經開發了幾個數據庫用于進一步的lncRNAs研究。例如,NONCODE是16種ncRNAs的完整收集和注釋數據庫,涵蓋動物中各種類型的ncRNAs,并使用CNCI軟件評估lncRNAs編碼潛力[60],然而在植物中,NONCODE中僅包括擬南芥lncRNAs;lncRNAdb[61]提供了287個真核生物lncRNAs的綜合注釋,以及它們實驗驗證的生物學功能,lncRNAdb中同樣只有很少的植物lncRNAs,包括7個擬南芥lncRNAs和2個水稻lncRNAs;QUEK等[62]開發了PlncDB,它提供了與lncRNAs相關的全面信息,但也僅適用于擬南芥;PNRD[63]是最大的植物lncRNAs數據庫,PNRD包括主要有4種植物物種的lncRNAs序列,包括擬南芥、水稻、楊樹和玉米,因此,如果鑒定植物中的lncRNAs,PNRD是首選數據庫。相比較鑒定動物lncRNAs而言,鑒定植物lncRNAs較少且受物種的局限,還有待于進一步研究并建立植物lncRNAs相關數據庫。
circRNAs是一類內源性非編碼環狀RNA,具有3’和5’末端共價結合形成的閉合環狀結構,具有組織特異性。與傳統的線性RNA相比,circRNAs沒有5’末端帽子結構和3’末端poly(A)尾巴,不易被核酸外切酶RNaseR降解,因此circRNAs結構穩定;一些circRNAs含有miRNAs應答元件,能夠miRNAs靶向結合,在細胞中與miRNAs存在海綿機制作用,消除miRNAs對靶基因的抑制,進而調控靶基因的表達。
目前發現的circRNAs主要來源于基因外顯子(exon),這些circRNAs廣泛存在于多種真核生物中,circRNAs的生物合成有幾個途徑(圖2)。首先外顯子環化的效率依賴于外顯子附近出現的剪切位點,正常情況下反向剪切效率一般都低于相同位置的線性轉錄本,這是由于剪切子在反向剪切位點位置上的組裝不利于5'端和3'端的連接;大多數的circRNAs包含幾個外顯子,其外顯子序列用于反向剪切,然后同一個基因通過可變剪切能夠產生多個circRNAs,在此過程中,環化的外顯子側翼內含子中可能會頻繁出現順式調控元件,如形成RNA雙鏈結構將明顯增強反向剪切,另外內含子序列中短的順式作用元件能夠識別RNA結合蛋白(PBRs)進而促進外顯子環化;circRNAs結合蛋白介導的調控合成途徑除了順式作用元件過表達RBPs,也可以在側翼內含子序列中添加RNA蛋白結合位點,同樣能促進circRNAs的表達。
SANGER等[64]于20世紀70年代在植物病毒體中發現了第1個circRNAs。2014年在擬南芥根部首次發現circRNAs,隨后2016年YE等[65]補充報道了水稻中有12 307個circRNAs,模式植物擬南芥中有6 012個circRNAs(表2)。2015年,LU等[66]通過高通量測序和RNA-seq數據的生物信息學計算后,在水稻中鑒定了2 354個circRNAs,其中1 356是外顯子來源的circRNAs,一些差異表達的circRNAs表現出組織特異性。LIU等[67]對不同生長階段的擬南芥葉片進行轉錄組測序,通過對擬南芥葉片生長與衰老過程的表達譜進行分析,鑒定了168個circRNAs,其中包括40種新型circRNAs,在擬南芥葉片中有158個是基因外顯子來源的circRNAs。通過GO分析和KEGG分析,一些circRNAs被注釋,從中發現circRNAs具有調控擬南芥葉片衰老的功能。

圖2 circRNAs的生物合成Fig.2 Biosynthesis pathways of plant circRNAs

表2 植物circRNAs鑒定Table 2 Identification of plant circular RNAs
ZHANG等[68]在玉米和擬南芥中分別鑒定了2 174和1 354個circRNAs,并且大多數差異表達的circRNAs參與干旱反應途徑。截止至目前,在玉米、大豆、水稻、小麥、大麥、擬南芥、獼猴桃(Pseudomonas syringaeL.)、番茄(Solanum lycopersicumL.)等植物中鑒定到了circRNAs (表2)。由于存在植物本身的特異性和取樣組織部位的特異性,不同樣品之間的測序深度不同,導致當前報道的circRNAs數量有明顯差異。
近年來,ZHAO等[69]通過轉錄組測序和生物信息學分析在鑒定了大豆中circRNAs,對3 904個circRNAs進行了GO分析和KEGG分析,在分子功能方面,GO分析的注釋包括核苷酸結合、ATP結合、蛋白質結合和mRNA加工等功能。在生物過程方面,circRNAs主要參與一些代謝過程;KEGG途徑分析顯示,circRNAs在檸檬酸循環途徑、氨酰基-tRNA生物合成、糖酵解/糖異生、甘油磷脂代謝、丙酮酸代謝和氧化磷酸化等相關途徑中顯著富集。ZHAO等[74]運用轉錄組測序技術對大豆抗蟲基因進行分析,從中鑒定出5 367個circRNAs,并預測在大豆中有5 356個circRNAs能與miRNAs靶標結合,這些miRNAs來自69個家族,包括miRNA1520、miRNA172、miRNA159、miRNA156和 miR395家 族 等,其中miRNA1514家族與circRNAs結合位點的數目最多。
目前在植物中鑒定到的circRNAs數量較少,鑒定到的miRNAs不夠全面,如在miRNAs一些新的數據庫中,鑒定到的玉米miRNAs有325個,但在動物中(包括人類)已達到2 000多個,這讓circRNAs和miRNAs之間的靶向關系變得模糊,因此有待于進一步研究驗證。
植 物 ncRNAs除 了 miRNAs、lncRNAs、circRNAs外,還有幾種較重要的RNA。例如,snRNAs核內小分子RNA(small nuclear RNA),它參與mRNA前體的加工,是真核生物轉錄后加工過程中RNA剪接體的主要成分;snoRNAs核仁小分子RNA(small nucleolar RNAs),它在核糖體RNA 的生物合成中發揮重要作用,還能指導snRNA、tRNA 和mRNA 的轉錄后修飾;siRNAs是siRISC的主要成員,激發與之互補的靶標mRNA的沉默;piRNAs(Piwi-interacting RNA)目前研究較少,它是一類長度為24~32 nt的單鏈小RNA,具有專一性,piRNAs主要與PIWI亞家族成員Piwi蛋白或AGO3蛋白質結合而發揮作用。隨著ncRNAs研究的深入,會出現越來越多新的ncRNAs。
植物ncRNAs的作用機理是當今分子生物學研究的前沿與熱點之一,鑒定ncRNAs的種類及功能,闡明ncRNAs的生物合成途徑是該領域的基本科學問題。近年來開發的單細胞測序和單分子測序可能會為鑒定植物中新的ncRNAs提供機會,因此,有必要開發新的生物信息學方法來鑒定更多的 ncRNAs[62]。雖然 miRNAs、circRNAs和lncRNAs在植物應激反應中取得了顯著進展,但它們之間的互相作用還有待進一步研究。研究miRNAs、circRNAs、lncRNAs之間的表達模式并構建網絡將會很有趣,這使我們對應激反應中基因調控網絡有更深的了解。即使編碼蛋白質的基因在植物中相對變化較少,隨著ncRNAs的增加,植物的結構域是動態的,每年都在不斷地發現新成員。
除在水稻和大豆等作物中有一些研究外,當前對植物ncRNAs的生物學功能和作用機制的研究還主要集中在擬南芥等模式植物方面。植物中circRNAs和lncRNAs的研究還處于起步階段,尤其是與植物circRNAs相關的問題有待深入研究,包括植物circRNAs的作用機制和生物學功能;還有受生物和非生物等環境因素所調控的比較重要的分子機制等,包括現在基因編輯CRISPR/Cas9技術的通用性可能對ncRNAs功能表征有一定作用,預計這些新的技術將在ncRNAs研究中得到廣泛應用。期望不久的將來會發現更多新的ncRNAs、成熟的研究技術以及利用ncRNAs的作用機制促進分子的植物育種。