沈錦純 張琳淳 李越 趙竑博
(華南農業大學園藝學院,廣東 廣州 510642)
高通量基因測序和轉錄組研究表明,真核生物基因組中只有極少數的轉錄本可以用于蛋白質的編碼,僅占全基因組的1%~2%,而剩下的大部分轉錄本是非編碼RNA(non-codingRNA,ncRNA)[1]。ncRNA曾被認為是不具有特定生物學功能的“轉錄噪聲”[2],但隨著轉越來越多的ncRNA被發現和鑒定,許多ncRNA已被證明在生物體的生長發育中具有關鍵功能[3-6]。根據轉錄本的長度,ncRNA分為小于200 bp的短鏈非編碼RNA(small non-coding RNA)和大于200 bp的長鏈非編碼RNA(long non-coding RNA,lncRNA)[7,8]。與得到廣泛研究的短鏈非編碼RNA相比,長非編碼RNA(lncRNA)的研究才剛剛處于起步階段,屬于研究尚不足夠的一類非編碼轉錄本[9]。
本文主要介紹了lncRNA的類型和生物學特性,總結了lncRNA在蔬菜作物生命歷程中發揮的各種生物學功能以及其功能發揮所涉及的調控基因表達的分子機制,以期為在蔬菜作物上進一步研究lncRNA提供重要參考依據。
紫花苜蓿早期根瘤蛋白基因enod40編碼的正義lncRNA是第1個被鑒定并分離出來的植物lncRNA,定位于根瘤原基細胞的細胞質中,在植物發育中起到“核調節因子”的作用[10]。enod40的發現促使了人們對核RNA結合蛋白MtRBP1的亞細胞定位的新認識[10,11]。此后,對植物lncRNA的研究更加深入,其各種生物學功能也逐漸被驗證。如,調節miRNA活性[12]、調控表觀遺傳[13]、參與重塑染色質結構[14]等。
依賴于其描述性和獨特性,lncRNA的分類方式多達數10種[8]。其中,最常用的是根據lncRNA轉錄位置的不同,將其劃分為5類,如圖1,分別為啟動子型lncRNA(enhancer lncRNA,eRNA):從增強子區域轉錄而來的;內含子型lncRNA(intronic lncRNA):從內含子區域轉錄而來;正義lncRNA(sence lncRNA):從基因重疊區域轉錄而來的;天然反義lncRNA(antisense lncRNA,NAT):從編碼基因互補區域轉錄而來;基因間lincRNA(long intergenic noncoding RNAs,lincRNA):從2個基因之間的區域轉錄而來。其中,lincRNA數量最多,占總數70%~90%[3,15-17]。
1.2.1 轉錄本的豐度和大小
lncRNA的轉錄本長度超過200個核苷酸,不具備或具備極低編碼蛋白質能力,廣泛存在于白菜、黃瓜、番茄和辣椒等蔬菜作物中[18]。根據方法不同,同一物種中lncRNA的數量也有差異,如利用鏈特異性RNA測序等鑒定的技術,在辣椒中分別鑒定出10655、11999個lncRNA[3,19]。lncRNA通常比蛋白質編碼的mRNA轉錄本短、表達量低且包含的外顯子較少[5]。另外,部分lncRNA含有開放閱讀框架(ORF),且具有產生小肽的潛力[20]。
1.2.2 結構
大多數lncRNA由RNA聚合酶II合成,其結構與mRNA相似,具有5’末端帽子結構和3’末端poly(A)尾巴[21-23]。少數的lncRNA由聚合酶III、IV和V合成,并充當小干擾RNA(siRNA)的前體或在RNA定向的DNA甲基化中用作支架[24]。lncRNA可以折疊成二級或更高級的結構,使其在靶向蛋白質或基因位點時更加靈活[25,26]。
1.2.3 亞細胞定位
在基因表達過程中,mRNA通常被輸出到細胞質中進行翻譯。相比之下,加工后的lncRNA的位置沒有太多限制,可以駐留在細胞核中,也可以輸出到細胞質或其它亞細胞位置和細胞器,如線粒體[27]。lncRNA通常更容易在細胞核中富集,這得益于lncRNA中的序列元件以及RNA結合蛋白[27,28]。植物中許多已知的lncRNA定位于細胞核,并在細胞核內起作用。如,與番茄成熟相關的lncRNA1459定位于細胞核,通過促進乙烯和類胡蘿卜素生物合成來調控果實發育[26]。
1.2.4 表達特異性和保守性
lncRNA表達具有高特異性和低保守性的特性,其中特異性包括種系特異性和組織特異性。在擬南芥中,約有32%的lncRNA表現出器官特異性表達[29];在卷心菜中,lncRNA BoNR8在萌發種子根伸長區的表皮組織中特異表達[30]。木薯在干旱脅迫下,lncRNA的表達具有組織特異性[31]。大多數lncRNA的序列保守性較弱,其表達隨組織的不同,發育階段甚至種與種而變化[32]。研究表明,白菜中只有一小部分lncRNA與其它蕓苔屬植物中lncRNA具有較高的同源性[33]。
最早關于lncRNA的研究主要在動物和人類醫藥領域開展,在植物中的研究也僅限于在模式作物擬南芥中進行。但隨著轉錄組測序和生物信息學等檢測分析技術的發展,近幾年研究人員在番茄、辣椒和甘藍型油菜等蔬菜作物中也開展了相關的研究,并建立了相應的lncRNA數據庫[26,34,35]。lncRNA作為重要的新型調控因子,在蔬菜作物中的功能研究成為了人們關注的焦點。現有研究表明,lncRNA在蔬菜作物生殖發育、果實成熟、生物脅迫和非生物脅迫等方面發揮關鍵的調節作用[3,19,36]。本文系統地整理了lncRNA在蔬菜作物中的生物學功能和功能發揮的具體分子機理。
生殖發育是植物繁衍過程中至關重要的一環[37-40]。目前,許多lncRNA被證實在花粉發育、雄性育性、受精以及種子萌發等生殖發育過程中起調控作用,如BcMF11、bra-eTM160-1、bra-eTM160-2、LINCAP2[37-40]。在油菜(Brassica Campestris SSP)中,BcMF11在花粉中特異表達,參與花粉發育和雄性育性[39]。lncRNA(bra-eTM160-1和bra-eTM160-2)通過抑制miRNA表達,上調生長素反應因子(ARF),參與花粉形成和雄性育性。LINCAP2是一個與花發育調控因子基因APETALA2(AP2)相近的基因間連接lncRNA,當被蕪菁皺縮病毒感染時,AP2表達下調,而LINC-AP2的表達上調,并且LINC-AP2的強烈上調與花結構異常相關。BrMYB80bSSLncRNA過表達導致白菜轉基因植株的部分花粉出現4個萌發溝[40]。此外,許多研究表明lncRNA在花發育、雄性不育等過程中具有潛在作用[40-42]。如,辣椒不育系中lncRNA1336、lncRNA7479和lncRNA8303的下調可能導致花粉和絨氈層發育缺陷,最終導致辣椒敗育[19]。Khemka等以鷹嘴豆為研究對象,發現lncRNA作為miRNA的靶標,與各種發育和生殖過程的調控網絡有關[43]。BoNR8是由甘藍RNA聚合酶III編碼產生的lncRNA,在擬南芥中過表達BoNR8的品系種子發芽率降低,根和角果生長降低[30]。
近年來,關于lncRNA調控蔬菜作物果實成熟的研究也取得了一定進展。lncRNA主要通過調控激素信號傳導、物質合成(類胡蘿卜素和乙烯)、糖類及主要有機酸代謝等過程,從而控制蔬菜作物果實發育[3]。在番茄中,lncRNA1459與果實成熟相關,影響番茄果實中類胡蘿卜素和乙烯的產生以及番茄紅素積累。利用CRISPR/Cas9系統敲除lncRNA1459會使番茄的成熟期嚴重滯后[26]。Zhu等研究發現,沉默番茄基因間lncRNA(lncRNA1459和lncRNA1840)明顯延緩了野生型果實的成熟[44]。DcMYB7是胡蘿卜中關鍵花青素生物合成轉錄因子,Chialva等通過研究發現,lncRNA可能通過與DcMYB7相互作用激活花青素生物合成[45]。Zuo等人通過對差異表達lncRNA的靶標進行了分析,發現一些靶標與果實的顏色、質地、風味和香氣形成以及ET和其它激素途徑有關,這表明lncRNA在辣椒成熟過程中具有特異的調控功能[3]。另外,lncRNA還可以通過反式調控編碼miRNA降解核酸酶的基因Capana04g001478,切割和降解miRNA,從而調控辣椒的成熟[6]。
蔬菜作物在生長發育過程中經常遭受各種生物脅迫,如真菌、細菌、病毒和線蟲的侵染[46]。其中,真菌病害對蔬菜作物危害尤為嚴重,如馬鈴薯晚疫病菌引起的晚疫病是制約當前番茄生產重要因素之一[47]。在番茄中,lncRNA與對致病疫霉的抗性有關。如lncRNA16397、lncRNA33732和lncRNA23468的過表達增強了番茄對侵染疫霉的抗性,l而沉默lncRNA42705、ncRNA08711和lncRNA23468則降低了抗性[48]。進一步研究表明,lncRNA通過誘導相關基因的表達,減少活性氧積累,減少細胞膜損傷,從而增強對致病疫霉的抗性[49]。如lncRNA16397、lncRNA23468和lncRNA39026分別調控SlGRX、NBS-LRR和PR基因的表達,誘導番茄對致病疫霉產生抗性[47-49]。此外,lncRNA可能通過調節ceRNA以誘騙miRNA,并作為其靶基因,增強對致病疫霉的抗性[50]。在甜瓜中,lncRNA可能通過調控轉錄因子CmWRKY21和氧化還原途徑相關基因的表達,從而提高甜瓜對白粉病的抗性[16]。有益的根際細菌可以通過誘導系統抗性來抵抗葉片病原菌的入侵,研究表明lncRNA(MSTRG18363)參與了該過程。在番茄植株中,枯草芽孢桿菌SL18R誘導MSTRG18363的表達有利于調節miR1918和SlATL20的表達,從而激發番茄葉片對灰霉病菌侵染的系統抗性。
在抗細菌方面,lncRNA與馬鈴薯響應胡蘿卜軟腐果膠桿菌危害的防御基因表達高度相關[51]。在抗病毒方面,lncRNA具有增強番茄黃化曲葉病毒(TYlCV)抗性的功能,對部分接種前后差異表達的lncRNA進行瞬時沉默分析后,番茄接種TYlCV后病毒量顯著上升[15,52,53]。根結線蟲嚴重影響植物的生長和生產力,幾種商品化生防菌劑可以提高植物對根結線蟲的抗性,如惡臭假單胞菌[54]。Yan等發現lncRNA參與了惡臭假單胞菌Sneb821誘導的番茄對南方根結線蟲的抗性[36]。在小白菜中,lncRNA通過與mRNA形成共表達的調控網絡參與油菜瘧原蟲侵染反應[55]。
研究表明,蔬菜作物lncRNA參與調控非生物脅迫響應過程[35,50,56]。其中,蔬菜作物lncRNA在調控干旱、冷害以及高溫脅迫方面的研究較多,而在其它非生物脅迫方面的研究則較為不足,如重金屬毒害、營養缺乏和鹽分脅迫[57]。
2.4.1 參與干旱應答過程
植物可以通過調控各種生理、生化和復雜的分子網絡,包括各種信號轉導通路的級聯,來緩解干旱逆境造成的不利影響[35,58]。近年研究表明,lncRNA在蔬菜作物中參與干旱應答過程,其作用機制是lncRNA與基因、miRNA、mRNA以及轉錄因子形成共表達網絡[59,60]。在不同的蔬菜作物中已經報道了干旱響應型lncRNA,如番茄[50,56]、黃瓜[35]、木薯[31,61]、芥子油菜[62]。Eom等研究表明,番茄lncRNA通過lncRNA-mRNA共表達在干旱應答過程中發揮關鍵作用[56]。Li等人在木薯中鑒定出153個NAT lncRNA參與干旱脅迫的反應[61]。其作用機制是在干旱條件下lincRNA340的表達增加,從而降低了靶標miR169的活性,最終提高了核因子Y(NF-Y)基因的表達[61]。Ding等人表明,lncRNA Tons_00060863和Tons_00097416分別參與干旱脅迫下的脫落酸和乙烯信號轉導途徑[31]。StFLORE是馬鈴薯StCDF1轉錄因子的天然反義lncRNA,研究發現,轉錄因子StCDF1通過與StFLORE啟動子中的DOF基序結合來負調控后者的表達,從而調控氣孔生長和晝夜開放來調節水分損失[63]。StFLORE轉錄本中的自然突變和CRISPR-Cas9突變都使植物對水分限制條件的敏感度增加[63]。相反,StFLORE的過表達或者StCDF1的下調導致的StFLORE的高表達都可以通過減少水分損失來提高抗旱性[63]。
2.4.2 提高蔬菜作物的耐熱性
高溫脅迫是主要的非生物脅迫,會嚴重影響植物的生長、生理、代謝活性發育和產量表現[64]。在不結球白菜中,位于蛋白質編碼基因Bra021232下游的lncRNA TCONS_00004594通過順式調節其表達水平,參與耐熱性調控[65]。此外,lncRNA TCONS_00048391和TCONS_00010856充當油菜miR164a的內源性模擬靶標,參與調節熱應激反應[65]。因此,在熱脅迫下,油菜miR164a的上調和lncRNA TCONS_00048391的下調以及靶標Bra030820(NAC1)基因在“XK”品種中表現出耐熱性。lincRNA159與保守的miR164的結合降低了靶向miR164的3個NAC基因的表達[61]。He等人對黃瓜中對熱應激反應的lncRNA,circRNA和miRNA進行系統的鑒定,發現lncRNA與mRNA競爭miRNA結合位點,推測lncRNA可能通過植物激素信號轉導途徑與miR9748相互作用,以響應高溫脅迫[66]。
2.4.3 參與冷害應答過程
最新報道證明,lncRNA在甘藍型油菜、辣椒、木薯、番茄等蔬菜作物中參與冷脅迫調控[34,61,67]。Shea等在甘藍型油菜中鑒定出2088個lncRNA,其中位于BrFLC基因位點的3個lncRNA有助于冷脅迫調控[68]。在甜椒中,為揭示全基因組響應冷害的lncRNA,共捕獲了380個lncRNA和3個完整的ceRNA(內源競爭RNA)網絡,表明lncRNA在甜椒冷害過程中具有特定的調控作用[34]。在木薯中,作為miR164模擬靶標的lincRNA159降低了冷脅迫下NAC基因的表達[61]。在番茄中,lncRNA和大量的編碼冷脅迫相關蛋白的基因表達,如冷熱休克蛋白,這表明lncRNA可能參與了冷害過程[67]。
miRNA是lncRNA功能實現的重要環節,二者之間的相互作用在植物的發育調節中發揮著關鍵作用[9,69]。目前,lncRNA與miRNA主要有2種互作方式,單個lncRNA與多個miRNA相互作用;單個miRNA與多個lncRNA相互作用[70]。Wang等人在LeERFl轉基因番茄中鑒定出LeERF1是miRNA1919b和miRNA1919c的前體,lncRNAZ081是miRNA6027的前體[71]。Li等在木薯中鑒定出12個lncRNA作為11種已知的miRNA前體,在這些lncRNA中,有7個lncRNA在寒冷、干旱脅迫的響應中差異表達,表明這些miRNA可能參與了脅迫響應[71]。Baruah等在辣椒中鑒定了30個lncRNA作為miRNA的前體,其中包括miR167b、miR167c、miR167e、miR5300、miR5303d等[70]。
模擬靶標是指一類可與miRNA相結合,進而抑制miRNA的活性但又不被miRNA降解的內源非編碼RNA[62]。先前研究表明,lncRNA可以被miRNA靶向,也可以作為內源性模擬靶標而發揮作用[72,73]。其主要機制是lncRNA按照堿基互補原則與miRNA發生特異性結合,阻止miRNA對靶基因的降解,進一步調控基因的表達[9]。在番茄中,Wang等發現lncRNA Slylnc0195和Slylnc1077分別作為miR166和miR399的模擬靶標參與TYLCV感染的應答[53]。而在甘藍型油菜中,lncRNA TCONS_00048391和TCONS_00010856充當miR164a的內源性模擬靶標,參與調節熱應激反應[65]。在馬鈴薯中,lncRNA作為miRNA的模擬靶標參與發芽調控[74]。Khemka等以鷹嘴豆為研究對象,發現lncRNA作為miRNA的靶標,與各種發育和生殖過程的調控網絡有關。Ding等人表明,lncRNA Tcon_00068353是調控多種非生物脅迫響應基因miR156k和miR172c的模擬靶標[31]。
lncRNA與mRNA有多種互作方式。lncRNA可以與mRNA直接或競爭性結合,形成lncRNA-mRNA共表達網絡,從而調節mRNA表達[5,75]。干旱響應型lncRNA通過lncRNA-mRNA共表達在番茄發育過程中發揮關鍵作用[5,56]。lncRNA、miRNA和mRNA三者可以形成共表達網絡調控各種生物學過程,如辣椒果實發育[6]。其主要機制是lncRNA充當miRNA的前體或模擬靶標調節miRNA活性;后者通過靶向mRNA的切割或引導翻譯抑制來負向調節mRNA的表達,最終形成lncRNA-miRNA-mRNA共表達網絡[76]。
lncRNA可以通過激活或抑制其上下游蛋白編碼基因的活性,使基因表達上調或下調,進而調控相關的發育和其它生物學過程[63]。如,lncRNA TCONS_00004594位于不結球白菜中蛋白質編碼基因Bra021232的下游,通過增加Bra021232的表達,從而參與耐熱性調控[65]。番茄感染致病疫霉過程中,lncRNA16397作為SIGRX22的反義轉錄本影響其表達[77];lncRNA39026誘導PR基因表達提高番茄對致病疫霉的抗性[48]。lncRNA還可以通過反式調控基因Capana04g001478(小RNA降解核酸酶),切割和降解miRNA,從而調控辣椒的成熟[6]。以往研究表明,從啟動子區域轉錄的lncRNA對其下游蛋白質編碼基因的轉錄的影響最大,其主要機制是通過在下游基因的啟動子中形成三重螺旋來調節基因表達[78]。
lncRNA與轉錄因子間具有多種相互作用方式。轉錄因子可以被lncRNA靶向激活或被招募至靶基因啟動子區域,進而抑制或增強下游基因的表達;轉錄因子通過調控lncRNA的表達,進而對目的基因起調控作用,從而影響其活性[63,79]。轉錄因子RIN通過識別lncRNA啟動子區域的MADS-box元件,激活LncRNA2155、LncRNA1780、LncRNA3197等lncRNA的表達,進一步調控成熟相關基因來參與番茄果實的成熟[80]。Cui等研究發現,轉錄因子WRKY1可以識別lncRNA33732啟動子區域的W-box元件,激活lncRNA33732的表達并誘導H2O2的積累和RBOH基因表達,從而參與番茄對致病疫霉的抗性機制[81]。StFLORE是馬鈴薯StCDF1轉錄因子的天然反義lncRNA,轉錄因子StCDF1通過與StFLORE啟動子中的DOF基序結合來負調控后者的表達[63]。DcMYB7是胡蘿卜中關鍵花青素生物合成轉錄因子,lncRNA可能通過與DcMYB7相互作用激活花青素生物合成[45]。
在蔬菜作物中,lncRNA在各種生理和代謝過程中可能起到關鍵的調節作用。雖然在少量蔬菜作物中已經發現lncRNA可以通過與其上下游基因、mRNA、miRNA或轉錄因子發生順式或反式結合,進而調控靶基因的表達[5,63,75,79],但到目前為止人們對大多數蔬菜作物lncRNA的認識仍不明確。出現這種情況的原因主要有:lncRNA具有高度的種系和組織特異性,lncRNA的作用可能只能在特定條件下才能觀察到。大多數lncRNA在物種間的保守性低,增加了對新的蔬菜lncRNA研究工作的難度。lncRNA具有異質性,能夠與調控DNA的序列結合,這使得評估其特定功能變得困難。因此,需要建立更多更有效的方法和技術,更深入和快速地探索各種蔬菜中lncRNA的生物學功能,找到不同蔬菜作物lncRNA的異同點和其它規律,以期更充分地探索和理解lncRNA在蔬菜作物生長代謝調控中的巨大作用及其發揮作用的機制。
果實成熟一直是蔬菜作物研究的一大熱點。目前僅在番茄和辣椒中鑒定出具有調控果實成熟的lncRNA[3,6,26,44,45],而且并不深入和系統,因此各種蔬菜中具有調控果實成熟功能的lncRNA的研究還需不斷完善。研究發現,lncRNA參與蔬菜作物逆境應答過程。在抗生物脅迫方面,lncRNA可以提高蔬菜作物對真菌病害的抗性,目前僅在番茄中研究較深入[47-49];而lncRNA在抗細菌、病毒和線蟲侵害方面的作用仍有待研究。在抗非生物脅迫方面,蔬菜作物lncRNA主要參與干旱、高溫和冷害應答過程[35,50,56]。目前已在番茄[50,56]、黃瓜[35]、辣椒[34]、白菜[65]、芥子油菜[62]等蔬菜作物中鑒定出非生物脅迫響應型lncRNA,而蔬菜作物lncRNA在重金屬毒害、鹽分脅迫、營養缺乏等方面的功能仍不清楚,未來研究可以加強這方面的研究。此外,蔬菜作物lncRNA是否具有調控開花時間的功能還沒有得到驗證。功能表征是一項具有挑戰性的任務,大規模篩選突變文庫的高級成像技術的發展應該會加速蔬菜作物lncRNA功能研究進展。未來研究可以利用對蔬菜作物lncRNA功能的了解,為蔬菜育種研究開辟新的可能性,從而提高蔬菜作物的品質和性能。
隨著轉錄組測序和計算生物學的快速發展,越來越多的新型高效的方法和工具都可以幫助預測準確的lncRNA和新型lncRNA的功能注釋,應用這些新的技術方法可以促進蔬菜lncRNA分子機制的研究。目前,CRISPR/cas9技術已應用于lncRNA調控番茄果實成熟的研究中[26]。此外,適配體標記的RNA序列可能是未來研究lncRNA細胞定位和相互作用的有用工具。lncRNA的結構穩定是和蛋白質結合所必需的,所以RNA結構的計算分析也成為識別蔬菜作物lncRNA潛在功能的重要工具。應用單細胞測序和單分子測序技術也可以為識別蔬菜作物lncRNA創造新機會。