朱旭東,安顏穎,王晨,賈海鋒,房經貴*
(1. 南京農業大學園藝學院/江蘇省果樹品種改良與種苗繁育工程中心,江蘇南京 210095;2. 南京農業大學農學院,江蘇南京 210095)
內源小分子RNA(small RNA,sRNA)是一類長度為19~25 nt的非編碼的重要調節分子[1],其通過介導靶基因的裂解或抑制靶翻譯在轉錄或轉錄后水平調控基因的表達[2]。microRNA(miRNA)是非編碼的sRNA主要類型之一,廣泛地分布在生物有機體內,該類sRNA分子在植物的生長發育及對環境脅迫的應答反應中起著重要作用。通常,它們的表達展示出不同種之間的發育時期或組織的特異性。越來越多的研究表明,miRNAs可能參與器官的發育、細胞的增殖與分化、細胞凋亡等重要過程[3]。有關miRNA的鑒定與其功能分析成為生物研究領域的重點。隨著具有通量大、時間短、精確度高和信息量豐富等優勢的下一代測序技術的高速發展并成為miRNA識別與鑒定的高效技術[4-5],葡萄屬植物目前已在歐亞與歐美兩個種群上開展了高通量測序,大批量的挖掘了葡萄種的miRNA[6-7]。但是,迄今為止,在葡萄砧木上尚無miRNA的相關研究報道。
砧木在葡萄種植中的應用起源于19世紀60年代,而隨著葡萄優質砧木的推廣與應用,葡萄嫁接栽培已成為世界各主要葡萄栽培生產國發展葡萄和葡萄酒產業的重要舉措[8-9],并促進了葡萄產業更好地發展。因此,有關葡萄砧木生長發育機理的研究得到了重視。
葡萄砧木miRNA的研究對砧木抗性機理的認識具有重要意義。為此,本研究首次構建了葡萄砧木‘3309M’的miRNA文庫,并通過高通量測序技術對該miRNA文庫進行深度測序,分析了葡萄砧木miRNA文庫的特點,以便于發現葡萄砧木中參與抗寒、抗病及果實品質發育的葡萄砧木特異的miRNA,為以后進一步分析其功能以及葡萄砧穗互作機制的研究奠定基礎。
葡萄砧木‘3309M’(Vitis labrusca)的葉片和根于2016年采自中國農業科學院鄭州果樹研究所,所有的樣品采集后立即投入液氮帶回實驗室-80 ℃保存,用于總RNA的提取。
RNA提取前所有的槍頭、Eppendorf管均用0.1%DEPC水于37 ℃浸泡過夜,高壓滅菌,烘干待用。其他玻璃器皿、研缽等按照分子克隆介紹的方法處理。分別按照如下的方法提取葡萄的葉、莖、卷須、花序、花和果實等器官的總RNA即按照SDS-酚法提取總RNA,并用4 mol/L的LiCl富集LMW RNA。
sRNA 3'末端加ploy(A)的反應總體系為25 μL:1.5μg sRNA模板;5 μL 5×buffer;2.5 μL 25 mmol MgCl2;0.25 μL ATP(100 nM/μL);1 μL PAP(2 U/μL);DEPC水補足。置于37 ℃,保溫1 h,得到加ploy(A)尾巴的sRNA。加尾后的小分子RNA用酚/氯仿抽提,乙醇沉淀,后用適量的DEPC水溶解。
1.3.1 5'端與3'端接頭的連接
將“1.2 總RNA、sRNA的提取”獲得的sRNA與1.3 μL 5'端接頭(5'UCAGAGUUCUACAGUCCGACGA UC)、1 μL 10×T4 RNA連接酶緩沖液、1 μL T4 RNA連接酶、1 μL RNA酶抑制劑混合,于20 ℃反應6 h。隨后以15% TBE-Urea PAGE膠進行分離純化,將長度為40~60個核苷酸的條帶切下,粉碎、洗脫、過濾和沉淀。得到的沉淀用無RNA酶的6.4 μL純水溶解后,與0.6 μL 3'端接頭(5'UCGUAUGCCGUCUUCUGCUUGU idT)、1 μL 10×T4 RNA連接酶緩沖液、1 μL T4 RNA連接酶、1 μL RNA酶抑制劑混合,于37 ℃反應6 h。連接產物用10% TBE-Urea PAGE膠分離純化:將長度為70個核苷酸的條帶切下并按前述步驟回收膠內的核酸。得到的核酸沉淀用5 μL無RNA酶的DEPC水溶解。
1.3.2 逆轉錄
將獲得的連有3'端和5'端接頭的sRNA產物用SuperScriptⅡ逆轉錄酶試劑盒進行逆轉錄。將4.5 μL產物與1.5 μL反轉錄引物(5'CAAGCAGAAGACGGC ATACGA)混合,于65 ℃加熱10 min去除RNA二級結構,置于冰上。隨后加入2 μL 10×第一鏈緩沖液、1 μL 10mmol/L dNTP、2 μL 100 mmol/L二硫蘇糖醇(DTT)、1 μL RNA酶抑制劑,用DEPC水補至9 μL置于65 ℃溫浴5 min,再加入1 μL SuperScriptⅡ反轉錄酶,在50 ℃下反應1 h。
1.3.3 cDNA文庫的純化和測序
獲得的cDNA用15%的TBE-PAGE膠進行分離純化,得到的cDNA用Agilent 2100測定其濃度,最終濃度稀釋到10 nmol/L,用Illumina新一代測序儀1 G Genome Analyzer系統測序平臺進行測序。
通過Base Callin將原始圖像數據轉換為序列數據,即為原始數據,并保存在“Fastq”文件中。為獲得高質量的序列,從原始序列(raw reads)數據中去除接頭序列和質量值Q≤5的堿基數占整個reads的50%以上的低質量序列,將獲得的干凈序列(clean reads)用于數據分析。通過比對miRBase 21.0庫中葡萄物種的miRNA序列,得到保守的miRNA。針對miRNA的生物特征,利用Mireap軟件進行非保守的miRNA鑒定。
miRNA表達量采用TPM(transcripts per million)校準,計算公式為:miRNA在文庫中的歸一化表達量=(Read count×106)/Total read count。若2個文庫中任何1個miRNA基因的表達量在歸一化后為0,則被修改為0.01;若2個文庫中任何1個miRNA基因的表達量在歸一化后小于1,則表示其表達量較低,不宜進行差異表達分析。根據公式“差異倍數(foldchange)=log2(根文庫中miRNA的歸一化表達量/葉片文庫中miRNA的歸一化表達量)”計算根與葉片文庫miRNA表達的差異倍數。
將測得序列與NCBI數據庫和Rfam10.0數據庫中水稻和擬南芥的非編碼RNA進行比對,并將sRNA的特異序列(unique reads)與miRBase 21.0數據庫中所有植物的序列進行BLASTn比對,只有完全匹配的序列才是保守的miRNA。根據上述分析結果確定根和葉片文庫中已知的miRNA數量,對已知的差異表達的miRNA進行分析,以foldchange≥1且FDR≤0.05作為miRNA顯著差異表達的篩選條件。
對差異表達的miRNA利用psRNATarget進行靶基因預測,并使用BLAST軟件將靶基因序列與NR(https://www.ncbi.nlm.nih.gov/)、Swiss-Prot(http://www.uniprot.org/)、GO(http://www.geneontology.org/)、COG(https://www.ncbi.nlm.nih.gov/COG/)、KEGG(http://www.kegg.jp/)、KOG(Clusters of orthologous groups for eukaryotic complete genomes)、Pfam(http://pfam.xfam.org/)數據庫比對,獲得靶基因的注釋信息。
高通量測序結果表明:葡萄砧木根和葉片文庫中sRNA的原始序列分別有12 633 906和12 686 708條;去除接頭序列、poly-A序列、≤18 nt序列和低質量序列后,干凈序列分別有12 174 719和12 397 993條。在根和葉片文庫中,sRNA的特異序列分別有2 772 037和1 676 324條(表1),其中,能與基因組比對成功的sRNA特異序列分別有949 559和633 100條,分別占各自sRNA特異序列總數的34.2%和37.8%。
由表1可見,葡萄砧木‘3309M’根和葉片文庫中sRNA類型較多,包括miRNA、rRNA、snRNA、snoRNA、tRNA和重復序列。其中,根和葉片文庫中未注釋的sRNA序列分別有1 597 233和1 070 626條,分別占各自sRNA特異序列總數的57.62%和63.87%,在已注釋的sRNA中,rRNA最多,分別占根和葉片文庫中sRNA特異序列總數的31.61%和22.67%;其次為tRNA,分別占各自sRNA特異序列總數的3.53%和2.53%;miRNA較少,分別僅占各自sRNA特異序列總數的0.47%和0.81%。
為了鑒定葡萄中保守的miRNA,深度測序的小分子RNA序列與目前miRBase 21.0已知的植物保守miRNA的進行比對。結果表明,通過高通量測序鑒定了葡萄砧木根和葉片中文庫分別包含104個和90個miRNA家族,共181條miRNA,并且這些鑒定的保守miRNA不同家族成員的數量存在重要的差異,其中大多數的家族僅包含幾個成員,而有4個家族(miR169、miR395、miR171和miR156)卻分別包含25、13、10和9個等多個成員,還有一些家族只有一個成員如miR162、miR168(圖1)。不同miRNA家族的讀數(read count)也存在劇烈變化,其變化范圍從1到413 112次(圖2)。在葡萄砧木保守miRNA中,miR159、miR166、miR396和miR482具有最多的讀數,而另外10條miRNA家族的讀數很低。這些miRNA表達豐度的劇烈變化,能夠進一步反映出這些miRNA可能在葡萄砧木生長發育過程中的調控功能存在重要差異。

表1 葡萄砧木sRNA的組成Table 1 Composition of small RNA in grapevine rootstock
分析葡萄砧木保守miRNA長度的結果(圖3)可知,長度為21 nt的miRNA所占比例最高,為69.45%;長度為20 nt和22 nt的miRNA所占比例相當,為11.63%和12.65%。總體上看,在葡萄砧木miRNA中,長度為20~22 nt的miRNA所占比例較高,為93.23%。

圖1 葡萄砧木保守miRNA不同家族的成員數量Figure 1 Numbers of members of each conserved miRNA families in grapevine rootstock

圖2 葡萄保守miRNA不同家族成員的讀數Figure 2 Numbers of identified miRNAs in each conserved miRNAs family in grapevine rootstock
對葡萄砧木保守miRNA堿基偏好性進行分析(圖4),結果表明,保守miRNA的第一個堿基偏好U,比例達到71%,說明該測序數據質量良好。
充分認識miRNA的靶基因將有助于我們深入理解miRNA調控基因的范圍以及更廣泛地描述這些miRNA功能的重要性。本研究根據miRNA與其靶基因之間近乎完全或完全的互補性以及一些靶基因預測的標準,預測了25個miRNA家族總共412個靶基因。將預測到的412個葡萄砧木根和葉片中miRNA的靶基因分別在Swiss-Prot、GO、KEGG、COG、KOG、Pfam和NR數據中進行功能注釋,發現分別有354、147、95、190、248、373和412個靶基因得到注釋。

圖3 保守miRNA的長度分布圖Figure 3 Size distributions of conserved miRNA sequences from grapevine rootstock

圖4 miRNA各位點堿基分布圖Figure 4 The bias distribution of nucleotide base in each position of miRNA sequences

圖5 葡萄砧木中鑒定的保守miRNA靶基因的GO功能分類結果Figure 5 GO classification of conserved miRNA target genes identified in grapevine rootstock
利用GO功能分類對葡萄砧木根和葉片鑒定的保守miRNA靶基因進行功能預測(圖5),結果表明:大部分差異表達miRNA靶基因的功能主要集中在生物學過程、細胞組分和分子功能3方面。細胞組分中,細胞、細胞部分和細胞器中的差異表達miRNA靶基因較多;在分子功能中,多數差異表達miRNA靶基因與結合功能及催化活性有關,與核苷酸結合有關的miRNA靶基因最多;在生物過程中,差異表達miRNA靶基因的功能主要集中在代謝過程(Metabolic process)、細胞過程(Cellular process)、單一生物過程(Single-organism process)、生物調節( Biological regulation)、響應刺激(Response to stimulus)等。
對葡萄砧木根和葉片中鑒定的保守miRNA靶基因進行KEGG通路富集分析(圖6)。結果顯示:富集差異表達miRNA靶基因數量最多的通路依次為核糖體(Ribosome)、植物激素信號轉導(Plant hormone signal transduction)、氧化磷酸化(Oxidative phosphorylation)、RNA運輸(RNA transport)、內質網蛋白質(Protein processing in endoplasmic reticulum)、糖酵解/糖異生(Glycolysis/Gluconeogenesis)等,富集的差異表達miRNA靶基因數分別為206、199、181、161、153和145個。

圖6 葡萄砧木中鑒定的保守miRNA靶基因的KEGG通路富集分析的結果Figure 6 KEGG enrichment analysis of conserved miRNA target genes identified in grapevine rootstocks
依據同源基因的功能注釋,我們把這些靶基因分為三大類:最大的一類是轉錄因子,其參與植物的生長、發育以及由營養生長到生殖生長的轉型;第二大類是編碼不同的酶蛋白基因,其主要涉及在不同的代謝過程如ATP、sulfurylase/APS kinase、ATP synthase等;第三類與免疫反應(NLA)、脅迫反應(CWP3)、抗病反應(NBSLRR)以及信號轉導(ARF、AFB)等過程相關。大多數潛在的靶基因預測的功能與蘿卜[10]、枳[11]、番茄[12]和擬南芥[13]等植物上鑒定的功能基本一致,表明不同植物中的靶基因的功能具有較高的保守性。
進一步的分析結果(表2)表明:以foldchange≥1且FDR≤0.05作為篩選條件,確定顯著差異表達的miRNA家族有32個,共87條miRNA家族成員,其中54條miRNA在葉片文庫上調表達(分別屬于vvimiR167a、vvi-miR156f、vvimiR156i、vvi-miR156g、vvimiR172d等成員),33條miRNA下調表達。

表2 葡萄砧木根和葉片中顯著差異表達miRNA的表達特性分析Table 2 Analysis on the expression of miRNA in grape rootstocks roots and leaves

續表2 Continued table 2
針對miRNA的生物特征,對于比對到參考基因組的序列,利用Mireap軟件進行非保守的miRNA鑒定。測序序列比對到參考序列,通過堿基數目延伸,獲得潛在前體序列,對前體序列進行miRNA結構預測,獲得新的非保守的miRNA。本研究發現了104條新的miRNA,其前體均能夠被折疊成穩定的二級結構。在這些新的miRNA中,有32條新的miRNA的5'末端以U開頭,而另外53條miRNA的5'末端以A開頭(在雙鏈RNA中A互補于U),這些是miRNA序列結構的重要特征。所有這些分析結果有力地證明了葡萄砧木中新的miRNAs的真實性。
研究發現,新的非保守的miRNAs被測序到的讀數(rea count)通常比保守的miRNA的數量要少,只有25條miRNA的序列的讀數達到10次(表3)。這些結果與山葡萄和鮮食葡萄中的研究報道相一致[14-16],大多數新的特異的miRNA通常比保守miRNA的表達水平低,且具有時空的特異性。基因組定位分析表明,這些新的miRNA均定位在葡萄第10、11、12和13條染色體,分別有24、22、26和32條miRNA,可以看出其在染色體上的分布是不均勻的。
大多數成熟的miRNA在不同植物中具有較高的保守性[1,3]。這能為預測不同植物中的同源miRNA提供有力證據。研究發現山葡萄與野生葡萄等不同品種中保守的和新的miRNA的數量與種類具有顯著差異[14-16],表明葡萄的不同品種、不同組織中miRNA文庫存在自身特點,有必要在不同葡萄種質的不同組織中開展高通量測序,以便能夠發現更多種類和數量的miRNA。

表3 葡萄砧木中鑒定的新的miRNATable 3 Novel miRNA identified in grapevine rootstock
本研究構建了葡萄砧木品種‘3309M’根和葉組織的小RNA文庫,鑒定了181條保守的和104條非保守的miRNA。葡萄砧木根和葉片中共有32個miRNA家族共87條顯著差異表達,其中vvi-miR167a、vvi-miR166b、vvimiR162和vvi-miR156等54條miRNA上調表達,其余33條miRNA下調表達。不同植物中的miRNA存在一定差異。本研究中,葡萄砧木根和葉片中miRNA長度均以21 nt為主。相關研究結果顯示,蘿卜中的miRNA長度以21 nt和24 nt為主[10];枳和番茄的miRNA長度以21 nt為最多[11-12],而擬南芥中的miRNA長度則以24 nt為最多[13],但與鮮食和野生葡萄中miRNA的長度分布一樣[14-16],表明不同植物的miRNA長度存在差異,可能與植物種類及參與miRNA生物合成的酶不同有關。
為了鑒定植物miRNA的功能,進一步確定其靶基因非常必要。目前,植物上靶基因預測最有效的工具是基于miRNA與靶基因高度同源性的生物信息學預測方法。本研究利用生物信息學方法預測了葡萄砧木中保守miRNA的靶基因,發現預測的大多數靶基因是植物特異的轉錄因子,如AP2、NAC、SBP、NF-YA、GRAS、Zincnger(C2H2)和ARF等,與鮮食葡萄和野生葡萄中miRNA靶基因類似,表明miRNA功能的保守性。本研究中,葡萄砧木根和葉片中miRNA靶基因的功能主要集中在植物激素信號轉導、氧化磷酸化、RNA運輸、內質網蛋白質運輸、糖酵解/糖異生等方面,這可能與葡萄砧木的抗性較強有關。葡萄砧木miRNA的靶基因功能注釋表明它們在葡萄的生長、發育及對環境脅迫反應的應答過程中起著重要作用,開展進一步的研究有助于更廣泛地理解miRNA在葡萄砧木生長發育中的功能。
本研究根據miRNA的特征如前體典型的發夾結構等特點,共預測了104條非保守的新的miRNA。所有這104條新的miRNA的前體都能夠折疊成典型的發夾結構并滿足miRNA的預測標準。只有25條新的miRNA的讀數達到10次以上。所有這些結果證明,這104條新的miRNA在葡萄砧木中確實存在。新的miRNA在葡萄砧木特定組織的特異表達能夠為研究它們的生理功能提供重要信息。葡萄砧木特異的miRNA在其生長發育過程中的詳細功能仍有待我們全面深入地闡述。
[1] PHILLIPS J, DALMAY T, BARTELS D. The role of small RNAs in abiotic stress[J]. FEBS Letters, 2007, 581(19): 3592-3597.
[2] LI Y, ZHENG Y, ADDO-QUAYE C, et al. Transcriptome-wide identification of microRNA targets in rice[J]. Plant Journal, 2010,62(5): 742-759.
[3] ZENG C Y, WANG W Q, ZHENG Y, et al. Conservation and divergence of microRNAs and their functions in Euphorbiaceous plants[J]. Nucleic Acids Research, 2010, 38(3): 981-995.
[4] YU H P, SONG C N, JIA Q D, et al. Computational identification of microRNAs in apple expressed sequence tags and Validation of their precise sequences by miR-RACE[J]. Physiologia Plantarum, 2011, 141(1): 56-70.
[5] SONG C N, WANG C, ZHANG C Q, et al. Deep sequencing discovery of new and conserved microRNAs in trifoliate orange(Citrus trifoliate)[J]. BMC Genomics, 2010(11): 431.
[6] PANTALEO V, SZITTYA G, MOXON S, et al. Identification of grapevine microRNAs and their targets using high-throughput sequencing and degradome analysis[J]. Plant Journal, 2010,62(6): 960-976.
[7] MICA E, PICCOLO V, DELLEDONNE M, et al. Correction:high throughput approaches reveal splicing of primary microRNA transcripts and tissue specific expression of mature microRNAs in Vitis vinifera[J]. BMC Genomics, 2010(11): 109.
[8] 袁園園, 姚玉新, 王文軍, 等. 葡萄嫁接栽培研究現狀與展望[J].中外葡萄與葡萄酒, 2012(6): 57-61.
[9] RASHEDY A. Response of two grape rootstocks to some salt tolerance treatments under saline water conditions[J]. Journal of Horticultural Science & Ornamental Plants, 2010, 2(2): 93-106.[10] SUN X C, XU L, WANG Y, et al. Identification of novel and salt responsive miRNAs to explore miRNA-mediated regulatory network of salt stress response in radish (Raphanus sativus L.)[J].BMC Genomics, 2015(16): 197.
[11] ZHANG X N, LI X, LIU J H. Identification of conserved and novel cold-responsive microRNAs in trifoliate orange (Poncirus trifoliate (L.) Raf.) using high-throughput sequencing[J]. Plant Molecular Biology Reporter, 2014, 32(2): 328-341.
[12] MOXON S, JING R C, SZITTYA G, et al. Deep sequencing of tomato short RNAs identifies microRNAs targeting genes involved in fruit ripening[J]. Genome Research, 2008, 18(10):1602-1609.
[13] KASSCHAU K D, FAHLGREN N, CHAPMAN E J, et al.Genome-wide profiling and analysis of Arabidopsis siRNAs[J].PLoS Biology, 2007, 5(3): e57.
[14] WANG C, WANG X, NICHOLAS K, et al. Deep sequencing of grapevine flower and berry short RNA library for discovery of novel microRNAs and validation of precise sequences of grapevine microRNAs deposited in miRBase[J]. Physiologia Plantarum, 2011. 143(1): 64-81.
[15] WANG C, HAN J, LIU C, et al. Identification of microRNAs from Amur grapes (Vitis amurensis Rupr.) by deep sequencing and analysis of microRNA variations with bioinformatics[J].BMC Genomics, 2012(13): 122.
[16] WANG C, HAN J, NICHOLAS K, et al. The characterization of target mRNAs for table grapevines miRNAs with an integrated strategy of modified RLM RACE, PPM RACE and qRT-PCRs of cleavage products[J]. Journal of Plant physiology, 2013,170(10): 943-957.