湯 彬,耿存娟,曾 強,郭歡樂,李 涵,曹鐘洋,鄧力超,彭 明,周 虹,陳志輝
(1.湖南省作物研究所,湖南 長沙 410125;2.湖南智行三湘農林科技有限公司,湖南 長沙 410205)
在全球變暖的大背景下,氣候系統的不穩定性加劇,全球氣候變化引起的高溫熱害已經逐漸成為限制玉米生產的主要非生物脅迫因子[1]。解析玉米耐高溫的分子機理,提高玉米品種的耐高溫能力,兼具重大的理論意義和應用價值,受到國內外學者的廣泛關注[2-4]。玉米生長發育適宜的日平均溫度為28~32 ℃,當溫度超過32 ℃會顯著影響玉米正常的生長發育過程,產生光合作用受阻、蒸騰速率增加、花粉失活、籽粒灌漿期縮短等不利因素,最終造成減產甚至絕收[1]。
玉米是湖南省第一大旱糧作物,常年種植面積保持在40萬hm2左右。湖南省屬亞熱帶季風濕潤氣候,每年7—8月為此地區常年高溫時期,正好也是春玉米籽粒灌漿和產量形成的關鍵時期。在氣候變化影響下,高溫顯著降低了湖南春玉米的光溫生產潛力[5]。因此,提高玉米籽粒形成期的耐高溫能力是選育適應本地區氣候特點的耐高溫玉米新品種的重要育種目標。
轉錄組測序是研究植物轉錄水平調控網絡的分子生物學技術,可以快速、有效地鑒定植物響應高溫脅迫相關的基因及其代謝通路[6-7]。盡管轉錄組學測序技術(RNA-Seq)已經鑒定了大量玉米響應高溫脅迫相關的差異表達基因,但是已有研究的取樣部位主要是玉米葉片[8]和花藥[9],對籽粒響應高溫脅迫的研究相對較少,且多數研究都只涉及單一玉米自交系[10]或雜交種[11],缺乏對不同耐高溫自交系基因型差異的比較分析,無法揭示不同耐高溫優良等位基因的功能差異。
表型鑒定和多組學方法(轉錄組、蛋白質組和代謝組)聯合分析表明,糯玉米籽粒發育早期(授粉后1~15 d)的高溫脅迫會影響整個籽粒發育時期,籽粒中生長素、脫落酸和水楊酸信號通路相關基因和蛋白質的差異表達可能參與調控高溫脅迫下籽粒代謝過程[12]。鑒于此,本研究在前期耐高溫自交系篩選的基礎上,通過對耐高溫自交系XN202和敏感自交系CT110授粉后1~15 d的籽粒進行高溫脅迫處理,研究不同耐高溫玉米自交系籽粒響應高溫脅迫的基因表達差異,在基因水平解析不同玉米種質響應高溫脅迫的分子機制,并將DEGs與已報道的玉米耐高溫相關性狀QTL/SNP定位結果進行聯合分析,以期進一步挖掘玉米籽粒響應高溫脅迫的關鍵基因,為后續耐高溫玉米新品種培育提供技術支撐。
供試材料耐高溫自交系XN202和敏感自交系CT110分別來源于湖南省農業科學院作物研究所和國家玉米產業技術體系。
盆栽試驗于2021年4—7月在湖南省作物研究所進行。收集田間土壤置于盆缽(高38 cm、直徑43 cm),每盆施12 g復合肥(N-P2O5-K2O為15%-15%-15%)作為基肥,并在每個盆缽中種植3粒種子,出苗后定苗至1株,拔節期每盆追施6 g尿素(N 46%),定期澆水使土壤含水量保持在70%左右。所有植株在室外自然條件下生長至開花期,吐絲后3 d進行人工授粉,授粉后1 d選擇生長一致的植株移入溫室大棚進行高溫處理。以室外自然溫度正常生長的植株為對照,每個處理9盆。高溫處理后15 d,選3株玉米果穗中部籽?;旌献鳛?個生物學重復,包含3個生物學重復,于液氮中速凍后將樣品保存在-80 ℃的超低溫冰箱。高溫處理下,耐高溫的自交系分別命名為THT1、THT2、THT3;不耐高溫的自交系分別命名為SHT1、SHT2、SHT3。室外自然溫度正常生長條件下,耐高溫的自交系分別命名為TCK1、TCK2、TCK3;不耐高溫的自交系分別命名為SCK1、SCK2、SCK3。由北京百邁客生物科技有限公司開展籽粒RNA樣品的提取和質量檢測,構建測序文庫并進行質量控制,最后完成所有樣品的高通量測序。
使用百邁客云平臺BMKCloud(www.biocloud.net) 提供的生物信息學分析流程進行分析。將測序數據與參考玉米基因組數據庫(B73_RefGen_v3版本)進行比對,采用FPKM(Fragments per kilobase of transcript per million fragments mapped)值進行歸一化后作為衡量基因表達水平的指標。差異表達基因通過DESeq2_edgeR軟件進行篩選與檢測,篩選標準為2組(正常對照和高溫脅迫處理)樣品間基因表達量的差異倍數(Fold change)≥2 同時錯誤發現率(False discovery rate,FDR)<0.01。最后,提取各差異表達基因集的注釋信息,使用GOseq R和 KOBAS軟件包進行差異表達基因集的GO節點或KEGG通路富集分析(FDR<0.05)。柱形圖的繪制使用GraphPad Prism v.8.0.0軟件(San Diego,CA,USA)完成。
采用分期播種的方法對511份玉米自交系進行開花期耐高溫綜合評價。以單穗總質量、單穗籽粒質量和單穗粒數3個性狀耐高溫系數(耐高溫系數=高溫性狀值/對照測定值)的平均值,作為耐高溫綜合系數,將玉米自交系的耐高溫特性分為5個等級(極強:耐高溫系數≥0.8;較強:0.8>耐高溫系數≥0.6;中等:0.6>耐高溫系數≥0.4;較弱:0.4>耐高溫系數≥0.2;極弱:耐高溫系數<0.2),篩選出耐高溫自交系XN202和敏感自交系CT110(圖1)。

圖1 玉米自交系耐高溫田間鑒定
分別提取XN202和CT110授粉后15 d的籽粒RNA用Illumina平臺進行轉錄組測序,將正常條件和高溫脅迫下耐高溫自交系的樣品分別命名為TCK-1-2-3和THT-1-2-3,不耐高溫自交系的樣品分別命名為SCK-1-2-3和SHT-1-2-3。12個樣品(2個品種、2個處理、3次生物學重復)共獲得83 061 999 806過濾堿基數(Clean bases),各樣品過濾堿基數(Clean bases)均達到5 917 021 526,Q30堿基百分比在92.59%及以上,GC含量約為53%,經過質量剪切統計后獲得各樣品的過濾序列(Clean reads)與指定的參考基因組進行序列比對,唯一配對序列從74.40%到81.59%不等(表1),表明本研究籽粒轉錄測序的質量較好,參考基因組選擇合理,可以進行后續分析。

表1 測序數據統計
為研究正常對照和高溫脅迫下不同耐高溫玉米自交系籽粒基因表達變化,使用DESeq2_edgeR軟件鑒定差異表達基因(Differentially expressed gene,DEG)。SCK-1-2-3 vs SHT-1-2-3對比組共篩選出1 012個表達變化水平大于2倍的DEGs,其中上調DEGs共有386個,下調DEGs共有626個;TCK-1-2-3 vs THT-1-2-3 對比組共篩選出1 517個表達變化水平大于2倍的DEGs,其中上調DEGs共有801個,下調DEGs共有716個;TCK-1-2-3 vs THT-1-2-3對比組與SCK-1-2-3 vs SHT-1-2-3對比組共檢測到142個共同的DEGs,其中上調DEGs共有74個,下調DEGs共有44個,表達模式相反的DEGs共有24個(表2)。結果表明,耐高溫自交系響應高溫脅迫的基因數量更多,且有更多的DEGs表現為上調表達。上調和下調DEGs數目的差異說明不同耐高溫玉米自交系籽粒響應高溫脅迫的基因存在較大差異,可能涉及一系列基因參與的生理生化過程。
參考生物學過程、細胞組分和分子功能3個大類的基因GO功能注釋,對高溫脅迫下玉米籽粒的DEGs 進行GO富集分析,XN202和CT110分別得到353,341個DEGs被顯著富集。在富集顯著的前 20個GO功能注釋分類中,SCK-1-2-3 vs SHT-1-2-3 對比組和TCK-1-2-3 vs THT-1-2-3 對比組中的DEGs分別富集在11,6個生物學過程,3,9個細胞組分,6,5個分子功能(圖2)。

A.CT110;B.XN202。
富集在生物學過程的亞類中,SCK-1-2-3 vs SHT-1-2-3 對比組的DEGs主要集中在蛋白質折疊(GO:0006457)、熱激反應(GO:0009408),分別有39,29個基因功能得到注釋;TCK-1-2-3 vs THT-1-2-3 對比組的DEGs主要集中在翻譯(GO:0006412),共有67個基因功能得到注釋;DNA復制起始(GO:0006270)是二者共有的顯著富集代謝通路,說明在玉米籽粒響應高溫脅迫的生物學過程中DNA復制起始發揮重要作用。
富集在細胞組分的亞類中,SCK-1-2-3 vs SHT-1-2-3 對比組的DEGs主要集中在核小體(GO:0000786),共有28個基因功能得到注釋;TCK-1-2-3 vs THT-1-2-3 對比組的DEGs主要集中在核糖體(GO:0005840)和細胞質核糖體大亞基(GO:0022625),分別有37,35個基因功能得到注釋;二者共有3個顯著富集代謝通路,分別為核小體(GO:0000786)、微小染色體維持復合物(GO:0042555)、DNA引物酶-多聚酶α復合體(GO:0005658)。
富集在分子功能的亞類中,SCK-1-2-3 vs SHT-1-2-3 對比組的DEGs主要集中在未折疊蛋白結合(GO:0051082)、蛋白質異二聚活性(GO:0046982),分別有42,28個基因功能得到注釋;TCK-1-2-3 vs THT-1-2-3 對比組的DEGs主要集中在核糖體的結構組成(GO:0003735),共有85個基因功能得到注釋;營養庫活性(GO:0045735)是二者共有的顯著富集代謝通路。
為進一步解析玉米自交系籽粒響應高溫脅迫的代謝調控通路,分析DEGs可能參與的生物學功能,分別對不同耐高溫自交系響應高溫脅迫的DEGs進行KEGG代謝通路富集分析,XN202和CT110分別得到176,138個DEGs 被顯著富集(表3)。

表3 差異表達基因的KEGG注釋
SCK-1-2-3 vs SHT-1-2-3 對比組的DEGs主要集中在內質網蛋白質加工(ko04141)、DNA復制(ko03030)、同源重組(ko03440)、錯配修復(ko03430)、丙氨酸、天冬氨酸和谷氨酸代謝(ko00250)、嘌呤代謝(ko00230)、谷胱甘肽代謝(ko00480)等途徑。有52個DEGs富集到內質網蛋白質加工是KEGG富集分析最顯著的通路。
TCK-1-2-3 vs THT-1-2-3 對比組的DEGs主要集中在核糖體(ko03010)、DNA復制(ko03030)、丙氨酸、天冬氨酸和谷氨酸代謝(ko00250)、精氨酸生物合成(ko00220)、乙醛酸和二羧酸代謝(ko00630)、真核生物核糖體的生物合成(ko03008)等途徑。有89個DEGs富集到核糖體是KEGG富集分析最顯著的通路。
二者共有2個顯著富集代謝途徑,分別為DNA復制和丙氨酸、天冬氨酸和谷氨酸代謝。
對不同耐高溫玉米自交系籽粒響應高溫脅迫的DEGs進行COG同源分類,XN202和CT110分別得到540,365個DEGs有COG功能注釋信息,分別屬于24,21個功能類別(圖3),其中XN202的DEGs主要分布于翻譯,核糖體結構和生物起源(98個DEGs)、翻譯后修飾,蛋白轉運(57個DEGs)、一般功能預測(46個DEGs)、氨基酸轉運和代謝(44個DEGs)、碳水化合物轉運和代謝(41個DEGs)、信號傳導機制(34個DEGs)、次生代謝產物的合成,轉運和代謝(31個DEGs)、復制,重組和修復(30個DEGs)、防御機制(26個DEGs)、細胞壁/細胞膜/包膜的生物發生(24個DEGs)10個主要分類(富集DEGs個數≥20個);CT110的DEGs主要分布于翻譯后修飾,蛋白轉運(81個DEGs)、碳水化合物轉運和代謝(37個DEGs)、信號傳導機制(33個DEGs)、復制,重組和修復(29個DEGs)、一般功能預測(26個DEGs)、氨基酸轉運和代謝(20個DEGs)6個主要分類(富集DEGs個數≥20個)。COG注釋結果在宏觀上解析了不同耐高溫玉米自交系籽粒響應高溫脅迫相關基因的功能分布特征。

圖3 COG功能分類
在鑒定的2 387個DEGs中,共有49個轉錄因子家族的125個轉錄因子,主要有AP2/ERF(12個)、AUX/IAA(3個)、bHLH(7個)、bZIP(5個)、C2H2(5個)、GARP-G2-like(5個)、HMG(4個)、HSF(6個)、MADS(5個)、MYB(9個)、NAC(9個)、WRKY(3個)等參與植物生長發育和逆境脅迫響應相關的重要轉錄因子。
TCK-1-2-3 vs THT-1-2-3 對比組與SCK-1-2-3 vs SHT-1-2-3 對比組檢測到142個共同的DEGs中有7個轉錄因子,其中共同上調的轉錄因子5個(GRMZM2G030768、GRMZM2G033828、GRMZM2G062657、GRMZM2G125648、GRMZM2G395749),共同下調的轉錄因子2個(GRMZM2G011110和GRMZM2G042756均為AP2/ERF轉錄因子),這些基因可能在玉米籽粒響應高溫脅迫過程中發揮重要作用。
將DEGs與已報道的玉米耐高溫相關性狀QTL定位和全基因組關聯分析定位結果進行聯合分析,共有374個DEGs與已有研究報道的QTL區間共定位,其中第1染色體上有31個,第2染色體上有117個,第3染色體上有32個,第4染色體上有11個,第5染色體上有60個,第6染色體上有8個,第7染色體上有2個,第8染色體上有11個,第9染色體上有73個,第10染色體上有29個。
位于玉米耐高溫相關性狀QTL的374個DEGs中,有42個為已報道的耐高溫相關候選基因(表4)。谷胱甘肽S移換酶和RWP-RK轉錄因子在SCK-1-2-3 vs SHT-1-2-3 對比組和TCK-1-2-3 vs THT-1-2-3 對比組都上調表達,而水通道蛋白和RLK-Pelle_DLSV蛋白激酶在SCK-1-2-3 vs SHT-1-2-3 對比組和TCK-1-2-3 vs THT-1-2-3對比組都下調表達。值得注意的是HSP70、HSP20和HSP101家族基因都在高溫敏感自交系CT110中顯著下調表達,但是在耐高溫自交系XN202中差異不顯著,可能是2個自交系耐高溫能力差異形成的關鍵基因。

表4 玉米耐高溫QTL區間內的候選基因
由于玉米耐熱性是一種受多基因控制的復雜數量性狀,更容易受到基因型-環境互作的影響,傳統的農藝栽培技術對緩解高溫脅迫的作用較小,因此,提高玉米的耐高溫能力是應對全球氣候變化最經濟有效的方法。玉米對高溫脅迫的響應,主要涉及信號感知、信號轉導、細胞結構、生理生化、基因表達和調控等過程[10]。本研究通過對授粉后15 d的玉米籽粒轉錄組的測序數據分析,在2個耐高溫能力不同的玉米自交系中獲得大量的DEGs,這些基因的表達和調控涉及高溫脅迫下生理生化過程和代謝途徑的變化,說明玉米耐熱性與基因的差異表達有關。耐高溫自交系XN202中的DEGs明顯多于高溫敏感自交系CT110,且XN202的DEGs中上調基因比下調基因多,而CT110的DEGs中下調基因比上調基因多,這些上調和下調DEGs數目的差異可能影響玉米籽粒發育時期的耐熱性。XN202和CT110基因組中共有響應高溫脅迫的DEGs只有142個,可見不同基因型的玉米對高溫脅迫響應的分子機制存在明顯差異[15]。
通過對DEGs的GO功能注釋分析,XN202和CT110分別得到353,341個DEGs被顯著富集,其中生物學過程(DNA復制起始)、細胞組分(核小體、微小染色體維持復合物、DNA引物酶-多聚酶α復合體)、分子功能(營養庫活性)共同參與響應高溫脅迫,增強了玉米籽粒對熱脅迫的響應。這表明高溫脅迫主要影響玉米的生物學過程和分子功能[8]。XN202有85個DEGs顯著富集在核糖體的結構組成(分子功能),67個DEGs顯著富集在翻譯(生物學過程),說明這些通路在玉米籽粒遭受高溫脅迫時可能發揮重要作用。谷氧還蛋白是維持活性氧平衡的重要組分,在玉米中異源表達擬南芥谷氧還蛋白家族基因AtGRXS17顯著影響核糖體RNA生物合成,可以提高玉米的耐熱性[16]。CT110有42個DEGs顯著富集在未折疊蛋白結合(分子功能),39個DEGs顯著富集在蛋白質折疊(生物學過程)。未折疊蛋白反應是一種與內質網應激相關的細胞應激反應,有助于減輕熱脅迫對細胞造成的損害[17]。通過對DEGs的全基因組及代謝途徑數據庫(KEGG)信號通路富集分析,XN202和CT110分別得到176,138個DEGs被顯著富集,只有DNA復制,丙氨酸、天冬氨酸和谷氨酸代謝等共同參與響應高溫脅迫的應答過程。XN202有89個DEGs顯著富集在核糖體路徑,CT110有52個DEGs顯著富集在內質網蛋白質加工路徑,進一步說明核糖體和內質網蛋白質加工代謝路徑可能是2個自交系耐高溫能力差異形成的重要原因。將DEGs與COG數據庫比對,XN202和CT110分別得到540,365個DEGs有COG功能注釋信息,其中XN202有98個DEGs與翻譯、核糖體結構和生物起源有關,CT110有81個DEGs與翻譯后修飾、蛋白轉運有關,XN202和CT110分別有34,33個DEGs與信號傳導機制有關,這些功能基因可能與玉米耐熱性有關,值得進一步研究。
轉錄因子可以通過調控下游多個靶基因的表達,參與植物熱激響應的調控網絡,是響應高溫脅迫的關鍵基因和重要分子開關[18-19]。本研究中DEGs共有49個轉錄因子家族的125個轉錄因子,其中AP2/ERF、MYB、bHLH、NAC、HSF等家族轉錄因子都直接或間接參與高溫脅迫響應[10]。為了減輕高溫脅迫對細胞的損害,植物需要HSF來快速轉錄激活熱激蛋白(HSP),與耐高溫能力密切相關[20]。HSP作為一種重要的分子伴侶,可以參與修復受損的蛋白質,減少蛋白質的錯誤折疊和聚集[17]。位于玉米耐高溫相關性狀QTL的374個DEGs中,有42個為已報道的耐高溫相關候選基因,其中15個基因的功能未知,共有7個HSP。HSP70、HSP20和HSP101家族基因都在高溫敏感自交系CT110中均顯著下調表達,但是在耐高溫自交系XN202中差異不顯著,說明在高溫脅迫條件下HSPs的積累量可能與耐熱性正相關。
本研究選擇以授粉后15 d的玉米籽粒為試驗材料,基于轉錄組高通量測序技術,發現高溫脅迫下玉米籽粒會形成復雜的細胞保護和防御系統,不同耐高溫自交系的籽粒對高溫脅迫的響應存在明顯差異,AP2/ERF、MYB、bHLH、NAC、HSF、HSP等耐高溫相關的DEGs可能在分子調控網絡中發揮重要作用。研究結果為進一步解析玉米耐高溫的分子遺傳機制,克隆玉米耐高溫關鍵基因,開發分子標記,篩選或培育耐高溫玉米新品種奠定了很好的理論基礎。