田 文,郭啟平,李梓彰,丁 寧,張 珊,聞珊珊
(西北農林科技大學農學院,陜西楊凌 712100)
對基因表達的調節是植物最主要的一種提高自身對逆境抵抗能力的方式[1-2]。轉錄因子是一種重要的調節基因表達的蛋白質,它們通過結合功能基因啟動子區的順式作用元件來激活或抑制相關基因的表達[3]。DREB(dehydration responsive element binding protein)家族是植物中特有的最大的轉錄因子家族之一,是AP2(APETALA2/ethylene-responsive element-binding protein)轉錄因子超家族的一個亞家族。DREB基因在植物對非生物逆境的響應中起著重要的作用[4-5]。 CBF1是從擬南芥中克隆到的第一個植物DREB基因,它能調節與冷害和脫水作用有關的基因的表達[6]。隨后,在擬南芥中又克隆到了兩個DREB基因( DREB1和 DREB2),它們分別參與干旱和低溫條件下的信號轉導過程。此后,又從煙草[7]、大麥[8]、水稻[9-10]、小麥[11-13]和大豆[14-15]等多種植物中克隆到了參與干旱、鹽堿和極端溫度等非生物逆境響應的DREB基因。同時,大量的研究發現,上調或者下調植物中特定DREB基因的表達可以提高植物對非生物逆境的抵抗能力[16-18]。目前,已經對多種植物中的DREB基因進行了全基因組范圍內的研究,比如擬南芥[2,19]、水稻[19]、玉米[20]、大麥[21]、棉花[22]和二穗短柄草等[23]。但是有關小麥中DREB基因家族的全基因組鑒定還未見報道,這限制了小麥DREB基因的進一步發掘和分析。
近年來,隨著全球氣候變暖,高溫逐漸成為了威脅小麥生長的重要因素。對小麥耐熱基因進行研究,可為小麥在高溫條件下穩產高產提供重要的理論依據。因此,本研究利用Ensembl Plants(http://plants.ensembl.org/index.html)中小麥第34版基因組數據,通過生物信息學方法從全基因組范圍內鑒定小麥中的DREB基因,并進行了一系列生物信息學分析,最后利用轉錄組測序(RNA-seq)數據,對小麥DREB基因在不同組織和逆境條件下的表達模式進行分析,并選取熱脅迫響應基因對其進行熒光定量反轉錄PCR(qRT-PCR)分析,以期為進一步研究DREB基因的功能機制提供理論依據。
首先,從Ensembl Plants(http://plants.ensembl.org/index.html)在全基因組范圍內下載小麥DREB蛋白質序列,構建本地數據庫;從Pfam(http://pfam.xfam.org/)下載已經構建好的典型AP2保守結構域的隱馬爾科夫模型(PF00847),用其作為搜索模型,以E<1e-5為標準,通過HMM 3.0[24]軟件在本地小麥蛋白質數據庫中搜索能夠匹配此模型的蛋白質序列。對于同一個基因的不同轉錄本,只保留長度最長的轉錄本作為對應基因的蛋白質序列。由于AP2轉錄因子超家族(由AP2、RAV、ERF和DREB四個亞家族組成)蛋白質序列中都含有AP2保守結構域,因此,經過HMM軟件篩選得到的蛋白質序列由四個亞家族成員組成,但是AP2亞家族成員的蛋白質序列中包含兩個串聯的AP2結構域,RAV亞家族成員的序列中包含一個AP2保守結構域和一個B3保守結構域,ERF和DREB亞家族成員只包含一個AP2保守結構域。因此,將上一步得到的備選序列提交到NCBI-CDD(https://www.ncbi.nlm.nih.gov/cdd),分析序列中所含的保守結構域,去除序列中屬于AP2亞家族和RAV亞家族的成員。最后,通過多序列比對,根據ERF亞家族和DREB亞家族AP2結構域中保守氨基酸的不同,人工去除序列中的ERF基因,最終得到小麥中的DREB基因。使用ExPASy-Compute pI/Mw(http://web.expasy.org/compute_pi/)預測TaDREB基因編碼蛋白的分子量、氨基酸序列長度和理論等電點;利用CELLO(http://cello.life.nctu.edu.tw/)預測TaDREB蛋白質的亞細胞定位。
從NCBI(https://www.ncbi.nlm.nih.gov/protein/)下載擬南芥AtDREB蛋白質序列,利用Clustal W軟件對小麥和擬南芥DREB蛋白序列進行全局比對,參數為默認。基于多序列比對結果,利用MEGA 6.0軟件,采用鄰接法(NJ)構建系統發育樹,Bootstrap值為1000。
通過TaDREB蛋白質序列編號和Ensembl Plants中小麥基因組注釋信息,從Ensembl Plants獲得TaDREB基因組序列和CDS序列,然后將序列提交到GSDS 2.0(http://gsds.cbi.pku.edu.cn)進行外顯子和內含子的可視化分析。
用MEME(http://meme-suite.org/)預測TaDREB蛋白質序列的保守基序,并采用如下參數:(1)最大基序數量為25;(2)保守基序長度為5~200個氨基酸;(3)其他參數為默認。
利用Ensembl Plants中小麥基因組注釋信息獲得TaDREB基因的染色體位置。參考王萌等[25]的標準,根據TaDREB基因兩兩之間BLASTN比對結果考察基因同源和復制事件。將以上分析結果用Circos 0.67軟件[26]可視化,同源或復制基因用弧線連接。
基于小麥和擬南芥中的同源基因,利用AraNet V2(http://www.inetbio.org/aranet/)分析小麥DREB基因參與的互作調控網絡。用Python程序提取TaDREB蛋白質編號,通過Ensembl Plants下載TaDREB基因上游1.5 kb序列作為基因的啟動子區域,并提交到PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)預測啟動子區存在的順式作用元件。從WheatExp(https://wheat.pw.usda.gov/WheatExp/)下載TaDREB基因在小麥5個組織(種子、根、莖、葉和穗)中的轉錄組數據,從NCBI Sequence Read Archive(SRA)(https://www.ncbi.nlm.nih.gov/sra/)下載TaDREB基因在干旱、熱和旱熱共脅迫下的轉錄組數據。使用Hisat2軟件[27]和Cuffdiff軟件[28]并按照以下標準鑒定差異表達基因:(1)對照或處理的FPKM值至少有一個大于1;(2)log2fold change的絕對值大于1;(3)q值小于0.05。利用Heml軟件繪制表達譜熱圖。
小麥DREB基因在干旱等逆境脅迫條件下的轉錄組測序數據來源于小麥品種中國春,為鑒定TaDREB基因在不同小麥品種中響應非生物脅迫的一致性,以及便于篩選到的熱脅迫響應基因的轉基因功能驗證,本研究選取本實驗室用于小麥轉基因的品種科農199,使用qRT-PCR技術進行TaDREB基因響應熱脅迫的驗證。科農199屬于半冬性小麥品種,在本實驗所采用的基因槍轉化體系下,科農199表現出優于其他小麥品種的轉化效率,因此本實驗室將科農199作為小麥轉基因功能驗證的工具品種。本研究選取科農199小麥出苗3 d、7 d、分蘗、春化、起身、拔節、挑旗、抽穗、開花、灌漿早期、灌漿晚期和成熟期共12個生長發育時期的小麥植株進行短期熱脅迫處理,處理溫度分別為35 ℃和42 ℃。用Trizol試劑(生工,上海)提取小麥葉片總RNA,用Transcriptor First Strand cDNA Synthesis Kit(羅氏,德國)進行cDNA第一鏈的合成。以小麥Actin基因作為內參,使用熒光定量試劑Ultra SYBR Mixture(康為世紀,北京)在Roche LightCycler 480熒光定量PCR儀(羅氏,德國)上對5個對熱脅迫有響應的TaDREB基因進行qRT-PCR(引物見表1),反應體系與程序參考Ultra SYBR Mixture說明書。每個處理進行三次生物學重復,每個樣品進行三次技術重復,數據處理采用2-△△CT法。
通過HMM軟件的初步搜索,在小麥蛋白質數據庫中共搜索到595個能夠匹配AP2結構域隱馬爾科夫模型且E值<1e-5的蛋白質序列。將所有序列提交到NCBI-CDD進一步篩選后,除去了其中133個屬于AP2亞家族和RAV亞家族的蛋白質序列,剩余的462條蛋白質序列均只含有一個AP2結構域且不包含其他保守結構域。將這462條蛋白質進行多重比對之后,根據保守區氨基酸序列,最終確定其中的204條序列屬于DREB基因家族。根據其系統進化分類和染色體位置進行命名。根據ExPASy-Compute pI/Mw的預測結果,TaDREB蛋白序列長度為150~1 409 個氨基酸,分子量為16.5~156.2 kDa,理論等電點(pI)介于4.29~11.69之間。蛋白質亞細胞定位結果表明,144(70.6%)個TaDREB蛋白定位在細胞核中,39個(19.1%)定位在葉綠體中,16個(7.8%)定位在細胞質中,3個(1.5%)定位在質膜上,2個(1.0%)定位在線粒體中。

表1 TaDREB基因qRT-PCR引物Table 1 Primers for qRT-PCR analysis of TaDREB genes
將從NCBI下載的AtDREB和TaDREB蛋白序列一起進行多序列比對并構建進化樹,結果發現,TaDREB基因能和AtDREB基因聚到一起,說明小麥中能夠和擬南芥各亞組序列聚到一枝的DREB基因為相同亞組。根據聚類結果,將TaDREB基因分為六個亞組,分別命名為DREB I、DREB II、DREB III、DREB IV、DREB V和DREB VI。每個亞組所包含的TaDREB基因數目分別為68、40、7、42、27和20個,分別占總數的33.4%、19.6%、3.4%、20.6%、13.2%和9.8%。
用MEME對TaDREB蛋白質保守基序進行分析,共鑒定到25個保守基序,并命名為motif 1~motif 25。結果表明,保守蛋白質基序在不同亞組之間存在高度的保守性。除TaDREB2-7A-1之外,所有的TaDREB蛋白質中都含有保守的motif 1,該保守基序位于AP2保守結構域中,并且含有一個保守的WLG短序列。除此之外,motif 4也幾乎包含在所有(除TaDREB2-5B-3、TaDREB2-5A-1、TaDREB2-4B-2、TaDREB2-2B-3、TaDREB2-2A-2、TaDREB2-2D-3、TaDREB2-6B-2、TaDREB3-1A-1、TaDREB3-1D-1和TaDREB3-1B-1外)的TaDREB蛋白質序列中,該保守基序同樣定位在AP2保守結構域中(圖1)。此外,motif 3、motif 4和motif 5在TaDREB蛋白的6個亞組中均有分布。同時,不同亞組蛋白質保守基序的分布也存在明顯的不同,除DREB III之外,其余5個亞組均含有其獨特的保守基序,例如,motif 2、motif 15、motif 12、motif 24和motif 17分別只存在于DREB I、DREB II、DREB IV、DREB V和DREB VI中(圖2)。
對TaDREB基因的結構分析表明,TaDREB基因的內含子數量為0~3個,存在內含子缺失現象。其中,DREB I、DREB III、DREB IV和DREB V等亞組中的大多數成員均沒有內含子,沒有內含子的基因數目分別為63、6、41和24個,占相應亞組基因總數的比例分別為92.6%、85.7%、97.6%和88.9%,DREB II中所包含的全部40個基因中,沒有內含子的基因只有14個,占總數的35%;22個基因含有一個內含子,占總數的55%;只有4個基因含有2~3個內含子。DREB VI中,50%的基因沒有內含子,其余50%均含有一個內含子。
根據Ensembl Plants中小麥基因組注釋信息,本研究將204個小麥DREB基因中的199個定位到了染色體上。結果表明,小麥21條染色體上均有TaDREB基因的分布。從1號到7號染色體,分布的TaDREB基因數目分別為22、36、11、13、52、41和24個,其中包含TaDREB基因最多的染色體為5B染色體,其上分布19個TaDREB基因;而3D染色體上只有3個TaDREB基因,為最少的一個,這表明小麥TaDREB基因在不同染色體之間的分布存在不平衡性,這有可能是因為染色體大小及結構不同導致的。從同源染色體組的角度來看,小麥A、B和D三個同源染色體組分別含有61、68和70個TaDREB基因,這表明A染色體組可能在進化的過程中發生了更多的基因丟失事件。

圖1 小麥DREB蛋白質序列保守基序1(A)和保守基序4(B)Fig.1 Conserved motif 1(A) and motif 4(B) in DREB protein
基因同源復制分析結果(圖3)表明,有164個TaDREB基因存在與其高度相似的同源序列,可分為兩類。第一類由108個TaDREB基因組成,構成了36個同源基因組,每組均由A、B和D染色體組上的三個同源基因組成;第二類由66個TaDREB基因組成,形成了33個同源基因對,每對同源基因分布在A、B和D三個同源染色體組中的兩個上。有趣的是,兩類同源序列中存在10個基因的重疊。以上結果說明,雖然小麥中大部分DREB基因都存在高度相似的同源染色體,但仍有一部分基因未鑒定到同源染色體,這表明小麥在進化過程中,TaDREB基因發生了部分丟失。同時,我們考察了非同源染色體之間基因的復制事件,總共鑒定到13個基因復制事件;其中,7個復制事件發生在同一條染色體上,其余6個發生在非同源染色體之間。值得注意的是,13個基因復制事件中的5對發生在5號染色體上。這些結果表明,在六倍體小麥中,雖然DREB基因復制事件很少發生,但是相對于其他染色體,5號染色體上的活躍性更高。
基于小麥與擬南芥基因的同源性關系,構建了小麥DREB基因與其他基因的互作關系網絡(圖4)。總共鑒定到了13個小麥DREB基因與122個其他基因存在互作關系,本研究稱這122個基因為互作基因,它們共構成了179個互作基因對。這些互作基因的功能主要涉及小麥基因的轉錄調控、植物的生長發育和對逆境的響應三個方面。這表明TaDREB基因對小麥的生長發育過程中起著重要的調控作用。從互作基因角度來看,其中110個互作基因只與一個TaDREB基因存在互作關系。從TaDREB基因的角度來看,TaDREB基因不僅與其他基因存在互作關系,TaDREB基因之間也存在相互作用關系。其中,和其他基因相比,與 TaDREB4-6D-1和 TaDREB5-2B-1存在互作關系的基因最多,分別為42和34個,并且這些基因的功能涉及器官發育,轉錄調控以及熱脅迫等逆境響應過程,暗示這兩個基因在小麥生長發育過程中的多個方面同時起著重要作用。
利用PlantCARE從204個TaDREB基因啟動子區共鑒定到了95個順式作用元件,其中42個和光響應有關,這表明TaDREB基因的表達可能和光有緊密的聯系。MBS(MYB binding site)、LTR(low-temperature responsiveness)和HSE(heat shock element)是在TaDREB基因啟動子區出現頻率最高的三個順式作用元件,它們分別涉及干旱、低溫和高溫響應。這暗示TaDREB基因可能參與植物對多種逆境的響應。

A:motif 2;B:motif 15;C:motif 12;D:motif 24;E:motif 17. 圖2 亞組特異的DREB蛋白質保守基序Fig.2 Subgroup-specific conserved motif of DREB protein
從WheatExp下載TaDREB基因在5個組織中的轉錄組數據進行表達分析,結果(圖5A)表明,TaDREB基因在小麥組織中的表達存在明顯差異,主要表現為三種表達模式,分別為在5個組織中的表達量都很低,甚至沒有表達;在5個組織中的表達都較高和組織特異性表達。如 TaDREB5-2B-1和 TaDREB6-6A-1等基因在5個組織中的表達量都很高,表明這些基因廣泛參與小麥的生長發育過程。而 TaDREB1-5B-7和 TaDREB1-5B-8主要在根中表達,暗示著這兩個基因在小麥根的發育中起著重要的作用。除此之外,5個組織中的每個組織都有其組織特異性表達的基因,說明基因表達的空間特異性在TaDREB基因中同樣存在。

圖3 小麥DREB基因的染色體定位、同源關系和基因復制事件Fig.3 Chromosomal localization, homologous relationship and gene duplication events of DREB genes in wheat
z10:第一片葉抽出胚芽鞘時期;Z10:3葉期;z23:3個分蘗時期;z30:穗長為1 cm時期;z32:2個節時期;z39:減數分裂時期;z65:開花期;z71:開花后2天;z75:開花后14天;z85:開花后30天。
z10:First leaf through coleoptile; Z10:Three leaves stage; z23:Three tillers stage; z30:Spike of 1 cm stage; z32:Two nodesstage;z39:Meiosis; z65:Anthesis; z71:2 days after anthesis; z75:14 days after anthesis; z85:30 days after anthesis.
1:干旱脅迫1 h;2:干旱脅迫6 h;3:熱脅迫1 h;4:熱脅迫6 h;5:旱熱共脅迫1 h;6:旱熱共脅迫6 h。
1:Drought for 1 h; 2:Drought for 6 h; 3:Heat for 1 h; 4:Heat for 6 h; 5:Drought plus heat for 1 h; 6:Drought plus heat for 6 h.
圖5小麥DREB基因在不同組織中(A)和不同逆境下(B)的表達模式分析
Fig.5ExpressionprofilesofTaDREBgenesindifferenttissuesandunderdifferentstresses
同時為了考察TaDREB基因在不同的非生物逆境條件下的表達模式,本研究下載了NCBI中現有的轉錄組數據,通過分析發現,在干旱、熱和旱熱共脅迫條件下,共有29個TaDREB基因在至少一種逆境條件下表現出了差異表達(圖5B)。在干旱脅迫下,11個基因的表達量顯著升高,5個基因的表達量顯著降低;熱脅迫下,15個基因的表達量顯著升高,8個基因的表達量顯著降低;在二者共脅迫下,16個基因的表達量顯著升高,10個基因的表達量顯著降低。值得注意的是, TaDREB4-7D-1在熱脅迫下表達量升高了100倍, TaDREB6-4D-1在干旱下的表達量上升了271倍, TaDREB6-2B-1在旱熱共脅迫條件下的表達量上升了189倍,暗示這些基因可能在對應的非生物逆境的響應中起著重要的作用。
根據轉錄組分析結果,本研究選擇了5個對熱脅迫響應程度最高的TaDREB基因,在小麥品種科農199中使用qRT-PCR驗證這種響應。結果表明(圖6),整體來看,這5個基因在小麥12個生育時期中的絕大部分時期都對熱脅迫產生響應,表達量均顯著升高。如 TaDREB2-1B-1基因,在12個生育時期中的6個時期,以及在42 ℃處理下,在12個時期中的7個時期,表達量均顯著升高。 TaDREB2-7A-2基因在35 ℃處理下,在12個時期的11個中表達量都顯著升高。值得注意的是,小麥DREB基因的表達對42 ℃脅迫的響應沒有對35 ℃脅迫顯著,在很多發育階段,DREB基因對42 ℃脅迫并無響應,基因表達沒有顯著變化。暗示著5個基因可能并不是小麥的42 ℃脅迫下的主要響應基因。但是從總體來看,對這5個基因的qRT-PCR分析結果和轉錄組數據分析結果一致,暗示這5個基因在小麥的高溫脅迫響應中扮演著重要角色。
X軸上的1~12依次代表小麥出芽3天、出芽7天、分蘗期、春化期、起身期、拔節期、挑旗期、抽穗期、開花期、灌漿早期、灌漿晚期和成熟期。
1-12 on the X-axis represent the 12 growth periods of wheat including 3 days and 7 days after germination, tillering, vernalization, booting, jointing, flagging, heading, flowering, early grain filling, late filling and maturing stages,respectively.
圖65個熱響應基因在小麥品種科農199不同生長發育時期的相對表達水平
Fig.6Relativeexpressionoffiveheatresponsegenesin12growthperiodsofwheat
本研究在小麥全基因組范圍內鑒定TaDREB基因,并最終獲得了204個TaDREB基因,大約占小麥中所有編碼基因的0.195%,這個比例和擬南芥中的0.206%接近,高于水稻的0.160%和玉米的0.129%。從數量來看,TaDREB基因的數量高于擬南芥(57)、水稻(57)和玉米(51),這很可能和它龐大的基因組有關;小麥屬于異源六倍體,是由三個物種通過雜交和染色體加倍形成的,在此過程中,基因數目也自然而然發生了加倍。值得注意的是,本研究鑒定到的TaDREB基因中,有16個TaDREB基因的編碼蛋白定位在細胞質中,這有可能是軟件的預測誤差和小麥基因組注釋誤差造成的。
針對DREB基因的全基因組鑒定最早是在擬南芥中進行的,Sakuma等[2]根據DREB蛋白質序列的不同將該家族分為6個亞組,隨后在其他物種DREB基因的全基因組鑒定中,延續了這種分類標準,并采用將待研究物種DREB蛋白質序列與擬南芥DREB蛋白質序列一起構建系統發生樹,并根據聚類結果對所研究物種DREB基因進行分類的方法。但是由于算法的原因,這種分類方法存在微小的誤差。為避免這種誤差造成的累積誤差,本研究中只使用擬南芥DREB蛋白序列與小麥DREB蛋白序列一起構建系統發育樹,而沒有加入其他物種的DREB蛋白質序列。蛋白質保守基序分析表明,亞組內部蛋白質保守基序分布高度相似,不同亞組之間存在明顯的不同,這從另一個方面證明了上述分類方法的正確性。最后,基因結構分析結果顯示,TaDREB基因普遍缺少內含子,這種現象和其他物種中的DREB基因結構類似。一種解釋基因中內含子缺少現象的推測認為,內含子的缺失能夠減少基因從轉錄到翻譯所需要的時間,使基因快速表達并生成有功能的蛋白質,以響應植物體內或環境的變化[29]。
啟動子分析表明,小麥DREB基因涉及對光、干旱和熱脅迫等多種逆境的響應;基因互作表明,小麥TaDREB基因主要通過與多種轉錄調控基因的互作來發揮其生物學功能。兩種分析均表明,TaDREB基因的不同成員在小麥的生長發育過程中起著重要的調控作用,是小麥生長發育中不可缺少的重要因素。
為了進一步研究DREB基因在小麥生長發育和逆境脅迫條件下的潛在作用,本研究下載并分析了TaDREB基因在小麥組織和逆境條件下的表達情況,鑒定到了一些組織特異表達基因,說明不同的TaDREB基因可能參與不同小麥組織的生長發育,基因表達有明顯的空間特異性。同時,也鑒定到多個對逆境脅迫有響應的基因,例如, TaDREB4-7D-1、 TaDREB6-4D-1和 TaDREB6-2B-1在逆境脅迫條件下表達量顯著上調,通過分子生物學和基因工程等手段對這這些基因的進一步研究,將為小麥在不良環境下的生理代謝機制提供新的信息,并為其他物種中DREB基因的研究提供線索和思路。