鄭文杰,黨仁美,丁 寧,劉媛媛,聞珊珊
(西北農(nóng)林科技大學 農(nóng)學院, 陜西楊凌 712100)
基因的轉錄是高度調(diào)控的過程,由組蛋白和DNA組成的染色質(zhì)狀態(tài)對基因轉錄有重大影響。核心組蛋白的核心區(qū)域由球形折疊區(qū)和N末端結構域組成,而發(fā)揮“信號位點”作用的N端常常被組蛋白乙酰轉移酶、甲基轉移酶及磷酸轉移酶等作用,發(fā)生共價修飾。常見的組蛋白共價修飾包括乙?;⒓谆?、磷酸化、泛素化等。組蛋白乙酰化由組蛋白乙酰轉移酶(histone acetyl transferase,HATs)和組蛋白去乙酰化酶(histone deacetylase,HDACs)共同介導[1],HATs調(diào)控的組蛋白乙?;c基因活性的增加有關,而HDACs導致組蛋白乙酰化的逆轉,抑制功能基因的轉錄,最終使其表達沉默[2]。
基于其同源性,真核生物HDAC可分為3個家族,RPD3/HDA1家族、Sir2家族和HD2家族[3],而RPD3/HDA1又是其中最大的一類,其蛋白的同源性很高,主要分布于細胞核和細胞質(zhì)中[1],HDA1和RPD3都能介導基因的特異性并且負責全局性的去乙?;?,兩者在功能上相互協(xié)作[4],催化去乙酰基團的基本結構由Zn2+和相鄰的2個天冬氨酸、2個組氨酸及1個酪氨酸組成[5]。最初Pandey等[6]通過序列分析表明,擬南芥(Arabidopsisthaliana)中的RPD3/HDA1家族能夠劃分為Ⅰ、Ⅱ、Ⅲ類。隨后,F(xiàn)u等[7]對水稻(Oryzasativa)中RPD3/HDA1家族的系統(tǒng)發(fā)育分析,鑒定出了第Ⅳ類,Demetriou等[3]在大麥(Hordeumvulgare) 中也鑒定出4類亞家族,與水稻一致。
RPD3/HDA1家族在植物對非生物脅迫的響應中具有重要作用。水稻中RPD3/HDA1家族成員HDA705通過影響種子萌發(fā)和植物激素信號傳導,參與對鹽脅迫的應答過程[8-9];同樣的,AtHDA19和它的部分同源基因AtHDA6共同參與對鹽、干旱等非生物脅迫的調(diào)控,并且涉及到對植物激素表達的影響[10]。AtHDA6突變體對脫落酸和鹽脅迫的敏感性高于野生型,且其表達受外源激素茉莉酸(JA)的誘導,有研究還發(fā)現(xiàn),AtHDA6突變體有明顯延遲開花的現(xiàn)象[11-13]。玉米(Zeamays)中RPD3/HDA1家族成員ZmHDAC102、ZmHDAC108和ZmHDAC110在低溫脅迫下表達量上升,三者都能激活各自低溫誘導基因的轉錄[14],ZmHDA101通過參與組蛋白修飾來調(diào)控基因表達,進而影響玉米的生長和發(fā)育[15]。
溫度對小麥生長發(fā)育的影響貫穿整個生長周期,是限制小麥產(chǎn)量和品質(zhì)的重要因素之一,全球平均氣溫的升高,直接影響到灌漿期等小麥生長的關鍵時期,小麥產(chǎn)量和品質(zhì)受到了前所未有的影響[16]。關于RPD3/HDA1家族在逆境脅迫中的研究在擬南芥[10]、水稻[8-9]和大麥[3]等植物中已有相關報道,小麥中還鮮有研究,且有關RPD3/HDA1基因在高溫脅迫下的研究尚未見報道,因此本試驗運用生物信息學方法對小麥RPD3/HDA1家族基因進行全基因組鑒定,并對其在熱脅迫下的表達模式進行分析,以期能夠完善RPD3/HDA1家族基因的功能注釋,尋找小麥RPD3/HDA1家族候選耐熱基因,為小麥在耐熱方面的遺傳改良工作提供參考。
將‘中國春’小麥種植于溫度為(23±1) ℃,光/暗周期=16/8 h,相對濕度為60%的BIC-300人工氣候箱(博訊,上海)中7 d左右,在兩葉一心期時移入[V(基質(zhì))∶V(蛭石)=3∶1]比例的混合土壤中,轉移到溫室中生長。選用正常生長的小麥,在出苗后3 d、出苗后7 d、分蘗期、分蘗-起身期、拔節(jié)期、拔節(jié)后期、孕穗前期、抽穗期、開花期、灌漿前期、灌漿期和灌漿末期這12個生長時期取材,并在人工氣候箱中進行1 h的熱脅迫處理,處理溫度分別為35 ℃和42 ℃,將未做熱處理的小麥做為對照,剪取對照和處理組的葉片置于-80 ℃冰箱凍藏,用于后續(xù)qRT-PCR分析。
從Ensembl Plants(http://plants.ensembl.org/index.html)下載小麥的所有蛋白質(zhì)數(shù)據(jù),構建本地的BLAST數(shù)據(jù)庫;隨后從Pfam(http://pfam.xfam.org/)下載HDAC的隱馬爾可夫模型(HMM)(PF00850)作為query,使用HMMER3.0(http://hmmer.org/download.html)的hmmsearch工具包來查找本地蛋白數(shù)據(jù)庫中所有可能的HDAC蛋白序列,參數(shù)為E<1.5e-5。利用InterPro(http://www.ebi.ac.uk/interpro/)和NCBI-CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)排除冗余序列。使用Compute pI/Mw(http://web.expasy.org/compute_pi/)計算其理論等電點(pI)和分子質(zhì)量(Mw),使用CELLO(http://cello.life.nctu.edu.tw/)進行亞細胞定位預測。
利用Clustal_W將小麥、擬南芥和水稻的RPD3/HDA1序列進行多重比對,比對結果用MEGA6.0軟件的鄰接法(NJ)構建進化樹,Bootstrap值設置為1 000;從Ensembl Plants中獲取各候選基因的全長、cDNA和CDS序列,使用GSDS 2.0(http://gsds.cbi.pku.edu.cn/)分析RPD3/HDA1基因的外顯子/內(nèi)含子結構,使用MEME工具(http://meme-suite.org/index.html)分析其保守結構域。
從Ensembl Plants中獲取各候選基因的染色體位置信息,根據(jù)小麥RPD3/HDA1基因兩兩之間的BLAST結果獲取基因同源復制事件,利用Circos0.67軟件將兩者結果可視化,其中同源復制事件用曲線連接;運用Plant Care(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) 預測各基因的啟動子的順式作用元件。
從WHEAT EXP(https://wheat.pw.usda.gov/WheatExp/)獲得各基因在5種不同組織或器官(籽粒、穗、葉、根、莖)的轉錄組數(shù)據(jù)。從NCBI Short Read Archive(https://www.ncbi.nlm.nih.gov/sra/)獲得了干旱脅迫(SRR1542407和SRR1542409)和熱脅迫(SRR1542411和SRR1542413)的轉錄組數(shù)據(jù),利用TopHat和Cufflinks進行轉錄組reads的全基因組mapping,計算各個RPD3/HDA1基因的FPKM值,鑒定差異表達基因[17],用TBtools匯集并繪制表達圖譜。
用Tzizol試劑(生工,上海)提取小麥葉片總RNA,采用Transcriptor First Strand cDNA Synthesis Kit(羅氏,德國)進行反轉錄,利用Light Cycler 480(羅氏,德國)熒光定量儀,采用Ultra SYBR Mixture(康為世紀,北京)熒光定量試劑進行qRT-PCR分析,程序參照Ultra SYBR Mixture說明書,所用特異性引物如表1,各樣品進行3次生物學重復,測定時作3次技術重復,數(shù)據(jù)處理采用2-ΔΔCt法[18]。

表1 熒光定量PCR引物Table 1 Primers for qRT-PCR
利用BLASTP和HMM建模篩選2種方法,從小麥基因組中篩選到60個RPD3/HDA1候選基因,去除蛋白結構不完整的基因,與已經(jīng)報道的大麥、擬南芥、水稻的RPD3/HDA1家族成員的氨基酸序列進行比對篩選,最終得到36個小麥RPD3/HDA1基因,根據(jù)進化樹聚類分布以及文獻中RPD3/HDA1家族中“HHA”、“DIDIH”等氨基酸殘基的特征[3]將其分為Ⅰ、Ⅱ、Ⅲ和Ⅳ 4類,按照其亞組分類和基因在染色體上的位置命名。亞細胞定位預測結果顯示,其中26個基因定位在細胞質(zhì)中,10個基因定位在細胞周質(zhì)中。這些基因成員的等電點介于4.71~8.73,分子質(zhì)量介于35.2~59.4 ku,蛋白序列長度為314~698 aa。
為明確小麥RPD3/HDA1家族成員的分類,基于氨基酸序列,用MEGA6.0將已經(jīng)報道的水稻、擬南芥的RPD3/HDA1基因與小麥的RPD3/HDA1基因進行聚類分析,結果如圖1,這3個物種的基因被分為ClassⅠ、ClassⅡ、ClassⅢ、ClassⅣ 4個類群,水稻和擬南芥的基因分布于每個聚類之中,蛋白序列的相似性說明這3個物種的RPD3/HDA1基因可能具有相似的生物學功能。小麥在ClassⅠ亞族中有16個基因成員,ClassⅡ亞族有14個成員,ClassⅢ和ClassⅣ各有3個成員。
小麥RPD3/HDA1基因家族的聚類(圖2-A)與基因結構(圖2-B)顯示,結構最簡單的基因是TaHDAC-Ⅰ-5a和TaHDAC-Ⅰ-5d,其外顯子數(shù)目只有1個,沒有內(nèi)含子,推測兩者的功能具有高度保守性;TaHDAC-Ⅱ-2a和TaHDAC-Ⅱ-2b的結構最為復雜,外顯子16個,內(nèi)含子15個。同一染色體組的基因結構極其相似,而不同染色體組間的基因結構差異明顯,ClassⅡ和ClassⅢ亞族之間的基因結構差異較小,內(nèi)部成員基因結構也基本一致,ClassⅠ亞族內(nèi)部成員之間差異顯著,ClassⅣ和其他亞族間的差異較顯著。
小麥保守結構域的組成和數(shù)目分析結果如圖2-C,小麥RPD3/HDA1家族共有15個保守的蛋白基序,各個聚類內(nèi)小麥基因的保守結構域比較相似,其中ClassⅢ和ClassⅣ各自的內(nèi)部保守基序完全一致,基序1、3、5和6最為保守,基本覆蓋了全部的家族成員,說明這4個基序與RPD3/HDA1家族的生物學功能有密切聯(lián)系,但具體功能有待進一步研究?;?和基序13僅存在于Ⅱ和Ⅳ亞組,基序10和基序2只出現(xiàn)于亞組Ⅰ,基序12在亞組Ⅱ中沒有出現(xiàn)過。
根據(jù)Ensembl Plants中的染色體注釋信息,將小麥RPD3/HDA1基因在染色體中的位置進行圖示(圖3),所有的36個基因都分布在A、B、D 3個同源染色體組中, A組有11個,B組有12個,D組有13個,唯獨在3A和4A染色體上是空缺的,說明這兩條染色體上的RPD3/HDA1基因發(fā)生了缺失。基因同源復制結果表明,一共有35個RPD3/HDA1基因組成了28對同源基因對,結合圖1和圖2-A發(fā)現(xiàn),這些同源基因對基因在進化關系上具有良好的近緣關系。

Ta.Triticumaestivum; Os.Oryzasativa; At.Arabidopsisthaliana;三角形代表Ta RPD3/HDA1s,圓形代表AtRPD3/HDA1s,矩形代表OsRPD3/HDA1sTriangles represent TaRPD3/HDA1s, circles represent AtRPD3/HDA1s, rectangles represent OsRPD3/HDA1s;紫色代表ClassⅠ亞家族,紅色代表ClassⅡ亞家族,綠色代表ClassⅢ亞家族,藍色代表ClassⅣ亞家族 Purple represents ClassⅠ subfamily, red represents Class Ⅱ subfamily, green represents Class Ⅲ subfamily, and blue represents ClassⅣ subfamily
圖1小麥、擬南芥和水稻RPD3/HDA1基因家族的系統(tǒng)進化樹
Fig.1PhylogenetictreeofRPD3/HDA1genesinwheat,Arabidopsisandrice

圖2 小麥 RPD3/HDA1基因的系統(tǒng)進化(A)、基因結構(B)和保守結構域(C)Fig.2 Phylogeny relationships(A), gene structure(B) and conserved domain(C) of RPD3/HDA1 genes in wheat
為進一步了解RPD3/HDA1基因的功能,通過Plant Care網(wǎng)站分析小麥RPD3/HDA1基因的啟動子區(qū)域,結果如圖4表明, 48個順式作用元件按其功能分為11個組別,所有基因都含有與光(Light)有關的作用元件如G-box元件,表明小麥RPD3/HDA1基因與光合作用有關;36個基因中有75%的基因具有與茉莉酸(JA)激素代謝相關的作用元件,最多的TaHDAC-Ⅰ-1b和TaHDAC-Ⅳ-1b具有8個;77.78%的基因具有脫落酸調(diào)控相關元件;其他組別如冷(55.56%)、干旱(77.78%)和熱(50%)相關的響應元件中的基因數(shù)目都超過1/2;除此以外,還有7個基因含有病害相關的作用元件。

圖3 小麥 RPD3/HDA1基因在染色體上的定位及同源基因在A、B和D亞基因組中的關系Fig.3 Localization of wheat RPD3/HDA1 gene on chromosome and relationship of homologous genes in A, B and D sub-genomes

從綠色到紅色,順式作用元件的數(shù)目逐漸增多,白色是中間值 From green to red, the numbers of cis-acting elements gradually increase, and white is the intermediate value;矩形中的數(shù)字代表順式作用元件的個數(shù) The number in the rectangle represents the number of cis-acting elements
圖4小麥RPD3/HDA1基因的順式作用元件分析
Fig.4Analysisofcis-actingelementsofwheatRPD3/HDA1genes
為探究小麥RPD3/HDA1基因在不同組織(籽粒、穗、葉、根、莖)中的表達模式,從WheatExp中獲取小麥RPD3/HDA1基因在各組織中的表達量,利用TBTools軟件將結果可視化(圖5-A)。小麥RPD3/HDA1不同基因成員在各組織中的表達量差異顯著,TaHDAC-Ⅰ-2a、TaHDAC-Ⅰ-2b、TaHDAC-Ⅰ-2d、TaHDAC-Ⅰ-4a、TaHDAC-Ⅰ-4b、TaHDAC-Ⅰ-4d這6個基因在5種組織中的表達量都比較高;TaHDAC-Ⅱ-3a、TaHDAC-Ⅱ-3b、TaHDAC-Ⅱ-3d在葉片中的表達量明顯高于其他組織;TaHDAC-Ⅱ-1b在穗中的表達量比位于同一染色體上的TaHDAC-Ⅱ-1d高。 為了進一步研究小麥RPD3/HDA1基因在脅迫下的表達水平,利用SAR數(shù)據(jù)庫中獲取的RNA-seq數(shù)據(jù),分析小麥RPD3/HDA1家族基因在干旱脅迫1 h、熱脅迫1 h以及旱熱共脅迫1 h下的表達模式。如圖5-B所示,TaHDAC-Ⅰ-2d、TaHDAC-Ⅰ-2a和TaHDAC-Ⅰ-2b的表達量在熱脅迫1 h和旱熱共脅迫1 h后都出現(xiàn)了不同程度的明顯上調(diào),結合干旱脅迫1 h后全部基因的表達情況,TaHDAC-Ⅰ-2d、TaHDAC-Ⅰ-2a在旱熱共脅迫下引起的表達量上調(diào)是由熱脅迫主導的,同理,TaHDAC-Ⅱ-3a、TaHDAC-Ⅱ-3b和TaHDAC-Ⅱ-3d在旱熱共脅迫1 h后引起的表達量下降也是由熱脅迫主導的。相比這6個基因,其他基因對熱脅迫的響應不夠顯著,所以此6個基因可初步認為是小麥RPD3/HDA1家族里對熱脅迫較敏感的基因。

圖5 小麥 RPD3/HDA1基因在不同組織中(A)和不同脅迫(B)下的表達模式Fig.5 Expression pattern of wheat RPD3/HDA1 genes in different tissues(A) and different stresses(B)
為了明確RPD3/HDA1基因在熱脅迫下的表達模式,選取TaHDAC-Ⅱ-3a、TaHDAC-Ⅱ-3b、TaHDAC-Ⅱ-3d、TaHDAC-Ⅰ-2d、TaHDAC-Ⅰ-2a和TaHDAC-Ⅰ-2b這6個對熱脅迫有明顯響應的基因,分析其在小麥12個不同生長發(fā)育時期短時間熱處理后的葉片中的相對表達量。qRT-PCR結果(圖6)表明:TaHDAC-Ⅰ-2a在拔節(jié)期(是對照組的17.55倍)和灌漿前期(14.2倍)熱處理后的表達量有明顯的提升,TaHDAC-Ⅰ-2b在出苗7 d(18.41倍)、分蘗-起身期(17.07倍)、抽穗期(37.43倍)和灌漿后期(22.83倍)熱處理后的表達量上升最顯著;TaHDAC-Ⅰ-2d在分蘗-起身期熱處理后檢測不到表達信號,但在拔節(jié)期(23.92倍)、開花期(34.02倍)和灌漿后期(19.81倍)熱處理后表達量上升明顯;這3個基因受42 ℃脅迫后的表達量增幅比受35 ℃脅迫后的大,TaHDAC-Ⅰ-2b的在抽穗期有8.51倍的差距;TaHDAC-Ⅱ-3a、TaHDAC-Ⅱ-3b、TaHDAC-Ⅱ-3d的在出苗7 d和拔節(jié)期以外的時期均呈現(xiàn)出受熱脅迫后表達量下降的趨勢,與對照組相比,TaHDAC-Ⅱ-3d在孕穗前期的35 ℃熱脅迫后下降14.57倍,TaHDAC-Ⅱ-3b在分蘗期以外的其他時期呈現(xiàn)35 ℃后表達下調(diào)然后在42 ℃上調(diào)的態(tài)勢,甚至在拔節(jié)期和開花期超過對照組。

A.出苗3 d 3 days after germination;b.出苗7 d 7 days after germination;c.分蘗期 Tillering stage;d.分蘗-起身期 Erecting;e.拔節(jié)期 Early jointing;f.拔節(jié)后期 Late jointing;g.孕穗前期 Early booting;h.抽穗期 Heading stage; i.開花期 Flowering;j.灌漿前期 Early stage of grain filling;k.灌漿期 Filling;l.灌漿后期 Late grain filling stage
圖6RPD3/HDA1基因在小麥不同發(fā)育時期熱脅迫下的表達水平
Fig.6ExpressionlevelsofRPD3/HDA1genesunderheatstressatdifferentgrowthstagesofwheat
小麥是全世界廣泛種植的糧食作物之一,其應對環(huán)境脅迫的能力直接影響產(chǎn)量的高低和品質(zhì)的好壞。中國作為小麥主要種植產(chǎn)區(qū)之一,在小麥抵御高溫、干旱等脅迫的研究中都取得了優(yōu)異的進展?;谛←溁蚪M的龐大和復雜性,一直以來人們都受限于對新基因的挖掘。小麥基因組序列組裝成功,為小麥能應用生物信息學的手段預測候選新基因奠定了堅實的基礎。植物的生長與各種基因的時空表達和基因組水平的調(diào)控息息相關。由HATs和HDACs共同動態(tài)調(diào)控的組蛋白乙?;揎棧c染色質(zhì)的結構和基因的表達密切相關,其修飾方式參與了植物生長的整個生育期,同時也是研究植物對逆境脅迫的響應機理的切入點之一。前人對組蛋白去乙酰化酶的研究多集中在擬南芥(12個)[19],水稻(14個)和玉米(6個)等物種中[3],而對小麥RPD3/HDA1基因的研究較少,本研究利用生物信息學方法,系統(tǒng)鑒定出小麥的36個RPD3/HDA1基因,并且從結構分析、進化角度以及對熱脅迫下的表達模式等方面進行了分析。
前人對擬南芥和水稻的RPD3/HDA1蛋白結構分析[3,7],將其劃分為4個亞組,本研究通過進化樹分析以及對蛋白基序分析也將小麥的RPD3/HDA1基因劃分為Ⅰ、Ⅱ、Ⅲ和Ⅳ類,基因結構以及蛋白基序分析表明,小麥RPD3/HDA1家族基因具有多樣的基因結構和保守結構域,這種結構上的多樣性導致功能上的分化以更好的適應復雜多變的外界環(huán)境。已經(jīng)報道的水稻和擬南芥的RPD3/HDA1基因與植物生長發(fā)育及非生物脅迫有關,例如位于Ⅰ類的AtHDA6、AtHDA19和HDA705[8-10]在生長發(fā)育和逆境脅迫中都發(fā)揮著作用,由此推測小麥RPD3/HDA1中的Ⅰ類基因可能也具有相似的生物學功能。
AtHDA6的光信號通路研究表明光照能影響擬南芥染色質(zhì)的狀態(tài),這一過程是靠組蛋白修飾因子實現(xiàn)的[20],本研究的順式作用元件分析顯示,所有被鑒定到的RPD3/HDA1基因都含有光響應元件,TaHDAC-Ⅳ-1b和TaHDAC-Ⅱ-2b分別含有18個和16個,但與光合作用的關聯(lián)仍需進一步的試驗去證明;除此以外, 本研究中75%以上的基因含有茉莉酸和脫落酸響應元件,這也與Chen等[10]對AtHDA6參與脫落酸和茉莉酸調(diào)控網(wǎng)絡的研究一致,具體表現(xiàn)在其突變體對脫落酸的敏感性高,且其表達受外源激素(JA)的誘導。順式作用元件的數(shù)量和分類揭示了小麥RPD3/HDA1基因在激素調(diào)控和多種非生物脅迫中都有響應。
Liu等[21]的RNA-seq數(shù)據(jù)分析表明,小麥RPD3/HDA1基因在不同組織中的表達量并不一致,這與擬南芥在不同發(fā)育時期的表達量不同是一致的[22-23],本研究中,同一染色體組基因在不同組織中的表達模式相似,個別的如TaHDAC-Ⅱ-4a、TaHDAC-Ⅱ-1d與其染色體上其他基因在組織內(nèi)的表達量略有差異,這可能是因為基因在染色體進化的過程中發(fā)生了功能的缺失。ZmHDAC102、ZmHDAC108和ZmHDAC110在低溫脅迫下其表達量上升[14],本研究根據(jù)對逆境脅迫下基因表達模式的分析及qRT-PCR的驗證發(fā)現(xiàn),TaHDAC-Ⅰ-2d、TaHDAC-Ⅰ-2a和TaHDAC-Ⅰ-2b在熱脅迫1 h后表達量有明顯的上調(diào),而TaHDAC-Ⅱ-3a、TaHDAC-Ⅱ-3b、TaHDAC-Ⅱ-3d卻恰好相反,因為這兩組基因來自不同的聚類,猜測它們在熱脅迫中行使的功能是不同的,但從另一方面看,其與熱脅迫都有關聯(lián)。此外多數(shù)基因在小麥拔節(jié)期、開花期和灌漿后期的表達量明顯提高,可能激活了高溫誘導基因的轉錄。熒光定量結果與RNA-seq數(shù)據(jù)的統(tǒng)計基本一致,TaHDAC-Ⅱ-3d在拔節(jié)期的熱處理后表達量上升,這與轉錄組測序數(shù)據(jù)相反,同一基因在不同時期對熱的響應是不同的,結合圖6可知,這6個基因對42 ℃高溫有更強烈的響應,說明植物對不同溫度脅迫的響應并不相同,需要進一步探究熱脅迫中溫度的變化對基因表達的影響。