張曼, 王志城, 劉正文, 王國寧, 王省芬, 張艷
(河北農(nóng)業(yè)大學農(nóng)學院,華北作物改良與調(diào)控國家重點實驗室,河北省作物種質(zhì)資源重點實驗室,河北 保定 071000)
棉花是重要的經(jīng)濟作物,對中國經(jīng)濟發(fā)展有著重要的作用。繼二倍體雷蒙德氏棉(Gossypium raimondii)[1]和亞洲棉(Gossypium arboreum)[2]測序完成,生產(chǎn)上應用最廣泛的陸地棉(Gossypium hirsutum)和海島棉(Gossypium barabdense)基因組序列也已繪制完成[3-4],標志著棉花研究進入了后基因組時代,為開展基因家族的全基因組鑒定與生物信息學分析提供了基礎信息。
β-葡萄糖苷酶(β-glucosidase)EC3.2.1.21,又稱β-D-葡萄糖糖苷水解酶,屬于纖維素酶類,是纖維素分解酶系中的重要組成成分。β-葡萄糖苷酶能夠從含糖化合物中催化水解末端的非還原性β-D-葡萄糖苷鍵,同時釋放β-D-葡萄糖和相應的配基[5]。在高等植物中,β-葡萄糖苷酶主要包括糖基水解酶家族1 (glycoside hydrolase family 1,GH1)[6],其廣泛參與防御反應[7]、細胞壁木質(zhì)化[8]、植物激素信號激活[9-10]和次生代謝[11]等重要生理過程。通過對β-葡萄糖苷酶家族的系統(tǒng)發(fā)育進行分析,發(fā)現(xiàn)擬南芥AtBGLU45、AtBGLU46和AtBGLU47與松柏(Pinus contorta conifin)β-葡萄糖苷酶基因聚為一類,它們可能通過水解單酚苷參與木質(zhì)化過程[12]。抑制水稻Os3BGLU6的表達導致植株矮化、葉片中ABA 含量降低、干旱敏感性增加、光合速率降低、細胞間CO2濃度升高,影響植株的耐旱性[13]。比較分析5 種薔薇科植物的β-葡萄糖苷酶家族全基因組發(fā)現(xiàn),梨(Pyrus bretschneideri)果實中BGLU基因與木質(zhì)化和石細胞發(fā)育有關[14]。水稻(Orazy sativa)中的OsGH3基因可以調(diào)控生長激素、茉莉酸和水楊酸信號通路之間的串聯(lián),從而影響水稻對生物和非生物脅迫的耐受性[15]。β-葡萄糖苷酶家族除了參與植物的細胞壁代謝及激素的激活外,還在植物逆境脅迫的防御反應中起重要作用。
生物信息學在全基因組分析中發(fā)揮著越來越重要的作用,棉花的多個重要基因家族已經(jīng)通過全基因組分析取得了重要成果[16-17]。目前,從基因組水平解析棉花β-葡萄糖苷酶基因(BGLU)家族的相關研究還未見報道。本研究從全基因組水平鑒定了陸地棉中的BGLU基因家族成員,對各成員的基因結構、染色體定位、系統(tǒng)進化關系、啟動子調(diào)控元件等進行了系統(tǒng)分析,并結合黃萎病菌處理后的抗病‘農(nóng)大601'的轉錄組數(shù)據(jù)對參與黃萎病抗性反應的GhBGLU基因進行了篩選和相關qPCR 驗證,為后續(xù)深入研究BGLU基因在陸地棉中的功能奠定基礎。
根據(jù)GhBGLU基因序列對最新版本的高質(zhì)量陸地棉基因組(https://cottonfgd.org/)進行BLAST搜索,確定候選基因,進一步利用GhBGLU家族特有保守結構域(PF00232)通過Pfam 數(shù)據(jù)庫[18](http://pfam.xfam.org/)和NCBI CD-Search 數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/cdd/)進行驗證,剔除冗余序列后,最終得到陸地棉BGLU家族成員的序列。
通過Clustal W 程序對陸地棉BGLU 氨基酸序列進行多序列比對[19],利用MEGA 7.0 軟件的鄰接法(Neighbor-Joining, NJ)構建系統(tǒng)進化樹,Bootstrap重復測試(replications)設置為1 000。
利用在線軟件MEME (http://meme.sdsc.edu/meme/)分析保守結構域,結合GhBGLU家族基因外顯子-內(nèi)含子結構,利用TBtools 進行可視化。根據(jù)基因組結構注釋文件的基因信息可知各BGLU家族成員在染色體上的位置,利用MapChart 軟件進行基因染色體定位。使用MCScanX 軟件對陸地棉GhBGLU家族成員的共線性進行分析[20],最后使用Circos 軟件對結果進行可視化展示[21]。利用TBtools 軟件對共線性基因進行Ka/Ks計算,并評估其進化選擇方向[22]。從陸地棉基因組數(shù)據(jù)庫中選取BGLU家族中起始密碼子ATG 上游2 000 bp 的序列,利用PlantCARE 數(shù)據(jù)庫(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)分析其可能存在的順式作用元件,篩選后利用TBtools軟件作圖。
利用本實驗室大麗輪枝菌脅迫的棉花轉錄組數(shù)據(jù)庫[23]進行BGLU家族基因表達模式分析,使用TBtools 軟件繪制BGLU基因家族各成員表達量熱圖。
以本實驗室保存的陸地棉抗病品種‘農(nóng)大601'(ND601)為材料,在黃萎病菌脅迫6、12、24、36、48 h后取根部樣品,提取RNA并進行Real-time PCR。以UBQ作為內(nèi)參,采用 2-△△CT法[24]計算基因的相對表達量,每個基因的表達反應有3個生物重復和3個技術重復。本文所用引物詳見表1。

表1 本研究中所用qRT-PCR引物序列Table 1 Primer sequences for qRT-PCR in this study
在陸地棉‘TM-1'基因組中共鑒定到53 個編碼GhBGLU基因的家族成員,根據(jù)它們在染色體上的位置分別命名為GhBGLU01~GhBGLU53(表2)。GhBGLU基因編碼的氨基酸范圍在121~546 aa 之間,蛋白質(zhì)分子量分布在13.9~66.3 kD 之間;等電點變化范圍則從4.694~9.728。利用不同的軟件對GhBGLU基因家族成員進行亞細胞定位預測,分析結果顯示,GhBGLU家族不同成員定位于細胞質(zhì)膜、液泡、胞質(zhì)、胞外和溶酶體中。信號肽預測發(fā)現(xiàn),53 個基因家族成員在N 末端均存在信號肽,且有16 個成員含有跨膜域,推測它們可能為分泌蛋白。
基于陸地棉和擬南芥蛋白序列構建系統(tǒng)發(fā)育樹,GhBGLU基因被分為6 個亞家族(A~F)(圖1),每個亞族均同時包含GhBGLU和AtBGLU基因,表明這些成員功能保守。AT1G52400、AT2G44490、AT5G57220、AT1G51490、AT3G09260等基因參與了擬南芥對病菌及蟲害的防御反應[25]。另外,擬南芥AT2G44450可催化黃酮類物質(zhì)的合成反應[26];AT3G09260、AT3G15950參與了茉莉酸調(diào)控通路[27];AT5G52310、AT5G60360通過調(diào)節(jié)脫落酸水解活性在擬南芥滲透脅迫響應中起重要作用[28]。根據(jù)同源進化關系,推測棉花中與擬南芥同源的這些基因可能參與了棉花對生物、非生物的脅迫響應。

圖1 陸地棉和擬南芥BGLU基因家族進化分析Fig. 1 Phylogenetic analysis of BGLU proteins in G. hirsutum and Arabidopsis
根據(jù)基因位置信息,發(fā)現(xiàn)陸地棉中53 個GhBGLU基因不均勻地分布在除A 亞組第3、4 號染色體和D亞組第2、4號染色之外的22條染色體上,且主要分布在染色體兩端(圖2)。此外,GhBGLU在A、D亞基因組間無明顯偏好性。

圖2 陸地棉BGLU基因家族成員的染色體分布Fig. 2 Chromosomal location of the GhBGLU genes in G. hirsutum
陸地棉GhBGLU基因編碼的蛋白含有8 種motif,分別命名為motif 1~motif 8(圖3)。這些motif 在GhBGLU家族大部分成員中均有出現(xiàn),為該家族的保守基序,推測其在該家族中行使基本功能。GhBGLU家族外顯子個數(shù)變異較大,GhBGLU17、GhBGLU38、GhBGLU44僅含有1 個外顯子,而GhBGLU4基因含有的外顯子高達14 個。大豆[29]和水稻[30]中外顯子數(shù)目基本在11~13 左右,個別基因出現(xiàn)了8~9個。

圖3 陸地棉GhBGLU基因家族保守基序Fig. 3 Conserved motifs of GhBGLU gene family in G. hirsutum
為研究GhBGLU家族基因進化的關系,使用MCScanX 軟件進行共線性分析,共發(fā)現(xiàn)21對共線性基因對。A、D 亞組中均發(fā)現(xiàn)2 對片段復制基因,A 亞組和D 亞組之間有17 對同源基因呈絕對共線性(圖4)。通過計算上述基因對的非同義突變率與同義突變率的比值(Ka/Ks)發(fā)現(xiàn),同源基因對的Ka/Ks均小于1,表明這些基因在進化過程中受到了純化選擇。

圖4 陸地棉GhBGLU共線性分析Fig.4 Collinearity analysis of GhBGLU in G. hirsutum
通過對GhBGLU基因上游2 000 bp 序列的啟動子區(qū)順式作用元件進行分析發(fā)現(xiàn),存在與激素信號相關的脫落酸(abscisic acid, ABA)響應元件、赤霉素(gibberellic acid, GA)響應元件、auxin響應元件、水楊酸(salicyclic acid, SA)應答元件、茉莉酸甲酶(methyl jasmonate, MeJA)應答元件以及與環(huán)境脅迫相關的低溫應答元件、干旱應答元件和防御脅迫應答元件(圖5),其中,MeJA 反應元件最豐富(121 個)。上述應答元件的富集表明,棉花BGLU基因可能參與了植物對各種病原菌及環(huán)境脅迫的響應。

圖5 陸地棉GhBGLU啟動子順式作用元件分析Fig.5 Analysis of cis-acting elements of GhBGLU promoter in G. hirsutum
利用黃萎病菌脅迫下抗病陸地棉農(nóng)大601 的轉錄組數(shù)據(jù)庫[23],依據(jù)GhBGLU基因家族成員接菌后不同時間點的RPKM 值構建基因表達熱圖,共篩選出33個GhBGLU基因在大麗輪枝菌脅迫下差異表達(圖6),表現(xiàn)為2 種模式:一種是基因在病菌脅迫處理后表達量出現(xiàn)上升趨勢,包括GhBGLU5、GhBGLU34等,表明這些基因在棉花抗黃萎病反應中起正調(diào)控作用;另一種是在黃萎病菌處理后基因表達量呈現(xiàn)出下降趨勢,包括GhBGLU22、GhBGLU52等,表明這些基因在棉花抗黃萎病反應中起負調(diào)控作用。

圖6 陸地棉大麗輪枝菌脅迫下GhBGLU基因表達分析Fig. 6 GhBGLU genes expression under Verticillium dahliae stress
為明確上述響應大麗輪枝菌脅迫的GhBGLU基因是否參與棉花抗病反應,從表達差異明顯的基因中挑選了9 個成員,進一步在不同抗感棉花品種中檢測這9 個基因的表達水平(圖7)。熒光定 量PCR 結 果 顯 示,GhBGLU5、GhBGLU14、GhBGLU18、GhBGLU26、GhBGLU34、GhBGLU33在受到黃萎病菌脅迫后,表達量顯著提高,且在抗病品種‘ND601'中的表達量顯著高于感病品種‘CCRI8',推測上述基因正向調(diào)控棉花黃萎病的抗性。GhBGLU22、GhBGLU40、GhBGLU52表達量在‘ND601'中顯著下調(diào),但在‘CCRI8'中的表達沒有明顯規(guī)律,需要進一步研究其參與黃萎病菌抗性的作用方式。此外,在接菌后12 h 的抗病品種‘澳SiV2'和感病品種‘湘棉18'的轉錄組數(shù)據(jù)中也發(fā)現(xiàn),上述9個基因中的7個基因在‘澳SiV2'的轉錄水平高于‘湘棉18'中,與熒光定量結果較吻合。結合抗感品熒光定量和轉錄組測序結果,推測GhBGLU5、GhBGLU14、GhBGLU18、GhBGLU26、GhBGLU34在抗黃萎病反應中起正調(diào)控作用。

圖7 黃萎病菌脅迫下9個GhBGLU基因的表達分析Fig. 7 Analysis of the expression of 9 GhBGLU genes under the stress of V. dahliae
β-葡萄糖糖苷酶參與植物體內(nèi)的各類生理過程,主要在植物次生代謝及逆境脅迫中發(fā)揮重要作用[5]。本研究利用生物信息學手段從陸地棉中共鑒定出53 個BGLU家族基因,它們不均勻地分布在22 條染色體上,且主要分布在染色體兩端,包含8 個典型保守基序。大多數(shù)BGLU家族基因都是成對出現(xiàn)的,同源性高,推測這些基因在功能上有一定的相似性。通過系統(tǒng)發(fā)育分析,53 個BGLU家族基因被分為6 個亞組,且每個亞組均有擬南芥出現(xiàn),表明棉花BGLU基因與擬南芥BGLU基因具有同源性,但是擬南芥成員分布不均,導致棉花在某些蛋白序列表現(xiàn)出進化過程中的差異,可能和物種的自然選擇有關系。共線性分析發(fā)現(xiàn)了21 對基因對,同源基因對的Ka/Ks均小于1,表明這些基因在進化過程中受到了純化選擇。亞細胞定位結果顯示這些成員均定位在胞外,N 端均存在信號肽,表明該家族基因功能保守。
通過對幾種已測序的模式植物進行研究,如擬南芥[31]、苜蓿[32]、玉米[33]、水稻[34],發(fā)現(xiàn)BGLU基因均響應生物和非生物脅迫,與激活植物激素和防御化合物相關。植物BGLU基因家族對病菌脅迫有著不同程度的響應,其應答機制也不盡相同,擬南芥BGLU基因家族與抗病相關的通路均有關聯(lián),如木質(zhì)素[35]、水楊酸[36]、黃酮醇[37]、乙烯[38]。AtBGLU6(AT1g60270)過表達可以調(diào)控異黃酮的積累,提高植物對病菌脅迫防御。OsbspP(BGLU_RS28885)的缺失減弱了水稻稻瘟病對寄主的侵染力。研究表明,GhBGLU與β-1,3-葡聚糖酶同屬于GH 超家族,定位于液泡和胞外的β-1,3-葡聚糖酶可以通過降解真菌細胞壁相關成分對病原菌進行防御[39-40],亞細胞定位預測將GhBGLU家族中的多個成員定位在液泡或胞外,推測其可能與β-1,3-葡聚糖酶發(fā)揮類似的功能。
本研究分析了陸地棉BGLU基因家族對黃萎病脅迫的響應,發(fā)現(xiàn)大多數(shù)GhBGLU基因受黃萎病菌脅迫后顯著表達,表明棉花可通過調(diào)控部分BGLU基因來提高植物對病原菌抗性。對GhBGLU基因家族進行順式作用元件分析,發(fā)現(xiàn)多個與抗病相關的應答元件,如多種激素應答元件、防御相關應答元件和非生物脅迫應答元件等。植物激素水楊酸、茉莉酸被認為是植物抗病防衛(wèi)反應的內(nèi)源及中間信號分子,而MeJA 作為數(shù)目最多的應答元件可以直接對病原菌起到抑制作用,并作為抗病防衛(wèi)反應的內(nèi)源及中間信號分子發(fā)揮作用[41]。因此,推測GhBGLU基因啟動子序列中植物激素響應元件可能調(diào)控棉花抗病過程。根據(jù)qRT-PCR 結果,棉花中有6 個GhBGLU基因受黃萎病菌誘導后表達量顯著上調(diào),3 個GhBGLU基因受黃萎病菌誘導后表達量顯著下調(diào),這些BGLU基因可能作為介導棉花對黃萎病抗性的調(diào)控因子,在響應黃萎病脅迫中具有重要作用,具體的抗病機制還需要進一步研究。