陳 云,董燁平,張世鵬,吳 蘇,譚 敏,宋正鑫,劉致浩
(湖北師范大學 生命科學學院,湖北 黃石 435002)
棉花(Gossypiumhirsutum)是世界上最主要的經濟作物,具有產量大、成本低、利用價值高等優點。研究表明,非生物逆境脅迫是影響棉花生長的主要因素之一,嚴重時會使棉花生長受到抑制,進而導致棉株死亡[1]。隨著全球溫室效應的加劇,在夏秋時節,我國新疆及長江流域會經常出現短暫或持續高溫天氣,對棉花生長造成嚴重的負面影響,導致棉花生長異常甚至不育。因此,針對干旱和高溫等非生物脅迫帶來的不利影響,篩選出具有優異抗逆性棉花種質,加強對棉花抗逆脅迫下生理響應機制的認識,鑒定抗逆境相關基因是當前棉花育種的主要研究內容[2,3]。
類黃酮是植物體內廣泛存在的一類次生代謝物質,在植物生長發育過程中均發揮多種生理功能。此外,類黃酮在植物抗生物脅迫方面也發揮著重要作用[4]。目前,植物界中從種子植物到苔蘚植物均發現了類黃酮的合成和分布[5]。常見的類黃酮有查爾酮、黃酮醇、黃酮、黃烷醇、黃烷酮、花青素等[6]。類黃酮具有很強的抗氧化活性,參與植物的抗逆反應,表現形式主要有植株的顏色發生改變,以此來清除逆境脅迫下產生和積累的活性氧[7]。類黃酮生物合成途徑在許多植物中進行了研究。目前已經在擬南芥(Arabidopsisthaliana)、大豆(Glycine)、葡萄(VitisviniferaL.)等多種植物中分析了催化類黃酮生物合成的酶。目前在植物中已經鑒定出26種類黃酮生物合成相關基因,主要包括查爾酮合成酶(CHS),查爾酮異構酶(CHI),黃酮醇合成酶(FLS),異黃酮還原酶(IFR),黃烷酮3-氫化酶(F3H),花青素合成酶(ANS),異黃酮合酶(IFS),二氫黃酮醇4-還原酶(DFR),花色素雙加氧酶(LDOX),花色素還原酶(LAR)等[8]。這些酶在類黃酮生物合成途徑中分別催化不同的反應。
查爾酮合成酶(CHALCOME SYNTHASE,CHS)是植物類黃酮生物合成途徑中的第一個關鍵酶,它催化丙二酰輔酶A的3個乙酸單元與對羥苯丙烯酰輔酶A的一個乙酸基縮合生成四羥基查爾酮,該產物進一步衍生轉化構成了各類黃酮類化合物[9]。前人的研究表明,查爾酮合成酶不僅催化黃酮類化合物的合成,而且在花青素生物合成,植物根瘤形成,抗生物脅迫和防止紫外線損傷方面均發揮重要作用[10]。CHS基因因其重要功能而得到廣泛研究。目前,已經在多種植物中對CHS基因家族的調控和功能進行了研究,包括葡萄、非洲菊(GerberajamesoniiBolus)、蘋果(Malusdomestica)、文心蘭(Oncidiumhybridum)、蘭花(Cymbidiumssp.)、金絲桃屬植物(Triadenum)、擬南芥、矮牽牛(PetuniahybridaVilm)和豆等[11]。查爾酮合成酶基因是一個比較大的多基因家族,并且在基因結構上非常保守[12]。目前,在玉米中已經鑒定了14個完整的CHS基因[13],在矮牽牛中鑒定了6個CHS基因[14],在大豆中發現了8個CHS基因[15],水稻中也已經鑒定出27個CHS基因[16]。
目前關于CHS基因在植物(尤其是棉花)抗逆方面的研究較少,在陸地棉中該基因家族信息也不清楚。因此,鑒定出陸地棉中的CHS基因對研究該基因家族在參與棉花抗逆中的功能角色具有重要的理論意義。
使用hmmsearch在陸地棉全基因組(https://cottonfgd.org/)范圍內鑒定同時包含PF00195 (Clal_sti_synt_C)與PF02797(Clal_sti_synt_N)結構域且E-value小于10-3的蛋白序列,再使用使用NCBI-CDD工具進行進一步的篩選,完成棉花CHS家族基因的鑒定。利用expasy對其編碼的蛋白質大小、分子量、理論等電點及親水性等理化性質進行分析。
使用MEGA7.0軟件對棉花CHS的蛋白序列進行系統進化分析,Bootstrap設置為1 000,使用工具TBtools對進化樹進行可視化。
根據棉花全基因組數據獲得棉花CHS基因家族的染色體信息,包括基因起始位點信息以及基因所在染色體長度,然后使用TBtools軟件進行染色體定位。
將鑒定的棉花CHS蛋白序列提交到在線MEME工具進行保守基序分析。參考其他文獻中有關CHS基因家族的保守結構域分析結果,我們將Motif sites設置為2~500 sites,Width在6~100 wide;接著利用TBtools對所得結果進行展示。
在棉花基因組數據庫中(https://www.cottongen.org/)下載棉花不同生長時期的組織中以及在不同脅迫處理條件下的棉花 RNA-Seq數據,使用perl腳本篩選出CHS基因的表達量,利用TBtools軟件繪制棉花CHS基因家族表達熱圖。
通過hmmsearch在陸地棉全基因組(https://cottonfgd.org/)范圍內鑒定同時包含PF00195 (Clal_sti_synt_C)與PF02797 (Clal_sti_synt_N)結構域的蛋白序列,從四倍體棉花基因組數據庫中鑒定出35個GhCHS基因,并按照每個基因在染色體上的位置順序重新命名(GhCHS01-35)。同時通過EsPAsy在線網站查詢GhCHS基因家族的基本信息。結果顯示,這些編碼CHS蛋白的氨基酸長度范圍在329 aa (GhCHS10)~597 aa (GhCHS23),氨基酸平均長度約為448.3 aa;分子量在 35.96 kD (GhCHS10)到66.43 kD (GhCHS23),平均分子量為49.9 kD;等電點在5.28 (GhCHS15)~9.42 (GhCHS03),除GhCHS15、GhCHS31、GhCHS33、GhCHS02、GhCHS17、GhCHS09、GhCHS13、GhCHS14、GhCHS24、GhCHS29、GhCHS10、GhCHS26、GhCHS27、GhCHS07外,其余蛋白理論等電點均大于7;除了GhCHS01,GhCHS04,GhCHS07,GhCHS11,GhCHS16,GhCHS19,GhCHS34這7個蛋白為疏水性蛋白,其他的蛋白均為親水性的蛋白(表1)。

表1 棉花CHS家族基因信息
單獨使用35個棉花CHS蛋白序列進行進化分析,同時對它們的基因結構與保守結構域進行了分析(圖1)。結果表明這些CHS蛋白可聚類為7個支(圖1)。第1支包含10個CHS蛋白,第2支包含5個,第3支包含4個,第4支只有1個CHS蛋白,第5支和第6支都只包含2個CHS蛋白,第7支包含的蛋白數最多,有11個。基因結構分析結果顯示CHS基因的外顯子數量在1~5個之間,其中有12個基因只有一個外顯子,沒有內含子;有一個基因有5個外顯子(GhCHS23);有14個基因有兩個外顯子一個內含子。保守結構域分析結果顯示,35個蛋白中均包含1號和2號,除了GhCHS23外,其余蛋白均包含10號Motif,7號和14號Motif只存在于第4~7進化支中的CHS蛋白,處于相同進化支的蛋白基本上具有相同的保守結構域。

圖1 棉花CHS蛋白進化樹、基因結構及保守結構域分析
為了了解CHS基因在棉花染色體上的分布情況,我們對鑒定出的35個GhCHS基因進行了染色體定位分析(圖2)。結果顯示,32個基因分別定位在棉花的16條染色體上,GhCHS33、GhCHS34和GhCHS35這3個基因分別定位于未能組裝到染色體的scaffold6253、scaffold27_A01和scaffold738_A03片段上。其中,A05號、D02號和D05號染色體上分布最多,分別有4個CHS基因,其余染色體上均含有1~3個CHS基因。

圖2 棉花CHS 基因在染色體上的定位
為了研究棉花CHS基因在棉花不同組織中的表達模式,我們從棉花轉錄組數據庫中篩選出了35個CHS的組織表達數據。分析了這些GhCHS基因在根、莖、葉、花瓣、花藥以及不同天數(開花前3d; 開花當天0d; 開花后1 d; 3 d; 5d; 10d; 15 d; 20 d)的胚珠和不同天數(開花后 10d; 15 d; 20 d)的纖維中的表達情況。依據組織表達情況這35個CHS基因可以分為8支(圖3):第一支的基因(GhCHS9~GhCHS31)在胚珠發育起始階段優勢表達;第二支的基因(GhCHS18~GhCHS20)在根中優勢表達;第三支的基因(GhCHS12~GhCHS32)在開花后3 d 和5 d的胚珠中優勢表達;第四支的基因(GhCHS23~GhCHS8)在葉片中優勢表達;第五支的基因(GhCHS02~GhCHS29)在花瓣中優勢表達;第六支的基因(GhCHS04~GhCHS27)在纖維中優勢表達;第七支的基因(GhCHS05和GhCHS21)在根、莖、胚珠和纖維中均有較高的表達;第八支的基因(GhCHS06,GhCHS11和GhCHS24)在開花后10 d和15 d的胚珠中優勢表達;這些結果表明這些CHS基因在棉花的不同組織中發揮著不同的生物學功能。

圖3 棉花CHS基因在不同組織中的表達情況
研究報道,CHS基因在不同植物中的表達是由許多生物和非生物脅迫反應誘導的[17]。為了研究CHS基因在棉花逆境脅迫中的應答情況,利用已報道的不同脅迫處理條件下的棉花RNA-Seq數據分別對GhCHS基因在干旱、熱、冷及鹽處理下的表達模式進行了分析(圖4)。在干旱處理條件下(圖4A),這些基因的表達情況分為3類,第一類是基因的表達量隨著處理時間的增加而降低(GhCHS05~GhCHS10);第二類是基因的表達量隨著處理時間的增加而逐漸增加,在干旱處理12 h達到最大,然后表達量逐漸下降(GhCHS03~GhCHS13);第三類是基因的表達量在干旱處理前期(6 h之前)不斷的增加,而在干旱處理6 h后開始下降(GhCHS25~GhCHS19,GhCHS26);此外,GhCHS11的表達幾乎不受干旱脅迫的影響。以上結果表明這些基因可能在植物抗逆的不同階段發揮功能,分工協作參與棉花對不同脅迫的響應。
在熱脅迫處理條件下,這些基因的表達模式與干旱脅迫下的表達模式很相似,大致可以分為3類(圖4B):第一類隨著熱脅迫處理時間的增加基因的表達量顯著下降(GhCHS05~GhCHS10);第二類在熱處理12 h時基因高量表達(GhCHS23~GhCHS19);第三類基因在熱處理的早期表達量較高,而隨著處理時間的增加表達量降低(GhCHS20~GhCHS24)。
在鹽脅迫處理條件下,一些CHS基因的表達在鹽處理的早期(1 h, 3 h)時升高,隨著處理時間的增加表達量下降,比如GhCHS12~GhCHS09(圖4C);一些基因在處理中期高量表達,比如GhCHS29~GhCHS32;另外一些基因在鹽脅迫處理條件下下調表達(GhCHS21~GhCHS28)。
在冷脅迫處理條件下,一些CHS基因在處理的早期(1 h)高量表達(GhCHS18~GhCHS16);一些基因在處理中后期高量表達,比如GhCHS28~GhCHS23;另外一些基因在處理條件下下調表達(GhCHS12~GhCHS17) (圖4D)。

圖4 GhCHS家族基因在不同脅迫處理條件下的表達分析
由于全球氣候變化和土壤鹽漬化,使得非生物脅迫成為限制棉花生長和產量的主要環境因素,挖掘一些重要的抗逆基因顯得十分重要。CHS基因是植物中特有的一類基因家族,在植物生長發育的各個時期都發揮著重要作用,參與類黃酮生物合成途徑。棉花全基因組測序的完成使得CHS基因家族的鑒定成為可能。目前,已經有很多物種的CHS基因家族成員被鑒定出來。
本研究從基因組水平上初步鑒定并分析了35個棉花CHS基因家族成員。系統進化和序列分析結果顯示這35個CHS蛋白可以分為7類,蛋白序列高度保守,并且它們的保守結構域與系統進化樹分類基本一致,同一類內的GhCHS蛋白通常表現出相似的基因序列組成。此外,大多數GhCHS基因包括兩個外顯子和一個內含子,與前人的研究一致。植物通常受到環境壓力的威脅,包括生物脅迫和非生物脅迫。為了研究棉花CHS基因在植物抗逆中的功能,我們對棉花CHS基因在不同生長時期的組織中以及在干旱、鹽、高溫、低溫等處理下的表達情況進行了分析,結果顯示不同的GhCHS基因在不同的脅迫條件下表達具有較大的差異性,暗示了這些CHS基因在棉花對脅迫條件的應答中具有不同的功能。
CHS基因家族調節植物的類黃酮代謝,在植物的生長發育過程中起著至關重要的作用。在本研究中,我們對棉花CHS基因家族進行了多項分析,包括蛋白序列分析,系統進化分析,染色體定位,基因結構及保守結構域分析等,揭示了棉花CHS基因家族的多樣性和保守性。此外,我們還研究了GhCHS基因在不同生長時期的組織中及逆境脅迫下的表達模式,這些結果為進一步研究CHS家族基因在植物抗逆方面的功能提供了科學依據。
Genome-wide identification and expression analysisofCHSgene family inGossypiumhirsutum
CHEN Yun,DONG Ye-ping,ZHANG Shi-peng,WU Su,TAN Ming,SONG Zheng-xin,LIU Zhi-hao