韓立軍,劉寶玲,李潤植,薛金愛
(山西農(nóng)業(yè)大學(xué) 分子農(nóng)業(yè)與生物能源研究所,山西 太谷 030801)
WRKY轉(zhuǎn)錄因子是指與真核基因啟動子區(qū)域順式作用元件結(jié)合的DNA結(jié)合蛋白[1]。自ULMASOV等[1]從甘薯中鑒定出第1個WRKY家族轉(zhuǎn)錄因子SPF1以來,WRKY家族轉(zhuǎn)錄因子相繼在水稻、小麥、番茄等多種植物中被發(fā)現(xiàn)[2-4]。WRKY因其蛋白含有高度保守的WRKYGQK七肽結(jié)構(gòu)而得名,每個家族成員具有1~2個七肽保守序列(N端)和1個鋅指結(jié)構(gòu)域(C端)構(gòu)成。WRKY域由60個氨基酸組成,C端為鋅指結(jié)構(gòu)C2H2(C-X4-5-C-X22-23-H-X-H)或C2HC(C-X7-C-X23-H-X-C)[5]。N端的WRKYGQK保守結(jié)構(gòu)域能識別并結(jié)合保守的DNA結(jié)合位點W-Box(TTTGACC/T)進而調(diào)控靶基因的表達[6]。盡管WRKYGQK高度保守,但在擬南芥、大豆、水稻等植物中發(fā)現(xiàn)WRKYGQK與鋅指結(jié)構(gòu)發(fā)生了變異[7-10]。根據(jù)七肽保守序列數(shù)量和鋅指結(jié)構(gòu)的特點將WRKY蛋白家族分成了三大類,第Ⅰ類和第Ⅱ類含有C2H2型鋅指結(jié)構(gòu),差別在于第Ⅰ類含有2個七肽保守序列而第Ⅱ類僅含有1個;第Ⅲ類則含有1個七肽保守序列和C2HC型鋅指結(jié)構(gòu)。其中,第Ⅰ類近N端七肽保守序列的DNA結(jié)合活性較弱,但近C端的七肽保守序列特異性增強與靶基因的結(jié)合[11-12]。WRKY作為植物最大的轉(zhuǎn)錄因子之一,廣泛參與植物的生長發(fā)育、生理過程以及多種生物和非生物脅迫響應(yīng)等[13]。魏鑫等[14]通過構(gòu)建棉花GhWRKY33過表達載體并轉(zhuǎn)化擬南芥,結(jié)果發(fā)現(xiàn),GhWRKY33響應(yīng)干旱脅迫,過表達后能明顯提高轉(zhuǎn)基因擬南芥的抗旱性。蘇瑩等[15]研究發(fā)現(xiàn),GhWRKY41過表達株系中,GhWRKY41參與了棉花響應(yīng)鹽和干旱脅迫應(yīng)答過程,且過表達可提高轉(zhuǎn)基因棉花耐鹽性和耐旱性。嚴(yán)曉紅等[16]通過實時熒光定量PCR(qPCR)檢測干旱脅迫下萌發(fā)棉籽的子葉和胚根中WRKY的表達變化,結(jié)果發(fā)現(xiàn),WRKY主要在胚根中表達從而響應(yīng)干旱脅迫。雷煜等[17]利用VIGS沉默技術(shù)抑制GhWRKY22基因的表達,發(fā)現(xiàn)沉默植株對大麗輪枝菌的敏感性增加,證明GhWRKY22基因正調(diào)控棉花的抗病性。劉秀芳[18]利用組織培養(yǎng)的方法將GhWRKY25異源轉(zhuǎn)化到本生煙中,結(jié)果獲得GhWRKY25超表達植株;與野生型本生煙相比,T3超表達GhWRKY25植株增強了對干旱脅迫的敏感性,并參與了ROS代謝路徑。目前,關(guān)于陸地棉中GhWRKY的研究多集中在生物及非生物脅迫方面[19],而對于WRKY參與種子萌發(fā)過程調(diào)控的研究鮮有報道。盡管已有研究表明,擬南芥AtWRKYⅠ亞家族中的AtWRKY2與種子萌發(fā)有關(guān)[20],但目前仍不清楚陸地棉WRKYⅠ亞家族成員是否也可能調(diào)控陸地棉種子萌發(fā)。
棉花作為我國重要的經(jīng)濟作物,其產(chǎn)量與品質(zhì)制約著與之相關(guān)產(chǎn)業(yè)的發(fā)展,系統(tǒng)鑒定異源四倍體陸地棉的WRKY轉(zhuǎn)錄因子家族,將有助于深入解析棉花的生長發(fā)育和脅迫應(yīng)答等生命活動的調(diào)控機制。本研究聚焦全基因組鑒定陸地棉(Gossypium hirsutum)GhWRKYⅠ亞家族,應(yīng)用組學(xué)工具檢測GhWRKYⅠ家族基因結(jié)構(gòu)、編碼蛋白理化性質(zhì)、進化關(guān)系,基于轉(zhuǎn)錄組數(shù)據(jù)對陸地棉GhWRKYⅠ亞家族基因的組織表達差異和對多種非生物脅迫的應(yīng)答進行了分析,進一步論證了參與棉籽萌發(fā)調(diào)控的候選GhWRKY24基因的表達譜,研究結(jié)果將為GhWRKYⅠ亞家族蛋白生物學(xué)功能和棉籽萌發(fā)調(diào)控機制的研究提供新的科學(xué)參考。
從TAIR里獲取擬南芥WRKYⅠ所有蛋白序列,利用這些序列在棉花數(shù)據(jù)庫CottonFGD(https://cottonfgd.org/)進行BLASTP,獲得陸地棉WRKYⅠ所有蛋白序列,通過同源性比對去掉重復(fù)序列后,在CDD(https://www.ncbi.nlm.nih.gov/cdd/?term=)中查找具有2個WRKY結(jié)構(gòu)域的所有序列,獲得GhWRKYⅠ亞家族所有成員。在CottonFGD中下載陸地棉基因組注釋文件,使用TBtools進行染色體定位。
使 用LocTree3(https://rostlab.org/services/loctree3/)預(yù)測亞細(xì)胞定位,并在SIB(http://expasy.org/)中獲得GhWRKYⅠ亞家族成員的氨基酸數(shù)目、分子質(zhì)量、理論等電點、不穩(wěn)定系數(shù)、穩(wěn)定性和親水指數(shù)。利用Euk-mPLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/euk-multi-2/)預(yù)測亞細(xì)胞定位。
從PlantFDB(http://planttfdb.gao-lab.org/)中獲得擬南芥、水稻W(wǎng)RKYⅠ亞家族蛋白序列(表1)。在MAGE 7.0軟件里采用鄰接法(Neighbor-joining,NJ)對擬南芥、水稻和陸地棉WRKYⅠ亞家族蛋白構(gòu)建系統(tǒng)進化樹,抽樣次數(shù)(Bootstrap)設(shè)置為1 000次。

表1 擬南芥和水稻W(wǎng)RKYⅠ基因登錄號Tab.1 Gene accession numbers of WRKYⅠsubfamily genes in Arabidopsis and rice
利用TBtools與陸地棉基因組注釋文件獲得GhWRKYⅠ蛋白,在CDD中分析GhWRKYⅠ蛋白的保守結(jié)構(gòu)域;利用在線網(wǎng)站MEME(http://memesuite.org/)預(yù)測陸地棉GhWRKYⅠ蛋白保守基序,保守基序數(shù)目為10;其他參數(shù)設(shè)定為默認(rèn)值。
利用GhWRKYⅠ亞家族蛋白序列在DNAMAN中進行多重序列比對,分析亞家族組內(nèi)成員的WRKY保守結(jié)構(gòu)域。
在棉花庫CottonFGD(https://cottonfgd.org/)中下載陸地棉WRKY基因家族在不同組織及冷、熱、鹽、PEG等4種脅迫下的相關(guān)數(shù)據(jù),利用軟件TBtools繪制GhWRKYⅠ亞家族基因組織表達及脅迫表達熱圖,對結(jié)果進行分析。
將陸地棉(冀豐1271)在28℃、16 h光照/8 h黑暗條件下分別培養(yǎng)0、24、48、72 h,用于提取RNA并反轉(zhuǎn)錄為cDNA。利用實時熒光定量PCR(Quantitative Real-time PCR)檢測其表達量。根據(jù)轉(zhuǎn)錄組測序得到的GhWRKY24CDS序列,用Primer 6.0設(shè) 計qRT-PCR特異性引物(表2),并由上海生工公司合成引物。用實時熒光定量PCR儀進行擴增,總反應(yīng)體系為10 μL:TB Green為5 μL,ddH2O為3.4 μL,正反向引物各0.4 μL,cDNA為0.8 μL。反應(yīng)條件為:95℃5 s;59℃30 s,72℃30 s,共40個循環(huán)。以Histone作為內(nèi)參基因,每樣品設(shè)3次重復(fù),最終結(jié)果用2-ΔΔCt法計算基因相對表達量(0 h為對照)。

表2 GhWRKY24基因的qRT-PCR引物Tab.2 Primers for qRT-PCR of GhWRKY24 gene
通過篩選、整合,最終鑒定出35個具有2個七肽保守序列的GhWRKYⅠ亞家族基因,不均勻地分布在19條染色上(圖1),依次命名為GhWRKY1~GhWRKY35;其中,在A亞基因組的10條染色體上分布著19個GhWRKYⅠ基因,在D亞基因組的9條染色體上分布著16個GhWRKYⅠ基因,在D4染色體上分布的基因多達5個,A4、A5、A7、A13、D13均含有3個GhWRKYⅠ,A8和D8上分布有2個GhWRKYⅠ,其余11條染色體各分布有1個GhWRKYⅠ。這些基因的分布取決于從原始的二倍體陸地棉進化到四倍體陸地棉過程中相應(yīng)基因發(fā)生串聯(lián)重復(fù)等因素。

圖1 GhWRKYⅠ家族基因在染色體上的分布Fig.1 Distribution of GhWRKYⅠsubfamily genes on chromosomes
由表3可知,GhWRKYⅠ家族基因編碼的氨基酸數(shù)目為331(GhWRKY9)~769個(GhWRKY33),分子質(zhì)量在36.50(GhWRKY9)~82.87 ku(GhWRKY33)。有15個GhWRKYⅠ蛋白的理論等電點小于7,呈酸性,其余20個GhWRKYⅠ蛋白的理論等電點大于7,呈堿性。所有GhWRKYⅠ蛋白不穩(wěn)定系數(shù)均大于40,表現(xiàn)出不穩(wěn)定性。從親水指數(shù)來看,GhWRKYⅠ的所有成員都是親水性蛋白,均定位在細(xì)胞核中。

表3 GhWRKYⅠ基因及其編碼蛋白的理化性質(zhì)Tab.3 Physicochemical properties of GhWYKYⅠgene and its coding proteins

續(xù)表3 GhWRKYⅠ基因及其編碼蛋白的理化性質(zhì)Tab.3(Continued)Physicochemical properties of GhWYKYⅠgene and its coding proteins
通過聚類分析(圖2),發(fā)現(xiàn)陸地棉、擬南芥和水稻這3個物種的WRKYⅠ亞家族成員盡管同屬一類,但還是存在著3種不同的進化方向,表明這3個物種在分化形成之前已經(jīng)發(fā)生了基因擴增事件,它們可能在植物不同生理過程中發(fā)揮著不同的作用。從整體看,與擬南芥的聚類相比,與水稻關(guān)系更近,這可能與物種本身在進化過程中陸地棉的GhWRKYⅠ的選擇壓力有關(guān)。

圖2 擬南芥、陸地棉、水稻W(wǎng)RKYⅠ蛋白的系統(tǒng)進化樹Fig.2 Phylogenetic tree of WRKYⅠproteins from Arabidopsis,upland cotton and rice
如圖3所示,GhWRKYⅠ保守基序排序相似,數(shù)目為6~10個,其中Motif1~Motif5最為保守。根據(jù)陸地棉基因組注釋文件檢測到,GhWRKYⅠ亞家族的保守結(jié)構(gòu)域都包含N端和C端的2個WRKY保守結(jié)構(gòu)域。從基因結(jié)構(gòu)看,GhWRKYⅠ亞家族具有3~6個外顯子和2~5個內(nèi)含子。

圖3 GhWRKYⅠ蛋白及基因結(jié)構(gòu)Fig.3 The structures of GhWRKYⅠgenes and their encoded proteins
GhWRKY3、GhWRKY6、GhWRKY7、GhWRKY11、GhWRKY12、GhWRKY15不 具 有5'-UTR,其 余29個GhWRKYⅠ亞家族基因同時含有5'-UTR和3'-UTR序列。
對GhWRKYⅠ亞家族蛋白進行多序列比對,結(jié)果發(fā)現(xiàn)(圖4),各成員N端WRKY結(jié)構(gòu)域高度保守,但GhWRKY11蛋白C端WRKY保守結(jié)構(gòu)域的WRKYGQK序列突變?yōu)閃RNYGQK。除此之外,還檢測到C端的C2H2(C-X4-C-X23-H-X-H)型鋅指結(jié)構(gòu)。

圖4 GhWRKYⅠ蛋白多重序列比對Fig.4 Multiple sequence alignment of GhWRKYⅠproteins
由圖5可知,GhWRKYⅠ亞家族的多數(shù)基因都表現(xiàn)出了組織特異性和對不同的非生物脅迫的響應(yīng)特征,例如GhWRKY2、GhWRKY4、GhWRKY8、GhWRKY21、GhWRKY22、GhWRKY24、GhWRKY31在各個組織與多種非生物脅迫下都有著較高的表達量。

圖5 GhWRKYⅠ亞家族基因在不同組織及脅迫下的表達模式Fig.5 Expression patterns of GhWRKYⅠsubfamily genes in different tissues and various stresses
GhWRKY6、GhWRKY7、GhWRKY11、GhWRKY14、GhWRKY18、GhWRKY23和GhWRKY29在不同組織及脅迫下表達量極低。結(jié)合進化樹的分布情況可以看出,這些低表達的GhWRKYⅠ基因所在的染色體上還存在著1個或多個其他GhWRKYⅠ亞家族基因,這些表達量極低的基因可能是陸地棉在進化過程中的冗余基因。
GhWRKY2、GhWRKY3、GhWRKY21和Gh-WRKY25在莖中表現(xiàn)出極高的表達量,表明它們很可能參與莖的形態(tài)建成。與其他亞家族成員相 比,GhWRKY2、GhWRKY21、GhWRKY24和GhWRKY25更多地在種子中高表達,其中以GhWRKY24表達量最高,推測其與種子發(fā)育以及種子萌發(fā)有關(guān)。
進一步檢測了GhWRKY24在陸地棉種子萌發(fā)過程中的表達譜,qRT-PCR結(jié)果表明(圖6),在陸地棉種子萌發(fā)的5 h內(nèi),GhWRKY24的表達量基本沒有升高,此時,棉籽正處于吸漲時期,并無強烈生化反應(yīng);從10 h起,該基因表達量開始升高,24~48 h表達量急劇增加,在72 h時相對表達量達到最高?;虮磉_譜分析顯示,GhWRKY24可能是參與棉花種子萌發(fā)生理生化調(diào)控的一個重要轉(zhuǎn)錄因子。

圖6 GhWRKY24在種子萌發(fā)過程的表達譜分析Fig.6 Expression analysis of GhWRKY24 during seed germination process
WRKY是植物中最大的一類轉(zhuǎn)錄因子,在植物的生長、發(fā)育和逆境響應(yīng)方面發(fā)揮著重要功能。目前,對于棉花WRKY的研究大多集中在逆境脅迫響應(yīng)和參與植物衰老進程[21-22],WRKY轉(zhuǎn)錄因子參與棉籽萌發(fā)過程調(diào)控的研究卻鮮有報道[19]。與棉花其他WRKY亞家族研究相比[23],有關(guān)陸地棉WRKYⅠ亞家族成員的鑒定,尤其是生物功能的研究有限。因此,鑒定異源四倍體陸地棉WRKYⅠ亞家族成員及其生物學(xué)功能可為全面解析棉花WRKY轉(zhuǎn)錄因子介導(dǎo)的調(diào)控網(wǎng)絡(luò)和棉花遺傳改良提供新的科學(xué)參考。
采用組學(xué)工具,本研究從陸地棉基因組共鑒定出35個含有2個WRKY保守域和C2H2型鋅指結(jié)構(gòu)的GhWRKYⅠ亞家族基因。這些基因不均勻地分布于A亞基因組和D亞基因組的19條染色體上,均為定位于細(xì)胞核的親水性蛋白,基因內(nèi)含子和外顯子分別為2~5個和3~6個,其編碼331~769個氨基酸,其中15個WRKY蛋白為酸性蛋白,20個為堿性蛋白,這與其他植物轉(zhuǎn)錄因子的亞細(xì)胞定位一致[24-25]。GhWRKYⅠ亞家族蛋白保守基序的排列順序相似,但含有的基序數(shù)目差異較大,最少的僅有6個,最多的有10個。盡管WRKY結(jié)構(gòu)域高度保守,但在擬南芥[7]、大豆[8]、水稻[9]等植物中發(fā)現(xiàn)了WRKYGQK肽鏈和鋅指結(jié)構(gòu)的變異。本研究中,GhWRKY11蛋 白C端WRKY保守結(jié)構(gòu) 域 的WRKYGQK序列突變?yōu)閃RNYGQK,而其他GhWRKYⅠ蛋白WRKY保守結(jié)構(gòu)域序列未出現(xiàn)變異。與之不同的是棉花其他WRKY亞家族蛋白的WRKY保守結(jié)構(gòu)域序列變異較多[26]。
WRKY蛋白聚類分析顯示,陸地棉、擬南芥、水稻的GhWRKYⅠ亞家族組內(nèi)成員之間存在著3種不同的進化方向,表明這3個物種在分化形成之前已經(jīng)發(fā)生了基因擴增事件?;蛑g的聚類分組,對于推測基因的生物學(xué)功能具有重要的參考價值。例如,AtWRKY11與AtWRKY17同為G2-d組,在擬南芥對丁香假單胞菌抗病性方面具有相似的功能[27]。與之相對應(yīng)的棉花GhWRKY成員也可能具有相似的功能,但這需要進一步試驗鑒定。根據(jù)轉(zhuǎn)錄組數(shù)據(jù),對陸地棉GhWRKYⅠ亞家族基因的組織與逆境表達模式進行系統(tǒng)分析,發(fā)現(xiàn)
GhWRKY6、GhWRKY7、GhWRKY11、GhWRKY14、GhWRKY18、GhWRKY23和GhWRKY29在不同組織及脅迫下未檢測到表達,推測這些基因可能為陸地棉進化過程中產(chǎn)生的冗余基因,這也是生物有機體減少外界不利環(huán)境對其生存影響的一種保險對策[28]。GhWRKY2、GhWRKY4、GhWRKY8、
GhWRKY21、GhWRKY22、GhWRKY24、GhWRKY31在所測各組織中高水平表達,預(yù)示著他們可能參與各個組織的生理生化反應(yīng)以及對多種非生物脅迫的響應(yīng),這些基因的多重生物學(xué)功能及調(diào)控機制有待深入研究。WRKY參與多種植物信號分子的調(diào)控途徑,其中赤霉素和生長素均能調(diào)控莖的 伸 長[29]。本 研 究 中,GhWRKY2、GhWRKY3、GhWRKY21和GhWRKY25在莖中顯著表達,這4個棉花GhWRKYⅠ轉(zhuǎn)錄因子是否通過調(diào)控這2種激素來參與陸地棉莖的生長還需要進一步探究。
更重要的是,已有研究報道了一些棉花WRKY成員的功能。例如,轉(zhuǎn)基因擬南芥試驗證明,棉花GhWRKY33負(fù)調(diào)控植物抗旱性[30];棉花GhWRKY22參與花藥和花粉的發(fā)育調(diào)控[31];GhWRKY27協(xié)同調(diào)控陸地棉衰老途徑[32];異源過表達棉花GhWRKY53導(dǎo)致擬南芥植株腺毛密度顯著增加[33]。與這些有關(guān)棉花WRKY的研究結(jié)果不同,本研究發(fā)現(xiàn),GhWRKY2、GhWRKY21、GhWRKY24和GhWRKY25在陸地棉種子中高度表達,特別是GhWRKY24在棉花種子萌發(fā)過程中表達量顯著上調(diào),預(yù)示著GhWRKY24可能介導(dǎo)棉花種子萌發(fā)過程中生理生化的調(diào)控。擬南芥AtWRKY41敲除突變體顯著下調(diào)了ABI3并影響了種子休眠[34]。后續(xù)需要試驗檢測GhWRKY24是否也能通過調(diào)控激素來參與種子萌發(fā)過程的調(diào)控。本研究結(jié)果為全面解析GhWRKYⅠ亞家族成員的生物學(xué)功能和棉花WRKY轉(zhuǎn)錄因子介導(dǎo)陸地棉種子萌發(fā)過程調(diào)控機制奠定了理論基礎(chǔ),亦為陸地棉遺傳改良提供了可挖掘的基因資源。