李麗華,郭穎彬,魏 昕
(1.河南省農(nóng)業(yè)科學(xué)院糧食作物研究所,河南 鄭州 450002;2.濟寧技師學(xué)院,山東 濟寧 272100)
轉(zhuǎn)錄因子是一類在多種生物學(xué)過程中起重要功能調(diào)節(jié)的蛋白。在植物中,NAC(NAM/ATAF/CUC2)蛋白是最大的轉(zhuǎn)錄因子家族之一,它們存在于多種植物中,并且在植物生長發(fā)育過程中扮演重要角色。而隨著植物基因組測序工作的不斷完成,越來越多物種內(nèi)的NAC成員也被鑒定分析。比如,在雙子葉植物擬南芥(Arabidopsisthaliana)內(nèi)鑒定出105個ANAC候選基因[1],大豆(Glycinemax)內(nèi)鑒定出101個GmNACs[2],桉樹(Eucalyptusgrandis)內(nèi)鑒定出189個EgrNACs[3],楊樹(Populustrichocarpa)內(nèi)鑒定出148個PtNACs[4]等;單子葉植物玉米(Zeamays)內(nèi)鑒定出116個ZmNACs[5],小麥(Triticumaestivum)內(nèi)鑒定出453個TaNACs[6]等。一般情況下,NAC轉(zhuǎn)錄因子的結(jié)構(gòu)特征是在N端包含一個高度保守的DNA結(jié)合結(jié)構(gòu)域,該結(jié)構(gòu)域可分為5個亞結(jié)構(gòu)域(A~E),C端通常含有轉(zhuǎn)錄調(diào)控區(qū)[7]。此外,一些NAC蛋白因為含有跨膜基序(Transmembrane Motifs, TMs),因此又被稱為NAC膜結(jié)合轉(zhuǎn)錄因子(Membrane-bound NAC transcription factors, NTLs)[8-9]。
NAC轉(zhuǎn)錄因子家族廣泛參與植物體內(nèi)各種生長發(fā)育和逆境應(yīng)答反應(yīng)[7]。在模式植物擬南芥和水稻中,已經(jīng)報道了許多NAC轉(zhuǎn)錄因子的功能。例如,研究發(fā)現(xiàn)擬南芥NAC1基因的表達由生長素誘導(dǎo),并且NAC1的表達可以影響側(cè)根的發(fā)育[10];擬南芥ANAC019,ANAC055或ANAC072的過表達植株都表現(xiàn)出對干旱脅迫耐受性增加的表型[11];水稻SNAC1基因的過表達植株表現(xiàn)出抗旱性和耐鹽性明顯增加的表型[12];水稻內(nèi)SNAC1和SNAC2的過表達水稻植株對低溫脅迫和鹽脅迫的耐受性增加[13];水稻中OsNAC5的過表達使水稻根的木質(zhì)部和通氣組織增生,進而提高水稻的耐旱性[14];水稻中SNAC3的過表達植株表現(xiàn)出對氧脅迫、干旱和高溫等脅迫的耐受性增強的表型[15]。水稻ONAC096基因可以通過調(diào)節(jié)葉片衰老和穗數(shù)影響籽粒產(chǎn)量[16];水稻OsNAC2基因作為生長素和細胞分裂素信號的上游整合子,可以影響冠狀根的缺失和周期蛋白依賴性蛋白激酶的產(chǎn)生從而調(diào)節(jié)根發(fā)育過程[17];陸地棉(Gossypiumhirsutum)GhXND1的過表達會抑制次生壁及木質(zhì)部的形成[18];鷹嘴豆(Cicerarietinum)的CarNAC1基因棉花品系可能通過降低氣孔導(dǎo)度、增強滲透條件等方法提高轉(zhuǎn)基因棉花的抗旱能力[19];玉米內(nèi)的ZmNAC111的過表達使植株表現(xiàn)出了苗期耐旱性增強,水分利用率提高的表型,并且誘導(dǎo)了干旱脅迫下有關(guān)應(yīng)答基因的上調(diào)[20]。
雖然植物內(nèi)NAC基因家族的相關(guān)研究不斷增加,但仍存在聚焦單物種、缺少多物種動態(tài)進化分析等問題。本研究選取禾本科內(nèi)4個代表性單子葉物種的NAC基因家族進行了分子進化,并以玉米NAC基因為例進行表達模式分析,進而探索了禾本科NAC基因家族成員的系統(tǒng)發(fā)育、基因結(jié)構(gòu)和擴增模式,基于玉米在不同生長條件以及不同組織和發(fā)育時期的轉(zhuǎn)錄組數(shù)據(jù),篩選了潛在的響應(yīng)干旱脅迫的NAC功能基因,為進一步研究NAC基因的功能提供參考。
在Ensembl Plants數(shù)據(jù)庫(http://plants.ensembl.org/index.html)內(nèi)下載玉米(Zeamays)、水稻(Oryzasativa)、高粱(Sorghumbicolor)和二穗短柄草(Brachypodiumdistachyon)的蛋白組數(shù)據(jù)及基因組注釋信息。從PFAM數(shù)據(jù)庫(http://pfam.xfam.org)內(nèi)下載NAC轉(zhuǎn)錄因子保守結(jié)構(gòu)域的隱馬爾可夫模型(PF02365.15)。使用HMMER軟件中的hmmsearch,對玉米、水稻、高粱和二穗短柄草等4個物種的蛋白組數(shù)據(jù)進行篩選,閾值設(shè)置為0.02。鑒于一個基因可能存在多個轉(zhuǎn)錄本,且NAC轉(zhuǎn)錄因子的保守結(jié)構(gòu)域長度在150個氨基酸殘基左右,因此去除長度短于75個氨基酸殘基的序列,并且當(dāng)候選基因含有多個轉(zhuǎn)錄本時,保留最長的轉(zhuǎn)錄本序列。
使用ExPASy在線工具(https://web.expasy.org/compute_pi/),對篩選出的玉米、高粱、水稻、二穗短柄草4個物種的NAC蛋白序列進行等電點和分子量等理化性質(zhì)分析。
使用MAFFT軟件對NAC蛋白序列進行多序列比對,然后使用FastTree軟件進行系統(tǒng)發(fā)育樹的構(gòu)建,bootstrap值設(shè)置為1 000。使用香蕉NAC轉(zhuǎn)錄因子GSMUA_Achr4G02380作為外群序列。在NCBI(https://www.ncbi.nlm.nih.gov/Taxonomy/CommonTree/wwwcmt.cgi)上獲取玉米、水稻、高粱、二穗短柄草和香蕉5個物種的系統(tǒng)發(fā)育關(guān)系。使用iTOL(https://itol.embl.de/)和FigTree對構(gòu)建的系統(tǒng)發(fā)育樹進行可視化展示。
基于物種進化關(guān)系和基因系統(tǒng)進化關(guān)系,使用Notung軟件[21]對譜系內(nèi)的NAC基因進行演化樹的重構(gòu)建以分析禾本科NAC基因在進化過程中的復(fù)制和丟失情況。
使用TMHHM在線服務(wù)器(http://www.cbs.dtu.dk/services/TMHMM/),對4個物種內(nèi)含有膜定位結(jié)構(gòu)域的NAC蛋白進行預(yù)測。
對4個禾本科物種內(nèi)的串聯(lián)復(fù)制基因的定義標(biāo)準(zhǔn)為:(1)同一物種內(nèi)的NAC基因位于同一染色體或同一染色體骨架內(nèi);(2)位于同一染色體或染色體骨架內(nèi)的兩對基因間距離小于100 kb并且中間間隔的基因數(shù)不超過10個。此外,在CoGe服務(wù)器(https://genomevolution.org/CoGe/SynMap.pl)上分析玉米NAC基因的大片段復(fù)制情況。
使用玉米在正常和干旱脅迫生長條件下的RNA-seq數(shù)據(jù)[22],分析玉米在干旱脅迫生長情況下NAC基因在V12、V14、V18、R1 4個發(fā)育期的雌穗、雄穗以及葉片3個組織內(nèi)的表達情況。數(shù)據(jù)處理方法參照前人研究[23],基因表達水平用FPKM(Fragments per kilobase of transcript per million fragments mapped)值表示(FPKM>1的基因被定義為表達基因),差異表達基因的定義標(biāo)準(zhǔn)為:|log2(倍數(shù)變化)|≥1,且錯誤發(fā)現(xiàn)率(FDR, false discovery rate)≤0.05。
從4個禾本科物種中共計鑒定出556個NAC基因,其中玉米164個,高粱127個,水稻144個,二穗短柄草121個。進一步對4個物種內(nèi)的556個NAC基因進行多序列比對及系統(tǒng)發(fā)育樹的構(gòu)建,結(jié)果發(fā)現(xiàn)依據(jù)系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu)可以將4個物種的NAC基因分為6個進化枝,依次命名為進化枝1、進化枝2、進化枝3、進化枝4、進化枝5和進化枝6(圖1)。在這6個進化枝內(nèi),最小的進化枝2內(nèi)包含48個NAC基因,最大的進化枝6內(nèi)包含132個NAC基因,其余4個進化枝內(nèi),進化枝3包含101個、進化枝4包含109個、進化枝5包含103個、進化枝1包含63個。進化枝1、3和5內(nèi)4個物種的NAC基因數(shù)目整體較接近,進化枝2和4內(nèi)玉米NAC基因數(shù)目多于其他物種,在進化枝6內(nèi)水稻NAC基因數(shù)目多于其他物種,這一情況暗示了不同物種內(nèi)基因復(fù)制的差異。
為進一步探索4個禾本科物種NAC轉(zhuǎn)錄因子的系統(tǒng)進化關(guān)系,計算了556個NAC蛋白的相對分子質(zhì)量和等電點等理化性質(zhì)以觀察其中的規(guī)律。結(jié)果發(fā)現(xiàn)4個禾本科物種的NAC理化性質(zhì)較相似無明顯差別,進一步結(jié)合系統(tǒng)發(fā)育分析發(fā)現(xiàn),進化枝1、進化枝2和進化枝3內(nèi)的NAC轉(zhuǎn)錄因子的相對分子質(zhì)量相似且分布集中,主要分布在32 000~43 000 kD,而進化枝4、進化枝5和進化枝6內(nèi)的NAC轉(zhuǎn)錄因子的相對分子質(zhì)量分布范圍較大,主要分布在27 000~58 000 kD,并且進化枝5內(nèi)的NAC蛋白相對分子質(zhì)量的變異幅度最大,進化枝3的相對分子質(zhì)量的變異幅度最小(圖2)。對等電點進行分析發(fā)現(xiàn),除了進化枝4和進化枝6外,其余4個進化枝的等電點有著相似的分布,進化枝1、進化枝2、進化枝3和進化枝5內(nèi)的NAC轉(zhuǎn)錄因子均分布在pI=7左右,而進化枝4和進化枝6的大部分NAC轉(zhuǎn)錄因子的pI<7,呈弱酸性(圖2)。這一結(jié)果表明進化枝1、2和3內(nèi)的NAC轉(zhuǎn)錄因子有著較相似的理化性質(zhì),進化枝4、5和6內(nèi)的NAC轉(zhuǎn)錄因子的理化性質(zhì)則較不保守,序列分化較明顯。
膜結(jié)合轉(zhuǎn)錄因子是指一類特殊的含有跨膜結(jié)構(gòu)域的轉(zhuǎn)錄因子蛋白,跨膜結(jié)構(gòu)域可以使該類轉(zhuǎn)錄因子與內(nèi)質(zhì)網(wǎng)、核膜或細胞膜等結(jié)合。該類轉(zhuǎn)錄因子的跨膜結(jié)構(gòu)域通常在植物應(yīng)答特定的發(fā)育或脅迫后被水解,然后轉(zhuǎn)運至細胞核發(fā)揮其調(diào)節(jié)功能[24]。例如,前人研究發(fā)現(xiàn)NTL6參與植物脅迫應(yīng)答和激素調(diào)節(jié)通路[8]。
使用TMHHM在線服務(wù)器,對4個物種內(nèi)含跨膜結(jié)構(gòu)域的NAC轉(zhuǎn)錄因子進行鑒定,結(jié)果從4個物種內(nèi)共鑒定出27個含有跨膜結(jié)構(gòu)域的NAC轉(zhuǎn)錄因子(NTLs),其中玉米8個,水稻6個,高粱6個,二穗短柄草7個,并且這些NTLs均只含有1個跨膜結(jié)構(gòu)域(圖3)。結(jié)合系統(tǒng)發(fā)育樹分析發(fā)現(xiàn),其中24個膜定位NAC轉(zhuǎn)錄因子位于系統(tǒng)發(fā)育樹的進化枝4內(nèi),剩余3個(高粱、二穗短柄草、水稻各一個)則位于進化枝5內(nèi),這一結(jié)果表明禾本科NTLs基因序列相似性較高,進化關(guān)系較保守,可能存在功能相似或冗余的情況。
為了探索禾本科植物NAC基因的進化歷史,基于4個禾本科物種的進化關(guān)系和NAC基因系統(tǒng)進化關(guān)系,使用Notung軟件,對禾本科內(nèi)的NAC基因進行進化樹的重構(gòu)建以分析NAC基因的得失情況。從556個NAC基因內(nèi)共鑒定出174個禾本科單系群,表明禾本科植物分化前有174個祖先基因,隨后產(chǎn)生分化,最終形成4個物種內(nèi)的556個NAC基因。圖4展示了禾本科進化過程中NAC基因的數(shù)目變化。4個禾本科物種在進化過程中有相似的基因丟失數(shù)量(69~86個),而復(fù)制基因數(shù)目則有較大差異,玉米內(nèi)的復(fù)制基因數(shù)目最多(76個),其余3個物種內(nèi)的復(fù)制基因數(shù)目則較接近(19~39個)。這可能是由玉米物種特異的全基因組復(fù)制事件導(dǎo)致的,這也是導(dǎo)致4個禾本科物種內(nèi)NAC基因數(shù)目差異的主要原因。
進一步對4個禾本科物種NAC基因復(fù)制事件進行分析發(fā)現(xiàn),4個禾本科物種中共鑒定出47個NAC串聯(lián)復(fù)制基因簇,共計116個基因,占基因總數(shù)的20.9%(116/556)。其中玉米內(nèi)鑒定出22個串聯(lián)復(fù)制NAC基因,水稻內(nèi)43個,高粱內(nèi)29個,二穗短柄草內(nèi)22個(圖5)。結(jié)合系統(tǒng)發(fā)育樹分析發(fā)現(xiàn),進化枝2內(nèi)沒有串聯(lián)復(fù)制NAC基因,超半數(shù)的NAC串聯(lián)復(fù)制基因(59.3%,67/113)位于進化枝6內(nèi),其中玉米和水稻的數(shù)目最多,分別有20個和24個NAC基因位于進化枝6。值得一提的是,除玉米外,其余3個物種均出現(xiàn)串聯(lián)復(fù)制基因?qū)Φ膬蓚€成員各自位于不同進化枝的情況(共12對)。以水稻為例,LOC_Os12g03040基因位于進化枝1內(nèi),而其串聯(lián)復(fù)制基因LOC_Os12g03050則位于進化枝3內(nèi),表明串聯(lián)復(fù)制基因?qū)Φ谋J匦砸寻l(fā)生變化,并且可能是發(fā)生在禾本科植物分化前。而玉米內(nèi)的串聯(lián)復(fù)制基因?qū)Τ蓡T則都是位于同一進化枝內(nèi),表現(xiàn)出相對保守的特點。

圖5 高粱、玉米、二穗短柄草和水稻NAC串聯(lián)復(fù)制基因分析Fig.5 NAC gene tandem replication statistics of sorghum, maize, brachypodium and rice
為進一步探索玉米NAC基因復(fù)制情況,對玉米基因組內(nèi)的大片段復(fù)制NAC基因進行鑒定,結(jié)果發(fā)現(xiàn)玉米內(nèi)含有50個大片段復(fù)制NAC基因。發(fā)生片段復(fù)制的基因在進化枝1至進化枝6中均有分布,在進化枝3和進化枝5中最多(圖6)(進化枝1~6中包含的數(shù)量分別為6、6、12、9、15個和2個)。并且只有一個串聯(lián)復(fù)制基因?qū)ξ挥谄螐?fù)制基因內(nèi),表明玉米內(nèi)的NAC基因復(fù)制事件相對獨立,不同進化枝內(nèi)的基因擴增模式是不同的。

圖6 玉米NAC基因的片段復(fù)制(線條連接基因表示片段復(fù)制基因)Fig.6 Fragment replication of maize NAC gene (genes are connected by lines are segment duplications)
為了探究不同進化枝內(nèi)NAC轉(zhuǎn)錄因子潛在功能的差異,以玉米為例,對正常生長和干旱脅迫下的玉米葉片、雄穗和雌穗3種組織以及4個發(fā)育時期(V12,V14,V16,R1)的轉(zhuǎn)錄組數(shù)據(jù)進行分析。結(jié)果發(fā)現(xiàn),正常生長和干旱脅迫下,在3個組織和4個發(fā)育時期中共有106個玉米NAC基因表達(FPKM>1),占玉米NAC基因總數(shù)的64.6%(106/164);進化枝1中NAC基因表達數(shù)目最多 (83.3%,15/18),而進化枝6中大約87%(26/30)的玉米NAC基因不表達或低表達,并且其中大部分都是串聯(lián)復(fù)制基因。干旱脅迫下,共鑒定出51個差異表達基因(|log2(fold-change)|>1,FDR<0.05),進化枝1~6內(nèi)的基因數(shù)目分別為11、8、12、11、6個和2個(圖7);在葉片和雌穗內(nèi)的差異表達基因數(shù)目多于雄穗。進一步對不同組織和發(fā)育時期內(nèi)的NAC基因表達情況分析發(fā)現(xiàn),隨著干旱脅迫的進行,葉片中干旱響應(yīng)的NAC基因數(shù)目在不斷增加,發(fā)生上調(diào)與下調(diào)的基因數(shù)基本保持一致,未見明顯的特異性;雌穗和雄穗中干旱響應(yīng)的NAC基因大多表現(xiàn)出下調(diào)趨勢;玉米NAC基因在V18時期的雄穗中沒有表達(圖7)。值得一提的是,玉米內(nèi)片段復(fù)制NAC基因大部分都表達并且應(yīng)答干旱脅迫。

圖7 干旱脅迫下玉米NAC基因的差異表達譜Fig.7 Expression profiles of differentially expressed NAC genes of maize under drought stress
本研究對4個禾本科物種包括玉米、高粱、水稻和二穗短柄草內(nèi)的NAC基因家族進行了鑒定和系統(tǒng)發(fā)育分析。結(jié)果發(fā)現(xiàn),玉米內(nèi)鑒定出164個NAC基因,高粱內(nèi)鑒定出127個NAC基因,水稻內(nèi)鑒定出144個NAC基因,二穗短柄草內(nèi)鑒定出121個NAC基因。系統(tǒng)發(fā)育分析表明4個物種的556個NAC基因聚類為6個進化枝,進化枝2(48個)是最小的進化枝,進化枝6(132個)是最大的進化枝,進化枝1、3和5內(nèi)的4個物種的NAC基因數(shù)目整體較接近,其余進化枝內(nèi)則存在數(shù)目差異,這暗示了不同進化枝內(nèi)基因擴增模式存在差異。對進化枝的理化性質(zhì)分析發(fā)現(xiàn),4個禾本科物種的NAC蛋白理化性質(zhì)無明顯差別,且不同進化枝的相對分子質(zhì)量和等電點表現(xiàn)出相似性。對膜定位結(jié)構(gòu)域進行分析,共鑒定出27個含跨膜結(jié)構(gòu)域的NAC轉(zhuǎn)錄因子,并且大部分(88.9%)都位于進化枝4內(nèi)。玉米中8個具有跨膜結(jié)構(gòu)域的NAC蛋白處在進化枝的同一簇上,結(jié)合基因表達分析發(fā)現(xiàn)大多對干旱脅迫不敏感,這可能暗示了膜定位NAC蛋白功能的獨特性。前人研究鑒定出7個ZmNTLs,其中有6個定位在質(zhì)膜上,1個定位在內(nèi)質(zhì)網(wǎng)上;當(dāng)植物被脫落酸或過氧化氫處理時,這7個基因在根和莖中均被上調(diào)表達,而在葉片中則被下調(diào)[25]。本研究內(nèi)的8個ZmNTLs只有Zm00001d040318應(yīng)答干旱脅迫并被下調(diào),因此玉米內(nèi)NTLs在植物生長發(fā)育和干旱脅迫應(yīng)答間的功能關(guān)系仍有待確定。
使用逐步溯源法從4個禾本科物種內(nèi)共鑒定出174個祖先基因,進一步觀察物種基因獲得和丟失數(shù)目發(fā)現(xiàn),4個禾本科物種在進化過程中有相似的基因丟失數(shù)量(69~86個),而復(fù)制基因數(shù)目則有較大差異,玉米內(nèi)的復(fù)制基因數(shù)目最多(76個),可能是由于全基因組復(fù)制事件導(dǎo)致的,其余3個物種內(nèi)的復(fù)制基因數(shù)目則較接近(19~39個)。玉米116號單系群中聚類為一個包含26個NAC基因的進化枝,其中包含23個串聯(lián)復(fù)制基因。此外,基因家族的復(fù)制分析發(fā)現(xiàn),串聯(lián)復(fù)制對這4個物種的NAC基因擴增貢獻明顯(20.9%,116/556),玉米內(nèi)基因組大片段復(fù)制事件對玉米NAC基因擴增貢獻明顯(30.5%,50/164)。
對玉米NAC基因家族進行了轉(zhuǎn)錄表達譜分析,結(jié)果發(fā)現(xiàn)在干旱脅迫下玉米內(nèi)鑒定出51個差異表達基因,且不同組織內(nèi)的差異表達基因數(shù)目存在差異,葉和雌穗內(nèi)的差異表達基因數(shù)目多于雄穗。前人研究發(fā)現(xiàn)ZmNAC84參與ABA信號通路并且在煙草內(nèi)的過表達可以提高煙草的抗旱性[26],本研究內(nèi)的表達分析發(fā)現(xiàn)ZmNAC84在營養(yǎng)組織內(nèi)表達而在生殖組織內(nèi)表達水平較低。此外,與ZmNAC84為片段復(fù)制基因?qū)Φ腪m00001d008817則在玉米雌蕊和葉的R1期、葉V18期應(yīng)答干旱脅迫,表明這對復(fù)制基因功能已發(fā)生分化。
玉米內(nèi)發(fā)生串聯(lián)復(fù)制的NAC基因多數(shù)都不表達,只有少量表達;與之相反的是玉米內(nèi)發(fā)生了大片段復(fù)制的NAC基因大部分都表達并且應(yīng)答干旱脅迫。在玉米NAC基因的組織特異性表達譜和干旱脅迫應(yīng)答表達譜中,除進化枝6外,其余進化枝中的基因大部分都有表達,推測潛在的功能基因主要分布于除進化枝6外的進化枝中。本研究為進一步探究禾本科物種NAC基因進化以及鑒定玉米NAC功能基因提供參考。