李澤隆,朱 穎,張成玉,郭穎彬,韓兆雪
(1. 西北農(nóng)林科技大學(xué)生命科學(xué)學(xué)院,陜西 楊凌 712100;2. 西北農(nóng)林科技大學(xué)農(nóng)學(xué)院,陜西 楊凌 712100)
包含功能未知結(jié)構(gòu)域(Domains of unknown functions, DUF)的蛋白家族是一類功能尚未被表征的蛋白家族。DUF基因家族廣泛存在于動物、植物和真菌內(nèi)。PFAM 32.0版包含3,900多個DUF蛋白質(zhì)家族,占PFAM蛋白質(zhì)家族總數(shù)的22%[1]。一些DUF基因家族參與植物逆境脅迫調(diào)控,例如擬南芥DUF6家族內(nèi)的AT1G09380缺失突變體對鹽和干旱脅迫表現(xiàn)出更敏感的表型[2]。擬南芥AtRDUF1和AtRDUF2的單、雙缺失突變體表現(xiàn)出對ABA敏感性和干旱脅迫耐受性下降的表型[3]。小麥DUF860基因家族內(nèi)的TaWTF1在小麥的開花期和苗期均可被高溫誘導(dǎo)表達(dá),該基因的擬南芥過表達(dá)轉(zhuǎn)基因植株在熱脅迫下存活率增加[4]。還有一些DUF基因參與植物的生長發(fā)育。研究人員分析了DUF668基因家族在水稻內(nèi)的系統(tǒng)發(fā)育關(guān)系和順式作用元件以及在不同組織和時期內(nèi)表達(dá)模式,并進(jìn)一步解析了該家族在水稻發(fā)育和適應(yīng)中的重要作用[5]。線粒體蛋白DUF295在植物內(nèi)的起源以及擴(kuò)張模式和保守結(jié)構(gòu)域的差異還有功能的分化也被研究人員分析[6]。
DUF581蛋白結(jié)構(gòu)域具有與MYM類鋅指蛋白含有的FCS基序(zf-FCS)高度相似的序列,因此又被命名為FLZ(FCS-Like Zinc finger)結(jié)構(gòu)域[7]。擬南芥DUF581基因家族的MARD1基因參與ABA介導(dǎo)的種子休眠,并且可以被衰老誘導(dǎo)[8-9]。研究擬南芥發(fā)現(xiàn)DUF581家族蛋白可以和許多蛋白相互作用,比如SnRK1[10-11]。有研究人員研究探索了DUF581基因家族在綠色植物內(nèi)的起源、擴(kuò)張和互作等[7]。小麥DUF581基因家族成員TaSRHP在擬南芥內(nèi)過表達(dá)后可以提高植株耐鹽性[12]。因此植物DUF581基因家族可能對植物的生長發(fā)育和抗逆脅迫有著重要的作用。
本研究對DUF581基因家族進(jìn)行了分子進(jìn)化及在干旱脅迫下表達(dá)模式的分析。以玉米為例,探索了DUF581基因家族成員的系統(tǒng)發(fā)育、基因結(jié)構(gòu)和擴(kuò)增模式,并利用不同水分生長條件以及不同組織和時期的轉(zhuǎn)錄組數(shù)據(jù)篩選了潛在的響應(yīng)干旱脅迫的DUF581功能基因,為研究DUF581基因的功能提供參考。
從PFAM數(shù)據(jù)庫(http://pfam.xfam.org)內(nèi)下載zf-FLZ保守結(jié)構(gòu)域的隱馬爾可夫模型(PF04570),然后使用HMMER3.0[13]的hmmersearch對玉米B73參考基因組內(nèi)的候選DUF581蛋白進(jìn)行搜索,閾值設(shè)置為E=0.001。將所得候選基因在SMART數(shù)據(jù)庫和NCBI的Conserved domain database 數(shù)據(jù)內(nèi)進(jìn)行重鑒定。玉米基因組序列和GFF3注釋文件從植物基因組phytozome(Version 13)數(shù)據(jù)庫[14]下載,其余16個物種包括雙子葉植物菜豆(Phaseolusvulgaris)、大豆(Glycinemax)、苜蓿(Medicagotruncatula)、蘋果(MaluspumilaMill)、黃瓜(Cucumissativus)、甘藍(lán)(Brassicaoleracea)、白菜(Brassicarapa)、擬南芥(Arabidopsisthaliana)、葡萄(Vitisvinifera)、番茄(Solanumlycopersicum)、單子葉植物高粱(Sorghumbicolor)、二穗短柄草(Brachypodiumdistachyon)、水稻(Oryzasativa)、小米(Setariaitalica)、香蕉(Musaacuminata);基部被子植物無油樟(Amborellatrichopoda)等的基因組也從Phytozome數(shù)據(jù)庫內(nèi)獲得并進(jìn)行相似的鑒定過程。
使用MAFFT(Version 7.037)[15]將所得候選DUF581基因進(jìn)行多序列比對,使用FastTree[16]進(jìn)行系統(tǒng)發(fā)育樹的構(gòu)建,Bootstrap值設(shè)置為1000,利用Figtree (Version 1.4.3)將所構(gòu)建的系統(tǒng)發(fā)育樹進(jìn)行可視化。
使用在線工具Compute pI/Mw(https://web.expasy.org/compute_pi/)和GRAVY(http://www.gravy-calcula-tor.de/)計(jì)算DUF581蛋白的等電點(diǎn)(pI)、相對分子量(kDa)和親水性(用GRAVY值來衡量,親水性氨基酸越多,則GRAVY值越小,疏水性氨基酸越多,則GRAVY值越大)等。玉米染色體定位使用TBtools進(jìn)行展示,基因結(jié)構(gòu)使用在線工具Gene structure display server (GSDS) (http://gsds.cbi.pku.edu.cn)[17]進(jìn)行展示。使用CoGe服務(wù)器[18]上的SynMap工具檢測玉米基因組中的片段復(fù)制事件。使用KaKs_Calculator 2.0軟件來分析復(fù)制基因的選擇壓力。
使用來自玉米葉片、雌穗和雄穗等3種不同組織4個生長時期的RNA-seq數(shù)據(jù)[19]探究玉米DUF581基因的組織特異性表達(dá)情況。數(shù)據(jù)處理參照Tan等[20]的研究,基因表達(dá)水平用FPKM(Fragments per kilobase of transcript per million fragments mapped)值表示,F(xiàn)PKM>1的基因被定義為表達(dá)基因。
分別對水分充足和干旱生長條件下玉米不同組織和時期的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析。差異表達(dá)基因的定義標(biāo)準(zhǔn)為:|log2(fold changde)|≥1并且錯誤發(fā)現(xiàn)率(FDR, false discovery rate)≤0.05。
在玉米基因組內(nèi)共鑒定出了45個DUF581候選基因。玉米DUF581基因編碼的蛋白序列長度介于60~355個氨基酸之間,與水稻、擬南芥和大豆DUF581基因相似(圖1a)。玉米內(nèi)大部分(64.4%, 29/45)DUF581基因具有相對較高的等電點(diǎn)(pI>7.0),該比例與大豆(73.7%, 28/38)和擬南芥(66.7%, 12/18)相似,但明顯高于水稻(41.4%, 12/29)(圖1b)。親水性分析發(fā)現(xiàn),玉米內(nèi)絕大部分(97.8%, 44/45)DUF581蛋白都是親水性蛋白(GRAVY<1),與水稻(93.1%, 27/29)、大豆(100%, 38/38)和擬南芥(100%; 18/18)相似(圖1c)。亞細(xì)胞定位預(yù)測表明,玉米DUF581蛋白主要位于葉綠體和細(xì)胞核內(nèi),該比例(77.8%, 14/18)低于大豆(78.9%, 30/38),但高于水稻(62.1%, 18/29)和擬南芥(66.7%, 30/45)(圖1d)。
為了進(jìn)一步探究DUF581基因家族的系統(tǒng)進(jìn)化關(guān)系,將17個被子植物的448個DUF581蛋白進(jìn)行系統(tǒng)發(fā)育分析。根據(jù)系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu),DUF581基因家族被分為6個進(jìn)化枝,分別依次命名為進(jìn)化枝Ⅰ、Ⅱ、Ⅲ、Ⅳ、V和Ⅵ(圖2)。6個進(jìn)化枝內(nèi)都含有基部被子植物無油樟的DUF581蛋白,除了進(jìn)化枝Ⅰ外,其余5個進(jìn)化枝都包含單子葉和雙子葉植物的DUF581蛋白。進(jìn)化枝Ⅳ是最大的進(jìn)化枝,進(jìn)化枝Ⅰ是最小的進(jìn)化枝且不包含雙子葉植物的DUF581蛋白(圖2)。
45個玉米DUF581基因分布在6個進(jìn)化枝內(nèi),依據(jù)外顯子-內(nèi)含子結(jié)構(gòu)分布,DUF581基因結(jié)構(gòu)可以分為兩類:第一類是進(jìn)化枝 Ⅱ~Ⅵ 內(nèi)的基因成員,他們的外顯子數(shù)目不超過2個;第二類是進(jìn)化枝 Ⅰ 內(nèi)的基因成員,平均每個基因含有5個外顯子結(jié)構(gòu),最多的一個基因Zm00001d049961內(nèi)含有9個外顯子(圖2)。此外,進(jìn)化枝 Ⅰ 和進(jìn)化枝 Ⅱ 的DUF581基因的UTR區(qū)存在斷裂的情況,且多發(fā)生在5’UTR區(qū)(圖2)。
對玉米45個DUF581基因進(jìn)行染色體定位,結(jié)果發(fā)現(xiàn),玉米DUF581基因家族成員在玉米10條染色體上均有分布,但是每條染色體上的基因數(shù)目分布不均勻。其中4號染色體上數(shù)目最多,有10個DUF581基因,1號和5號染色體包含7個,2號染色體包含6個,3號染色體包含5個,10號染色體包含3個,6、7、9號染色體上都包含2個,8號染色體上只有1個(圖3)。進(jìn)一步對玉米DUF581基因進(jìn)行復(fù)制事件分析發(fā)現(xiàn),玉米內(nèi)共有14個串聯(lián)復(fù)制基因,占基因總數(shù)的31.1%,分布于2、4、5、10號染色體上,并且都位于進(jìn)化枝Ⅳ(圖3)。此外,在2、4、5號染色體上的3個串聯(lián)復(fù)制基因簇內(nèi)還存在片段復(fù)制基因,2號染色體的Zm00001d002530和4號染色體的Zm00001d051496都與5號染色體的Zm00001d017646為片段復(fù)制基因?qū)Γ麄冇兄嗨频幕蚪Y(jié)構(gòu),都只含有1個內(nèi)含子(圖2)。但位于2號、5號和10號染色體上的串聯(lián)復(fù)制基因簇內(nèi)的串聯(lián)復(fù)制基因的結(jié)構(gòu)存在差異,部分基因不含內(nèi)含子(圖2)。此外,對復(fù)制基因?qū)Φ倪x擇壓力分析發(fā)現(xiàn),所有玉米DUF581復(fù)制基因的Ka/Ks都小于1,這表明DUF581復(fù)制基因在進(jìn)化過程中都受到了純化選擇。
為了探究玉米DUF581基因家族在玉米生長發(fā)育中的作用,對玉米在4個生長發(fā)育時期(V12、V14、V16、R1)和葉、雌穗和雄穗3種生長發(fā)育組織內(nèi)的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行表達(dá)模式分析(圖4)。結(jié)果發(fā)現(xiàn),在玉米不同生長時期內(nèi)有32個基因至少在一個組織和時期內(nèi)表達(dá)(FPKM>1),在雌蕊內(nèi)共檢測到30個表達(dá)基因,葉內(nèi)檢測到28個表達(dá)基因,雌蕊內(nèi)檢測到32個表達(dá)基因,雌蕊和雄蕊內(nèi)的基因表達(dá)水平普遍高于葉片。在這些表達(dá)基因內(nèi),有26個基因在3個組織內(nèi)都呈現(xiàn)組成型表達(dá),這些組成型表達(dá)基因主要來自進(jìn)化枝Ⅳ(11個)和Ⅵ(7個),例如進(jìn)化枝Ⅳ內(nèi)的Zm00001d002520在3個組織的4個時期內(nèi)都有較高的表達(dá)水平(22.96 通過分析正常生長條件和干旱脅迫生長條件下玉米3種組織4個發(fā)育時期的轉(zhuǎn)錄組數(shù)據(jù)發(fā)現(xiàn),玉米DUF581基因家族有26個DUF基因差異表達(dá)(|log2(fold-change)|>1, FDR<0.05),其中有18個來自于進(jìn)化枝Ⅳ和Ⅵ。干旱脅迫下,玉米V12和R1期雌穗內(nèi)差異表達(dá)基因大部分呈現(xiàn)表達(dá)上調(diào),而在V14和V18期內(nèi)都是表達(dá)下調(diào);相似的是,玉米DUF581差異表達(dá)基因在V12和V14期的雄穗內(nèi)也都是表達(dá)下調(diào)。此外,一些基因在特定的組織和時期內(nèi)差異表達(dá),比如進(jìn)化枝Ⅲ內(nèi)的Zm00001d015420只在V18期雄穗內(nèi)被誘導(dǎo)上調(diào)。而有一些基因在不同組織時期內(nèi)都被干旱誘導(dǎo),并且表現(xiàn)出相似的表達(dá)模式,例如進(jìn)化枝Ⅵ內(nèi)的Zm00001d048694在V12期雌穗、V18和R1期雄穗都被誘導(dǎo)上調(diào)。還發(fā)現(xiàn)有一些基因廣泛參與不同組織時期內(nèi)的干旱脅迫應(yīng)答,并且應(yīng)答模式也存在差異。比如進(jìn)化枝Ⅳ內(nèi)的Zm00001d002520在葉組織內(nèi)的4個時期都被誘導(dǎo)上調(diào),而在V14期雌穗內(nèi)、V12和V14期雄穗內(nèi)則被誘導(dǎo)下調(diào)。尤其需要注意的是,有些基因在干旱脅迫下有很高的表達(dá)量,比如Zm00001d002520在雌穗的R1時期表現(xiàn)出超高的表達(dá)量(FPKM>1100)。此外,還有些基因的表達(dá)量顯著增加,比如進(jìn)化枝Ⅳ內(nèi)的Zm00001d026029在R1期葉片內(nèi)表達(dá)量由FPKM=7.7增加到了FPKM=69.8,被上調(diào)了9倍;Zm00001d036409在R1期雌穗內(nèi)表達(dá)量由FPKM=0.24增加到了FPKM=4.61,被上調(diào)了19倍。進(jìn)一步觀察了片段復(fù)制基因和串聯(lián)復(fù)制基因的表達(dá)情況,并且觀察到復(fù)制基因間表達(dá)模式的差異,比如片段復(fù)制基因?qū)m00001d017646和Zm00001d002530內(nèi)只有Zm00001d017646在R1期的雌蕊內(nèi)差異表達(dá)上調(diào),Zm00001d002530的表達(dá)值無明顯變化(圖5)。有趣的是,在干旱脅迫下,葉片組織內(nèi)的部分DUF581基因會應(yīng)答干旱脅迫從而增加表達(dá)量(圖5、6)。這些結(jié)果暗示了ZmDUF581基因在干旱脅迫調(diào)控時的重要性以及復(fù)雜性。 本研究對玉米DUF581基因家族和其它物種的該家族進(jìn)行比較和系統(tǒng)發(fā)育分析表明,玉米、水稻、大豆和擬南芥DUF581家族成員理化性質(zhì)表現(xiàn)出較高的相似性,表明該家族成員在進(jìn)化中的保守性。不同物種內(nèi)DUF581基因數(shù)目存在明顯差異,例如,大豆(38個)DUF581家族是菜豆(19個)的二倍,這可能是由于大豆進(jìn)化過程中發(fā)生的全基因組復(fù)制事件導(dǎo)致了這一差異[21],因此推測全基因組加倍事件對DUF581基因家族的擴(kuò)張起著重要的貢獻(xiàn)。 根據(jù)系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu),DUF基因家族分為6個進(jìn)化枝,不同進(jìn)化枝內(nèi)物種類別存在差異,因此在植物進(jìn)化過程中DUF581基因可能在有些物種中發(fā)生了丟失。不同進(jìn)化枝內(nèi)玉米DUF581基因結(jié)構(gòu)表現(xiàn)出明顯差異,進(jìn)化枝Ⅱ~Ⅵ的基因結(jié)構(gòu)呈現(xiàn)出較高的保守性,而進(jìn)化枝Ⅰ內(nèi)的基因結(jié)構(gòu)更多樣化。此外,進(jìn)化枝Ⅰ和Ⅱ內(nèi)DUF581基因UTR區(qū)結(jié)構(gòu)也較復(fù)雜,這暗示了玉米DUF581基因家族在轉(zhuǎn)錄過程中的調(diào)控存在多樣性。對基因家族復(fù)制事件分析發(fā)現(xiàn),玉米DUF581基因家族共有14個串聯(lián)復(fù)制基因和3個片段復(fù)制基因,這表明串聯(lián)復(fù)制和片段復(fù)制對該家族的擴(kuò)張起著重要的作用。 對玉米DUF581基因家族進(jìn)行了轉(zhuǎn)錄表達(dá)譜分析,結(jié)果表明,正常水分生長條件下,在玉米3種組織4個時期內(nèi)接近半數(shù)的DUF581基因呈現(xiàn)組成型表達(dá),并且在雌穗和雄穗生殖組織內(nèi)的表達(dá)水平較高,這表明玉米DUF581可能在玉米的生殖組織內(nèi)起重要作用;干旱脅迫下,超過半數(shù)的DUF581基因?yàn)椴町惐磉_(dá)基因,這暗示了玉米DUF581基因可能在非生物脅迫應(yīng)答中起重要作用;而串聯(lián)復(fù)制和片段復(fù)制基因則表現(xiàn)出差異的表達(dá)模式,表明復(fù)制基因可能產(chǎn)生了功能的分化。本研究鑒定了玉米應(yīng)答干旱脅迫的DUF581基因成員,為進(jìn)一步深入研究該家族基因的功能奠定了基礎(chǔ)。2.5 玉米DUF581基因在干旱脅迫下的表達(dá)模式分析
3 討 論