郭亞寧,張盼盼,羅 玉,陳潤峰,張 雄
(榆林學院 生命科學學院 ,陜西 榆林 719000)
NAC是植物特有的較大轉錄因子家族之一,其命名起源于NAM、ATAF1/2和CUC1/2三類基因。隨著多種植物的基因組測序完成,為NAC轉錄因子在基因組水平的分析奠定基礎,在擬南芥、大豆和玉米中分別鑒定得到117[1]、150[2]和216[3]個家族成員,同時在棉花、卷心菜、毛果楊等植物中分別鑒定得到NAC轉錄因子,說明NAC轉錄因子在植物中具有廣泛的作用[4]。近年大量研究表明NAC轉錄因子在植物生長發育及逆境應答中發揮著重要的作用,芒屬中的MlNAC10基因能夠提高擬南芥的抗旱能力[5];狼尾草中的PgNAC21調控擬南芥對高鹽的忍耐力[6];香蕉MpSNAC67基因參與葉綠素合成途徑[7]。綜上可知,NAC蛋白作為植物特有的轉錄因子,對植物的生長具有普遍的調控作用。
綠豆(VignaradiataL.)是我國重要的食用豆類[8],其籽粒富含蛋白質等營養物質,是高血脂、糖尿病人的優良食材[9]。綠豆基因組數據的公布[10],為綠豆的分子相關研究奠定了數據基礎。大量研究表明NAC轉錄因子在植物逆境生長發育中發揮著重要作用,但綠豆中關于NAC轉錄因子的研究匱乏,綠豆中的功能NAC亟待挖掘。本研究基于綠豆基因組數據,利用生物信息學方法,對綠豆中NAC轉錄因子進行核酸組成及結構分析、進化分析、聚類分析,保守結構域分析,初步鑒定得到綠豆功能NAC基因,為綠豆的分子育種奠定基礎。
基于綠豆基因組數據(ftp://ftp.gramene.org/pub/gramene),借助NCBI中擬南芥及水稻的NAC蛋白序列(https://www.ncbi.nlm.nih.gov/),通過本地Blast軟件進行tblastn同源比對,設置E-value<1E-10,Identity>200,去冗余后,得到完整的CDs共59條,按照順序命名為VrNAC1-VrNAC59,NCBI中對應編號見附表1。
利用DNAMAN軟件,進行VrNACs的核酸分子量、長度及保守序列的多重序列比對分析;利用mapchart軟件對VrNACs的染色體體定位信息進行可視化分析。
利用MEME(http://meme-suite.org/)在線分析VrNACs的模體結構;通過KaKs Calculator軟件,分析VrNACs在隨著綠豆進化過程中的演替方向。
基于VrNACs氨基酸序列及擬南芥的137條ANACs,利用MUSCLE(http://www.ebi.ac.uk/Tools/msa/muscle/)進行多重序列比對,構建聚類圖。
VrNACs的基礎結構如表1所示。59條VrNACs基因的核酸長度分布于498~2919 bp之間;59條綠豆VrNACs序列的G/C含量較低,A/T的含量較高。
利用DNAMAN軟件,對59條VrNACs序列進行多重序列比對,結果見圖1。綠豆的VrNAC序列的N端相對保守,長度在450 bp左右,根據其結構特征可以劃分為A、B、C、D和E五個亞結構域[11],其中C亞結構域保守性最高,可能是NAC轉錄因子與其他蛋白或下游DNA的結合的決定因子。綠豆VrNACs序列的C端差異顯著,可能與NAC轉錄因子的轉錄激活活性相關,綠豆VrNACs基因的結構特征與其他植物的NAC轉錄因子的結構特征一致。

圖1 159條VrNACs的多重序列比對
根據綠豆基因組數據,利用mapchat軟件對59個VrNACs基因的染色體定位進行可視化分析,結果見2。除VrNAC1-VrNAC6、VrNAC23、VrNAC24、VrNAC28、VrNAC29和VrNAC44分別定位到scaffold_7、43、48、51、86、137、179、312、341和425上,其余48個基因均準確定位于綠豆的11條染色體上,其中9號染色體無VrNAC基因分布,4號和10號染色體分別僅包含VrNAC30和VrNAC58,1號、5號和7號染色體的VrNACs基因分布較多,2號和6號染色體上各包含5個VrNACs基因,3號、8號和11號染色體分別有3個VrNACs基因分布,該結果表明VrNACs在綠豆11條染色體非均勻分布。
利用MEME在線軟件分析59條VrNACs的模體組成,結果見圖3。VrNACs的模體數量及相對位置存在較大的差異,且VrNACs的6個模體大部分存在于N端。其中VrNAC07、VrNAC09、VrNAC12、VrNAC53、VrNAC50、VrNAC05和VrNAC20聚類到同一分支,均包含3個不連續模體;VrNAC33、VrNAC14、VrNAC44、VrNAC28、VrNAC35、VrNAC04、VrNAC22和VrNAC41均包含5個不同的模體。

圖2 VrNACs的染色體定位分析

圖3 綠豆VrNACs的模體分析
圖注:Chr1-chr11分別代表綠豆基因組標注的1-11號染色體。
通過KaKs_Calculator軟件計算7對VrNACs基因的ka/ks比值,結果見表3。7對VrNACs基因的相似性均大于45%,其中VrNAC13-VrNAC52、VrNAC32-VrNAC43、VrNAC08-VrNAC45、VrNAC12-VrNAC53和VrNAC37-VrNAC48的ka/ks比值均大于1,為正選擇過程;VrNAC25-VrNAC55和VrNAC03-VrNAC17均小于1,為純化選擇過程。

表3 VrNACs的ka/ks值
利用MEGA軟件對擬南芥和綠豆的NACs序列進行聚類分析,結果如圖4所示。196個NACs共聚為7個亞類,分別標記為Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ和Ⅶ。59個VrNACs非均勻地分布到7個亞類中,其中Ⅰ亞類包含7個VrNACs;亞類Ⅱ包含綠豆VrNAC57和5個擬南芥的NAC蛋白;第Ⅲ、Ⅳ、Ⅴ、Ⅵ和Ⅶ亞類亞類分別包含9、8、13、6、15個綠豆VrNACs。

圖4 59個VrNACs和137個ANACs的氨基酸序列聚類分析
綠豆中的59個VrNAC基因N端保守,保守區域長度約150aa,C端變異較大,表明其N端涉及VrNAC蛋白靶向下游因子的準確性,C端變異較大說明綠豆VrNACs蛋白在功能上存在顯著性差異;綠豆VrNAC基因集中分布在1、2、5、6、7號染色體上,9號染色體無分布,其余染色體分布較少,同時位于同一染色體的VrNACs具有相似的模體結構,屬于同一亞類,推測VrNACs在隨著綠豆的進化過程中發生復制和變異是非均衡的,且同一染色體上的VrNACs通過共同的祖先,經過多次復制、變異產生多個相似基因[12]。聚類結果表明綠豆的VrNACs非均勻分布于7個亞類中,根據結構決定功能的原理,結合擬南芥中NAC蛋白在植物生長發育及逆境脅迫中的功能多樣性,推測綠豆的VrNACs可能參與綠豆的生長發育及逆境脅迫應答。