張愷愷,楊立瑩,豐美靜,,張林鳳,陳段芬,邱德有,楊艷芳*
(1.中國林業科學研究院林業研究所,林木遺傳育種國家重點實驗室,國家林業和草原局林木培育重點實驗室,北京 100091;2.河北農業大學園藝學院,河北保定 071001;3.中國花卉協會,北京 100020)
紅豆杉(Taxusspp.)是舉世公認的珍貴林木,在全世界一共有11 種,我國存在4 種和1 變種,即東北紅豆杉(T.cuspidataSieb.et Zucc.)、西藏紅豆杉(T.wallichianaZucc.)、云南紅豆杉(T.yunnanensisCheng et L.K.Fu)、中國紅豆杉(T.chinensis(Pilger) Rehd.)以及南方紅豆杉(T.chinensisvar.mairei(Lemeee et Levl)Cheng et L.K.Fu)[1]。曼地亞紅豆杉(Taxus×mediaRehder)為一種天然雜交種,于上世紀90 年代由美國或加拿大引種于我國。
NAC (NAM/ATAF/CUC)是植物中最常見的轉錄因子家族之一,在植物生長發育過程中起到重要的調控作用,如響應非生物脅迫、調控器官生長發育以及參與激素信號轉導等[2-4]。研究發現,水稻OsNAC2 蛋白能夠通過影響植物生長素和細胞分裂素(cytokinin)反應基因來調控根的發育[5],而擬南芥ANAC092 可以與生長素應答因子ARF8和PIN4 的啟動子相結合,通過控制生長素信號途徑來影響擬南芥根系的發育[6-8]。此外,在擬南芥中異源表達BnNAC14、GmNAC109、CiNAC3和CiNAC4等其他物種的NAC基因,也可以對側根的形成起到促進作用[8-11]。這些研究結果表明,NAC 轉錄因子在植物根系的形成過程中扮演重要角色。
近年來,人們為了緩解紅豆杉開發與利用的矛盾,在紅豆杉人工種植研究上取得了巨大進展,但仍存在紅豆杉扦插繁殖生根較慢(大約需要45~60 d)的技術瓶頸。并且,目前關于紅豆杉生根的分子機制研究也較為少見。本研究從曼地亞紅豆杉三代全長轉錄組數據中鑒定出了44 個NAC轉錄因子基因,并對該基因家族進行了系統生物信息學及組織表達分析,為探索NAC 轉錄因子調控紅豆杉根系的形成奠定理論基礎,有助于今后利用分子手段調控其根系生長、縮短扦插育苗時間。
通過隱馬可夫模型HMM(PF02365) (TBtools v1.064[12])從課題組曼地亞紅豆杉三代全長轉錄組數據(未發表)中獲取NAC 蛋白序列。利用在線工具CD-HIT Suite 進行去冗余[13],利用NCBI CD Search 工具進行結構域預測,并篩選結構域完整的序列進行后續分析。
利用ExPASy 在線工具ProtParam(https://web.expasy.org/protparam/)分析TmNAC 蛋白理化特性。根據進化樹結果,每個亞家族選取一個TmNAC 蛋白作為代表,利用phyre2 在線網站(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)進行三級結構建模。
擬南芥NAC 蛋白序列下載于Plant TFDB (http://planttfdb.cbi.pku.edu.cn/)數據庫。從138 個擬南芥NAC 蛋白質序列中隨機選取6 個序列,用ClustalX2 軟件將其與44 個TmNAC 序列進行多序列比對,比對結果利用EsPript 3.0 (http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)進行美化。利用MEGA 7 軟件中的NJ(Neighbor-Joining)法構建進化樹,重復1 000 次,其他參數為默認值。iTOL(https://itol.embl.de/)在線網站美化進化樹。
利用 MEME 在線網站對TmNAC 蛋白進行保守基序(Motif)分析[14],最大motif 檢索數為10,其余為默認參數,將結果通過TBtoolsv1.064軟件進行可視化處理[12]。
利用云南紅豆杉植株根、莖和葉的RNA-seq數據(SRP127697)和TBtools v1.064 軟件繪制TmNACs 基因在根、莖和葉組織中的表達熱圖,對NAC 成員基因表達量FPKM 值使用log2 (FPKM +1)對數轉化處理[12]。
本研究共獲得44 條NAC 蛋白序列,命名為TmNAC1~TmNAC44。對獲得的44 個TmNAC蛋白序列進行理化性質分析,發現TmNAC38 序列最長,含有1 010 個氨基酸殘基,而TmNAC9序列最短,含有154 個氨基酸殘基;這些TmNAC蛋白等電點為 4.70~9.60,相對分子質量為18.13~113.57 kDa,GRAVY 值均為負值,表明TmNAC蛋白均為親水蛋白。
系統進化樹結果顯示,44 個TmNAC 蛋白被分為NAM 等7 個亞家族,其他NAC1、ONAC22和SEUN5 等擬南芥9 個NAC 亞家族中無TmNACs蛋白分布(圖1)。
從圖1 中可以看出,各TmNAC 成員的三級結構十分相似,但也存在些許差異,如TmNAC1 蛋白比其他蛋白多了一個β-折疊,TmNAC16 和TmNAC21 蛋白比其他蛋白多一個α 螺旋(圖2)。

圖1 曼地亞紅豆杉與擬南芥NAC 家族進化樹分析Fig.1 Phylogenetic relationship among NAC superfamily genes of of Taxus × media and Arabidopsis thaliana

圖2 TmNAC 蛋白的三級結構分析Fig.2 3D structures of TmNAC proteins
多序列比對結果發現,所有的NAC 蛋白在N 端均具有保守的NAC 結構域(圖3),其結果與擬南芥和水稻NAC 轉錄因子家族分析結果相似[15]。此外,TmNAC7 和TmNAC42 蛋白具有不完整的亞結構域D 與E (圖3),其余蛋白均具有5 個保守的亞結構域(A~E)。

圖3 曼地亞紅豆杉和擬南芥NAC 蛋白保守結構域分析Fig.3 Analysis of conserved domains of the NAC proteins of Taxus × media and Arabidopsis thaliana
基序分析結果發現motif 2、4、5 幾乎存在于所有的NAC 蛋白成員中。另外,有的亞家族具有或缺失某些蛋白基序,如motif 8、10 僅存在于ANAC011 亞家族中,motif 7 僅存在于NAM 與ATAF 亞家族中;而ANAC011 亞家族中的TmNAC36 和TmNAC15 則分別缺少motif 2 和motif 5 (圖4)。

圖4 曼地亞紅豆杉TmNAC 蛋白motif 分析Fig.4 Motif analysis of TmNAC proteins of Taxus × media
組織表達分析結果顯示,TmNAC15、16、18、21、22、29、39、40、41和44在根中均有較高的表達量,而在葉和莖中的表達量都相對較低。另外,TmNAC2、3、8、17、25和42在根與葉中表達量相近,而TmNAC27和TmNAC43在莖中表達量最高,在葉和根中的表達量均較低(圖5)。

圖5 TmNAC 基因在根、莖和葉中表達模式Fig.5 The expression patterns of TmNAC genes in roots, leaves and stems
NAC基因家族具有保守的結構域和功能域,對植物的生長發育具有重要的作用[15-17]。本研究從曼地亞紅豆杉轉錄組數據中鑒定出 44 個NAC 轉錄因子,數目明顯少于擬南芥和水稻基因組中的138 個和140 個[18-19]。究其原因,很有可能是由于本研究的NAC 來源于三代全長轉錄組測序數據,也有可能是因為物種不同造成。目前,已經有西藏紅豆杉和南方紅豆杉基因組發表[20-21],未來可以利用這些基因組信息對NAC 基因家族進一步進行分析,紅豆杉NAC 家族的完整性可以得到進一步完善和確定。
研究表明NAC 蛋白具有典型結構特征,均含有NAC 功能域,且NAC 區域包含 A~E 共5 個NAC 亞結構域。本研究蛋白多序列比對結果顯示,44 個TmNAC 蛋白在N 端均含有 NAC 結構域,但TmNAC7 和TmNAC42 蛋白具有不完整的D 和E 亞結構域。這5 個亞結構域的保守性順序為A>C>D>B>E,亞結構域A 與C 對蛋白質的穩定發揮著重要作用。此外,亞結構域 E 是NAC 蛋白中一個重要的 DNA 結合區域,可能參與了發育時期調控,并且前人也推測存在由亞結構域D 和E 組成的DNA 結合區[22]。蛋白的功能與其結構密切相關,由此可以推測,TmNAC 家族有很大可能與其他植物的NAC 蛋白功能相似,而TmNAC7和TmNAC42 蛋白功能則極其可能與其他TmNAC蛋白功能有所不同。
進化樹分析顯示紅豆杉TmNAC 成員與大多數擬南芥NAC 家族各亞家族成員具有較高同源性,表明NAC 家族在物種間進化保守。因此,可以通過其他物種NAC 蛋白功能來預測紅豆杉NAC 同源蛋白的功能。此外,擬南芥中NAC1、ONAC22和SEUN5 等9 個亞家族并不包含紅豆杉NAC 同源蛋白,這些情況可能是由于曼地亞紅豆杉的NAC家族序列是從轉錄組數據中獲得,并未全部獲取到基因組中其他亞家族NAC 蛋白序列所造成。
多序列比對、motif 及蛋白質三級結構分析均發現,44 個曼地亞紅豆杉NAC 蛋白具有較高的相似性和保守性,該結果與桃樹、蓖麻、茶樹、番茄中的報道相類似,說明其在進化上非常保守[23-26]。值得注意的是,TmNAC1、TmNAC16 和TmNAC21三者所在的亞家族與其他亞家族成員結構上存在顯著差異,且不同亞家族或同一亞家族不同成員之間motif 類型和數目也存在差異,這些結構差異是否導致它們功能發生變異尚不清楚,值得研究人員進一步深入研究。
研究表明,不同的物種間同源基因在進化過程中會保留相同或相似的功能,而基因的組織表達模式往往與其功能密切相關[27]。擬南芥和水稻的一些NAC 轉錄因子的功能已經得到驗證,這為預測紅豆杉TmNAC 轉錄因子的功能提供了線索。TmNAC 家族TmNAC15、16、18、21、22、29、39、40、41和44基因在紅豆杉根中表達量較高,同時TmNAC21、30、39、40 和44 蛋白與擬南芥AtNAC2/AT3G15510 蛋白在系統發育樹中聚為一支,而AtNAC2恰恰參與側根的形成與發育[28];TmNAC5、11、14、22、24、34 和37 蛋白與擬南芥AtNAC1/AT3G15170 蛋白在系統發育樹中聚為一支,AtNAC1介導生長素信號以促進側根的形成[29]。綜合上述,推測紅豆杉TmNAC21、39、40、44(NAP/ANAC3 亞家族)和TmNAC22(NAM 亞家族)可能在紅豆杉根系生長發育中起到重要調控作用。
本研究從紅豆杉轉錄組中鑒定出44 個NAC成員,發現紅豆杉NAC基因編碼的44 個蛋白在N 端均具有保守的NAC 結構域,TmNAC 家族有很大可能與其他植物的NAC 蛋白功能相似。蛋白功能結構域分析結果預示著紅豆杉NAC 家族成員可能在亞家族間以及亞家族內部具有功能的特異性。表達量比較分析顯示,TmNAC基因在紅豆杉不同組織中的表達量各不相同,TmNAC21、22、39、40和44可能與紅豆杉根的生長發育有關,為進一步探索紅豆杉NAC 轉錄因子調控紅豆杉根系生長提供理論基礎。