王仁漢 宋志美 屈旭



摘要:YUC基因家族催化吲哚-3-丙酮酸(IPA)生成生長素(IAA)的過程,進而調控植物生長素的合成。目前,研究者已經在多種植物上鑒定分析了YUCCA基因家族,但是關于煙草中該基因的報道較少。為了探討普通煙草YUCCA基因結構及功能,通過檢索普通煙草全基因組蛋白序列,篩選出21個煙草YUCCA基因家族序列,利用生物信息學工具對其蛋白質結構域、亞細胞定位、同源性進行分析。系統發育樹分析結果顯示,煙草YUCCA蛋白可以聚類到4個分支,與同為單子葉植物的擬南芥的親緣關系較近。結構域分析結果顯示,煙草YUCCA基因內含子數量在0~6個之間;協同進化樹分析結果顯示,親緣關系近的基因內含子數量較為相近;亞細胞定位結果顯示,19個序列定位到細胞質,2個序列定位到細胞質膜,該基因可能參與細胞質基因的轉錄調控。
關鍵詞:煙草;YUCCA基因家族;生物信息學;生長素
生長素(IAA)是一種重要的植物激素,參與植物的大部分生長發育過程,如在花、維管束、葉的發育和胚胎模式等發育過程中發揮了重要作用。近年來,IAA的合成途徑已經被揭示(圖1)[1],IAA生物合成的2條主要途徑包括色氨酸(Trp)依賴途徑和Trp獨立途徑[2]。通過色氨酸轉氨酶(TAA)/YUCCA(YUC)途徑合成生長素是目前研究最多的生長素生物合成途徑,該途徑中的Trp首先由TAA轉化為吲哚-3-丙酮酸酯(IPA),IPA在YUC家族編碼的黃素單加氧酶作用下產生IAA,此過程為多種植物IAA合成的限速步驟[3-5]。YUC是最早被確定為生長素合成過程的關鍵酶,因為 YUC酶在擬南芥中過表達導致IAA過量產生[3]。研究者在擬南芥[6-7]、水稻[8]、玉米[9]等植物中進行了YUCCA基因的全基因分析,而對煙草中該基因的研究較少。過表達OsYUCCA1基因的水稻植株表現出IAA水平升高和生長素分泌過多的特征表型,而表達反義OsYUCCA1 cDNA的植株則表現出生長素不敏感[8]。過表達擬南芥AtYUC6基因的馬鈴薯具有植株增高、生命周期延長等較明顯的生長素表現特征[9]。YUC基因的失活導致在表達YUC基因的組織中生長素報告基因DR5-GUS的表達量顯著降低[6]。本研究利用生物信息學方法對煙草YUCCA基因家族進行分析,為深入探討煙草該基因家族的功能提供理論基礎。
1 材料與方法
1.1 數據來源
從美國國家生物信息中心(NCBI)網站(https://www.ncbi.nlm.nih.gov/)下載擬南芥、水稻、玉米、小麥的YUCCA蛋白序列,合并作為種子序列。從SNG數據庫(https://solgenomics.net/)下載普通煙草蛋白序列文件和gff文件。
1.2 煙草YUCCA基因的鑒定和理化性質分析
以擬南芥、水稻、小麥、玉米的YUCCA蛋白序列為種子序列,通過BLASTp檢索煙草的全部蛋白質序列,E值設置為1×10-10。經去重復,共獲得25個候選序列,將候選序列提交到Pfam數據庫(https://web.expasy.org/protparam/)中,鑒定其是否含有YUCCA蛋白特有的保守結構域,E值設置為0.001。然后將獲得的序列提交到ExPASy(https://web.expasy.org/protparam/),預測其分子量、氨基酸數量、等電點等信息。再將序列提交到Protcomp 9.0(http://linux1.softberry.com/),對其進行亞細胞定位分析。
1.3 YUCCA基因家族的保守域分析和同源性分析
搜索煙草YUCCA基因家族中的基序,可以揭示基因家族在進化中的多樣性并推測它們的功能。通過MEME搜索煙草YUCCA蛋白質氨基酸序列,對其基序進行預測分析,預測基量設定為10。
通過基因進化樹,可以清晰、直觀地觀察到基因家族成員在進化過程中的分化情況。為了研究煙草YUCCA基因在進化中的規律,用MEGA軟件對擬南芥、水稻、玉米、煙草的YUCCA蛋白質序列進行多序列比對,選擇泊松模型,bootstrap值設置為1 000,構建鄰接進化樹。
1.4 煙草YUCCA基因家族表達模式分析
從NCBI GEO數據庫下載編號為GSE95717的普通煙草品種K326的轉錄組數據,將本研究獲得的煙草 YUCCA基因家族成員依次檢索,提取匹配到的煙草相關基因的表達數據,用Multiple Experiment Viewer軟件對結果進行可視化分析。
2 結果與分析
2.1 YUCCA基因家族的鑒定和理化性質分析
利用種子序列檢索普通煙草蛋白質數據庫,得到25個YUCCA基因家族候選序列。將候選序列提交至Pfam數據庫,其中有21個序列含有YUCCA基因家族特有的蛋白結構保守域,最終獲得21個煙草YUCCA基因家族成員(表1、圖2)。理化性質分析結果顯示,最短的YUCCA蛋白序列(YUCCA17)包含161個氨基酸,最長的YUCCA蛋白序列(YUCCA21)包含485個氨基酸,相應的相對分子量分別為18 247.92、5 837.18;YUCCA20~YUCCA9的理論等電點為572~9.43,YUCCA9~YUCCA8的不穩定指數為29.44~48.79。在21個YUCCA蛋白序列中,YUCCA15沒有內含子,YUCCA17含有1個內含子,YUCCA1~YUCCA8含有2個內含子,YUCCA9~YUCCA14、YUCCA16、YUCCA19含有3個內含子,YUCCA18含有4個內含子,YUCCA20、YUCCA21含有6個內含子。將序列提交到Protcomp 9.0進行亞細胞定位,發現除了YUCCA20、YUCCA21定位在細胞質膜,其余19條序列均定位在細胞質。染色體定位結果顯示,10個基因定位到9條染色體上,其中17號染色體上有2個基因,7、8、12、16、19、21、22、23號染色體均有1個基因,其余11個家族成員定位到Scaffold上。
2.2 煙草YUCCA蛋白序列保守域分析
用DNAMAN工具對21個煙草的YUCCA蛋白序列進行比對,結果(圖3)發現,除個別序列外,大部分序列含有黃素嘌呤二核苷酸(FAD)結合位點、腺嘌呤核苷三磷酸序列、還原型輔酶Ⅱ結合位點,這些位點在不同序列中幾乎相同,其中在10個保守的motifs中,motif2為FAD、NADPH的結合位點。利用MEME工具對21條煙草的YUCCA蛋白序列進行分析(圖4),發現在所有序列中,YUCCA20含有3個motifs,數量最少。協同系統進化樹分析發現,分在同一分支基因的motif數量相近,分布在不同分支的基因各序列間的motif數量相差較大,可能在基因功能上也存在差異。
2.3 煙草、擬南芥、水稻、玉米YUCCA基因的同源性分析
為進一步研究YUCCA蛋白在植物中的進化規律,利用21個煙草YUCCA蛋白質序列、7個水稻YUCCA蛋白質序列、9個玉米YUCCA蛋白質序列、12個擬南芥YUCCA蛋白質序列構建系統發育樹(圖5)。進化樹將這4種植物的49個YUCCA成員分為7個亞科(1~7),發現所有煙草YUCCA蛋白都屬于1、5、6、7這4個分支。分支2、3屬于水稻特有的2個類群,分支4是玉米特有的1個類群。在1、5、6、7分支中, 同為雙子葉植物的煙草、擬南芥YUCCA蛋白的親緣關系較為密切,在分支6、7上,發現單子葉植物水稻、玉米YUCCA蛋白有較密切的親緣關系,這意味著雙子葉植物和單子葉植物的YUCCA基因親緣關系較遠,同為雙子葉植物或同為單子葉植物具有高度的進化保守性和密切的同源關系。
2.4 煙草YUCCA基因的表達模式分析
煙草YUCCA基因聚類分析和可視化處理結果(圖6)顯示,不同基因的表達量存在差異,在18 h內,YUCCA13、YUCCA21在各組織中均高表達,YUCCA15、YUCCA16、YUCCA18、YUCCA19基因的表達水平較低。部分基因僅在某個組織的發育時期高表達,YUCCA5、YUCCA9、YUCCA10基因僅在莖端組織高表達,YUCCA1、YUCCA4基因在根組織高表達。綜上分析結果表明,煙草YUCCA基因家族在不同組織中的表達量存在差異,莖端的總體表達量高于莖、根,這與莖端是生長素的主要合成部位相吻合。
3 討論
YUC作為植物IAA合成過程中的限速酶,其生物學功能在多種植物中得到了廣泛挖掘,但是該基因在煙草中的信息較為缺乏[10-11]。因此,利用生物信息學鑒定煙草YUCCA基因,并對其理化性質、保守結構域及同源性進行分析,可為后續研究YUCCA在生長素合成過程中發揮的分子機制提供基礎信息。
本研究利用普通煙草數據庫,鑒定出21個YUCCA基因家族成員,多于擬南芥的12個,出現這種現象可能是由于普通煙草是異源四倍體植物,在進化過程中,由于全基因復制而使基因家族出現擴增。通過煙草YUCCA蛋白保守結構域和進化樹協同分析發現,劃分在同一分支的家族成員具有相近數量的motif,表現出煙草YUCCA蛋白結構上的保守性、功能上的相似性;分布在不同分支的家族成員的motif數量相差較大,motif存在差異可以賦予YUCCA基因不同的功能,從而表現出基因家族功能的多樣性,此結果與大豆[12]、大白菜[13]、水稻[8]YUCCA基因的研究結果相吻合。以往研究發現,FAD、NADPH、ATG基序可能是YUCCA基因生物學功能的關鍵位點,其中FAD、NADPH的結合位點是YUCCA活動中心[14-15]。亞細胞定位結果表明,煙草YUCCA成員被定位到細胞質和細胞質膜,生長素合成是在細胞質中完成的,這些基因可能在細胞質中參與生長素合成過程。本研究利用生物信息初步分析了普通煙草的21個YUCCA基因,但是關于該基因在煙草生長素合成過程中的作用機制及相關功能還有待進一步研究。
4 結論
本研究鑒定出21個煙草YUCCA基因家族成員,氨基酸長度為161~485個之間,除YUCCA15沒有內含子外,其余成員的內含子數為2~6個;19個YUCCA家族成員亞細胞定位在細胞質,2個定位在細胞質膜;染色體定位結果顯示,10個基因定位到9條染色體上,17號染色體有2個基因,7、8、12、16、19、21、22、23號染色體均有1個基因,其余11個家族成員定位到Scaffold,染色體位置尚無法確定。結構域分析發現,煙草YUCCA蛋白含有FAD、NADPH結合位點。系統進化樹分析將煙草YUCCA家族成員分到了4個分支,在同一分支中,煙草與擬南芥YUCCA家族成員的親緣關系較近。
參考文獻:
[1]Mashiguchi K,Tanaka K,Sakai T,et al. The main auxin biosynthesis pathway in Arabidopsis[J]. Proceedings of the National Academy of Sciences of the United States of America,2011,108(45):18512-18517.
[2]Zazimalova E,Napier R M. Points of regulation for auxin action[J]. Plant Cell Reports,2003,21(7):625-634.
[3]Zhao Y. A role for flavin Monooxygenase-like enzymes in auxin biosynthesis[J]. Science,2001,291(5502):306-309.
[4]Zhao Y. Auxin biosynthesis:a simple two-step pathway converts tryptophan to indole-3-acetic acid in plants[J]. Molecular Plant,2012,5(2):334-338.
[5]Tivendale N D,Ross J J,Cohen J D. The shifting paradigms of auxin biosynthesis[J]. Trends in Plant Science,2014,19(1):44-51.
[6]Cheng Y. Auxin biosynthesis by the YUCCA flavin monooxygenases controls the formation of floral organs and vascular tissues in Arabidopsis[J]. Genes & Development,2006,20(13):1790-1799.
[7]劉華彬,張秦瑩,門淑珍. YUCCA基因家族在擬南芥胚胎發育過程中的表達模式研究[J]. 南開大學學報(自然科學版),2017,50(4):1-7.
[8]Yamamoto Y,Kamiya N,Morinaka Y,et al. Auxin biosynthesis by the YUCCA genes in rice[J]. Plant Physiology,2007,143(3):1362-1371.
[9]Kim J I,Baek D,Park H C,et al. Overexpression of Arabidopsis YUCCA6 in potato results in high-auxin developmental phenotypes and enhanced resistance to water deficit[J]. Molecular Plant,2013,6(2):337-490.
[10]Li W,Zhao X,Zhang X. Genome-wide analysis and expression patterns of the YUCCA genes in maize[J]. Journal of Genetics & Genomics,2015,42(12):707-710.
[11]Betekhtin A,Rojek M,Nowak K,et al. Cell wall epitopes and endoploidy as reporters of embryogenic potential in Brachypodium Distachyon callus culture[J]. International Journal of Molecular Sciences,2018,19(12):3811.
[12]Wang Y,Liu H,Wang S,et al. Genome-wide identification and expression analysis of the YUCCA gene family in soybean (Glycine max L.)[J]. Plant Growth Regulation,2016,81(2):265-275.
[13]綦 洋,王柬鈞,桑園園,等. 大白菜YUCCA基因家族的鑒定與生物信息學分析[J]. 江蘇農業科學,2019,47(3):57-62.
[14]Cao X,Yang H L,Shang C Q,et al. The roles of auxin biosynthesis YUCCA gene family in plants[J]. International Journal of Molecular Sciences,2019,20(24):6343.姚 義,張明偉,陳京都,等. 稻蝦共作模式下不同栽插密度對豐優香占群體結構及產量的