劉暢暢 黃敏









摘要:LEC基因家族包含LEC1和LEC2,參與植物的生長發育及儲藏物質的積累。LEC1(Leafy Cotyledon 1)是NF-YB9蛋白家族的成員,編碼了CCAAT-box結合轉錄因子HAP3(Heme activated protein 3)亞單位。利用生物信息學方法,獲得了16個玉米LEC1基因。分析發現,ZmLEC1蛋白大部分都是酸性的不穩定親水蛋白,含有1個保守結構域CBFD_NFYB_HMF及10個保守基序。通過與擬南芥LEC1基因和水稻LEC1基因的聚類分析,將玉米LEC1基因家族分為4類:ClassⅠ、ClassⅡ、ClassⅢ、ClassⅣ。經RNA-seq等分析發現,玉米LEC1家族基因具有組織特異性,響應非生物脅迫。啟動子分析發現,玉米LEC1基因啟動子上含有響應激素和非生物脅迫的順式作用元件。
關鍵詞:玉米;LEC1基因家族;生物信息學
中圖分類號:S513? ? ? ? ? ? ? 文獻標志碼:A? ? ? ? ? ? ? 文章編號:1001-1463(2022)01-0031-07
doi:10.3969/j.issn.1001-1463.2022.01.007
Identification and Bioinformatics Analysis of LEC1 Gene Family in Maize
LIU Changchang 1, HUANG Min 1, 2
(College of Life Science, Yangtze University, Jingzhou Hubei 434025, China)
Abstract:The LECfamily genes, consisting of LEC1 and LEC2, are involved in the development and accumulation of storage materials in plants. LEC1(Leafy Cotyledon 1) is a member of the NF-YB9 protein family, encoding the CCAAT-box binding transcription factor HAP3 (Heme activated protein 3) subunit. In this study, we identified 16 LEC1? genes by using bioinformatics. Most of the ZmLEC1 proteins are acidic unstable hydrophilic proteins, containing a conserved domain CBFD_NFYB_HMF and 10 conserved motifs. By aligning the sequence of LEC1 genein Arabidopsis and rice, respectively, these genes were divided into four categories as ClassⅠ、ClassⅡ、ClassⅢ、ClassⅣ. According to the analysis of RNA-seq, ZmLEC1 preferentially expressed in specific tissues, responding to the abiotic stress. Promoter region analysis revealed that the promoter of ZmLEC1 contained cis-acting elements in response to hormonal and abiotic stresses.
Key words:Maize(Zea mays L.);LEC1 gene family;Bioinformatics
植物的胚胎發育一直是人們的研究熱點,隨著科技水平的迅猛發展,有大量胚胎發育相關基因被克隆出來。LEC1基因最早是在擬南芥中發現的,其在早期發育階段發揮作用,以維持胚胎細胞的命運[1 ]。LEC1的異位胚后表達能夠誘導擬南芥葉片組織中胚狀結構的形成、幼苗發育畸形、子葉生長異常,根系生長也受到了抑制[2 ]。繼擬南芥LEC1基因被克隆后,玉米、胡蘿卜、花生、棉花等作物的LEC1基因也相繼被克隆出來并進行了初步的探索與研究[3 - 6 ]。研究發現,基因LEC1還參與植物脂肪酸生物合成的縮合、伸長和去飽和反應。LEC1基因的過度表達導致擬南芥脂肪酸生物合成基因的整體表達增加[7 ],其在玉米中過量表達時提高了種子的油脂含量[8 ]。基因LEC1在油菜中的過量表達可以是其種子油脂含量增加7%~16%[9 ]。
2020年中國玉米產量高達2.61億t,作為我國的高產糧食作物,玉米是畜牧業、養殖業等重要的飼料來源,也是許多工業用品不可缺少的原料之一,在全國31個省、市、自治區均有種植[10 ]。胚胎的發育影響了種子萌發速率和整齊度,同時也會影響后期的抗蟲害能力及產量[11 ]。目前,關于玉米LEC1基因組鑒定及生物信息學分析尚未見報道,本文利用生物信息學手段對玉米LEC1基因家族理化性質、基因結構、蛋白結構、系統發育、啟動子元件,基因的差異性表達等進行了分析,以期為進一步探究玉米LEC1基因功能與調節機制奠定基礎。
1? ?材料與方法
1.1? ?數據來源
通過MaizeGDB(https: //maizegdb.org/gene_center/gene)和NCBI獲取玉米LEC1基因家族數據,在Ensembl Plants(http://plants.ensembl.org/index.html)上下載玉米蛋白質的全部序列,在TAIR(https://www.arabidopsis.org)網站上獲取擬南芥LEC1基因的蛋白序列。
1.2? ?方法
1.2.1? ? 玉米LEC1基因家族的鑒定及理化性質分析
通過TBtools工具將獲得的玉米LEC1基因家族數據進行進一步篩選。將所得玉米LEC1基因家族蛋白序列提交在線網站ProtParam(https://web.expasy.org/protparam/)上,分析各玉米LEC1蛋白的氨基酸數量,分子量,等電點,蛋白疏水性,不穩定系數等理化性質。
1.2.2? ? 玉米LEC1基因家族的染色體定位? ? 在NCBI數據庫中獲取玉米LEC1基因家族各成員的在染色體上的位置信息及玉米各染色體長度信息,將上述信息整理并上傳至MapGene2Chrom(http://mg2c.iask.in/mg2c_v2.1/),在線網站繪制出玉米LEC1基因染色體定位圖。
1.2.3? ? 玉米LEC1基因結構及蛋白結構域分析? ? 通過TBtools工具提取玉米LEC1基因家族各成員的外顯子、內含子結構信息,并上傳至GSDS2.0(http://gsds.cbi.p-ku.edu.cn/)。通過MEME(http://alternate.meme-suite.org/tools/meme)在線網站分析玉米LEC1-1~16蛋白保守基序。利用NCBI中Batch CD-Search工具分析ZmLEC1-1~16蛋白結構域,并通過TBtools處理得到可視化圖形。
1.2.4? ? 玉米LEC1基因啟動子順式元件分析? ? 玉米LEC1-1~16基因上游2 000 bp的啟動子序列,通過PlantCARE(http://bioinformatics.psb.ugent.be/webt ools/plantcare/html/)分析順式作用元件,并利用Tbtools對順式作用元件的在基因上的位置進行可視化處理。
1.2.5? ? 玉米LEC1蛋白的系統發育分析? ? 從Ensembl Plants數據庫下載水稻的全部蛋白質信息,利用從PFAM網站(http://pfam.xfam.org/)得到的蛋白保守結構域CBFD_NFYB_HM的Pfam號(PF 00808)進行信息搜索。將得到全部9個水稻LEC1、14個擬南芥LEC1的蛋白序列和玉米的16個LEC1蛋白序列導入到Tbtools中進行系統發育樹構建。
1.2.6? ? 玉米LEC1基因表達模式分析? ? 從MaizeGDB網站下載玉米根、葉、種子、胚乳的轉錄數據及玉米在冷、熱、鹽、紫外脅迫和正常生長下的轉錄組數據,將玉米LEC1-1~16的數據篩選出來并上傳至TBtools進行熱圖繪制。
2? ?結果與分析
2.1? ?玉米LEC1基因家族的鑒定及理化性質分析
通過從TAIR上得到的擬南芥LEC1蛋白的氨基酸序列,在NCBI和MAIZEGDB上進行BLAST搜索,最終篩選得到16個玉米LEC1基因。根據它們在染色體上的排列順序,將其命名為ZmLEC1-1~16。玉米LEC1家族蛋白的氨基酸數量為91~278 aa,分子量為10 394.60~29 097.21 Kda。蛋白的等電點除ZmLEC1-9(7.10)和ZmLEC1-11(8.81)外,其余均在7.00以下,說明玉米LEC1蛋白大多是呈酸性的。且蛋白疏水性均小于0,不穩定系數均大于40,說明玉米LEC1蛋白是不穩定的親水蛋白(表1)。
2.2? ?玉米LEC1基因家族染色體定位
為了進一步了解ZmLEC1基因家族在染色體上的具體分布,通過MG2C在線網站對ZmLEC1-1~16的注釋信息進行分析,結果顯示,除了第10條染色體無基因分布外,其余染色體上均有分布,其中第2條染色體上有3個基因,第3條染色體上有5個基因,第8條染色體上有2個基因,其余每條染色體上均有1個基因(圖1)。
2.3? ?玉米LEC1基因結構及蛋白結構域
通過GSDS2.0在線網站分析得到玉米LEC1基因結構,發現其編碼區為1~3個,其中ZmLEC1-8、ZMLEC1-14沒有5′UTR和3′UTR,ZmLEC1-2,ZMLEC1-5沒有3′UTR(圖2)。利用MEME在線工具對LEC1基因家族的保守結構域進行分析,得到10個保守的motif(圖3),命名為motif1-motif10,但每個ZmLEC1-1~16蛋白的motif排列順序并不完全相同,其中ZmLEC1-3包含7個motif,ZmLEC1-1、ZmLEC1-4、ZmLEC1-6、ZmLEC1-7、ZmLEC1-12、ZmLEC1-15、ZmLEC1-16包含4個motif,ZmLEC1-5、ZmLEC1-8、ZmLEC1-9、ZmLEC1-11、ZmLEC1-13、ZmLEC1-14包含3個motif,ZmLEC1-2包含2個motif(圖4)。通過TBtools對LEC蛋白結構域進行分析,發現基因ZmLEC1-1~16蛋白擁有保守的蛋白結構域CBFD_NFYB_HMF(圖5)。
2.4? ?玉米LEC1家族基因啟動子特異順式作用元件
選取玉米ZmLEC1-1~16碼子上游2 000 bp的序列進行啟動子順式作用元件的分析。Plant CARE在線分析結果表明(圖6),玉米ZmLEC1-1~16區域含有茉莉酸甲酯響應元件(TGACG-motif,CGTCA-motif)、生長素反應元件(TGA-element,Aux RR-core)、水楊酸反應元件(TCA-element)、赤霉素反應元件(GARE-motif,TATC-box,P-box)、脫落酸反應元件(ABRE,SARE)、光響應元件(G- box,Sp1,GATA-motif,Box 4,AE-box,I-box)、干旱響應元件(MBS)、低溫調控元件(LTR)、防御及應激響應元件(TC-rich repeats)、種子特異性調控元件(RY-element)。
2.5? ?玉米LEC1基因的系統發育分析
在Ensembl Plants數據庫搜索得到9個水稻LEC1和14個擬南芥LEC1的蛋白序列,將獲得的擬南芥、水稻和玉米的蛋白序列導入到TBtools中進行系統發育樹的構建。結果顯示(圖7),39個LEC1基因可分為4個亞家族(ClassⅠ、ClassⅡ、ClassⅢ、ClassⅣ),其中ClassⅠ中包含了4個玉米基因(ZmLEC1-6,ZmLEC1-7,ZmLEC1-8,ZmLEC1-11)、2個水稻基因(Os01t0935200,Os08t017450),6個擬南芥基因(AT1G19890,AT5G10980,AT5G 43250,AT1G09030,AT2G47810,AT2G13570);ClassⅡ包含了4個玉米基因(ZmLEC1-3,ZmLEC 1-10,ZmLEC1-13,ZmLEC1-16)、2個水稻基因(Os02t0725700,Os06t0285200)、2個擬南芥基因(AT1G21970,AT5G47670);ClassⅢ中包含了2個玉米基因(ZmLEC1-1,ZmLEC1-4)、2個水稻基因(Os03t0413000,Os07t0606600)、3個擬南芥基因(AT4G14540,AT5G47640,AT1G07980);ClassⅣ包含了6個玉米基因(ZmLEC1-2,ZmLEC1-5,ZmLEC1-9,ZmLEC1-12,ZmLEC1-14,ZmLEC1- 15)、3個水稻基因(Os05t0573500,Os01t 0834400,Os05t0463800)、3個擬南芥基因(AT2G37060,AT3G53340,AT2G38880)。
2.6? ?玉米LEC1基因表達模式分析
為研究玉米LEC1基因在不同組織和不同脅迫下的特異性表達情況,對玉米轉錄組數據庫的數據進行分析。結果發現(圖8),基因ZmLEC1-12在根中的表達量均高于其他組織,ZmLEC1-15在葉中表達量最高,ZmLEC1-7在種子和胚乳中表達量最高。環境對植物的生長發育有著很大的影響,其中鹽害,高溫,低溫等都可能會導致玉米生長發育受到損傷。由分析結果可看出,玉米ZmLEC1-1、ZmLEC1-7、ZmLEC1-12、ZmLEC1-15這4個基因比較容易受到脅迫影響,其中ZmLEC1-12在鹽害脅迫下轉錄水平增高了9倍。
3? ?結論與討論
通過生物信息學分析共得到玉米ZmLEC1-1~16,其不均勻分布在9條染色體上。玉米LEC家族具有保守的蛋白結構域,除ZmLEC1~9以外,ZmLEC1蛋白均為酸性的不穩定親水蛋白,含有1個保守結構域CBFD_NFYB_HMF及10個保守基序。通過與擬南芥LEC1基因和水稻LEC1基因的聚類分析,將玉米LEC1基因家族分為4類:ClassⅠ、ClassⅡ、ClassⅢ、ClassⅣ。RNA-seq等分析發現,玉米LEC1家族基因具有組織特異性,響應非生物脅迫。啟動分析發現,玉米LEC1基因啟動因子上含有響應激素和非生物脅迫的順式作用元件。玉米LEC1基因在種子、葉片、根、胚乳中均有不同的表達水平,且基因ZmLEC1~12在鹽害脅迫下表達量有明顯的提高。本研究為玉米基因LEC1的功能研究提供依據,也為ZmLEC1基因的后續研究奠定基礎。
LEC1基因參與調控非生物脅迫。劉豪等[12 ]通過熒光定量PCR對小麥LEC1基因在ABA、干旱、高溫脅迫處理后的表達量進行分析,發現ABA處理后的小麥TaLEC1基因表達量上升,干旱和高溫脅迫下小麥TaLEC1基因在脅迫初期急劇上調表達,原因很有可能是在小麥受到高溫和干旱影響時,ABA發揮作用使小麥脫水率降低。同樣通過熒光定量PCR實驗發現花生LEC1基因對干旱、鹽害、低溫脅迫有明顯的響應[13 ]。通過生物信息學分析啟動子作用元件發現,LEC1基因還可能參與茉莉酸甲酯、生長素、水楊酸、赤霉素等依賴的脅迫響應。人們通過不同耕作方式和研究響應機理來豐富玉米品種資源[14 ]。
生長環境對作物的生長發育有很大的影響,鹽害是影響我國玉米產量的主要因素之一。鹽害是指土壤含鹽過多,土壤溶液滲透壓過高引起植物生長發育不良的現象。玉米對鹽的承受量最高在0.0017 mol/L左右,土壤鹽害高度影響玉米的生長、發育及產量[15 ]。玉米遭受到鹽害影響時會使胞內滲透壓失衡,導致細胞質壁分離[16 ]、離子失衡、植株失水[17 ]、細胞器的功能喪失[18 ],導致玉米植株死亡。本研究發現,基因ZmLEC1-7在受到鹽害脅迫時高度表達,表明ZmLEC1-7基因可能在鹽害脅迫方面起著重要作用。
參考文獻:
[1] LOTAN T,OHTO M A,YEE K M,et al.? Arabidopsis LEAFY COTYLEDON1 is sufficient to induce embryo development in vegetative cells[J].? Cell,1998,93(7):1195-1205.
[2] WEST,MAL.? LEAFY COTYLEDON1 is an essential regulator of late embryogenesis and cotyledon Identity in Arabidopsis[J].? The Plant Cell,1994,6(12):1731-1745.
[3] ZHANG S,WONG L,LING M,et al.? Similarity of expression patterns of knotted1 and ZmLEC1 during somatic and zygotic embryogenesis in maize(Zea mays L.)[J].? Planta,2002,215(2):191-194.
[4] YAZAWA K, TAKAHATA K, KAMADA H.? Isolation of the gene encoding Carrot leafy cotyledon1 and expression analysis during somatic and zygotic embryogenesis[J].? Plant Physiology and Biochemistry,2004,42(3):215-223.
[5] 李愛芹,夏? ?晗,王興軍,等.? 花生LEC1基因的克隆及表達研究[J].? 西北植物學報,2009,29(9):1730-1735.
[6] 樊可心,曹愛萍,張文婷,等.? 棉花G. LEC1A基因的克隆和鑒定[J].? 石河子大學學報(自然科學版),2015,33(5):535-540.
[7] MU J,TAN H,ZHENG Q,et al.? LEAFY COTYLEDON1 is a key regulator of fatty acid biosynthesis in Arabidopsis[J].? Plant physiology,2008,148(2):1042-1054.
[8] BO SHEN,WILLIAM B ALLEN,PEIZHONG ZHENG,et al.? Expression of ZmLEC1 and ZmWRI1 Increases Seed Oil Production in Maize[J].? Plant Physiology, 2010,153(3):980-987.
[9] ELAHI N,DUNCAN R W,STASOLLA C.? Modification of oil and glucosinolate content in canola seeds with altered expression of Brassica napus LEAFY COTYLEDON1[J].? Plant Physiology and Biochemistry,2016,
100:52-63.
[10] 南彩霞,張南冰,鄧喆元.? 玉米新品種強碩168選育報告[J].? 甘肅農業科技,2019(4):1-4.
[11] 連彩云,馬忠明.? 玉米種子活力研究綜述[J].? 甘肅農業科技,2019(5):64-68.
[12] 劉? ?豪,王艷麗,孟曉丹,等.? 小麥TaLEC1基因的克隆及其表達特性分析[J].? 西北植物學報,2019,
39(5):904-910.
[13] 席旭東,常? ?宏,車? ?卓,等.? 6個玉米新品種在定西旱作農業區的引種初報[J].? 甘肅農業科技,2019(7):61-65.
[14] 潘麗娟,王? ?冕,蘇茂文,等.? 花生轉錄因子LEC1的表達特性分析[J].? 花生學報,2021,50(2):15-20.
[15] 李? ?明,冷冰瑩,張晗菡,等.? 鹽脅迫下調控玉米胞內Na+/K+比穩定的主要機制與措施[J].? 山東農業科學,2021,53(6):133-138.
[16] RANA,MUNNS,MARK,et al.? Mechanisms of salinity tolerance[J].? Annual Review of Plant Biology,2008,
59:651-681.
[17] ZHAO Y,LIU M,HE L,et al.? A cytosolic NAD+-dependent GPDH from maize (ZmGPDH1) is involved in conferring salt and osmotic stress tolerance[J].? BMC Plant Biology,2019,19(1):16. https://doi.org/10.118 6/s12870-018-1597-6.
[18] 武? ?燕,解丹丹,馬小亭,等.? 外源Ca2+對鹽脅迫下玉米幼苗生理指標的影響[J].? 安徽農業科學,2014,
42(12):3471-2472.