申序 陳曉慧 徐小萍 霍雯 李曉斐 蔣夢琦 張婧 林玉玲 賴鐘雄



摘 ?要??SET domain group(SDG)基因家族控制的組蛋白賴氨酸甲基化,是參與染色質功能調控和表觀遺傳調控基因表達的重要部分。為了解龍眼(DlSDG)家族的生物學功能,采用生物信息學分析方法進行龍眼全基因組SDG家族成員的鑒定,并對蛋白質結構域、保守基序、基因結構、啟動子順勢作用元件、進化樹、相關基因的蛋白互作和體胚發生早期的基因表達情況進行預測和分析。結果顯示,龍眼SDG家族基因包括32個成員,分為Suv、Ash、ATXR5/ATXR6、Trx、E(z)、SMYD和SETD 7個亞家族,其中Suv亞族成員數量最多;外顯子數量在1~22個不等,蛋白結構域保守,都含有一個SET結構域,DlSDG蛋白保守motif不同亞家族間差異較大;DlSDG啟動子包含許多諸如低溫、干旱和壓力等非生物脅迫響應元件和激素響應元件;龍眼SDG成員在體胚發生早期均能不同程度表達,其中DlSUVR4b在EC和ICpEC階段可能發揮著較為重要的作用;DlSUVH4可以和DNA甲基轉移酶MET1發生互作。本研究表明,龍眼DlSDG32個組蛋白賴氨酸甲基轉移酶基因可能除了在生物鐘的調節、植物發枝數量、根的生長發育、種子的萌發、花的發育和植株的形態建成等方面發揮重要功能外,也可能直接參與脅迫響應和體細胞胚胎發生的調控,并且還可能在參與DNA甲基化、染色質重塑的過程中形成體細胞胚胎發生的協作調控網絡,表現其具有功能上的多樣性、復雜性。
關鍵詞 ?龍眼;組蛋白賴氨酸甲基轉移酶;成員鑒定;功能分析;表觀遺傳中圖分類號??S667.2??????文獻標識碼??A
Genome-wide Identification and Expression Analysis of SDG?Gene Family During Early Somatic Embryogenesis in Dimocarpus longan Lour.
SHEN Xu, CHEN Xiaohui, XU Xiaoping, HUO Wen, LI Xiaofei, JIANG Mengqi, ZHANG Jing, LIN Yuling, LAI Zhongxiong*
Institute of Horticultural Biotechnology, Fujian Agriculture and Forestry University, Fuzhou, Fujian?350002, China
Abstract ?The SET domain group (SDG) gene family controls histone lysine methylation, which is an important part of the regulation of chromatin function and epigenetic regulation of gene expression. To understand the biological function of longan (DlSDG) family, the wholeSDGfamily members of longan genome were identified by bioinformatics analysis, and the protein domain, conserved motif, gene structure, promoter homeopathic elements, evolutionary tree, protein interaction of related genes and gene expression at the early stage of somatic embryogenesis were predicted and analyzed. There were 32 members of longanDlSDGgene family, which could be divided into seven subfamilies,Suv,Ash,ATXR5/ATXR6,Trx,E(z),SMYDandSETD, andSuvhad the largest subfamily members. The number of exons varied from 1 to 22, and protein domains were conserved, all containing a SET?domain. DlSDG protein conserved motif had large differences among different subfamilies.DlSDGpromoters contained many abiotic stress response elements such as low temperature, drought, stress and hormone response elements.SDGmembers could be expressed to different degrees in the early stage of somatic embryogenesis.DlSUVR4bmight play an important role in EC and ICpEC stages. DlSUVH4 could interact with DNA methyltransferase MET1. The study showed that the longanDlSDG32 histone lysine methylation transferase genes maight directly involved in the regulation of stress response and somatic embryogenesis, possibly in DNA methylation, chromatin remodeling, formation in the process of somatic embryogenesis of collaborative control network in addition to the regulation of the circadian clock, branch number, root growth and development, seed germination, the growth of flowers and plants of morphogenesis with diversity and complexity.
Keywords ?longan; histone lysine methyltransferase; identification of members; functional analysis; epigenetic
DOI10.3969/j.issn.1000-2561.2019.10.002
在植物表觀遺傳學快速的發展背景下,植物組蛋白修飾作為重要的表觀遺傳調控手段已日益成為研究的熱點。組蛋白修飾同DNA甲基化、染色質重塑和非編碼RNA調控一樣是表觀遺傳調控的重要機制之一。真核生物中基因組DNA和組蛋白組裝在一起形成染色體。首先,組蛋白H2A、H2B形成二聚體,H3、H4形成四聚體,而染色質的核心組成單位八聚體由2個H2A、H2B二聚體和1個H3、H4四聚體組成,經146 bp的DNA纏繞形成染色體的基本組成單元核小體[1-3]。作為調控核小體結構的主要方式,組蛋白翻譯后修飾主要包括甲酰化(Formylation)、乙?;ˋcetylation)、甲基化(Methylation)、磷酸化(Phosphorylation)、泛素化(Ubiquity lation)、抑制基因表達的SUMO(small ubiquitin-like modifier modification,SUMOylation)化、ADP(ADP-ribosylation)核糖基化等修飾方式[4-7],且多發生在N端,多種組蛋白修飾結合與排列在一起構成了組蛋白密碼[8],組蛋白與組蛋白、組蛋白與DNA的互作受到組蛋白密碼的影響從而調控基因的轉錄與表達[9]。組蛋白甲基化修飾是最為復雜的植物組蛋白修飾方式,表現出修飾位點多樣性和不同程度的修飾。植物組蛋白賴氨酸甲基化共價修飾主要依賴賴氨酸甲基轉移酶來完成,含有SET結構域的SDG(SET domain group)是植物中唯一存在的具有組蛋白甲基轉移酶活性的蛋白家族。賴氨酸甲基轉移酶(histone lysine mathylatransferases,HKMTs)是兩類組蛋白甲基轉移酶的一大類,在植物中共發現17個組蛋白賴氨酸甲基化位點和7個精氨酸甲基化位點。組蛋白甲基化常發生在組蛋白H3、H4的賴氨酸(K)和精氨酸(R)的殘基上,賴氨酸殘基上發生最為常見。組蛋白賴氨酸甲基化修飾主要通過改變賴氨酸殘基甲基化狀態和程度,介導轉錄沉默與染色質的活化而不改變修飾位點攜帶的電荷量,從而提高組蛋白疏水性,改變組蛋白分子內部和分子間的相互作用,也可通過含有識別甲基化信號特定結構域的閱讀器來實現[10]。組蛋白賴氨酸甲基化可以發生單甲基化、雙甲基化和三甲基化3種不同程度的甲基化形式,其甲基化程度可以通過賴氨酸甲基轉移酶和賴氨酸去甲基轉移酶調控維持動態平衡[10]。H3和H4組蛋白中分別有5個(K4、K9、K27、K36、K79)賴氨酸殘基和1個(K20)賴氨酸殘基可被甲基化。一般H3K4、H3K36和H3K79甲基化通常和參與基因轉錄的激活有關,H3K9、H3K27和H4K20甲基化則和參與基因的轉錄抑制相關[11]。
組蛋白賴氨酸甲基轉移酶在植物的生長發育中發揮著重要作用。組蛋白賴氨酸甲基化可以通過調控春化途徑從而參與開花、促進花粉發育的過程[12-13];還可以參與啟動植物種子萌發、調節根的生長發育、調節生物鐘以及與擬南芥的發枝數量等[14-17]。組蛋白賴氨酸甲基化能夠介導植物體細胞胚胎發生相關基因的表達,從而參與對體細胞胚胎生長發育過程的調控,并且植株的形態建成等完整生命過程均有組蛋白甲基化修飾的參與[18]。此外,組蛋白賴氨酸甲基轉移酶常通過調控基因的表達而參與各種脅迫應答反應。綜上,提示組蛋白賴氨酸甲基化幾乎參與了植物生長發育的所有過程。
龍眼(Dimocarpus longanLour.)是我國重要的熱帶、亞熱帶常綠木本果樹,果實富含蛋白質、氨基酸、類黃酮和多酚多種物質,營養價值和藥用價值極高[19],其胚胎發育情況很大程度上影響果實產量、品質和可食用率,但在龍眼生長發育的過程中仍然存在核大、可食率低的問題。賴鐘雄等[20-21]以龍眼幼胚為材料建立了龍眼松散型胚性愈傷組織系,進行長期保持,并以此為基礎開展了大量與龍眼體細胞胚胎發生相關的研究。但在龍眼體細胞胚胎發生的進程中關于組蛋白賴氨酸甲基轉移酶的研究未見報道。據其他植物研究報道,組蛋白賴氨酸甲基轉移酶基因MEA在胚胎和胚乳中表達,并通過基因組印跡參與胚胎和胚乳的發育[22-23]。因此,鑒于SDG在高等植物尤其是木本果樹胚胎發育過程中潛在的生物學功能,進一步的分析鑒定很有必要。在本實驗室龍眼基因組破譯的基礎上,基于基因組開展龍眼體胚發生早期組蛋白賴氨酸甲基轉移酶基因家族的生物學功能研究,不僅對龍眼生物技術的發展具有極大的意義,也對無患子科甚至所有木本植物體胚發生過程中組蛋白甲基轉移酶的研究具有重要借鑒意義。
1.1材料
采用本實驗室最新精確組裝的龍眼基因組及全轉錄組數據庫(待發表)進行分析。擬南芥(Arabidopsis thaliana)、甜橙(Citrus sinensis)基因序列、氨基酸序列下載于https://phytozome.?html;水稻(Oryza sativa)氨基酸序列下載于Rice Annotation project Database(RAP-DB)[24]。
1.2 方法
1.2.1 ?龍眼DlSDG基因家族成員鑒定??為對龍眼DlSDG家族進行鑒定,首先選取模式植物擬南芥SDG氨基酸序列,經龍眼數據庫同源比對,結合NCBI Blast分析,初步篩選確定37條具有完整開放閱讀框的龍眼DlSDG候選序列。采用DNAMAN 6.0進行gDNA、CDS、氨基酸序列比對,其中Dlo032596、Dlo027491注釋一樣,經DNAMAN同源比對,Dlo032596、Dlo027491的CDS序列Identity為52.51%,氨基酸為42.38%,視為2條基因,分別命名為SUVH4a、SUVH4b;Dlo020952、Dlo020987的氨基酸同源比對顯示Identity為97.43%,CDS為97.96%,且5?端完全重合,選取Dlo020952進行后續分析;Dlo014820、Dlo034485的氨基酸和CDS同源比對顯示Identity均為100%,后續選取Dlo014820進行分析。結合SMART(http://smart.embl-heidelberg.de)和Pfam結構域預測分析和Softberry基因全長預測分析,最終確定了龍眼基因組中存在32條DlSDG序列。
1.2.2 ?龍眼DlSDG基因染色體定位與進化樹構建??根據擬南芥SDG成員在龍眼基因組中的查找注釋,參考擬南芥的命名方法對龍眼DlSDG基因家族成員進行命名。采用MEGA7的ClustalW對32個DlSDG基因家族成員氨基酸序列進行多序列比對分析,用進化樹構建軟件的Neighbor-?joining method臨近法對龍眼、擬南芥、水稻、甜橙4個物種140條SDG基因家族成員的氨基酸序列進行系統進化樹構建,Bootstrap值設置為1000。采用TBtools[25]進行龍眼SDG基因染色體位置示意圖繪制。
1.2.3 ?龍眼DlSDG基因結構及蛋白結構域分析??采用TBtools[25]軟件,利用龍眼gff文件和genome文件對龍眼DlSDG家族32個成員進行基因結構預測和分析;采用ExPASy對32條DlSDG氨基酸序列進行蛋白的等電點(pI)、分子量(Mw)、氨基酸數目等數據的分析;通過MEME(multiple expectation maximization for motif elicitafion)(http://meme-suite.org/tools/meme)進行龍眼DlSDG的保守基序分析,采用TBtools的可視化分析與motif圖片繪制。采用SMART和Pfam對龍眼DlSDG進行蛋白結構域在線預測,利用TBtools進行蛋白結構域示意圖繪制。
1.2.4 ?龍眼DlSDG啟動子分析??采用TBtools進行龍眼DlSDG基因起始密碼子ATG上游2000 bp序列的提取。采用PlantCARE(http://bioinform a
tics.psb.ugent.be/webtools/plantcare/html/)網站在線預測分析龍眼DlSDG不同成員的啟動子特征和順勢作用元件功能特點,采用TBtools進行可視化繪圖。
1.2.5 ?龍眼DlSDG成員蛋白互作預測分析??利用STRING(https://string-db.org)網站進行蛋白質互作預測、利用k均值聚類算法進行4個聚類分析,選用研究最深入的擬南芥作為參考,最低互動評分要求選擇highest confidence(0.900)探究DlSDG成員自身之間、與其他蛋白之間的互作情況。
1.2.6 ?龍眼DlSDG家族體胚發生早期階段表達分析??為更深入的了解DlSDG在體細胞胚胎和不同組織器官中可能具有的功能特點,利用龍眼轉錄組數據庫提取DlSDG基因在不同體胚發生階段胚性愈傷組織(EC)、不完全胚性緊實結構(IcpEC)、球形胚(GE)特異表達的FPKM值,分析家族各成員的表達情況。利用TBtools繪制表達熱圖。
2.1龍眼DlSDG家族基因鑒定與蛋白特性分析
在龍眼中獲得了32個SDG家族成員。通過NCBI Blast雙向比對,與模式植物擬南芥、單子葉子植物水稻和木本果樹甜橙家族成員進行系統進化分析,將其命名情況見表1。SDG家族蛋白特性分析發現,該基因家族氨基酸長度相差較大,有336~2426?aa,大部分在1000 aa以下,蛋白分子量在36.33~275.37 ku之間,等電點(pI)為4.82~9.05(表1)。
2.2龍眼DlSDG家族基因染色體定位分析
DlSDG家族基因染色體定位預測發現,賴氨酸甲基轉移酶家族基因成員能精確定位在組裝好的染色體上,在龍眼基因組組裝好的15條染色體中,染色體3、10、12沒有DlSDG成員分布(圖1)。DlSDG基因在染色體上分布不均勻,其中1、5、6、7、9、13、15號染色體均分布3個以上的賴氨酸甲基轉移酶家族成員,以6號染色體最多,存在6個成員的分布,4、11、14號染色體最少,均只有1個成員分布。為分析DlSDG基因家族成員數量的龐大是否因為基因的串聯重復導致,參考Huang等[26]的方法進行串聯重復分析,結果表明DlSDG家族成員無串聯復制現象存在(表1)。
2.3龍眼DlSDG基因結構與蛋白結構域分析
為進一步了解龍眼組蛋白賴氨酸甲基轉移酶SDG基因家族成員的生物學功能,對32條基因的結構進行內含子、外顯子的數目及位置進行分析(圖1)。結果表明,所有SDG基因中有15條基因序列完整,具有基因結構的上下游,4條基因序列具有上游或下游,13條序列缺少完整上下游。DlSDG內含子數為1~22個之間,內含子第1個均落在成熟編碼序列內部,有利于將信號序列與編碼序列整齊地分開。基因結構圖明顯看出,龍眼賴氨酸甲基轉移酶SDG基因家族成員基因長度存在較大的差異,可能是內含子數量差異較大的原因,同時也可能影響其基因功能的分化。
為了解龍眼DlSDG基因家族的蛋白保守基序特點和分布情況,通過MEME軟件搜索出15個保守motif(圖2)。由圖2可知,整個龍眼SDG基因家族中最為保守的基序是motif2,所有32個成員中只有DlSUVH1缺少該保守基序,其次是motif1和motif3,均有27個成員具有這2個保守基序,大多數基因還具有motif4和motif7。進化分析可以看出,同一個分支上的保守基序位置大致相同,這可能與它們功能的保守性有關。
SMART和Pfam蛋白結構域預測分析,DlSDG家族均屬于含SET結構域超家族賴氨酸甲基轉移酶活性的蛋白??傮w而言,DlSDG家族成員均至少含有1個SET結構域,其中E(z)亞族的DlCLF蛋白最為特殊,含有3個SET結構域,且為間斷排列,多數SET結構域位于SET結構域蛋白的末端,少數位于SET結構域蛋白的前端和中部。圖3結構域分析顯示,主要包括8個組別,分別為:含PreSET和SET結構域的DlSUVH和DlSUVR;含有AWS、SET和PostSET的DlASHR3、DlASHH2,DlATXR7與其結構域最為相似,歸為同一類;含有2個及以上PHD和1個SET結構域的DlATX2、DlATX3、DlATX5;含有1個PHD和1個SET結構域的DlATXR5;含有特殊SANT結構域的DlSWN和DlCLF;2條含有AWS和SET的短序列DlASHH1和DlASHH3;只含有1個結構域的DlASHR1、DlASHR2、DlATXR1、DlATXR2、DlATXR3、DlATXR4、DlSDG41和DlSETD10;以及含Rubis-subs-bind和SET的DlSDG40和DlSETD3。
2.4植物SDG家族的系統進化樹分析
為更深入的了解龍眼DlSDG家族的生物學功能,采用MEGA7對擬南芥、水稻、甜橙和龍眼4個物種140條氨基酸序列進行系統進化樹的構建(圖4)。參考擬南芥、水稻中基因的分類,并結合聚類分析,大致可以將龍眼DlSDG家族分為7類。第1類為Suv中的DlSUVH1、DlSUVH3、DlSUVH4a、DlSUVH4b、DlSUVH6、DlSUVH9以及DlSUVR2、DlSUVR3、DlSUVR4a、DlSUVR4b、DlSUVR5;第2類為Ash中的DlASHH1、DlASHH2、DlASHH3、DlASHR3;第3類主要包括DlATXR5;第4類為Trx中的DlATX5、DlATX3和DlATX2;第5類主要包括E(z)中的DlSWN和DlCLF;第6類主要包括SMYD中的DlATXR1、DlATXR2、DlATXR3、DlATXR4、DlASHR2;第7類主要為SET domain contain protein?(SETD),包括DlSDG41、DlSDG40和SETD3、SETD10。
2.5龍眼DlSDG基因家族啟動子分析
為進一步的分析龍眼DlSDG家族基因啟動子的功能,通過PlantCARE在線預測分析DlSDG基因的啟動子順式作用元件發現(圖5),DlSDG
家族成員啟動子序列均含有較多的CAAT-box和TATA-box,說明家族DlSDG基因均能進行正常的轉錄。所有龍眼DlSDG家族基因啟動子含有較多的光響應、厭氧誘導響應元件,90%以上基因啟動子含有茉莉酸甲酯激素應答元件,50%基因啟動子含有乙烯、水楊酸和赤霉素應答元件,少數基因響應脫落酸和生長素應答。此外,DlSDG家族基因還響應低溫、干旱、脅迫、種子特異調控和胚乳表達元件,提示DlSDG家族基因可能在抗逆、耐寒、種子生長和胚胎成熟發育過程中發揮重要的作用。
2.6龍眼DlSDG家族蛋白互作網絡預測
利用String蛋白互作在線數據庫對32個DlSDG蛋白成員之間的功能關系進行預測(通過擬南芥與甜橙、楊樹互作結果比對,選擇研究較為深入的擬南芥作為模式植物,圖6)。蛋白互作聚類預測顯示,綠色和黃色區域的蛋白質間互作關系強,SDG家族除自身成員之間會發生互作之外,還會與其他蛋白互作。SDG家族主要有ASHH1、EFS(ASHH2)、ATXR5、ATXR6互作和SWN、CLF、MEA之間的互作。說明這兩組基因之間功能的關聯性強。
2.7龍眼DlSDG家族基因組織特異表達分析
結合龍眼3代轉錄組數據庫注釋中不同體胚發生階段的FPKM值,制作聚類分析熱圖(圖7)。結果表明:在不同體胚發生過程中,大致有4種表達模式:GE階段上調,EC和ICpEC階段下調(DlSUVH4b、DlATXR7、DlSWN、DlCLF);EC階段上調,GE和ICpEC階段下調(DlASHH2、DlATXR2、DlASHR2、DlSDG40);ICpEC階段上調,GE和EC階段下調(DlSUVH1、DlSUVH3、DlSUVH9、DlSUVH4a、DlSUVR5、DlASHR3、DlATX2、DlATXR5);EC和ICpEC階段上調,GE階段下調(DlSUVH6、DlSUVR2、DlSUVR3、DlSUVR4a、DlSUVR4b、DlASHR3、DlATX2、DlASHH2、DlATXR4、DlASHR1、DlATXR1、DlASHH1、DlSETD10、DlSETD3、DlSDG41)??傊?,龍眼賴氨酸甲基轉移酶家族在體胚發生不同階段均發生不同程度的表達,總體來看,與EC和ICpEC階段相比,大部分龍眼SDG家族成員在GE中表達較低,其中DlSUVR4b在EC和ICpEC中出現高表達,DlCLF較EC和ICpEC相比,在GE中高表達,可能預示著DlSUVR4b在EC和ICpEC中、DlCLF在GE中發揮著較為重要的作用。
3??討論
3.1龍眼組蛋白甲基轉移酶家族成員可能具有功能上的多樣性
組蛋白賴氨酸甲基轉移酶介導組蛋白的賴氨酸甲基化共價修飾的完成,絕大多數含有一個具有甲基轉移活性,130~150個氨基酸的SET保守結構域。在擬南芥、水稻和玉米中至少有47、37和35個SDG基因[27],其他在葡萄和楊樹中有報道[28-29],關于無患子科植物組蛋白甲基轉移酶SDG家族的研究尚未見報道。系統進化分析將含有SET結構域的龍眼組蛋白甲基轉移酶基因分為7個大類。鑒定龍眼基因組有32個完整SET結構域的SDG成員,少于擬南芥的47個、水稻的35個,可能是因為DlSDG在龍眼基因組中無串聯重復或染色體片段復制導致的基因復制相對較少有關。與之前的研究相似,系統發育分析將龍眼SDG基因分為了7個主要的類群[27,30](圖4)。近年來的研究揭示,擬南芥組蛋白甲基轉移酶ATX1可通過調節水楊酸(salicylic acid,SA)和茉莉酸(jasmonic acid,JA)信號途徑的關鍵轉錄因子WRKY70啟動子的H3K4的甲基化,來激活WRKY70,進而上調水楊酸信號途徑基因PR1的表達以及下調茉莉酸信號途徑基因THI2.1的表達,參與到擬南芥對假單胞菌(PstDC3000)侵染的防御反應[31-32]。植物病原抵御基因能夠被轉錄激活標志H3K36me3修飾誘導并大量表達,從而抵御病菌的侵害[33]。也有研究顯示ASHH2通過介導ERF1、MYC2、PDF1.2a和VSP2等JA/ET信號途徑基因位點,誘導這些基因的快速轉錄,增強擬南芥對真菌(黑斑病菌和灰霉病菌)的抗性[33]。這些研究表明H3K36甲基化修飾正調控植物對細菌及真菌的防御反應。在龍眼中沒有鑒定出ATX1基因,但鑒于SDG亞族間功能上有冗余性的特點,龍眼中與ATX1結構域相似的DlATX2、DlATX3和DlATX5具有同DlASHH2一樣抵御病原菌侵害的潛在功能。SDG基因還參與了花粉的發育、根的生長發育、種子萌發、生物鐘的調節等生物過程[14-17]和控制擬南芥根尖分生組織和靜止中心的細胞分裂[34]。
結合蛋白結構域分析,龍眼SDG同其他植物一樣都具有保守的SET結構域。E(z)亞家族在擬南芥中包括CURLYLEAF(CLF)、MEDEA(MEA)和SWINGER(SWN)3個成員,除SET結構域外,還含有SWl3、ADA2、NCoR、TFIIIBDNA. Binding(SANT)和cysteine. rich(CXC)2種結構域,龍眼E(z)家族的DlSWN和DlCLF 2個成員均含有SANT結構域,只有DlCLF還含有CXC,可能龍眼dlswn與擬南芥atswn功能存在差異。Trx亞家族中ATXR7不含有除SET和PostSET以外的結構域,其他成員的PHD結構域是一類含類C4HC3型鋅指基序結構域的統稱,具有與DNA、RNA、蛋白質、組蛋白共價修飾等多種生物大分子結合的能力,同一個蛋白質上的不同PHD結構域,甚至同一PHD結構域的不同基序都可能具有識別不同生物大分子的功能[35];PWWP結構域可以特異地與甲基化的賴氨酸殘基結合[36];可能龍眼中DlATX2、DlATX3、DlATX5具有識別生物大分子并結合形成復合物發揮相關功能。此外FYRN和FYRC結構域存在于染色質相關的蛋白質中,具體功能未知[37],DlATX2具有完整的FYRN和FYRC結構域,暗示其可能與染色質生物學功能有關。Suv亞家族是SDG中最大的亞族,可以細分Suvhomologs(SUVH)亞族和Suv-related homolog(SUVR)亞族。SUVH亞族成員含有一個保守的SET和RING finger associated(SRA)結構域,可以特異地與DNA序列中甲基化的胞嘧啶結合[38],暗示龍眼DlSUVH可能與DNA甲基化共同參與某一生物學問題。研究證明SMYD亞家族的AtASHRl與H3K4me2甲基化相關[39],研究認為SETD亞家族成員不作用于組蛋白的甲基化[27]。
3.2龍眼DlSDG可能影響體細胞胚胎發生的進程
在植物中,組蛋白賴氨酸甲基轉移酶直接參與體細胞胚胎發生的研究報道很少。已見報道E(z)家族的MEA在胚胎和胚乳中表達,參與胚胎和胚乳的發育。對于同亞族SWN,有報道稱萌發后的clf和swn雙突變體中有LEC1異位表達[40]。也有報道表明SWN與MEA存在功能冗余,SWN突變增強了MEA突變體的胚胎致死性[41]。SWN可能抑制與胚胎發生無關的基因,并且是營養階段抑制LEC1的重要因子。在鑒定的龍眼組蛋白賴氨酸甲基轉移酶SDG家族中,存在2個E(z)家族成員DlSWN和DlCLF成員,且在龍眼早期胚胎發生GE階段上調表達,表明龍眼DlSWN和DlCLF可能直接參與植物體細胞胚胎發育進程。
組蛋白修飾酶是參與染色質重塑最重要的因子[42]。在擬南芥中,已經證實了染色質重塑與體細胞胚胎之間發生的關系,據報道,一種染色質重塑因子PICKLE(PKL)影響胚胎特異性基因的表達,如擬南芥中的LEC1[43]。許多研究報道證明,組蛋白甲基化在表觀遺傳控制基因的表達和染色質重塑與包裝方面發揮著重要的作用[44],尤其是在分化方面[45]。越來越多證據表明植物體胚發生過程中基因表達的時空特異性除了受特異的DNA序列控制,一定程度的DNA甲基化有利于植物體細胞胚胎的正常發育[46]。對擬南芥MET和CMT3(維持甲基化酶)無效等位基因的突變體進行研究,發現其胚胎無法正常發育且生活力下降,且胚胎發育相關的基因未出現表達,說明DNA甲基化對擬南芥的胚胎發生起著非常關鍵的作用[47]。早期的研究發現,H3K9甲基化對DNA甲基化是必須的,對擬南芥kyp(suvh4)突變株功能分析證實了這一關系,和cmt3的突變體相似,kyp突變體中CNG區域的DNA甲基化水平降低[48],表明CMT3介導的DNA甲基化位于H3K9甲基化的下游。另外的研究表明CMT3的Chromo結構域可以與K9和K27同時被甲基化的組蛋白H3K9K27的N-端結合[49],表明H3K9和H3K27甲基化可能共同形成了被CMT3識別的信號導致CNG的甲基化。這些研究表明,組蛋白賴氨酸轉移酶可能通過參與染色質重塑和DNA甲基化來影響體細胞胚胎發生基因的表達,從而對體細胞胚胎的生長發育進程產生重要的影響。在龍眼基因組中鑒定出32個組蛋白賴氨酸甲基轉移酶,表達分析提示組蛋白賴氨酸甲基轉移酶可能在參與DNA甲基化和染色質重塑與組裝的過程中對體細胞胚胎發生的進程產生重要的影響,也可能通過形成DNA甲基化、組蛋白修飾和染色質重塑更為復雜的調控網絡,協同參與體細胞胚胎生長發育的調控。蛋白質互作預測也顯示出SDG家族成員MEA、CLF、SWN、SUVH4與DNA甲基轉移酶MET1之間具有互作關系,進一步說明組蛋白賴氨酸甲基轉移酶可能通過與DNA甲基化和染色質重塑關聯參與植物體細胞胚胎調控。
3.3龍眼DlSDG可能響應非生物脅迫
龍眼SDG家族順勢作用元件分析(圖5)發現,除DlSUVH3、DlSUVH4a、DlSUVR3、DlSUVR4b、DlASHR3、DlATXR2、DlATXR5、DlSWN、DlASHH3、DlASHR1、DlASHH1、DlASHR2、DlSETD3、DlSDG40、DlSDG41以外啟動子均含有低溫響應元件,9個成員DlSUVH1、DlSUVR2、DlSUVR4a、DlSUVR4b、DlASHR3、DlATXR7、DlATX3、DlATXR1、DlASHH1預測到干旱脅迫響應元件,還有DlSUVH1、DlSUVH3、DlSUVH9、DlSUVR3、DlSUVR4a、DlASHR3、DlASHH2、DlATXR2、DlASHR1、DlATXR1、DlASHH1、DlSDG40、DlSDG41、DlSETD3共14個成員具有抵御和壓力脅迫響應元件,預示龍眼中SDG家族可能與龍眼干旱、低溫和鹽脅迫等非生物脅迫響應有關。組蛋白賴氨酸甲基化共價修飾在響應低溫、干旱脅迫、鹽脅迫和生物脅迫等方面具有一定的作用,而與高溫脅迫響應無密切關系[50]。在干旱條件下,ABA合成關鍵酶NINE-CIS-EPOXYCAROTENOIDDIOXYGENASE3(IVCED3)基因座能特異結合ATX1,上調其表達,ABA依賴的干旱響應信號通路被啟動;同時也上調表達RESPONSIVETODESICCATION?29A(RD29A)和RD29B等基因,參與其他干旱響應信號通路[51-52]。多次干旱處理,RD29B和RESPONSIVETOABA18(RABl8)等基因的基因座上H3K4me3水平在水分充足的情況下同樣維持在較高水平,表明ATXl參與了干旱脅迫的記憶過程[53]。CLF引導的H3K27me3同樣參與了干旱脅迫過程,但并不形成脅迫記憶[54]。龍眼SDG中未能鑒定到ATX1賴氨酸甲基轉移酶基因,有一個CLF基因,鑒于同一家族結構保守和可能存在功能冗余性,除上述具有干旱、低溫和壓力脅迫響應的基因外,龍眼SDG家族中DlATX2、DlATX5和DlCLF也可能具有抗旱、抗寒和耐鹽脅迫的潛在功能。此外,ASHH2也被證明在重復的機械刺激造成的對觸碰誘導基因TOUCH3(TCH3)的脅迫記憶中發揮作用[55],順式作用響應元件分析表明,龍眼DlASHH2可能具有這方面的功能。
參考文獻
[1]Kornberg R D. Chromatin structure: a repeating unit of histones and DNA[J]. Science, 1974, 184(4139): 868-871.
[2]?Luger K, M?der A W, Richmond R K,et al.Crystal structure of the nucleosome core particle at 2.8 ? resolution[J]. Nature, 1997, 389(6648): 251-260.
[3]?Wolffe A P, Guschin D. Chromatin structural features and targets that regulate transcription[J]. Journal of Structural Biology, 2000, 129(2-3): 102-122.
[4]?Sura?W, Kabza M, Karlowski W M,et al.Dual role of the histone variant H2A. Z in transcriptional regulation of stress-response genes[J]. The Plant Cell, 2017, 29(4): 791-807.
[5]?Strahl B D, Allis C D. The language of covalent histone modifications[J]. Nature, 2000, 403(6765): 41-45.
[6]?Zhang Y, Reinberg D. Transcription regulation by histone methylation: interplay between different covalent modifications of the core histone tails[J]. Genes & Development, 2001, 15(18): 2343-2360.
[7]?Iizuka M, Smith M M. Functional consequences of histone modifications[J]. Current Opinion in Genetics & Development, 2003, 13(2): 154-160.
[8]?Jenuwein T, Allis C D. Translating the histone code[J]. Science, 2001, 293(5532): 1074-1080.
[9]?Chinnusamy V, Zhu J K. Epigenetic regulation of stress responses in plants[J]. Current Opinion in Plant Biology, 2009, 12(2): 133-139.
[10]?Liu C, Lu F, Cui X,?et al. Histone methylation in higher plants[J]. Annual Review of Plant Biology, 2010, 61(1):?395-420.
[11]?Martin C, Zhang Y. The diverse functions of histone lysine methylation[J]. Nature Reviews Molecular Cell Biology, 2005, 6(11): 838-849.
[12]?Yang H, Mo H, Fan D,et al. Overexpression of a histone H3K4 demethylase, JMJ15, accelerates flowering time inArabidopsis[J]. Plant Cell Reports, 2012, 31(7): 1297-1308.
[13]?Cartagena J A, Matsunaga S, Seki M,?et al. The Arabidopsis SDG4 contributes to the regulation of pollen tube growth by methylation of histone H3 lysines 4 and 36 in mature pollen[J]. Developmental Biology, 2008, 315(2): 355-368.
[14]?Dong G, Ma D P, Li J. The histone methyltransferase SDG8 regulates shoot branching in Arabidopsis[J]. Biochemical and Biophysical Research Communications, 2008, 373(4): 659-664.
[15]?Yao X, Feng H, Yu Y,et al.SDG2-mediated H3K4 methylation is required for proper Arabidopsis root growth and development[J]. PLoS One, 2013, 8(2): e56537.
[16]?Malapeira J, Khaitova L C, Mas P. Ordered changes in histone modifications at the core of theArabidopsis circadianclock[J]. Proceedings of the National Academy of Sciences, 2012, 109(52): 21540-21545.
[17]?Müller K, Bouyer D, Schnittger A,et al.Evolutionarily conserved histone methylation dynamics during seed life-cycle transitions[J]. PLoS One, 2012, 7(12): e51532.
[18]?Alvarez-Venegas R, Pien S, Sadder M,et al.ATX-1, an Arabidopsis homolog of trithorax, activates flower homeotic genes[J]. Current Biology, 2003, 13(8): 627-637.
[19]?Lin Y L, Min J M, Lai R L,et al. Genome-wide sequencing of longan (Dimocarpus longan Lour.) provides insights into molecular basis of its polyphenol-rich characteristics[J]. GigaScience, 2017, 6(5): 1-14.
[20]?賴鐘雄, 陳振光. 龍眼胚性愈傷組織的高頻率體細胞胚胎發生[J]. 福建農業大學學報, 1997(3): 271-276.
[21]?陳春玲, 賴鐘雄. 龍眼胚性愈傷組織體胚發生同步化調控及組織細胞學觀察[J]. 福建農林大學學報(自然科學版), 2002, 31(2): 192-194.
[22]?Autran D, Huanca-Mamani W, Vielle-Calzada J P. Genomic imprinting in plants: the epigenetic version of anOedipus complex[J]. Current Opinion in Plant Biology, 2005, 8(1): 19-25.
[23]?Leroy O, Hennig L, Breuninger H,et al. Polycomb group proteins function in the female gametophyte to determine seed development in plants[J]. Development, 2007, 134(20): 3639-3648.
[24]?Ohyanagi H, Tanaka T, Sakai H,et al.The rice annotation project database (RAP-DB): hub forOryza sativassp. japonica genome information[J]. Nucleic Acids Research, 2006, 34(S1): D741-D744.
[25]?Chen C, Xia R, Chen H,et al. TBtools, a toolkit for biologists integrating various biological data handling tools with a user-friendly interface[J/OL]. BioRxiv, 2018: 289660.?http://dx.doi.org/10.1101/289660.
[26]?Huang S, Gao Y, Liu J,et al. Genome-wide analysis ofWRKYtranscription factors inSolanum lycopersicum[J]. Molecular Genetics and Genomics, 2012, 287(6): 495-513.
[27]?Ng D W K, Wang T, Chandrasekharan M B,et al. Plant SET domain-containing proteins: structure, function and regulation[J]. Biochimica et Biophysica Acta (BBA)-Gene Structure and Expression, 2007, 1769(5-6): 316-329.
[28]?Aquea F, Vega A, Timmermann T,et al.Genome-wide analysis of the SET DOMAIN GROUP family inGrapevine[J]. Plant Cell Reports, 2011, 30(6): 1087-1097.
[29]?Lei L, Zhou S L, Ma H,et al.Expansion and diversification of the SET domain gene family following whole-genome duplications inPopulus trichocarpa[J]. BMC Evolutionary Biology, 2012, 12(1): 51.
[30]?Baumbusch L O, Thorstensen T, Krauss V,?et al.TheArabidopsis thalianagenome contains at least 29 active genes encoding SET domain proteins that can be assigned to four evolutionarily conserved classes[J]. Nucleic Acids Research, 2001, 29(21): 4319-4333.
[31]?Alvarez-Venegas R, Abdallat A A, Guo M,?et al.Epigenetic control of a transcription factor at the cross section of two antagonistic pathways[J]. Epigenetics, 2007, 2(2): 106-113.
[32]?Alvarez-Venegas R, Sadder M, Hlavacka A,et al. The Arabidopsis homolog of trithorax,ATX1, binds phosphatidylinositol 5-phosphate, and the two regulate a common set of target genes[J]. Proceedings of the National Academy of Sciences, 2006, 103(15): 6049-6054.
[33]?Berr A, McCallum E J, Alioua A,?et al. Arabidopsis histone methyltransferase SET DOMAIN GROUP8 mediates induction of the jasmonate/ethylene pathway genes in plant defense response to necrotrophic fungi[J]. Plant Physiology, 2010, 154(3): 1403-1414.
[34]?Kumpf R, Thorstensen T, Rahman M A,et al.The ASH1-RELATED3 SET-domain protein controls cell division competence of the meristem and the quiescent center of the Arabidopsis primary root[J]. Plant Physiology, 2014, 166(2): 632-643.
[35]?Sanchez R, Zhou M M. The PHD finger: a versatile epigenome reader[J]. Trends in Biochemical Sciences, 2011, 36(7): 364-372.
[36]?Wang Y, Reddy B, Thompson J,et al. Regulation of Set9-mediated H4K20 methylation by a PWWP domain protein[J]. Molecular Cell, 2009, 33(4): 428-437.
[37]?García-Alai M M, Allen?M D, Joerger A C,et al. The structure of the FYR domain of transforming growth factor beta regulator 1[J]. Protein Science, 2010, 19(7): 1432-1438.
[38]?Johnson L M, Bostick M, Zhang X,et al. The SRA methyl-cytosine-binding domain links DNA and histone methylation[J]. Current Biology, 2007, 17(4): 379-384.
[39]?De-La-Pe?a?C, Rangel-Cano A, Alvarez-Venegas R. Regulation of disease-responsive genes?mediated by epigenetic factors: interaction of Arabidopsis-Pseudomonas[J]. Molecular Plant Pathology, 2012, 13(4): 388-398.
[40]?Makarevich G, Leroy O, Akinci U,et al. Different polycomb group complexes regulate common target genes in Arabidopsis[J]. EMBO Reports, 2006, 7(9): 947-952.
[41]?Wang D, Tyson M D, Jackson S S,et al. Partially redundant functions of two SET-domain polycomb-group proteins in controlling initiation of seed development inArabidopsis[J]. Proceedings of the National Academy of Sciences, 2006, 103(35): 13244-13249.
[42]?Loidl P. A plant dialect of the histone language[J]. Trends in Plant Science, 2004, 9(2): 84-90.
[43]?Ogas J, Kaufmann S, Henderson J,et al. PICKLE is a CHD3 chromatin-remodeling factor that regulates the transition from embryonic to vegetative development inArabidopsis[J]. Proceedings of the National Academy of Sciences, 1999, 96(24): 13839-13844.
[44]?Cao R, Zhang Y. The functions of E (Z)/EZH2-mediated methylation of lysine 27 in histone H3[J]. Current Opinion in Genetics & Development, 2004, 14(2): 155-164.
[45]?Tariq M, Paszkowski J. DNA and histone methylation in plants[J]. Trends in Genetics, 2004, 20(6): 244-251.
[46]?Nic-Can G I, De la Pena C. Epigenetic advances on somatic embryogenesis of agronomical and important crops[M]//?Epigenetics in Plants of Agronomic Importance: Fundamentals and Applications. Cham: Springer??International Publishing, 2014: 91-109.
[47]?Xiao W, Custard K D, Brown R C,et al.DNA methylation is critical for Arabidopsis embryogenesis and seed viability[J]. The Plant Cell, 2006, 18(4): 805-814.
[48]?Jackson J P, Lindroth A M, Cao X,et al.Control of CpNpG DNA methylation by the KRYPTONITE histone H3 methyltransferase[J]. Nature, 2002, 416(6880): 556-560.
[49]?Lindroth A M, Shultis D, Jasencakova Z,?et al.Dual histone H3 methylation marks at lysines 9 and 27 required for interaction with CHROMOMETHYLASE3[J]. The EMBO Journal, 2004, 23(21): 4286-4296.
[50]?Kim J M, Sasaki T, Ueda M,et al. Chromatin changes in response to drought, salinity, heat, and cold stresses in plants[J]. Frontiers in Plant Science, 2015, 6: 114.
[51]?Kim J M, To T K, Ishida J,et al.Alterations of lysine modifications on the histone H3 N-tail under drought stress conditions inArabidopsis thaliana[J]. Plant and Cell Physiology, 2008, 49(10): 1580-1588.
[52]?Kim J M, To T K, Ishida J,et al.Transition of chromatin status during the process of recovery from drought stress inArabidopsis thaliana[J]. Plant and Cell Physiology, 2012, 53(5): 847-856.
[53]?Ding Y, Fromm M, Avramova Z. Multiple exposures to drought ‘train transcriptional responses in Arabidopsis[J]. Nature Communications, 2012, 3: 740.
[54]?Liu N, Fromm M, Avramova Z. H3K27me3 and H3K4me3 chromatin environment at super-induced dehydration stress memory genes ofArabidopsis thaliana[J]. Molecular Plant, 2014, 7(3): 502-513.
[55]?Cazzonelli C I, Nisar N, Roberts A C,et al.A chromatin modifying enzyme, SDG8, is involved in morphological, gene expression, and epigenetic responses to mechanical stimulation[J]. Frontiers in Plant Science, 2014, 5: 533.