烏云塔娜,王 淋,葉生晶
(1.中國林業科學研究院 經濟林研究開發中心,河南 鄭州 450003;2.國家林業局杜仲工程技術研究中心,河南 鄭州 450003;3.中南林業科技大學a.經濟林育種與栽培國家林業局重點實驗室;b.林學院,湖南 長沙410004;4.國家林業局中南林業調查規劃設計院,湖南 長沙 410014)
杜仲Eucommia ulmoidesOliv是我國特有的藥用樹種和膠源樹種,是第三紀孑遺植物[1-2]。杜仲作為藥材富含大量苯丙素類、黃酮類、木質素類等活性成分,具有抗衰老、降血壓、安胎、增強免疫功能等多種功效[3-5];作為源樹種,杜仲果實、葉子、樹皮等組織均含有大量的絲狀天然產物——杜仲膠,具有“橡膠-塑料的雙重性質”被廣泛的應用于橡膠、航天、醫療等多個領域[6]。
杜仲膠是天然橡膠順式聚異戊二烯的同分異構體,其化學結構為反式聚異戊二烯,聚異戊二烯是重要有機物質,其合成是通過甲羥戊酸代謝途徑的一系列酶的酶促反應進行的[7]。甲羥戊酸激酶(mevalonate kinase,MK)是MVA代謝途徑的限速酶之一,MK在動物中主要對控制膽固醇類生物合成其作用,而在植物中,MK主要參與類異戊二烯化合物的生物合成[8-9]。MK能將三磷酸腺苷(ATP-C)中的磷酸基團轉移到甲羥戊酸(mevalonate,MVA)第5位的羥基上形成甲羥戊酸-5-磷酸(mevalonate-5-phosphate,MVAP)并釋放 ADP,最終合成異戊烯焦磷酸(sopentenyl-PP,IPP),即合成萜類物質前體所必須的前體[8,10-11]。 本研究根據杜仲基因組數據,對杜仲MK基因進行生物信息學分析,為揭示EuMK基因調控杜仲萜類次生代謝產物的生物合成機制提供可靠的理論基礎。
文中以phytozome(http://www.phytozome.net/search.php)數據庫、杜仲全基因組測序和轉錄組數據庫為依據對MK基因相關分析[12-13]。
文中利用各類生物信息學軟件對MK基因進行在線分析。其中基因氨基酸殘基數、氨基酸組成、蛋白質的親疏水性等性質由 ExPASyProtParam完成;蛋白質跨膜結構及親水性/疏水性的分析利用在線軟件TMHMM、ProScale 完成;蛋白質二級及三級結構的預測利用PSIPRED和Swiss model在線工具完成;內含子及其外顯子結構預測用GSDS完成;對EuMK3啟動子功能的預測由PLANT CARE在線軟件完成。
利用Cluastl X2對EuMK與單子葉植物玉米Zea mays的ZmMK1、ZmMK2、ZmMK3, 水稻Oryza sativaL的OsMK,雙子葉植物擬南芥Arabidopsis thaliana的AtMK,葡萄Viteus vitifoliae的VvMK,苔蘚類小立碗蘚Physcomitrella patens的PpMK等MK基因家族進行多重序列比較(見圖1)。EuMK與其它植物的MK基因存在多個保守區,序列相似性可達到80%以上,因此確定為杜仲MK基因,記為EuMK3[14]。

圖1 全長MK蛋白多序列對比Fig.1 Multiple sequence alignment of the full length MK proteins
利 用MEGA軟件對EuMK3、ZmMK1、ZmMK2、ZmMK3、OsMK、AtMK、VvMK、PpMK基因建了杜仲ACOTS的系統進化樹(見圖2)。從進化樹中可見,共分為3個主要的分支:單子葉植物玉米、水稻為1個大分支;雙子葉植物杜仲、擬南芥、葡萄為1個大分支;苔蘚類小立碗蘚為1個分支,這與傳統植物的進化結果相一致。

圖2 MK蛋白的聚類分析Fig.2 Cluster analysis of MK proteins
利用在線軟件對植物MK基因的蛋白質具體理化性質進行了預測,結果見表1。植物MK編碼氨基酸為30~450 aa;理論等電為5~8;其中,EuMK3、VvMK、ZmMK1為穩定的疏水性蛋白,而 PpMK、AtMK、ZmMK2、ZmMK3、OsMK 為穩定的親水蛋白。
根據植物MK蛋白的氨基酸組成(見表2)可知,不用植物的HMGS基因的氨基酸組成較為不同,其中EuMK3基因中性疏水性氨基酸為Ala(A)9.7%、Asn(N)3.6%、Ile(I)6.1%、Leu(L)11.8% 、Met(M)3.0%、Phe(F)3.0%、Val(V)7.0%、Trp(W)1.2%、Tyr(Y)11.5%, 共 占56.9%;中性親水性氨基酸為Asn(N)3.6%、Cys(C)1.5%、Gln(Q)1.2%、Gly(G)7.3%、Ser(S)11.2%、Thr(T)5.8%,共占30.6%;堿性氨基酸為Arg(R)2.7%、His(H)2.4%、Lys(K)5.5%,共占10.6%;酸性氨基酸為Asp(D)3.9%、Glu(E)7.6%,共占11.5%。
利用MEME在線工具分析了MK氨基酸序列的功能結構,見圖3。所有植物MK蛋白均含有3個結構保守域均為,其中Motif1起始位置102 aa,保守序列為 IPEANIGLAAGVSAFLWLYISIQGYKPGNVVITSELPLGSGLGSSASFCV;Motif2起始位點為186 aa,保守序列為NKWAFEGERIIHG RPSGIDNTVSTYGYVVKFKKGQITRLHTQMPL RMLLT;Motif3起始位點為280 aa,保守序列為QSPASDDFAITEKEEKLEELMEMNQGLLQCMGV SHSSIETVLRTTLKYKL。

表1 MK編碼氨基酸的基本理化參數Table 1 Some basis physical and chemical parmeters of MK

圖3 MK基因的保守結構域Fig.3 Some conserved domains in MK gene

表2 MK蛋白質的氨基酸組成Table 2 Amino acid composition of MK protein %
利用在線工具TMHMM2.0對EuMK3氨基酸序列的跨膜結構域進行了預測,結果見圖4。EuMK3蛋白無明顯跨膜區域,蛋白全部位于膜外。

圖4 EuMK3蛋白的跨膜區預測Fig.4 Predicted transmembrane domain of the deduced EuMK3 protein
根據EuMK3氨基酸序列預測其蛋白二級結構(見圖5)。EuMK3二級結構中α-螺旋占42.42%,β-折疊占14.55%,螺環結構占43.03%,屬于混合型結構的蛋白質。
通過在線SWISS-MODEL中的Automated Mode進行同源建模,推導EuMK3蛋白的三級結構模型(見圖6)。以蛋白模板(2r3vA),ExPAsy structure assessment 程序評測推導的EuMK3蛋白模型QMEAN 6 得分為0.45,蛋白序列的相似性為32.93%。
根據已知的杜仲EuMK3基因組序列及其對應的完整編碼序列(coding sequence,CDS),預測了EuMK3基因組結構記憶分布情況,分別見圖7和表3。EuMK3共有4個外顯子,3個內含子,其中位于1相位的內含子2個,2相位的內含子1個。

圖5 EuMK3蛋白二級結構預測Fig.5 Predicted secondary structure of the deduced EuMK3 protein

圖6 EuMK3蛋白三級結構預測Fig.6 Predicted tertiary structure of the deduced EuMK3 protein

表3 EuMK3外顯子和內含子分布序列Table 3 Distribution sequence on the introns and exons of EuMK3 bp
利用plantCARE 啟動子在線數據庫,預測EuMK3基因的啟動子(5’UTR 2 000 bp)的主要順式元件潛在的分布以及功能。EuMK3家族基因啟動子主要順式元件潛在的分布以及功能(見表4)。結果發現EuMK3基因啟動子含有大量TATAbox,CAATbox基本順式作用元件、光響應作用元件(G-box)、防御與脅迫(TC-rich repeats)、參與生理調節(circadian)、熱脅迫(HSE)以及脫落酸(ABRE)應答相關調控元件。

圖7 EuMK3基因內含子和外顯子預測Fig.7 Prediction on introns and exons in EuMK3
甲羥戊酸(mevalonate pathway,MVA)途徑又稱細胞質途徑,其中間體甲羥戊酸激酶屬于細胞質酶[14],受代謝產物反饋抑制調節。Champenoy[15-17]等提出植物不同階段的生長發育,MK酶活性是不同的,因此通過調控MK酶活性可以參與調控植物的生長發育。Tang Wei[18]等對白松MK基因的轉錄水平上進行分析,白松MK基因在植株的生長發育階段均有表達,并且在根的分生組織區及花器官中表達量相對較高。葉生晶[14]提出EuMK3基因在杜仲果實和葉子中均有表達,在果實中的表達量遠遠高于葉子,且存在顯著的差異,且對EuMK基因熒光定量PCR的引物篩選,從而在定量PCR中檢測萜類物質合成MVA途徑各基因的表達差異分析[19]。MK基因參與MVA途徑合成各種衍生物,對植物生長發育具有一定的調控作用。

表4 EuMK3基因啟動子區順式元件作用預測Table 4 Function prediction on the cis-elements of promoters in EuMK3
通過與其它植物MK基因進行多重序列比較,杜仲MK基因其已知植物MK基因序列相似行較高,因此確定為EuMK。結構域預測顯示杜仲、玉米、水稻、擬南芥、葡萄、小立碗蘚的MK基因均含有與甲羥戊酸底物結合及催化反應有關的3結構保守域。不同植物MK基因,具有相似的結構保守域,說明各個植物MK基因具有相似的酶促反應機理[20]。
EuMK3基因啟動子內部存在著大量光誘導型啟動子相關元件(G-box、Box 4 、CATT-motif、GAG-motif、I-box、TCT-motif、Box I、GT1-motif), 推測EuMK3可能是基因啟動子是一種光誘導型啟動子。EuMK3啟動子還含有高溫脅迫應答相關元件HSE,即使應答高溫等逆境脅迫[21];乙烯應答元件(ERE)、茉莉酸應答相關元件(CGTCAmotif)、水楊酸酸應答相關元件(TCA-element),推測基因啟動子的轉錄調控活性可能受到及植物激素脫落酸、乙烯、茉莉酸等多種信號途徑的協同作用[22]。
文中首次對杜仲甲羥戊酸激酶(EuMK)進行了全面的生物信息學分析,對EuMK基因的表達調控機制以及次生代謝物積累了分子機理,為萜類物質-杜仲膠的合成提供了重要的理論基礎。
[1] 杜紅巖,謝碧霞,邵松梅.杜仲橡膠的研究進展與發展前景[J].中南林學院學報,2003,23(4):95-99.
[2] 王弦云,朱曉敏,王 勤.杜仲ISSR-PCR反應體系的建立與引物篩選及其在遺傳多樣性研究中的應用[J].經濟林研究,2013,31(1):30-34.
[3] 杜紅巖.杜仲活性成分與藥理研究的新進展[J].經濟林研究,2003,21(2):58-61.
[4] 杜紅巖,劉昌勇,李 欽,等.杜仲葉中3 種主要活性成分含量的季節變化[J].中南林業科技大學學報,2011,31(8): 6-9.
[5] 高 超,閆文德,田大倫,等.杜仲光合速率日變化及其與環境因子的關系[J].中南林業科技大學學報,2011,31(5): 100-104.
[6] 杜紅巖,胡文臻,俞 銳.杜仲產業綠皮書:中國杜仲橡膠資源與產業發展報告[M].北京:社會科學文獻出版社,2013:133-134.
[7] 王寶蓮,樊慶琦,李永波.甲羥戊酸激酶基因研究進展[J].中國農業科技導報,2011,13(3):17-25.
[8] David Potter,Hellry M,Miziorko.Identifieation ofCatalytic Residuesin Human Mevalonate Kinase[J].The journal of biological chemistry,1997,(272): 25449-25454.
[9] John L Ai,Kristina D,Thomas S L.Streptococcus pneumoniae isoprenoid biosynthesis is downregulated by diphosphomevalonate: an antimicrobial target[J].Biochemistry,2004,43:16461-16466.
[10] Bach T J.Some new aspects of isoprenoid biosynthesisin plants a review[J].Lipids,1995,30(3): 191-202.
[11] Lange BM,Croteau R.sopentenyl diphosphate biosynthesis via a mevalonate-independent pathway: isopentenyl monophosphate kinase catalyzes the terminal enzymatic step[J].Proc Natl Acad Sci USA,1999,96(24):13714-13719.
[12] 李鐵柱,杜紅巖,劉慧敏,等.杜仲果實和葉片轉錄組數據組裝及基因功能注釋[J].中南林業科技大學學報,2012,32(11):122-130.
[13] 李鐵柱,杜紅巖,劉慧敏,等.杜仲幼果和成熟果實轉錄組數據組裝及基因功能注釋[J].中南林業科技大學學報,2012 ,32(10): 9-17.
[14] 葉生晶.杜仲MVA途徑相關基因表達差異及全長cDNA序列特征[D].長沙:中南林業科技大學,2012.
[15] PoPjak G.Enzymes of sterol biosynthesis in liver and intermediates of sterol biosynthesis[C]// B C Raylllond.Methods Enzymology Steroids and Terpenoids.London: Academic Press,1969: 393-454.
[16] Cham penoy S,Tourte M.Expression of the yeastm evalonate kinase gene in transgenic tobacco[J].Mol Breed,1998,4(4):291-300.
[17] Cham penoy S,Vau zelle C,Tourte M.Activity of the yeastm evalonate kinase promoter in transgenic tobacco[J].Plant Sci,1999,147(1):25-35.
[18] Tang Wei,New ton R J.Mevalonate kinase activity during different stages of plant regeneration from nodular callus cultures in white pine (Pinus strobus)[J].Tree Physiol,2006,26(2):195-200.
[19] 葉生晶,烏云塔娜,田大倫,等.杜仲MVA途徑相關基因的鑒定及熒光定量PCR引物篩選[J].中南林業科技大學學報,2013,8(33):50-56.
[20] Chu X,Li D.Expression,purification,and characterization of His 20 mutants of rat mevalonate kinase[J].Protein Expr Purif,2003,32:75-82.
[21] 姜志磊,李淑芳,胡 慶.水稻、擬南芥組織特異性啟動子的序列特征分析[J].中國農學通報,2013,29(15):142-148.
[22] 董 浩,趙軼君,李紅民.生菜rbcS基因啟動子序列的克隆與分析[J].華北農學報,2013,28(1): 88-92.