王 淋,烏云塔娜,葉生晶
(1.中南林業科技大學 a.經濟林育種與栽培國家林業局重點實驗室;b.林學院,湖南 長沙 410004;2.中國林業科學研究院 經濟林研究開發中心,河南 鄭州 450003;3.國家林業局杜仲工程技術研究中心,河南 鄭州450003;4.國家林業局中南林業調查規劃設計院,湖南 長沙 410014)
我國是世界上最大的橡膠消費國,橡膠被廣泛應用于工業、航空及軍事等高科技領域[1]。我國對國外橡膠的需求量較大,而我國特有的經濟物種杜仲是名貴的藥材,已被收錄于2010 版中國藥典[2]。不僅如此,杜仲果實、葉片、樹皮、根部均含優質天然橡膠——杜仲膠[3],其中杜仲葉含膠量為1%~3%,果實含膠量為10%~12%,是世界上極具發展潛力的優質天然膠資源[4]。杜仲果實的含膠量較高,利用杜仲果皮提取杜仲膠,可以降低杜仲膠提取的生產成本,促進杜仲膠產業的發展[5]。杜仲膠作為多萜類化合物,其結構與三葉橡膠順式異戊二烯不同,杜仲膠為反式異戊二烯,這就決定了杜仲膠具有獨特的橡塑二重性,被譽為高分子合金[6-7]。
萜類物質合成主要通過以下2條途徑:一是Michel Rohmer和Duilio Arigoni等[8-9]提出位于質體的2-甲基-D-赤蘚醇-4-磷酸途徑(MEP),二是Lynen等[10-11]提出位于細胞質的甲羥戊酸途徑(MVA),其中3-羥基-3-甲基戊二酰輔酶A合成酶(3-Hydroxy-3-methylglutaryl-coenzyme A synthase,HMGS)是位于MVA 途徑中的一個重要的代謝酶,乙酰乙酰CoA(acetoacetyl-CoA)經羥甲基戊二酰CoA合酶(HMGS)的催化形成3-羥基-3-甲基戊二酰CoA(HMG-CoA),隨后在HMGCoA還原酶(3-Hydroxy-3-methylglutaryl-coenzyme A reductase,HMGR)的作用下生成甲羥戊酸(MVA),甲羥戊酸經焦磷酸化和脫羧作用形成異戊烯焦磷酸IPP,從而為杜仲膠的生物合成提供通用前體[12-13]。
目前,已經從動物和植物的MVA途徑中系統分離出來HMGS基因進行了研究[14],而本文中利用生物信息學技術,對杜仲膠生物合成的重要靶點之一的HMGS基因進行相關的預測及分析,旨在為利用基因工程技術代謝調控杜仲膠生物合成提供理論依據。
玉米Zea mays、擬南芥Arabidopsis thaliana、葡萄Viteus vitifoliae、小立碗蘚Physcomitrella patens基因組以及編碼區序列來源于phytozome(http://www.phytozome.net/search.php)數據庫,杜仲Eucommia ulmoidesOliv.數據來源于杜仲全基因組測序以及轉錄組數據[15-16]。
利用生物信息學軟件ExPASyProtParam、TMHMM對EuHMGS基因氨基酸殘基數、氨基酸組成、蛋白質相對分子質量、理論等電點、蛋白質的親疏水性等性質以及蛋白的結果保守域進行了預測與分析;利用PSIPRED、Swiss model預測蛋白質的二級、三級結構;利用軟件GSDS對EuHMGS基因組結構進行預測;利用PLANT CARE在線軟件預測EuHMGS基因啟動子序列中可能存在的順式元件進行分析。
杜仲EuHMGS基因氨基酸序列與擬南芥Arabidopsis thaliana、葡萄Viteus vitifoliaeHMGS基因家族的基因序列相比較,存在多個保守區,序列相似性達到80 %以上(見圖1),因此命名為EuHMGS,記為EuHMGS4[17]。

圖1 全長HMGS蛋白多序列對比Fig.1 Multiple sequence alignment of the full length HMGS proteins
利用MEGA5.1軟件對單子葉植物玉米Zea mays、雙子葉植物擬南芥Arabidopsis thaliana、葡萄Viteus vitifoliae、苔蘚類小立碗蘚Physcomitrella patens的HMGS基因家族進行進化分析,構建了杜仲HMGS的系統進化樹(見圖2)。從系統進化樹圖中可知,單子葉植物玉米,雙子葉植物杜仲、擬南芥、葡萄,苔蘚類小立碗蘚共分為3個主要的大分支,符合傳統的進化分類結果。其中EuHMGS位于雙子葉植物的1個大分支,且與VvHMGS2的遺傳距離相對較近,說明EuHMGS4與VvHMGS2的同源關系較近。

圖2 HMGRS蛋白的聚類分析Fig.2 Cluster analysis of HMGRS proteins
對各個植物HMGRS基因家族的蛋白質理化性質進行了預測,結果如表1所示。HMGRS基因編碼氨基酸為450~470 aa;相對分子質量為50~52kD;理論等電點為5~6,不同植物的HMGS基因編碼氨基酸數、相對分子質量以及理論等電點均較為一致。EuHMGS4、VvHMGS1為不穩定的疏水蛋白;ZmHMGS3為不穩定的親水蛋白;AtHMGS為穩定的疏水蛋白;VvHMGS2、PpHMGS1、PpHMGS2、ZmHMGS1、ZmHMGS2為穩定的親水蛋白。

表1 HMGS編碼蛋白質的基本理化參數Table 1 Physical and chemical parmeters of HMGS
HMGS蛋白質的氨基酸組成如表2所示。由表2可見,HMGS基因所編碼蛋白質的氨基酸組成大致相同,其中EuHMGS4中性疏水性氨基酸 為 Asn(N)3.3%、Ala(A)8.2%、Ile(I)4.6%、Leu(L)7.7%、Met(M)3.5%、Phe(F)4.9%、Val(V)6.0%、Trp(W)0.4%、Tyr(Y)5.3%,共43.8%;中性親水性氨基酸為Asn(N)3.3%、Cys(C)2.2%、Gln(Q)3.5%、Gly(G)6.4%、Ser(S)9.7%、Thr(T)6.2%,共31.3%;堿性氨基酸為Arg(R)3.3%、His(H)2.0%、Lys(K)7.1%,共10.4%;酸性氨基酸為Asp(D)5.3%、Glu(E)6.2%,共11.5%。

表2 HMGS蛋白質的氨基酸組成Table 2 Amino acid composition of HMGS %
利用MEME在線工具分析HMGRS氨基酸序列的功能結構域(見圖3),無論是單子葉植物、雙子葉植物還是苔蘚類植物,HMGRS蛋白的結構保守域均為3個,且3個保守區均靠近蛋白的N端,其中Motif1起始位點為9 aa,保守序列為 ILAMEI YFPPTCVQQEAMETHDGVSKGKYTIGLGQDCM AFCTEVEDVISM;Motif2起始位點為72 aa,保守序列為IDPTQIGRMEVGSETVIDKSKSIKTFLMQI FEECGNTDIEGVDSTNACYG;Motif3起始位點為128 aa,保守序列為NCTNWVESSSWDGRYGLVV CTDSAVYAEGPARPTGGAAAIAMLIGPDAPI。

圖3 HMGS基因的保守結構域Fig.3 The conserved domains in HMGS gene
利用在線工具TMHMM2.0對EuHMGS4氨基酸序列的跨膜結構域進行預測(見圖4)。EuHMGS4蛋白無明顯跨膜區,蛋白全部位于膜外。
根據EuHMGS4氨基酸序列,預測其蛋白的二級結構(見圖5)。結果表明,EuHMGS4蛋白二級結構中α-螺旋占38.05 %,β-折疊占12.17 %,螺環結構占49.78 %,屬于混合型結構的蛋白質。

圖4 EuHMGS4蛋白的跨膜區預測Fig.4 Predicted transmembrane region of the deduced protein of EuHMGS4 protein

圖5 EuHMGS4蛋白二級結構預測Fig.5 Predicted secondary structure of the deduced EuHMGS4 protein
采用Auto mode建模方式對EuHMGS4蛋白進行同源建模,得到了EuHMGS4蛋白的三維空間模型,如圖6所示。ExPAsy structure assessment程序評測推導的EuHMGS4蛋白模型QMEAN 6 得分為0.7。
將杜仲HMGS基因組序列及其對應的完整編碼序列(coding sequence CDS)提交到GSDS在線網站預測基因組序列特征,結果如圖7和表3所示。EuHMGS基因家族不同的基因具有不同的外顯子和內含子數量,其中EuHMGS4有11個外顯子,10個內含子,其中位于0相位的內含子6個,1相位的內含子1個,2相位的內含子3個。

圖6 EuHMGS4蛋白三級結構預測Fig.6 Predicted tertiary structure of the deduced EuHMGS4 protein

圖7 EuHMGS基因內含子和外顯子預測Fig.7 Prediction on the intron and exon in EuHMGS

表3 EuHMGS4外顯子和內含子分布序列Table 3 Distribution sequence on the intron and exon in EuHMGS4 bp
利用PLACE 和plantCARE 在線數據庫,預測EuHMGS基因啟動子(5’UTR 2 000bp)的主要順式元件潛在的分布以及功能(見表4)。結果發現,EuHMGS基因啟動子含有大量基本順式作用元件TATAbox、CAATbox,除此之外,EuHMGS4啟動子部分還還有熱脅迫(HSE)、脫落酸(ABRE)、水楊酸(TCA-element)、乙烯(ERE)等相關調控元件,這些順式作用元件均可能參與杜仲MK基因功能以及萜類物質代謝調控的過程。

表4 EuHMGS4基因啟動子區順式元件作用預測Table 4 Function prediction on the cis-elements of promoter in EuHMGS4

續表1Table 1 Continuation
杜仲羥甲基戊二酰輔酶A 合酶基因(EuHMGS)是甲羥戊酸途徑(MVA)中的第1個催化酶,催化乙酰乙酰CoA 生成羥甲基戊二酰CoA,對于杜仲膠-多萜類的生物合成起著十分重要的作用[18]。序列上高度保守且功能相似的基因被稱為是同一個基因家族,生理功能的實現一般是通過一個家族的功能來實現,而不是單獨的1個基因,利用基因組數據,從基因家族的角度分析代謝途徑以及基因的功能具有重要的意義[19],根據杜仲HMGS的完整編碼框(CDS),在杜仲基因組數據中找到唯一1個HMGS基因,目前認為杜仲HMGS家族就只包含1個基因,而巴西橡膠樹(Hevea brasiliensis)HMGS也是一個小的基因家族,包括HMGS1和HMGS2[17]。對EuHMGS基因進行生物信息學分析結果表明,含有HMGS蛋白的典型保守序列GNTDIEGVDSTNACYGGTA;聚類分析顯示EuHMGS與雙子葉植物遺傳距離較近,符合遺傳進化規律。EuHMGS基因啟動子中含有大量的脫落酸、水楊酸、茉莉酸響應調控元件。用甲基茉莉酸和水楊酸誘導CaHMGS 喜樹子葉和胚軸中的表達,結果發現在不同的組織中具有不同的表達調控模式[20],因此,推測EuHMGS基因也可能具有組織特異性表達基因,而且在巴西橡膠樹中HMGS基因的mRNA和酶的活性在白天顯著高于夜間,推測HMGS可能因含有大量的光調控順式作用元件,導致HMGS基因的表達受到光變化的調控[21]。
[1] 杜紅巖.我國的杜仲膠資源及其開發潛力與產業發展思路[J].經濟林研究,2010,28(3):1-6.
[2] 杜紅巖,劉昌勇,李 欽,等.杜仲葉中3 種主要活性成分含量的季節變化[J].中南林業科技大學學報,2011,31(8): 6-9.
[3] 杜紅巖,劉攀峰,孫志強.我國杜仲產業發展布局探討[J].經濟林研究,2012,30(3):130-144.
[4] 李芳東,杜紅巖.杜仲[M].北京:中國中醫藥出版社,2001:232-256.
[5] 杜蘭英,劉攀峰,朱景樂,等.環剝與環割強度對果園化栽培條件下杜仲生長和結果的影響[J].中南林業科技大學學報,2013,33(8):14-18.
[6] 紀奎江.我國橡膠資源與廢橡膠循環利用[J].技術交流,2010,(4):21-24.
[7] 杜紅巖,胡文臻,俞 銳.杜仲產業綠皮書:中國杜仲橡膠資源與產業發展報告[M].北京:社會科學文獻出版社,2013:1-2.
[8] Duilio A,Silvia S,Christoph,et al.Terpenoid Biosynthesis from 1-Deoxy-D-xylulose in Higher Plantd by Intramolecular Skeletal Rearrangement[J] Proc Natl Acad Sci USA,1997,94:10600-10605.
[9] Hartmut K L,Michel R,J?rg S.Two Independent Biochemical Pathways for Isopentenyl Diphosphate and Isoprenoid Biosynthesis in Higher Plants[J].Physiol Plant,1997,101:643-652.
[10] Lynen F,Efferer H,Henning U,et al.Farnesylpyrophosphatund 3-Methyl-Δ3-butenyl-1-pyrophosphat,diebiologischen Vorstufendes Squalens Zur Biosyntheseder Terpene,III [J].Angewandte Chemie,1958,70(24):738-742.
[11] Chaykin S,Law J,Phillips A H,et al.Phosphorylated Intermediates in the Synthesis of Squalene[J].Proc N A S,1958,44 (10):998-1004 .
[12] 韓軍麗,李振秋,劉本葉.植物萜類代謝工程[J].生物工程學報,2007,23(4):561-569.
[13] Mann V,Harker M,Pecker I,et al.Metabolic engineering of astaxanthin production in tobaccof lowers [J].Nat Biotechnol,2000,18: 888-892.
[14] 葉生晶,烏云塔娜,田大倫,等.杜仲MVA途徑相關基因的鑒定及熒光定量PCR引物篩選[J].中南林業科技大學學報,2013,33(8)51-56.
[15] 李鐵柱,杜紅巖,劉慧敏,等.杜仲果實和葉片轉錄組數據組裝及基因功能注釋[J].中南林業科技大學學報,2012,32(11):122-130.
[16] 李鐵柱,杜紅巖,劉慧敏,等.杜仲幼果和成熟果實轉錄組數據組裝及基因功能注釋[J].中南林業科技大學學報,2012,32(10):9-17.
[17] 葉生晶.杜仲MVA途徑相關基因表達差異及全長cDNA序列特征[D].長沙:中南林業科技大學,2012.
[18] T Dairi.Biosynthetic Genes and Enzymes of Isoprenoids Produced by Actinomycetes[C]//Isoprenoid Synthesis in Plants and Microorganisms.New York: Springer-Verlag,2013: 29-49.
[19] 王鳳華,劉文鋒.擬南芥HMGS家族成員全基因組分析[J].安徽農業科學,2012,40(36):17478-17481.
[20] Pluang S,Nualpun S,Wallie S.Regulation of 3-Hydroxy-3-Methylglutaryl-CoA Synthase and 3-Hydroxy-3-Methylglutaryl-CoA Reductase and Rubber Biosynthesis ofHevea brasiliensis(BHK)Mull Arg[C]//Isoprenoid Synthesis in Plants and Microorganisms.New York: Springer-Verlag,2013: 315-327.
[21] 王 偉.喜樹毛狀根培養體系的建立及喜歡HMGS基因的克隆分析[D].上海:上海師范大學,2009.