張鵬飛,王 寧,周 蔓,李 萍
(西南交通大學生命科學與工程學院, 成都 610031)
?
牦牛兒基牻牛兒基焦磷酸合成酶(GGPS)的生物信息學分析
張鵬飛,王 寧,周 蔓,李 萍*
(西南交通大學生命科學與工程學院, 成都 610031)
GGPS是萜類化合物合成的一個重要分支點酶,同時也是合成GGPP的催化酶。本課題共選擇了9個不同科的植物,對其GGPS核苷酸及氨基酸序列的理化性質、蛋白質結構功能以及親緣進化關系等進行詳細的分析。結果表明,九個科植物GGPS核苷酸序列長度均大于1 000 bp小于2 000 bp;GGPS氨基酸都不含有信號肽,不存在跨膜結構域;GGPS蛋白的二級結構中α螺旋和無規卷曲是主要結構,且無β-折疊結構,延伸鏈和β-轉角則分散于整個蛋白中。通過生物信息學方法進行合理預測,為進一步研究GGPS的酶學特性提供了重要理論依據。
生物信息學;GGPS;分子進化
高等植物中類胡蘿卜素的合成途徑理論已經成熟,牻牛兒基牻牛兒基焦磷酸(GGPP)是類胡蘿卜素最直接的前體物質[1]。GGPS催化3,3-二甲烯丙基焦磷酸(DMAPP)與異戊烯基焦磷酸(IPP)合成GGPP,兩個GGPP分子通過八氫番茄紅素合成酶縮合形成八氫番茄紅素。GGPS基因最早從辣椒[2]中分離得出,之后又在番茄[3]、丹參[4]、煙草[5]、銀杏[6]等植物中分離得到。
近年來,GGPS基因在功能研究上取得了一些進展。在一些植物中發現GGPS對類胡蘿卜素的合成積累具有極為重要的作用[3,7]。但在啤酒酵母中GGPS基因過表達,會導致β-胡蘿卜素含量顯著增加[8]。在法夫酵母和卷枝毛霉中,GGPS過表達也能顯著提高類胡蘿卜素產量[9-10]。在cDNA文庫中,通過使用該酶抗體完成篩選,從而得到GGPScDNA[11]。另外研究還發現,GGPS對于調節碳流還有著重要的作用[12]。在植物體中,GGPS經常是多基因家族化合物。其表達的蛋白質存在于不同的亞細胞結構中[13]。本課題共選擇了以下9種不同科且已知GGPS基因序列的物種:銀杏(銀杏科)、煙草(茄科)、長春花(夾竹桃科)、丹參(唇形科)、薔薇(薔薇科)、萬壽菊(菊科)、甘薯(薯蕷科)、茉莉(木犀科)、加拿大紅豆杉(紅豆杉科)。對GGPS的理化性質、核酸序列、蛋白質結構功能等進行詳細的分析,研究其進化關系,進而更深層次的了解GGPS的性質,為該基因對植物的生長調控所產生的影響提供更可靠的理論依據。
1.1 實驗材料
本實驗數據來源于NCBI核酸和蛋白質數據庫中已經注冊的GGPS核酸及相應的氨基酸序列,包括銀杏(Ginkgobiloba ,AAQ72786.1)、萬壽菊(Tageteserecta,AAG10424.1)、甘薯(Ipomoea batatas,ACF37217.1)、茉莉(Jasminum sambac,AIY24421.1)、加拿大紅豆杉(Taxus canadensis,AAD16018.1)、煙草(Nicotiana tabacum,ADD49734.1)、長春花(Catharanthus roseus,AGL91648.1)、丹參(Salvia miltiorrhiza,ACR19637.1)、薔薇(Cistus creticus,AAM21639.1)、甜菊(Stevia rebaudiana,ABD92926.2)、蓖麻(Ricinus communis,XP_002531191.1)、麻瘋樹(Jatropha curcas,ADD82422.1)、橡膠樹(Hevea brasiliensis,BAF98302.1)。
1.2 方法
GGPS氨基酸序列的理化性質的分析使用Expasy軟件中的ProtParam在線工具;ORF的預測分析使用NCBI數據庫中ORF查詢工具;使用SignalP 4.1在線工具分析GGPS是否含有信號肽;通過NetPhos 2.0 和NetNGlyc 1.0在線工具分析糖基化和磷酸化位點;通過NCBI數據庫中的CDD工具對GGPS的保守結構域進行預測分析;通過SOPMA軟件可以預測GGPS二級結構,通過SWISS-MODEL在線分析其三級結構;通過Clustal X采用漸進比較算法進行多序列比對[14];通過MEGA建樹工具構建進化樹。
2.1 GGPS氨基酸序列理化性質分析
使用在線分析軟件ProtParam分析9種植物GGPS氨基酸序列的理化性質(見表1)。
由表可知,所選植物GGPS序列在氨基酸數目、預測分子量、Ip都表現出一致性,他們的基因序列全長在1 000 bp到2 000 bp之間;氨基酸數目除銀杏和加拿大紅豆杉在390左右外,其余的在365左右;Ip值除甘薯6.84以外,其余均小于6,不穩定指數40左右,脂肪指數在94左右;Ala、Leu、Glu、Lys、Gly是所選植物GGPS序列中含量最為豐富的氨基酸,而Pyl和Sec為所選植物中都不存在的氨基酸。
2.2 GGPS核酸序列ORF分析
通過ORF Finder在線軟件分析9種植物GGPS核酸序列的開放閱讀框(見表2)。

表2 不同植物GGPS核酸序列ORF分析
在線分析軟件ORF Finder提供了六組參考數據,包含了不同閱讀順序可能出現的情況。由于GGPS氨基酸序列長度已經知道,所以每一個ORF基本都對應著相應編碼蛋白質的大小,結果顯示除了丹參以外其余植物GGPS的開放閱讀框大小均在1 100 bp左右,而丹參可能由于蛋白編輯剪切不同,所以稍有差異。從這些也可以看出,GGPS序列存在一定的保守性。
2.3 蛋白質信號肽的預測分析
使用SignalP 4.1 Server在線工具以銀杏為研究對象對所選GGPS未知氨基酸序列中包含的信號肽進行分析(見圖1)。

圖1 銀杏GGPS的信號肽分析結果Fig. 1 Signal peptide analysis result of Ginkgo GGPS
結果表明,銀杏的GGPS蛋白序列都不存在信號肽。且由圖可以看出,S值和Y值均比較低,因此可以推測以上植物的GGPS蛋白通過核糖體合成之后,生成的蛋白質屬于非分泌蛋白。通過對另外8種植物分析可得到相近的結果。
2.4 糖基化和磷酸化位點分析
使用NetNGlyc 1.0以萬壽菊為例對所選GGPS序列的糖基化位點進行分析(見圖2)。
如圖所示,紅色橫線(Threshold)表示閾值,閾值設定為0.5,大于閾值的藍色豎線(Potential)表示此點有被糖基化的可能。萬壽菊GGPS氨基酸序列糖基化分析結果顯示,在5和24位點的天冬酰胺處存在藍色豎線,值分別為0.782 8和0.715 6,因此這兩處可能被糖基化。對其他植物GGPS氨基酸序列的糖基化預測分析得出,除銀杏、茉莉和紅豆杉沒有糖基化位點外,其余植物GGPS蛋白均存在不同程度的糖基化。
使用NetPhos 2.0在線工具以銀杏為研究對象分別預測了絲氨酸、蘇氨酸、酪氨酸3種不同的磷酸化位點(見圖3)。

圖2 萬壽菊GGPS氨基酸序列的糖基化分析Fig. 2 Glycosylation prediction of ginkgo GGPS amino acid sequence

圖3 銀杏GGPS氨基酸序列的磷酸化位點預測*Fig. 3 Phosphorylation site prediction of ginkgo GGPS amino acid sequence
注:*彩圖見電子版(http://swxxx.alljournals.cn/ch/index.aspx)(2016年第3期doi:10.3969/j.issn.1672-5565.2016.03.01)。
結果表明,總共有24個位點被磷酸化,其中有13個絲氨酸磷酸化位點(分別是第24、33、66、84、109、222、224、229、258、295、326、339和369位)、9個蘇氨酸磷酸化位點(分別是第44、88、120、144、203、223、262、302和325位)以及2個酪氨酸磷酸化位點(分別是第53和370位),在以上24個磷酸化位點中S369、S258、S295預測分值最高,均在0.990以上。通過對另外8種植物GGPS氨基酸序列的分析,可以得到同樣的結果。
2.5 蛋白質二級結構預測分析
以銀杏為研究對象,使用SOPMA在線工具分析GGPS氨基酸序列的二級結構(見圖4)。

圖4 銀杏GGPS氨基酸序列的二級結構預測* Fig. 4 Secondary structure prediction of ginkgo GGPS amino acid sequence
注:*彩圖見電子版(http://swxxx.alljournals.cn/ch/index.aspx)(2016年第3期doi:10.3969/j.issn.1672-5565.2016.03.01)。
由圖可知,在銀杏多肽鏈中二級結構中α-螺旋(藍色線*)在鏈中出現的概率是51.92%、無規卷曲(紫色線*)在鏈中出現的概率是26.09%、延伸鏈(紅色線*)在鏈中出現的概率是12.02%、β-轉角(綠色線*)在鏈中出現的概率是9.97%,可以看出銀杏GGPS二級結構中沒有β-折疊結構。可見α-螺旋是GGPS多肽鏈中大量存在的結構元件而散布于整個肽鏈中。另外8種植物的GGPS二級結構中也有類似的情況。
2.6 保守結構域的預測和分析
使用NCBI中的CDD工具以銀杏為例進行蛋白質結構域的預測分析(見圖5)。

圖5 銀杏GGPS保守結構域分析Fig. 5 conserved domains analysis of Ginkgo GGPS
由NCBI中CDD工具中的詳細解釋可以得出,銀杏GGPS氨基酸序列有一個異戊二烯合酶C1超家族,總共有六個不同的保守結構域,分別是底物結合保守結構域,結合Mg2+的結構域,活性位點殘基結合結構域,決定鏈長度的保守結構域,催化殘基的保守結構域和富含天冬氨酸的保守結構域。
2.7 蛋白質三級結構預測分析
使用Swiss-Model對九個科植物GGPS氨基酸序列的三級結構進行預測分析(見圖6)。

圖6 不同植物GGPS氨基酸序列的三級結構預測Fig. 6 Tertiary structure prediction of GGPS in different plants
通過上面九個三級結構圖可以看出,這些植物GGPS蛋白的三級結構極為相似,這同它們核苷酸序列與氨基酸序列的相似性有很大關系,相似的空間結構往往具有相似的功能,同時也可以看出GGPS在進化過程中是相對保守的。
2.8 核苷酸多序列比對
從前面對九個不同科植物GGPS序列的分析可以看出,它們的序列相似性相對較高,理化性質差異也不是很大,因此將進一步從序列上分析它們的同源性,為這些植物構建進化樹,從而較直觀的反映出它們之間的親緣關系。使用Clustal X軟件對九個不同科植物進行多序列比對(見圖7)。
通過Clustal軟件對九個科植物GGPS氨基酸序列進行比對的結果,可以明顯的看到這些序列在很大程度上都是相似的,只有少部分存在差異,因此可以得知GGPS在進化過程中是相對保守的。

圖7 不同植物GGPS的氨基酸多序列對比分析*Fig. 7 Multiple sequence alignment of GGPS in different plants
注:*彩圖見電子版(http://swxxx.alljournals.cn/ch/index.aspx)(2016年第3期doi:10.3969/j.issn.1672-5565.2016.03.01)。
2.9 GGPS進化樹的構建
對九種植物的GGPS氨基酸序列和一些相同科的植物如甜菊、蓖麻、麻瘋樹、橡膠樹使用MEGA4.0軟件進行分子系統演化分析,獲得GGPS核苷酸序列的分子進化樹,更進一步地分析它們的親緣進化關系(見圖8)。從圖中可看出13種植物GGPS氨基酸序列明顯被分為三大類,萬壽菊和甜菊同屬于菊科因此親緣關系最近,蓖麻和麻瘋樹同是大戟科,親緣關系也很近,由于有九個不同的科所以進化樹的小分支較多,而氨基酸序列和基因序列進化樹在大體結構上是相似的,但其分類也有稍微差異,可能是由于在進化過程中某些核苷酸的變異導致其氨基酸發生變化,但結合其序列比對結果發現,總體上GGPS序列還是較為保守的。因此GPSS是牻牛兒基牻牛兒基焦磷酸生物合成途徑中一個相對保守的基因,可作為生物遺傳分化和分子進化研究中的重要依據。

圖8 不同植物GGPS的氨基酸序列分子進化分析Fig. 8 Phylogenetic tree analysis of GGPS in different plants
本研究使用生物信息學的方法對來源不同植物GGPS的氨基酸序列進行了系統分析。試驗結果表明,植物GPSS屬于大分子蛋白;氨基酸序列理化性質分析顯示植物GGPS 富含Ala和Leu;通過植物GGPS氨基酸序列進行比對的得知GGPS在進化過程中是相對保守的;將13種植物的GGPS進行分子進化分析,結果表明萬壽菊和甜菊同屬于菊科因此親緣關系最近,蓖麻和麻瘋樹同是大戟科,親緣關系也很近,由于有九個不同的科所以進化樹的小分支較多,而氨基酸序列和基因序列進化樹在大體結構上是相似的,但其分類也有稍微差異,可能是由于在進化過程中某些核苷酸的變異導致其氨基酸發生變化,但結合其序列比對結果發現,總體上GGPS序列還是較為保守的,因此可作為生物遺傳分化和分子進化研究中的重要依據;二級結構分析推測 α-螺旋是多肽鏈中的主要結構元件。該研究結果可為深入開展 GGPS 酶學特性的分子機理研究提供重要理論依據。
References)
[1]CAZZONELLI C I,POGSON B J. Source to sink: regulation of carotenoid biosynthesis in plants[J]. Trends Plant Science,2010,15(5):266-274.
[2]KUNTZ M,ROMER S,SUIRE C. Identification of a cDNA for the plastid-located geranylgeranyl pyrophosphate synthase from Capsicum annuum: correlative increase in enzyme activity and transcript level during fruit ripening[J]. The Plant Journal,1992,2(1):25-34.
[3]鐘秋月,國艷梅,梁燕,等.兩個不同來源的番茄GGPS基因克隆和序列分析[J].華北農學報,2009,24(3):15-22.
ZHONG Qiuyue,GUO Yanmei,LIANG Yan,et al. Cloning and sequence analysis of GGPS gene in two sources of tomato[J]. Acta Agriculturae Boreali-Sinica,2009, 24(3):15-22.
[4]張蕾,戴住波,崔光紅,等.丹參牻牛兒基牻牛兒基焦磷酸合酶基因的克隆與分析[J].中國中藥雜志,2009,34(21):2704-2708.
ZHANG Lei,DAI Zhubo,CUI Guanghong,et al. Cloning and characterization of geranylgeranyl diphosphate synthase gene of Salvia miltiorrrhia[J]. China Journal of Chinese Materia Medica,2009,34(21):2704-2708.
[5]李鋒,李明,金立鋒,等.煙草牻牛兒基牻牛兒基焦磷酸合成酶基因的克隆及分析[J].煙草科技,2012(5):60-64.
LI Feng,LI Ming,JIN Lifeng,et al. Cloning and characterization of a new gene encoding geranylgeranyl pyrophosphate synthase from Nicotiana tabacum[J]. Tobacoo Agronomy,2012(5):60-64.
[6]張洪娟,譚碧月,曹福亮.銀杏GbGGPS基因的克隆及序列分析[J].南京林業大學學報:自然科學版,2013,37(4):9-12.
ZHANG Hongjuan,TAN Biyue,CAO Fuliang. Cloning and characterization of the geranylgeranyl pyrophosphate synthase gene from Ginkgo biloba Linn[J]. Journal of Nanjing Forestry University :Natural Sciences Edition,2013, 37(4):9-12.
[7]ZHAO W E,LV P,GU H H.Studies on carotenoids in watermelon flesh[J].Agricultural Science,2013,4(7A):13-20.
[8]UKIBE K,HASHIDA K,YOSHIDA N,et al. Metabolic engineering of Saccharomyces cerevisiae for astaxanthin production and oxidative stress tolerance[J]. Applied Environmental Microbiology,2009,75(22):7205-7211.
[9]BREITENBACH J,VISSER H,VERDOES J C,et al. Engineering of geranylgeranyl pyrophosphate synthase levels and physiological conditions for enhanced carotenoid and astaxanthin synthesis in Xanthophyllomyces dendrorhous[J]. Biotechnology Letters,2011,33(4):755-761.
[10]CSERNETICS A,NAGY G,ITURRIAGA E A,et al. Expression of three isoprenoid biosynthesis genes and their effects on the carotenoid production of the zygomycete Mucor circinelloides[J]. Fungal Genetics and Biology,2011,48(7):696-703.
[11]KUNTZ M, ROMER S, SUIRE C, et al. Identification of a cDNA for the plastidlocated geranylgeranyl pyrophosphate synthase from Cap sicumannum: Correlative increase in enzyme activity and trGGPScript level during fruit ripening[J]. The Plant Journal, 2002 , 2(1)∶25-34.
[12]LASKARIS G, BOUNKHAY M, THEODORIDIS G, et al. Induction of ger Anylgeranyl diphosphate synthase activity and taxane accumulation inTaxus baccatacell cultures afterelicitation bymethyl jasmonate [J].Plant Science, 1999, 147(1):1-8.
[13]LUCKER J,BOUWMEESTER H J,SCHWAB W,et al. Expression of Clarkia S-linalool synthase in trGGPSgenic petunia plants results in the accumulation of Dglucopyranoside[J].The Plant Journal,2001,27(4):315-324.
[14]CHIZZOLA R. Regular monoterpenes and sesquiterpenes (Essential oils)[J]. In Natural Products, 2013, 2973-3008.DOI: 10.1007/978-3-642-22144-6_130.
Bioinformatics analysis of geranylgeranyl pyrophosphate synthase in plants
ZHANG Pengfei,WANG Ning,ZHOU Man,LI Ping*
(SchoolofLifeScienceandEngineering,SouthwestJiaotongUniversity,Chengdu610031,China)
GGPS is an important branch point enzyme for terpenoids systhesis, but also it’s catalyting enzyme of GGPS.This study select 9 different families of plants, implement a series of detailed analyses to the physicochemical properties of GGPS nucleotide and amino acid sequence,protein structure and function and phylogenetic and so on. The results indicate that full length of DNA sequence from 9 species is in the range from 1 000 bp to 2 000 bp. All the GGPS amino acid sequence dont contain signal peptide and trmenbrance structure; α-helix and random coil are the primary structure of GGPS secondary structure and don’t have any β-sheet structure, extension chain and β-corner are scattered throughout the protein.Reasonably prediction based on bioinformatics methods provide important theoretical basis for further research GGPS enzymatic properties.
Bioinformatics; GGPS; Molecular evolution
2016-03-07;
2016-05-07.
張鵬飛,男,碩士研究生,研究方向:生物化學與分子生物學;E-mail:1913405585@qq.com.
*通信作者:李萍,女,教授,博士,研究方向:生物化學與分子生物學;E-mail:wuping4535@sina.com.
10.3969/j.issn.1672-5565.2016.03.01
Q55
A
1672-5565(2016)03-127-07