石鵬 曹紅星 李東霞 王永 雷新濤
摘 要 油棕果實中含有豐富的維生素E,而提高其中高活性的維生素E組分是改善棕油品質的關鍵。油棕γ-生育酚甲基轉移酶(GenBank登錄號為AEU17779)能將低活性的γ-生育酚三烯催化生成高活性的α-生育酚和α-生育酚三烯,是控制油棕維生素E組分和活性的關鍵酶,其功能在油棕等許多植物中極其保守。本研究利用生物信息學相關軟件對以油棕VTE4基因為主要分析對象的一些植物VTE4基因的核酸和相應的氨基酸序列的組成成分、疏水性/親水性、跨膜結構域以及功能結構域等進行分析。結果表明:VTE4屬于不具有信號肽的親水性蛋白,可能作為轉運蛋白在葉綠體中發揮作用,α-螺旋和無規則卷曲大量散布于整個蛋白質二級結構中,具有S-腺苷甲硫氨酸結合位點和PLN02244保守結構域。這一結果可為油棕等植物VTE4的功能和分子機制研究提供更多詳細的參考。
關鍵詞 油棕;γ-生育酚甲基轉移酶;生物信息學;保守結構域
中圖分類號 Q811.4 文獻標識碼 A
油棕(Elaeis guineensis Jacq.)屬棕櫚科油棕屬多年生喬木,是重要的熱帶木本油料作物,生產效率很高,有“世界油王”之稱。維生素E在油棕果實中的含量大約為100 mg/kg,其作為功能性成分影響著棕油的品質,粗棕油中的維生素E類主要是γ-生育酚三烯、α-生育酚和α-生育酚三烯[1]。低活性的γ-生育酚三烯會影響人體的吸收利用,VTE4能將γ-生育酚三烯催化生成高活性的α-生育酚和α-生育酚三烯。因此,對油棕等植物的VTE4的生物信息學分析對于油棕維生素E品質性狀的改良具有十分重要的意義。
維生素E是一類脂溶性物質,通常在光合作用器官中合成和積累,是人們飲食中攝取的重要成分。植物中合成的維生素E是生育酚和生育酚三烯的總稱,按照側鏈基團是否飽和分為生育酚(tocopherol)和生育酚三烯(tocotrienol),又根據苯環上甲基位置和數目的不同各分為α、β、γ和δ共4種類型[2]。盡管所有的維生素E組分都有生物活性,但是α-生育酚/生育酚三烯的活性是其它種類的2~50倍,主要是因為哺乳動物肝臟中含有α-生育酚/生育酚三烯的轉運蛋白[3]。維生素E不僅對提高植物自身的抗光氧化、抗寒、抗旱和抗鹽堿等非生物逆境脅迫有重要作用,在細胞信號轉導等方面也發揮重要作用[4-7]。此外,維生素E能增強人類免疫力、減緩衰老、抑制心血管疾病和癌癥的發生[8-11]。維生素E在植物中合成時首先在一系列酶的催化下生成γ和δ類型的生育酚及生育酚三烯,隨后都在VTE4(γ-生育酚甲基轉移酶,γ-TMT,γ-tocopherol methyltransferase)的催化下分別生成α和β類型的生育酚及生育酚三烯[12]。而α和β類型的維生素E的活性較高,所以說VTE4是決定植物中維生素E成分和活性的關鍵酶,其基因已經在多種植物中被克隆和研究。Li等[13]在擬南芥中使VTE4過量表達時, 可使擬南芥葉片維生素E中α-生育酚比率從87.5%增加到97.1%。Jessica等[14]在甘藍型油菜中克隆并定位了4個與擬南芥VTE4同源的基因,轉基因實驗發現其中的一個拷貝BnaA.VTE4.a1能夠提高α-生育酚的含量。Maria等[15]在大豆中通過QTL定位分析找到了一個γ-生育酚甲基轉移酶基因,對γ-TMT3分析發現它的變異位點決定著大豆種子中α-生育酚的含量。Yusuf等[16]在芥菜型油菜超表達VTE4使α-生育酚含量提高了6倍。
生物信息學是應用信息學技術(來自于應用數學、計算機科學和統計學)大規模解析和組織與這些分子(核酸和氨基酸等)相關的信息。簡而言之,生物信息學是分子生物學的一種管理信息系統,有大量的實際應用價值。利用互聯網上的各種分子生物學數據庫及軟件對已知的核酸和氨基酸序列進行比對、分析及建立計算模型,對其結構和功能進行預測與分析,是生物信息學的重要分析思路[17-18]。許多植物中都開展了VTE4基因的生物信息學分析,但是在油棕中還少有報道。本文應用生物信息學的方法以油棕VTE4基因為主要分析對象,對來自GenBank(美國國家生物技術信息中心遺傳序列數據庫)中的油棕等不同植物的VTE4基因的核酸及氨基酸序列的理化性質、結構特征和功能特征等進行預測和分析,為油棕等植物VTE4基因的進一步研究提供更詳細的理論依據。
1 材料與方法
1.1 材料
數據資料均來源于NCBI(National Center for Biotechnology Information)的核酸及蛋白質數據庫中已有的油棕等植物γ-生育酚甲基轉移酶基因的核酸序列及其對應的氨基酸序列:油棕(Elaeis guineensis,JN848783、AEU17779)、擬南芥(Arabidopsis thaliana,NM105171、AAM64696)、小麥(Triticum aestivum,DQ139266、CAI77219)、玉米(Zea mays,NM001112444、AGF92707)、馬鈴薯(Solanum tuberosum,DQ456877、ABE41795);另外構建系統進化樹還用到了一下幾種植物的VTE4氨基酸序列:美洲油棕(E. oleifera,ABS76142)、野生番茄(S. pennellii,ADZ24710)、可可(Theobroma cacao,EOY10208)、栽培番茄(S. lycopersicum,NP001233814)、白蘇(Perilla frutescens,AEP68180)、陸地棉(Gossypium hirsutum,ABE41798)。
1.2 方法
利用NCBI(http://www.ncbi.hlm.nih.gov/)、CBS(http://www.cbs.dtu.dk)和ExPASy(www.expasy.ch)等網站提供的在線生物信息學工具和MEGA 6.06序列比對分析軟件(http://www.megasoftware.net/)進行分析。核酸及氨基酸序列的組成成分和理化性質的分析、開放閱讀框(ORF,Open reading frame)的查找和翻譯利用NCBI上的ORF Finder和ExPASy上的ProtParam在線工具;核酸及氨基酸序列的同源性比對和分子進化樹聚類利用Clustal Omega在線工具和MEGA 6.06軟件分析;氨基酸翻譯后修飾、蛋白質跨膜結構域、親水/疏水性及亞細胞定位的分析利用在線工具NetPhos 2.0 Server、TMHMM 2.0 Server、ProtScale和PSORT完成;蛋白質信號肽和導肽預測利用在線工具SignalP 4.1 Server和TargetP1.1 Server。蛋白質保守結構域的預測利用NCBI上的CDD在線工具完成,蛋白質二級及三級結構的預測利用SOPMA和SWISS-MODEL在線工具完成。
2 結果與分析
2.1 油棕等植物VTE4基因核酸及氨基酸序列分析
利用NCBI上的ORF Finder和ExPASy上的ProtParam對油棕、擬南芥、小麥、玉米和馬鈴薯5種植物的VTE4基因的核酸序列及其氨基酸序列進行分析。分析結果如表1所示,ORF Finder分析發現不同植物VTE4基因開放閱讀框的堿基數及所推導的氨基酸殘基數相差不大,起始密碼子均為ATG,終止密碼除擬南芥為TAA外,其它4種植物均為TAG 。利用ProtParam分析氨基酸理化性質發現不同植物γ-生育酚甲基轉移酶蛋白的分子量和理論等電點基本一致;Ala、Ser、Leu、Gly、Arg、Lys、Pro、Ile是這5種植物γ-生育酚甲基轉移酶中含量最豐富的氨基酸;由于不穩定性指數小于40才是穩定類蛋白質,所以它們都屬于不穩定類蛋白質,且親水系數都為負值,都為親水性蛋白質,可能不會作為膜蛋白行使功能。
2.2 油棕等植物VTE4親水性/疏水性的預測和分析
利用ProtScale在線工具對油棕VTE4氨基酸序列的疏水性/親水性進行預測(圖1)。結果表明,多肽鏈第47位的Ser具有最低的分值-2.711,親水性最強;而第337位的Ile具有最高的分值2.478,疏水性最強。整體來看,親水氨基酸數量大于疏水氨基酸,故推測油棕γ-生育酚甲基轉移酶蛋白質為親水性蛋白。小麥和擬南芥等其它植物γ-生育酚甲基轉移酶氨基酸序列的疏水性/親水性分析結果與此基本一致,即γ-生育酚甲基轉移酶多肽鏈表現為親水性,據此可以推斷植物γ-生育酚甲基轉移酶是親水性蛋白質。
2.3 油棕等植物VTE4二級結構的預測和分析
利用在線二級結構預測軟件SOPMA對油棕VTE4氨基酸序列進行二級結構預測(圖2)。結果表明,油棕VTE4氨基酸二級結構由48.4%的α-螺旋(Alpha helix),35.28%的無規則卷曲(Random coil),11.37%的延伸鏈(Extended strand)和4.96%β-轉角(Beta turn)組成。在VTE4蛋白的整體結構中,α-螺旋和無規則卷曲是油棕VTE4最主要的結構元件,而延伸鏈和β-轉角則分布于整個蛋白質中。其它植物的VTE4氨基酸序列的二級結構分析結果與此基本一致。據此可以推測在植物γ-生育酚甲基轉移酶蛋白質結構中,α-螺旋和無規則卷曲是最豐富的結構元件,而延伸鏈和β-轉角則分散其中。
2.4 油棕等植物VTE4蛋白三級結構的預測和分析
利用SWISS-MODEL在線工具預測油棕VTE4蛋白的三級結構,通過同源建模的方法獲得油棕VTE4三維結構模式(圖3)。建模發現與蛋白質模板2o57.1.A有較高相似性,達到21.90%。圖中藍色螺旋環即為α-螺旋,它在油棕γ-生育酚甲基轉移酶中占據主要部分,且根據三級結構特征推測為肌氨酸二甲基甘氨酸甲基轉移酶(sarcosine dimethylglycine methyltransferase,SDMT)。小麥和擬南芥等其它植物的γ-生育酚甲基轉移酶進行三級結構預測和分析結果基本一致。
2.5 油棕等植物VTE4跨膜結構域的預測和分析
跨膜結構域是穿過細胞膜連接細胞內外的部分,主要功能是固定蛋白質,另外還有一些具有介導細胞信號傳遞的功能。對蛋白質進行跨膜結構域預測,可以判斷蛋白質是否定位在細胞膜上,具有介導細胞信號傳遞功能。利用在線工具TMHMM對油棕VTE4氨基酸序列的跨膜結構域進行預測,沒有發現明顯的跨膜結構域。小麥和擬南芥等其它植物跨膜結構域分析結果基本一致,表明植物γ-生育酚甲基轉移酶沒有跨膜結構域,可能不是固定在細胞膜上,而是轉運蛋白質。
2.6 油棕等植物VTE4翻譯后修飾的預測和分析
翻譯后修飾是蛋白質在翻譯后進行的化學修飾,這是大部分蛋白質生物合成的較后步驟。對蛋白質修飾是控制蛋白質活性的一種機制,常見的修飾有磷酸化、甲基化和乙?;?,對蛋白質的翻譯后修飾預測分析對正確認識和理解蛋白質的功能具有重要作用。利用NetPhos 2.0 Server在線工具對油棕VTE4的翻譯后修飾預測的結果表明(圖4),油棕γ-生育酚甲基轉移酶多肽鏈中的磷酸化位點(分值>0.5)有16個,其中Ser(絲氨酸):12,Thr(蘇氨酸):3,Tyr(酪氨酸):1。小麥和擬南芥等其它植物的磷酸化位點預測結果與此基本一致。
2.7 油棕等植物VTE4的亞細胞定位分析
亞細胞定位可以預測蛋白質在細胞內的具體存在部位,例如在細胞核內、細胞質內或者細胞器中存在。利用PSORT在線工具對油棕等5種植物的VTE4蛋白質進行亞細胞定位分析(表2),結果表明,油棕和小麥VTE4蛋白質分別定位在細胞核和線粒體基質的可能性最大,擬南芥、玉米和馬鈴薯則主要定位在葉綠體基質中,據結果推測植物γ-生育酚甲基轉移酶蛋白可能主要是在葉綠體中行使功能。
2.8 油棕等植物VTE4信號肽和導肽的預測和分析
信號肽是新合成肽鏈中用來引導蛋白質的跨膜定位的氨基酸序列,一般位于蛋白質N端,有15~30個氨基酸,包括中間疏水區、C端加工區和堿性氨基酸N端等3部分。利用在線工具SignalP 4.1 Server對油棕VTE4氨基酸序列的信號肽進行預測(圖5),結果表明,油棕VTE4不含有信號肽。對其它幾種植物VTE4氨基酸序列的存在位置及其序列做相應的分析也得到了與之相一致的結果,即植物γ-生育酚甲基轉移酶不存在信號肽。
導肽是新合成蛋白質N端大約20~80個氨基酸的肽鏈,主要功能是引導蛋白質穿過線粒體等細胞器雙層膜,運送蛋白質。利用TargetP1.1 Server進行導肽分析也證實了其作為葉綠體轉運蛋白(分值為0.876)和線粒體轉運蛋白(分值為0.507)的可能性比較大,該蛋白存在信號肽(分值為0.003)的可能性很小。此結果與亞細胞定位和信號肽預測結果基本一致。
2.9 油棕等植物VTE4保守結構域的預測和分析
結構域實質上是二級結構的組合體,充當三級結構的構建,每個結構域分別代表一種功能。利用NCBI中的保守結構域數據庫(Conserved Domain Database,CDD)工具對VTE4基因的氨基酸序列分析發現,γ-生育酚甲基轉移酶含有S-adenosylmethionine(SAM,S-腺苷甲硫氨酸)結合位點,AdoMet_MTases(腺苷甲硫氨酸甲基轉移酶)保守域,AdoMet_MTases superfamily家族和PLN02244保守結構域。其中PLN02244是生育酚甲基轉移酶的特征序列(圖6)。
2.10 油棕等植物VTE4氨基酸序列比對及分子系統進化分析
用Blast程序比對油棕與其它植物VTE4的核酸及氨基酸序列同源性,結果表明油棕VTE4的核酸序列與其它植物如水稻(NM001054379)、大麥(AK369125)、小麥(DQ139266)、葡萄(FQ394048)、陸地棉(DQ456880)、大豆(NM001249796)、白蘇(JN381069)和萵苣(FJ975047)的一致性分別是76%、75%、75%、75%、74%、74%、74%、74%;蛋白質的Blastp比對結果,油棕VTE4的氨基酸序列與其他植物的氨基酸序列有基本一致的相似性,如與栽培番茄(NP001233814)、可可(EOY10208)、山羊草(EMT29211)、白蘇(AEP68180)、陸地棉(ABE41798)、馬鈴薯(ABE41795)、玉米(AGF92707)和小麥(CAI177219)的一致性分別為78%、77%、76%、75%、75%、73%、72%、71%。據此可以發現,不同植物VTE4的氨基酸序列之間的相似性與核酸之間的相似性基本一致。根據以上Blast結果,用EBI(歐洲生物信息學研究所)上的Clustal Omega程序對油棕、擬南芥、馬鈴薯、小麥和玉米5種植物的VTE4氨基酸序列進行多序列比對,其結果顯示,不同植物γ-生育酚甲基轉移酶的功能域是很保守的。
將11個源自不同物種的VTE4氨基酸序列用MEGA 6.06軟件進行分子系統進化分析,采用Neighbor-Joining法,進行1 000次bootstrap統計學檢驗構建分子進化樹(圖7)。結果表明,11種不同植物的VTE4氨基酸序列聚成4支,擬南芥和白蘇各自成一支;可可和陸地棉聚成一支;非洲油棕、美洲油棕、小麥、玉米、馬鈴薯、野生番茄和栽培番茄聚成一支。由此可見,依據氨基酸序列構建的分子進化樹能比較真實地反映不同物種之間的系統分類學關系和自然演化進程,對明確判斷物種間的親緣關系具有一定的參考價值。
3 討論與結論
γ-生育酚甲基轉移酶最早是從擬南芥中克隆的,是催化低活性的γ-生育酚/生育酚三烯和δ-生育酚/生育酚三烯生成高生物活性的α-生育酚/生育酚三烯和β-生育酚/生育酚三烯的關鍵酶[19]。而維生素E這些組分的變化影響其活性的高低,VTE4是控制植物維生素E組分和活性的重要基因,通過對油棕等植物γ-生育酚甲基轉移酶的生物信息學分析,有助于加深對VTE4的生物學功能的了解。油棕果實中含有豐富的維生素E,維生素E是一種功能性成分,不僅能提高植物本身的抗逆性,而且對于保護人體健康具有重要意義。維生素E的組分和活性直接決定著棕油的品質,增加高活性的α-生育酚/生育酚三烯和β-生育酚/生育酚三烯的含量是關鍵。利用生物信息學工具對油棕VTE4這一關鍵基因進行結構和功能預測有助于了解油棕維生素E合成的分子機制,為下一步的VTE4基因功能分析和遺傳改良奠定基礎。利用油棕VTE4基因序列開發特異分子標記,可以用于油棕種質資源鑒定和評價,為后續雜交育種親本選擇奠定基礎。而且未來可以利用轉基因技術,直接改良優良種質資源的維生素E組分,提高棕油品質。
擬南芥中γ-生育酚甲基轉移酶研究表明,VTE4蛋白質與Δ-24-甾醇甲基轉移酶(Δ-24-sterol-C-methyltransferases)有類似的氨基酸序列,VTE4蛋白質包含有SAM結合域和N端信號肽等γ-生育酚甲基轉移酶的結構特點[6]。本研究通過利用生物信息學的相關工具對油棕等5種植物的VTE4基因的核酸及氨基酸序列的組成、生化特性、結構特點和功能等進行了預測和分析,并對油棕等11種植物的VTE4氨基酸序列進行了分子進化樹聚類分析。預測結果表明,不同植物VTE4基因推測的氨基酸序列的理化性質相差不大,且都屬于不穩定的親水性蛋白質。膜結構域、信號肽及導肽預測表明,5種植物的VTE4都沒有發現明顯的跨膜結構域和信號肽,但是可能作為葉綠體轉運蛋白行使功能。據此可以推斷VTE4基因在游離核糖體上起始合成后,可能轉運到葉綠體中發揮作用,與Ferro等[20]研究結果一致。通過NCBI的CDD數據庫對VTE4基因的氨基酸序列分析發現,γ-生育酚甲基轉移酶均含有S-腺苷甲硫氨酸結合位點、AdoMet_
MTases保守域、AdoMet_MTases superfamily家族和PLN02244保守結構域,其中PLN02244保守結構域是γ-生育酚甲基轉移酶的特征結構域。這些預測結果與花生、紫花苜蓿和大豆VTE4的研究結果基本一致[18,21-22]。油棕等11種植物VTE4氨基酸序列比對和分子進化樹聚類分析發現,不同植物的VTE4序列相似性高,其功能域非常保守,而以VTE4氨基酸序列構建的進化樹對判斷物種間的親緣關系具有參考作用。油棕等植物VTE4的氨基酸序列分析可以作為判斷不同物種間親緣關系的依據,例如可以用來判斷油棕種間親緣關系,進行油棕種間進化分析。通過對油棕等不同植物的γ-生育酚甲基轉移酶進行生物信息學預測和分析,豐富了油棕等植物的分子生物學信息,為今后深入研究和利用油棕等植物的VTE4基因奠定了基礎。
參考文獻
[1] 雷新濤, 曹紅星. 油棕[M]. 北京: 中國農業出版社, 2013: 103-104.
[2] Regina B F, Maret G T. Vitamin E: function and metabolism[J]. The FASEB Journal, 1999, 13(10): 1 145-1 155.
[3] Laura U G, Maria M L, Cori H, et al. Genetic basis for natural variation in seed vitamin E levels in Arabidopsis thaliana[J]. PNAS, 2006, 103(49): 18 834-18 841.
[4] Michel H, Francoise E, Svetlana P, et al. Vitamin E protects against photoinhibition and photooxidative stress in Arabidopsis thaliana[J]. The Plant Cell, 2005, 17(12): 3 451-3 469.
[5] Zhirong L, Jay D K, Krishna K N. Overlapping photoprotective function of vitamin E and carotenoids in Chlamydomonas[J]. Plant Physiol, 2012, 158(1): 313-323.
[6] David S, Dean D P. Elevating the vitamin E content of plants through metabolic engineering[J]. Science, 1998, 282(5 396): 2 098-2 100.
[7] Gerald R, Anne M M, Jonathan M, et al. Regulation of cell signaling by vitamin E[J]. Proceeding of the Nutrition Society, 2002, 61(4): 415-425.
[8] Clarke M W, Burnett J R, Croft K D. Vitamin E in human health and disease[J]. Crit Rev Clin Lab Sci, 2008, 45(5): 417-450.
[9] Moriguchi S, Muraga M. Vitamin E and immunity[J]. Vitam Horm, 2000(59): 305-336.
[10] Ju J, Picinich S C, Yang Z, et al. Cancer-preventive activities of tocopherols and tocotrienols[J]. Carcinogenesis, 2010, 31(4): 533-542.
[11] Peter W, Adrianne B, Lawrence J M. Vitamin E and human health: Rationale for determining recommended intake levels[J]. Nutrition, 1997, 13(5): 450-460.
[12] Dean D, Barry J P. Vitamin synthesis in plants: Tocopherols and Carotenoids[J]. Annual Review of Plant Biology, 2006(57): 711-738.
[13] Li Y, Zhou Y, Wang Z, et al. Engineering tocopherol biosynthetic pathway in Arabidopsis leaves and its effect on antioxidant metabolism[J]. Plant Sci, 2010, 178(3): 312-320.
[14] Jessica E, Xingxing W, Daguang C, et al. Genetic mapping, cloning, and functional characterization of the BnaX.VTE4 gene encoding a γ-tocopherol methyltransferase form oilseed rape[J]. Theoretical and Applied Genetics, 2009, 119(3): 567-575.
[15] Maria S D, Tetsuya Y, Masako S, et al. Genetic variation of γ-tocopherol methyltransferase gene contributes to elevated α-tocopherol content in soybean seeds[J]. BMC Plant Biology, 2011(11): 152.
[16] Yusuf M A, Sarinl N B. Antioxidant value addition in human diets: genetic transformation of Brassica juncea with γ-TMT gene for increased α-tocopherol content[J]. Transgenic Res, 2007, 16(1): 109-113.
[17] 陳觀水, 余文杰, 阮孝麟, 等. 甘薯等7種植物NPR1基因的生物信息學分析[J]. 熱帶作物學報, 2011, 32(5): 881-885.
[18] 李拴柱, 萬勇善, 劉鳳珍. 花生γ-生育酚甲基轉移酶基因(γ-TMT)的克隆及序列分析[J]. 作物學報, 2012, 38(10): 1 856-1 863.
[19] Koch M, Lemke R, Heise K P, et al. Characterization of γ-tocopherol methyltransferase from Capsicum annuum L. and Arabidopsis thaliana[J]. Eur J Biochem, 2003, 270(1): 84-92.
[20] Ferro M, Brugiere S, Salvi D, et al. AT_CHLORO: a comprehensive chloroplast proteome database with sub-plastidial localization and information for functional genomics using quantitative label-free analyses[J]. Molecular and Cellular Porteomics, 2010(9): 1 063-1 084.
[21] 賈會麗, 王學敏, 高洪文, 等. 紫花苜蓿γ-生育酚甲基轉移酶(γ-TMT)基因的克隆與逆境下的表達分析[J]. 草業學報, 2012, 21(6): 198-206.
[22] 胡英考, 孟憲萍, 李雅軒, 等. 大豆γ-生育酚甲基轉移酶基因的克隆與表達分析[J]. 大豆科學, 2011, 30(2): 198-204.