摘要: 膜蕨科植物是薄囊蕨類中種類最多的科,主要分布在潮濕的熱帶地區,擁有陸生、附生、半附生和攀生等多種生態型。為進一步了解膜蕨科植物輻射式物種分化的分子適應機制,該研究在時間框架下采用位點模型對膜蕨科植物rbcL基因的進化式樣進行分析。結果表明:共鑒定出6個氨基酸正選擇位點(125I、227L、231A、258F、304S和351L),其中位點304S位于環六上,對維持Rubisco功能有重要作用。此外,還計算了Rubisco大亞基內部氨基酸位點之間的共進化關系,共檢測出39組(35個氨基酸)共進化位點,其中位點在α螺旋上的占46%,在β折疊上的占14%。膜蕨科植物rbcL基因這種復雜的進化式樣可能與其起源較早有關。鑒于此,基于UCLD分子鐘模型對膜蕨科植物的分化時間進行了估計,結果顯示膜蕨科植物首次發生分歧的時間在三疊紀早期,瓶蕨屬和膜蕨屬的分歧時間分別發生在侏羅紀早期和白堊紀晚期,并且得出陸生生態型是其它生態型進化的基礎,推測最近幾次最熱事件可能對物種分化的形成產生一定的作用。該研究結果對認識膜蕨科植物如何應對被子植物興起所導致的陸地生態系統改變具重要意義。
關鍵詞: 膜蕨科, rbcL基因, 共進化, 正選擇位點, 生態型
中圖分類號: Q941.2文獻標識碼: A文章編號: 10003142(2017)02014508
Abstract: Hymenophyllaceae is the most rich speices family of leptosporangiate ferns. It mainly distributed in the humid tropics, possessing terrestrial, epiphytic, hemepiphytic and climbing ecotypes. To further understand the molecular adaptation linked to fern radiation, evolutionary patterns of the rbcL sequences in the family Hymenophyllaceae were examined using randomsite models along with the estimated timescale of Hymenophyllaceous phylogeny. By comparing Modles M1a/M2a and M7/M8 under randomsite modles, six amino acid sites (125I, 227L, 231A, 258F, 304S and 351L) were found to be positively selected, in which the site 304S was located in the Dloop six, playing an important role in keeping Rubisco function. We also used CAPS v1.0 (coevolution analysis using protein sequences) to study the evolutionary relationship between the amino sites within the Rubisco large subunit. Thirtynine groups of coevolutionary sites were detected (totally thirtyfive amino sites), of which 46% were located in the αhelix, 14% in the βsheet. This complex evolutionary patterns may be related to its earlier origin. In view of this, the phylogenetic tree was reconstructed. The results showed that the initial divergence whin Hymenophyllaceae occurred in the early Triassic. The divergence within Trichomanes and Hymenophyllum occurred in the early Jurassic and Cretaceous, seperatelly. The results also indicated that the ancestral state for the Hymenophyllaceae was terrestrial, suggesting possible roles played by the Thermal Maximum recently. These results provide new insights for how Hymenophyllaceae ferns response to the terrestrial ecosystem changes caused by the rise angiosperms.
Key words: Hymenophyllaceae, rbcL gene, coevolution, positive selection, ecotypes
核酮糖1,5二磷酸羧化酶/加氧酶(簡稱Rubisco),是葉綠體基質中的可溶性蛋白。該酶在植物光合作用中發揮重要作用,既是固定CO2的羧化酶,也是光呼吸途徑中的加氧酶(Rowan Athena,2006;張江洪等,2002)。光呼吸代謝途徑消耗光合作用過程中合成的有機物,由此造成的損失非常高。現已知,葉綠體rbcL基因編碼Rubisco大亞基,且大亞基的C末端與催化固定CO2密切相關(Spreitzer Salvuccim,2002;Curmipm et al,1992)。鑒于此,若能深入了解Rubisco的結構并對其進行改造,適當增強與CO2的親合力,則能提高植物的光合效率(蔣德安等,2001;洪健等,2004)。
基因序列適應性進化分析可為深入理解蛋白質的結構和功能提供參考信息。將蛋白質編碼序列分為同義置換(dN)和非同義置換(dS)。 ω=dN/dS可用來判斷蛋白質中氨基酸位點的進化方式(Yang,2007)。當 ω=1表示為中性進化; ω<1說明受到負選擇; ω>1表明發生了正向選擇,也即暗示蛋白質發生了適應性進化。與此同時,蛋白質內部氨基酸位點并不是孤立存在,單獨進化的,它們之間存在一種共進化關系。氨基酸位點間的這種共進化關系的復雜性與它們在結構和功能上的聯系成正比,正是這種分子內部氨基酸位點間的共進化關系網促成了蛋白質的進化。近年來有文獻報道,發生正選擇的位點多數都伴隨著與其它氨基酸之間的復雜的共進化關系,鑒于此,我們計算了Rubisco大亞基內部各氨基酸位點間的共進化關系,以期為研究其功能提供精確的位點參考信息。
膜蕨科植物有750~800種,是薄囊蕨類中種類最多的科,主要分布在潮濕的熱帶地區,擁有多種生態型(陸生、附生、半附生和攀生等)。考慮到膜蕨科植物生境的異質性(Zhang et al,2006),推測在物種發生輻射式分化的過程中,參與光合作用的關鍵基因可能也發生了某種程度的適應性進化。鑒于此,本研究的目的是①揭示膜蕨科植物rbcL基因編碼的氨基酸位點發生適應性進化式樣并進一步檢測各氨基酸位點間的共進化關系;②對膜蕨科植物分歧時間進行估計;③初步探討膜蕨科植物不同生態型之間的進化關系。
1材料與方法
1.1 序列數據
由GenBank獲得膜蕨科139種植物的rbcL基因序列(表1),根據文獻以4種植物(水蕨,楔葉鐵線蕨,鳳丫蕨和沼澤蕨)為外類群(Qin,1978)。使用ClustalW(Thompson et al,1994)軟件對序列進行比對,共獲得402個密碼子。
1.2 統計分析
運行Modeltest 3.7(Pos Crandall,1998)軟件選取核苷酸進化模型。采用Mrbayes 3.1.2(Hulsenbeck Ronquist,2001)軟件構建膜蕨科植物系統發育樹。根據MCMC(Markov Chain Monte Carlo)理論計算15 000 000代,每100代取樣1次,總共產生150 000棵樹,運算過程按照4條鏈同時運行(3條熱鏈和1條冷鏈),這樣最開始的37 500棵樹作為預熱樣本被摒棄掉,用余下的樣本在時間框架下構建一致樹。使用Tracer v1.4.1(Rambaut Drummonda,2008)軟件檢測運算的收斂程度。最后用Figtree v1.2.3(Rambaut Drummonda,2009)軟件查看膜蕨科植物的系統發育關系。
利用BEAST v2.2.1軟件估計膜蕨科植物的分歧時間(Drummond Rambaut,2007)。根據所得的系統發育關系將所有植物劃分為5個類群集。為準確估計膜蕨科植物的分歧時間,本研究基于最近共同祖先時間(tMRCA)值校正主要分支的分歧時間,由于沒有可用化石記錄的報道,我們采用外類群水蕨屬,楔葉鐵線蕨屬和鳳丫蕨屬的分歧時間進行單點校正(Pryer et al,2004;Schneider et al,2004)(圖1)。采用Modeltest 3.7軟件選取核苷酸進化模型并計算30 000 000代,每1 000代取樣1次,最開始的7 500棵樹作為預熱樣本被摒棄掉,用Figtree v1.2.3(Rambaut Drummonda,2009)軟件查看剩余樣本重建的最大置信度時間樹。
采用位點模型進行適應性進化分析,根據dN和dS的比值( ω>1)來判斷氨基酸位點是否發生正向選擇(Yang,2007)。其中,M0模型設定系統樹上所有的位點及分支具有同樣的 ω值,即單一比值。近中性M1a模型假設蛋白質具保守(0< ω<1)和中性( ω=1)兩類位點。M2a(選擇)模型中 ω值可以大于1,為自由參數,由此衍生出第三類位點。M3模型可以根據離散型分布分別計算出三類位點的 ω比值(ω1 、ω2和 ω3)及其所占比例(p0、p1和p2)。M7模型允許 ω值在0到1之間,符合beta分布(p,q)。M8(beta和 ω)模型允許 ω值大于1,其數值和比例可由數據計算獲得,這樣,M8在M7基礎上新增了一類位點。與M8模型類似,M8a(beta和 ω=1)模型設定 ω值固定為1。在此設定基礎上對模型進行成對比較(M1aM2a、M7M8和M8M8a),根據比較的結果便可判定位點是否發生過正向選擇(Nielsen Yang,1998)。以上各種模型的參數利用PAML4軟件計算獲得(Yang,2007)。
同時,用CAPS v1.0 (coevolution analysis using protein sequences) 計算Rubisco大亞基內部氨基酸位點之間的共進化關系(Fares,2006)。CAPS既能計算分子內共進化又能計算分子間共進化,本研究屬于分子內共進化。CAPS通過檢測氨基酸位點的進化速率相關性來揭示它們之間是否存在共進化關系。計算中設置 α值為0.001,隨機抽樣值設置為1 000 000,以此減少假陽性。此外,為了消除系統發育拓撲結構的影響,我們采用CAPS v1.0中的亞程序,通過去掉一些明顯具有系統發育關系(后驗概率>75%)的分支來鑒定出結構和功能共進化位點。
2結果與分析
2.1 膜蕨科的系統發育和分化時間
膜蕨科植物的系統發育關系如圖1,主要聚為兩大類群(后驗概率值為1.00):類群1包括除膜蕨屬之外的膜蕨科大部分屬(后驗概率值為0.97);類群2主要由膜蕨屬、簇生蕨屬、細口團扇蕨屬、腎膜蕨屬組成(后驗概率值為1.00),其中腎膜蕨屬首先分化出來,這與傳統分類學的觀點是一致的(張巧艷等,2006)。
BEAST軟件計算結果顯示膜蕨科的首次分歧時間發生在三疊紀早期(約233 Ma;圖1),瓶蕨屬的分歧時間發生在侏羅紀早期(約201 Ma),膜蕨屬的分歧時間發生在白堊紀晚期(約83 Ma)。結果與以往的研究基本一致(Pryer et al,2004)。其次,圖1很清晰地反映了不同種生態型之間的親緣關系,陸生生態型是其它幾種生態型演化的基礎。
2.2 膜蕨科rbcL基因正選擇位點的鑒定和空間位置
利用PAML4軟件計算各種模型的參數值(表2,表3)。在95%水平上,模型M2a鑒定出5個氨基酸位點(125I、227L、231A、304S和351L)受到正向選擇,而模型M8鑒定出有6個氨基酸位點(125I、227L、231A、258F、304S和351L)受到正向選擇。
為了更精確地定位上述6個氨基酸正選擇位點的空間位置,采用參考序列(煙草Rubisco大亞基,登錄號為CAA77361)作為基準進行比對,結果顯示125I、227L、231A、258F、304S和351L六個正選擇位點分別對應于煙草Rubisco大亞基的149Q、251I、255V、282H、328S和375L。用raswin軟件(Roger et al,1995)將這六個位點標定在Rubisco晶體結構圖中,其中125I位于Rubisco大亞基N末端的環上,227L和231A位于羧基末端α/β桶結構域的第3個α螺旋上,258F位于第4個α螺旋上,304S位于α/β桶中的環6上,對維持Rubisco功能有重要作用。351S在α/β桶的第7個β折疊上(圖2)。
2.3 Rubisco大亞基內部氨基酸位點之間共進化分析
為了研究Rubisco大亞基內部氨基酸位點之間的關系,用CAPS v1.0軟件進行共進化分析,共鑒定出39組(35個氨基酸)共進化位點(圖3),為確定這些位點在Rubisco大亞基內部的分布,同樣用raswin軟件進行標定,結果顯示其中位點在α螺旋上的占46%,14%的位點在β折疊上。其中大部分位點間伴隨著疏水性共進化、分子量共進化和疏水性兼分子量共進化(P < 0.01)。另外,用CAPS v1.0的亞程序,在去掉一些明顯具有系統發育關系的分支后,所得結果也是39組結構和功能共進化位點。
3討論
本研究雖然構建系統進化樹的目的是為隨后計算的需要,但仍能給出一些頗具系統分類意義的信息。首先,從系統樹上可以看出,膜蕨科主要分為兩大類群:既瓶蕨屬和膜蕨屬,這與傳統分類學是一致的。其次,對于假脈蕨屬的分類問題一直存在爭論,雖然本研究數據有限,不同屬之間種類數量的差異比較大,但我們仍然建議將假脈蕨屬歸為瓶蕨屬這一大類。此外,鑒于膜蕨科植物生態型的多樣性,我們對其演化關系進行了初步分析,結果與以往的化石證據一致(Axsmith et al,2001;Dubuisson et al,2003),即陸生生態型是其它生態型演化的基礎。與此同時,Pryer et al(2004)提出,最近幾次的最熱事件可能是造成生態型多樣性的原因。
Rubisco的大亞基由N和C兩個結構域組成。N結構域從N末端開始,包括137個氨基酸,其中含有5股β折疊;C結構域中含有豐富的α螺旋,其中以α/β桶狀結構域(α/β barrel domain)最為重要,包括8個α螺旋和8個β折疊,彼此連接成8個環,形成了漏滴狀的活性中心,由兩個大亞基參與組成,Mg2+也參與其中(Knight et al,1990;Sopert et al,1988;Wan et al,2011)。本研究鑒定出的6個正向選擇位點中,227L和231A位于α/β桶結構域的第3個α螺旋上,258F位于第4個α螺旋上,351S在α/β桶的第7個β折疊上。其中,位點231A側鏈由一個甲基構成,相對較短,由此可以預留出更為寬闊的空間,便于進行催化反應(Persson et al,2001)。另外,α/β桶結構域上的環6對Rubisco維持活性狀態非常關鍵(Chen Spreitzer,1989)。而本研究鑒定出的位點304S就位于環6上。至于位點125I,它并不位于酶活性中心區域,推測是在亞基間相互結合時起作用。這些被鑒定出的正向選擇位點可為后續的基因工程實驗提供參考,推進Rubisco催化機制研究的進程(森林等,2010)。
為進一步加深對Rubisco大亞基的了解,我們研究了Rubisco大亞基內部氨基酸位點間的共進化關系,結果顯示疏水性、分子量和疏水性兼分子量共進化位點皆為39組,這可能與rbcL基因高度保守有關。為排除系統發育拓撲結構的影響,在去掉一些明顯具有系統發育關系的分支后,得到的結果也是39組共進化位點,進一步證明rbcL基因的高度保守性。另外,Rubisco活性中心的3個賴氨酸殘基(Lys175、Lys201和Lys334)高度保守且與Rubisco活性狀態密切相關(熊曉然等,2003)。本研究的共進化位點中沒有這3個氨基酸,且在這3個位點8范圍內并無發現任何其它氨基酸,說明在Rubisco大亞基空間結構中并沒有其它氨基酸與這3個氨基酸相互作用,再次證明了這3個位點的高度保守性,不受其它氨基酸的影響,對維持Rubisco功能的正常工作起到重要作用。同時,我們發現用paml檢測出的6個正選擇位點,除位點351L外都存在共進化氨基酸位點。另外,這些與正選擇位點存在共進化關系的氨基酸位點很少在α/β桶上,即不在活性中心,這可能是為了更好地維護Rubisco的功能而減少正選擇位點帶來的影響。與其它正選擇位點相比,與125I共進化的位點只有3個,351L在Rubisco大亞基內部沒有檢測出共進化氨基酸位點,且這兩個氨基酸分別位于Rubisco大亞基結構的C端和N端。我們推測與這兩個正選擇位點共進化的氨基酸可能位于Rubisco小亞基上,這需要計算分子間共進化來證明(Rubisco大、小亞基之間的共進化),這是我們下一步研究的方向。
參考文獻:
AXSMITH BJ, KRINGS M, TAYLOR TN, 2001. A filmy fern from the Upper Triassic of North Carolina (USA) [J]. Am J Bot, 88(9): 1558-1567.
CHEN Z, SPREITZER RJ, 1989. Chloroplast intragenic suppression enhances the low CO2/O2 specificity of mutant ribulosebisphosphate carboxylase/oxygenase [J]. J Biol Chem, 264(6): 3051-3053.
CURMIPM G, CASCI OD, SWEET RM, et al, 1992. Crystal structure of the unactivated form of ribulose1,5bisphosphate carboxylase/oxygenase from tobacco refined at 2.0 resolution [J]. J Biol Chem, 267(24): 16980-16989.
DRUMMOND AJ, RAMBAUT A, 2007. BEAST: Bayesian evolutionary analysis by sampling trees [J]. BMC Evol Biol, 7(2): 214-221.
DUBUISSON JY, HENNEQUIN S, RAKOTONDRAINIBE F, et al, 2003. Ecological diversity and adaptive tendencies in the tropical fern Trichomanes L. (Hymenophyllaceae) with special reference to epiphytic and climbing habits [J]. Bot J Linn Soc, 142(142): 41-63.
FARES M, 2006. [20150713]. CAPS v1.0 http://bioinf.gen.tcd.ie/~faresm.
HONG J, WANG WB, HU DW, 2004. The immunogold localization of rubisco and its activase in chloroplast of barley and maize leaves [J]. J Plant Physiol Mol Biol,30(5): 561-568. [洪健, 王衛兵, 蔣德安, 等, 2004. 大麥和玉米葉片葉綠體中Rubisco及其活化酶的免疫金標記定位 [J]. 植物生理與分子生物學學報, 30(5): 561-568.]
HULSENBECK JP, RONQUIST F, 2001. Mr. Bayes: Bayesian inference of phylogeny [J]. Bioinformatics, 17(3):754-755.
JIANG DA, WENG XY, LU Q, 2001. Quantitation of Rubisco activase by single radial immunodiffusion [J]. J Zhejiang Univ (Agric Life Sci Ed), 27(3): 255-258. [蔣德安, 翁曉燕, 陸慶, 2001. Rubisco活化酶免疫單擴散定量分析研究 [J]. 浙江大學學報(農業與生命科學版), 27(3): 255-258.]
KNIGHT S, ANDERSSON I, BRANDEN CI, 1990. Crystallographic analysis of ribulose 1,5bisphosphate carboxylase from spinach at 2.4 resolution Subunit interactions and active site [J]. J Mol Biol, 215(23): 113-160.
NIELSEN R, YANG Z, 1998. Likelihood models for detecting positively selected amino acid sites and applications to the HIV1 envelope gene [J]. Genetics, 148(3): 929-936.
PERSSON E, BAK H, OLSEN O, 2001. Substitution of valine for leucine 305 in factor VIIa increases the intrinsic enzymatic activity [J]. J Biol Chem, 276(31): 29195-29199.
POS ADAD, CRANDALL KA, 1998. Modeltest: testing the model of DNA substitution [J]. Bioinformatics, 14(9): 817-818.
PRYER KM, SCHUETTPELZ E, WOLF PG,et al, 2004. Phylogeny and evolution of ferns (monilophytes) with a focus on the early leptosporangiate divergences [J]. Am J Bot, 91(10): 1582-1598.
QIN RC, 1978. Fern families and genera in China: their system of arrangement and history origin [J]. J Syst Evol, 3(4): 16-37. [秦仁昌, 1978. 中國蕨類植物科屬系統排列和歷史來源 [J]. 植物分類學報, 3(4): 16-37.]
RAMBAUT A, DRUMMONDA J, 2008. [20150615]. Tracer v1.4.1 http://tree.bio.ed.ac.uk/software/tracer/.
RAMBAUT A, DRUMMONDA J, 2009. [20150627]. FigTree v1.2.3 http://tree.bio.ed.ac.uk/software/figtree/.
ROGER A, SAYLE E, JAMES MW. 1995. RASMOL: biomolecular graphics for all [J]. Trends Biochem Sci, 20(9): 374-376.
ROWAN FS, ATHENA DMK, 2006. Is C4 photosynthesis less phenotypically plastic than C3 photosynthesis [J]. J Exper Bot, 57(2): 303-317.
SCHNEIDER H, SCHUETTPELZ E, PRYER KM, et al, 2004. Ferns diversied in the shadow of angiosperms [J]. Nature, 428(6982): 553-557.
SEN L, SU YJ, ZHANG B, et al, 2010. Adaptive evolution of the rbcL gene in pteridaceous ferns [J]. J Trop Subtrop Bot, 18(1): 1-8. [森林, 蘇應娟, 張冰, 等, 2010. 鳳尾蕨科植物rbcL基因的適應性進化分析 [J]. 熱帶亞熱帶植物學報, 18(1): 1-8.]
SOPERT S, MURALR J, LARIMER FW, et al, 1988. Essentiality of Lys329 of ribulose 1,5bisphosphate carboxylase/oxygenase from Rhodospirillum rubrum as demonstrated by site 2directed mutagenesis [J]. Protein Eng, 2(1): 39-44.
SPREITZER RJ, SALVUCCIM E, 2002. Rubisco: Structure, regulatory interactions, and possibilities for a better enzyme [J]. Ann Rev Plant Biol, 53(1): 449-475.
THOMPSON JD, HIGGINSD G, GIBSON TJ, 1994. CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positionsspecific gap penalties and weightmatrix choice [J]. Nucl Acids Res, 22(22): 4673-4680.
WAN D, WANG A, ZHANG X,et al, 2011. Gene duplication and adaptive evolution of the CHSlike genes within the genus Rheum (Polygonaceae) [J]. Biochem Syst Ecol, 39(1): 651-659.
XIONG XR, CHEN WM, FENG SY, et al, 2003. Simulation on botanic rubisco active center [J]. Chin J Biochem Mol Biol, 19(4): 493-498. [熊曉然, 陳蔚梅, 馮勝彥, 等, 植物Rubisco活性中心的模擬分析 [J]. 中國生物化學與分子生物報, 19(4): 493-498.]
YANG Z, 2007. PAML 4: a program package for phylogenetic analysis by maximum likelihood [J].Mol Biol Evol, 24(8): 1586-1591.
ZHANG JH, YNAG HJ, LIN MQ, et al, 2002. Localization of ribulose1,5bisphosphate carboxylase in leaves of two clones of Hevea brasiliensis by immunofluorescence method [J]. J Fujian Agr For Univ (Nat Sci Ed),31(2): 234-237. [張江洪, 楊漢金, 林梅馨, 等, 2002. 巴西橡膠兩品系葉片RuBP羧化酶的免疫熒光定位 [J]. 福建農林大學學報(自然科學版), 31(2): 234-237.]
ZHANG QY, SU LJ, LIU XR, et al, 2006. Advances in the systematic studies of the Hymenophyllaceae [J]. Biotechnol Bull, 8(1): 63-66. [張巧艷, 蘇立娟, 劉曉瑞, 等, 2006. 膜蕨科系統學研究進展 [J]. 生物技術通報, 8(1): 63-66.]