999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于5993個(gè)核基因的被子植物系統(tǒng)發(fā)育關(guān)系研究

2020-03-02 07:46:59金鑫程書楊拓余慷段肖霞倪雪梅李世明張耕耘
廣西植物 2020年1期

金鑫 程書 楊拓 余慷 段肖霞 倪雪梅 李世明 張耕耘

摘 要:系統(tǒng)發(fā)育關(guān)系的構(gòu)建對(duì)被子植物分類及進(jìn)化研究非常重要。長期以來,被子植物系統(tǒng)發(fā)育的研究,大多使用質(zhì)體基因、線粒體基因或少數(shù)保守的單拷貝核基因。該研究從已注釋基因組或轉(zhuǎn)錄組中搜集88種被子植物(包含58目)的核基因集;通過對(duì)其進(jìn)行同源基因聚類及去旁系同源基因,獲得了5 993個(gè)一對(duì)一的直系同源基因家族(即對(duì)于每個(gè)基因家族,每種植物最多一條序列,最少包含50個(gè)物種);使用截取各種不同數(shù)目基因集的DNA或氨基酸序列,采用串聯(lián)法(concatenation)和溯祖法(coalescence),共構(gòu)建了20棵進(jìn)化樹。比較這些進(jìn)化樹,雖然大部分結(jié)果支持APG IV中描述的被子植物主要支系之間的關(guān)系[(真雙子葉植物,單子葉植物),木蘭類植物],但真雙子葉植物內(nèi)部各目分支的演化關(guān)系與APG IV有一個(gè)很大的不同,即認(rèn)為檀香目和石竹目是薔薇類植物的姊妹群。基于這些進(jìn)化樹,估算了被子植物各目分支的分化時(shí)間,結(jié)果表明被子植物的起源時(shí)間為237.78百萬年前(95%置信區(qū)間為202.6~278.08),與主流觀點(diǎn)認(rèn)為的225百萬年至240百萬年前一致。以上結(jié)果為構(gòu)建進(jìn)化樹提供了一種可行性策略,這種方法允許使用基因數(shù)目更多而計(jì)算速度更快。

關(guān)鍵詞:系統(tǒng)發(fā)育關(guān)系,被子植物,核基因,同源基因聚類,串聯(lián)法,溯祖法,分化時(shí)間

中圖分類號(hào):Q949.4文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1000-3142(2020)01-0044-16

Abstract:Construction of phylogeny is important for classification and research of angiosperms. For a long time,angiosperm phylogeny has been analysed using plastid genes,mitochondrial genes or a few conserved single-copy nuclear genes. We collected nuclear gene sets of 88 species of angiosperm (contains 58 orders) from annotated genomes or transcriptomes. By using a combined homology- and phylogeny tree-based approach,we obtained a total of 5 993 one-to-one ortholog groups (one sequence of each species for each ortholog group),each of which was represented by at least 50 species. Then,a total of 20 species trees were reconstructed using? methods with different combinations of reconstruction (concatenation-based and coalescence-based) and sequence type (nucleotide or amino acid) for gene data sets with different gene occupancy values. Most of the resulting topologies support the relationships of the major clades of angiosperm as described in APG IV,but present different deep relationships among major clades in eudicots phylogeny such as the placement of Santalales and Caryophyllales as sisters to Rosids. We estimate the divergence times of the major clades of angiosperm and conclude that the origin of angiosperm is about 237.78 million years ago(95% confidence interval is 202.6-278.08),which is in accordance with the previously accepted 225 million years to 240 million years ago. This study provides an efficient strategy for building phylogenetic trees using thousands of genes with ultrafast calculation.

Key words:phylogeny,angiosperms,nuclear genes,ortholog inference,concatenation,coalescence,divergence time

系統(tǒng)發(fā)育樹的正確構(gòu)建對(duì)植物分類及進(jìn)化研究非常重要。進(jìn)化樹構(gòu)建的準(zhǔn)確度主要受以下因素的影響。其一,所使用的數(shù)據(jù)集的種類及大小。不僅使用形態(tài)性狀數(shù)據(jù)、質(zhì)體基因、線粒體基因及核基因序列建立的進(jìn)化樹不一樣(Endress & Doyle,2009; Soltis et al.,2011; Ruhfel et al.,2014; Zeng et al.,2014),使用全長核酸序列或僅使用基因密碼子某個(gè)位點(diǎn)的核酸序列及氨基酸序列所構(gòu)建的進(jìn)化樹也有所不同(Wickett et al.,2014);其二,構(gòu)建樹的方法及模型。方法有串聯(lián)法(concatenation)和溯祖法(coalescence)。串聯(lián)法是將所有基因串聯(lián)作為一個(gè)整體,使用軟件RAxML(Stamatakis,2014)或iqtree(Nguyen et al.,2015)構(gòu)建系統(tǒng)發(fā)育樹;溯祖法是先對(duì)每個(gè)基因建樹,再使用軟件ASTRAL(Zhang et al.,2017)建立所有基因樹的共有樹(Wickett et al.,2014)。而構(gòu)建系統(tǒng)發(fā)育樹使用的模型更是多種多樣,如核酸模型GTR、HKY、JC、F81、K2P、K3P、K81uf等,蛋白質(zhì)模型LG、Poisson、cpREV、mtREV、Dayhoff、mtMAM、JTT、WAG等(Nguyen et al.,2015)。

被子植物是植物界最高等且種類最多的一類,它們在地球上占據(jù)著絕對(duì)優(yōu)勢。現(xiàn)在已報(bào)道被子植物有352 000種(http://www.theplantlist.org/),屬于416科和64目,各目之間的演化關(guān)系一直是研究的熱點(diǎn)和爭論的焦點(diǎn)。被子植物除了最基部的三個(gè)目:無油樟目(Amborellales)、睡蓮目(Amborellales)和木蘭藤目(Austrobaileyales),又稱ANITA組,其余的(99.95%)可以分為五類:木蘭類植物(magnoliids)、單子葉植物(monocots)、真雙子葉植物(eudicots)、金栗蘭科(Chloranthaceae)和金魚藻科(Ceratophyllaceae)。這五類的系統(tǒng)演化拓?fù)潢P(guān)系一直存在爭論,Zeng et al.(2014)總結(jié)了已經(jīng)發(fā)表的五種主要的拓?fù)潢P(guān)系(圖1:A-E),其中A是最主流的,也是APG IV(The Angiosperm Phylogeny Group,2016)的拓?fù)浣Y(jié)構(gòu)。Soltie et al.(2011)使用17個(gè)基因串聯(lián)(包括質(zhì)體基因、線粒體基因和核基因)為640種植物構(gòu)建的系統(tǒng)發(fā)育進(jìn)化樹和Ruhfel et al.(2014)使用78個(gè)質(zhì)體基因串聯(lián)為360種植物構(gòu)建的進(jìn)化樹,支持主流A拓?fù)浣Y(jié)構(gòu)。Wickett et al.(2014)使用674個(gè)核基因串聯(lián)為92種植物構(gòu)建的進(jìn)化樹和Zeng et al.(2014)使用59個(gè)核基因串聯(lián)為61種植物構(gòu)建的進(jìn)化樹,支持B拓?fù)浣Y(jié)構(gòu)。除此之外,Qiu et al.(2010)使用4個(gè)線粒體基因?yàn)?80種植物構(gòu)建的進(jìn)化樹,支持C拓?fù)浣Y(jié)構(gòu);Endress & Doyle(2009)使用形態(tài)性狀構(gòu)建的進(jìn)化樹,支持D拓?fù)浣Y(jié)構(gòu);Zhang et al.(2012)使用5個(gè)核基因?yàn)?1種植物構(gòu)建的進(jìn)化樹,支持E拓?fù)浣Y(jié)構(gòu)。

去掉金栗蘭科和金魚藻科后,單子葉植物、木蘭類植物、真雙子葉植物之間的系統(tǒng)發(fā)育關(guān)系有三種:(真雙子葉植物,單子葉植物),木蘭類植物;(真雙子葉植物,木蘭類植物),單子葉植物;(單子葉植物,木蘭類植物),真雙子葉植物。Lu et al.(2018)使用4個(gè)質(zhì)體基因和1個(gè)線粒體基因分析了5 864種中國被子植物(幾乎包括所有中國地區(qū)被子植物)的系統(tǒng)發(fā)育關(guān)系,其構(gòu)建的進(jìn)化樹支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,單子葉植物),木蘭類植物]。Chen et al.(2019)發(fā)布了木蘭類植物鵝掌楸(Liriodendron)基因組,使用其502個(gè)核基因及溯祖法為18種植物構(gòu)建的進(jìn)化樹,同樣支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,單子葉植物),木蘭類植物]。Chaw et al.(2019)發(fā)布了另一個(gè)木蘭類植物牛樟(stout camphor tree)基因組,使用其211個(gè)核基因?yàn)?3種植物構(gòu)建的進(jìn)化樹,支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,木蘭類植物),單子葉植物]。Li et al.(2019)使用2 881種被子植物的質(zhì)體基因組的80個(gè)基因重建了被子植物高分辨率的系統(tǒng)發(fā)育樹,支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,單子葉植物),木蘭類植物]。從上述已有的研究中,我們發(fā)現(xiàn),使用核基因串聯(lián)法建立的進(jìn)化樹基本都支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,木蘭類植物),單子葉植物],使用核基因溯祖法、質(zhì)體和線粒體基因建立的進(jìn)化樹基本都支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,單子葉植物),木蘭類植物]。

真雙子葉植物內(nèi)部各目的系統(tǒng)發(fā)育關(guān)系也存在爭論(圖1:F-K),真雙子葉植物除了最基部的毛茛目(Ranunculales)、山龍眼目(Proteales)、昆欄樹目(Trochodendrales)、黃楊目(Buxales)和洋二仙草目(Gunnerales),其余的可以分為兩類:薔薇類植物(Rosids)和菊類植物(Asterids)。這兩類植物的基部有6個(gè)目的系統(tǒng)發(fā)育關(guān)系比較混亂,即五椏果目(Dilleniales)、虎耳草目(Saxifragales)、葡萄目(Vitales)、檀香目(Santalales)、智利藤目(Berberidopsidales)及石竹目(Caryophyllales)。Zeng et al.(2017)總結(jié)了已經(jīng)發(fā)表的六種主要的拓?fù)潢P(guān)系(圖1:F-K),其中K是APG IV中所認(rèn)可的拓?fù)浣Y(jié)構(gòu)。Moore et al.(2010)使用83個(gè)質(zhì)體基因?yàn)?6種植物構(gòu)建的進(jìn)化樹,支持“五椏果目是薔薇類植物的姊妹群”;Soltie et al.(2011)使用17個(gè)基因串聯(lián)(包括質(zhì)體基因、線粒體基因和核基因)為640種植物構(gòu)建的進(jìn)化樹和Moore et al.(2011)使用質(zhì)體IR序列為87種植物構(gòu)建的進(jìn)化樹,支持“五椏果目是菊類植物的姊妹群”;Worberg et al.(2007)等使用五個(gè)基因組區(qū)域序列為56種植物構(gòu)建的進(jìn)化樹和Moore et al.(2011)使用質(zhì)體IR序列為244種植物構(gòu)建的進(jìn)化樹,及APG IV都支持“五椏果目是薔薇類植物和菊類植物共同的姊妹群”。大部分研究都支持“葡萄目和虎耳草目是薔薇類植物的姊妹群,智利藤目、檀香目和石竹目是菊類植物的姊妹群”(Worberg et al.,2007; Moore et al.,2010,2011; Yang et al.,2015);Zeng et al.(2017)使用504個(gè)核基因和溯祖法為100種植物構(gòu)建的進(jìn)化樹,支持“檀香目和智利藤目是薔薇類植物的姊妹群”。

被子植物的起源及進(jìn)化一直是植物學(xué)界研究和爭論的熱點(diǎn)。在古生物學(xué)界,很長時(shí)期內(nèi),被子植物的最早化石記錄都是白堊紀(jì)125百萬年前,也是最早的真雙子葉植物化石記錄(Herendeen,1995)。Fu et al.(2018)發(fā)現(xiàn)了早侏羅紀(jì)地層(約175百萬年前)中的“南京花”,其具有花萼、花瓣、雌蕊,有明顯的杯托、下位子房上位花、樹狀的花柱,其種子/胚珠確實(shí)是被完全包裹著,子房壁將種子與外界完全隔絕,這都滿足了被子植物判斷標(biāo)準(zhǔn)。“南京花”的發(fā)現(xiàn),將被子植物最早化石記錄向前推進(jìn)了約5 000萬年,并填補(bǔ)了被子植物化石記錄(125百萬年前)與分子鐘推算時(shí)間(225百萬年至240百萬年前)之間的“侏羅紀(jì)空缺”(Jurassic gap)(Li et al.,2019)。目前,大多數(shù)基于系統(tǒng)進(jìn)化樹的被子植物分化時(shí)間估計(jì)研究,都認(rèn)為被子植物的起源為三疊紀(jì)225百萬年至240百萬年前(Magallon,2010; Smith et al.,2010; Zeng et al.,2014; Mandel,2019),這與起傳粉作用的核心植食性鱗翅目昆蟲的起源時(shí)間(約230百萬年前)一致(Zeng et al.,2014; Li et al.,2019)。

本研究使用超過5 000個(gè)核基因的核酸及蛋白序列,用兩種進(jìn)化樹構(gòu)建方法分析了88種被子植物的系統(tǒng)發(fā)育關(guān)系(包括87科58目),并對(duì)各進(jìn)化分支的分化時(shí)間進(jìn)行了估計(jì)(總流程如圖2)。為了得到準(zhǔn)確可靠的被子植物系統(tǒng)發(fā)育進(jìn)化樹,我們對(duì)5 000多個(gè)核基因進(jìn)行了拆分,得到了包含不同基因數(shù)量的多個(gè)數(shù)據(jù)集,并對(duì)各個(gè)數(shù)據(jù)集進(jìn)行系統(tǒng)發(fā)育樹的構(gòu)建,最后比較了所得到的20棵系統(tǒng)發(fā)育進(jìn)化樹之間的一致性。

1 材料與方法

1.1 材料

我們收集了1個(gè)裸子植物(Ginkgo biloba作為外類群)基因組、43個(gè)被子植物基因組(主要來自NCBI和PHYTOZOME數(shù)據(jù)庫)、43個(gè)被子植物已拼接轉(zhuǎn)錄組(http://www.onekp.com/public_data.html )及2個(gè)被子植物RNA-seq數(shù)據(jù)(其中無葉蓮Petrosavia sakurai是本研究測序的物種),A-E. 五類被子植物間[金栗蘭科(Chl)、金魚藻科(Cer)、木蘭類植物(Mag)、單子葉植物(Mon)及真雙子葉植物(Eud)]5種代表性拓?fù)浣Y(jié)構(gòu); F-K. 真雙子葉植物內(nèi)部各目間6種代表性拓?fù)浣Y(jié)構(gòu)。

A-E. Five representative topologies among eudicots (Eud),monocots (Mon),magnoliids (Mag),Ceratophyllaceae (Cer) and Chloranthaceae (Chl); F-K. Six representative topologies among eudicots.其中被子植物共包含87科58目(表1)。

1.2 基于基因組序列的直系同源基因鑒定

我們使用Yang & Smith(2014)報(bào)道的方法,對(duì)43個(gè)植物基因組的基因集進(jìn)行同源基因聚類分析。首先,使用軟件BLASTN v2.6.0+ 對(duì)43個(gè)基因集CDS序列進(jìn)行all-by-all blast,每條序列取最佳的1 000條比對(duì)結(jié)果,去掉比對(duì)長度小于1/3總長的序列,修剪未比對(duì)上的末端序列。然后,使用MCL軟件(Van,2000)進(jìn)行同源基因聚類(inflation value = 1.4),去除少于20個(gè)植物的基因家族,剩余基因家族使用MAFFT v7.310軟件(Katoh & Standley,2013)進(jìn)行多序列比對(duì)(maximum iterative refinement cycles = 1 000),使用PHYUTILITY v2.2.6軟件(Smith & Dunn,2008)修剪缺失率大于90%的位點(diǎn),使用軟件RAXML v8.2.11(Stamatakis,2014)對(duì)修剪后的多序列比對(duì)數(shù)據(jù)估算系統(tǒng)進(jìn)化樹(model = GTRCAT)。最后修剪掉進(jìn)化樹上的所有旁系同源基因枝,修剪枝長大于0.6的枝、比姐妹枝長十倍的末端枝,單源且全部同樣品的枝只保留一個(gè),修剪枝長比預(yù)期堿基替換率大0.3倍的內(nèi)部枝,再使用MO方法(Yang & Smith,2014)去除所有剩余的旁系同源枝,獲得one-to-one同源基因家族(即每個(gè)樣品最多一條序列),只保留大于20個(gè)樣品的基因家族。

1.3 轉(zhuǎn)錄組及外類群數(shù)據(jù)處理

我們對(duì)兩個(gè)來自兩個(gè)科(無葉蓮科Petrosavia sakurai和鴉跖草科Cyanotis arachnoidea)的RNA-seq數(shù)據(jù)從頭拼接。首先使用Trimmomatic v0.38軟件(Bolger et al.,2014)過濾原始reads數(shù)據(jù)(參數(shù)HEADCROP:15 LEADING:20 TRAILING:20 SLIDINGWINDOW:5:20 MINLEN:50 AVGQUAL:20),再使用Trinity v2.6.6軟件(Grabherr et al.,2011)拼接(min contig length=150 bp),最后使用TransDecoder v5.5.0(https://github.com/TransDecoder/TransDecoder/releases/tag/TransDecoder-v5.5.0 )進(jìn)行CDS和蛋白質(zhì)序列預(yù)測(參考數(shù)據(jù)庫為Swissprot和Pfam-A)。將得到的這兩個(gè)物種的基因集、從onekp數(shù)據(jù)庫下載得到的43種被子植物的基因集和1個(gè)裸子植物(Ginkgo biloba)的基因集,使用HaMStR v13.2.6軟件(Ebersberger et al.,2009)合并到利用基因組數(shù)據(jù)得到的同源基因家族中,最終只保留大于50個(gè)樣品的基因家族。

1.4 系統(tǒng)發(fā)育進(jìn)化樹構(gòu)建

我們采用兩種方法串聯(lián)法 (concatenation)和溯祖法(coalescence),并分別使用CDS序列和氨基酸序列構(gòu)建進(jìn)化樹。無論是CDS序列還是蛋白質(zhì)序列,都使用PRANK v.170427軟件(http://wasabiapp.org/software/prank/)進(jìn)行多序列比對(duì),使用PHYUTILITY v2.2.6軟件(Smith & Dunn,2008)修剪缺失率大于70%的位點(diǎn),其中CDS序列需去除長度小于300個(gè)堿基的序列,蛋白質(zhì)序列需去除長度小于100個(gè)氨基酸的序列。

溯祖法,先對(duì)每個(gè)基因使用RAxML v8.2.11軟件(默認(rèn)參數(shù))(Stamatakis,2014)畫樹,再使用ASTRAL v5.5.9軟件(Zhang et al.,2017)處理所有基因樹,得到共有樹,參數(shù)設(shè)置“-t 1--gene-only”以獲得bootstrap值和基因支持率,枝長使用iqtree v1.5.5軟件(Nguyen et al.,2015)獲得。

串聯(lián)法,先使用PartitionFinder v2.1.1軟件(Lanfear et al.,2009)對(duì)串聯(lián)序列進(jìn)行分區(qū)和進(jìn)化模型檢測,從而設(shè)置較合理的分區(qū)和為每個(gè)分區(qū)選擇合理的進(jìn)化模型。對(duì)CDS序列檢測下列的四個(gè)分區(qū)策略(表2):no partitioning,partitioning by each codon position (three partitions),partitioning by gene和partitioning by each codon position within each gene。對(duì)蛋白質(zhì)序列檢測下列兩個(gè)分區(qū)策略:no partitioning和 partitioning by gene。參數(shù)設(shè)置如下:branch lengths = linked;model_selection = aicc;search = user;models = GTR,GTR+G,GTR+I+G(CDS序列)或者models = LG+G,LG+I+G,WAG+G,WAG+I+G(蛋白質(zhì)序列)。再使用iqtree v1.5.5軟件畫樹[1000 ultrafast bootstrap replicates(Von Haeseler et al.,2013),-spp設(shè)置最優(yōu)分區(qū)策略],基因支持率使用ASTRAL v5.5.9軟件(-t 1)獲得。最后使用軟件Evolview v2(He et al.,2016)對(duì)獲得的所有進(jìn)化樹進(jìn)行美化。

A. 每個(gè)同源基因家族含有的基因數(shù)目; B. 每個(gè)樣品含有的同源基因家族數(shù)目。

A. Gene number of each orthologous gene family; B. Number of orthologous genes for each sample.

1.5 分化時(shí)間估計(jì)

我們使用PAML v4.9軟件包 (Yang,2007)的MCMCTREE程序進(jìn)行分化時(shí)間估計(jì),輸入拓?fù)浣Y(jié)構(gòu)為綜合20棵進(jìn)化樹的最佳拓?fù)浣Y(jié)構(gòu)(即使用742個(gè)基因的CDS序列串聯(lián)法獲得的拓?fù)浣Y(jié)構(gòu)),輸入序列為742個(gè)基因的CDS序列。我們先對(duì)每個(gè)基因都分別估計(jì)分化時(shí)間,再綜合742個(gè)基因的分析結(jié)果(即每個(gè)節(jié)點(diǎn)取所有基因的平均值)獲得最終的分化時(shí)間樹。拓?fù)浣Y(jié)構(gòu)的枝長使用JONES+gamma堿基替換模型獲得;rgene gamma設(shè)定為G(1,4.5);sigma2 gamma設(shè)定為G(1,4.5);clock設(shè)定為3;Markov chain Monte Carlo(MCMC)設(shè)定為burnin=50 000,sampfreq=100,nsample=10 000。對(duì)每個(gè)基因,都是分別運(yùn)行兩次獨(dú)立的MCMC(即不同的random seeds),使用Tracer v1.7軟件(https://github.com/beast-dev/tracer/releases/tag/v1.7.1 )觀察運(yùn)行結(jié)果是否穩(wěn)定和收斂,所有節(jié)點(diǎn)及參數(shù)的effective sample size是否大于200。九個(gè)化石校準(zhǔn)設(shè)定如下:銀杏分化時(shí)間為290百萬年至310百萬年前(Gao et al.,1989);單子葉植物和真雙子葉植物分化時(shí)間為130百萬年至200百萬年前(Kumar et al.,2017);真雙子葉植物共同祖先(即最早的雙子葉植物化石記錄)為125 百萬年前(Herendeen,1995; Zeng et al.,2014);山龍眼目(Proteales)的共同祖先為108.8百萬年前(Crane et al.,1996);葡萄目(Vitales)與其余薔薇類植物間分化時(shí)間為105百萬年至115百萬年前(Fawcett et al.,2009; Kumar et al.,2017);Arabidopsis thaliana與Populus trichocarpa間分化時(shí)間為97百萬年至109百萬年前(Kumar et al.,2017);豆目(Fabales)與殼斗目(Fagales)間分化時(shí)間為93.5百萬年前(Friis et al.,1996);山茱萸目(Cornales)共同祖先為85.8百萬年前(Takahashi et al.,2002);唇形目(Lamiales)共同祖先為44.3百萬年前(Call et al.,1992)。

2 結(jié)果與分析

2.1 直系同源基因鑒定

我們對(duì)44個(gè)植物基因組基因集和45個(gè)已拼接轉(zhuǎn)錄組CDS序列進(jìn)行同源基因聚類,并使用Yang & Smith(2014)報(bào)道的方法,去除所有旁系同源基因,最終獲得大于50個(gè)樣品的one-to-one 基因家族(即每個(gè)樣品最多一條序列)共5 993個(gè)(圖3:A),各種植物的基因覆蓋率從33.57%到97.85%,平均為80.40%(圖3:B)。

2.2 系統(tǒng)發(fā)育進(jìn)化樹構(gòu)建

我們采用串聯(lián)和溯祖法共構(gòu)建了20棵進(jìn)化樹,并比較它們之間的不同(圖4),以評(píng)估樹的穩(wěn)定性。CDS序列和蛋白質(zhì)序列,都分別使用五個(gè)數(shù)據(jù)集,總共構(gòu)建20棵樹(5棵CDS串聯(lián)法樹,5棵CDS溯祖法樹,5棵AA串聯(lián)法樹和5棵AA溯祖法樹)。這5個(gè)數(shù)據(jù)集分別包含5 928個(gè)orthologs(≥50 samples)、3 384個(gè)orthologs(≥70 samples)、1 791個(gè)orthologs(≥80 samples)、742個(gè)orthologs(≥85 samples)及42個(gè)orthologs(≥89 samples)。

這20棵進(jìn)化樹主要是為了進(jìn)一步確定圖1中五類被子植物間演化關(guān)系和真雙子葉植物內(nèi)部各目間系統(tǒng)發(fā)育關(guān)系。這些進(jìn)化樹中的大多數(shù),是與使用742個(gè)基因CDS序列(共4 069 848位點(diǎn))串聯(lián)方法建立的進(jìn)化樹高度一致的(圖5)(使用3 384個(gè)基因AA序列建立的進(jìn)化樹,和使用1 791個(gè)基因AA序列建立的進(jìn)化樹,也是相同的最佳拓?fù)浣Y(jié)構(gòu))。

2.2.1 木蘭類植物、單子葉植物及雙子葉植物間演化關(guān)系 無論核酸序列還是蛋白質(zhì)序列,使用串聯(lián)法和溯祖法建立的進(jìn)化樹基本都支持拓?fù)浣Y(jié)構(gòu)[(真雙子葉植物,單子葉植物),木蘭類植物](圖4)。

2.2.2 金栗蘭科與金魚藻科 我們的研究表示,金魚藻科是真雙子葉植物的姊妹群,這與前人的研究結(jié)果一致(圖4)。但金栗蘭科是所有被子植物(除ANITA外)的基底旁系群,這與APG IV認(rèn)為的“金栗蘭科是木蘭類植物的姊妹群”是不同的。

2.2.3 雙子葉植物內(nèi)部各目的系統(tǒng)發(fā)育關(guān)系 我們的研究認(rèn)為,五椏果科是薔薇類植物和菊類植物共同的姊妹群,虎耳草目是薔薇類植物的姊妹群,這都與APG IV一致(圖4)。

APG IV認(rèn)為“檀香目和石竹目是菊類植物的姊妹群”,而我們的研究否定了這一結(jié)論:20棵進(jìn)化樹中,所有結(jié)果都支持“石竹目是薔薇類植物的姊妹群”;大部分支持“檀香目是薔薇類植物的姊妹群”,這與Zeng et al.( 2017)的研究結(jié)果一致;少部分支持“檀香目是薔薇類植物和菊類植物共同的姊妹群”(圖4)。

APG IV認(rèn)為“智利藤目是菊類植物的姊妹群”,而我們的研究只有少部分支持這一結(jié)論。使用蛋白質(zhì)序列建立的進(jìn)化樹,無論串聯(lián)還是溯祖法,都支持“智利藤目是薔薇類植物和菊類植物共同的姊妹群”。使用核酸序列建立的進(jìn)化樹,隨著基因數(shù)目的增多,逐漸轉(zhuǎn)變?yōu)橹С帧爸抢倌渴蔷疹愔参锏逆⒚萌骸保cAPG IV一致(圖4)。

2.3 分化時(shí)間估計(jì)

基于742個(gè)基因CDS序列串聯(lián)方法建立的進(jìn)化樹,我們估計(jì)了被子植物的分化時(shí)間(圖6)。我們認(rèn)為被子植物的起源時(shí)間為237.78百萬年前(95%置信區(qū)間為202.6~278.08),與主流觀點(diǎn)認(rèn)為的225百萬年至240百萬年前一致 (Magallon,2010; Smith et al.,2010; Zeng et al.,2014)。木蘭類植物與單子葉植物和真雙子葉植物的分化時(shí)間約為166.11百萬年前;五椏果科與薔薇類和菊類植物的分化時(shí)間約為124.23百萬年前;薔薇類植物與菊類植物的分化時(shí)間約為116.98百萬年前;唇形類植物(Lmiids)與桔梗類植物(Campanulids)的分化時(shí)間約為102.37百萬年前。

3 討論與結(jié)論

長期以來,被子植物的系統(tǒng)發(fā)育關(guān)系重建,都是使用質(zhì)體基因、線粒體基因或少數(shù)保守的單拷貝核基因。Yang & Smith(2014)報(bào)道了一種基于系統(tǒng)進(jìn)化樹的同源基因聚類及去旁系同源基因的方法,我們使用此種方法對(duì)收集的88種植物核基因集進(jìn)行聚類,共獲得了多達(dá)5 993個(gè)one-to-one基因家族,并從這個(gè)數(shù)據(jù)集里面截取各種大小的數(shù)據(jù)進(jìn)行進(jìn)化樹重建,以測定進(jìn)化樹的穩(wěn)定性。

獲得比以前更多的核基因家族后,制約系統(tǒng)演化關(guān)系構(gòu)建的另一個(gè)因素就是大量的計(jì)算資源和計(jì)算時(shí)間。構(gòu)建系統(tǒng)進(jìn)化樹時(shí),一般需要設(shè)置bootstrap值(100~1 000)迭代,此步驟非常耗費(fèi)計(jì)算時(shí)間。Nguyen et al.(2015)發(fā)表的軟件iqtree,采用ultrafast bootstrap approximation(UFBoot)方法獲得bootstrap值(Von Haeseler et al.,2013),比RAxML軟件的傳統(tǒng)方法,計(jì)算速度快10~40倍,并且獲得的bootstrap值更精確。

我們使用多達(dá)5 993個(gè)one-to-one基因家族構(gòu)建的進(jìn)化樹,與APG IV報(bào)道的主要差異為檀香目和石竹目在系統(tǒng)發(fā)育樹中的位置,本研究認(rèn)為“檀香目和石竹目是薔薇類植物的姊妹群”,而APG IV認(rèn)為“檀香目和石竹目是菊類植物的姊妹群”。可能原因有以下兩個(gè):一是基因數(shù)目的增多;二是本研究所選88個(gè)植物只有一半使用的基因組序列,另一半為轉(zhuǎn)錄組序列,而轉(zhuǎn)錄組序列一般存在大量的基因缺失(即未表達(dá)基因較多)。

A. Bootstrap值; B. 基因支持率。紅色表示支持,藍(lán)色表示拒絕,紅色星星表示支持率最高的拓?fù)浣Y(jié)構(gòu)。

A. Bootstrap value; B. Gene trees support ratio. Red represents support,blue represents rejection,the topology labeled with a red star represents the most support.枝上斜線左邊數(shù)字為bootstrap值,右邊數(shù)字為基因支持率。

灰色條紋為分化時(shí)間的95%置信區(qū)間,九個(gè)化石校準(zhǔn)時(shí)間為(1)銀杏分化時(shí)間為290百萬年至310百萬年前;(2)單子葉植物和真雙子葉植物分化時(shí)間為130百萬年至200百萬年前;(3)真雙子葉植物共同祖先(即最早的雙子葉植物化石記錄)為125 百萬年前;(4)山龍眼目(Proteales)的共同祖先為108.8百萬年前;(5)山茱萸目(Cornales)共同祖先為85.8百萬年前;(6)唇形目(Lamiales)共同祖先為44.3百萬年前;(7)葡萄目(Vitales)與其余薔薇類植物間分化時(shí)間為105百萬年至115百萬年前;(8)豆目(Fabales)與殼斗目(Fagales)間分化時(shí)間為93.5百萬年前;(9)Arabidopsis thaliana與Populus trichocarpa間分化時(shí)間為97百萬年至109百萬年前。

Grey bars are 95% confidence intervals,nine fossil calibration points are as follows:(1) The divergence time of Ginkgo biloba is 290 million years to 310 million years ago; (2) The divergence time of eudicots and monocots is 130 million years to 200 million years ago; (3) The divergence time of eudicots is 125 million years ago; (4) The divergence time of Proteales is 108.8 million years ago; (5) The divergence time of Cornales is 85.8 million years ago; (6) The divergence time of Lamiales is 44.3 million years ago; (7) The divergence time of Vitales from Rosids is 105 million years to 115 million years ago; (8) The divergence time of Fabales and Fagales is 93.5 million years ago; (9) The divergence time of Arabidopsis thaliana and Populus trichocarpa is 97 million years to 109 million years ago.總的來說,本研究不僅進(jìn)一步確定了被子植物各目間系統(tǒng)發(fā)育關(guān)系,而且為“使用更多的基因和計(jì)算速度更快的方法構(gòu)建進(jìn)化樹”探討了一種可行性策略:即使用Yang & Smith(2014)報(bào)道的同源基因聚類及去旁系同源基因方法,獲得大量的one-to-one基因家族,再使用IQ-TREE(串聯(lián)法)和ASTRAL(溯祖法)軟件,能快速精確的計(jì)算出進(jìn)化樹。隨著更多植物基因組的測序和基因聚類及系統(tǒng)發(fā)育關(guān)系構(gòu)建方法的進(jìn)一步優(yōu)化,被子植物系統(tǒng)發(fā)育關(guān)系將越來越精確,例如進(jìn)一步準(zhǔn)確確定檀香目和石竹目在被子植物中與其他進(jìn)化分支之間的關(guān)系。

參考文獻(xiàn):

BOLGERAM,LOHSE M,USADEL B,2014. Trimmomatic:A flexible trimmer for Illumina sequence data[J]. Bioinforma-tics,30(15):2114-2120.

CALL VB,DILCHER DL,1992. Investigations of angiosperms from the Eocene of southeastern North America:Samaras of Fraxinus wilcoxiana Berry[J]. Rev Palaeobot Palynol,74:249-266.

CHAW SM,LIU YC,WU YW,et al.,2019. Stout camphor tree genome fills gaps in understanding of flowering plant genome evolution[J]. Natl Plants,5(1):63-73.

CHEN JH,HAO ZD,GUANG XM,et al.,2019. Liriodendron genome sheds light on angiosperm phylogeny and species-pair differentiation[J]. Nat Plants,5(1):18-25.

CRANE PR,HERENDEEN PS,1996. Cretaceous floras containing angiosperm flowers and fruits from eastern North America[J]. Rev Palaeobot Palynol,90:319-337.

EBERSBERGER I,STRAUSS S,VON HAESELER A,2009. HaMStR:Profile hidden markov model based search for orthologs in ESTs[J]. Bmc Evol Biol,9(1):157-157.

ENDRESS PK,DOYLE JA,2009. Reconstructing the ancestral angiosperm flower and its initial specializations[J]. Am J Bot,96(1):22-66.

FAWCETT JA,MAERE S,VAN DE PEER Y,2009. Plants with double genomes might have had a better chance to survive the Cretaceous-Tertiary extinction event[J]. Proc Natl Acad Sci USA,106(14):5737-5742.

FRIIS EM,PEDERSEN KR,SCHNENBERGER J,2006. Normapolles plants:A prominent component of the Cretaceous rosid diversification[J]. Plant Syst Evol,260:107-140.

FU Q,DIEZ JB,POLE M,et al.,2018. An unexpected noncarpellate epigynous flower from the Jurassic of China[J]. Elife,7:e38827.

GAO Z,BARRY AT,1989. A review of fossil cycad megasporophylls,with new evidence of Crossozamia pomel and its associated leaves from the lower permian of Taiyuan,China[J]. REV Palaeobot Palynol,60(3-4):205-223.

GRABHERR MG,HAAS BJ,YASSOUR M,et al.,2011. Full-length transcriptome assembly from RNA-Seq data without a reference genome[J]. Nat Biotechnol,29(7):644-652.

HE ZL,ZHANG HK,GAO SH,et al.,2016. Evolview v2:An online visualization and management tool for customized and annotated phylogenetic trees[J]. Nucl Acid Res,44(W1):236-241.

HERENDEEN PS,1995. The enigma of angiosperm origins[J]. Earth-Sci Rev,39(1):253-254.

KATOH K,STANDLEY DM,2013. MAFFT multiple sequence alignment software version 7:Improvements in performance and usability[J]. Mol Biol Evol,30(4):772-780.

KUMAR S,STECHER G,SULESKI M,et al.,2017. TimeTree:A Resource for 598 timelines,timetrees,and divergence times[J]. Mol Biol Evol,34:1812-1819.

LANFEAR R,F(xiàn)RANDSEN PB,WRIGHT AM,et al.,2016. PartitionFinder 2:New methods for selecting partitioned models of evolution formolecular and morphological phylogenetic analyses[J]. Mol Biol Evol,34(3): 772-773.

LU LM,MAO LF,YANG T,et al.,2018. Evolutionary history of the angiosperm flora of China[J]. Nature,554(1):234-238.

LI HT,YI TS,GAO LM,et al.,2019. Origin of angiosperms and the puzzle of the Jurassic gap[J]. Nat Plants,5(1):461-470.

MAGALLON S,2010. Using fossils to break long branches in molecular dating:A comparison of relaxed clocks applied to the origin of angiosperms[J]. Syst Biol,59(4):384-399.

MOORE MJ,HASSAN N,GITZENDANNER MA,et al.,2011. Phylogenetic analysis of the plastid inverted repeat for 244 species:Insights into deeper-level angiosperm relationships from a long,slowly evolving sequence region[J]. Int J Plant Sci,172(4):541-558.

MOORE MJ,SOLTIS PS,BELL CD,et al.,2010. Phylogenetic analysis of 83 plastid genes further resolves the early diversification of eudicots[J]. Proc Natl Acad Sci USA,107(10):4623-4628.

NGUYEN LT,SCHMIDT HA,VON HAESELER A,et al.,2015. IQ-TREE:A fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies[J]. Mol Biol Evol,32(1):268-274.

QIU YL,LI LB,WANG B,et al.,2010. Angiosperm phylogeny inferred from sequences of four mitochondrial genes[J]. JSE,48(6):391-425.

RUHFEL BR,GITZENDANNER MA,SOLTIS PS,et al.,2014. From algae to angiosperms-inferring the phylogeny of green plants (Viridiplantae) from 360 plastid genomes[J]. Bmc Evol Biol,14(1):23.

SMITH SA,BEAULIEU JM,DONOGHUE MJ,2010. An uncorrelated relaxed-clock analysis suggests an earlier origin for flowering plants[J]. Proc Natl Acad Sci USA,107(13): 5897-5902.

SMITH SA,DUNN CW,2008. Phyutility:A phyloinformatics tool for trees,alignments and molecular data[J]. Bioinformatics,24(5):715-716.

SOLTIS DE,SMITH SA,CELLINESE N,et al.,2011. Angiosperm phylogeny:17 genes,640taxa[J]. Am J Bot,98(4): 704-730.

STAMATAKIS A,2014. RAxML Version 8:A tool for phylogenetic analysis and post—analysis of large phylogenies[J]. Bioinformatics,30(9):1312-1313.

TAKAHASHI M,CRANE PR,MANCHESTER SR,2002. Hironoia fusiformis gen. et sp. nov.,a cornalean fruit from the Kamikitaba locality (Upper Cretaceous,Lower Coniacian) in northeastern Japan[J]. J Plant Res,115:463-473.

THE ANGIOSPERM PHYLOGENY GROUP,2016. An update of the angiosperm phylogeny group classification for the orders and families of flowering plants:APGIV[J]. Bot J Linn Soc,181(1):1-20.

VANDS,2000. Graph Clustering by Flow Simulation[M]. University of Utrecht.

VONHAESELER A,MINH BQ,NGUYEN MAT,2013. Ultrafast approximation for phylogenetic bootstrap[J]. Mol Biol Evol,30(5):1188-1195.

WICKETT NJ,MIRARAB S,NGUYEN N,et al.,2014. Phylotranscriptomic analysis of the origin and early diversification of land plants[J]. Proc Natl Acad Sci USA,111(45): 4859-4868.

WORBERG A,QUANDT D,BARNISKE AM,et al.,2007. Phylogeny of basal eudicots:Insights from non-coding and rapidly evolving DNA[J]. Org Divers Evol,7(1):55-77.

YANG Z,2007. PAML 4:Phylogenetic analysis by maximum likelihood[J]. Mol Biol Evol,24:1586-1591.

YANG Y,MOORE MJ,BROCKINGTON SF,et al.,2015. Dissecting molecular evolution in the highly diverse plant clade caryophyllales using transcriptome sequencing[J]. Mol Biol Evol,32(8):2001-2014.

YANG Y,SMITH SA,2014. Orthology inference in nonmodel organisms using transcriptomes and low-coverage genomes:Improving accuracy and matrix occupancy for phylogenomics[J]. Mol Biol Evol,31(11):3081-3092.

ZENG LP,ZHANG N,ZHANG Q,et al.,2017. Resolution of deep eudicot phylogeny and their temporal diversification using nuclear genes from transcriptomic and genomic datasets[J]. New Phytol,214(3):1338-1354.

ZENG LP,ZHANG Q,SUN RR,et al.,2014. Resolution of deep angiosperm phylogeny using conserved nuclear genes and estimates of early divergence times[J]. Nat Comm,5(1): 4956.

ZHANG C,SAYYARI E,MIRARAB S,2017. ASTRAL-III:Increased scalability and impacts of contracting low support branches[J]. RECOMB-CG,Springer,Cham:53-75.

ZHANG N,ZENG LP,SHAN HY,et al.,2012. Highly conserved low-copy nuclear genes as effective markers for phylogenetic analyses in angiosperms[J]. New Phytol,195(4):923-937.

(責(zé)任編輯 周翠鳴)

主站蜘蛛池模板: 国产一级毛片在线| 国产精品欧美在线观看| 国产自产视频一区二区三区| 色网在线视频| 国产精品9| 三级毛片在线播放| 在线观看国产精品第一区免费| 露脸国产精品自产在线播| 熟女成人国产精品视频| 97人妻精品专区久久久久| 天天综合网亚洲网站| 久久久久无码国产精品不卡| 国产在线视频自拍| 国产黄色片在线看| 国产丝袜啪啪| 国产一级特黄aa级特黄裸毛片| 欧美国产在线一区| 亚洲色图欧美| 1024你懂的国产精品| 欧美不卡在线视频| 色亚洲激情综合精品无码视频| 亚洲精品无码不卡在线播放| 又黄又湿又爽的视频| 欧美精品黑人粗大| 国产成人精品18| 高清欧美性猛交XXXX黑人猛交| 国产欧美又粗又猛又爽老| 国产h视频在线观看视频| 中文字幕在线一区二区在线| 久久国产精品影院| 无码精品国产dvd在线观看9久| 欧美一级大片在线观看| 视频一区亚洲| 欧美专区日韩专区| 99无码熟妇丰满人妻啪啪| 无码一区18禁| 精品久久国产综合精麻豆| 2021天堂在线亚洲精品专区| 无码中文AⅤ在线观看| 久久窝窝国产精品午夜看片| 亚洲高清国产拍精品26u| 亚洲欧美日韩精品专区| 午夜在线不卡| 伊人久久久久久久| 亚洲欧美成人影院| 色悠久久久久久久综合网伊人| 亚洲高清在线天堂精品| 亚洲综合中文字幕国产精品欧美| 黄色网页在线播放| 亚洲欧洲天堂色AV| 午夜福利视频一区| 国产一级毛片高清完整视频版| 日本在线视频免费| 欧美精品啪啪| 国产剧情无码视频在线观看| 精品国产Av电影无码久久久| yjizz国产在线视频网| 99国产精品一区二区| 久久亚洲欧美综合| 亚洲国产天堂在线观看| 亚洲无码视频一区二区三区| 又大又硬又爽免费视频| 欧美日韩动态图| 免费无码又爽又黄又刺激网站| 成人免费黄色小视频| 91伊人国产| 日韩AV无码免费一二三区| 国产精品原创不卡在线| 亚洲av日韩av制服丝袜| 呦系列视频一区二区三区| 伊人成人在线| 欧洲成人在线观看| 亚洲制服丝袜第一页| 亚洲中文在线看视频一区| 国产精品亚洲五月天高清| 一本大道视频精品人妻 | 综合色88| av大片在线无码免费| 日韩av在线直播| 国产91视频免费观看| 亚洲婷婷丁香| 欧美精品啪啪|