王飛 辛雅萱 董章宏 趙文植 李衛(wèi)英 馬路遙 夏茂甜 辛培堯










摘要:【目的】分析無刺龍舌蘭葉綠體基因組特征及密碼子偏好性,為無刺龍舌蘭葉綠體相關(guān)基因的表達、修飾和物種進化研究提供參考?!痉椒ā繉o刺龍舌蘭的葉綠體基因組進行測序、組裝和注釋,分析密碼子偏好性及其影響因素,并通過建立高、低基因表達庫,篩選出最優(yōu)密碼子?;?0個已發(fā)表的龍舌蘭科植物葉綠體基因組數(shù)據(jù)構(gòu)建系統(tǒng)發(fā)育進化樹。【結(jié)果】無刺龍舌蘭葉綠體基因組總長157579 bp,大單拷貝區(qū)(LSC)、小單拷貝區(qū)(SSC)和2個反向重復區(qū)(IRa和IRb)的長度分別為85940、18279和26680 bp,GC含量為37.8%,包括135個基因(85個蛋白編碼基因、38個tRNA基因、8個rRNA基因及4個未知功能的基因),從中篩選出51個長度大于300 bp的基因編碼區(qū)(CDS)序列,其有效密碼子數(shù)(ENC)均大于41.0。GC1、GC2、GC3和GC3s含量分別為46.75%、39.61%、29.19%和26.06%,說明密碼子第3位多以A/T結(jié)尾。GCall與GC1、GC2和GC3均呈極顯著相關(guān)(P<0.01,下同),但GC3與GC1和GC2均無顯著相關(guān)性(P>0.05,下同),表明密碼子第1、2位的堿基組成相似,但與第3位的相似度不高。選擇和突變是導致葉綠體基因組密碼子偏好性的主要因素。篩選出14個多以A/U結(jié)尾的最優(yōu)密碼子。無刺龍舌蘭與克雷塔羅絲蘭和西地格絲蘭為姊妹關(guān)系,自薦值為100%?!窘Y(jié)論】無刺龍舌蘭葉綠體基因組為保守的四分體結(jié)構(gòu),葉綠體基因組密碼子偏好性較弱,主要受選擇和突變等多因素影響?;谥参锶~綠體基因組構(gòu)建系統(tǒng)發(fā)育進化樹在物種的分類鑒定及確定各物種間系統(tǒng)發(fā)育關(guān)系的研究中是一種準確、可靠的方法。
關(guān)鍵詞:無刺龍舌蘭;葉綠體基因組;密碼子偏好性;系統(tǒng)發(fā)育分析
中圖分類號:S563.8? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標志碼: A 文章編號:2095-1191(2022)04-1030-10
Chloroplast genome characteristics and codon preference analysis of Yucca treculeana
WANG Fei, XIN Ya-xuan, DONG Zhang-hong, ZHAO Wen-zhi,
LI Wei-ying, MA Lu-yao, XIA Mao-tian, XIN Pei-yao
(Southwest Landscape Architecture Engineering Technology Research Center of National Forestry and Grassland Administration, Southwest Forestry University/Key Laboratory of Biodiversity Conservation in Southwest China of National Forestry and Grassland Administration, Southwest Forestry University, Kunming, Yunnan? 650224, China)
Abstract:【Objective】To analyze chloroplast genome characteristics and codon preference of Yucca treculeana, so as to provide reference for the study of chloroplast-related gene expression,modification and species evolution. 【Method】Chloroplast genome of Y. treculeana was sequenced, assembled and annotated to analyze codon preference and its influe-ncing factors, and the optimal codon was screened by establishing high and low gene expression libraries. Phylogenetic tree was constructed based on 20 published chloroplast genome data of Agavaceae plants. 【Result】The total length of Y. treculeana chloroplast genome was 157579 bp, and the length of the large single copy region(LSC), small single copy region(SSC), and two reverse repeat regions(IR),namely IRa and IRb regions were 85940, 18279 and 26680 bp, respectively. The total GC content was 37.8%. Among 135 genes (85 protein-coding gene, 38 tRNA, 8 rRNA and 4 unknown functional genes), 51 coding DNA sequences(CDS) with length greater than 300 bp were screened out, and the ENC was greater than 41.0. The contents of GC1, GC2, GC3 and GC3s were 46.75%, 39.61%, 29.19% and 26.06%, respectively, indicating that the third codon most ended in A/T. GCall was significantly correlated with GC1, GC2 and GC3 (P<0.01, the same below), but GC3 was not significantly correlated with GC1 and GC2 (P>0.05, the same below), suggesting that the base composition of the first and second codon of chloroplast genome was basically similar,but the similarity with the third codon was not high. Selection and mutation were the main causes of chloroplast genome codon preference. 14 optimal codons ending in A/U were screened out. Y. treculeana was sisterly with Y. queretaroensis and Y. schidigera,and the bootstrap values was 100%. 【Conclusion】The chloroplast genome of Y. treculeana has a conserved tetrad structure, and the codon bias is weak, which is mainly affected by multiple factors such as selection and mutation. It is an accurate and reliable method to construct phylogenetic tree based on chloroplast genome in studying the taxonomic identification and phylogenetic relationship among plant species.
Key words: Yucca treculeana; chloroplast genome; codon preference; phylogeny analysis
Foundation items:Yunnan Science and Technology Department Science and Technology Plan Development Key Research Project (2018BB005); Southwest Forestry University Science and Technology Innovation Fund Project (KY21034)
0 引言
【研究意義】無刺龍舌蘭(Yucca treculeana)為絲蘭屬(Yucca)多年生植物,原產(chǎn)于北美洲,多生于降雨稀少的沙漠地區(qū),適應性強,劍形葉,花莖高挺,整體形態(tài)優(yōu)美,具有極高的觀賞價值,且其根和莖分別用作啤酒發(fā)泡劑、除臭劑的生產(chǎn)原料,葉纖維強韌亦可用于制作繩纜(Irish,2000)。據(jù)調(diào)查,絲蘭屬內(nèi)約有40個種。截至2021年7月,NCBI數(shù)據(jù)庫中已確定發(fā)表葉綠體全基因組的絲蘭屬植物有6種。目前,絲蘭屬植物在不同分類系統(tǒng)存在爭議,根據(jù)哈欽松系統(tǒng)和克朗奎斯特系統(tǒng)將其劃分為龍舌蘭科(Agavaceae);而APG Ⅲ分類系統(tǒng)則將其定位至天門冬科(Asparagaceae)(http://www.iplant.cn/info/Yucca)。造成分類差異的原因不僅與分類系統(tǒng)本身有關(guān),還與絲蘭屬植物形態(tài)特征相似度較高密切相關(guān)。因此,在利用傳統(tǒng)形態(tài)學方法分類存在爭議的情況下,借助無刺龍舌蘭葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育進化樹能直觀反映物種間遺傳關(guān)系,同時有助于對其進行分類(Kai et al.,2018)。此外,通過分析無刺龍舌蘭葉綠體基因組密碼子偏性,可優(yōu)化基因密碼子,提高目的基因表達水平,對選育優(yōu)良品種具有重要意義。【前人研究進展】葉綠體是綠色植物和部分藻類用于光合作用的細胞器(Jia-Yee et al.,2015),也是除線粒體外的另一個含有遺傳信息的細胞器。與含有龐大遺傳信息的核基因組相比,葉綠體基因組長度較小,僅為160 kb左右,且堿基含量和基因數(shù)量均較少,但因葉綠體內(nèi)基因所在位置的特殊性,其具有結(jié)構(gòu)完整性和序列保守性(Parks et al.,2009;Jansen and Uhlman,2012)。葉綠體基因組為單親遺傳,堿基很少發(fā)生替換,使其在植物分類及系統(tǒng)進化研究中具有獨特的優(yōu)勢(Tao et al.,2017)。在解析植物葉綠體基因組特征的基礎(chǔ)上,結(jié)合系統(tǒng)發(fā)育分析探究物種間進化關(guān)系已有相關(guān)報道。高亞芳等(2019)通過對藥用植物金鐵鎖葉綠體基因組的測序、組裝和注釋,明確了其基因組成,進而利用葉綠體全基因組構(gòu)建系統(tǒng)發(fā)育進化樹,解析了石竹科屬間的系統(tǒng)發(fā)育關(guān)系。段義忠和張凱(2021)對2種沙冬青屬植物葉綠體基因組的反向重復區(qū)(IR)進行比對分析,并基于葉綠體基因組構(gòu)建了系統(tǒng)發(fā)育進化樹,為該屬的物種鑒別、種群動態(tài)研究打下基礎(chǔ)。此外,作為編碼氨基酸的遺傳密碼子在基因功能和蛋白質(zhì)表達的研究中意義重大。肽鏈合成過程中每種氨基酸對應1~6種密碼子(即同義密碼子)(牛元等,2018),但密碼子的使用偏好于一種或幾種特定密碼子,稱為密碼子偏好性(Li et al.,2019)。只有無選擇壓或基因突變的情況下,才不存在密碼子使用偏好性(Long et al.,2018)。但實際上,生物體是自然選擇的結(jié)果,均存在密碼子使用偏好性(Li et al.,2019)。密碼子使用偏好性存在于各生物體中,自然選擇、堿基組成、基因的長度和表達水平、RNA豐度和二級結(jié)構(gòu)、氨基酸保守性等均可能造成密碼子使用偏好性(Xu et al.,2011)。目前,不同植物密碼子偏好性分析已有相關(guān)報道。金剛等(2018)揭示了同為龍舌蘭科植物劍麻的葉綠體基因組密碼子偏好性,并指出密碼子使用偏好性受選擇和突變等多重因素影響。另外,香花枇杷(屈亞亞等,2021)、杧果(辛雅萱等,2021)、永椿香槐(李江飛等,2021)和蒜頭(原曉龍等,2021)等葉綠體基因組密碼子偏好性分析均是在測序獲得葉綠體全基因組的基礎(chǔ)上,應用統(tǒng)計學方法分析其密碼子使用模式及形成原因?!颈狙芯壳腥朦c】無刺龍舌在植物分類中仍存在一定的爭議,利用其葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育進化樹有助于其分類研究,但目前未見絲蘭屬植物葉綠體基因組特征及密碼子偏好性的相關(guān)研究報道?!緮M解決的關(guān)鍵問題】對無刺龍舌蘭的葉綠體基因組進行測序、組裝和注釋,分析密碼子偏好性及其影響因素,并通過建立高、低基因表達庫,篩選出最優(yōu)密碼子;基于20個已發(fā)表的龍舌蘭科植物葉綠體基因組數(shù)據(jù)構(gòu)建系統(tǒng)發(fā)育進化樹,為無刺龍舌蘭乃至絲蘭屬植物葉綠體相關(guān)基因的表達、修飾和物種進化研究提供理論依據(jù)。
1 材料與方法
1. 1 試驗材料
供試材料為新鮮無刺龍舌蘭葉片,采自于中國科學院西雙版納熱帶植物園,將采集好的樣葉裝入自封袋放入液氮中速凍,帶回實驗室后保存于-80 ℃的超低溫冰箱備用。主要設備儀器:超微量紫外分光光度計(DN2000)、核酸蛋白測定儀(NanoDrop 2000 Thermo Scientific)、瓊脂糖凝膠電泳儀(北京六一DYCP-31DN)和凝膠成像系統(tǒng)(Gene Company Limited,GBOX.E3)。
1. 2 DNA提取及測序
采用改良CTAB法提取無刺龍舌蘭的全基因組DNA(Windarti et al.,2021),并利用瓊脂糖凝膠電泳及NanoDrop2000對其完整性、質(zhì)量和濃度進行檢測。將檢測合格的DNA樣品送至北京諾禾致源科技股份有限公司建庫測序。
1. 3 葉綠體基因組組裝、注釋及編碼區(qū)(CDS)序列挑選
以克雷塔羅絲蘭(Yucca queretaroensis)(登錄號KX931468)為參考序列,使用GetOrganelle進行基因組序列組裝(Jin et al.,2020),采用GeSeq(https:// chlorobox.mpimp-golm.mpg.de/geseq.html)對無刺龍舌蘭葉綠體基因組進行注釋(Tillich et al.,2017),再用Geneious 8.1.3手動校正(Kearse et al.,2012)。將注釋好的無刺龍舌蘭葉綠體基因組數(shù)據(jù)(登錄號OL912952)上傳至NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/)。利用OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)(Lohse et al.,2013)繪制無刺龍舌蘭葉綠體基因組物理圖譜。
利用Geneious 8.1.3、BioEdit Sequence Alignment Editor和ORFfinder(https://www.ncbi. nlm.nih.gov/orffinder/)對無刺龍舌蘭葉綠體基因組進行分析,共獲得85個基因的CDS序列。為了降低誤差,剔除長度小于300 bp、內(nèi)部含有終止密碼子和重復基因的序列,最終篩選出51個以ATG為起始密碼子的CDS用作后續(xù)分析。
1. 4 密碼子相關(guān)參數(shù)計算
使用CodonW 1.4.2和CUSP(https://bioinforma-tics.nl/emboss-explorer/)統(tǒng)計上述篩選出的51個CDS序列的有效密碼子數(shù)(Effective number of codon,ENC)、同義密碼子相對使用度(Relative synonymous codon usage,RSCU)、各CDS序列總GC含量(用GCall表示),以及密碼子第1、2、3位上的GC含量(分別用GC1、GC2和GC3表示)。
1. 5 中性繪圖分析
利用中性繪圖直觀反映影響密碼子使用偏好性因素,即利用Excel 2010以CDS的GC3值為橫坐標、GC12(GC1和GC2的均值)為縱坐標繪制散點圖,用于分析GC12和GC3的相關(guān)性,進而判斷密碼子偏好性影響因素(Jiang et al.,2008)。若GC12與GC3相關(guān)性顯著,回歸系數(shù)接近1,說明突變是其主要影響因素;反之,則說明GC12與GC3差異大,自然選擇是主要影響因素(Wei et al.,2014)。
1. 6 ENC-plot分析
利用Excel 2010以GC3為橫坐標、ENC為縱坐標,利用兩者的實際值來構(gòu)建二維散點圖,并在圖中添加ENC=2+GC3+29/[GC2+(1-GC3)2]的標準曲線,根據(jù)散點在標準曲線周圍的分散情況,再結(jié)合ENC比值頻率,進而判斷影響密碼子偏好性的原因(Sueoka,2017)。若代表CDS的散點落在曲線附近,則密碼子偏好性受突變影響;而落在曲線下方較遠的位置,則受自然選擇影響(Wang et al.,2018)。
1. 7 PR2-plot分析
利用Excel 2010以G3/(G3+C3)為橫坐標、A3/(A3 +T3)為縱坐標進行繪圖,用于分析密碼子第3位上的堿基組成。圖的中心點表示A=T且G=C,即無偏性的密碼子狀態(tài),由中心點向其余點發(fā)出的矢量表示偏性方向和程度(Yang et al.,2015)。
1. 8 最優(yōu)密碼子分析
同義密碼子相對使用度(RSCU)作為選擇最優(yōu)密碼子的條件之一,RSCU=1時,密碼子無偏好性;RSCU>1時,密碼子使用頻率偏高;反之,表示密碼子出現(xiàn)頻率低(Wu et al.,2019;惠小涵等,2020)。最優(yōu)密碼子選擇時,以ENC為標準,對51個CDS序列的ENC進行排序,分別從ENC最高和最低兩端選取10%的基因,建立高、低表達庫。計算ΔRSCU值(ΔRSCU=RSCU高表達-RSCU低表達),將ΔRSCU≥0.08,且RSCU>1的密碼子定為最優(yōu)密碼子。
1. 9 系統(tǒng)發(fā)育分析
為了確定無刺龍舌蘭在龍舌蘭科中的系統(tǒng)發(fā)育位置,從NCBI數(shù)據(jù)庫下載20個已發(fā)表的龍舌蘭科植物葉綠體基因組與外類群綿棗兒(Barnardia japonica),結(jié)合無刺龍舌蘭葉綠體基因組進行系統(tǒng)發(fā)育分析。將22個葉綠體基因組序列用MAFFT 7比對,BioEdit手動調(diào)整,用最大似然法(ML)對系統(tǒng)發(fā)育關(guān)系進行分析,使用RAxML 8.2.12中的HPC2 on XSEDE模型構(gòu)建系統(tǒng)發(fā)育進化樹(Stamatakis et al.,2008;Katoh and Standley,2013),最后用FigTree 1.4.0進行樹圖美化。
2 結(jié)果與分析
2. 1 葉綠體基因組基本特征分析結(jié)果
無刺龍舌蘭葉綠體基因組大小為157579 bp,呈反向平行的雙鏈環(huán)狀四分體結(jié)構(gòu),大單拷貝區(qū)(LSC)、小單拷貝區(qū)(SSC)和2個IR區(qū)(IRa和IRb)的大小分別為85940、18279和26680 bp,平均GC含量為37.8%。另外,葉綠體基因組共有135個基因(85個蛋白編碼基因、38個tRNA基因、8個rRNA基因及4個未知功能的基因),絕大多數(shù)存在于LSC 區(qū)(圖1)。4個未知功能的基因中,ycf3和ycf4位于LSC區(qū),ycf2位于IR區(qū)并有一個拷貝,ycf1基因則位于SSC區(qū)和IRb區(qū)的交界位置。值得注意的是,LSC區(qū)的atpB基因出現(xiàn)了1個突變位點和1個缺失位點,導致該基因序列不能正常翻譯,基因功能喪失,致使假基因化。
2. 2 密碼子組成及使用度分析結(jié)果
無刺龍舌蘭葉綠體基因組密碼子組成如圖2所示。GC1、GC2和GC3含量分別為46.75%、39.61%和29.19%。密碼子第1、2、3位的GC分布并不均勻,第3位上的GC含量明顯低于前兩位,分布趨勢為GC1>GC2>GC3,GC3s含量為26.06%,表明密碼子第3位多以A/T 結(jié)尾。
ENC理論取值范圍為20.0~61.0,與同義密碼子的偏性呈負相關(guān)。無刺龍舌蘭51個CDS序列的ENC為41.2~61.0,均>41.0,說明無刺龍舌蘭葉綠體基因組密碼子偏好性較弱。其中,ndhE基因的ENC為理論取值范圍的上限(即61.0),說明該基因密碼子使用無偏好性。
從密碼子各參數(shù)的相關(guān)分析結(jié)果(表1)可看出,GCall與GC1、GC2和GC3均呈極顯著相關(guān)(P<0.01,下同),且GC1與GC2及ENC值與GC3均呈極顯著相關(guān),但GC3與GC1和GC2均無顯著相關(guān)性(P>0.05,下同),表明葉綠體基因組密碼子第1、2位的堿基組成基本類似,但與第3位的堿基相似度不高。而葉綠體基因組密碼子數(shù)與各GC含量和ENC均無顯著相關(guān)性。
從無刺龍舌蘭各氨基酸RSCU分析(表2)可看出,RSCU>1的密碼子共30個,多為A/U結(jié)尾,而以G/C結(jié)尾的密碼子RSCU多數(shù)都小于1,表明無刺龍舌蘭葉綠體基因組密碼子偏好以A/U結(jié)尾。
2. 3 中性繪圖分析結(jié)果
從圖3可看出,GC12和GC3的取值范圍分別為0.33~0.51和0.22~0.35,回歸系數(shù)(即斜率)為0.0391,GC12與GC3的相關(guān)系數(shù)(R)為0.024,二者相關(guān)性弱,表明密碼子第1、2位與第3位之間堿基的相關(guān)性不強,可初步判斷出自然選擇是影響密碼子使用偏好性的主要因素之一。
2. 4 ENC-plot分析結(jié)果
從圖4中可看出,多數(shù)基因CDS序列處于標準曲線下方。再結(jié)合圖5可知,ENC比值分布在-0.05~0.05區(qū)間的基因CDS序列有15個,其接近標準曲線,實際ENC與預期ENC接近,說明其偏好性主要受突變影響;而其余36個基因CDS序列的ENC比值分布在 -0.05~0.05區(qū)間之外,位于標準曲線較遠的位置,表示與預期ENC相差較大,即這部分基因密碼子偏好性與GC3含量有關(guān)。因此,除了突變的影響,自然選擇等其他因素很大程度上也會影響密碼子的偏好性。
2. 5 PR2-plot分析結(jié)果
PR2-plot繪圖是通過分析密碼子第3位堿基類型,從而揭示密碼子使用偏性影響因素。由圖6可知,51個基因CDS序列在圖中4個區(qū)域分布并不均勻,其中,左下方分布較多。T>A、C>G,即嘧啶使用頻率高于嘌呤,進一步說明突變并不是影響無刺龍舌蘭葉綠體基因組密碼子使用偏好性的唯一因素,選擇、堿基組成等其他因素對其密碼子使用偏好性也有一定影響。
2. 6 最優(yōu)密碼子的確定
對ENC進行排序,從兩端各選5個基因來構(gòu)建高、低表達庫,分別計算△RSCU,結(jié)果如表3所示。以△RSCU≥0.08為標準,再結(jié)合葉綠體基因的RSCU>1確定最優(yōu)密碼子,共14個,分別是UCU、UGU、UUA、UUG、UAG、CCU、CGU、CGA、AUU、ACU、AGU、ACC、AAA、AGA、GCU、GGU、GUA和GCA。其中8個以U結(jié)尾,5個以A結(jié)尾,1個以G結(jié)尾,說明最優(yōu)密碼子多以A/U結(jié)尾。
2. 7 無刺龍舌蘭葉綠體基因組系統(tǒng)發(fā)育分析
基于葉綠體基因組序列,以天門冬科(Asparagaceae)綿棗兒屬(Barnardia)植物綿棗兒(B. japonica)為外類群,構(gòu)建無刺龍舌蘭在內(nèi)的21種龍舌蘭科植物的系統(tǒng)發(fā)育進化樹,如圖7所示。除外類群綿棗兒之外,龍舌蘭科15個屬的植物按進化關(guān)系遠近可分為7個分支,其中絲蘭屬(Yucca)(Clade I)、玉簪屬(Hosta)(Clade IV)和知母屬(Anemarrhena)(Clade VI)植物各單獨分為一支,與其他屬的親緣關(guān)系較遠;龍舌蘭屬(Agave)、龍薈蘭屬(Beschorneria)和龍香玉屬(Manfreda)植物聚為一支(Clade II);皂百合屬(Chlorogalum)、糠米百合屬(Camassia)、夕麗花屬(Hesperocallis)、西絲蘭屬(Hesperoyucca)和草絲蘭屬(Hesperaloe)植物聚為一支(Clade III);擬菝葜屬(Behnia)和吊蘭屬(Chlorophytum)植物聚為一支(Clade V),虎尾蘭屬(Sansevieria)和龍血樹屬(Dracaena)植物聚為一支(Clade VII),說明聚為一支的各屬植物之間親緣關(guān)較近。在7種絲蘭屬植物中,系統(tǒng)發(fā)育進化樹以100%的自薦值(Bootstrap values)支持無刺龍舌蘭(Y. treculeana)與克雷塔羅絲蘭(Y. queretaroensis)和西地格絲蘭(Y. schidigera)聚為一小支,互為姊妹關(guān)系,說明三者的遺傳距離較小,共同起源較接近。
3 討論
研究表明,被子植物葉綠體基因組長度一般為120~220 kb,包含大約130個基因,LSC、SSC和IR區(qū)的長度分別為81~90、18~20和20~29 kb(Zhang et al.,2012)。本研究無刺龍舌蘭葉綠體全基因組長度為157579 bp,總基因數(shù)為135個,共分為LSC、SSC和IR(包括IRa和IRb)的長度分別為85940、18279和26680 bp,與被子植物葉綠體基因組特征(Zhang et al.,2012)相似。假基因(通常用符號ψ表示)是基因組中與CDS相似的非功能基因組DNA拷貝,多存在于真核生物,于1977年在研究爪蟾核糖體5S RNA基因時被首次發(fā)現(xiàn)(Xie et al.,2019)。本研究發(fā)現(xiàn),無刺龍舌蘭葉綠體基因組LSC區(qū)的atpB基因第111位點的C突變?yōu)镚,第462位點缺失1個A,導致atpB基因無法正常翻譯成氨基酸序列,造成了atpB基因的假基因化。關(guān)于該基因的假基因化并未見相關(guān)報道,僅Malinova(2021)在研究月見草(Oenothera)質(zhì)體突變體I-iota時發(fā)現(xiàn)atpB基因編碼區(qū)的第11位點有一個攜帶腺嘌呤A的插入,而葉綠體基因中的翻譯重編碼可糾正atpB基因的移碼突變。
堿基組成的差異會引起同義密碼子的非均衡使用現(xiàn)象(胡曉艷等,2019)。研究表明,密碼子第3位上的堿基突變不改變氨基酸類型且受選擇壓較小,因此,GC3常被用作分析密碼子使用模式的重要依據(jù)(Tang et al.,2020)。本研究PR2-plot分析結(jié)果顯示,無刺龍舌蘭葉綠體CDS在密碼子第3位上,T>A,C>G,與酸棗(胡曉艷等,2019)、向日葵(Helianthus annuus)(Chen et al., 2021)等植物的研究結(jié)果一致,但與蘇鐵(Cycas revoluta)(Zhou et al.,2008)、燈盞花(李顯煌等,2021)等植物的研究結(jié)果存在差異,即蘇鐵和燈盞花葉綠體CDS序列在密碼子第3位上出現(xiàn)了T>A,C>G且A、T與 G、C的使用頻率相當?shù)那闆r,存在差異的原因可能與植物進化速率及環(huán)境型有關(guān)。對多數(shù)植物而言,自然選擇和突變是造成其密碼子偏好性的主要動力(Musto, 2016)。植物葉綠體基因組密碼子使用偏好性雖受選擇、突變等多重因素的影響,但主要影響因素只有1~2種(Zhang et al.,2018)。本研究利用中性繪圖、ENC-plot和PR2-plot對造成無刺龍舌蘭葉綠體基因組密碼子偏好性的原因進行統(tǒng)計分析,結(jié)果發(fā)現(xiàn)突變和選擇是導致無刺龍舌蘭葉綠體基因組密碼子偏性的主要影響因素,與龍舌蘭屬植物劍麻(金剛等,2018)的研究結(jié)論一致,說明選擇和突變對密碼子偏好性的影響在親緣關(guān)系較近的植物中較一致,可能與物種的遺傳進化有關(guān)。沈宗芳等(2021)在3種槲蕨屬植物葉綠體基因組密碼子偏好性分析研究中也得出相同結(jié)論。另外,關(guān)于物種遺傳距離遠近與密碼子使用偏好性之間是否存在一定關(guān)系的問題,各學者所持觀點不同(Tang et al.,2021),如Somaratne等(2019)通過對2種親緣關(guān)系較近的胡枝子屬(Desmodieae)植物葉綠體基因組進行序列差異及密碼子使用模式分析,結(jié)果發(fā)現(xiàn)親緣關(guān)系遠近與密碼子使用模式相關(guān),即親緣關(guān)系越近,其密碼子使用模式也會越相似。目前,有關(guān)絲蘭屬植物密碼子使用偏好性的研究較少,探究密碼子使用模式與物種的親緣關(guān)系是否存在相關(guān)性還需要對屬內(nèi)各物種的密碼子偏性進行深入研究。
大量研究表明,植物葉綠體基因組具有結(jié)構(gòu)完整性和序列保守性,因此,在植物分類、系統(tǒng)進化的研究中優(yōu)勢突出(Parks et al.,2009)。目前,直接利用葉綠體基因組構(gòu)建龍舌蘭科植物的系統(tǒng)發(fā)育進化樹的研究報道較少,僅Kate和Mark(2013)對蛇紋石土壤上特有植物進行分類研究時,首次利用葉綠體基因組對龍舌蘭科部分植物進行系統(tǒng)進化關(guān)系探究。另外,在龍舌蘭科植物自花授粉起源的研究中,McKain等(2016)基于葉綠體基因組構(gòu)建了最大似然(ML)樹和貝葉斯(Bayes)樹,初步明確了屬間的授粉起源關(guān)系,所構(gòu)建的系統(tǒng)發(fā)育進化樹顯示西地格絲蘭和克雷塔羅絲蘭為姊妹關(guān)系,且同與短葉絲蘭聚為絲蘭屬一支,無論是絲蘭屬的4種植物間,還是其余各屬之間,其分支結(jié)果均與本研究的系統(tǒng)發(fā)育進化樹分支結(jié)果一致。因此,在物種的分類鑒定及確定各物種間系統(tǒng)發(fā)育關(guān)系的研究中,基于植物葉綠體基因組構(gòu)建系統(tǒng)發(fā)育進化樹是一種準確、可靠的方法。
4 結(jié)論
無刺龍舌蘭葉綠體基因組為保守的四分體結(jié)構(gòu),葉綠體基因組密碼子偏好性較弱,主要受選擇和突變等多因素影響?;谥参锶~綠體基因組構(gòu)建系統(tǒng)發(fā)育進化樹在物種的分類鑒定及確定各物種間系統(tǒng)發(fā)育關(guān)系的研究中是一種準確、可靠的方法。
參考文獻:
段義忠,張凱. 2020. 沙冬青屬植物葉綠體基因組對比和系統(tǒng)發(fā)育分析[J]. 西北植物學報,40(8):1323-1332. [Duan Y Z,Zhang K. 2020. Comparative analysis and phylogenetic evolution of the complete chloroplast genome of Ammopiptanthus[J]. Northwestern Journal of Botany,40(8):1323-1332.]doi:10.7606/j.issn.1000-4025.2020.08. 1323.
高亞芳,劉瑩瑩,楊從衛(wèi),李國棟,錢子剛. 2019. 金鐵鎖葉綠體基因組序列及其系統(tǒng)發(fā)育分析[J]. 中草藥,50(22):5532-5536. [Gao Y F,Liu Y Y,Yang C W,Li G D,Qian Z G. 2019. Analysis on structure and phylogeny of complete chloroplast genomes in Psammosilene tunicoides[J]. Chinese Herbal Medicine,50 (22):5532-5536.]doi:10.7501/j.issn.0253-2670.2019.22.022.
惠小涵,程婷婷,柯衛(wèi)東,郭宏波. 2020. 蓮藕PPO基因密碼子偏好性特征分析[J]. 江蘇農(nóng)業(yè)學報,36(2):438-446. [ Hui X H,Cheng T T,Ke W D,Guo H B. 2020. Analysis on codon preference of PPO gene in lotus root[J]. Jiangsu Journal of Agricultural Sciences,36(2):438-446.]doi:10.3969/j.issn.1000-4440.2020.02.026
胡曉艷,許艷秋,韓有志,杜淑輝. 2019. 酸棗葉綠體基因組密碼子使用偏性分析[J]. 森林與環(huán)境學報,39(6):621-628. [Hu X Y,Xu Y Q,Han Y Z,Du S H. 2019. Codon usage bias analysis of the chloroplast genome of Ziziphus jujuba var. Spinosa[J]. Journal of Forest and Environment,39(6):621-628.] doi:10.13324/j.cnki.jfcf.2019. 06.009.
金剛,覃旭,龍凌云,王麗萍,覃劍峰,危丹妮,陳濤,蔡中全. 2018. 劍麻葉綠體基因組編碼序列密碼子的使用特征[J]. 福建農(nóng)林大學學報(自然科學版),47(6):705-710. [Jin G,Qin X,Long L Y,Wang L P,Qin J F,Wei D N,Chen T,Cai Z Q. 2018. Characteristics of codon usage in the chloroplast protein-coding genes of Agave hybrid No.11648[J]. Journal of Fujian Agriculture & Forestry University (Natural Science Edition),47(6):705-710.] doi:10.13323/j.cnki.j.fafu(nat.sci.).2018.06.011.
李江飛,原曉龍,李熙顏,王瑜,蔡年輝,陳詩,許玉蘭. 2021. 永椿香槐葉綠體基因組密碼子偏好性分析[J]. 分子植物育種,https://kns.cnki.net/kcms/detail/46.1068.S.2021 0630.1627.017.html. [Li J F,Yuan X L,Li X Y,Wang Y,Cai N H,Chen S,Xu Y L. 2021. Analysis on codon usage bias of chloroplast genome in Cladrastis yungchunii[J]. Molecular Plant Breeding,https://kns.cnki.net/kcms/detail/46.1068.S.20210630.1627.017.html.]
李顯煌,楊生超,辛雅萱,屈亞亞,楊琳懿,馮發(fā)玉,范偉,辛培堯. 2021. 燈盞花葉綠體基因組密碼子偏好性分析[J]. 云南農(nóng)業(yè)大學學報(自然科學),36(3):384-392. [Li X H,Yang S C,Xin Y X,Qu Y Y,Yang L Y,F(xiàn)eng F Y,F(xiàn)an W,Xin P Y. 2021. Analysis of the codon usage bias of chloroplast genome in Erigeron breviscapus(Vant.) Hand-Mazz[J]. Journal of Yunnan Agricultural University(Natural Science),36 (3):384-392.] doi:10.12101/j.issn. 1004-390X(n).202010007.
牛元,徐瓊,王崳德,代立蘭,莊健,趙亞蘭. 2018. 大花香水月季葉綠體基因組密碼子使用偏性分析[J]. 西北林學院學報,33(3):123-130. [Niu Y,Xu Q,Wang Y D,Dai L L,Zhuang J,Zhao Y L. 2018. An analysis on codon usage bias of the chloroplast genome of Rosa odorata var. Gigantea[J]. Journal of Northwest Forest College,33 (3):123-130.] doi:10.3969/j.issn.1001-7461.2018.03.19.
屈亞亞,辛靜,馮發(fā)玉,董章宏,瞿紹宏,王海洋,李斌,辛培堯. 2021. 香花枇杷質(zhì)體基因組序列密碼子偏性分析[J]. 西北林學院學報,5(4):1-8. [Qu Y Y,Xin J,F(xiàn)eng F Y,Dong Z H,Qu S H,Wang H Y,Li B,Xin P Y. 2021. Condon usage bais in chloroplast genome of Eriobotrya fragrans Champ. Ex Benth[J]. Journal of Northwest Forest College,5(4):1-8.] doi:10.3969/j.issn.1001-7461.2021.04.20.
沈宗芳,陸添權(quán),張志榮, 蔡傳濤,田波. 2021. 槲蕨屬葉綠體基因組密碼子偏好性分析[J]. 廣西植物,41(2):266-273. [Shen Z F,Lu T Q,Zhang Z R,Cai Z T,Tian B. 2021. Condon bias of chloroplast genome of Drynaria[J]. Guangxi Plant,41(2):266-273.] doi:10.11931/guihaia.gxzw201904013.
辛雅萱,黎若竹,李鑫,陳麗瓊,唐軍榮,屈亞亞,楊琳懿,辛培堯,李云芳. 2021. 杧果葉綠體基因組密碼子使用偏好性分析[J]. 中南林業(yè)科技大學學報,(9):148-156. [Xin Y X,Li R Z,Li X,Chen L Q,Tang J R,Qu Y Y,Yang L Y,Xin P Y,Li Y F. 2021. Analysis on codon usage bias of chloroplast genome in Mangifera indica[J]. Journal of Central South University of Forestry and Technology,(9):148-156.] doi:10.14067/j.cnki.1673-923x.2021.09.016.
原曉龍,劉音,康洪梅,陳中華,李云琴,王毅. 2021. 蒜頭果葉綠體基因組密碼子偏好性分析[J]. 西南林業(yè)大學學報(自然科學),41(3):15-22. [Yuan X L,Liu Y,Kang H M,Chen Z H,Li Y Q,Wang Y. 2021. Analysis of codon usage bias in chloroplast genome of Malania oleifera[J]. Journal of Southwest Forestry University (Natural Sciences),41(3):15-22.] doi:10.11929/j.swfu.2020 01047.
Chen S Y,Zhang H,Wang X,Zhang Y H,Ruan G H,Ma J. 2021. Analysis of codon usage bias in the chloroplast genome of J-01[J]. IOP Conference Series:Earth and Environmental Science,792(1):1755. doi:10.1088/1755-1315/792/1/012009.
Irish G. 2000. Agaves,Yuccas,and related plants:A gardener’s guide[M]. Portland :Timber Press.
Jansen R K,Uhlman R. 2012. Plastid genomes of seed plants. genomics of chloroplasts and mitochondria[M]. Dordrecht:Springer.
Jiang Y,Deng F,Wang H L,Hu Z H. 2008. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Archives of Virology,153(12):2273. doi:10. 1007/s00705-008-0260-1.
Jia-Yee S,Thore R,Abigail G,Hannah M P,Wendy G,Annie Y,Marc R,Sven K D. 2015. Complete chloroplast genome of the Wollemi Pine (Wollemia nobilis ):Structure and evolution[J]. Public Library of Science,10(6):126-128. doi:10.1371/journal.pone.0128126.
Jin J J,Yu W B,Yang J B,Song Y,Yi T S,Li D Z. 2020. GetOrganelle:A fast and versatile toolkit for accurate de novo assembly of organelle genomes[J]. Genome Biology,21(1):241. doi:10.1186/s13059-020-02154-5.
Kai J,Song X Q,Chen C G. 2020. Coons for the chloroplast genome of the Magnoliaceae use trait analysis[J]. China Agricultural Science and Technology Herald,22(11):52-62.
Kate H,Mark F. 2013. A chloroplast phylogeny of agavaceae subfamily Chlorogaloideae:Implications for the Tempo of Evolution on Serpentine Soils[J]. Systematic Botany,38(4):674. doi:10.1600/036364413X674850.
Katoh K,Standley D M. 2013. MAFFT multiple sequence alignment software version 7:Improvements in performance and usability[J]. Molecular Biology and Evolution,30(4):772-780. doi:10.1093/molbev/mst010.
Kearse M,Moir R,Wilson A. 2012. Geneious Basic:An integrated and extendable desktop software platform for the organization and analysis of sequence data[J]. Bioinformatics,28(12):1647-1649. doi:10.1093/bioinformatics/bts199.
Li G L,Pan Z L,Gao S C,He Y Y,Xia Q Y,Jin Y,Yao H P. 2019. Analysis of synonymous codon usage of chloroplast genome in Porphyra umbilicalis[J]. Genes Geno-mics,10(41):1173-1181. doi:10.1007/s13258-019-00847-1.
Lohse M,Drechsel O,Kahlau S. 2013. Organellar genome DRAW—A suite of tools for generating physical maps of plastid and mitochondrial genomes and visualizing expression data sets[J]. Nucleic Acids Research,(41):575-581. doi:10.1093/nar/gkt289.
Long S,Yao H,Wu Q,Li G L. 2018. Analysis of compositional bias and codon usage pattern of the coding sequence in Banna virus genome[J]. Virus Research,(10):1016. doi:10.1016/j.virusres.2018.10.006.
Malinova I,Zupok A,Massouh A,Meyer E H,Greiner S. 2021. Correction of frameshift mutations in the atpB gene by translational recoding in chloroplasts of Oenothera and tobacco[J]. The Plant Cell,33(5):1-24. doi:10.1093/PLCELL/KOAB050.
McKain M R,McNeal J R,Kellar P R. 2016. Timing of rapid diversification and convergent origins of active pollination within Agavoideae(Asparagaceae)[J]. American Journal of Botany,103(10):1717-1729.
Musto H. 2016,What we know and what we should know about codon usage[J]. Journal of Molecular Evolution,82(6):245-246. doi:10.1007/s00239-016-9742-z.
Parks M,Cronn R,Liston A. 2009. Increasing phylogenetic resolution at low taxonomic levels using massively parallel sequencing of chloroplast genomes[J]. BMC Developmental Biology,12(7):84.
Somaratne Y,Guan D L,Wang W Q,Zhao L,Xu S Q. 2019. The complete chloroplast genomes of two Lespedeza species:Insights into codon usage bias,RNA editing sites,and phylogenetic relationships in Desmodieae (Fabaceae:Papilionoideae)[J]. Plants,9(1):3390. doi:10.3390/plants 9010051.
Stamatakis A,Hoover P,Rougemont J. 2008. A rapid bootstrap algorithm for the RAxML web servers[J]. Systema-tic Biology,57(5):758-771. doi:10.1080/1063515080242 9642.
Sueoka N. 2017. Near homogeneity of PR2-bias fingerprints in the human genome and their implications in phylogenetic analyses[J]. Journal of Molecular Evolution,19(53):469-476.
Tang D F,Wei F,Cai Z Q,Wei Y Y,Khan A,Miao J H,Wei K H. 2020. Analysis of codon usage bias and evolution in the chloroplast genome of Mesona chinensis Benth[J].Development Genes and Evolution,(10):1007. doi:10. 1007/s00427-020-00670-9.
Tang Y J,Zhao Y,Huang G D. 2021. Mangifera indica L. chloroplast genome codon using preference analysis[J]. Journal of Tropical Crop Science,7:1-11.
Tao X L,Ma L C,Zhang Z S,Liu W X,Liu Z P. 2017. Characterization of the complete chloroplast genome of alfalfa (Medicago sativa) (Leguminosae)[J]. Gene Reports,(6):1-6. doi:10.1016/j.genrep.2016.12.006.
Tillich M,Lehwark P,Pellizzer T,Ulbricht-Jones E S,F(xiàn)ischer A,Bock R,Greiner S. 2017. GeSeq-versatile and accurate annotation of organelle genomes[J]. Nucleic Acids Research,45(7):6-11. doi:10.1093/nar/gkx391.
Wang H,Meng T,Wei W. 2018. Analysis of synonymous codon usage bias in helicase gene from Autographa californica multiple nucleopolyhedrovirus[J]. Genes & Genomi-cs,(40):767-780. doi:10.1007/s13258-018-0689-x.
Wei L,He J,Jia X,Qi Q. 2014. Analysis of codon usage bias of mitochondrial genome in Bombyx mori and its relation to evolution[J]. BMC Evolutionary Biology,(14):262. doi:10.1186/s12862-014-0262-4.
Windarti C K,Maryanto A E,Salamah A. 2021. The study of heat shock protein 70 (Hsp70) gene expression on Agera-tum conyzoides L. and Synedrella nodiflora L. in Universitas Indonesia,Depok and Cibodas Botanical Garden[J]. Journal of Physics:Conference Series,1725(1):012059. doi:10.1088/1742-6596/1725/1/012059.
Wu M L,Chen S P,Chen H. 2019. Condon preference of chloroplast genome of Bambusoideae[J]. Journal of Environmental Quality,(1):9-14. doi:10.13324/j.cnki.jfcf.2019.01.002.
Xie J B,Li Y,Liu X M,Zhao Y Y,Li B L,Ingvarsson P K,Zhang D Q. 2019. Evolutionary origins of pseudogenes and their association with regulatory sequences in plants[J]. The Plant Cell,31(3):601-619. doi:10.1105/tpc. 18.00601.
Xu C,Cai X,Chen Q. 2011. Factors affecting synonymous codon usage bias in chloroplast genome of Oncidium gower ramsey[J]. Evolutionary Bioinformatics,10(7):271-278. doi:10.4137/EBO.S8092.
Yang G F,Su K L,Zhao Y R. 2015. Analysis of codon usage in the chloroplast genome of Medicago truncatula[J]. Acta Pharmacologica Sinica,6(12):171-179.
Zhang R,Zhang L,Wang W. 2018. Differences in codon usage bias between photosynthesis related genes and genetic system-related genes of chloroplast genomes in cultivated and wild Solanum species[J]. International Journal of Molecular Sciences,(19):3142. doi:10.3390/ijms 19103142.
Zhang T W,F(xiàn)ang Y J,Wang X M,Deng X,Zhang X W,Hu S N,Yu J. 2012. The complete chloroplast and mitochondrial genome sequences of Boea hygrometrica:Insights into the evolution of plant organellar genomes[J]. Public Library of Science,7(1):e30531. doi:10.1371/journal.pone.0030531.
Zhou M,Long W,Li X. 2008. Patterns of synonymous codon usage bias in chloroplast genomes of seed plants[J]. Fore-stry Studies in China,10(4):235-242. doi:10.1007/s11632-008-0047-1.
收稿日期:2021-08-24
基金項目:云南省科技廳科技計劃重點研發(fā)項目(2018BB005);西南林業(yè)大學科技創(chuàng)新基金項目(KY21034)
通訊作者:辛培堯(1975-),https://orcid.org/0000-0001-8512-7083,教授,主要從事植物遺傳育種與快繁研究研究工作,E-mail:xpytgyx@163.com
第一作者:王飛(1996-),https://orcid.org/ORCID:0000-0002-9117-6620,主要從事林木分子生物學與遺傳改良研究,E-mail:1767785429@qq.com