趙鵬宇,趙 威,侯智揚,李 瀟,劉博寬,杜 瑤,謝睿琪,曹澤林,王開開
? 藥材與資源 ?
黃背草與2種菅屬植物葉綠體基因組特征比較及系統發育分析
趙鵬宇1, 2,趙 威1*,侯智揚1,李 瀟1,劉博寬1,杜 瑤1,謝睿琪3,曹澤林1,王開開1
1. 河南科技大學農學院,河南 洛陽 471000 2. 中國科學院分子植物科學卓越創新中心 植物分子遺傳國家重點實驗室,上海 200032 3. 河南科技大學基礎醫學與法醫學院,河南 洛陽 471000
以黃背草為試驗材料,比較分析其與阿拉伯黃背草、中華菅2種同屬植物的葉綠體基因組特征及其與近緣物種的系統發育關系。采用Illumina HiSeq高通量測序平臺首次對黃背草葉綠體基因組進行測序,使用SPAdes和CpGAVAS2分別對其進行組裝和注釋,并用CodonW、DnaSP和MISA等對其與2種同屬植物進行一系列比較基因組分析,利用最大似然法(maximum likelihood,ML)構建系統進化樹。3個葉綠體基因組全長為138 735~138 961 bp,具有典型的四分體結構,共注釋出129個基因;黃背草與其同屬的2個物種相比,反向重復區(inverted repeats,IR)收縮了2132 bp,大單拷貝區(large single copy region,LSC)擴張了約4000 bp,而小單拷貝區(small single copy region,SSC)變化不大。密碼子偏好性分析顯示,3個葉綠體基因組相對豐度最大和最小的密碼子都相同,同義密碼子相對使用豐度略有不同,但差異不大。核酸多態性分析顯示,3個葉綠體基因組間區序列的核酸多態性值(Pi)普遍高于共有基因序列,且IR區域相比于LSC、SSC區域更為保守。3個葉綠體基因組中分別檢測到38、36、37個簡單重復序列(simple sequence repeat,SSR)和2種長重復序列(long sequence repeat)。系統發育分析表明,黃背草與阿拉伯黃背草親緣關系最近。對黃背草與2種菅屬植物葉綠體基因組特征及其系統發育進行了比較分析,為上述3種植物的物種鑒定及菅屬遺傳多樣性和系統進化研究奠定了基礎。
黃背草;菅屬;葉綠體基因組;系統發育分析;高通量測序;密碼子偏好性
菅屬Forssk.為禾本科(Gramineae)多年生或一年生草本植物,有30余種[1],其中我國有13種,主要分布于西南和華南地區[2]。黃背草(Willd.) Tanaka是最常見的菅屬植物,又被稱為進肌草、黃背茅、草糖等,是一種進行C4光合作用的地面芽叢生草[3]。黃背草是非洲、亞洲、澳大利亞熱帶和亞熱帶地區生態及經濟上最重要和最廣泛的多年生草叢之一[4],在全球超過四分之一的草原上占據主導地位[5],其分布幾遍中國,多生長于干燥山坡、路邊、林緣等處[1]。黃背草在《中華本草》和《全國中草藥匯編》中均有記載,其全草均可入藥[6],味甘性溫,具有活血調經、驅風除濕的功效,主要用于治療閉經、風濕疼痛[7],具有一定的藥用價值。黃背草還具有耐旱耐寒、生長力強、根須繁多等特點[8],其群落通常分布均勻,蓋度較大,在一定的范圍內可以調節氣候、涵養水源[9],具有良好的生態價值。但在藥用方面,同為菅屬的阿拉伯黃背草Forsk.和中華菅(Linnaeus) Kuntze與黃背草相比不具備相應的價值,且上述3種植物形態學特征極為相似,利用已有的物種鑒定方法難將三者區分開,存在基源植物使用混亂的現象,因此尋找新的方法對其鑒定手段進行補充至為關鍵。
葉綠體是高等植物和一些藻類所特有的一種半自主性細胞器,也存在于少數原生生物中,具有獨立的遺傳物質[10]。葉綠體基因組是獨立于核基因組的一套完整的DNA序列,結構高度保守且易于測序,其大小介于120~180 kb,共編碼120~130個基因[11];葉綠體基因組一般為雙鏈環狀分子,大多是以多拷貝的形式存在于細胞中,主要參與光合作用的光反應,在基因表達過程中參與轉錄和翻譯[12]。由于葉綠體基因組編碼基因種類和排列順序穩定,相對分子質量較小,通常可用于植株物種鑒定和分類、系統發育研究及遺傳多樣性分析等[13]。近年來,隨著高通量測序技術的逐漸成熟,越來越多的植物的葉綠體基因組被陸續發布,可見基于葉綠體基因組的研究成為新趨勢。在菅屬植物中,除黃背草以外的阿拉伯黃背草、中華菅、瘤菅(Nees ex Steud.) Hack.等13種植物的葉綠體基因組也已完成測序[14-16],隨著菅屬葉綠體基因組數量的增加,同屬其他物種的葉綠體基因組也越來越容易組裝,這也為黃背草葉綠體基因組的組裝提供了條件。目前,國內外大量學者對黃背草的研究多集中在生物學特性[17]、種子萌發[18]和繁殖[19]、生理生態和生產[20]、種群空間分布[21]、對環境因素的生態響應[22]、性狀與環境的關系[23]及其作為牧草的適口性和可接受性[24]等方面,然而關于黃背草葉綠體基因組的系統研究尚未見報道,因此,完成黃背草葉綠體基因組圖譜的構建和分析,對于后續的物種鑒定以及生物的遺傳和進化等一系列研究具有重要意義。
本研究基于Illumina HiSeq高通量測序技術,以黃背草葉片為試驗材料,首次對黃背草葉綠體基因組進行測序、組裝和注釋。同時,將黃背草與其他2種菅屬植物葉綠體基因組進行比較,分析了這3種菅屬植物的葉綠體基因組特征結構、密碼子偏好性、核酸多態性、簡單重復序列及其系統發育等信息,進一步促進了黃背草與其他2種菅屬植物之間的遺傳學和分子鑒定研究,明確了黃背草葉綠體基因組的序列特征、基因組成及系統發育關系,為菅屬植物遺傳多樣性與系統進化研究提供理論依據。
黃背草植物樣本采集于河南省沁陽市紫陵鎮宋寨村附近太行山系(35°11′33″N,112°45′56″E),由河南科技大學農學院生物科學系洪亞平副教授和戴攀峰博士鑒定為禾本科菅屬植物黃背草(Willd.) Tanak,樣本保存于河南科技大學標本館,憑證標本號為TJ-2022101206。部分葉片樣本經硅膠干燥后,裝入自封袋帶回實驗室,用無菌水沖洗至表面潔凈后置于?80 ℃冰箱保存備用。在NCBI數據庫中下載黃背草近緣物種葉綠體基因組序列,試驗材料詳細信息見表1。

表1 植物樣本來源
取100 mg樣本新鮮葉片,液氮研磨后使用植物DNA提取試劑盒(上海聯邁生物工程有限公司)進行全基因組DNA提取。將質量濃度大于200 ng/μL且260/280值在1.8~2.0的DNA送至武漢菲沙基因信息有限公司質檢,合格的DNA用于文庫構建和Illumina HiSeq雙端測序,其測序長度為150 bp,去除低質量reads后得到clean reads。
使用SPAdes(v 3.11)軟件對上一步得到的clean reads進行基因組組裝[25],使用Bandage(v 0.8.1)軟件解環并輸出完整的葉綠體基因組序列文件[26]。以阿拉伯黃背草葉綠體基因組(GenBank登錄號:MT505020)為參考序列,使用在線工具CpGAVAS2(http://47.96.249.172:16019/analyzer/home)對黃背草葉綠體基因組進行注釋[27]。注釋結果經手動校正后,上傳至NCBI數據庫,其登錄號為OP897809。最后使用在線工具Chloroplot(https://irscope.shinyapps. io/Chloroplot/)繪制其葉綠體基因組圈圖[28]。
使用IRscope軟件對黃背草、阿拉伯黃背草和中華菅(GenBank登錄號:NC_035492)葉綠體基因組4個邊界的收縮與擴張進行可視化分析[29],并使用在線工具CPJSdraw繪制這3個葉綠體基因組的邊界圖。使用CodonW(v 1.42)軟件對上述3種植物的葉綠體基因組序列進行同義密碼子相對使用豐度比較[30],其編碼基因按照以下校準進行過濾:(1)基因的起始密碼子為ATG;(2)基因長度須大于等于300 bp;(3)處于重復區域的基因只選取1個且去除假基因。使用在線工具mVISTA(https://genome.lbl.gov/vista/mvista/submit.shtml)的Shuffle-LAGAN模式對上述3種植物進行葉綠體基因組比較分析[31]。使用MISA軟件對上述3種植物的葉綠體基因組進行簡單重復序列分析[32],其參數為單核苷酸SSR:重復單元為10,二核苷酸SSR:重復單元為6,三核苷酸SSR:重復單元為5,四核苷酸、五核苷酸和六核苷酸SSRs:重復單元為4。使用在線軟件REPuter(https:// bibiserv.cebitec.uni-bielefeld.de/session Timeout.jsf)對上述3種植物的葉綠體基因組進行長重復序列分析[33],其參數:Hamming Distance為3,最小重復單元為30個堿基。
使用上述已從NCBI數據庫中下載的15條黃背草近緣植物葉綠體基因組序列,以Hook. f.和Stapf作為外群進行全葉綠體基因組系統發育分析。調整序列LSC第一個堿基作為序列起始后,使用MAFFT進行全葉綠體基因組多序列比對,對齊好的文件使用Modeltest軟件進行模型檢測后,使用RaxML(v 8.2.12)軟件在GTR+GAMMA模型下[34],以最大似然法(maximum likelihood,ML)進行系統發育分析,自展值為1000。
原始數據經過過濾后,共得到251 兆條clean reads,且clean reads質量值大于30的堿基占比為88.7%,代表測序質量較好,可用于黃背草的組裝。如圖1和表2所示,黃背草葉綠體基因組全長為138 736 bp,具有典型的四分體結構,由2個單拷貝區(LSC:84 883 bp,SSC:12 549 bp)和一對重復區(IR:20 652 bp)組成。
在黃背草、阿拉伯黃背草和中華菅序列中,葉綠體基因組長度在138 735~138 961 bp內,阿拉伯黃背草的葉綠體基因組最短。這3種植物葉綠體基因組全長僅相差226 bp,黃背草與其他2種植物IR區域相比收縮了2132 bp,LSC區域擴張了約4000 bp,而SSC區域變化不大。3種植物葉綠體IR區域的GC在43.94%~44.18%,高于LSC區域(36.43%~36.69%)和SSC區域(32.76%~32.78%),這可能是由于IR中含有4個GC含量較高的核糖體RNA(rRNA)基因。
如表3和表4所示,黃背草葉綠體基因組共注釋出129個基因,含有82個編碼蛋白基因,8個rRNA基因和39個tRNA基因,且IR區域中含有16個重復基因。其中82個編碼蛋白基因可以根據不同的功能分為4類:46個光合作用相關基因(photosynthesis related genes),30個自我復制相關基因(self-replication related genes),1個未知功能基因(unknown function genes)和5個其他基因(other genes)。在tRNA基因中,、、、、、、、存在雙拷貝,rRNA的4種基因(、、、)存在雙拷貝。黃背草IR區注釋出16個基因,和阿拉伯黃背草及中華菅相比少了3個基因,分別為、和基因。基因的缺失主要是由于重復區域的收縮引起的,因此本課題組對這3個物種進行了邊界分析。由圖2可知,黃背草IR區域出現了明顯的收縮現象,這導致LSC與IRb及LSC與IRa的邊界基因與其他2個物種不同。

外環基因為逆時針轉錄,內環基因為順時針轉錄,相同功能的基因以相同的顏色表示

表2 黃背草、阿拉伯黃背草和中華菅葉綠體基因組堿基組成

表3 黃背草葉綠體基因組注釋基因信息

表4 黃背草、阿拉伯黃背草和中華菅葉綠體基因組的基因數及重復基因數目

JLB、JSB、JSA、JLA分別代表葉綠體基因組4個邊界的連接位點
按照方法中的3個條件,3種葉綠體基因組經過過濾都只保留了50條蛋白編碼序列。其同義密碼子相對使用豐度結果見圖3,在3種葉綠體基因組中,在三者中相對豐度最大的密碼子都為編碼亮氨酸(Leu)的UUA;相對豐度最小的密碼子在三者中也相同,都為編碼亮氨酸Leu的CUG。3種葉綠體基因組的同義密碼子相對使用豐度略有不同,但差異不大。由圖3可以看出,除了編碼色氨酸的(UGG)和甲硫氨酸的(AUG)外,其他氨基酸都有多個密碼子。Leu、精氨酸(Arg)和絲氨酸(Ser)有6個同義密碼子;甘氨酸(Gly)、纈氨酸(Val)、蘇氨酸(Thr)、脯氨酸(Pro)和丙氨酸(Ala)有4個同義密碼子;異亮氨酸(Ile)和終止密碼子都有3個同義密碼子;而其余的氨基酸都有2個同義密碼子且同義密碼子通常只在密碼子第3位不同。

每個氨基酸柱狀圖從左到右分別為黃背草、阿拉伯黃背草、中華菅
從3種葉綠體基因組中分別提取到105個共有基因和110個共有間區,經MAFFT對齊后,使用DnaSP 6.0軟件計算核酸多態性值(Pi)[35],最后按照基因和基因間區在葉綠體基因組中的位置繪制圖譜。由圖4可以看出,間區序列的Pi值普遍高于共有基因序列,且IR區域相比于LSC、SSC區域更為保守,這與圖5結果相同。在基因序列中,篩選出10個Pi值大于0.001的高突變區域(、、、、、、、、、);在間區序列中,篩選出9個Pi值大于0.003的高突變區域(、、、、、、、、)。突變為進化提供了基礎,因此這些高突變區域可用于研究物種進化和物種鑒定。
如圖6所示,從3個葉綠體基因組中分別檢測到38、36、37個SSR。3個葉綠體基因組中都只檢測到2種微衛星序列(單核苷酸重復和四核苷酸重復),且大多為單堿基重復型微衛星序列。單核苷酸重復多為A/T重復,其重復單元數目的范圍為10~17,四核苷酸重復在三者中都為GTAG重復,中華菅中其重復單元數目為6,而黃背草和阿拉伯黃背草中其重復單元數目為5。SSR廣泛分布于葉綠體基因組不同的位置,這些SSR區域可用于物種的分子標記,為遺傳圖譜構建和目的基因定位提供參考依據。如圖7所示,3個葉綠體基因組中都只檢測到2種長重復序列(long sequence repeat),包括正向重復序列(forward repeat sequence)和回文重復序列(palindromic repeat sequence),且重復序列長度多為40 bp以下,這些長重復序列可用于研究葉綠體基因組的結構變異。

A-共有基因的核酸多態性分析 B-共有間區基因的核酸多態性分析

橫軸代表葉綠體基因組序列長度,縱軸表示序列相似度

圖6 黃背草、阿拉伯黃背草和中華菅葉綠體基因組SSR分析
以和作為外群,經Modeltest軟件進行模型檢測后,使用RaxML(v 8.2.12)軟件在GTR+GAMMA模型下[34],以最大似然法(ML)構建黃背草及13種菅屬植物葉綠體全基因組的系統發育樹(圖8)。系統發育分析結果顯示,鄰接樹分支上支持值均大于80%,并具有很好的聚類效果,說明結果的可靠性。所有物種共聚為3大類,分別是外類的和以及菅屬,菅屬又分為2支。根據進化距離可以看出,相比與禾本科假鐵稈草屬與苞茅屬植物,菅屬植物是最后分化出來的一個支系,且黃背草、阿拉伯黃背草和中華菅在菅屬植物形成穩定的單系分支,三者中,黃背草與阿拉伯黃背草互為姐妹支,親緣關系最近。上述結果與《中國植物志》[1]中所記載的分類結果相同。

F-正向重復 P-回文重復 R-反向重復 C-互補重復
葉綠體基因組作為獨立于核基因組的完整DNA序列,在進化過程中具有高度的保守性和穩定性,近年來廣泛應用于植物種類鑒定和系統進化研究[36]。目前已有關于姜屬、藜蘆屬、扁果草屬植物中近緣物種葉綠體基因組差異分析及系統發育關系的相關報道[37-38],同時,黃背草與其同屬的阿拉伯黃背草、中華菅形態學特征極為相近,以現有的鑒定方法很難區分,這為補充其鑒定方法提供了新思路。
本研究首次完成了黃背草葉綠體基因組的測序、組裝和注釋工作,將黃背草和已報道的菅屬植物阿拉伯黃背草、中華菅的葉綠體基因組進行比較,結果顯示其具有典型的四分體結構,3個葉綠體基因組序列全長在138 735~138 961 bp,基因組大小相似度較高,最大僅相差226 bp。同時發現3種菅屬植物葉綠體基因組總GC含量(38.53%~38.57%)及LSC區(36.43%~36.69%)、SSC區(32.76%~32.78%)、IR區(43.94%~44.18%)的GC含量也高度相似。對黃背草葉綠體基因組進行注釋后得到129個功能基因,其中包括82個蛋白編碼基因、39個tRNA基因和8個rRNA基因,與已報道的阿拉伯黃背草、中華菅的葉綠體基因數目一致。黃背草、阿拉伯黃背草和中華菅葉綠體基因組序列的高度相似性在一定程度上解釋了三者形態學特征的近似性。IR區被認為是葉綠體基因組中最保守的區域,但生物進化過程中仍經常伴隨著IR區的擴張和收縮,這往往會造就葉綠體基因組的差異性[39]。本研究通過邊界分析發現,黃背草葉綠體基因組IR區出現了明顯的收縮現象,其IR區收縮了2132 bp,LSC區域擴張了約4000 bp,與阿拉伯黃背草及中華菅相比在IR區少了3個基因(、和)。這導致了黃背草LSC/IRb及LSC/IRa的邊界基因與其他兩個物種的較大差異,而其余2個邊界兩側基因完全相同。該差異性可為黃背草物種鑒定及系統發育關系的深入研究提供思路。
密碼子使用偏性在解釋生物基因組進化規律方面具有重要意義[40]。本研究發現黃背草葉綠體密碼子偏好性較低,除了編碼色氨酸的和甲硫氨酸外,其他氨基酸都有多個同義密碼子,同義密碼子之間通常只在第3位存在差異且更傾向于以A/T堿基結尾。同時,黃背草與阿拉伯黃背草、中華菅的葉綠體基因組的同義密碼子相對使用豐度具有較高一致性。有研究認為密碼子偏性與基因長度、氨基酸組分、GC含量、tRNA豐度等因素有關[40],本研究中3種菅屬植物葉綠體基因組的總GC含量及各拷貝區GC含量均低于50%,表明3個葉綠體基因組傾向于使用A/T堿基,這與本實驗發現的黃背草密碼子更傾向于以A/T堿基結尾這一結論相吻合。本研究從3種葉綠體基因組中共提取到105個共有基因和110個共有間區。經mVISTA工具和DnaSP 6.0軟件分析發現,共有間區序列的Pi值普遍高于共有基因序列,且IR區較LSC、SSC區更為保守,這可能是由于IR區的重復基因能夠通過基因轉換對此區發生的變異進行修正[41]。在基因序列中篩選出10個高突變區域(Pi>0.001),在間區序列中篩選出9個高突變區域(Pi>0.003),這些核酸多態性值較高的變異位點,能夠為黃背草物種鑒定的DNA條形碼篩選提供參考依據,并且在黃背草及其近緣物種的系統進化研究方面發揮重要作用。
植物葉綠體基因SSR具有數量大、保守性高、遺傳信息豐富等特點,其拷貝數的變異是一種重要的分子標記,在植物多態性研究、群體結構分析、種群遺傳進化等方面的研究具有重要意義[42]。黃背草、阿拉伯黃背草和中華菅葉綠體基因組中分別檢出38、36、37個SSR位點,包括單核苷酸SSR和四核苷酸SRR 2種類型。單核苷酸SSR多為A/T重復,重復單元范圍10~17。四核苷酸SSR在三者中均為GTAG重復,其中中華菅重復單元數目為6,其余兩者均為5。目前已報道了多種植物葉綠體基因組SSR主要由A/T堿基構成[37-38],這與本實驗的研究結果相一致。此外,黃背草、阿拉伯黃背草和中華菅葉綠體基因組中分別檢測到51、45、46個長重復序列,且都只檢測到正向重復型和回文重復型兩種長重復序列,長重復序列是導致葉綠體基因組結構變異的重要因素[43]。這些SSR位點以及長重復序列為黃背草的分子鑒定、物種演化、群體遺傳學研究等方面提供了候選分子標記。為進一步確定黃背草在菅屬植物中的系統位置,基于黃背草及其15種近緣植物葉綠體全基因組構建ML系統發育樹。結果表明,14種菅屬植物聚為一類,菅屬又分為2支,且黃背草、阿拉伯黃背草和中華菅在菅屬植物中形成穩定的單系分支,支持值為100%。其中,黃背草與阿拉伯黃背草互為姐妹支,親緣關系最為密切。同時,黃背草與阿拉伯黃背草在形態上也較中華菅更為相似,且黃背草與除上述2種植物外的菅屬物種相比,形態差異更大,對系統發育分析的結果也起到一定的支撐作用。該研究也表明葉綠體基因組可有效區分菅屬植物的系統發育關系,為后續菅屬植物的種群分類、系統進化和遺傳多樣性研究提供材料。
隨著高通量DNA測序技術和生物信息學的快速發展,葉綠體基因組因其豐富的遺傳信息和高度的保守性,在藥用植物的近緣物種鑒定及系統進化研究領域廣受關注[36]。本研究首次完成了黃背草葉綠體基因組的序列測序、組裝和注釋工作,詳細介紹了黃背草葉綠體基因組基本特征,闡明了黃背草在菅屬植物中的系統位置。同時將黃背草、阿拉伯黃背草和中華菅3種在形態學特征上難以區分的菅屬植物的葉綠體基因組進行比較分析,為黃背草的物種鑒定、群體遺傳學研究等方面所需的DNA條形碼和分子標記篩選提供了參考方向。完成了對菅屬植物的遺傳多樣性與功能基因組學研究的關鍵補充,為后續開展菅屬植物的分子鑒定、系統進化研究以及綜合開發利用奠定了理論基礎。
利益沖突 所有作者均聲明不存在利益沖突
[1] 中國科學院中國植物志編輯委員會. 中國植物志(第九卷. 第二分冊)[M]. 北京: 科學出版社, 2002: 23.
[2] 張煜, 劉青. 菅屬植物的地理分布 [J]. 熱帶亞熱帶植物學報, 2012, 20(3): 221-228.
[3] Christenhusz M J M. The Kew Plant Glossary, an illustrated dictionary of plant terms [J]., 2010, 164(4): 440-441.
[4] Snyman H A, Ingram L J, Kirkman K P.: A keystone grass species [J]., 2013, 30(3): 99-125.
[5] B H, Downing,. Growth and development of fourpopulations from southern Africa in response to temperature [J]., 1985, 51(5): 350-354.
[6] 國家中醫藥管理局《中華本草》編委會. 中華本草-9 [M]. 上海: 上海科學技術出版社, 1999: 8-429.
[7] 《全國中草藥匯編》編寫組. 全國中草藥匯編(上)[M]. 第2版. 北京: 人民衛生出版社, 1996: 873.
[8] Evans L T, Knox R B. Environmental control of reproduction in[J]., 1969, 17(3): 375.
[9] 趙威, 王馨, 王艷杰, 等. 河南黃背草群落碳、氮密度空間變化及其驅動因素分析 [J]. 草地學報, 2018, 26(4): 846-852.
[10] 熱伊漢古麗·圖爾迪, 慕麗紅, 田新民. 扁果草葉綠體基因組特征分析 [J]. 生物工程學報, 2022, 38(8): 2999-3013.
[11] Tonti-Filippini J, Nevill P G, Dixon K,. What can we do with 1000 plastid genomes? [J]., 2017, 90(4): 808-818.
[12] Khan I A, Zhang Y. Characterization of mango (L.) transcriptome and chloroplast genome [J]., 2014, 85(1): 193-208.
[13] Suparman S, Pancoro A, Hidayat T. Phylogenetic analysis ofbased on rbcL sequences, chloroplast DNA [J]., 2013, 57: 235-240.
[14] Arthan W, Dunning L T, Besnard G,. Complex evolutionary history of two ecologically significant grass Genera,and(Poaceae: Panicoideae: Andropogoneae) [J]., 2021, 196(4): 437-455.
[15] Dunning L T, Liabot A L, Olofsson J K,. The recent and rapid spread of[J]., 2017, 164(4): 327-337.
[16] Dunning L T, Olofsson J K, Papadopulos A S T,. Hybridisation and chloroplast capture between distinctlineages in Australia [J]., 2022, 31(22): 5846-5860.
[17] Tomlinson K, O'Connor T. The effect of defoliation environment on primary growth allocation and secondary tiller recruitment of two bunchgrasses [J]., 2005, 22(1): 29-36.
[18] 趙金輝, 王奎玲, 劉慶華, 等. 黃背草種子萌發特性研究 [J]. 西北農業學報, 2009, 18(3): 245-248.
[19] 岳喜成, 鄭觀玉, 劉耀曾, 等. 野生黃背草人工繁殖及開發利用試驗研究 [J]. 中國水土保持, 1994(12): 29-30.
[20] Ruppert J C, Holm A, Miehe S,. Meta-analysis of ANPP and rain-use efficiency confirms indicative value for degradation and supports non-linear response along precipitation gradients in drylands [J]., 2012, 23(6): 1035-1050.
[21] 王馨, 趙威. 區域尺度下黃背草種群空間分布格局及其與土壤因子的關系 [J]. 草業科學, 2019, 36(2): 335-345.
[22] H A, Snyman,. Transpiration and water-use efficiency in response to water stress inand[J]., 1997, 63(1): 55-59.
[23] Fynn R, Morris C, Ward D,. Trait-environment relations for dominant grasses in South African mesic grassland support a general leaf economic model [J]., 2011, 22(3): 528-540.
[24] van der Westhuizen H, Snyman H, van Rensburg W,. The quantification of grazing capacity from grazing—and production values for forage species in semi-arid grasslands of southern Africa [J]., 2001, 18(1): 43-52.
[25] Prjibelski A, Antipov D, Meleshko D,. Using SPAdes de novo assembler [J]., 2020, 70(1): e102.
[26] Wick R R, Schultz M B, Zobel J,. Bandage: Interactive visualization of de novo genome assemblies [J]., 2015, 31(20): 3350-3352.
[27] Liu C, Shi L C, Zhu Y J,. CpGAVAS, an integrated web server for the annotation, visualization, analysis, and GenBank submission of completely sequenced chloroplast genome sequences [J]., 2012, 13: 715.
[28] Zheng S Y, Poczai P, Hyv?nen J,. Chloroplot: An online program for the versatile plotting of organelle genomes [J]., 2020, 11: 576124.
[29] Amiryousefi A, Hyv?nen J, Poczai P. IRscope: An online program to visualize the junction sites of chloroplast genomes [J]., 2018, 34(17): 3030-3031.
[30] Sharp P M, Li W H.usage in regulatory genes indoes not reflect selection for ‘rare’ codons [J]., 1986, 14(19): 7737-7749.
[31] Frazer K A, Pachter L, Poliakov A,. VISTA: Computational tools for comparative genomics [J]., 2004, 32: W273-W279.
[32] Beier S, Thiel T, Münch T,. MISA-web: A web server for microsatellite prediction [J]., 2017, 33(16): 2583-2585.
[33] Kurtz S, Choudhuri J V, Ohlebusch E,. REPuter: The manifold applications of repeat analysis on a genomic scale [J]., 2001, 29(22): 4633-4642.
[34] Stamatakis A. RAxML version 8: A tool for phylogenetic analysis and post-analysis of large phylogenies [J]., 2014, 30(9): 1312-1313.
[35] Rozas J, Ferrer-Mata A, Sánchez-DelBarrio J C,. DnaSP 6: DNA sequence polymorphism analysis of large data sets [J]., 2017, 34(12): 3299-3302.
[36] 姜汶君, 郭夢月, 龐曉慧. 葉綠體基因組在藥用植物鑒定及系統進化研究中的應用 [J]. 世界中醫藥, 2020, 15(5): 702-708.
[37] 馬孟莉, 張薇, 孟衡玲, 等. 草果葉綠體基因組特征及系統發育分析 [J]. 中草藥, 2021, 52(19): 6023-6031.
[38] 田星, 劉瑩瑩, 張穎敏, 等. 藜蘆屬藥用植物的葉綠體基因組比較分析和系統發育研究 [J]. 中草藥, 2022, 53(4): 1127-1137.
[39] Odintsova M S, Yurina N P. Plastid genomes of higher plants and algae: Structure and functions [J]., 2003, 37(5): 649-662.
[40] 吳憲明, 吳松鋒, 任大明, 等. 密碼子偏性的分析方法及相關研究進展 [J]. 遺傳, 2007, 29(4): 420-426.
[41] Chen J H, Hao Z D, Xu H B,. The complete chloroplast genome sequence of the relict woody plantHu et Cheng [J]., 2015, 6: 447.
[42] 王化坤, 婁曉鳴, 章鎮. 葉綠體微衛星在植物種質資源研究中的應用 [J]. 分子植物育種, 2006, 4(S1): 92-98.
[43] Asaf S, Khan A L, Khan M A,. Complete chloroplast genome sequence and comparative analysis of loblolly pine (L.) with related species [J]., 2018, 13(3): e0192966.
Comparison of chloroplast genome characteristics and phylogenetic analysis betweenand two species of
ZHAO Peng-yu1, 2, ZHAO Wei1, HOU Zhi-yang1, LI Xiao1, LIU Bo-kuan1, DU Yao1, XIE Rui-qi3, CAO Ze-lin1, WANG Kai-kai1
1. College of Agriculture, Henan University of Science and Technology, Luoyang 471000, China 2. National Key Laboratory of Plant Molecular Genetics, CAS Center for Excellence in Molecular Plant Sciences, Chinese Academy of Sciences, Shanghai 200032, China 3. College of Basic Medicine and Forensic Medicine, Henan University of Science and Technology, Luoyang 471000, China
was used as the experimental material to compare its chloroplast genome characteristics with those of two congeners,and, and their phylogenetic relationships with the closely related species.Using the Illumina HiSeq high throughput sequencing platform, the chloroplast genome ofwas sequenced for the first time. SPAdes and CpGAVAS2 were used to assemble and annotate it, respectively. CodonW, DnaSP, and MISA were used to perform a series of comparative genomic analysis with two species of plants of the same genus, and the maximum likelihood (ML) method was used to construct a phylogenetic tree.The three chloroplast genomes were 138 735—138 961 bp in length, with a typical tetrad structure, and a total of 129 genes were annotated; compared with the two species of the same genus, the inverted repeats (IR) contracted by 2 132 bp, the large single copy region (LSC) expanded by about 4 000 bp, and the small single copy region (SSC) did not change much. Codon preference analysis showed that the codons with the highest and lowest relative abundance in the three chloroplast genomes were the same, while the relative abundance of synonymous codons was slightly different, but the difference was not significant. Nucleic acid polymorphism analysis showed that the nucleic acid polymorphism values (Pi) of the sequences in the inter-region of the three chloroplast genomes were generally higher than those of the shared gene sequences, and the IR region was more conserved than the LSC and SSC regions. A total of 38, 36 and 37 simple sequence repeats (SSR) and two long sequence repeats were detected in the three chloroplast genomes, respectively. Phylogenetic analysis indicated thatwas most closely related to.The comparative analysis of chloroplast genome characteristics and phylogeny betweenand two species ofwas carried out, laying the foundation for the species identification of the three species and the study of genetic diversity and phylogeny of.
(Willd.) Tanaka;; chloroplast genome; phylogenetic analysis; high-throughput sequencing; codon preference
R286.12
A
0253 - 2670(2023)10 - 3261 - 12
10.7501/j.issn.0253-2670.2023.10.023
2023-02-26
中國科學院大學生創新實踐訓練計劃項目(20224001686);河南省大學生創新創業訓練計劃項目(202210464086);河南省特色骨干學科建設——旱地綠色智慧農業學科群(17100001);NSFC-河南人才培養聯合基金項目(U1304306)
趙鵬宇(2001—),男,在讀本科生,主持中國科學院大學生創新實踐訓練計劃項目,研究方向為藥用植物分子生物學。E-mail: zhaopengyu122601@163.com
趙 威(1975—),男,教授,研究方向為植物生態學。E-mail: zhaowei1@haust.edu.cn
[責任編輯 時圣明]