余瀟 趙振寧 鄧?yán)蛱m



摘 要 為明確銹毛兩型豆的葉綠體基因組結(jié)構(gòu)和兩型豆屬葉綠體基因組密碼子使用偏性及影響因素,以亞熱帶中、南部地區(qū)具有廣闊開(kāi)發(fā)利用前景的豆科草種—銹毛兩型豆(Amphicarpaea ferruginea)為試驗(yàn)材料,利用高通量測(cè)序技術(shù)對(duì)銹毛兩型豆進(jìn)行葉綠體基因組測(cè)序、組裝和注釋,對(duì)其葉綠體基因組結(jié)構(gòu)、基因組成進(jìn)行分析。同時(shí)利用 CodonW 1.4.2 軟件和CUSP 在線程序等軟件分析銹毛兩型豆和兩型豆的基因密碼子使用偏性參數(shù)和核苷酸組成。結(jié)果顯示:銹毛兩型豆葉綠體基因組全長(zhǎng)為 152 531 bp,包含83 364 bp的大單拷貝(LSC)區(qū)、17 935 bp的小單拷貝(SSC)區(qū)和25 616 bp的1對(duì)反向重復(fù)序列,為典型四分體結(jié)構(gòu),GC含量為35.44%;葉綠體基因組共編碼130個(gè)基因,包括85個(gè)蛋白質(zhì)編碼基因、37個(gè)tRNA基因和8個(gè)rRNA基因;葉綠體基因組共檢測(cè)出73個(gè)簡(jiǎn)單重復(fù)序列(SSRs),單、二、三、四、五和六核苷酸SSRs的數(shù)目分別為41、28、3、1、0和0。從銹毛兩型豆和兩型豆葉綠體基因組中篩選到適用于密碼子使用偏好性分析的CDS基因共48條,兩種植物葉綠體基因組具有相似的密碼子使用模式,均傾向于使用A與U作為末尾堿基,48個(gè)基因的ENC 值均在35%以上,表明銹毛兩型豆和兩型豆葉綠體基因組的密碼子偏性較弱;綜合中性繪圖分析、有效密碼子數(shù)(ENC-plot)分析和奇偶偏好性(PR2-plot)分析的結(jié)果顯示兩型豆屬葉綠體基因組密碼子使用模式不僅受突變壓力的影響,同時(shí)還受選擇壓力以及其他多種因素的影響;在銹毛兩型豆和兩型豆中分別確定18和20個(gè)最優(yōu)密碼子,其中共有最優(yōu)密碼子18個(gè)。基于豆科20個(gè)物種葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育樹(shù)表明,豆科20個(gè)物種構(gòu)成一個(gè)單系類群,銹毛兩型豆與兩型豆親緣關(guān)系最近。
關(guān)鍵詞 兩型豆屬;銹毛兩型豆;葉綠體基因組特征;密碼子偏好性;系統(tǒng)發(fā)育分析
兩型豆屬(Amphicarpaea Elliot)隸屬于豆科,該屬大多為多年生纏繞草本植物,全球共有約10種,廣泛分布于東亞、北美以及非洲東南部等地,中國(guó)產(chǎn)3種,分別為兩型豆(Amphicarpaea edgeworthii Benth.)、銹毛兩型豆[Amphicarpaea ferruginea (Franch.) Y. T. Wei]和線苞兩型豆(Amphicarpaea linearis Chun et T. Chen)[1]。兩型豆屬植物最顯著的特征是在地上和地下均能發(fā)育出成熟果實(shí),是典型的地上地下兩型結(jié)實(shí)類型[2]。由于兩型豆屬植物這一獨(dú)特的發(fā)育模式,其已成為植物發(fā)育生物學(xué)研究的模式植物,具有獨(dú)特的育種意義[3]。兩型豆屬植物與大豆屬植物的形態(tài)特征非常相似,在親緣關(guān)系上也非常近,研究者們希望研究找到控制兩型豆屬植物發(fā)育方式的性狀基因,使大豆也能實(shí)現(xiàn)地上和地下結(jié)果,以此提高豆類作物的產(chǎn)量[4]。此外,兩型豆屬植物的粗蛋白、鈣和磷含量較高,具有較高的飼用價(jià)值,是優(yōu)質(zhì)牧草發(fā)展的重要對(duì)象;種子富含異黃酮類化合物,具抗炎、抗氧化、抗腫瘤、抗菌等作用[5]。銹毛兩型豆[Amphicarpaea ferruginea(Franch.)Y.T.Wei]是兩型豆屬的多年生草本藤本植物,主要分布在中國(guó)云南省和四川省海拔2 300~3 000 m的山坡林中[6],為中國(guó)特有種,國(guó)家二級(jí)重點(diǎn)保護(hù)野生植物;而兩型豆(Amphicarpaea edgeworthii Benth.)則為1 a生纏繞草本植物,在中國(guó)分布較廣,常生于海拔? 300~1 800 m的山坡、路旁及曠野草地,具較強(qiáng)的耐蔭性,其營(yíng)養(yǎng)價(jià)值與經(jīng)濟(jì)價(jià)值與銹毛兩型豆相似[7]。目前對(duì)于兩型豆和銹毛兩型豆的研究主要集中在種子營(yíng)養(yǎng)成分、種子休眠解除與解剖觀察等方面[6-7]。銹毛兩型豆和兩型豆作為兩型豆屬植物的典型物種,《中國(guó)南方牧草志 第一卷 豆科》中記載其為亞熱帶中、南部地區(qū)具有廣闊開(kāi)發(fā)利用前景的豆科草種[8]。
葉綠體是重要的植物細(xì)胞器,在光合作用、生物合成和碳儲(chǔ)存中起著至關(guān)重要的作用,具有獨(dú)立于核基因組的遺傳系統(tǒng)。自從煙草的第一個(gè)葉綠體基因組[9]問(wèn)世以來(lái),人們對(duì)其結(jié)構(gòu)和功能的了解日益加深。葉綠體基因組的長(zhǎng)度為100 ~200 kb,具有典型的四分體結(jié)構(gòu),包括大單拷貝區(qū)(LSC)、小單拷貝區(qū)(SSC)和兩個(gè)反向重復(fù)區(qū)(IR)[10]。密碼子使用偏好性是指編碼相同氨基酸的同義密碼子頻率的差異,這種現(xiàn)象在原核生物和真核生物的生物體中都很常見(jiàn)[11]。然而,不同的基因組有其特有的同義密碼子使用模式,這使得解釋這種偏好性具有挑戰(zhàn)性[12]。以往的研究主要集中于核基因組中密碼子的使用偏性[13-14],而針對(duì)其細(xì)胞器基因組的研究相對(duì)較少。作為基因相對(duì)保守的葉綠體基因組使用的是不同于標(biāo)準(zhǔn)密碼子的第十一套密碼子表[15]。通常,密碼子使用偏性反映了物種或基因的起源、進(jìn)化和突變模式,并會(huì)對(duì)基因功能和蛋白質(zhì)表達(dá)產(chǎn)生重大影響[16]。因此,分析葉綠體基因組中的密碼子使用偏好將有助于了解密碼子偏好選擇的潛在分子機(jī)制以及相關(guān)物種的進(jìn)化和環(huán)境適應(yīng),同時(shí)也能研究物種間的進(jìn)化關(guān)系,對(duì)研究基因表達(dá)具有重要意義。
兩型豆屬植物具有巨大的科研及經(jīng)濟(jì)價(jià)值,但目前僅有山東師范大學(xué)生命科學(xué)學(xué)院Han Y.提交的兩型豆葉綠體基因組序列公布[7],而未見(jiàn)關(guān)于兩型豆屬葉綠體基因組特征和密碼子偏性研究的詳細(xì)報(bào)道,本研究通過(guò)對(duì)銹毛兩型豆的葉綠體全基因組進(jìn)行測(cè)序、分析,并與近緣種兩型豆進(jìn)行比較,進(jìn)一步分析兩型豆屬植物葉綠體基因組密碼子堿基組成、密碼子偏好性、最優(yōu)密碼子以及系統(tǒng)發(fā)育關(guān)系,結(jié)果可為兩型豆屬飼草植物葉綠體深入研究和應(yīng)用奠定基礎(chǔ)。
1 材料與方法
1.1 DNA 提取及葉綠體基因組測(cè)序注釋
所用的銹毛兩型豆的新鮮植物葉片采集于云南省玉龍縣黃山鎮(zhèn)南溪村(東經(jīng)? 100°8′59.93″,北緯26°46′8.02″,海拔3 103 m)的野生植株,共采集3株,每株上采集3片成熟葉片,經(jīng)西南林業(yè)大學(xué)標(biāo)本館樹(shù)木學(xué)教研室李雙智副教授鑒定為豆科兩型豆屬植物銹毛兩型豆Amphicarpaea ferruginea(Franch.)Y.T.We。使用改良的CTAB法[17]從硅膠干燥的葉片中提取總基因組DNA,提取的DNA送天津諾禾致源生物科技有限公司(中國(guó)天津)進(jìn)行葉綠體基因組測(cè)序,使用Get organelle組裝葉綠體基因組,生成的完整葉綠體基因組的組裝圖由Bandage v.0.8.1驗(yàn)證[18]。使用PGA軟件,以兩型豆(Amphicarpaea edgeworthii)葉綠體基因組序列為參考,對(duì)序列進(jìn)行注釋,然后在Geneious Prime 10.0.5中手動(dòng)調(diào)整[19]。利用Organellar Genome DRAW在線程序生成注釋的葉綠體基因組圖,銹毛兩型豆的完整葉綠體基因組提交至GenBank公共數(shù)據(jù)庫(kù),登錄號(hào)為ON050971。從NCBI數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/)平臺(tái)上下載兩型豆的葉綠體基因組,登錄號(hào)為NC_057598.1。
1.2 重復(fù)序列分析
采用在線工具M(jìn)ISA-web(http://webblast.ipk-gatersleben.de/misa/)對(duì)銹毛兩型豆的SSRs的類型和數(shù)量進(jìn)行分析[20],對(duì)單、二、三、四、五和六核苷酸的關(guān)鍵參數(shù)分別設(shè)置為10、5、4、3、3和3,兩個(gè)SSRs之間的最小間距為100 bp。
1.3 密碼子偏好性分析
1.3.1 密碼子相關(guān)參數(shù)計(jì)算 根據(jù)GenBank文件中的信息手動(dòng)提取每個(gè)葉綠體基因組中的蛋白質(zhì)編碼序列,然后檢查其是否存在正確的起始密碼子和終止密碼子。由于短長(zhǎng)度的CDS通常會(huì)導(dǎo)致密碼子使用的較大估計(jì)誤差,因此在密碼子使用計(jì)算中,長(zhǎng)度小于300 bp的CDS被排除在外,以避免采樣偏差[21]。利用CUSP在線程序(http://www.Bioin formatics.nl/emboss-explorer/)計(jì)算整個(gè)基因的GC含量(GCall)、第1、第2和第3位密碼子位置(GC1、GC2、GC3)。
1.3.2 中性繪圖分析 GC12是GC1和GC2的平均值,手動(dòng)計(jì)算用于中性圖分析。中性分析(GC12 vs GC3)是GC12與GC3的對(duì)比圖,有助于揭示GC12和GC3之間的關(guān)系,用于檢查密碼子形成過(guò)程中的突變選擇平衡[22]。在中性圖中,單個(gè)基因由一個(gè)離散點(diǎn)表示,如果GC12與GC3為中性,則這些點(diǎn)應(yīng)位于對(duì)角線上(單位斜率),而如果GC12不為中性,這些點(diǎn)應(yīng)顯示在橫坐標(biāo)的平行線上(零斜率),斜率小于1的程度表明GC12的中性程度小于GC3[23]。
1.3.3 ENC-plot分析 ENC圖分析(ENC vs GC3)用于檢查基因組的密碼子使用是否僅受突變力或其他因素的影響,遵循的標(biāo)準(zhǔn)是,對(duì)于一個(gè)基因,如果其密碼子使用僅受G+C突變偏倚的限制,則其將位于或略低于預(yù)測(cè)值的曲線,而如果要選擇翻譯最佳密碼子,它將大大低于預(yù)期曲線[24]。根據(jù)各組基因密碼子的GC含量和ENC值,運(yùn)用R語(yǔ)言繪制ENC-plot散點(diǎn)圖,并計(jì)算出預(yù)期ENC值(預(yù)期ENC計(jì)算公式:ENCexp=? GC3+2+29/[GC23+(1-GC3)2]),通過(guò)比較預(yù)期ENC值與實(shí)際ENC值,可以分析得出突變壓力和選擇壓力對(duì)密碼子使用偏性的作用大小[25]。單純分析ENC-plot繪圖無(wú)法定量比較實(shí)際ENC值與標(biāo)準(zhǔn)ENC值的差異,因此通過(guò)計(jì)算得到ENC比值(即(標(biāo)準(zhǔn)ENC-實(shí)際ENC)/標(biāo)準(zhǔn)ENC),并統(tǒng)計(jì)各個(gè)組段ENC比值的頻數(shù)和頻率,從而更加準(zhǔn)確直觀地對(duì)其ENC差異進(jìn)行分析。
1.3.4 PR2-plot繪圖 奇偶校驗(yàn)分析(PR2)是DNA組成的規(guī)則,用于指示突變和選擇壓力對(duì)密碼子使用偏差的影響。分析每個(gè)密碼子第3位的A、T、C和G的含量,并以A3/(A3+T3)為縱坐標(biāo),以G3/(G3+C3)為橫坐標(biāo)進(jìn)行PR2-plot偏差圖分析。每個(gè)基因的堿基組成顯示在一個(gè)平面上,其中中心點(diǎn)表示無(wú)偏使用時(shí)的密碼子狀態(tài),即A=T和C=G,其余點(diǎn)和中心點(diǎn)之間的矢量距離表示偏誤的程度和方向[26]。
1.3.5 最優(yōu)密碼子確定 最優(yōu)密碼子被定義為在高表達(dá)基因中比在低表達(dá)基因中更頻繁出現(xiàn)的密碼子。以ENC為首選標(biāo)準(zhǔn),將48條葉綠體基因中ENC值最高和最低的5個(gè)基因分別視為高表達(dá)組和低表達(dá)組。如果ΔRSCU>0.08,并且密碼子的同義密碼子的相對(duì)使用頻率(RSCU)在高樣本組大于1,在低樣本組小于1,則定義為高表達(dá)最優(yōu)密碼子(高級(jí)密碼子)[27]。
1.4 系統(tǒng)發(fā)育分析
以銹毛兩型豆的葉綠體基因組序列在NCBI數(shù)據(jù)庫(kù)上進(jìn)行BLAST同源性比對(duì),下載同源性比對(duì)率高于85%的序列,共計(jì)19個(gè)近緣物種。同時(shí)以薔薇科的繅絲花Rosa roxburghii(NC_032038.1)和金櫻子Rosa laevigata(NC_046824.1)兩種植物為外類群,對(duì)銹毛兩型豆及其19個(gè)近緣種構(gòu)建系統(tǒng)發(fā)育樹(shù)。首先,對(duì)所有這22個(gè)完整的葉綠體基因組序列均通過(guò)MAFFT v.7軟件進(jìn)行比對(duì)[28],基于RAxMLv.8中的GTR+? I+G模型,采用最大似然法進(jìn)行系統(tǒng)發(fā)育分析[29],共設(shè)1 000次自展值重復(fù)。
1.5 數(shù)據(jù)統(tǒng)計(jì)
基于皮爾遜相關(guān)法,采用SPSS 18.0和Excel 2019軟件進(jìn)行相關(guān)分析,顯著性水平為P<0.05或? P<0.01。
2 結(jié)果與分析
2.1 銹毛兩型豆葉綠體基因組的基本特征
銹毛兩型豆的葉綠體基因組是一種雙鏈環(huán)狀DNA,長(zhǎng)度為152 531 bp,包含83 364 bp的大單拷貝(LSC)區(qū)、17 935 bp的小單拷貝(SSC)區(qū)和2 561 6bp的1對(duì)反向重復(fù)序列(圖1)。葉綠體基因組的堿基組成不均勻,A堿基占32.26%、C堿基占17.60%、G堿基占17.85%、T堿基占32.29%,整個(gè)葉綠體組的GC和AT含量分別為35.45%和64.55%。IR區(qū)的GC含量(41.87%)高于LSC區(qū)(32.92%)和SSC區(qū)(28.81%)(表1)。葉綠體基因組共編碼130個(gè)基因,包括85個(gè)蛋白質(zhì)編碼基因、37個(gè)tRNA基因和8個(gè)rRNA基因。18個(gè)基因在IR區(qū)復(fù)制并相互反向重復(fù),包括7個(gè)蛋白質(zhì)編碼基因(rpl2、rpl23、ycf2、ndhB、rps7、rps12、ycf1)、7個(gè)tRNA基因(trnN-GUU、trnI-CAU、trnL-CAA、trnA-UGC、trnV-GAC、trnI-GAU、trnR-ACG)和4個(gè)rRNA基因(rrn4.5、rrn5、rrn16、rrn23)。從基因功能上看,與自我復(fù)制相關(guān)的基因有69個(gè),與光合作用相關(guān)的基因 49個(gè),另有 6 個(gè)其他編碼蛋白質(zhì)的基因和6個(gè)功能未知的基因? (表2)。
2.2 銹毛兩型豆重復(fù)序列分析
利用在線軟件MISA web在銹毛兩型豆中共檢測(cè)出73個(gè)SSRs(表3),單、二、三、四、五和六核苷酸SSRs的數(shù)目分別為41、28、3、1、0和0。其中,單核苷酸重復(fù)序列共有A(23個(gè)SSRs)、G? (1個(gè)SSRs)和T(17個(gè)SSRs)3種重復(fù)類型;二核苷酸重復(fù)序列共有AT(17個(gè)SSRs)和TA(11個(gè)SSRs)2種重復(fù)類型;三核苷酸共有ATA(1個(gè)SSRs)、ATT(1個(gè)SSRs)和TCT(1個(gè)SSRs)3種重復(fù)類型;四核苷酸共有只有TATC(1個(gè)SSRs)1種重復(fù)類型。在 73個(gè)SSRs中,有13個(gè)SSRs 位于基因的編碼區(qū)(coding sequence,CDS);有60個(gè)SSRs位于基因的非編碼區(qū),其中9個(gè) SSRs位于基因的內(nèi)含子(intron)區(qū)域,51個(gè) SSRs 位于基因間隔區(qū)? (intergenic spacer,IGS)(表4)。
2.3 兩型豆屬密碼子堿基組成分析
去除葉綠體基因組長(zhǎng)度小于300 bp的CDS序列,從銹毛兩型豆和兩型豆葉綠體基因組中篩選到適用于密碼子使用偏好性分析的CDS基因共48條。銹毛兩型豆和兩型豆葉綠體基因組的GC含量見(jiàn)表5。銹毛兩型豆的48個(gè)CDS基因GC1、GC2、GC3和GCall的平均GC含量分別為45.78%(30.8%~56.9%)、38.29%(26.4%~54.7%)、25.67%(18%~35.8%)和36.58%(26.8%~43.3%),而兩型豆的分別為45.75%(31.1%~56.5%)、38.24%(26%~54.7%)、25.6%(17.5%~35.8%)和36.52%(26.4%~? 43.3%)。統(tǒng)計(jì)發(fā)現(xiàn)GC含量在密碼子的3個(gè)位置之間的分布不均,其中 GC1>GC2>GC3,平均 GC 含量均小于 50%,這說(shuō)明銹毛兩型豆和兩型豆的葉綠體基因組傾向于使用A與U作為末尾堿基。銹毛兩型豆和兩型豆葉綠體基因組CDS基因的 ENC 值分別在35.83%(rps18)~? 56.95%(atpE)和35.83%(rps18)~52.01(ycf3),兩個(gè)物種的48個(gè)基因的ENC 值均在35%以上,表明銹毛兩型豆和兩型豆葉綠體基因組的密碼子偏性較弱。
運(yùn)用SPSS軟件對(duì)銹毛兩型豆和兩型豆葉綠體全基因組的GC1、GC2、GC3、GCall和ENC之間的相關(guān)性進(jìn)行分析(表6),銹毛兩型豆相關(guān)性達(dá)到極顯著水平? (P<0.01)的參數(shù)有4組,分別為GC1與GC2、GC1與GCall、GC2與GCall、GC3與GCall,而兩型豆相關(guān)性達(dá)到極顯著水平(P<? 0.01)的參數(shù)有5組,分別為GC1與GC2、GC1與GCall、GC2與GCall、GC3與GCall、GC1與ENC,表明銹毛兩型豆和兩型豆的密碼子第1、2位堿基的成分最為接近,與第3位上的堿基具有一定的相似性,且兩型豆的密碼子第1位堿基構(gòu)成會(huì)對(duì)密碼子的使用偏好性具有極顯著影響。銹毛兩型豆和兩型豆相關(guān)性呈顯著水平的參數(shù)均為4組,銹毛兩型豆的分別為GC2與GC3、GC1與GC3、GC1與ENC、GC3與ENC,兩型豆的分別為GC2與GC3、GC1與GC3、GC3與ENC、GCall與ENC,表明銹毛兩型豆的密碼子第 1位和第3 位堿基組成,兩型豆的密碼子第3 位堿基組成和基因編碼區(qū)總GC含量對(duì)密碼子使用偏性有重要影響。
銹毛兩型豆和兩型豆各氨基酸密碼子的 RSCU 分析顯示(表7),銹毛兩型豆和兩型豆的RSCU 值相近,銹毛兩型豆和兩型豆RSCU>1 的密碼子均有 11 個(gè),其中有6個(gè)密碼子以A作為結(jié)尾,有5個(gè)密碼子以U作為結(jié)尾,沒(méi)有以G作為末尾堿基的密碼子,由此可知銹毛兩型豆和兩型豆偏好于使用 A、U 作為密碼子的末尾堿基。而在RSCU<1 的密碼子中除UGA和CUA以A結(jié)尾外,其余密碼子均以 C 或 G 結(jié)尾,說(shuō)明銹毛兩型豆和兩型豆以 C和G 結(jié)尾的密碼子出現(xiàn)頻率比較低,是非偏好密碼子。
2.4 兩型豆屬密碼子偏好性分析
銹毛兩型豆和兩型豆中性繪圖見(jiàn)圖2。銹毛兩型豆和兩型豆葉綠體基因組各基因的GC3分別為18.0%~35.8%、17.5%~35.8%,GC3 含量最低的基因?yàn)? rps3基因,最高的為? ycf2基因。GC12的取值范圍分別為銹毛兩型豆(29.1%~52.9%)、兩型豆(28.75%~52.90%)。銹毛兩型豆和兩型豆的GC12與 GC3 的相關(guān)系數(shù)分別為? 0.096和? 0.087,相關(guān)性均達(dá)到了顯著水平(P<? 0.05),說(shuō)明突變壓力對(duì)密碼子偏好性的影響具有的顯著的影響。銹毛兩型豆和兩型豆的 GC12與GC3回歸系數(shù)分別為0.285和0.294,滿足GC12和GC3呈顯著相關(guān)性且回歸系數(shù)大于0,說(shuō)明銹毛兩型豆和兩型豆葉綠體基因組密碼子堿基的第3位與第1、2位組成相似,密碼子受突變壓力的影響較大。
銹毛兩型豆和兩型豆葉綠體基因組密碼子的ENC與 GC3的關(guān)聯(lián)分析(圖3)顯示,分布在標(biāo)準(zhǔn)ENC曲線下方的基因較多,其大多與預(yù)期ENC值差距較大,僅有少數(shù)基因位于曲線附近,說(shuō)明銹毛兩型豆和兩型豆葉綠體基因組密碼子偏好性受選擇壓力的影響較大。進(jìn)一步計(jì)算ENC比值,并對(duì)其ENC比值在各個(gè)組段的頻數(shù)和頻率進(jìn)行分析(表8),銹毛兩型豆和兩型豆ENC比值分布在-0.05~0.05 區(qū)間的數(shù)量分別有 9個(gè)和10個(gè),處于-0.05~0.05 區(qū)間外的基因分別為39個(gè)和38個(gè),分別占到基因總數(shù)的81.25%和? 79.16%,這一部分基因離標(biāo)準(zhǔn)曲線較遠(yuǎn),表明銹毛兩型豆和兩型豆偏好性主要受到選擇壓力的影響,這與中性繪圖分析的結(jié)果具有一定的差異。
采用 PR2-plot 繪圖分析銹毛兩型豆和兩型豆各編碼基因部分氨基酸嘌呤(A和G)和嘧啶(T和 C)之間的關(guān)系(圖4),結(jié)果顯示圖中的大部分基因分布于右下角象限內(nèi),說(shuō)明在堿基使用頻率方面,密碼子第3位T堿基的出現(xiàn)頻率大于A堿基,G堿基的出現(xiàn)頻率大于C堿基,嘧啶出現(xiàn)頻率高于嘌呤,銹毛兩型豆和兩型豆葉綠體基因密碼子的第 3 位堿基的使用存在T/C 偏向,其密碼子使用模式不僅受突變壓力的影響,同時(shí)還受選擇壓力以及其他多種因素的影響。[FL)]
2.5 兩型豆屬最優(yōu)密碼子的確定
按照48個(gè)CDS基因的ENC值對(duì)其進(jìn)行排序,根據(jù)高低庫(kù)中密碼子的 RSCU 值和?傄cRSCU 值來(lái)確定銹毛兩型豆和兩型豆葉綠體的最優(yōu)密碼子(表 9)。銹毛兩型豆高表達(dá)密碼子(ΔRSCU≥0.08)有22個(gè),高頻密碼子(RSCU>1)有30個(gè),篩選得到GCU、AGA、CGA、AAU、UGU、CAA、GAA、GGU、CAU、AUA、UUA、AAA、UUU、CCU、AGU、ACU、UAU、GUU等共計(jì)18個(gè)最優(yōu)密碼子。而在兩型豆中,表達(dá)密碼子? (ΔRSCU≥0.08)有25個(gè),高頻密碼子(RSCU≥1)有30個(gè),篩選得到GCU、AGA、CGA、AAU、UGU、CAA、GAA、GGU、CAU、AUA、AUU、UUA、AAA、UUU、CCU、AGU、ACU、UAU、GUA、GUU等共計(jì)20個(gè)最優(yōu)密碼子。除AUU和GUA以外,其余均為兩個(gè)物種的共有最優(yōu)密碼子,共計(jì)18個(gè)。18個(gè)共有密碼子中? △RSCU均大于 0.5 的有 5個(gè),分別為編碼丙氨酸GCU、編碼精氨酸AGA、編碼精氨酸CGA、編碼亮氨酸UUA和編碼纈氨酸GUU。兩個(gè)物種的最優(yōu)密碼子均以A或U結(jié)尾,共有最優(yōu)密碼子當(dāng)中,以A結(jié)尾的最優(yōu)密碼子共計(jì)7個(gè),以U結(jié)尾的有? 11個(gè)。
2.6 系統(tǒng)發(fā)育分析
以繅絲花和金櫻子為外類群,基于豆科20個(gè)物種葉綠體基因組構(gòu)建的系統(tǒng)發(fā)育樹(shù)表明,豆科20個(gè)物種構(gòu)成一個(gè)單系類群,自展支持率(bootstrap)高達(dá)100%(圖5),單系類群形成具有高支持率(100%)的 兩大分支(Clade 1 和 Clade 2),其中Clade 1由小刀豆(Canavalia cathartica)、刀豆(Canavalia gladiata)、棉豆(Phaseolus lunatus)、四棱豆(Psophocarpus tetragonolobus)、美麗密花豆(Spatholobus pulcher)、密花豆(Spatholobus suberectus)黑吉豆(Vigna mungo)、蝶豆(Clitoria ternatea)、北美土圞兒(Apios americana)、大果油麻藤(Mucuna macrocarpa)、油麻藤(Mucuna sempervirens)、紫礦(Butea monosperma)、須彌葛(Haymondia wallichii)、豆薯(Pachyrhizus erosus)、銹毛兩型豆(Amphicarpaea ferruginea)、兩型豆(Amphicarpaea edgeworthii)、寬葉蔓豆(Glycine gracilis)和大豆(Glycine max)18個(gè)物種,Clade 2由山葛(Pueraria montana)和食用葛(Pueraria edulis)2個(gè)物種組成。研究結(jié)果顯示,銹毛兩型豆位于分支1內(nèi),其與兩型豆親緣關(guān)系最近。
3 討? 論
葉綠體全基因組長(zhǎng)度為100~200 kb,包含大量的進(jìn)化信息,其所含大量的高度可變區(qū)域[30],使其成為分子生物標(biāo)志物、系統(tǒng)發(fā)育分析、進(jìn)化分析和比較基因組研究的理想研究模型[31]。近年來(lái),隨著高通量測(cè)序技術(shù)的高速發(fā)展,葉綠體基因組公共數(shù)據(jù)庫(kù)相關(guān)數(shù)據(jù)逐步完善,使牧草植物葉綠體基因組測(cè)序和研究方面取得了一定的發(fā)展,但關(guān)于牧草葉綠體基因組的研究仍然不多。目前僅有關(guān)于紫花苜蓿(Medicago sativa)、箭筈豌豆(Vicia sativa)、鴨茅(Dactylis glomerata)、三葉草(Trifolium subterraneum)和鷹嘴豆(Cicer arietinum)等少量牧草植物葉綠體基因組的報(bào)道研究,牧草在在葉綠體基因組的研究方面還不甚深入,還具有很大的研究發(fā)展空間[32]。銹毛兩型豆的葉綠體基因組長(zhǎng)度為152 531 bp,為典型的雙鏈環(huán)狀四分體結(jié)構(gòu),總GC含量為? 35.45%,符合常見(jiàn)雙子葉植物葉綠體基因組GC總含量在31%~38%的特征[33]。同樣的,其反向重復(fù)區(qū)(41.87%)的總GC含量明顯高于大單拷貝區(qū)(32.97%)和小單拷貝區(qū)(28.81%),其原因可能是因?yàn)閞RNA基因在該區(qū)域的具有較高的 GC值水平表達(dá),而NADH基因可能是導(dǎo)致SSC 區(qū)的低GC含量表達(dá)的關(guān)鍵[34]。但銹毛兩型豆與三葉草、蒺藜苜蓿、鷹嘴豆等傳統(tǒng)豆科牧草相比,其葉綠體基因組特征還是具有一定的差異性,這些傳統(tǒng)牧草植物因一個(gè)反向重復(fù)序列( IR)完全丟失而具有特殊的葉綠體基因組結(jié)構(gòu)[32]。
以往的研究表明,簡(jiǎn)單重復(fù)序列(SSRs)在基因組中廣泛分布,并且由于其特殊的親本遺傳特征,SSR通常用于遺傳群體結(jié)構(gòu)和母體分析,通過(guò)尋找葉綠體基因組的SSR,對(duì)鑒定植物種質(zhì)資源和分子標(biāo)記具有重要意義[35]。本研究結(jié)果顯示,銹毛兩型豆葉綠體基因組共檢測(cè)到41個(gè)單核苷酸、28個(gè)二核苷酸SSRs。其中,二核苷酸重復(fù)序列共有AT(17 SSRs)和TA(11 SSRs)2種重復(fù)類型,表明SSRs 主要由短的 poly A和poly T構(gòu)成[36]。本研究檢測(cè)到的簡(jiǎn)單重復(fù)序列可為今后兩型豆屬植物分子生物學(xué)研究提供候選的分子標(biāo)記。
密碼子使用偏好性與不同因素相關(guān),包括基因表達(dá)水平、GC含量、氨基酸保護(hù)和轉(zhuǎn)錄選擇等[37]。前人研究表明密碼子的使用模式與 GC 含量密切相關(guān),本研究中銹毛兩型豆葉綠體基因組48個(gè)CDS基因GC1、GC2、GC3和GCall的平均GC含量分別為45.78%(30.8%~56.9%)、38.29%(26.4%~54.7%)、25.67%(18%~? 35.8%)和36.58%(26.8%~43.3%),而兩型豆的分別為45.75%(31.1%~56.5%)、38.24%(26%~54.7%)、25.6%(17.5%~35.8%)和36.52%(26.4%~43.3%)。銹毛兩型豆和兩型豆平均 GC 含量均小于 50%,這說(shuō)明兩種植物的葉綠體基因組傾向于使用A與U作為末尾堿基。這與已報(bào)道的與蒺藜苜蓿(Medicago truncatula)[38]和紫苜蓿(Medicago sativa)[39]等表現(xiàn)出一致性。銹毛兩型豆和兩型豆的RSCU 值相近,銹毛兩型豆和兩型豆RSCU>1 的密碼子均有 11 個(gè),其中有6個(gè)密碼子以A作為結(jié)尾,有5個(gè)密碼子以U作為結(jié)尾,沒(méi)有以G作為末尾堿基的密碼子。而在RSCU<1 的密碼子中除UGA和CUA以A結(jié)尾外,其余密碼子均以 C 或 G 結(jié)尾,這與黃花文心蘭(Oncidium gower ramsey)[40]、銀白楊(Populus alba)[41]和喜馬紅景天(Rhodiola himalensis)[42]等對(duì)葉綠體偏性的分析的結(jié)果相似。本研究揭示了選擇和突變是影響密碼子偏好性的可能因素。選擇理論解釋說(shuō),密碼子偏好性有助于蛋白質(zhì)表達(dá)的效率和準(zhǔn)確性,因此進(jìn)行正選擇。同時(shí),突變解釋假設(shè)由于突變模式的非隨機(jī)性,存在密碼子偏倚[43-44]。雖然密碼子偏好性選擇背后的機(jī)制仍有爭(zhēng)議,但本研究中確定了GC含量與密碼子使用模式之間的強(qiáng)相關(guān)性[45]。本研究中銹毛兩型豆和兩型豆植物葉綠體基因組 RSCU 值的變異范圍相似,分別為? 0.23~1.92和0.24~1.92,均以CGC(編碼精氨酸) 的 RSCU值最低和AGA(編碼精氨酸) RSCU值最高,表明銹毛兩型豆和兩型豆均以CGC使用頻率最低,AGA 使用頻率最高,這一結(jié)果與柿屬(Diospyros)[46]植物和蒺藜苜蓿[37]等結(jié)果表現(xiàn)出一致性。但卻與蒜頭果(Malania oleifera)[47]、高山松(Pinus densata)[48]、楸樹(shù)(Catalpa bungei)[49]等植物的研究表現(xiàn)出差異性,這些植物以AGC(編碼絲氨酸)的RSCU值最低,TTA(編碼亮氨酸)最高,這表明不同植物的氨基酸與密碼子的偏好性具有一定的差異。
根據(jù)分子進(jìn)化的中性理論,堿基突變和自然選擇對(duì)密碼子第3堿基變化的影響是中性的或接近中性的[50]。如果密碼子的使用受到自然選擇的影響,GC3值的分布范圍較小,GC12和GC3沒(méi)有顯著的相關(guān)性[51]。本研究表明,銹毛兩型豆和兩型豆的GC12與 GC3 的相關(guān)系數(shù)分別為0.341和0.362,相關(guān)性均達(dá)到了顯著水平(P<0.05),說(shuō)明突變壓力對(duì)密碼子偏好性具有顯著的影響。然而,ENC-plot和PR2-plot分析表明,銹毛兩型豆和兩型豆葉綠體基因組的密碼子偏好可能受到突變和自然選擇的影響。由此可以看出,植物密碼子使用偏差受到多種因素的影響,而影響CUB的主要因素在不同植物物種中也可能存在差異。另外,本研究在銹毛兩型豆和兩型豆中分別提取到18個(gè)和20個(gè)最優(yōu)密碼子,其中共有18個(gè)共有密碼子,兩個(gè)物種的最優(yōu)密碼子均以A或U結(jié)尾,共有最優(yōu)密碼子當(dāng)中,以A結(jié)尾的最優(yōu)密碼子共計(jì)7個(gè),以U結(jié)尾的有11個(gè)。同時(shí)本研究在研究銹毛兩型豆和兩型豆葉綠體基因組的基礎(chǔ)上第一次對(duì)兩型豆屬已公布在NCBI平臺(tái)上的葉綠體基因組序列進(jìn)行了系統(tǒng)發(fā)育分析,確定了兩型豆屬的系統(tǒng)發(fā)育位置。總之,本研究對(duì)于兩型豆屬葉綠體基因組特征、密碼子偏好性及系統(tǒng)發(fā)育的分析可能對(duì)后續(xù)的密碼子優(yōu)化、葉綠體基因組改造、探索物種進(jìn)化和增加外源基因表達(dá)具有重要意義。
參考文獻(xiàn) Reference:
[1] KUMAR S,SANE P V. Legumes of South Asia [M]. London:Royal Botanic Gardens,Kew. A Checklist,2003:1-536.
[2] SHAN J G,ZHANG Y,GENG S L,et al. Comparative embryology of aerial and subterranean flowers of Amphicarpaea edgeworthii Benth (Leguminosae) [J]. Acta Scientiarum Naturalium Universitatis Pekinensis,2009,45(3):395-401.
[3] OHASHI H,OHASHI K. A taxonomic revision of Amphicarpaea (Leguminosae) including a pollen morphological comparison with Shuteria [J]. Journal of Japanese Botany,2016,91:231-249.
[4] OHASHI K,OHASHI H. A phylogenetic study of Amphicarpaea with a new genus Afroamphica (Leguminosae Tribe Phaseoleae) [J].Journal of Japanese Botany,2018,93(1):9-17.
[5] 鄭月萍. 兩型豆(Amphicarpaea edgeworthii Benth.)和野大豆(Glycine soja Sieb. et Zucc.)的生物學(xué)特性比較研究[D].浙江金華:浙江師范大學(xué),2012.
ZHENG Y P. Comparative study on biological characteristics of Amphicarpaea edgeworthii Benth. and Glycine sofa Sieb.et Zucc. [D]. Jinhua Zhejiang :Zhejiang Normal University,2012.
[6] 吳征鎰.中國(guó)植物志(第41卷1分冊(cè))[M].北京:科學(xué)出版社,1995:257.
WU ZH Y. Flora Reipublicae Popularis Sinicae (Volume 41,Division 1) [M]. Beijing:Science Press,1995:257.
[7] 喬亞科,李桂蘭,王文頗,等.三籽兩型豆生長(zhǎng)發(fā)育特性及栽培技術(shù)研究[J].中國(guó)中藥雜志,2003(10):24-26.
QIAO Y K,LI G L,WANG W P,et al. Primary study on developmental speciality and cultural practices of Amphicarpaea edgeworthii[J]. China Journal of Chinese Materia Medica,2003(10):24-26.
[8] 劉國(guó)道,楊虎彪.中國(guó)南方牧草志.第一卷,豆科[M].北京:科學(xué)出版社,2022:479.
LIU G D,YANG H B.Forage Flora of Southern China. Volume 1,Leguminosae [M]. Beijing:Science Press,2022:479.
[9] SUGIURA M,SHINOZAKI K,ZAITA N,et al. Clone bank of the tobacco (Nicotiana tabacum) chloroplast genome as a set of overlapping restriction endonuclease fragments:mapping of eleven ribosomal protein genes [J]. Plant Science,1986,44:211-217.
[10] SUGIURA M. The chloroplast genome [J]. Plant Molecular Biology,1992,19:149-168.
[11] PEDEN J F. Analysis of codon usage [J]. Biology System,1999,5:45-50.
[12] SHARP P M,EMERY L R,ZENG K. Forces that influence the evolution of codon bias [J]. Philosophical Transactions of the Royal Society of London. Series B:Biological Sciences,2010,365:1203-1212.
[13] SHARP P M,STENICO M,PEDEN J F,et al. Codon usage:mutational bias,translational selection,or both? [J]. Biochemical Society Transactions,1993,21:835-841.
[14] SUBRAMANIAN S. Nearly neutrality and the evolution of codon usage bias in Eukaryotic genomes:figure 1 [J]. Genetics,2008,178:2429-2432.
[15] QIN H,WU W? B,COMERON J M,et al. Intragenic spatial patterns of codon usage bias in prokaryotic and eukaryotic genomes [J]. Genetics,2004,168:2245-2260.
[16] XING Z B,CAO L,ZHOU M,et al. Analysis on codon usage of chloroplast genome of Eleutherococcus senticosus [J]. China Journal of Chinese Materia Medica,2013,? 38(5):661-665.
[17] TAI T H,TANKSLEY S D. A rapid and inexpensive method for isolation of total DNA from dehydrated plant tissue [J]. Plant Molecular Biology Reporter,1990,? 8(4):297-303.
[18] DING B C,SUN Y,RONG F X,et al. The complete mitochondrial genome of Holothuria spinifera (Théel,1866) [J].Mitochondrial DNA Part B:Resources,2020,5(2):1679-1680.
[19] QU X J,MOORE M J,LI D Z,et al. PGA:a software package for rapid,accurate,and flexible batch annotation of plastomes [J].Plant Methods,2019,15(1):50.
[20] BEIER S,THIEL T,MUUNCH T,et al. MISA-web:a web server for microsatellite prediction [J]. Bioinformatics,2017,33(16):2583-2585.
[21] ROSENBERG MS,SUBRAMANIAN S,KUMAR S. Patterns of transitional mutation biases within and among mammalian genomes [J]. Molecular Biology and Evolution,2003,20:988-993.
[22] NOBORU S. Directional mutation pressure and neutral molecular evolution [J]. Proceedings of the National?? Academy of Sciences of the United States of America,1988,85:2653-2657.
[23] XING Y P,XU L,CHEN S Y,et al.Comparative analysis of complete chloroplast genomes sequences of Arctium lappa and A.tomentosum [J]. Biologia Plantarum,2019,63(1):565-574.
[24] WRIGHT F. The ‘effective number of codons used in a gene [J]. Gene,1990,87:23-29
[25] 尚明照,劉 方,華金平,等. 陸地棉葉綠體基因組密碼子使用偏性的分析[J].中國(guó)農(nóng)業(yè)科學(xué),2011,44(2):245-253.
SHANG M ZH,LIU F,HUA J P,et al. Analysis on codon usage of chloroplast genome of Gossypium hirsutum[J]. Scientia Agricultura Sinica,2011,44(2):245-253.
[26] 趙 洋,劉 振,楊培迪,等.密碼子偏性分析方法及茶樹(shù)中密碼子偏性研究進(jìn)展[J].茶葉通訊,2016,43(2):3-7.
ZHAO Y,LIU ZH,YANG P D,et al. Codon bias analysis method and research progress on codon bias in Camellia sinensis [J]. Journal of Tea Communication,2016,? 43(2):3-7.
[27] 胡莎莎,羅 洪,吳 琦,等.苦蕎葉綠體基因組密碼子偏愛(ài)性分析[J].分子植物育種,2016,14(2):309-317.
HU SH SH,LUO H,WU Q,et al. Analysis of codon bias of chloroplast genome of Tartary Buckwheat[J]. Molecular Plant Breeding,2016,14(2):309-317.
[28] KATOH K,MISAWA K,KUMA K I,et al. MAFFT:a novel method for rapid multiple sequence alignment based on fast fourier transform [J]. Nucleic Acids Research,2002,30(14):3059-3066.
[29] NIE X,LV S,ZHANG Y,et al. Complete chloroplast genome sequence of a major invasive species,crofton weed (Ageratina adenophora)[J]. PLoS One,2012,7:e36869
[30] GUO S,LIAO X,CHEN S,et al. A comparative analysis of the chloroplast genomes of four Polygonum medicinal plants[J]. Frontiers in Genetics,2022,13:764534.
[31] TIAN C,LI X,WU Z,et al. Characterization and comparative analysis of complete chloroplast genomes of three species from the Genus Astragalus (Leguminosae)[J]. Frontiers in Genetics,2021,12:705482.
[32] 陶曉麗,王彥榮,劉志鵬.牧草葉綠體基因組研究進(jìn)展[J].草業(yè)科學(xué),2015,32(6):978-987.
TAO X L,WANG Y R,LIU ZH P. Progress in chloroplast genome analysis of herbage [J].Pratacultural Science,2015,32(6):978-987.
[33] 丁祥青,畢遠(yuǎn)洋,陳佳婷,等.抱莖金花茶(Camellia tienii)的葉綠體基因組特征分析[J].江蘇農(nóng)業(yè)科學(xué),2022,? 50(23):33-40.
DING X Q,BI Y Y,CHEN J T,et al. Analysis of chloroplast genome characteristics of Camellia tienii[J]. Jiangsu Agricultural Sciences, 2022,? 50(23):33-40.
[34] YAN L,WANG H,HUANG X,et al. Chloroplast genomes of Genus Tilia:comparative genomics and molecular evolution[J]. Frontiers in Genetics,2022,13:925726.
[35] LIU S,F(xiàn)ENG S,HUANG Y,et al. Characterization of the complete chloroplast genome of Buddleja lindleyana [J]. Journal of AOAC International,2022,105(1):202-210.
[36] KUANG D Y,WU H,WANG Y L,et al. Complete chloroplast genome sequence of Magnolia kwangsiensis (Magnoliaceae):implication for DNA barcoding and population genetics [J]. Genome,2011,54(8):663-673.
[37] 吳憲明,吳松鋒,任大明,等. 密碼子偏性的分析方法及相關(guān)研究進(jìn)展[J].遺傳,2007,29(4):420-426.
WU X M,WU S F,REN D M,et al. The analysis method and progress in the study of codon bias [J]. Hereditas,2007,29(4):420-426.
[38] 楊國(guó)鋒,蘇昆龍,趙怡然,等. 蒺藜苜蓿葉綠體密碼子偏好性分析[J].草業(yè)學(xué)報(bào),2015,24(12):171-179.
YANG G F,SU K L,ZHAO Y R,et al. Analysis of codon usage in the chloroplast genome of Medicago truncatula [J]. Acta Prataculturae Sinica,2015,24(12):171-179.
[39] 喻 鳳,韓 明.紫花苜蓿葉綠體基因組密碼子偏好性分析[J].廣西植物,2021,41(12):2069-2076.
YU F,HAN M. Analysis of codon usage bias in the chloroplast genome of alfalfa (Medicago sativa) [J]. Guihaia,2021,41(12):2069-2076.
[40] XU C,CAI X,CHEN Q. Factors affecting synonymous codon usage bias in chloroplast genome of Oncidium gowerramsey [J]. Evolutionary Bioinformatics,2011,7:271-278.
[41] ZHOU M,LONG W,LI X. Analysis of synonymous codon usage in chloroplast genome of Populas alba [J]. Journal of Forestry Research,2008,4:293-297.
[42] 張 雨,蘇 旭,劉玉萍,等.喜馬紅景天葉綠體基因組特征及其系統(tǒng)發(fā)育分析[J].植物研究,2022,42(4):602-612.
ZHANG Y,SU X,LIU Y P,et al. Characteristics of complete chloroplast genome and phylogenetic analysis of Rhodiola himalensis (Crassulaceae) [J]. Bulletin of Botanical Research,2022,42(4):602-612.
[43] LESEBERG C H,DUVALL M R. The complete chloroplast genome ofCoix lacryma-jobi and a comparative molecular evolutionary analysis of plastomes in cereals [J].Journal of Molecular Evolution,2009,69(4):311-318.
[44] BUMER M. The selection-mutation-drift theory of synonymous codon usage[J].Genetics,1991,129:897-907.
[45] GUI L J,JIANG S F,XIE D F,et al. Analysis of complete chloroplast genomes of Curcuma and the contribution to phylogeny and adaptive evolution [J]. Gene,2020,732:144355.
[46] 傅建敏,索玉靜,劉慧敏,等.柿屬植物葉綠體蛋白質(zhì)編碼基因密碼子用法[J].經(jīng)濟(jì)林研究,2017,35(2):38-44.
FU J M,SUO Y J,LIU H M,et al. Analysis on codon usage in the chloroplast protein-coding genes of Diospyros spp. [J]. Nonwood Forest Research,2017,35(2):38-44.
[47] 原曉龍,劉 音,康洪梅,等.蒜頭果葉綠體基因組密碼子偏好性分析[J].西南林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)),2021,? 41(3):15-22.
YUAN X L,LIU Y,KANG H M,et al. Analysis of codon usage bias in chloroplast genome of Malania oleifera [J]. Journal of Southwest Forestry University,2021,41(3):15-22.
[48] 李江飛,李亞麒,唐軍榮,等.高山松葉綠體基因組密碼子偏好性模式[J].生物學(xué)雜志,2023,40(1):52-59.
LI J F,LI Y Q,TANG J R,et al. Comparison of codon preference patterns in the chloroplast genome of Pinus densata [J]. Journal of Biology,2023,40(1):52-59.
[49] 李 鳳,辛 靜,辛雅萱,等. 楸樹(shù)葉綠體基因組密碼子偏性分析[J].南方農(nóng)業(yè)學(xué)報(bào),2021,52(10):2735-2743.
LI F,XIN J,XIN Y X,et al. Codon usage bias of chloroplast genome in Catalpa bungei C.A.Mey. [J]. Journal of Southern Agriculture ,2021,52(10):2735-2743.
[50] ZHOU M,LONG W,LI X. Patterns of synonymous codon usage bias in chloroplast genomes of seed plants [J]. For Study China,2008,10(4):235-242.
[51] KAWABE A,MIYASHITA N T.Patterns of codon usage bias in three dicot and four monocot plant species [J]. Genes & Genetic Systems,2003,5:343-352.
Genomic Characteristics and Codon? Usage Bias of Chloroplast Genome in Amphicarpaea Elliot
Abstract In order to elucidate the chloroplast genome structure of Amphicarpaea ferruginea and analyze the codon usage bias and influencing factors of Amphicarpaea species chloroplast genome,the leguminous grass species of A. ferruginea which holds considerable potential for development and?? utilization prospects in the central and southern subtropical regions,was used as the test material. The chloroplast genome of A. ferruginea was sequenced,assembled and annotated using high-throughput sequencing technology,and its chloroplast genome structure and gene composition were analyzed. CodonW 1.4.2 software and CUSP online program were used to analyze the gene codon usage bias parameters and nucleotide composition of A. ferruginea and A. edgeworthii. The results showed that A. ferruginea chloroplast genome had a total length of 152? 531 bp and followed a typical tetrad structure,including a large single copy region (LSC) of 83 364 bp,a small single copy region (SSC) of 17 935 bp,and a pair of inverted repeats of 25 616 bp. The GC content was 35.44%. The A. ferruginea chloroplast genome encoded 130 genes, comprising 85 protein-coding genes,37 tRNA genes and 8 rRNA genes. A total of 73 simple sequence repeats (SSRs) were detected in the A. ferruginea chloroplast genome. The numbers of mononucleotide,dinucleotide,trinucleotide,tetranucleotide,pentanucleotide,and hexanucleotide SSRs were 41,28,3,1,0 and 0,respectively. A total of 48 CDS genes suitable for codon usage bias analysis were screened from the A. ferruginea and A. edgeworthii chloroplast genomes. The codon usage patterns of the two plant chloroplast genomes were similar,both tending to use A and U as terminal bases. The ENC values of the 48 genes were all above 35%,indicating that the codon usage bias of A. ferruginea and A. edgeworthii chloroplast genomes was weak. The results of neutral plot analysis,effective number of codons ( ENC-plot ) analysis and parity preference (PR2-plot ) analysis showed that the codon usage patterns of Amphicarpaea chloroplast genome was not only affected by mutation pressure,but also by selection pressure and other factors. 18 and 20 optimal codons were identified in A. ferruginea and A. edgeworthii, respectively,among which there were 18 optimal codons. The phylogenetic tree construction based on the chloroplast genomes of 20 species of Leguminosae showed that the 20 species of Leguminosae constituted a monophyletic group,and A. ferruginea and A. edgeworthii were most closely related.