中圖分類號:S432.41;Q52 文獻標識碼:A 文章編號:1000-369X(2025)04-0587-17
Analysis of Codon Usage Bias in Chloroplast and Mitochondrial Genomes of Camellia sinensis cv. \"Baihaozao'
ZENG Wenjuan 1,2,3,4 , LIU Shan 1,2,3,4 , WEN Cong1 g1,2.3,4, ZHANG Qixiang 1,2,3,4 HUANG Jing5, GONG Yihui1,2,3,4, ( , CHEN Zhiyin1,2,3,4*
1.ColegeofgiculureadotechnologyHunanUversityofmaiies,ieneandThnologyLoudioa;2.
InovationandEntrepreneurshipEducationCenterforHorticulturalProductionandProcesinginHunanProvince,HunanUniversityof Humanities,ienceandchologyLoudi47o,ina;3.uanUiversityfHumaniiesieneadcnologya ProvincialIovationandEntrepreneurshipDemonstrationBase,Loudi47ooo;4.KeyLaboratoryofCharacteristicAgricultural
ResourceDevelopmentandQualitySafetyControlinHunanProvice,HunanUniversityofHumanities,ScienceandTechnologyLoudi 417000,China;5.Tea Research Institute of Hunan Academy of Agricultural Sciences,Changsha 410l25,China
Abstract: Codon usage bias serves as a critical driving mechanism in gene expresson regulation and molecular evolution,holding significant biological importance in theevolution of organelle genomes in plants.Thisstudy focused on the economically important tea cultivar ‘Baihaozao’ (Camellia sinensis cv.‘Baihaozao\")and systematically analyzed the codon usage patternsand evolutionary drivers of its chloroplast (52 genes)and mitochondrial (29 genes) genomes for the first time.The results indicate: (1) the average effective codon number (ENC=44.57±4.59) )of the chloroplast genome is significantly lower than that of the mitochondrial genome (ENC=51.87±5.31 ),with both exhibiting weak preference characteristics. Neutrality analysis reveals that the chloroplast's preference is primarily driven by natural selection (correlation between GC3s and ENC, R2=-0.016 ) whereas the mitochondrial genome is regulated by a combination of natural selection and mutational pressure ( R2= -0.1),which is consistent withthe evolutionaryconstraints observed in theorganelle genomes of dicotyledons.(2) RSCU analysis shows that both types of organelle genomes significantly prefer synonymous codons ending in ΔA/U withhigh-expression chloroplast genes (e.g.,ndhA,rps14)exhibiting astronger preference for A/U terminal codons. This suggests that translational selection optimizes highly expressd genes. (3) Through multivariate statistical screening,18 optimal codons were identified for the chloroplast genome (e.g.,GCA,GCU)and18 optimal codons for the mitochondrial genome (e.g., GCA, AGA). GCA was favored in both organelle types,reflecting the adaptive convergence of functional genes across organeles.This study elucidated the heterogeneity of codon usage characteristics in the organelle genomes of‘Baihaozao’ and their evolutionary drivers for the first time, providing a theoretical basis for the adaptive optimization of exogenous genes andtheconstruction of cross-organell expression regulatory networks in molecular tea breeding.
Keywords:Cameliasinensiscv.Baihaozao’,chloroplastgenome,mitochondrialgenome,codonusagebias,optimalcodon
密碼子使用偏好性(Codonusagebias,CUB)作為基因組進化與基因表達調控的關鍵指標,深刻反映物種在突變-選擇平衡下的分子適應策略。經典理論表明,CUB的形成機制可追溯至tRNA豐度與翻譯效率的協同優化[1]。在植物細胞器中,葉綠體與線粒體因遺傳系統半自主性、修復機制差異(如葉綠體依賴SOS修復,而線粒體依賴錯配修復)及重組頻率低(線粒體重組抑制顯著),其CUB模式與核基因組存在顯著分異。例如,刺柏屬(Juniperus)葉綠體因光合基因高表達呈現嘧啶第3位堿基偏好( C3s/T3s 占比 gt;65% )[2],而石竹科(Caryophyllaceae)線粒體因母系遺傳與重組抑制導致AT偏好性顯著增強(密碼子第3位A/T占比達 78.3% )。上述分異暗示,細胞器CUB的進化驅動力需從突變壓力(如GC/AT偏向性)與自然選擇(如翻譯效率優化)的互作中解析,但其相對貢獻仍存在顯著爭議。
當前研究普遍認為,葉綠體CUB存在突變壓力主導型(如蒺藜苜蓿, GC3s 與基因組GC含量顯著正相關, R2=0.82 )[與自然選擇主導型[如薔薇科植物,有效密碼子數(Effectivenumberofcodons,ENC)與 GC3s 無顯著相關性]的類群分化[4-5];而線粒體因重組抑制與進化速率快,其CUB常受適應性選擇強烈驅動(如石竹科線粒體密碼子適應指數(Codonadaptationindex,CAI)與基因表達量顯著正相關, Plt; 0.01)。Sharp等[1提出的“選擇強度指數(S)”進一步量化了跨物種CUB進化約束的異質性,揭示線粒體受選擇壓力強度普遍高于葉綠體。值得注意的是,Sueokal根據定向突變壓力理論,認為基因組中中性區域的突變壓力效應更為顯著。這為解析細胞器CUB的異質性提供了理論框架。然而,現有研究多聚焦單一細胞器或單一驅動因素,對同一物種內雙細胞器CUB協同進化機制的系統解析仍存在顯著空間,尤其缺乏整合多維度驗證策略(如PR2-plot中性檢驗與對應性分析)的典型案例[5,7]。
現有植物細胞器CUB研究存在三方面局限性:(1)最優密碼子篩選標準單一化:如獨腳金(Elaeagnusangustifolia)葉綠體依賴相對同義密碼子使用度(Relativesynonymouscodonusage,RSCU)單一指標篩選的UCU因未通過PR2-plot中性檢驗導致假陽性[8],而水稻(Oryzasativa)葉綠體研究通過RSCU、ENC與中性繪圖交叉驗證篩選出32個高頻密碼子,顯著提升篩選可靠性[9];(2)線粒體基因組數據匱乏:以茶樹(Camelliasinensis)為例,其線粒體因高雜合度 (gt;0.8% )與動態重組特性導致組裝困難,現有數據庫覆蓋率不足5%[10] ;(3)跨細胞器CUB與生態適應性的關聯機制不明:僅少數研究[如甘草(Glycyrrhiza)葉綠體CAI與年均降水量顯著相關, R2=0.518 4]納入氣候因子與密碼子適應指數的相關性分析[5,11]。近期研究進一步指出,PR2-plot分析可有效區分突變壓力與自然選擇對密碼子第3位堿基的差異化影響[2.5],而中性繪圖的回歸線斜率(如斜率 gt;0.5 提示突變壓力主導)為量化驅動力貢獻度提供了定量工具[12-13]。上述瓶頸嚴重制約了細胞器基因工程與分子育種的精準設計。
‘白毫早’(Camelliasinensiscv.‘Baihaozao')作為高抗逆性茶樹品種(耐寒性評分較普通品種提高 40% ),其葉綠體與線粒體基因組的CUB特征尚未解析。本研究首次整合‘白毫早’雙細胞器基因組數據,建立雙細胞器CUB協同進化模型。通過中性繪圖、ENC- ?GC3s 回歸模型及PR2-plot偏倚檢驗,量化突變壓力與自然選擇的相對貢獻;聯合對應性分析與多因素回歸模型,篩選細胞器特異性最優密碼子。研究結果不僅深化植物細胞器基因組進化理論,更為高抗逆茶樹品種設計提供分子調控依據。
1材料與方法
1.1樣本來源與預處理
1.1.1樣本采集與處理
‘白毫早’幼嫩葉片樣本于2022年6月采自湖南省新化縣川坳村標準化茶園( 27°46′ 1.226\"N , 110°53′17.932\"E) 。樣本采集后立即液氮速凍,全程干冰保存并運輸至南京集思慧遠生物科技有限公司進行葉綠體基因組測序,以確保DNA完整性和后續分析的可靠性。
1.1.2DNA提取與測序
采用改良CTAB法提取茶樹葉片總DNA,并通過梯度離心實現細胞器富集。具體流程:取新鮮幼嫩葉片經液氮研磨后,加入預冷提取緩沖液( 100mmol?L-1 Tris-HC1, 20mmol?L-1 EDTA, 1.4mol?L-1NaCl , 2% CTAB, pH8.0 )裂解細胞,經雙層尼龍網過濾后,通過差速離心\" (2000×g10min ; 12000×g20min )分別收集葉綠體和線粒體組分[14-15]。采用蔗糖密度梯度離心( 30%~50% 梯度)進一步純化葉綠體,并通過DNaseⅠ處理去除核基因組污染[14,16]。線粒體組分經蛋白酶K消化后,使用酚-氯仿法分離高純度mtDNA[17-18]。經Qubit 4.0定量和 1% 瓊脂糖電泳驗證后,分別構建葉綠體與線粒體DNA測序文庫。
1.1.3葉綠體基因組組裝
基于Illumina NovaSeq 60oo平臺獲取PE150數據,采用混合組裝策略整合二代和三代測序數據。使用GetOrganelle進行初步組裝,通過SSPACEv2.0和GapFiller v2.1.1完成scaffold連接與缺口填補[19]。針對IR區邊界不確定性,設計特異性引物進行PCR驗證,并通過循環校正策略確保單拷貝區與反向重復區的精確組裝[19]。
1.1.4線粒體基因組組裝
采用Canuassembler對PacBioCCS數據進行糾錯組裝,結合Unicycler整合Illumina短讀長數據。利用Bandagev0.8.1可視化環狀結構,通過minimap2比對植物線粒體核心基因集(Plant_mt_ref_gene v2.0)驗證組裝完整性[17-18]。針對亞環結構采用手動調整策略,通過長讀長數據支持的分支比對解決復雜重復區域[15,19]。
1.1.5基因組注釋與基因篩選
‘白毫早’葉綠體基因組全長157052bp(GenBank登錄號:PQ066596),包含52個蛋白編碼基因(Protein-codinggenes,CDS);線粒體基因組總長909843bp(GenBank登錄號:PV340641-PV340651),含29個CDS。采用
DOGMA程序進行自動化注釋,并通過Geneious v9.0.2 手動修正移碼突變及RNA編輯位點(基于RNA-seq數據)。基因篩選標準如下: ① 起始密碼子包括ATG/GTG/ATT(線粒體特有); ② 終止密碼子排除非標準類型(如AGA在植物線粒體中的特殊功能); ③ 剔除編碼區含內部終止密碼子或長度 lt;270bp 的基因; ④ 利用OrthoFinderv2.5.4進行直系同源基因聚類驗證功能保守性(E值 )[1]。最終保留52個葉綠體基因與29個線粒體基因用于后續分析。
1.2密碼子偏好性分析方法
1.2.1堿基組成與密碼子參數計算
基于CodonWv1.4.2計算以下參數:CAI(取值范圍0~1,趨近1表示高翻譯效率)、RSCU( gt;1 表示顯著偏好)、ENC(20~61,數值越小偏好性越強)。通過EMBOSSCUSP模塊解析密碼子各堿基位點GC含量( GC1,GC2 、GC3 及 GCall ),并采用SPSS24.0進行Pearson相關性分析(顯著性閾值 Plt;0.05. ,重點探究 GC3 與密碼子偏好性的關聯。前人研究表明, GC3 含量與密碼子偏好性呈顯著負相關,且末端堿基為A/T的密碼子更易被優先選擇[20-22]。
1.2.2中性繪圖分析
構建以 GC1 、 GC2 為自變量, GC3 為因變量的多元線性回歸模型。通過決定系數 (R2 )與回歸斜率評估突變壓力與自然選擇的相對貢獻:若回歸斜率 ≈1 且 R2gt;0.5 ,則偏好性主要由突變壓力驅動;反之則以自然選擇為主導[20-21]。
1.2.3ENC-plot分析
繪制ENC實際觀測值與 GC3 含量的二維分布圖,疊加理論曲線方程為 VENC,#?=2+ GC3s+29/[GC3s2+(1-GC3s)2] 。數據點顯著分布于曲線下方時,表明自然選擇或翻譯優化對密碼子使用模式具有顯著調控作用[22-23]。
1.2.4PR2-plot分析
基于密碼子第3位堿基組成,構建二維坐標系[橫坐標: A3/(A3+T3) ;縱坐標: G3/(G3+C3)] 。通過數據點偏離中心點(0.5,0.5)的程度,量化堿基使用偏倚的非對稱性。顯著偏移提示突變偏倚或選擇壓力主導[24-25]。
1.2.5最優密碼子識別
按ENC值對基因排序,分別選取高表達組(葉綠體:ycf3、rpl2等;線粒體:atp4、rps7)與低表達組(葉綠體:psbA、rps8等;線粒體:rps13、sdh3),計算△RSCU為高表達組RSCU與低表達組RSCU的差值。篩選閾值設定為 ΔRSCU≥0.08 且RSCU高表達組 gt;1 ,最終確定物種特異性最優密碼子集合[26-27]。
2結果與分析
2.1密碼子堿基組成與偏好性特征
2.1.1堿基組成差異
對‘白毫早’葉綠體與線粒體基因組的密碼子堿基組成分析表明(表1、表2),二者在核苷酸組成上呈現顯著分化。葉綠體基因組共包含52個密碼子,其3個位點平均GC含量( GCall )為 37.98% (范圍 29.8%~44.14% ),其中 GC1 ( 46.85% )、 GC2 ( 39.50% )和 GC3 ( 27.59% )呈逐級遞減趨勢,第3位點AT偏好顯著( GC3lt;30% )。線粒體基因組29個密碼子的 GCall 均值( 42.83% )顯著高于葉綠體( Plt; 0.05),且 GC3 含量( 37.52% )較葉綠體高9.93個百分點,暗示兩類細胞器在進化中可能受到不同的突變壓力或選擇約束[21,23]。
2.1.2密碼子偏好性強度
ENC量化分析表明,‘白毫早’細胞器基因的密碼子使用偏好性整體較弱。葉綠體基因組的ENC值介于 34.24~53.16 (均值44.57),其中 98% 基因(51個)的ENC值超過35;線粒體基因組的ENC值范圍更廣( 37.79-61.00 ,均值51.87),所有基因均顯示弱偏好( ENCgt;35 )。這一特征與列當科植物葉綠體基因組(平均ENC為48.17)[28]及云南藍果樹( ENCgt;45 基因占比75% )[23]相似,但顯著區別于Ganoderma屬真菌線粒體(平均ENC為31.53)[29],反映不同物種細胞器基因表達策略的多樣性。值得注意的是,線粒體ENC均值顯著高于葉綠體( Plt;0.01 ),
表1GC含量與ENC值在‘白毫早’葉綠體基因組間的對比分析
[able 1 Comparative analysis of GC content and ENC values in the chloroplast genome of ‘Baihaoz:
表2GC含量與ENC值在‘白毫早’線粒體基因組間的對比分析
Table2Comparative analysis ofGC content and ENC values in the mitochondrial genome of‘Baihaozao
暗示其密碼子使用受自然選擇的約束較弱,可能與線粒體基因表達調控機制的獨特性有關[30-31]。
2.2中性繪圖分析
中性繪圖分析揭示了‘白毫早’葉綠體與線粒體基因組密碼子偏好性形成機制的顯著差異及功能異質性。中性繪圖模型( GC12 VSGC3 回歸分析)定量解析了自然選擇與突變壓力對‘白毫早’細胞器基因組密碼子偏好性的相對貢獻。
2.2.1葉綠體基因組:自然選擇主導下的功能基因分化
由圖1可知,葉綠體基因組的回歸模型(A: y=0.408+0.0853x) )顯示極低的調整決定系數( ,表明自然選擇貢獻率(59.2%)顯著高于突變壓力(40.8%)[21,32]。
值提示模型解釋力弱于均值預測,暗示非中性進化因素(如RNA編輯或表觀修飾)可能對密碼子偏好性產生調控作用[33-34]。功能基因分析進一步揭示:光合系統Ⅱ核心基因(psbB、psbC)的 GC3 平均值( 31.45% )顯著偏離中性預期( ΔGC3=3.86% , P=0.007 ),符合光合相關基因受強烈自然選擇的普遍規律[32.35];而核糖體蛋白基因(如rpl16,其 GC3=19.85% 顯著低于其 GC12=51.84% ),其進化模式符合突變壓力主導的特征,反映了葉綠體內功能基因的進化路徑分化[36-37]。
2.2.2線粒體基因組:選擇與突變的區域異質性
線粒體基因組呈現顯著的空間異質性( F=4.32 , P=0.002) ,具體表現見圖2。
片段1(atpl~rps7):回歸方程 y=0.489- 0.081 7x ( )顯示自然選擇貢獻率為51.1% 。ATP合酶基因(atp1、atp6)的 GC3 值(32.66%±1.65% )與 GC12 呈非線性關系,其密碼子偏好性( ΔRSCU=0.18 )與呼吸鏈功能強相關( R2=0.4624 , P=0.01 ),支持翻譯優化驅動的適應性選擇假說[6,38]。
片段2(apt8~rps4):方程 ν=0.467-0.0472x ( )顯示自然選擇貢獻率為 53.3% 。cox3基因 GC3 值( 33.83% )顯著低于中性預期( 37.52% ),其第3位堿基偏好C結尾( C3%=63.8% ),可能與復合體IV亞基的氧化還原穩定性需求相關[39-40]。
片段3(cob~sdh3):方程 y=0.536-0.295x (20號 )顯示自然選擇貢獻率為 46.4% 。核糖體基因(rpl5、rps13)的 GC3 值( 33.14% ±8.35% )與 GC12 高度同步( R2=0.6724AA ,符合中性進化特征[20,27]。
片段5(rpl16~rps3):極端負 值(-0.97)反映數據離散度極高( GC3 范圍為31.4%~50.0%) ,可能源于功能異質性基因(如rps3)在自然選擇( ΔENC=14.2 )與突變壓力間的動態平衡[6,33]。
片段8(apt4~ccmC): NAN提示數據存在完全共線性或樣本量不足( 1=2 [4],atp4基因 GC3 異常值( 40.41% )可能與其跨膜結構域疏水性氨基酸(如GCA-Ala)的局部適應性選擇相關[40-41]。
圖2‘白毫早’線粒體基因組密碼子中性繪圖分析
注:A為線粒體片段1;B為線粒體片段2;C為線粒體片段3;D為線粒體片段4;E為線粒體片段5;F為線粒體片段8。 Note:A,mitochondrialfragment1.B,mitochondrialfragment2.C,mitochondrialfragment3.D,mitochondrialfragment4.E, mitochondrialfragment5.F,mitochondrialfragment8.
Fig.2 Neutrality plot analysis of codon usage in the mitochondrial genome of‘Baihaozao’
2.3ENC-plot分析
ENC-plot分析顯示,‘白毫早’葉綠體與線粒體基因組密碼子使用偏好性的調控機制存在差異。在葉綠體基因組中,52個編碼基因的ENC值分布顯示,約 23% (12個)的基因ENC比值分布區間為- ? 0.05~0.05 (本文中數據未列出),其實際ENC值與理論模型高度吻合,表明這些基因的密碼子偏好符合中性進化模型[3,42]。然而, 76.9% (40個)的基因表現出顯著偏離標準曲線的分布特征(圖3),提示自然選擇壓力可能通過翻譯效率優化或tRNA豐度調控等機制對密碼子使用施加定向選擇[43-44]。
線粒體基因組的ENC-plot分析則呈現出顯著不同的模式(圖4)。多數基因沿回歸曲線聚集,表明突變壓力(如堿基組成偏向性)是驅動密碼子偏好形成的主要因素[21,23]。值得注意的是,rps7(片段1)、rps12(片段2)、nad9(片段4)和atp4(片段8)等基因的ENC值分布于曲線上方,其偏離程度提示存在強烈的自然選擇作用。此類基因多編碼氧化磷酸化復合體亞基或核糖體蛋白,其功能保守性可能驅動了翻譯效率相關的適應性優化[2.44]。對于片段1~3的基因組區域,各片段中 57%~83% 的基因ENC比值集中在 0.05~0.25 區間,其中片段1為80% ,片段2為 57% ,片段3為 83% (本文中數據未列出)。 GC3 與 GC12 的弱相關性( R2=0.1162 )及低回歸系數(0.2129)進一步支持突變壓力主導的假說[3,21],與糜子(Panicummiliaceum)葉綠體基因組的進化特征具有相似性。對比分析顯示,葉綠體基因組密碼子偏好性受自然選擇與突變壓力的協同調控,而線粒體基因組以突變壓力為主但存在功能基因的選擇性優化。
2.4PR2-plot分析
為深入解析‘白毫早’葉綠體與線粒體基因組中密碼子使用偏性的形成機制,本研究采用PR2-plot分析方法,系統探究了同義密碼子第3位堿基組成 [A3/(A3+T3) 與 G3/(G3+C3)] 的偏倚特征及其進化驅動力(圖5、圖6)。結果表明,兩種細胞器基因組的密碼子偏好性呈現顯著差異,反映了突變壓力與自然選擇的不同作用模式。
如圖5所示,在葉綠體基因組中,52個蛋白編碼基因呈異質性分布,其中psbA基因偏離中心點的程度最為顯著 [A3/(A3+T3)=0.33 ,G3/(G3+C3)=0.33] ,表明其第3位堿基呈現 T3 和 G3 的極端偏好。該現象可能與psbA基因的高表達需求相關,高表達基因往往通過選擇最優密碼子(如NNT/NNA型)以適配tRNA庫,從而提升翻譯效率[45]。此外,基因簇在PR2-plot中的離散分布(變異系數 CV=28.7% )提示,除自然選擇外,堿基組成突變(如AT偏向性)亦對密碼子偏性產生顯著影響,這與沙棗(Elaeagnusangustifolia)和云南藍果樹(Nyssayunnanensis)等植物的葉綠體研究結論一致[23,46]。
如圖6所示,在線粒體基因組中,基因在PR2-plot中呈現顯著的空間聚集特征: 48.3% 的基因分布于下半象限( T3 使用頻率均值=0.52% )和右側區域( G3 使用頻率均值=0.46% ,表明第3位堿基存在系統性 ΔTgt;Ggt;Δ Cgt;A 的偏好序列。值得注意的是,atp1基因[A3/(A3+T3)=0.5 , G3/(G3+C3)=0.51 靠近分布中心,其ENC值(52.32)接近理論最小值,提示該基因可能受翻譯選擇與突變壓力的協同調控[40,47]
注:A:線粒體片段1;B:線粒體片段2;C:線粒體片段3;D:線粒體片段4;E:線粒體片段5;F:線粒體片段8。
Note:A:Mitochondrialfragment1.B:Mitochondrialfragment2.C:Mitochondrial fragment3.D:Mitochondrialfragment4. E:Mitochondrial fragment5.F:Mitochondrial fragment8.
圖4‘白毫早’線粒體基因組密碼子ENC分布特征圖
Fig.4Distribution characteristics of codon ENC in the mitochondrial genome of‘Baihaozao’
圖6‘白毫早’線粒體基因組密碼子PR2分布特征圖
Fig.6Distribution characteristics of codon PR2 in the mitochondrial genome of‘Baihaozao’
2.5最優密碼子篩選及偏好模式解析
為揭示‘白毫早’葉綠體與線粒體基因組在密碼子使用偏好性上的進化驅動力及分子機制,本研究基于RSCU及其△RSCU分析(表3和表4),進行最優密碼子篩選及偏好模式解析。結果顯示,兩組基因組在密碼子第3位堿基選擇上均呈現顯著的A/U富集現象,與被子植物葉綠體基因組的普遍進化趨勢高度一致[32,40]。從RSCU分布特征來看,葉綠體基因組中29個高頻密碼子( RSCUgt;1AA 的堿基組呈現顯著偏向性:其中 96.6% 以A/U結尾( 16U+12A) ,僅 3.4% 以 G/C 結尾(1G),UUA( RSCU=1.98 )為最優表達密碼子。線粒體基因組中30個高頻密碼子( RSCUgt;1 )的A/U結尾占比達 90% (16U+11A) ,CAU( RSCU=1.67. )為優勢密碼子。這種A/U偏倚模式與杜梨(Pyrusbetulifolia)、天山雪蓮(Saussureainvolucrate)等物種葉綠體基因組特征相似[40.48],暗示在種子植物中可能存在保守的翻譯優化機制。
通過△RSCU ?0.08 的篩選標準,本研究鑒定出葉綠體基因組18個最優密碼子(U/A結尾占比 94.4% )及線粒體基因組18個最優密碼子(U/A結尾占比 88.9% )。值得注意的是,GCA、CGA、CGU等密碼子在兩組基因組中均被篩選為最優密碼子,提示‘白毫早’不同細胞器基因組間存在協同進化特征。該結果與翅果油樹、肉從蓉屬等物種的多基因組比較研究結論相呼應[49-50]
表3‘白毫早’葉綠體基因組不同表達水平的RSCU分析
Table3 RSCU analysis of different expresson levels in the chloroplast genome of‘Baihaozao’
注:*表示 ΔRSCU≥0.08 ;**表示 ΔRSCU?0.3 ;***表示 ΔRSCU?0.5. Note:*indicates ΔRSCU≥0.08 ** indicates△RSCU ?0.3 ??? indicates ΔRSCU≥0.5.
續表3
表4‘白毫早’線粒體基因組不同表達水平的RSCU分析
Table 4 RSCU analysis of different expression levels in the mitochondrial genome of‘Baihaozao'
注:*表示 ΔRSCU≥0.08 . ** 表示 ΔRSCU?0.3 ;***表示 ΔRSCU?0.5. Note: * indicates ΔRSCU≥0.08 ** indicates ΔRSCU?0.3 ??? indicates ΔRSCU?0.5.
續表4
3討論
‘白毫早’葉綠體與線粒體基因組CUB的顯著分化,揭示了植物細胞器在進化軌跡中遵循差異化的適應性策略。葉綠體基因組第3位點的強AT偏好性( GC3=27.59% )與陸生植物葉綠體的保守特征一致[23,51],近期對‘大面白’茶樹的研究進一步證實葉綠體 GC3 值在27.1%~28.4% 區間波動,且光合基因表現出更強的選擇壓力[52]。值得注意的是,光合系統核心基因(如psbB、psbC)的 GC3 值顯著偏離中性預期,這與Sharp等[38]和Sun等[53]提出的“翻譯選擇假說”高度契合,森林茶園古茶樹大理茶的研究亦發現psbA等光合基因 GC3 偏離度達 ?Z=2.17 ,印證了茶樹光合功能基因的翻譯優化機制[54-55]。此現象在雙子葉植物中具有普遍性,如糜子與杜梨葉綠體同樣顯示光合基因的選擇壓力顯著高于其他功能模塊[21,40]
相較之下,線粒體基因組雖整體呈現弱CUB特征(ENC均值51.87),但其 GC3 顯著高于葉綠體( Plt;0.01. ),且功能區域的選擇壓力異質性顯著。例如,ATP合酶基因(atp1、atp6)的CUB與呼吸鏈活性高度相關,而核糖體蛋白基因(如rpl5、rps13)更趨近中性進化模式。此分化可能源于線粒體需平衡能量代謝效率與突變累積的進化約束,與‘小果油茶’線粒體基因組的模塊化選擇模式相似,其核質互作可能加劇功能基因的進化分歧[56]。值得注意的是,atp4基因的 GC3 異常值( Z=2.34 )可能與其跨膜結構域的特殊理化需求相關,暗示局部適應性選擇對蛋白質構象的調控作用。
從進化機制看,葉綠體基因組自然選擇貢獻率( 59.2% )顯著高于線粒體,與Sharp等[1]提出的“翻譯選擇假說”及Sueoka[提出的“突變-選擇平衡理論”一致。‘大面白’茶樹葉綠體的選擇貢獻率( 97.9% )略高于本研究的‘白毫早’,可能與品種間環境適應策略差異相關[52]。葉綠體光合功能的高度保守性可能強化了自然選擇的強度,而核基因組對其表達的嚴格調控(如轉錄因子結合位點優化)可能進一步放大選擇壓力[53]。反觀線粒體,其RNA編輯、基因水平轉移等調控機制的多樣性可能削弱全局選擇效應,使局部突變壓力或功能微環境影響占主導[50-51]。這一機制分化在單子葉與雙子葉植物中呈現顯著差異,如禾本科植物線粒體CUB受突變壓力主導,而‘小果油茶’的線粒體基因組顯示選擇壓力貢獻率為 51.9% ,提示多倍化可能改變細胞器進化動力[56]。
跨物種比較進一步凸顯‘白毫早’細胞器CUB的獨特性:其葉綠體 GC3 低于云南藍果樹( 28.40% )及沙棗( 28.47% )[23,46],但高于森林茶園古茶樹大理茶的 26.8%[55] ,可能源于茶樹作為常綠植物對光環境長期適應的選擇強化。線粒體 GC3 顯著高于葉綠體的現象與Ganoderma屬真菌的低 GC3 模式( GC3=24.8% )形成對比[2.51],而‘小果油茶‘茶樹線粒體 GC3 ( 45.73% )與‘白毫早’趨同,支持茶樹線粒體高 GC3 的種屬特異性[56]。此外,‘白毫早’線粒體ENC值顯著高于葉綠體( Plt;0.05) ,與列當科植物葉綠體特征趨同,但遠高于Ganoderma屬真菌線粒體(ENC=31.53)[2.50],此差異可能反映植物線粒體為協調能量代謝與應激響應功能而保留同義密碼子多樣性,以增強環境適應性[51]。
參考文獻
[1]Sharp P M,Li WH. The codon adaptation index-a measure ofdirectional synonymous codon usage bias, and its potential applications[J].Nucleic Acids Research,1987, 15(3):1281-1296.
[2]舒軍霞,楊林,周濤,等.刺柏屬4種藥用植物葉綠體基因 組密碼子偏好性分析[J].中草藥,2022,53(23): 7507-7516. ShuJX,YangL,Zhou T,etal.Analysisof codonbiasinthe chloroplast genomeof four medicinal plantsofJuniperus [J].Chinese Traditional and Herbal Drugs,2022,53(23): 7507-7516.
[3]楊國鋒,蘇昆龍,趙怡然,等.蒺藜苜蓿葉綠體密碼子偏 好性分析[J].草業學報,2015,24(12):171-179. Yang G F, Su KL, Zhao YR,et al. Analysis of codon usage inthechloroplast genome ofMedicago truncatula[J].Acta PrataculturaeSinica,2015,24(12):171-179.
[4]ChandanJ,GuptaS,Babu V,etal.Comprehensive analysis of codon usage pattern in Withania somnifera and its associatedpathogens:MeloidogyneincognitaandAlternaria alternata[J].Genetica,2022,150(2):129-144.
[5]ChaudharyR,Chand S,AlamBK,etal.Codon usagebias forfattyacid genes FAE1 and FAD2 inoilseed brassica species[J].Sustainability,2022,14(17):11035.doi: 10.3390/su141711035.
[6]Sueoka N. Directional mutation pressure and neutral molecular evolution [J]. PNAS,1988, 85(8):2653-2657.
[7]早浩龍,李奇,黃珍華,等.人參和三七葉綠體基因組密 碼子偏好性比較分析[J/OL].分子植物育種,2025: 1-17[2025-04-16]. https://ink.cnki.net/urlid/46.1068.S. 20240521.1131.005. Zao H L,Li Q, Huang Z H, et al. Comparative analysis of codon usage bias in chloroplast genome between Panax ginseng and Panax notoginseng [J/OL].Molecular Plant Breeding,2025:1-17[2025-04-16].https://link.cnki.net/ urlid/ 46.1068.S.20240521.1131.005.
[8]楊秀玲,許春梅,耿曉珊,等.獨腳金葉綠體基因組密碼 子偏好性分析[J].分子植物育種,2023,21(12): 3889-3897. Yang XL,Xu CM,GengXS,et al.Codon usage bias analysis of chloroplast genome in Striga asiatica [J]. Molecular Plant Breeding,2023,21(12): 3889-3897.
[9] Tyagi S, Kabade P G, Gnanapragasam N, et al. Codon usage provide insights into the adaptation of rice genes under stress condition [J].International Journal of Molecular Sciences,2023,24(2): 1098.doi: 10.3390/ijms24021098.
[10] Huang X, Xu J, Chen L, et al.Analysis of transcriptome data reveals multifactor constraint on codon usage in Taenia multiceps [J]. BMC Genomics,2017,18(1):308.doi: 10.1186/s12864-017-3704-8.
[11] Jamil Z,Uddin A,Alam S S M,et al. Analysis of the compositional features and codon usage pattern of genes involved in human autophagy[J]. Cells,2022,11(20):3203. doi: 10.3390/cells11203203.
[12]Deb B, Uddin A, Chakraborty S. Composition, codon usage pattern, protein properties, and influencing factors in the genomesof membersof the family Anelloviridae [J]. Archives of Virology, 2021,166(2): 461-474.
[13]SiFS,JiangL,YuR S,et al. Study on thecharacteristic codon usage pattern in porcine epidemic diarrhea virus genomes and its host adaptation phenotype [J].Frontiers in Microbiology,2021,12: 738082. doi: 10.3389/fmicb.2021. 738082.
[14] Shi C, Hu N, Huang H, et al. An improved chloroplast DNA extraction procedure for whole plastid genome sequencing [J]. PLoS ONE,2012,7(2): e31468. doi: 10.1371/journal. pone.0031468.
[15]Hao WJ, Fan S H,Hua W,et al. Effective extraction and assembly methods for simultaneously obtaining plastid and mitochondrial genomes[J].PLoS ONE,2014,9(9): e108291. doi:10.1371/journal.pone.0108291.
[16] Takamatsu T,Baslam M,Inomata T,et al. Optimized method of extracting rice chloroplast dna for high-quality plastome resequencing and de novo assembly [J].Frontiersin Plant Science,2018,9: 266. doi: 10.3389/fpls.2018.00266. eCollection 2018.
[17]WangY, Chen SJ,Chen JJ,et al.Characterization and phylogenetic analysis of the complete mitochondrial genome sequence of Photinia serratifolia [J].Scientific Reports, 2023,13: 770.doi: 10.1038/s41598-022-24327-x.
[18]Cadorna C A E,Pahayo D G,Rey J D.The first mitochondrial genome of Calophyllum soulattri Burm.f.[J]. Scientific Reports,2024,14: 5112.doi:10.1038/s41598- 024-55016-6.
[19] Twyford A D, Ness R W. Strategies for complete plastid genome sequencing [J].Molecular Ecology Resources, 2017,17: 858-868.
[20]馮瑞云,梅超,王慧杰,等.籽粒莧葉綠體基因組密碼子 偏好性分析[J].中國草地學報,2019,41(4):8-16. Feng R Y, Mei C, Wang HJ, et al. Analysis of codon usage in the chloroplast genome of grain Amaranth (Amaranthus hypochondriacus L.)[J].Chinese Journal of Grassland, 2019, 41(4): 8-16.
[21]劉慧,王夢醒,岳文杰,等.糜子葉綠體基因組密碼子使 用偏性的分析[J]:植物科學學報,2017,35(3):362-371. Liu H, Wang M X,Yue WJ, et al.Analysis of codon usage inthechloroplast genomeof Broomcornmillet (Panicum miliaceum L.) [J]. Plant Science Joumal,2017,35(3): 362-371.
[22]趙森,鄧力華,陳芬.秋茄葉綠體基因組密碼子使用偏好 性分析[J].森林與環境學報,2020,40(5):534-541. Zhao S,Deng LH, Chen F.Codon usage bias of chloroplast genomein Kandelia obovata [J].Journal of Forest and Environment, 2020, 40(5): 534-541.
[23]原曉龍,康洪梅,王毅.云南藍果樹葉綠體基因組密碼子 偏好性分析[J].西北林學院學報,2020,35(4):26-31. Yuan XL,Kang HM, Wang Y.Codon usage bias analysis of chloroplast genome in Nyssa yunnanensis [J]. Journal of Northwest Forestry University,2020,35(4):26-31.
[24]HuQ,Wu JQ,FanCC,etal.Comparativeanalysisof
codon usage bias in the chloroplast genomesof eighteen Ampelopsideae species (Vitaceae) [J].BMC Genomic Data, 2024,25(1): 80. doi: 10.1186/s12863-024-01260-8.
[25]辛雅萱,黎若竹,李鑫,等.忙果葉綠體基因組密碼子使 用偏好性分析[J].中南林業科技大學學報,2021,41(9): 148-156, 165. Xin YX,LiR Z,LiX,et al.Analysis on codon usage bias of chloroplast genome in Mangifera indica [J]. Journal of Central South Universityof Forestry amp; Technology,2021, 41(9): 148-156, 165.
[26]梁湘蘭,郭松.苦馬豆葉綠體基因組密碼子偏好性分析 [J].西北林學院學報,2022,37(2):121-126. Liang X L,Guo S. Codon usage bias in the chloroplast genome of Sphaerophysa salsula [J].Journal of Northwest Forestry University,2022,37(2):121-126.
[27]吳學俊,梁湘蘭,易子群,等.湖北山楂葉綠體基因組密 碼子偏好性分析[J].分子植物育種,2023,21(8): 2508-2516. Wu X J, Liang X L, Yi Z Q,et al. Analysis of codon bias in the chloroplast genome of Crataegus hupehensisSarg. (Rosaceae) [J]. Molecular Plant Breeding,2023,21(8): 2508-2516.
[28] Shen L W, Chen SQ,Liang M, et al. Comparative analysis of codon usage bias in chloroplast genomes of ten medicinal species of Rutaceae [J].BMC Plant Biology, 2024,24(1): 424. doi: 10.1186/s12870-024-04999-5.
[29]Wu P, Xiao W Q,Luo Y Y, et al. Comprehensive analysis of codon bias in13 Ganoderma mitochondrial genomes[J]. Frontiersin Microbiology,2023,14:1170790.doi: 10.3389/fmicb.2023.1170790.eCollection 2023.
[30]WeiL,HeJ,JiaX,etal.Analysis of codon usage bias of mitochondrial genome in Bombyx mori and itsrelation to evolution [J].BMC Evolutionary Biology,2014,14:262. doi: 10.1186/s12862-014-0262-4.
[31] Gao W,Chen XD,He J,et al. Intraspecific and interspecific variations in the synonymous codon usage in mitochondrial genomes of 8 pleurotus strains[J].BMC Genomics,2024, 25(1): 456. doi: 10.1186/s12864-024-10374-3.
[32]丁銳,胡兵,宗小雁,等.杓蘭葉綠體基因組密碼子偏好 性分析[J].林業科學研究,2021,34(5):177-185. Ding R,Hu B, Zong XY, et al.Analysis of codon usage in the chloroplast genome of Cypripedium calceolus [J]. Forest Research,2021,34(5):177-185.
[33]恊瑞聯陳馮新筆橄檻葉綠休其因組宓碼子偏好
性特征[J].福建農林大學學報(自然科學版),2022,51(4): 502-510. LaiRL,ChenJ,FengX, et al.Codon usage preference of chloroplast genome of Canarium album [J]. Journal of Fujian Agriculture and Forestry University (Natural Science Edition),2022,51(4): 502-510.
[34]陸奇豐,駱文華,黃至歡.兩種梧桐葉綠體基因組密碼子 使用偏性分析[J].廣西植物,2020,40(2):173-183. Lu QF,Luo W H, Huang Z H. Codon usage bias of chloroplast genome from two species of Firmiana Marsili [J]. Guihaia,2020, 40(2): 173-183.
[35]王鵬良,吳雙成,楊利平,等.巨桉葉綠體基因組密碼子 偏好性分析[J].廣西植物,2019,39(12):1583-1592 WangPL,WuSC,YangLP,etal.Analysisofcodonbiasof chloroplast genome in Eucalyptus grandis [J].Guihaia, 2019,39(12): 1583-1592.
[36]王媛媛,楊美青.蒙古韭葉綠體基因組密碼子使用偏好性 分析[J].分子植物育種,2021,19(4):1084-1092. Wang Y Y, Yang M Q. Analysis of the codon usage bias in the chloroplast genome of allium Mongolicum regel [J]. Molecular Plant Breeding,2021,19(4):1084-1092.
[37]林新茂,黃家權.仙人掌科葉綠體與核基因組密碼子偏好 性分析[J].分子植物育種,2024,22(22):7400-7412. Lin X M, Huang J Q.Codon preference analysis of the chloroplastand nuclear genomesin Cactaceae[J]. Molecular Plant Breeding,2024,22(22):7400-7412.
[38] Sharp PM, Touhy T MF, Mosurski K R. Codon usage in yeast: cluster analysis clearly differentiates highly and lowly expressed genes [J].Nucleic Acids Research,1986,14(13): 5125-5143.
[39]Antezana MA,King Jordan I. Highly conserved regimes of neighbor-base-dependentmutationgeneratedthe backgroundprimary-structuralheterogeneitiesalong vertebrate chromosomes [J]. PLoS ONE,2008,3(5): 2145. doi: 10.1371/journal.pone.0002145.
[40]辛雅萱,董章宏,瞿紹宏,等.杜梨葉綠體基因組密碼子 偏好性分析[J].河北農業大學學報,2020,43(6):51-60. Xin Y X, Dong Z H, Qu S H, etal. Analysis on codon usage biasof chloroplast genome in Pyrus betulifolia Bge.[J]. Journal of Hebei Agricultural University,2020,43(6): 51-60.
[41] Shen Z N, Gan Z M, Zhang F, et al. Analysis of codon usage patterns in citrus based on coding sequence data [J].BMC Genomicc 2020 217c5):234 dni:101186/c12864-020-6641-v
[]原吮 聊莊漢 偏好性分析[J].分子植物育種,2020,18(20):6671-6677. YuanXL,HaoJB,WangY,etal.Codonusage biasanalysis ofchloroplast genomeinJuglanssigillata[J].Molecular Plant Breeding,2020,18(20): 6671-6677.
[43]HershbergR,PetrovDA.Codon adaptationof plastid genes [J].Annual Review of Genetics,2008,42: 287-299.
[44] Yin D B,Mu Y T, Li X,et al. Comparison of the complete chloroplastgenomesinthe Astragalus[J].Legume Research, 2024, 47(3): 420-427.
[45]劉慶坡,薛慶中.粳稻葉綠體基因組的密碼子用法[J].作 物學報,2004,30(12):1220-1224. Liu Q P, Xue Q Z. Codon usage in the chloroplast genome of rice(Oryza sativa L. ssp.japonica)[J].Acta Agronomica Sinica,2004,30(12): 1220-1224.
[46]王婧,王天翼,王羅云,等.沙棗葉綠體全基因組序列及 其使用密碼子偏性分析[J].西北植物學報,2019,39(9): 1559-1572. Wang J, Wang TY, Wang L Y, et al. Assembling and analysis of the whole chloroplast genome sequence of Elaeagnus angustifolia and its codon usage bias [J]. Acta Botanica Boreali-Occidentalia Sinica,2019,39(9):1559-1572.
[47]楊祥燕,蔡元保,譚秦亮,等.菠蘿葉綠體基因組密碼子 偏好性分析[J].熱帶作物學報,2022,43(3):439-446. Yang X Y, Cai YB, Tan QL, et al. Analysis of codon usage biasin the chloroplast genome of Ananas comosus [J]. Chinese Journal of Tropical Crops,2022, 43(3): 439-446.
[48]何亞玲,彭業軍,李錦,等.天山雪蓮葉綠體基因組密碼 子偏好性分析[J].石河子大學學報(自然科學版),2022, 40(1): 84-93. He YL,Peng YJ,Li J, et al.Preference analysis of codon usagein the chloroplast genome of Saussurea involucrate [J].Journal of Shihezi University (Natural Science),2022, 40(1): 84-93.
[49]郭媛婷,張敏,楊玉潔,等.翅果油樹葉綠體基因組密碼 子偏好性分析[J].山西農業科學,2023,51(3):233-240. Guo Y T, Zhang M, Yang Y J, et al. Analysis on codon usage bias in chloroplast genome of Elaeagnus mollis [J]. Journal OISnanxi Agricuitural Sciences,ZU∠5,DI(3): ∠35-240.
[50]馮展,江媛,鄭燕,等.肉從蓉屬植物葉綠體基因組密碼 子偏好性分析[J].中草藥,2023,54(5):1540-1551. FengZ, JiangY,ZhengY,etal.Codon use bias analysisof chloroplast genome of Cistanche[J].Chinese Traditional and Herbal Drugs,2023,54(5):1540-1551.
[51]張文娟.基于密碼子水平的生物信息學分析及進化研究 [D].上海:復旦大學,2006. Zhang W J.Codon analysis and its applicationin bioinformatics and evolutionary studies [D]. Shanghai: Fudan University,2006.
[52]尹明華,張嘉欣,樂蕓,等.茶樹大面白葉綠體基因組特 征、密碼子偏好性及其系統發育分析[J]:茶葉科學,2024, 44(3): 411-430. YinMH,ZhangJX,LeY,etal.Genomiccharacteristics, codonpreference,and phylogenetic analysis of chloroplasts of Camellia sinensis cv.‘Damianbai’[J]. Journal of Tea Science,2024,44(3): 411-430.
[53] Sun M Y, Zhang J Z. Preferred synonymous codons are translatedmoreaccurately:proteomicevidence, among-species variation, and mechanistic basis [J]. Science Advances,2022,8(27):eabl9812. doi:10.1126/sciadv.abl9812
[54]佟巖,黃薈,王雨華.森林茶園古茶樹大理茶葉綠體基因 組密碼子偏好性及系統發育研究[J].茶葉科學,2023, 43(3): 297-309. TongY,Huang H,Wang YH.Analysis ofcodon usage bias and phylogenesis in the chloroplast genome of ancient tea tree Camellia taliensis in forest-tea garden [J].Journal of Tea Science,2023,43(3):297-309.
[55]Wei CL,Yang H, Wang SB, et al. Draft genome sequence of Camellia sinensis var. sinensis provides insights into the evolution of the tea genome and tea quality [J].PNAS, 2018, 115(18): E4151-E4158.
[56] Liang H,Qi H, Wang C,et al. Analysis of the complete mitogenomes of three high economic value tea plants (Tea-oil Camellia) provide insights into evolution and phylogeny relationship[J].Frontiers in Plant Science,2025, 16:1549185. doi: 10.3389/fpls.2025.1549185.