Analysis ofcodonusagebiasinchloroplast genomeof Phellodendron amurense
LU Mengyue ZHOU MengmengYANG JunWU ZhenyuWANG Bowen ZOU YuYANG Hongsheng (College of Biologyand Agriculture,Jiamusi University, Jiamusi 1540o7,China)
AbstractTo explore thecodonusage biasand its major influencingfactors in thechloroplast genomeof Phellodendron amurense, the coding sequences (CDS) of the chloroplast genome of P .amurensewere utilized.Fragments shorter than 30O bp,containing stop codons,or repetitive sequences were excluded,ultimately retaining 52 valid sequences.The GC content and efective number of codons (ENC)of these sequences were calculated using Codon W and CUSP software,and the influencing factors of codon preference were further discussed by correlation analysis of codon preference parameters.The findings indicated thatthe average GC content within thechloroplast genome of P .amurense was 39.34% ,with the GC content at the three positions ranked as follows:
(2號
The codon preference parameter correlation analysis revealed a preference for A and U as the third base of the codon,withan average ENCvalueof 49.13,indicating a weak codon usage bias.Natural selection pressure was identifiedas theprimary factor affecting codon usage bias.Tenoptimizedcodons were identified,which showed a significant preferenceforthe Aand U types.This research lays a data foundation and provides a referencefor gene engineering and the optimization of codons in the chloroplast genome of P amurense.
Keywords Phelldendron amurense; chloroplast genome; codon usage bias; optimal codons
葉綠體基因組的遺傳方式為單親遺傳,并具備一定程度的半自主性。這些特征賦予葉綠體基因組在植物學研究領域,特別是植物多樣性和系統發育研究中廣泛的應用潛力[2。此外,葉綠體基因組在植物適應性研究中也占有重要部分,通過分析其在不同環境條件下的變異和適應性進化,有助于揭示植物對環境變化的響應機制[3]。密碼子作為遺傳信息的基本單位,通過不同的編碼方式對氨基酸進行編碼[4。由于遺傳密碼的簡并性,同一氨基酸可由多種密碼子編碼,這些同義密碼子在遺傳信息的傳遞過程中發揮重要作用5。密碼子使用偏好性是指不同物種或同一物種不同基因組區域在使用同義密碼子時的選擇傾向性,該偏好性的形成受多種因素影響,包括基因組背景、轉錄和翻譯效率、密碼子與反密碼子配對的適應性等
黃檗(Phellodendronamurense)是蕓香科黃檗屬多年生落葉喬木,廣泛分布于中國東北及華北地區。該植物在中醫藥領域應用廣泛,據現代藥理學研究,其含有主要活性成分小檗堿及少量的巴馬亭等,具有顯著的抗菌和抑菌功能8。通過優化密碼子,不僅有助于理解黃檗的遺傳機制,還可為基因組的改良和目的基因的優化提供重要依據,以提高黃檗中目標基因的表達效率和穩定性,從而提高黃檗的經濟價值和藥用價值。本研究選取黃葉綠體基因組編碼區序列為研究對象,分析其基因組中密碼子的使用偏好及主要影響因素,為該植物的葉綠體基因組研究和遺傳改良提供參考。
1材料與方法
1.1數據來源
本研究所使用的黃檗葉綠體基因組數據(登錄號:KY707335.1)從NCBI數據庫中獲得。該基因組的總長度為 158442bp ,包含88個編碼序列(CodingDNAsequence,CDS)。在使用MEGA6軟件進行CDS篩選時,排除了重復序列以及長度不足 300bp 的序列,最終篩選出52個CDS,用于后續分析。
1.2分析方法
使用CodonW1.4.2軟件分析有效密碼子數(Effectivenumberofcodons,ENC)相對同義密碼子使用度(Relative synonymous codon usage,RSCU)密碼子數量(N)以及8種氨基酸密碼子第三位堿基腺嘌呤
、胸腺嘧啶
)、胞嘧啶
和鳥嘌呤
的含量。ENC值的高低可以推斷密碼子偏好性的強弱。ENC理論取值在 20~61 ,越靠近20,密碼子偏好性越強;越靠近61,密碼子偏好性較弱,將45作為判斷密碼子偏好性強弱的標準。此外,利用CUSP軟件評估密碼子第一、第二和第三位的GC含量
,以及基因組總體GC含量(
;進一步采用SPSS27.0軟件分析密碼子偏好參數的相關性。使用Excel軟件用于繪制中性圖表,分析影響密碼子使用偏好性的因素。為揭示密碼子使用偏好性的潛在影響因素,進行ENC-plot和PR2-plot分析。同時,選擇RSCU值 ?1 的密碼子作為高頻密碼子,計算高表達與低表達密碼子的△RSCU(兩者之間的差值),通過設定 RSCUgt;0.08的標準,篩選出高表達密碼子,結合RSCU值 ?1 確定黃葉綠體基因組中的最優密碼子[10]
2結果與分析
2.1黃檗葉綠體基因組的密碼子組成
經分析,黃檗葉綠體基因組中52個CDS密碼子的GC平均含量為 39.34% ,密碼子第一、第二和第三位的GC含量分別為 47.63% 、 40.07% 和 30.32% 。這些數據揭示出黃檗葉綠體基因組中的密碼子的堿基在不同位置上對堿基A或尿嘧啶(U)存在偏好,而非均勻分布。此外,52個CDS的ENC值在 37.79~ 61.00,平均值為49.13,ENC值 gt;45 的基因數有44個,表明黃檗葉綠體基因組密碼子使用偏好性較弱。
由表1可知,
與
間的相關性具有統計學意義
),
與
之間的相關性較高( Plt;0.05 ),
與
之間的相關性無統計學意義( Pgt;0.05 )。這表明
與
的堿基序列具有較高的一致性。進一步分析顯示,ENC值與
相關性具有統計學意義(Plt;0.01,說明密碼子使用偏好受第三位堿基影響較大。N值與ENC值之間相關性無統計學意義( Pgt;0.05 ,表明基因編碼序列的長度對密碼子使用偏好的影響較小[]。此外,N與
及
之間的相關性無統計學意義( Pgt;0.05) ,這說明密碼子的堿基組成對密碼子數量的影響不大。

RSCU分析結果顯示,有30個密碼子的RSCU值gt;1。以U為末端堿基的有16個,以A為末端堿基的有13個,僅有1個密碼子以G作為末端堿基。表明黃檗葉綠體基因密碼子在選擇末端堿基時,更傾向A和U。
2.2 中性繪圖分析結果
中性繪圖分析結果顯示,黃葉綠體基因組52個CDS的
值
和
的平均值)在 0.34395~ 0.58275,而
的值在
與 
的相關性分析顯示,二者的相關系數為0.214,未達到統計學顯著性水平(Pgt;0.05) (圖1)。這一結果表明黃檗密碼子的偏好主要受到選擇壓力的影響。

2.3 ENC-plot分析結果
ENC-plot分析結果顯示(圖2),位于標準曲線下方的基因數量更多,表明大多數基因的密碼子偏好性受到自然選擇的影響[12。ENC比值頻數分布結果顯示,ENC比值分布在 -0.05~0.05 的基因有20個,而另外32個基因的ENC比值則超出該范圍(表2)。大部分基因的ENC實際值與期望值之間的差距揭示了黃檗葉綠體基因組的密碼子偏好性主要受到選擇壓力的影響。


2.4PR2-plot分析結果
PR2-plot分析結果顯示(圖3),散點在各象限內分布不均,大多數分布在象限下方,表明具有顯著偏好性的是密碼子的第三位堿基,且4種堿基的使用頻率差異顯著。表明黃檗葉綠體基因組密碼子使用偏好主要受自然選擇的影響。

2.5 最優密碼子確定
據RSCU分析結果,在黃檗葉綠體基因組中鑒定出33個高頻密碼子,這些密碼子的RSCU值 gt;1。其中,29個密碼子的 RSCUgt;0.08 ,將這些密碼子定義為高表達密碼子。以RSCUgt;0.08且RSCU值 ?1 為標準,最終篩選出10個最優密碼子,即UUU、CUU、CCC、ACA、UAU、CAU、AAU、UGA、AGA和GGA。
3結論與討論
針對植物葉綠體基因組中的密碼子使用偏好進行系統分析,可探究突變壓力和自然選擇對其密碼子偏好性的影響,并進一步分析堿基組成等其他因素,有助于全面評估這些因素對其密碼子使用偏好的潛在影響。研究表明,不同物種在同義密碼子使用上的差異,是植物在長期的環境適應和進化過程中形成的特征[13]。該現象主要歸因于突變壓力和自然選擇的雙重作用[14-15]。在同義密碼子的使用中,主要差別存在于密碼子的第三位堿基。
本研究中,有30個密碼子的RSCU值 gt;1 ,其中以U為末端堿基的有16個,以A為終止堿基的有13個,以G為末端堿基的僅1個。這表明黃檗葉綠體基因組的密碼子末位堿基偏好使用A或U。ENC值 gt;45 的基因有44個,表明黃檗葉綠體基因組密碼子使用偏好性較弱。這一結果與蕁麻和栽培型向日葵等植物葉綠體基因組的研究結果一致[,表明不同植物在葉綠體基因組的密碼子使用偏好性上存在一定的共性,這與葉綠體基因組的進化和適應性有關。此外,黃檗葉綠體基因組中GC平均含量39.34% ,且密碼子第一、二位的GC含量高于第三位,這一特征與北沙參等雙子葉植物的研究結果相似[7,顯示不同植物類別在密碼子使用模式上存在一定的相似性,與基因組的結構和穩定性有關。黃檗葉綠體基因組中密碼子的末位堿基偏好A或U,這一模式與某些單子葉植物的密碼子使用模式類似,說明在不同植物中,密碼子的末位堿基偏好受到相似的進化壓力和選擇機制的影響。然而,盡管存在這些共性,不同植物在密碼子使用偏好性和基因組結構上仍表現出顯著差異[18]。例如,黃檗葉綠體基因組的密碼子使用偏好性較低,而某些植物的葉綠體基因組表現出更高的密碼子使用偏好性和較低的ENC值。這種差異與植物的進化歷史、環境適應性和基因組結構有關,需進一步試驗驗證和分析[9]。黃檗葉綠體基因組中GC平均含量 39.34% ,不同植物的葉綠體基因組中GC含量與基因組堿基組成存在差異,與其特定的生理和生態適應性有關。大多數植物表現出不同的末位堿基偏好,這種差異與植物的翻譯效率、mRNA穩定性以及蛋白質合成機制有關,需深入研究探究[20]。
本研究分析了黃檗葉綠體基因組水平的密碼子使用偏好,并揭示其在突變壓力和自然選擇影響下的特征。然而,該研究尚不全面,需在未來研究中進一步完善。目前尚未探討特定基因表達水平和功能影響,以及特定基因的表達模式與其密碼子偏好性之間的直接關系。未來研究可結合轉錄組數據,深入分析特定基因的表達模式及其與密碼子使用偏好的關系,以更全面地理解密碼子偏好性對基因功能的影響。此外,基因表達調控和環境因素在密碼子使用偏好中的潛在影響尚未得到充分評估[19,后續研究應納入基因表達調控和環境因素,以更全面地評估其對黃檗葉綠體基因組密碼子使用偏好的影響。通過多因素分析模型,探討這些因素在密碼子使用偏好中的交互作用和潛在機制,將有助于更全面地理解密碼子使用偏好的形成和調控機制。還可以通過基因工程技術,將篩選的最優密碼子應用于黃檗的遺傳改良,通過試驗驗證其在提升基因表達效率和改良植物特性方面的實際效果。這不僅有助于提高黃檗的經濟和藥用價值,還可為其他藥用植物的遺傳改良提供參考。
參考文獻
[1]吳茜,姜梅,陳海梅,等.旋覆花、湖北旋覆花和線葉旋覆花的葉綠體基因組比較分析和系統發育研究[J].藥學學報,2020,55(5):1042-1049.
[2]李事超,趙誠貴,姜永成,等.黃芪屬物種葉綠體基因組蛋白編碼基因密碼子偏好性分析[J/OL].草業科學,1-18(2024-11-10)[2025-4-30].http://kns.cnki.net/kcms/detail/62.1069.S.20241028.1736.002.html.
[3]何雯杰,黃華枝,張馳,等.薇甘菊葉綠體基因組密碼子偏好性分析[J].廣西林業科學,2024,53(3):329-338.
[4]柳燕杰,田旭平,李倩.美國紅梣葉綠體基因組密碼子偏好性分析[J].江蘇農業科學,2020,48(15):83-88.
[5]劉起麟,李金澤,丁佳渝,等.蓼屬葉綠體基因組密碼子偏好性分析及比較特征[J/OL].中國農業科技導報,1-12(2024-11-10)[2025-4-30].https://doi.org/10.13304/j.nykjdb. 2024.0090.
[6] LU Y W,CHIU T S. Factors affecting synonymous Codonusage of housekeeping genes in Drosophila melanogaster[J].Acta biologica hungarica,2018,69(1) :58-71.
[7]黃治昊,周鑫,張孝然,等.我國大陸黃檗潛在分布區及分布適宜性評價[J].生態學報,2018,38(20):7469-7476.
[8]高楊,劉銘,張洪文.珍稀植物黃檗的藥用價值及可持續利用[J].中國保健營養,2012,22(4):22-24.
[9]屈亞亞,辛靜,馮發玉,等.香花枇杷質體基因組序列密碼子偏性分析[J].西北林學院學報,2021,36(4):138-144,158.
[10]李顯煌,楊生超,辛雅萱,等.燈盞花葉綠體基因組密碼子偏好性分析[J].云南農業大學學報(自然科學版),2021(3):384-392.
[11]秦斗文,徐庭亮,閆京艷,等.柔毛郁金香葉綠體基因組密碼子偏好性分析[J].江蘇農業科學,2023,51(22):41-47.
[12]楊秀玲,許春梅,耿曉珊,等.獨腳金葉綠體基因組密碼子偏好性分析[J].分子植物育種,2023,21(12):3889-3897.
[13]NIE XJ,DENGPC,FENGKW,et al. Comparativeanalysis of codon usage patterns in chloroplast genomesof the Asteraceae family[J].Plant molecular biologyreporter,2014,32(4):828-840.
[14] SUZUKI Y. Statistical methods for detecting naturalselection from genomicdata[J]. Genesamp;geneticsystems,2010,85(6):359-376.
[15]余志偉,陳垣,郭鳳霞,等.菘藍葉綠體基因組密碼子使用偏好性分析[J].草地學報,2024,32(8):2374-2385.
[16]李魁印,張海玲,張鴻,等.蕁麻葉綠體基因組密碼子偏好性分析[J].種子,2022,41(2):51-58.
[17]趙靖僑,王杰敏,石衛紅,等.北沙參葉綠體基因組密碼子偏好性分析[J/OL].分子植物育種,1-20(2024-11-10)[2025-4-30].http://kns.cnki. net/kcms/detail/46.1068.S.20240320.1248.013.html.
[18]尹明華,李文婷,歐陽茜,等.蘇丹草葉綠體基因組特征及系統發育分析[J].草業科學,2025,42(1):101-118.
[19]王文斌,于歡,邱相坡.黃芩葉綠體基因組重復序列及密碼子偏好性分析[J].分子植物育種,2018,16(8):2445-2452.
[20]陸奇豐,駱文華.廣西秋海棠葉綠體基因組密碼子偏好性分析[J/OL].分子植物育種,1-20(2024-11-10)[2025-4-30]. http://kns.cnki. net/kcms/detail/46.1068.S.20230905. 0920.002.html.(青任纻輯.何)