999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于轉(zhuǎn)錄組數(shù)據(jù)分析藥用大黃的密碼子使用偏好性

2021-10-25 06:29:16高夢琦鄒建珍霍小位李依民張明英劉蒙蒙
中草藥 2021年20期
關(guān)鍵詞:分析研究

高夢琦,鄒建珍,霍小位,李依民,張明英,高 靜,張 崗*,劉蒙蒙*

1.河北大學(xué)中醫(yī)學(xué)院,河北 保定 071002

2.河北大學(xué)藥學(xué)院,河北 保定 071002

3.陜西中醫(yī)藥大學(xué)藥學(xué)院 陜西省秦嶺中草藥應(yīng)用開發(fā)工程技術(shù)研究中心,陜西 西安 712046

藥用大黃Rheum officinaleBaill.屬于蓼科大黃屬多年生草本植物,為《中國藥典》2020年版收錄的大黃3種基原植物之一,具有瀉下攻積、清熱瀉火、涼血解毒、逐瘀通經(jīng)、利濕退黃等功效[1]。現(xiàn)代中藥化學(xué)研究表明大黃中主要含有蒽醌類、酚類等物質(zhì),其中蒽醌類化合物是主要的活性物質(zhì),具有抗炎、抗腫瘤作用[2-3]。目前藥用大黃的資源主要來源于人工種植,隨著過度采挖,野生資源已經(jīng)瀕臨滅絕。因此,開展蒽醌類化合物生物合成機制研究,探索蒽醌類化合物生物合成路徑,是解決藥用大黃野生資源瀕危的思路之一。

遺傳密碼子是生物體DNA與蛋白之間信息傳遞的信息載體。大多數(shù)氨基酸不僅由一種密碼子編碼,而是可以同時由2~3種密碼子編碼,生物對于不同的密碼子的使用具有一定偏好性[4]。研究發(fā)現(xiàn),密碼子使用偏好性受到GC含量(鳥嘌呤和胞嘧啶含量)[5]、基因表達(dá)水平[6]、環(huán)境壓力[7]、突變壓力[8]、基因長度[9]、蛋白結(jié)構(gòu)[10]及tRNA豐度[11]的影響。隨著高通量測序技術(shù)的發(fā)展,藥用植物的密碼子使用偏好性研究有了顯著的成果[12-13],但是目前還沒有關(guān)于藥用大黃密碼子偏好性的研究。生物體選擇最優(yōu)密碼子可以體高基因的翻譯效率及蛋白的表達(dá)量。因此,研究密碼子的使用偏好性,有利于基因工程研究中密碼子優(yōu)化、最適外源宿主選擇,并對生物的系統(tǒng)進化研究具有重要意義。

本研究利用藥用大黃的轉(zhuǎn)錄組數(shù)據(jù)對其編碼序列進行密碼子偏好性分析,揭示藥用大黃基因密碼子使用偏好性的特征,為藥用大黃基因基因工程研究中進行密碼子優(yōu)化及選擇最佳的外源載體提供理論基礎(chǔ)。

1 數(shù)據(jù)

藥用大黃轉(zhuǎn)錄組(SRR10838870)來源于本課題組前期選取藥用大黃種苗根、根莖、樣品,利用Illumina HiSeq 2500 測序平臺進行轉(zhuǎn)錄組測序并拼接獲得Uingenes序列,利用BLASTx及ESTScan軟件對上述Uingenes序列進行編碼序列(coding sequence,CDS)分析。使用perl程序篩選編碼序列中長度大于300 bp并且同時具有起始密碼子及終止密碼的序列,用于藥用大黃密碼子使用偏好性分析,最后共得到4 733條CDS進行分析。

2 方法

2.1 編碼序列中堿基含量及中性繪圖分析

使用Codon W軟件分析藥用大黃編碼序列中的有效密碼子數(shù)(effective number of codons,ENc)、密碼子適應(yīng)指數(shù)(codon adaptation index,CAI)及同義密碼子相對使用度(relative synonymous codon usage,RSCU),計算序列中的GC含量,利用編寫的perl程序計算GC1、GC2及GC3的含量,即密碼子第1、2、3位的GC含量。GC12為GC1、GC2的平均值。

中性繪圖分析主要用于分析GC12與GC3之間的相關(guān)性,以GC12為縱坐標(biāo),以GC3為橫坐標(biāo)制作散點圖,并進行線性擬合回歸分析。可用于評價自然選擇壓力及突變對密碼子使用偏好性造成的影響。

2.2 GC3關(guān)聯(lián)及奇偶偏好性分析

ENc-GC3關(guān)聯(lián)分析主要用于分析密碼子使用偏好性與堿基組成之間的關(guān)聯(lián)。以ENc為縱坐標(biāo)、GC3s為橫坐標(biāo)繪制二維散點圖,并進行非線性擬合回歸分析。如果基因的點分布在擬合曲線附近,則表明密碼子的使用偏好性主要是受到突變作用的影響;如果基因點分布在擬合曲線下方,則表明密碼子的使用偏好性主要是受到選擇壓力的影響。奇偶偏好性分析以A3/(A3+T3)為縱坐標(biāo),以G3/(G3+C3)為橫坐標(biāo)制作二維散點圖,以(0.5,0.5)坐標(biāo)為中心點,從這個中心點制作的失量表示了奇偶偏倚的程度和方向[14]。

2.3 最優(yōu)密碼子分析

對于最優(yōu)密碼子的篩選,本研究利用藥用大黃編碼書寫的CAI值進行由高到低排列,然后取前后各5%的編碼序列,分別代表高表達(dá)與低表達(dá)的基因序列。之后分析各個密碼子的平均RSCU值。當(dāng)密碼子在高低表達(dá)基因中RSCU值的差異>0.3,且在高表達(dá)基因中RSCU≥1、在低表達(dá)基因中的RSCU≤1,即可被確定為最優(yōu)密碼子[15-16]。

2.4 對應(yīng)分析

對應(yīng)分析是指利用多元統(tǒng)計分析的方法研究不同編碼序列密碼子的變異趨勢。利用Codon W軟件中對應(yīng)分析功能,將所有編碼序列分布到59維向量空間,進而獲得密碼子使用偏好性的特點。通過分析基因位置研究基因向量及基因間值的變異程度,預(yù)測使密碼子使用發(fā)生偏好性的原因[17]。

3 結(jié)果

3.1 密碼子GC含量組成分析

利用Codon W軟件計算藥用大黃編碼序列中GC含量,將藥用大黃編碼序列作為一個整體進行計算。結(jié)果如圖1所示,GC含量范圍分布在28.6%~71.9%,主要分布在40%~50%,GC的平均含量為45.6%。GC1、GC2、GC3的平均含量分別為48.63%、40.89%、44.37%。對比發(fā)現(xiàn),GC2的含量最小,GC1與GC3的值相對比較接近,說明藥用大黃編碼序列更傾向于使用鳥嘌呤(G)和胞嘧啶(C)這2種堿基。

圖1 藥用大黃編碼序列中GC含量組成Fig.1 Distribution of GC content ofcoding sequences(CDS) in R.officinale

3.2 中性繪圖分析

藥用大黃編碼序列的中性圖分析如圖2所示,其中GC12的數(shù)值范圍為0.15~0.87,GC3的數(shù)值范圍為0.09~0.87。GC12與GC3的相關(guān)性系數(shù)為0.155,表明這兩者之間的相關(guān)性比較弱,說明選擇壓力在藥用大黃密碼子使用偏好性的選擇具有一定影響。

圖2 中性圖分析Fig.2 Neutrality plot

3.3 ENc-plot繪圖分析

ENc的取值范圍為20~61,平均值為47.58,其中ENc≤35的基因有386個(8.15%),ENC=61的基因有251個(5.30%),說明藥用大黃的編碼序列除了少數(shù)密碼子具有較強的偏好性,其整體的密碼子使用偏好性較弱。以ENc為縱坐標(biāo)、GC3s為橫坐標(biāo)繪制散點圖(圖3),圖中各點代表基因分布情況。圖3顯示大部分基因遠(yuǎn)離期望曲線,說明密碼子的偏好性主要來源于選擇壓力的影響,少部分基因均勻的分布在期望曲線兩側(cè),說明部分基因收到突變壓力的影響。

圖3 藥用大黃轉(zhuǎn)錄組編碼序列ENC-GC3s相關(guān)性分析Fig.3 Neutrality plot (ENC vs GC3)

利用(ENCexp-ENCobs)/ENCexp統(tǒng)計分析期望ENc與觀測ENc之間的區(qū)別[18]。如圖4所示,(ENCexp-ENCobs)/ENCexp的取值主要分布在0~0.2,說明期望ENc與觀測ENc兩者之間的存在很小差異。進而說明在藥用大黃編碼序列密碼子使用偏好性形成過程中,突變壓力不是唯一的影響因素,但卻是一個重要的影響因素。

圖4 ENc比值頻率分布Fig.4 Frequency distribution of ENc ratio

3.4 對應(yīng)性分析

對應(yīng)性分析結(jié)果見圖5,GC含量不同的基因被標(biāo)記上不同的顏色,編碼序列中GC含量大于60%的被標(biāo)記為紅色,GC含量在45%~60%的被標(biāo)記為藍(lán)色,GC含量小于45%的被標(biāo)記為綠色。其中,GC含量大于60%的編碼序列分散的分布在坐標(biāo)系中,而GC含量小于60%的編碼序列則在坐標(biāo)系中分布比較集中。

圖5 對應(yīng)性分析Fig.5 Correspondence analysis

此外,選取6個編碼序列相關(guān)的參數(shù)(GC12、GC3、GCall、ENC、CAI以及Axis 1)進行相關(guān)性分析,結(jié)果如表1所示,Axis 1與GC12、GC3這2個重要參數(shù)存在顯著的負(fù)相關(guān)性(r=-0.418,r=-0.728,P<0.01)。結(jié)合圖5與表1,可以說明GC含量與GC3含量高的編碼序列取向于分布在Axis 1左側(cè)。因此,推測以G/C結(jié)尾的密碼子應(yīng)集中分布在Axis 1負(fù)軸而以A/U結(jié)尾的密碼子集中分布在Axis 1正軸。

表1 藥用大黃編碼序列對應(yīng)參數(shù)的相關(guān)性分析Table 1 Correlation analysis of R.officinale gene-related parameters

3.5 偏倚性分析

偏倚性分析結(jié)果如圖6所示,大部分藥用大黃轉(zhuǎn)錄組編碼序列樣本點分布于中心點附近,說明其堿基中嘌呤與嘧啶出現(xiàn)的頻率相對一致,少部分編碼序列偏離中心點較遠(yuǎn),進一步說明藥用大黃密碼子使用偏好性形成過程中主要受到突變壓力的影響。

圖6 編碼序列偏倚性分析Fig.6 Parity rule 2 (PR2 ) -bias plot

3.6 基因表達(dá)水平對密碼子使用偏好性的影響

藥用大黃編碼序列的CAI的范圍為0.261~0.835,表明藥用大黃的基因表達(dá)水平比較高。同時,對CAI與其他幾個重要的參數(shù)進行了相關(guān)性分析,包括ENc、GC3、GC。結(jié)果如表1及圖7所示,CAI與ENc及GC之間都存在顯著的正相關(guān)性(r=0.07,P<0.01;r=0.695,P<0.01)。因此,基因表達(dá)水平在藥用大黃密碼子使用偏好性形成過程中起到關(guān)鍵作用,基因表達(dá)水平高并且基因中GC含量高,密碼子使用偏好性程度越高。

圖7 中性圖分析Fig.7 Neutrality plot

3.7 最優(yōu)密碼子分析

藥用大黃編碼序列高、低表達(dá)序列的RSCU值如表2所示。從中篩選到29個密碼子作為藥用大黃編碼序列的最優(yōu)密碼子,在這些最優(yōu)密碼子中,以U(15個)及A(13個)結(jié)尾的較多,表明藥用大黃轉(zhuǎn)錄組編碼序列的最優(yōu)密碼子偏好以U或A結(jié)尾。

表2 藥用大黃轉(zhuǎn)錄組高、低表達(dá)基因的RSCU比較分析Table 2 Optimal codons of R.officinale genes based on the RSCU values

4 討論

在生物長期的進化過程中,形成了對密碼子的使用的固定模式。今年來,隨著二代測序技術(shù)的發(fā)展,探索天然產(chǎn)物合成路徑并進行異源合成,成為了研究熱點。因此,探索藥用大黃基因密碼子使用偏好性,可為研究其密碼子使用特點,篩選最佳蛋白異源表達(dá)載體及密碼子優(yōu)化奠定理論基礎(chǔ)。

本研究對藥用大黃轉(zhuǎn)錄組數(shù)據(jù)中4733條完整編碼序列的密碼子使用偏好性進行分析,結(jié)果顯示,藥用大黃轉(zhuǎn)錄組編碼序列的GC、GC3平均含量分別為45.6%、44.73%,表明藥用大黃轉(zhuǎn)錄組中的編碼序列偏好使用富含A、U且以A/U結(jié)尾的密碼子,這與小麥Triticum aestivumL.[19]、水稻Oryza sativaL.[20]、玉米Zea maysL.[21]密碼子使用模式不一致,這些植物的密碼子富含GC堿基,并且大多數(shù)密碼子以G/C結(jié)尾,藥用植物川貝母轉(zhuǎn)錄組中的編碼序列的GC和GC3平均含量都接近于50%,并沒有表現(xiàn)出密碼子使用偏好性[15],表明堿基組成在藥用大黃響密碼子偏好性形成過程中起到重要作用。

此外,堿基突變和遺傳選擇也影響著密碼子使用偏好性形成的重要因素。本研究中,藥用大黃轉(zhuǎn)錄組GC12與GC3含量具有顯著相關(guān)性,ENc-plot繪圖及偏倚性分析分析結(jié)果表明,大部分基因遠(yuǎn)離于標(biāo)準(zhǔn)曲線及坐標(biāo)軸中心點,基因的期望ENc值與觀測ENc值具有較大差異,說明這部分基因密碼子偏好性的形成是以遺傳選擇為主導(dǎo)因素;少數(shù)的基因分布于標(biāo)準(zhǔn)曲線附近及坐標(biāo)軸中心點,基因的期望ENc值與觀測ENc值基本保持一致,說明這部分基因密碼子形成偏好性的形成是以突變?yōu)橹鲗?dǎo)因素。

在構(gòu)建蛋白表達(dá)載體時,不同的基因密碼子使用偏好性差異很大,因此分析藥用大黃的密碼子使用特點對于載體的密碼子優(yōu)化具有重要意義。本研究篩選得到藥用大黃29個最優(yōu)密碼子,大多數(shù)密碼子以A/U結(jié)尾,從藥用大黃編碼序列中的GC含量可以看出, 其偏好使用A或U堿基結(jié)尾的密碼子。由此推斷藥用大黃基因的密碼子偏好性的產(chǎn)生與其基因進化過程中AU到GC突變壓力要比GC到AU突變壓力高有關(guān)。

本研究對藥用大黃轉(zhuǎn)錄組數(shù)據(jù)中編碼序列的密碼子使用特點進行了研究,探討了影響其密碼子使用偏好性形成的影響因素,并篩選出藥用大黃基因的29個最優(yōu)密碼子,可為蒽醌類化合物的異源合成及其合成路徑研究提供理論依據(jù)。

利益沖突所有作者均聲明不存在利益沖突

猜你喜歡
分析研究
FMS與YBT相關(guān)性的實證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
新版C-NCAP側(cè)面碰撞假人損傷研究
電力系統(tǒng)及其自動化發(fā)展趨勢分析
中西醫(yī)結(jié)合治療抑郁癥100例分析
主站蜘蛛池模板: 中文字幕啪啪| 国产精品久线在线观看| 免费国产高清精品一区在线| 日韩性网站| 亚洲无码高清免费视频亚洲| 免费人成在线观看成人片 | 国产无人区一区二区三区| 国产日韩欧美精品区性色| 丁香婷婷在线视频| 成人福利视频网| 久久婷婷五月综合97色| 欧美v在线| 亚洲男人的天堂在线| 欧美一级大片在线观看| 白丝美女办公室高潮喷水视频| 亚洲V日韩V无码一区二区| 亚洲综合专区| 亚洲欧洲一区二区三区| 91精品专区国产盗摄| 久久鸭综合久久国产| 久久激情影院| 玖玖精品视频在线观看| 亚洲美女一区二区三区| 午夜欧美理论2019理论| 天天色综网| 美女扒开下面流白浆在线试听| 日韩欧美视频第一区在线观看| 午夜福利在线观看入口| 国产v精品成人免费视频71pao| 国产美女91视频| 综1合AV在线播放| 日韩经典精品无码一区二区| 亚洲欧美日韩中文字幕在线一区| 99精品国产电影| 国产成人精品亚洲77美色| 亚洲第一国产综合| 国内精品九九久久久精品| 欧美无专区| 欧美精品二区| 成人国内精品久久久久影院| 天堂网亚洲系列亚洲系列| 91极品美女高潮叫床在线观看| 精品国产成人a在线观看| 国产微拍一区| 99热这里只有成人精品国产| 亚洲日韩精品欧美中文字幕| 一个色综合久久| 偷拍久久网| 老司机精品99在线播放| 国产成人麻豆精品| 亚洲欧洲日产国产无码AV| 日韩午夜伦| 99久久精品国产麻豆婷婷| 日韩黄色大片免费看| 尤物成AV人片在线观看| 国产精品一老牛影视频| 亚洲欧美一级一级a| 777国产精品永久免费观看| 国产精品女主播| 国产精品尤物铁牛tv| 女人av社区男人的天堂| 国产精品无码影视久久久久久久| 欧美日韩午夜| 国产精品午夜福利麻豆| 在线免费观看a视频| 无码精品国产VA在线观看DVD| 久久人妻系列无码一区| 欧美精品黑人粗大| 高潮毛片无遮挡高清视频播放| 免费大黄网站在线观看| 国产精品福利尤物youwu | 人妻21p大胆| 五月天丁香婷婷综合久久| 一级成人a毛片免费播放| 极品国产一区二区三区| 午夜综合网| 国产成人精品亚洲77美色| 免费精品一区二区h| 国产成人免费手机在线观看视频| 亚洲日韩精品伊甸| 亚洲av日韩综合一区尤物| 在线观看av永久|