摘要:運用CodonW程序對擬南芥(Arabidopsis thaliana)POT基因密碼子組成、同義密碼子使用頻率和全長編碼區密碼子進行分析。結果表明,擬南芥POT基因密碼子適應指數(CAI)與同義密碼子第三位堿基含量(C3s)、密碼子偏愛指數(CBI)均呈顯著正相關(P<0.05),與最優密碼子使用頻率(FOP)呈極顯著正相關(P<0.01)。有效密碼子數(ENC)與同義密碼子第三位堿基含量(C3s)呈顯著正相關(P<0.05),與GC3s呈極顯著正相關(P<0.01),與同義密碼子第三位堿基含量(T3s)呈極顯著負相關(P<0.01)。擬南芥POT基因密碼子使用相對概率(RSCU)>1的密碼子多以堿基A或T結尾。
關鍵詞:擬南芥(Arabidopsis thaliana);POT基因;密碼子
中圖分類號:Q943 文獻標識碼:A 文章編號:0439-8114(2013)04-0956-03
Characterization of Codon Usage of Arabidopsis thaliana POT Gene
WANG Fu-yuan1,TANG Ning2,YANG Ping2
(1.Higher Vocational and Technology School, China Pharmaceutical University, Nanjing 211198, China;
2.School of Biochemistry and Environmental Engineering, Nanjing Xiaozhuang College, Nanjing 211171, China)
Abstract: CodonW software was applied to analyze the nucleotide composition, relative synonymous codon usage and other parameters of Arabidopsis thaliana POT gene. The results indicted that CAI was significantly positively correlated with C3s and CBI(P<0.05), and very significantly positively correlated with FOP(P<0.01); ENC was significantly positively correlated with C3s content(P<0.05), very significantly positively correlated with GC3s(P<0.01), and very significantly negatively correlated with T3s(P<0.01). Most codons with RSCU>1 of A. thaliana POT gene ended with A and T.
Key words: Arabidopsis thaliana; POT gene; codon
POT基因是擬南芥編碼高親和性K+載體蛋白的基因[1],將AtPOT1基因導入酵母菌缺鉀營養突變體,可使其恢復對K+的吸收[2,3]。同義密碼子的使用偏好性與諸多生命活動密切相關。目前密碼子的使用偏好性主要集中在對已知全基因組序列的低等生物和模式生物的基因組密碼子使用模式研究[4-6],對單一功能基因家族的密碼子用法研究還比較少[7,8]。本研究通過分析擬南芥POT基因家族全長編碼框密碼子的使用特性,為深入研究POT基因的進化、表達調控機制等提供重要的理論依據。
1 材料與方法
1.1 擬南芥POT基因序列
從TAIR(http://www.arabidopsis.org/)和Uniport(http://www.uniprot.org/)獲得擬南芥POT基因家族序列。序列名稱及Uniport對應登錄號如下:AtPOT1:022397;AtPOT2:022881;AtPOT3:Q9FE38;AtPOT4: Q9LD18; AtPOT5: Q9M7K4; AtPOT6:Q8W414; AtPOT7: Q9FY75; AtPOT8: Q9M7J9;AtPOT9: O49423; AtPOT10: Q9SA05; AtPOT11:O64769;AtPOT12:O80739;AtPOT13:Q8LPL8。
1.2 方法
利用CodonW(http://codonw.sourceforge.net/)和CUSP(http://bioweb2.pasteur.fr)軟件分析擬南芥POT基因密碼子使用特性的參數包括:氨基酸數(L_aa)、同義氨基酸數(L_sym)、氨基酸組分指數[平均親水性值(Gravy)和芳香性值(Aroma)]、A3s、 T3s、G3s、C3s(同義密碼子在第三位上腺嘌呤、胸腺嘧啶、鳥嘌呤和胞嘧啶的出現頻率)、GC含量(基因的G+C含量)、GC3s(編碼同一氨基酸的同義密碼子的第三位的GC含量)、ENC(有效密碼子數)、FOP(最優密碼子使用頻率)、CBI(密碼子偏愛指數)、RSCU(密碼子使用相對概率)、CAI(密碼子適應指數)等。運用SPSS 17.0統計軟件進行密碼子組成和使用偏好性各參數間相關性的分析。
2 結果與分析
2.1 擬南芥POT基因的密碼子組成和使用性參數分析
擬南芥POT基因氨基酸數(L_aa)、同義氨基酸數(L_sym)、氨基酸組分指數(平均親水性值和芳香性值)、A3s、T3s、G3s、C3s、GC3s、ENC、CAI、GC含量等密碼子使用特性見表1。由表1可知,擬南芥POT基因GC含量為42.70%~46.30%,這表明13個基因在整體編碼框區域內都傾向于使用腺嘌呤(A)和胸腺嘧啶(T)。利用CUSP軟件分析擬南芥POT基因編碼區GC含量為42.70%~46.30%,與整個基因組GC含量44.59%基本相當[9]。Gravy值均為正值,表明擬南芥POT基因為疏水性蛋白質。
ENC是衡量單個基因密碼子非均衡使用的偏好程度,取值范圍為20(每個氨基酸只使用1個密碼子)到61(各個密碼子被均衡使用)。其值越低表明該基因的密碼子使用偏好性越強。Jiang等[10]將ENC 35作為偏性強弱的區分標準。擬南芥POT基因家族ENC取值范圍為49.90~57.77,除AtPOT1的ENC為49.90,其他ENC都大于50,表明擬南芥POT基因家族密碼子偏性較弱。CAI是基因編碼區同義密碼子與密碼子最佳使用相符合程度的參數指標,其取值范圍為0~1。擬南芥POT基因CAI為0.179~0.219,表明擬南芥POT基因密碼子偏性較弱。
2.2 擬南芥POT基因密碼子使用參數的相關性分析
擬南芥POT基因密碼子使用性各參數之間相關分析見表2。由表2可知,CAI與C3s、CBI均呈顯著正相關(P<0.05),與FOP呈極顯著正相關(P<0.01)。ENC與同C3s呈顯著正相關(P<0.05),與GC3s呈極顯著正相關(P<0.01),與T3s呈極顯著負相關(P<0.01)。由各參數間的相關性關系表明,同義密碼子第三位的堿基含量對基因的表達水平和密碼子使用偏好性程度有一定的影響。
2.3 擬南芥POT基因密碼子的對應性分析
根據CodonW軟件分析,擬南芥POT基因相對同義密碼子的對應性分析結果表明,擬南芥POT基因前兩個軸對變異方差的貢獻率分別為19.29%和16.64%,其余各軸對變異方差的貢獻更小。可以將擬南芥POT基因密碼子放在這兩條軸上進行分析。各基因密碼子在前兩軸的分布見圖1,擬南芥以G和C結尾的密碼子大多位于第二軸的上側,表明G+C含量是影響同義密碼子使用偏性的主要因子。對應分析中的第一軸與氨基酸數(L_aa)的相關系數為-0.68,呈顯著負相關(P<0.05),與同義氨基酸數(L_sym)的相關系數為-0.689,呈極顯著負相關(P<0.01),表明基因長度對密碼子偏性有明顯影響。
2.4 擬南芥POT基因密碼子偏好性
密碼子使用的相對概率(RSCU)作為衡量密碼子偏好性的標準被該領域研究者普遍接受,并廣泛應用。當某一密碼子的RSCU值等于1時,表明它在編碼使用時出現的次數與期望值相等;當其值大于1時,表明它的出現次數大于期望值,表現為使用偏好;反之則使用偏少。利用CodonW計算擬南芥POT基因的RSCU值(表3)。RSCU值大于1的密碼子多以U(T)或A結尾,說明密碼子以U(T)或A結尾的出現頻率較高,這些是基因組偏愛的密碼子。以G或C結尾的密碼子RSCU值多小于1,說明以G或C結尾的密碼子出現的頻率較低,這些是基因組非偏愛的密碼子。
3 小結與討論
密碼子是核酸攜帶信息和蛋白質攜帶信息間對應的基本規則,是生物體內信息傳遞的基本環節。對于不同的物種來說,不同密碼子在基因中出現的頻率有很大不同,同義密碼子使用偏性的現象廣泛存在于動物、植物和微生物中[11]。
本研究對擬南芥POT基因的氨基酸數(L_aa)、同義氨基酸數(L_sym)、氨基酸組分指數(平均親水性值和芳香性值)、A3s、T3s、G3s、C3s、GC3s、ENC、CAI、CBI、GC含量等密碼子使用特性進行了分析,綜合分析表明擬南芥POT基因的RSCU值大于1的密碼子多以U(T)或A結尾,說明密碼子以U(T)或A結尾的出現頻率較高,這些是基因組偏愛的密碼子。高表達的基因相對于其他低表達或中等表達的基因具有更為強烈的密碼子使用上的偏好,擬南芥POT基因密碼子使用上的偏向性還受GC3s、C3s的影響,GC3s、C3s含量越小,密碼子發生偏向使用的趨勢越明顯。
不同物種的不同基因對密碼子的偏好特性各有不同,劉慶坡等[12]通過單、雙子葉植物基因組密碼子偏好特性的比較研究證明雙子葉植物偏向使用以A或T結尾的密碼子,而單子葉植物則偏向使用以C或G結尾的密碼子。本研究結果與其一致,擬南芥POT基因偏向使用以U(T)或A結尾的密碼子。本研究確定的擬南芥POT基因密碼子偏向性可為今后研究該基因的進化、克隆、表達調控等提供重要的理論依據。
參考文獻:
[1] QUINTERO F J, BLATT M R. A new family of K+ transporters from Arabidopsis that are conserved across phyla[J]. FEBS letters,1997,415(2):206-211.
[2] KIM E J, KWAK J M, UOZUMI N, et al. AtKup1: an Arabidopsis gene encoding high-affinity potassium transport activity[J]. The Plant Cell Online,1998,10(1):51-62.
[3] FU H H,LUAN S. AtKUP1:A dual-affinity K+ transporter from Arabidopsis[J]. The Plant Cell Online,1998,10(1):63-73.
[4] 范三紅,郭藹光,單麗偉,等. 擬南芥基因密碼子偏愛性分析[J]. 生物化學與生物物理進展,2003,30(2):221-225.
[5] 續 晨,蔡小寧,錢保俐,等.葡萄基因組密碼子使用偏好模式研究[J]. 西北植物學報,2012,32(2):409-415.
[6] ZHOU T, GU W, MA J, et al. Analysis of synonymous codon usage in H5N1 virus and other influenza A viruses[J]. Biosystems,2005,81(1):77-86.
[7] 張曉峰,薛慶中. 水稻和擬南芥NBS-LRR基因家族同義密碼子使用偏好的比較[J].作物學報,2005,31(5):596-620.
[8] 楊 平.擬南芥NHX基因密碼子使用特性分析[J]. 南京曉莊學院學報,2011(6):80-84.
[9] Codon usage database[EB/OL].http://www.kazusa.or.jp/codon/.
[10] JIANG Y, DENG F, WANG H L, et al. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Archives of Virology,2008,153(12):2273-2282.
[11] 劉漢梅,何 瑞,張懷渝,等. 擬南芥和水稻轉錄因子WRKY同義密碼子的偏好性分析[J]. 四川農業大學學報,2010,28(1):20-27.
[12] 劉慶坡,馮 英,董 輝. 20個物種同義密碼子偏性的比較分析[J].西北農林科技大學學報(自然科學版),2004,32(7):67-71.