999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人類組成型和可變外顯子的密碼子偏性及聚類分析

2014-09-10 18:06:07張占軍邢永強(qiáng)王成愛
湖北農(nóng)業(yè)科學(xué) 2014年11期

張占軍+邢永強(qiáng)+王成愛

摘要:通過計(jì)算人類組成型外顯子和可變外顯子的RSCU值,對兩種外顯子的RSCU值進(jìn)行了比較?結(jié)果表明,除了UAG?UGA?UAA 3個(gè)終止密碼子外,兩種外顯子的密碼子偏性都是相同的?對30條可變外顯子和30條組成型外顯子序列的RSCU值進(jìn)行聚類分析,聚類結(jié)果不能把兩種外顯子區(qū)別開,證明兩種外顯子之間的密碼子偏性是相同的?對這60條序列的HI進(jìn)行了聚類分析,聚類結(jié)果沒有把兩種外顯子分開?所以外顯子序列中沒有組成型剪接和可變剪接的信息?

關(guān)鍵字:人類;組成型外顯子;可變外顯子;密碼子偏性;聚類

中圖分類號:Q52文獻(xiàn)標(biāo)識碼:A文章編號:0439-8114(2014)11-2675-04

Codon Bias and Cluster Analysis of the Constitutive Exons and

the Alternative Exons of Human

ZHANG Zhan-jun,XING Yong-qiang,WANG Cheng-ai

(School of Mathematics, Physics and Biological Engineering,Inner Mogolia University of Science &

Technology,Baotou 014010, Inner Mogolia,China)

Abstract: RSCU of the constitutive exons and alternative exons of human were calculated. Two kinds of exons RSCU values were compared. The results showed that every codon bias was the same in two kinds of exons, except three stop codons(UAG,UGA,UAA). 30 constitutive exon sequences and 30 alternative exon sequences were selected to calculate RSCU values of them. The cluster analysis did not distinguish two kinds of exons, proving that the codon biases were the same between the two kinds of exons. HI of the 60 sequences were calculated and used to cluster analysis. It was not able to separate the two kinds of exons. It is indicated that there is no constitutive splicing and alternative splicing information in the exon sequences.

Key words: human;constitutive exons;alternative exons;codon bias;clustering

基金項(xiàng)目:國家自然科學(xué)基金項(xiàng)目(61271448)

可變剪接是多細(xì)胞真核生物蛋白質(zhì)多樣性的主要來源,且由于可變剪接的存在使得剪接機(jī)制變得異常復(fù)雜[1]?基于深度測序技術(shù),估計(jì)超過95%的人類多外顯子基因存在可變剪接現(xiàn)象?可變剪接主要包括5種類型:可變5剪接(Alternative 5 splicing)?可變3剪接(Alternative 3 splicing)?外顯子跳躍(Exon skipping)?內(nèi)含子保留(Intron retention)?互斥外顯子(Mutually exclusive exons)?如果把外顯子分為兩類,可以分為組成型外顯子(Constitution exons)和可變外顯子(Variable exons)?上述5種外顯子均屬于可變外顯子?

密碼子具有簡并性,即組成蛋白質(zhì)的每個(gè)氨基酸可能由一個(gè)到多個(gè)密碼子編碼?在基因中, 同義密碼子的使用并不是完全均勻的?在不同物種?不同生物體中,密碼子的使用存在很大的差異[2]?在一些單細(xì)胞生物中,如在大腸桿菌和酵母中,高表達(dá)的基因密碼子使用的偏性一般比較大,主要是由于基因的堿基組成和mRNA翻譯時(shí)tRNA的選擇造成的?

目前,對于組成型和可變外顯子的研究主要集中在用IDQD?SVM以及自由能等進(jìn)行分類?有些研究認(rèn)為密碼子偏性與諸多因素有關(guān), 如氨基酸組分[3]?mRNA的二級結(jié)構(gòu)[4]?翻譯起始效應(yīng)?G+C含量?基因長度[5,6]?tRNA的豐度[7]?蛋白質(zhì)的結(jié)構(gòu)[8]等?

鑒于此,筆者研究了組成型外顯子和可變外顯子的密碼子偏向性?非均勻性及其聚類?研究組成型外顯子和可變外顯子的密碼子偏向性,以及通過RSCU值和HI值聚類檢驗(yàn)其是否可以聚成兩類,有助于分析發(fā)生可變剪接的序列信息是在外顯子中還是在內(nèi)含子中,以及分析剪接的具體機(jī)制?

1材料與方法

所用的可變剪接的數(shù)據(jù)來源于ASTD數(shù)據(jù)庫(Release3)(ftp://ftp.ebi.edu.au/pub/databases/astd/altsplice /human/release3_36.35i/)[9,10],人類基因CDS序列數(shù)據(jù)來源于Ensembl(http://asia.ensembl.org/biomart/martview/04fb71801495bc0713760267933b

b8c3)?

1.1組成型外顯子和可變外顯子的來源

由ASTD庫的AltSplice-rel3.exon.txt庫?AltSplice-rel3.events.txt庫以及AltSplice-rel3.genes.txt庫得到4 624條人類的組成型外顯子序列;由Ensembl下載得到人類基因的CDS序列211 776條?對以上兩組序列進(jìn)行比對,確定出具有三周期讀碼框的人類組成型外顯子3 847條?

由ASTD庫的AltSplice-rel3.events.txt庫和AltSplice-rel3.genes.txt庫分別得到盒式外顯子序列8 049條?內(nèi)含子保留序列5 926條?互斥外顯子序列1 509對?可變3′外顯子序列6 320對?可變5′外顯子序列3 391對?這5種序列都是可變外顯子序列?由上述5種可變外顯子序列庫和人類基因的CDS庫比對得到具有三周期讀碼框的可變外顯子9 738條?在組成型和可變外顯子密碼子偏向性分析時(shí),確定了兩類外顯子的三周期讀碼框?

1.2密碼子偏向性計(jì)算

1.2.1密碼子使用的相對概率計(jì)算密碼子偏性常用的指標(biāo)有密碼子使用的相對概率?密碼子有效數(shù)?密碼子偏好參數(shù)?GC3s值等?其中密碼子使用的相對概率(Relative synonymous codon usage,RSCU) 是指對于某一特定的密碼子在編碼對應(yīng)氨基酸的同義密碼子間的相對概率[11]?密碼子使用的相對概率RSCUij的計(jì)算公式為:

RSCUij=(1)

式中,RSCUij表示第i個(gè)外顯子序列?第j個(gè)密碼子的相對使用概率,obsij表示密碼子j在外顯子i中出現(xiàn)的次數(shù),aaij表示密碼子j編碼的氨基酸在外顯子i編碼的氨基酸序列中出現(xiàn)的次數(shù),k表示與密碼子j同義的密碼子個(gè)數(shù)?

RSCU值等于1,表示這個(gè)密碼子沒有偏向性,大于1表示這個(gè)密碼子是使用較多的密碼子,小于1表示這個(gè)密碼子使用較少?RSCU值越大表示密碼子的偏向性越大?

1.2.2組成型外顯子和可變外顯子的RSCU值計(jì)算把“1.1”得到的組成型外顯子和可變外顯子分別連接起來,用CodonW軟件分別計(jì)算其RSCU值?

1.3用RSCU值進(jìn)行聚類分析

1.3.1聚類分析使用的數(shù)據(jù)從“1.1”所述的具有三周期讀碼框的人類組成型外顯子3 847條,隨機(jī)選取超過大小500 bp的組成型外顯子30條,作為正集;隨機(jī)選取盒式外顯子6條?互斥外顯子6條?可變5′外顯子6條?可變3′外顯子6條?內(nèi)含子保留序列6條,序列長度都超過500 bp,共30條,把這些作為可變外顯子,作為負(fù)集?分別將上述組成型外顯子序列編號為1-30,可變外顯子序列編號為31-60?

1.3.2聚類方法對外顯子密碼子使用概率進(jìn)行聚類分析,將每個(gè)外顯子序列作為研究對象,將密碼子的相對使用概率統(tǒng)計(jì)值作為變量?由于AUG(編碼蛋氨酸的密碼子)?UGG(編碼色氨酸的密碼子)的RSCU值始終為1,所以除去這兩個(gè)密碼子,同時(shí)除去3個(gè)終止密碼子,剩下59個(gè)密碼子,用這59個(gè)密碼子的RSCU值進(jìn)行聚類分析?

這里外顯子間的距離規(guī)定為密碼子使用相對概率的歐拉平方距離?歐拉平方距離dij的計(jì)算公式為:

dij=(RSCUik-RSCUjk)2 (2)

式中,dij表示外顯子i與外顯子j之間的距離?RSCUik表示第i個(gè)外顯子的第k個(gè)密碼子的RSCU值,RSCUjk表示第j個(gè)外顯子的第k個(gè)密碼子的RSCU值?

1.3.3聚類分析用CodonW軟件分別計(jì)算這60條序列的RSCU值,并用公式(2)計(jì)算出其距離矩陣?用SPSS 13.0軟件進(jìn)行聚類分析?

1.4用非均勻指數(shù)(HI)進(jìn)行聚類

1.4.1非均勻指數(shù)(HI)非均勻指數(shù)(HI)定義為:

HI=(3)

式中,N?琢(α=1?2?3?4)表示序列的4種堿基A?G?T?C;N=N?琢為序列長度;N(l)(l=1?2?3)為3個(gè)子序列的長度;N(l)=N/3;Nα(l)為第l個(gè)子序列中第α種堿基數(shù)[12]?利用該參數(shù)研究堿基的非均勻分布?

1.4.2用非均勻指數(shù)聚類所使用的距離用非均勻指數(shù)聚類所使用的距離定義為:

dij=HIi-HIj(4)

式中,dij表示第i條外顯子和第j條外顯子的距離,HIi表示第i條外顯子序列的非均勻指數(shù),HIj表示第j條外顯子序列的非均勻指數(shù)?

1.4.3聚類分析用公式(3)計(jì)算“1.3.1”中所述的60條序列的HI值,然后用公式(4)計(jì)算其距離矩陣,最后用SPSS 13.0軟件進(jìn)行聚類分析?

2結(jié)果與分析

2.1組成型和可變外顯子密碼子偏性結(jié)果

將找到的所有符合條件的組成型外顯子連成一條序列,計(jì)算其RSCU值,同時(shí)把找到的所有符合條件的可變外顯子連接成一條序列,計(jì)算其RSCU值?在計(jì)算結(jié)果中,剔除了UAA?UAG?UGA 3個(gè)終止密碼子,繪制折線圖,如圖1所示?從圖1中可以看出,組成型外顯子和可變外顯子之間偏性是相同的?每個(gè)外顯子的RSCU值稍有差異,可能是統(tǒng)計(jì)誤差的原因?

2.2用RSCU值對組成型外顯子和可變外顯子聚類的結(jié)果

1-30號序列為組成型外顯子,31-60號序列是可變外顯子,利用這60條序列的RSCU值,采用SPSS 13.0軟件進(jìn)行聚類分析(通過計(jì)算距離矩陣),結(jié)果如圖2所示?由圖2可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,進(jìn)一步確認(rèn)了組成型和可變外顯子的密碼子偏性是相同的?

2.3用HI指數(shù)對組成型外顯子和可變外顯子聚類的結(jié)果

計(jì)算了1-30號組成型外顯子和31-60號可變外顯子序列的HI指數(shù),并用HI指數(shù)對它們進(jìn)行聚類分析,聚類結(jié)果如圖3所示?由圖3可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,說明組成型外顯子和可變外顯子之間序列的不均勻性是相同的?

3結(jié)論與討論

本研究結(jié)果表明,組成型外顯子和可變外顯子的密碼子偏性是相同的?組成型外顯子和可變外顯子的非均勻性是相同的?可以推斷,組成型剪接和可變剪接與外顯子序列的特異性關(guān)系不大,或者組成型外顯子和可變外顯子在密碼子偏性或不均勻性上不存在特異性?

組成型外顯子和可變外顯子在密碼子的使用上沒有偏性,可以得出在剪接的時(shí)候外顯子一端是否發(fā)生剪接的信息不在外顯子里?為什么某個(gè)位點(diǎn)發(fā)生的是組成型剪接,而不是可變剪接,而另一個(gè)位點(diǎn)發(fā)生的是可變剪接,而不是組成型剪接,可能是大量的剪接信息是在內(nèi)含子序列?剪接因子?pre-mRNA?DNA大分子?非編碼RNA等的互相作用中產(chǎn)生的?

結(jié)合組成型外顯子和可變外顯子之間的密碼子偏性相同的信息進(jìn)一步猜測,有可能由于進(jìn)化的選擇,外顯子中的堿基序列是用來編碼蛋白質(zhì)的,這些序列已經(jīng)有了編碼蛋白質(zhì)的功能,不適合有太多的剪接信息;而就平均長度來說,內(nèi)含子比外顯子長得多,而且不需要編碼蛋白質(zhì),適宜于放置可變剪接的調(diào)控模體——剪接信息?

參考文獻(xiàn):

[1] SMITH C W, VALCARCEL J. Alternative pre-mRNA splicing: The logic of combinatorial control[J].Trends Biochem Sci,2000,25(8):381-388.

[2] GRANTHAM R, GAUTIER C, GOUY M, et al.Codon catalog usage and the genome hypothesis[J]. Nucleic Acids Research,1980,8(1):49-62.

[3] ONOFRIO G D, MOUCHIROUD D, AISSANIi B ,et al. Correlations between the compositional properties of human genes, codon usage, and amino acid composition of proteins[J].J Mol Evol,1991,32(6):504-510.

[4] ZAMA M. Codon usage and secondary structure of mRNA[J]. Nucleic Acids Symp Ser,1990,22(3):93-94.

[5] EYRE-WALKER A. Synonymous codon bias is related to gene length in Escherichia coli:Selection for translational accuracy?[J]. Mol Biol Evol,1996,13(6):864-872.

[6] MORIYAMA E N, POWELL J R. Gene length and codon usage bias inDrosophila melanogaster, Saccharomyces cervisiae and Escherichia coli[J].Nucleic Acids Res,1998,26(13):3188-3193.

[7] BUCHAN J R, AUCOTT L S, STANSFIELD I. tRNA properties help shape codon pair preferences in open reading frames[J]. Nucleic Acids Res,2006,34(3):1015-1027.

[8] GUPTA S K, MAJUMDAR S K, BHATTACHARYA T, et al. Studies on the relationships between the synonymous codon usage and protein secondary structural units[J].Biochem Biophys Res Commun, 2000,269(3): 692-696.

[9] THANARAJ T A, STAMM S, CLARK F, et al. ASD: The alternative splicing database[J]. Nucleic Acids Res, 2004,32(1):64-69.

[10] STAMM S, RIETHOVEN J J, LE TEXIER V, et al. ASD: A bioinformatics resource on alternative splicing[J]. Nucleic Acids Res, 2006,34(S1):46-55.

[11] COMERON J, AGUADE M. An evaluation of measure of synonymous codon usage bias[J]. Journal of Molecular Evolution, 1998, 47(2): 268-274.

[12] 晉宏?duì)I,李 宏. 核酸序列非均勻指數(shù)(HI)的約化[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,33(3):283-287.

RSCUij=(1)

式中,RSCUij表示第i個(gè)外顯子序列?第j個(gè)密碼子的相對使用概率,obsij表示密碼子j在外顯子i中出現(xiàn)的次數(shù),aaij表示密碼子j編碼的氨基酸在外顯子i編碼的氨基酸序列中出現(xiàn)的次數(shù),k表示與密碼子j同義的密碼子個(gè)數(shù)?

RSCU值等于1,表示這個(gè)密碼子沒有偏向性,大于1表示這個(gè)密碼子是使用較多的密碼子,小于1表示這個(gè)密碼子使用較少?RSCU值越大表示密碼子的偏向性越大?

1.2.2組成型外顯子和可變外顯子的RSCU值計(jì)算把“1.1”得到的組成型外顯子和可變外顯子分別連接起來,用CodonW軟件分別計(jì)算其RSCU值?

1.3用RSCU值進(jìn)行聚類分析

1.3.1聚類分析使用的數(shù)據(jù)從“1.1”所述的具有三周期讀碼框的人類組成型外顯子3 847條,隨機(jī)選取超過大小500 bp的組成型外顯子30條,作為正集;隨機(jī)選取盒式外顯子6條?互斥外顯子6條?可變5′外顯子6條?可變3′外顯子6條?內(nèi)含子保留序列6條,序列長度都超過500 bp,共30條,把這些作為可變外顯子,作為負(fù)集?分別將上述組成型外顯子序列編號為1-30,可變外顯子序列編號為31-60?

1.3.2聚類方法對外顯子密碼子使用概率進(jìn)行聚類分析,將每個(gè)外顯子序列作為研究對象,將密碼子的相對使用概率統(tǒng)計(jì)值作為變量?由于AUG(編碼蛋氨酸的密碼子)?UGG(編碼色氨酸的密碼子)的RSCU值始終為1,所以除去這兩個(gè)密碼子,同時(shí)除去3個(gè)終止密碼子,剩下59個(gè)密碼子,用這59個(gè)密碼子的RSCU值進(jìn)行聚類分析?

這里外顯子間的距離規(guī)定為密碼子使用相對概率的歐拉平方距離?歐拉平方距離dij的計(jì)算公式為:

dij=(RSCUik-RSCUjk)2 (2)

式中,dij表示外顯子i與外顯子j之間的距離?RSCUik表示第i個(gè)外顯子的第k個(gè)密碼子的RSCU值,RSCUjk表示第j個(gè)外顯子的第k個(gè)密碼子的RSCU值?

1.3.3聚類分析用CodonW軟件分別計(jì)算這60條序列的RSCU值,并用公式(2)計(jì)算出其距離矩陣?用SPSS 13.0軟件進(jìn)行聚類分析?

1.4用非均勻指數(shù)(HI)進(jìn)行聚類

1.4.1非均勻指數(shù)(HI)非均勻指數(shù)(HI)定義為:

HI=(3)

式中,N?琢(α=1?2?3?4)表示序列的4種堿基A?G?T?C;N=N?琢為序列長度;N(l)(l=1?2?3)為3個(gè)子序列的長度;N(l)=N/3;Nα(l)為第l個(gè)子序列中第α種堿基數(shù)[12]?利用該參數(shù)研究堿基的非均勻分布?

1.4.2用非均勻指數(shù)聚類所使用的距離用非均勻指數(shù)聚類所使用的距離定義為:

dij=HIi-HIj(4)

式中,dij表示第i條外顯子和第j條外顯子的距離,HIi表示第i條外顯子序列的非均勻指數(shù),HIj表示第j條外顯子序列的非均勻指數(shù)?

1.4.3聚類分析用公式(3)計(jì)算“1.3.1”中所述的60條序列的HI值,然后用公式(4)計(jì)算其距離矩陣,最后用SPSS 13.0軟件進(jìn)行聚類分析?

2結(jié)果與分析

2.1組成型和可變外顯子密碼子偏性結(jié)果

將找到的所有符合條件的組成型外顯子連成一條序列,計(jì)算其RSCU值,同時(shí)把找到的所有符合條件的可變外顯子連接成一條序列,計(jì)算其RSCU值?在計(jì)算結(jié)果中,剔除了UAA?UAG?UGA 3個(gè)終止密碼子,繪制折線圖,如圖1所示?從圖1中可以看出,組成型外顯子和可變外顯子之間偏性是相同的?每個(gè)外顯子的RSCU值稍有差異,可能是統(tǒng)計(jì)誤差的原因?

2.2用RSCU值對組成型外顯子和可變外顯子聚類的結(jié)果

1-30號序列為組成型外顯子,31-60號序列是可變外顯子,利用這60條序列的RSCU值,采用SPSS 13.0軟件進(jìn)行聚類分析(通過計(jì)算距離矩陣),結(jié)果如圖2所示?由圖2可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,進(jìn)一步確認(rèn)了組成型和可變外顯子的密碼子偏性是相同的?

2.3用HI指數(shù)對組成型外顯子和可變外顯子聚類的結(jié)果

計(jì)算了1-30號組成型外顯子和31-60號可變外顯子序列的HI指數(shù),并用HI指數(shù)對它們進(jìn)行聚類分析,聚類結(jié)果如圖3所示?由圖3可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,說明組成型外顯子和可變外顯子之間序列的不均勻性是相同的?

3結(jié)論與討論

本研究結(jié)果表明,組成型外顯子和可變外顯子的密碼子偏性是相同的?組成型外顯子和可變外顯子的非均勻性是相同的?可以推斷,組成型剪接和可變剪接與外顯子序列的特異性關(guān)系不大,或者組成型外顯子和可變外顯子在密碼子偏性或不均勻性上不存在特異性?

組成型外顯子和可變外顯子在密碼子的使用上沒有偏性,可以得出在剪接的時(shí)候外顯子一端是否發(fā)生剪接的信息不在外顯子里?為什么某個(gè)位點(diǎn)發(fā)生的是組成型剪接,而不是可變剪接,而另一個(gè)位點(diǎn)發(fā)生的是可變剪接,而不是組成型剪接,可能是大量的剪接信息是在內(nèi)含子序列?剪接因子?pre-mRNA?DNA大分子?非編碼RNA等的互相作用中產(chǎn)生的?

結(jié)合組成型外顯子和可變外顯子之間的密碼子偏性相同的信息進(jìn)一步猜測,有可能由于進(jìn)化的選擇,外顯子中的堿基序列是用來編碼蛋白質(zhì)的,這些序列已經(jīng)有了編碼蛋白質(zhì)的功能,不適合有太多的剪接信息;而就平均長度來說,內(nèi)含子比外顯子長得多,而且不需要編碼蛋白質(zhì),適宜于放置可變剪接的調(diào)控模體——剪接信息?

參考文獻(xiàn):

[1] SMITH C W, VALCARCEL J. Alternative pre-mRNA splicing: The logic of combinatorial control[J].Trends Biochem Sci,2000,25(8):381-388.

[2] GRANTHAM R, GAUTIER C, GOUY M, et al.Codon catalog usage and the genome hypothesis[J]. Nucleic Acids Research,1980,8(1):49-62.

[3] ONOFRIO G D, MOUCHIROUD D, AISSANIi B ,et al. Correlations between the compositional properties of human genes, codon usage, and amino acid composition of proteins[J].J Mol Evol,1991,32(6):504-510.

[4] ZAMA M. Codon usage and secondary structure of mRNA[J]. Nucleic Acids Symp Ser,1990,22(3):93-94.

[5] EYRE-WALKER A. Synonymous codon bias is related to gene length in Escherichia coli:Selection for translational accuracy?[J]. Mol Biol Evol,1996,13(6):864-872.

[6] MORIYAMA E N, POWELL J R. Gene length and codon usage bias inDrosophila melanogaster, Saccharomyces cervisiae and Escherichia coli[J].Nucleic Acids Res,1998,26(13):3188-3193.

[7] BUCHAN J R, AUCOTT L S, STANSFIELD I. tRNA properties help shape codon pair preferences in open reading frames[J]. Nucleic Acids Res,2006,34(3):1015-1027.

[8] GUPTA S K, MAJUMDAR S K, BHATTACHARYA T, et al. Studies on the relationships between the synonymous codon usage and protein secondary structural units[J].Biochem Biophys Res Commun, 2000,269(3): 692-696.

[9] THANARAJ T A, STAMM S, CLARK F, et al. ASD: The alternative splicing database[J]. Nucleic Acids Res, 2004,32(1):64-69.

[10] STAMM S, RIETHOVEN J J, LE TEXIER V, et al. ASD: A bioinformatics resource on alternative splicing[J]. Nucleic Acids Res, 2006,34(S1):46-55.

[11] COMERON J, AGUADE M. An evaluation of measure of synonymous codon usage bias[J]. Journal of Molecular Evolution, 1998, 47(2): 268-274.

[12] 晉宏?duì)I,李 宏. 核酸序列非均勻指數(shù)(HI)的約化[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,33(3):283-287.

RSCUij=(1)

式中,RSCUij表示第i個(gè)外顯子序列?第j個(gè)密碼子的相對使用概率,obsij表示密碼子j在外顯子i中出現(xiàn)的次數(shù),aaij表示密碼子j編碼的氨基酸在外顯子i編碼的氨基酸序列中出現(xiàn)的次數(shù),k表示與密碼子j同義的密碼子個(gè)數(shù)?

RSCU值等于1,表示這個(gè)密碼子沒有偏向性,大于1表示這個(gè)密碼子是使用較多的密碼子,小于1表示這個(gè)密碼子使用較少?RSCU值越大表示密碼子的偏向性越大?

1.2.2組成型外顯子和可變外顯子的RSCU值計(jì)算把“1.1”得到的組成型外顯子和可變外顯子分別連接起來,用CodonW軟件分別計(jì)算其RSCU值?

1.3用RSCU值進(jìn)行聚類分析

1.3.1聚類分析使用的數(shù)據(jù)從“1.1”所述的具有三周期讀碼框的人類組成型外顯子3 847條,隨機(jī)選取超過大小500 bp的組成型外顯子30條,作為正集;隨機(jī)選取盒式外顯子6條?互斥外顯子6條?可變5′外顯子6條?可變3′外顯子6條?內(nèi)含子保留序列6條,序列長度都超過500 bp,共30條,把這些作為可變外顯子,作為負(fù)集?分別將上述組成型外顯子序列編號為1-30,可變外顯子序列編號為31-60?

1.3.2聚類方法對外顯子密碼子使用概率進(jìn)行聚類分析,將每個(gè)外顯子序列作為研究對象,將密碼子的相對使用概率統(tǒng)計(jì)值作為變量?由于AUG(編碼蛋氨酸的密碼子)?UGG(編碼色氨酸的密碼子)的RSCU值始終為1,所以除去這兩個(gè)密碼子,同時(shí)除去3個(gè)終止密碼子,剩下59個(gè)密碼子,用這59個(gè)密碼子的RSCU值進(jìn)行聚類分析?

這里外顯子間的距離規(guī)定為密碼子使用相對概率的歐拉平方距離?歐拉平方距離dij的計(jì)算公式為:

dij=(RSCUik-RSCUjk)2 (2)

式中,dij表示外顯子i與外顯子j之間的距離?RSCUik表示第i個(gè)外顯子的第k個(gè)密碼子的RSCU值,RSCUjk表示第j個(gè)外顯子的第k個(gè)密碼子的RSCU值?

1.3.3聚類分析用CodonW軟件分別計(jì)算這60條序列的RSCU值,并用公式(2)計(jì)算出其距離矩陣?用SPSS 13.0軟件進(jìn)行聚類分析?

1.4用非均勻指數(shù)(HI)進(jìn)行聚類

1.4.1非均勻指數(shù)(HI)非均勻指數(shù)(HI)定義為:

HI=(3)

式中,N?琢(α=1?2?3?4)表示序列的4種堿基A?G?T?C;N=N?琢為序列長度;N(l)(l=1?2?3)為3個(gè)子序列的長度;N(l)=N/3;Nα(l)為第l個(gè)子序列中第α種堿基數(shù)[12]?利用該參數(shù)研究堿基的非均勻分布?

1.4.2用非均勻指數(shù)聚類所使用的距離用非均勻指數(shù)聚類所使用的距離定義為:

dij=HIi-HIj(4)

式中,dij表示第i條外顯子和第j條外顯子的距離,HIi表示第i條外顯子序列的非均勻指數(shù),HIj表示第j條外顯子序列的非均勻指數(shù)?

1.4.3聚類分析用公式(3)計(jì)算“1.3.1”中所述的60條序列的HI值,然后用公式(4)計(jì)算其距離矩陣,最后用SPSS 13.0軟件進(jìn)行聚類分析?

2結(jié)果與分析

2.1組成型和可變外顯子密碼子偏性結(jié)果

將找到的所有符合條件的組成型外顯子連成一條序列,計(jì)算其RSCU值,同時(shí)把找到的所有符合條件的可變外顯子連接成一條序列,計(jì)算其RSCU值?在計(jì)算結(jié)果中,剔除了UAA?UAG?UGA 3個(gè)終止密碼子,繪制折線圖,如圖1所示?從圖1中可以看出,組成型外顯子和可變外顯子之間偏性是相同的?每個(gè)外顯子的RSCU值稍有差異,可能是統(tǒng)計(jì)誤差的原因?

2.2用RSCU值對組成型外顯子和可變外顯子聚類的結(jié)果

1-30號序列為組成型外顯子,31-60號序列是可變外顯子,利用這60條序列的RSCU值,采用SPSS 13.0軟件進(jìn)行聚類分析(通過計(jì)算距離矩陣),結(jié)果如圖2所示?由圖2可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,進(jìn)一步確認(rèn)了組成型和可變外顯子的密碼子偏性是相同的?

2.3用HI指數(shù)對組成型外顯子和可變外顯子聚類的結(jié)果

計(jì)算了1-30號組成型外顯子和31-60號可變外顯子序列的HI指數(shù),并用HI指數(shù)對它們進(jìn)行聚類分析,聚類結(jié)果如圖3所示?由圖3可知,聚類結(jié)果沒有把組成型外顯子和可變外顯子區(qū)別開,說明組成型外顯子和可變外顯子之間序列的不均勻性是相同的?

3結(jié)論與討論

本研究結(jié)果表明,組成型外顯子和可變外顯子的密碼子偏性是相同的?組成型外顯子和可變外顯子的非均勻性是相同的?可以推斷,組成型剪接和可變剪接與外顯子序列的特異性關(guān)系不大,或者組成型外顯子和可變外顯子在密碼子偏性或不均勻性上不存在特異性?

組成型外顯子和可變外顯子在密碼子的使用上沒有偏性,可以得出在剪接的時(shí)候外顯子一端是否發(fā)生剪接的信息不在外顯子里?為什么某個(gè)位點(diǎn)發(fā)生的是組成型剪接,而不是可變剪接,而另一個(gè)位點(diǎn)發(fā)生的是可變剪接,而不是組成型剪接,可能是大量的剪接信息是在內(nèi)含子序列?剪接因子?pre-mRNA?DNA大分子?非編碼RNA等的互相作用中產(chǎn)生的?

結(jié)合組成型外顯子和可變外顯子之間的密碼子偏性相同的信息進(jìn)一步猜測,有可能由于進(jìn)化的選擇,外顯子中的堿基序列是用來編碼蛋白質(zhì)的,這些序列已經(jīng)有了編碼蛋白質(zhì)的功能,不適合有太多的剪接信息;而就平均長度來說,內(nèi)含子比外顯子長得多,而且不需要編碼蛋白質(zhì),適宜于放置可變剪接的調(diào)控模體——剪接信息?

參考文獻(xiàn):

[1] SMITH C W, VALCARCEL J. Alternative pre-mRNA splicing: The logic of combinatorial control[J].Trends Biochem Sci,2000,25(8):381-388.

[2] GRANTHAM R, GAUTIER C, GOUY M, et al.Codon catalog usage and the genome hypothesis[J]. Nucleic Acids Research,1980,8(1):49-62.

[3] ONOFRIO G D, MOUCHIROUD D, AISSANIi B ,et al. Correlations between the compositional properties of human genes, codon usage, and amino acid composition of proteins[J].J Mol Evol,1991,32(6):504-510.

[4] ZAMA M. Codon usage and secondary structure of mRNA[J]. Nucleic Acids Symp Ser,1990,22(3):93-94.

[5] EYRE-WALKER A. Synonymous codon bias is related to gene length in Escherichia coli:Selection for translational accuracy?[J]. Mol Biol Evol,1996,13(6):864-872.

[6] MORIYAMA E N, POWELL J R. Gene length and codon usage bias inDrosophila melanogaster, Saccharomyces cervisiae and Escherichia coli[J].Nucleic Acids Res,1998,26(13):3188-3193.

[7] BUCHAN J R, AUCOTT L S, STANSFIELD I. tRNA properties help shape codon pair preferences in open reading frames[J]. Nucleic Acids Res,2006,34(3):1015-1027.

[8] GUPTA S K, MAJUMDAR S K, BHATTACHARYA T, et al. Studies on the relationships between the synonymous codon usage and protein secondary structural units[J].Biochem Biophys Res Commun, 2000,269(3): 692-696.

[9] THANARAJ T A, STAMM S, CLARK F, et al. ASD: The alternative splicing database[J]. Nucleic Acids Res, 2004,32(1):64-69.

[10] STAMM S, RIETHOVEN J J, LE TEXIER V, et al. ASD: A bioinformatics resource on alternative splicing[J]. Nucleic Acids Res, 2006,34(S1):46-55.

[11] COMERON J, AGUADE M. An evaluation of measure of synonymous codon usage bias[J]. Journal of Molecular Evolution, 1998, 47(2): 268-274.

[12] 晉宏?duì)I,李 宏. 核酸序列非均勻指數(shù)(HI)的約化[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,33(3):283-287.

主站蜘蛛池模板: 亚洲一区黄色| 动漫精品啪啪一区二区三区| 伊人久久综在合线亚洲91| 国产原创第一页在线观看| 日本欧美精品| 日本亚洲欧美在线| 国产精品综合久久久| 亚洲婷婷丁香| 欧美日本在线一区二区三区| 日本精品视频| 亚洲成a人片| 国产一区亚洲一区| 免费观看男人免费桶女人视频| 91国内外精品自在线播放| 色爽网免费视频| 2021国产v亚洲v天堂无码| 久久精品人妻中文系列| 欧美日韩高清| 久久久久久久97| 亚洲福利一区二区三区| 国产无套粉嫩白浆| 免费国产黄线在线观看| 亚洲欧洲自拍拍偷午夜色| 91探花在线观看国产最新| 波多野结衣一区二区三区四区视频| 人妻中文字幕无码久久一区| 欧美第一页在线| 怡春院欧美一区二区三区免费| 亚洲中文字幕久久精品无码一区| 欧美一级黄片一区2区| 伊人成人在线| 国产欧美日韩视频怡春院| 四虎AV麻豆| 国产精品夜夜嗨视频免费视频 | 一本视频精品中文字幕| 日韩在线影院| 国产产在线精品亚洲aavv| 国产视频 第一页| 五月激激激综合网色播免费| 国产欧美精品专区一区二区| 91精品国产91欠久久久久| 国产一区二区福利| 亚洲成人一区二区| 尤物精品视频一区二区三区| 免费人成在线观看成人片 | 国产成人凹凸视频在线| 熟女日韩精品2区| 国产大片黄在线观看| 国产在线精品99一区不卡| 老熟妇喷水一区二区三区| 在线va视频| 丰满人妻久久中文字幕| 天天综合网在线| 囯产av无码片毛片一级| 亚洲国产日韩在线观看| 成人一级黄色毛片| 免费Aⅴ片在线观看蜜芽Tⅴ| 亚洲第一成年人网站| 在线精品亚洲一区二区古装| 久久a级片| 99re精彩视频| 欧美黑人欧美精品刺激| 免费AV在线播放观看18禁强制| 国产视频入口| 国产成人综合久久精品尤物| 国产精品女主播| 久久精品这里只有精99品| 本亚洲精品网站| 欧美日韩激情| 日本道综合一本久久久88| 国产亚洲欧美日韩在线一区二区三区| 久久综合色播五月男人的天堂| 亚洲一级无毛片无码在线免费视频 | 国产成人亚洲无吗淙合青草| 免费无遮挡AV| 亚洲成人网在线播放| a网站在线观看| 欧美激情福利| 蜜芽国产尤物av尤物在线看| 日韩精品久久无码中文字幕色欲| 国产一区二区福利| 国产成人91精品免费网址在线|