999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

固有無(wú)序蛋白質(zhì)無(wú)序區(qū)和有序區(qū)氨基酸組成偏好性分析

2014-07-11 05:13:17王紅梅等
江蘇農(nóng)業(yè)科學(xué) 2014年4期

王紅梅等

摘要:以固有無(wú)序蛋白質(zhì)為研究對(duì)象,通過(guò)CD-HIT對(duì)數(shù)據(jù)進(jìn)行去冗余處理,然后利用編程軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)而得到新的數(shù)據(jù)。對(duì)所有無(wú)序區(qū)及有序區(qū)的氨基酸含量進(jìn)行對(duì)比,認(rèn)為氨基酸Val、Ile、Leu、Phe、Trp、Asn、Tyr、His具有形成有序結(jié)構(gòu)的偏好性;氨基酸Pro、Ser、Gln、Asp、Lys具有形成無(wú)序結(jié)構(gòu)的偏好性。研究結(jié)論有助于進(jìn)一步挖掘固有無(wú)序蛋白質(zhì)的序列特征,并為固有無(wú)序蛋白質(zhì)的預(yù)測(cè)提供一些借鑒。

關(guān)鍵詞:固有無(wú)序蛋白質(zhì);功能位點(diǎn);無(wú)序區(qū);序列分析

中圖分類(lèi)號(hào): Q516 文獻(xiàn)標(biāo)志碼: A 文章編號(hào):1002-1302(2014)04-0038-02

收稿日期:2013-08-23

基金項(xiàng)目:山東省自然科學(xué)基金(編號(hào):ZR2010CQ041)。

作者簡(jiǎn)介:王紅梅(1974—),女,山東德州人,碩士,副教授,主要從事生物信息學(xué)的研究。E-mail:whm_2327@126.com。蛋白質(zhì)是生物體中最重要的兩類(lèi)大分子之一,傳統(tǒng)思想認(rèn)為蛋白質(zhì)要實(shí)現(xiàn)其生物功能,必須先折疊成一個(gè)穩(wěn)定的三維結(jié)構(gòu),因此形成了蛋白質(zhì)結(jié)構(gòu)決定其功能的主流觀點(diǎn)[1]。然而隨著基因工程方法和實(shí)驗(yàn)技術(shù)的發(fā)展以及基因組計(jì)劃的開(kāi)展,在20世紀(jì)90年代初,人們發(fā)現(xiàn)有些蛋白質(zhì)或蛋白質(zhì)序列中的一部分區(qū)域在生理?xiàng)l件下不具有一個(gè)確定的三維結(jié)構(gòu),但是依然能夠正常行使生物學(xué)功能。進(jìn)一步研究發(fā)現(xiàn)的這類(lèi)蛋白質(zhì)越來(lái)越多,并逐漸形成了一種新的蛋白質(zhì)類(lèi)型,稱(chēng)為固有無(wú)序蛋白質(zhì)(intrinsically disordered proteins,簡(jiǎn)稱(chēng)為IDPs)[1-3]。對(duì)目前存在的大量基因庫(kù)數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn):蛋白質(zhì)的無(wú)序結(jié)構(gòu)與蛋白質(zhì)功能之間關(guān)系密切,無(wú)序蛋白質(zhì)在諸如轉(zhuǎn)錄、翻譯、調(diào)控細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)、蛋白質(zhì)磷酸化及小分子存儲(chǔ)等過(guò)程中發(fā)揮著重要的作用;另一方面,無(wú)序蛋白質(zhì)又經(jīng)常與多種疾病聯(lián)系在一起。與人類(lèi)癌癥相關(guān)的蛋白質(zhì)中,無(wú)序蛋白質(zhì)的含量高達(dá)79%;在心血管疾病有關(guān)的蛋白質(zhì)中,無(wú)序蛋白質(zhì)的含量也高達(dá)57%。無(wú)序區(qū)是固有無(wú)序蛋白質(zhì)發(fā)揮功能的主要區(qū)域,功能位點(diǎn)大多分布在該區(qū)域,因此預(yù)測(cè)蛋白質(zhì)的無(wú)序區(qū)成為判斷蛋白質(zhì)是否無(wú)序的熱點(diǎn)問(wèn)題。Romero 等在1997年首次對(duì)蛋白質(zhì)無(wú)序區(qū)域進(jìn)行預(yù)測(cè),他們預(yù)測(cè)的準(zhǔn)確性達(dá)到70%,此后無(wú)序蛋白質(zhì)的預(yù)測(cè)方法得到了迅速發(fā)展,目前應(yīng)用于無(wú)序蛋白質(zhì)序列預(yù)測(cè)的方法已經(jīng)超過(guò)50種,并且這些預(yù)測(cè)方法的準(zhǔn)確性普遍達(dá)到85%以上。

本研究基于序列分析的方法,以DisProt數(shù)據(jù)庫(kù)中的固有無(wú)序蛋白質(zhì)為研究對(duì)象,通過(guò)CD-HIT程序?qū)?shù)據(jù)進(jìn)行去冗余處理,將處理后的數(shù)據(jù)利用編程軟件Matlab 7.0進(jìn)行統(tǒng)計(jì)而得到新的數(shù)據(jù);對(duì)新數(shù)據(jù)進(jìn)行分析,通過(guò)編程把序列的無(wú)序區(qū)和有序區(qū)分別提取出來(lái),再分析無(wú)序區(qū)和有序區(qū)氨基酸組成的偏好性。本研究有助于進(jìn)一步挖掘固有無(wú)序蛋白質(zhì)的序列特征,從而為固有無(wú)序蛋白質(zhì)的預(yù)測(cè)提供借鑒。

1數(shù)據(jù)來(lái)源及去冗余處理

1.1數(shù)據(jù)來(lái)源

本研究以固有無(wú)序蛋白質(zhì)數(shù)據(jù)庫(kù)DisProt(版本6.01)[4](http://www.disprot.org/index.php)為研究對(duì)象(發(fā)布日期為2012年10月15日),下載數(shù)據(jù)庫(kù)中最新的固有無(wú)序蛋白質(zhì)進(jìn)行研究,共有無(wú)序蛋白質(zhì)684個(gè),無(wú)序區(qū)1 513個(gè)。

1.2去冗余處理

由于蛋白質(zhì)序列數(shù)據(jù)庫(kù)中都含有大量的冗余序列,它們通常不能提供更多的信息,而且不利于數(shù)據(jù)的統(tǒng)計(jì)分析,并且由于冗余序列要占用更多的計(jì)算機(jī)存儲(chǔ)和處理資源,因此去除這些冗余信息具有很高的實(shí)用價(jià)值,不但可以減小數(shù)據(jù)庫(kù)的大小、提高序列搜索的速度,而且有助于對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析。本研究利用去冗余程序CD-HIT[5-6](http://weizhong-lab.ucsd.edu/cdhit_suite/cgi-bin/index.cgi)對(duì)數(shù)據(jù)進(jìn)行處理,將相似度閾值設(shè)為30%。結(jié)果顯示:去冗余前,固有無(wú)序蛋白質(zhì)共有684條序列;去冗余后,蛋白質(zhì)共有549條序列。

2固有無(wú)序蛋白質(zhì)無(wú)序區(qū)和有序區(qū)的氨基酸組成偏好性分析

用Matlab編程對(duì)全部序列(去冗余后)提取無(wú)序區(qū)和有序區(qū)。無(wú)序區(qū)包括112個(gè)全部無(wú)序區(qū)(如DisProtDP00001,108個(gè)氨基酸都是無(wú)序的)以及非全部無(wú)序蛋白質(zhì)(蛋白質(zhì)中含有無(wú)序片段)序列中的各條無(wú)序區(qū);無(wú)序區(qū)的氨基酸總數(shù)為64 243,約占固有無(wú)序蛋白質(zhì)氨基酸總數(shù)的28.67%。因此可以看出:固有無(wú)序蛋白質(zhì)中有序區(qū)的氨基酸數(shù)大約是無(wú)序區(qū)氨基酸數(shù)的3.5倍。結(jié)果表明,固有無(wú)序蛋白質(zhì)的氨基酸在有序區(qū)的含量要大大高于無(wú)序區(qū),即固有無(wú)序蛋白質(zhì)的大部分組分都是有序部分。

對(duì)固有無(wú)序蛋白質(zhì)中的所有無(wú)序區(qū)及有序區(qū)的氨基酸個(gè)數(shù)和含量進(jìn)行對(duì)比,以分析每種氨基酸的偏好性。通過(guò) Matlab 軟件進(jìn)行處理得到了固有無(wú)序蛋白質(zhì)中的無(wú)序區(qū)和有序區(qū)的所有氨基酸含量及差值,詳見(jiàn)表1。

3結(jié)論

本研究以DisProt數(shù)據(jù)庫(kù)中的固有無(wú)序蛋白質(zhì)為研究對(duì)象,先通過(guò)程序CD-HIT對(duì)數(shù)據(jù)進(jìn)行去冗余處理,然后利用編程軟件Matlab7.0對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)而得到新的數(shù)據(jù),再對(duì)數(shù)據(jù)進(jìn)行分析。結(jié)果表明:氨基酸Val、Ile、Leu、Phe、Trp、Asn、Tyr、His具有形成有序結(jié)構(gòu)的偏好性;氨基酸Pro、Ser、Gln、Asp、Lys具有形成無(wú)序結(jié)構(gòu)的偏好性。

無(wú)序蛋白質(zhì)具有獨(dú)特的氨基酸組成特點(diǎn),這些獨(dú)特的氨基酸序列決定了其無(wú)序的結(jié)構(gòu)。無(wú)序蛋白質(zhì)的研究將促進(jìn)人們重新認(rèn)識(shí)蛋白質(zhì)的結(jié)構(gòu)和功能關(guān)系,也將為蛋白質(zhì)的全新設(shè)計(jì)和疾病的治療提供新的思路。相信隨著研究數(shù)據(jù)的增加,對(duì)固有無(wú)序蛋白質(zhì)的研究將更深入和全面,從而能夠進(jìn)一步加深對(duì)這類(lèi)蛋白質(zhì)的認(rèn)識(shí)。

參考文獻(xiàn):

[1]Uversky V N. Natively unfolded proteins:A point where biology waits for physics[J]. Protein Science,2002,11(4):739-756.

[2]Dunker A K,Obradovic Z,Romero P,et al. Intrinsic protein disorder in complete genomes[J]. Genome Informatics,2000,11:161-171.

[3]Dunker A K,Oldfield C J,Meng J,et al. The unfoldomics decade:an update on intrinsically disordered proteins[J]. BMC Genomics,2008,9(S2):12-18

[4]Sickmeier M,Hamilton J A,LeGall T,et al. DisProt:the database of disordered proteins[J]. Nucleic Acids Research,2007,35(S1):786-793.

[5]Li W,Godzik A.Cd-hit:a fast program for clustering and comparing large sets of protein or nucleotide sequences[J]. Bioinformatics,2006,22(13):1658-1659.

[6]Li W,Jaroszewski L,Godzik A. Clustering of highly homologous sequences to reduce the size of large protein databases[J]. Bioinformatics,2001,17(3):282-283.

[7]黃永棋,劉志榮. 天然無(wú)序蛋白質(zhì):序列-結(jié)構(gòu)-功能的新關(guān)系[J]. 物理化學(xué)學(xué)報(bào)2010,26(8):2061-2072.劉思言,高瑋,夏海豐,等.

摘要:以固有無(wú)序蛋白質(zhì)為研究對(duì)象,通過(guò)CD-HIT對(duì)數(shù)據(jù)進(jìn)行去冗余處理,然后利用編程軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)而得到新的數(shù)據(jù)。對(duì)所有無(wú)序區(qū)及有序區(qū)的氨基酸含量進(jìn)行對(duì)比,認(rèn)為氨基酸Val、Ile、Leu、Phe、Trp、Asn、Tyr、His具有形成有序結(jié)構(gòu)的偏好性;氨基酸Pro、Ser、Gln、Asp、Lys具有形成無(wú)序結(jié)構(gòu)的偏好性。研究結(jié)論有助于進(jìn)一步挖掘固有無(wú)序蛋白質(zhì)的序列特征,并為固有無(wú)序蛋白質(zhì)的預(yù)測(cè)提供一些借鑒。

關(guān)鍵詞:固有無(wú)序蛋白質(zhì);功能位點(diǎn);無(wú)序區(qū);序列分析

中圖分類(lèi)號(hào): Q516 文獻(xiàn)標(biāo)志碼: A 文章編號(hào):1002-1302(2014)04-0038-02

收稿日期:2013-08-23

基金項(xiàng)目:山東省自然科學(xué)基金(編號(hào):ZR2010CQ041)。

作者簡(jiǎn)介:王紅梅(1974—),女,山東德州人,碩士,副教授,主要從事生物信息學(xué)的研究。E-mail:whm_2327@126.com。蛋白質(zhì)是生物體中最重要的兩類(lèi)大分子之一,傳統(tǒng)思想認(rèn)為蛋白質(zhì)要實(shí)現(xiàn)其生物功能,必須先折疊成一個(gè)穩(wěn)定的三維結(jié)構(gòu),因此形成了蛋白質(zhì)結(jié)構(gòu)決定其功能的主流觀點(diǎn)[1]。然而隨著基因工程方法和實(shí)驗(yàn)技術(shù)的發(fā)展以及基因組計(jì)劃的開(kāi)展,在20世紀(jì)90年代初,人們發(fā)現(xiàn)有些蛋白質(zhì)或蛋白質(zhì)序列中的一部分區(qū)域在生理?xiàng)l件下不具有一個(gè)確定的三維結(jié)構(gòu),但是依然能夠正常行使生物學(xué)功能。進(jìn)一步研究發(fā)現(xiàn)的這類(lèi)蛋白質(zhì)越來(lái)越多,并逐漸形成了一種新的蛋白質(zhì)類(lèi)型,稱(chēng)為固有無(wú)序蛋白質(zhì)(intrinsically disordered proteins,簡(jiǎn)稱(chēng)為IDPs)[1-3]。對(duì)目前存在的大量基因庫(kù)數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn):蛋白質(zhì)的無(wú)序結(jié)構(gòu)與蛋白質(zhì)功能之間關(guān)系密切,無(wú)序蛋白質(zhì)在諸如轉(zhuǎn)錄、翻譯、調(diào)控細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)、蛋白質(zhì)磷酸化及小分子存儲(chǔ)等過(guò)程中發(fā)揮著重要的作用;另一方面,無(wú)序蛋白質(zhì)又經(jīng)常與多種疾病聯(lián)系在一起。與人類(lèi)癌癥相關(guān)的蛋白質(zhì)中,無(wú)序蛋白質(zhì)的含量高達(dá)79%;在心血管疾病有關(guān)的蛋白質(zhì)中,無(wú)序蛋白質(zhì)的含量也高達(dá)57%。無(wú)序區(qū)是固有無(wú)序蛋白質(zhì)發(fā)揮功能的主要區(qū)域,功能位點(diǎn)大多分布在該區(qū)域,因此預(yù)測(cè)蛋白質(zhì)的無(wú)序區(qū)成為判斷蛋白質(zhì)是否無(wú)序的熱點(diǎn)問(wèn)題。Romero 等在1997年首次對(duì)蛋白質(zhì)無(wú)序區(qū)域進(jìn)行預(yù)測(cè),他們預(yù)測(cè)的準(zhǔn)確性達(dá)到70%,此后無(wú)序蛋白質(zhì)的預(yù)測(cè)方法得到了迅速發(fā)展,目前應(yīng)用于無(wú)序蛋白質(zhì)序列預(yù)測(cè)的方法已經(jīng)超過(guò)50種,并且這些預(yù)測(cè)方法的準(zhǔn)確性普遍達(dá)到85%以上。

本研究基于序列分析的方法,以DisProt數(shù)據(jù)庫(kù)中的固有無(wú)序蛋白質(zhì)為研究對(duì)象,通過(guò)CD-HIT程序?qū)?shù)據(jù)進(jìn)行去冗余處理,將處理后的數(shù)據(jù)利用編程軟件Matlab 7.0進(jìn)行統(tǒng)計(jì)而得到新的數(shù)據(jù);對(duì)新數(shù)據(jù)進(jìn)行分析,通過(guò)編程把序列的無(wú)序區(qū)和有序區(qū)分別提取出來(lái),再分析無(wú)序區(qū)和有序區(qū)氨基酸組成的偏好性。本研究有助于進(jìn)一步挖掘固有無(wú)序蛋白質(zhì)的序列特征,從而為固有無(wú)序蛋白質(zhì)的預(yù)測(cè)提供借鑒。

1數(shù)據(jù)來(lái)源及去冗余處理

1.1數(shù)據(jù)來(lái)源

本研究以固有無(wú)序蛋白質(zhì)數(shù)據(jù)庫(kù)DisProt(版本6.01)[4](http://www.disprot.org/index.php)為研究對(duì)象(發(fā)布日期為2012年10月15日),下載數(shù)據(jù)庫(kù)中最新的固有無(wú)序蛋白質(zhì)進(jìn)行研究,共有無(wú)序蛋白質(zhì)684個(gè),無(wú)序區(qū)1 513個(gè)。

1.2去冗余處理

由于蛋白質(zhì)序列數(shù)據(jù)庫(kù)中都含有大量的冗余序列,它們通常不能提供更多的信息,而且不利于數(shù)據(jù)的統(tǒng)計(jì)分析,并且由于冗余序列要占用更多的計(jì)算機(jī)存儲(chǔ)和處理資源,因此去除這些冗余信息具有很高的實(shí)用價(jià)值,不但可以減小數(shù)據(jù)庫(kù)的大小、提高序列搜索的速度,而且有助于對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析。本研究利用去冗余程序CD-HIT[5-6](http://weizhong-lab.ucsd.edu/cdhit_suite/cgi-bin/index.cgi)對(duì)數(shù)據(jù)進(jìn)行處理,將相似度閾值設(shè)為30%。結(jié)果顯示:去冗余前,固有無(wú)序蛋白質(zhì)共有684條序列;去冗余后,蛋白質(zhì)共有549條序列。

2固有無(wú)序蛋白質(zhì)無(wú)序區(qū)和有序區(qū)的氨基酸組成偏好性分析

用Matlab編程對(duì)全部序列(去冗余后)提取無(wú)序區(qū)和有序區(qū)。無(wú)序區(qū)包括112個(gè)全部無(wú)序區(qū)(如DisProtDP00001,108個(gè)氨基酸都是無(wú)序的)以及非全部無(wú)序蛋白質(zhì)(蛋白質(zhì)中含有無(wú)序片段)序列中的各條無(wú)序區(qū);無(wú)序區(qū)的氨基酸總數(shù)為64 243,約占固有無(wú)序蛋白質(zhì)氨基酸總數(shù)的28.67%。因此可以看出:固有無(wú)序蛋白質(zhì)中有序區(qū)的氨基酸數(shù)大約是無(wú)序區(qū)氨基酸數(shù)的3.5倍。結(jié)果表明,固有無(wú)序蛋白質(zhì)的氨基酸在有序區(qū)的含量要大大高于無(wú)序區(qū),即固有無(wú)序蛋白質(zhì)的大部分組分都是有序部分。

對(duì)固有無(wú)序蛋白質(zhì)中的所有無(wú)序區(qū)及有序區(qū)的氨基酸個(gè)數(shù)和含量進(jìn)行對(duì)比,以分析每種氨基酸的偏好性。通過(guò) Matlab 軟件進(jìn)行處理得到了固有無(wú)序蛋白質(zhì)中的無(wú)序區(qū)和有序區(qū)的所有氨基酸含量及差值,詳見(jiàn)表1。

3結(jié)論

本研究以DisProt數(shù)據(jù)庫(kù)中的固有無(wú)序蛋白質(zhì)為研究對(duì)象,先通過(guò)程序CD-HIT對(duì)數(shù)據(jù)進(jìn)行去冗余處理,然后利用編程軟件Matlab7.0對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)而得到新的數(shù)據(jù),再對(duì)數(shù)據(jù)進(jìn)行分析。結(jié)果表明:氨基酸Val、Ile、Leu、Phe、Trp、Asn、Tyr、His具有形成有序結(jié)構(gòu)的偏好性;氨基酸Pro、Ser、Gln、Asp、Lys具有形成無(wú)序結(jié)構(gòu)的偏好性。

無(wú)序蛋白質(zhì)具有獨(dú)特的氨基酸組成特點(diǎn),這些獨(dú)特的氨基酸序列決定了其無(wú)序的結(jié)構(gòu)。無(wú)序蛋白質(zhì)的研究將促進(jìn)人們重新認(rèn)識(shí)蛋白質(zhì)的結(jié)構(gòu)和功能關(guān)系,也將為蛋白質(zhì)的全新設(shè)計(jì)和疾病的治療提供新的思路。相信隨著研究數(shù)據(jù)的增加,對(duì)固有無(wú)序蛋白質(zhì)的研究將更深入和全面,從而能夠進(jìn)一步加深對(duì)這類(lèi)蛋白質(zhì)的認(rèn)識(shí)。

參考文獻(xiàn):

[1]Uversky V N. Natively unfolded proteins:A point where biology waits for physics[J]. Protein Science,2002,11(4):739-756.

[2]Dunker A K,Obradovic Z,Romero P,et al. Intrinsic protein disorder in complete genomes[J]. Genome Informatics,2000,11:161-171.

[3]Dunker A K,Oldfield C J,Meng J,et al. The unfoldomics decade:an update on intrinsically disordered proteins[J]. BMC Genomics,2008,9(S2):12-18

[4]Sickmeier M,Hamilton J A,LeGall T,et al. DisProt:the database of disordered proteins[J]. Nucleic Acids Research,2007,35(S1):786-793.

[5]Li W,Godzik A.Cd-hit:a fast program for clustering and comparing large sets of protein or nucleotide sequences[J]. Bioinformatics,2006,22(13):1658-1659.

[6]Li W,Jaroszewski L,Godzik A. Clustering of highly homologous sequences to reduce the size of large protein databases[J]. Bioinformatics,2001,17(3):282-283.

[7]黃永棋,劉志榮. 天然無(wú)序蛋白質(zhì):序列-結(jié)構(gòu)-功能的新關(guān)系[J]. 物理化學(xué)學(xué)報(bào)2010,26(8):2061-2072.劉思言,高瑋,夏海豐,等.

摘要:以固有無(wú)序蛋白質(zhì)為研究對(duì)象,通過(guò)CD-HIT對(duì)數(shù)據(jù)進(jìn)行去冗余處理,然后利用編程軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)而得到新的數(shù)據(jù)。對(duì)所有無(wú)序區(qū)及有序區(qū)的氨基酸含量進(jìn)行對(duì)比,認(rèn)為氨基酸Val、Ile、Leu、Phe、Trp、Asn、Tyr、His具有形成有序結(jié)構(gòu)的偏好性;氨基酸Pro、Ser、Gln、Asp、Lys具有形成無(wú)序結(jié)構(gòu)的偏好性。研究結(jié)論有助于進(jìn)一步挖掘固有無(wú)序蛋白質(zhì)的序列特征,并為固有無(wú)序蛋白質(zhì)的預(yù)測(cè)提供一些借鑒。

關(guān)鍵詞:固有無(wú)序蛋白質(zhì);功能位點(diǎn);無(wú)序區(qū);序列分析

中圖分類(lèi)號(hào): Q516 文獻(xiàn)標(biāo)志碼: A 文章編號(hào):1002-1302(2014)04-0038-02

收稿日期:2013-08-23

基金項(xiàng)目:山東省自然科學(xué)基金(編號(hào):ZR2010CQ041)。

作者簡(jiǎn)介:王紅梅(1974—),女,山東德州人,碩士,副教授,主要從事生物信息學(xué)的研究。E-mail:whm_2327@126.com。蛋白質(zhì)是生物體中最重要的兩類(lèi)大分子之一,傳統(tǒng)思想認(rèn)為蛋白質(zhì)要實(shí)現(xiàn)其生物功能,必須先折疊成一個(gè)穩(wěn)定的三維結(jié)構(gòu),因此形成了蛋白質(zhì)結(jié)構(gòu)決定其功能的主流觀點(diǎn)[1]。然而隨著基因工程方法和實(shí)驗(yàn)技術(shù)的發(fā)展以及基因組計(jì)劃的開(kāi)展,在20世紀(jì)90年代初,人們發(fā)現(xiàn)有些蛋白質(zhì)或蛋白質(zhì)序列中的一部分區(qū)域在生理?xiàng)l件下不具有一個(gè)確定的三維結(jié)構(gòu),但是依然能夠正常行使生物學(xué)功能。進(jìn)一步研究發(fā)現(xiàn)的這類(lèi)蛋白質(zhì)越來(lái)越多,并逐漸形成了一種新的蛋白質(zhì)類(lèi)型,稱(chēng)為固有無(wú)序蛋白質(zhì)(intrinsically disordered proteins,簡(jiǎn)稱(chēng)為IDPs)[1-3]。對(duì)目前存在的大量基因庫(kù)數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn):蛋白質(zhì)的無(wú)序結(jié)構(gòu)與蛋白質(zhì)功能之間關(guān)系密切,無(wú)序蛋白質(zhì)在諸如轉(zhuǎn)錄、翻譯、調(diào)控細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)、蛋白質(zhì)磷酸化及小分子存儲(chǔ)等過(guò)程中發(fā)揮著重要的作用;另一方面,無(wú)序蛋白質(zhì)又經(jīng)常與多種疾病聯(lián)系在一起。與人類(lèi)癌癥相關(guān)的蛋白質(zhì)中,無(wú)序蛋白質(zhì)的含量高達(dá)79%;在心血管疾病有關(guān)的蛋白質(zhì)中,無(wú)序蛋白質(zhì)的含量也高達(dá)57%。無(wú)序區(qū)是固有無(wú)序蛋白質(zhì)發(fā)揮功能的主要區(qū)域,功能位點(diǎn)大多分布在該區(qū)域,因此預(yù)測(cè)蛋白質(zhì)的無(wú)序區(qū)成為判斷蛋白質(zhì)是否無(wú)序的熱點(diǎn)問(wèn)題。Romero 等在1997年首次對(duì)蛋白質(zhì)無(wú)序區(qū)域進(jìn)行預(yù)測(cè),他們預(yù)測(cè)的準(zhǔn)確性達(dá)到70%,此后無(wú)序蛋白質(zhì)的預(yù)測(cè)方法得到了迅速發(fā)展,目前應(yīng)用于無(wú)序蛋白質(zhì)序列預(yù)測(cè)的方法已經(jīng)超過(guò)50種,并且這些預(yù)測(cè)方法的準(zhǔn)確性普遍達(dá)到85%以上。

本研究基于序列分析的方法,以DisProt數(shù)據(jù)庫(kù)中的固有無(wú)序蛋白質(zhì)為研究對(duì)象,通過(guò)CD-HIT程序?qū)?shù)據(jù)進(jìn)行去冗余處理,將處理后的數(shù)據(jù)利用編程軟件Matlab 7.0進(jìn)行統(tǒng)計(jì)而得到新的數(shù)據(jù);對(duì)新數(shù)據(jù)進(jìn)行分析,通過(guò)編程把序列的無(wú)序區(qū)和有序區(qū)分別提取出來(lái),再分析無(wú)序區(qū)和有序區(qū)氨基酸組成的偏好性。本研究有助于進(jìn)一步挖掘固有無(wú)序蛋白質(zhì)的序列特征,從而為固有無(wú)序蛋白質(zhì)的預(yù)測(cè)提供借鑒。

1數(shù)據(jù)來(lái)源及去冗余處理

1.1數(shù)據(jù)來(lái)源

本研究以固有無(wú)序蛋白質(zhì)數(shù)據(jù)庫(kù)DisProt(版本6.01)[4](http://www.disprot.org/index.php)為研究對(duì)象(發(fā)布日期為2012年10月15日),下載數(shù)據(jù)庫(kù)中最新的固有無(wú)序蛋白質(zhì)進(jìn)行研究,共有無(wú)序蛋白質(zhì)684個(gè),無(wú)序區(qū)1 513個(gè)。

1.2去冗余處理

由于蛋白質(zhì)序列數(shù)據(jù)庫(kù)中都含有大量的冗余序列,它們通常不能提供更多的信息,而且不利于數(shù)據(jù)的統(tǒng)計(jì)分析,并且由于冗余序列要占用更多的計(jì)算機(jī)存儲(chǔ)和處理資源,因此去除這些冗余信息具有很高的實(shí)用價(jià)值,不但可以減小數(shù)據(jù)庫(kù)的大小、提高序列搜索的速度,而且有助于對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析。本研究利用去冗余程序CD-HIT[5-6](http://weizhong-lab.ucsd.edu/cdhit_suite/cgi-bin/index.cgi)對(duì)數(shù)據(jù)進(jìn)行處理,將相似度閾值設(shè)為30%。結(jié)果顯示:去冗余前,固有無(wú)序蛋白質(zhì)共有684條序列;去冗余后,蛋白質(zhì)共有549條序列。

2固有無(wú)序蛋白質(zhì)無(wú)序區(qū)和有序區(qū)的氨基酸組成偏好性分析

用Matlab編程對(duì)全部序列(去冗余后)提取無(wú)序區(qū)和有序區(qū)。無(wú)序區(qū)包括112個(gè)全部無(wú)序區(qū)(如DisProtDP00001,108個(gè)氨基酸都是無(wú)序的)以及非全部無(wú)序蛋白質(zhì)(蛋白質(zhì)中含有無(wú)序片段)序列中的各條無(wú)序區(qū);無(wú)序區(qū)的氨基酸總數(shù)為64 243,約占固有無(wú)序蛋白質(zhì)氨基酸總數(shù)的28.67%。因此可以看出:固有無(wú)序蛋白質(zhì)中有序區(qū)的氨基酸數(shù)大約是無(wú)序區(qū)氨基酸數(shù)的3.5倍。結(jié)果表明,固有無(wú)序蛋白質(zhì)的氨基酸在有序區(qū)的含量要大大高于無(wú)序區(qū),即固有無(wú)序蛋白質(zhì)的大部分組分都是有序部分。

對(duì)固有無(wú)序蛋白質(zhì)中的所有無(wú)序區(qū)及有序區(qū)的氨基酸個(gè)數(shù)和含量進(jìn)行對(duì)比,以分析每種氨基酸的偏好性。通過(guò) Matlab 軟件進(jìn)行處理得到了固有無(wú)序蛋白質(zhì)中的無(wú)序區(qū)和有序區(qū)的所有氨基酸含量及差值,詳見(jiàn)表1。

3結(jié)論

本研究以DisProt數(shù)據(jù)庫(kù)中的固有無(wú)序蛋白質(zhì)為研究對(duì)象,先通過(guò)程序CD-HIT對(duì)數(shù)據(jù)進(jìn)行去冗余處理,然后利用編程軟件Matlab7.0對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)而得到新的數(shù)據(jù),再對(duì)數(shù)據(jù)進(jìn)行分析。結(jié)果表明:氨基酸Val、Ile、Leu、Phe、Trp、Asn、Tyr、His具有形成有序結(jié)構(gòu)的偏好性;氨基酸Pro、Ser、Gln、Asp、Lys具有形成無(wú)序結(jié)構(gòu)的偏好性。

無(wú)序蛋白質(zhì)具有獨(dú)特的氨基酸組成特點(diǎn),這些獨(dú)特的氨基酸序列決定了其無(wú)序的結(jié)構(gòu)。無(wú)序蛋白質(zhì)的研究將促進(jìn)人們重新認(rèn)識(shí)蛋白質(zhì)的結(jié)構(gòu)和功能關(guān)系,也將為蛋白質(zhì)的全新設(shè)計(jì)和疾病的治療提供新的思路。相信隨著研究數(shù)據(jù)的增加,對(duì)固有無(wú)序蛋白質(zhì)的研究將更深入和全面,從而能夠進(jìn)一步加深對(duì)這類(lèi)蛋白質(zhì)的認(rèn)識(shí)。

參考文獻(xiàn):

[1]Uversky V N. Natively unfolded proteins:A point where biology waits for physics[J]. Protein Science,2002,11(4):739-756.

[2]Dunker A K,Obradovic Z,Romero P,et al. Intrinsic protein disorder in complete genomes[J]. Genome Informatics,2000,11:161-171.

[3]Dunker A K,Oldfield C J,Meng J,et al. The unfoldomics decade:an update on intrinsically disordered proteins[J]. BMC Genomics,2008,9(S2):12-18

[4]Sickmeier M,Hamilton J A,LeGall T,et al. DisProt:the database of disordered proteins[J]. Nucleic Acids Research,2007,35(S1):786-793.

[5]Li W,Godzik A.Cd-hit:a fast program for clustering and comparing large sets of protein or nucleotide sequences[J]. Bioinformatics,2006,22(13):1658-1659.

[6]Li W,Jaroszewski L,Godzik A. Clustering of highly homologous sequences to reduce the size of large protein databases[J]. Bioinformatics,2001,17(3):282-283.

[7]黃永棋,劉志榮. 天然無(wú)序蛋白質(zhì):序列-結(jié)構(gòu)-功能的新關(guān)系[J]. 物理化學(xué)學(xué)報(bào)2010,26(8):2061-2072.劉思言,高瑋,夏海豐,等.

主站蜘蛛池模板: 欧美人人干| 国产欧美日韩另类精彩视频| 欧美成人a∨视频免费观看| 中文字幕自拍偷拍| 人妻无码中文字幕一区二区三区| 亚洲AV免费一区二区三区| 亚洲天堂在线免费| 国产乱子伦无码精品小说| 国产福利影院在线观看| 婷婷开心中文字幕| 免费不卡视频| 日韩无码黄色| 日本免费福利视频| 国产SUV精品一区二区| 自慰网址在线观看| 热九九精品| 国产女人18水真多毛片18精品 | 99久久精品国产精品亚洲| 91久久偷偷做嫩草影院| 国产成人精品一区二区| 欧美精品在线免费| 色偷偷一区二区三区| 国内精品一区二区在线观看| 最新痴汉在线无码AV| 婷婷亚洲天堂| 亚洲精品色AV无码看| 欧美不卡在线视频| 精品人妻系列无码专区久久| 国产精品思思热在线| 国产99精品视频| 国产在线观看一区二区三区| 激情综合婷婷丁香五月尤物| 国产亚洲精品资源在线26u| 在线a网站| 亚洲第一区在线| 视频二区欧美| 欧美日韩中文国产| 色综合久久88| 少妇精品久久久一区二区三区| 欧美亚洲中文精品三区| 国产在线拍偷自揄拍精品| 2020国产精品视频| 国产主播在线观看| 亚洲AⅤ无码日韩AV无码网站| 久久青草视频| 国产喷水视频| 亚洲精品在线影院| 亚洲欧洲自拍拍偷午夜色| 91麻豆国产视频| 亚洲精品在线91| 国产美女精品人人做人人爽| 超级碰免费视频91| 国产AV毛片| 国产视频一二三区| 国产一级特黄aa级特黄裸毛片| 色婷婷天天综合在线| 天天色综网| 免费一级全黄少妇性色生活片| 国产福利微拍精品一区二区| 国产成人精品2021欧美日韩| 欧亚日韩Av| 成人一区专区在线观看| 亚洲成年人网| 国产精品99r8在线观看| 欧美日韩一区二区在线免费观看| 日韩第九页| 动漫精品中文字幕无码| 亚洲国产清纯| 97人人模人人爽人人喊小说| 综合人妻久久一区二区精品| 国产一级二级在线观看| 亚洲无码A视频在线| 欧美精品伊人久久| AV不卡在线永久免费观看| 久久久久青草大香线综合精品| 亚洲视频a| 视频一区亚洲| 伊人色综合久久天天| 直接黄91麻豆网站| 亚洲视频影院| 国产精品99久久久| 国产成人综合日韩精品无码不卡|