999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于一種新的偽氨酸組成預(yù)測蛋白質(zhì)折疊速率

2015-04-20 03:26:50單萌萌白鳳蘭
大連交通大學(xué)學(xué)報 2015年3期
關(guān)鍵詞:方法

單萌萌,白鳳蘭

(大連交通大學(xué) 理學(xué)院,遼寧 大連 116052)

?

基于一種新的偽氨酸組成預(yù)測蛋白質(zhì)折疊速率

單萌萌,白鳳蘭

(大連交通大學(xué) 理學(xué)院,遼寧 大連 116052)

以chou等人提出的偽氨酸組成方法為基礎(chǔ),從蛋白質(zhì)序列的氨基酸組成信息和順序信息著手,提出一種新的偽氨酸組成方法,即利用新偽氨酸序列的自相關(guān)函數(shù)、氨基酸的平均中程接觸和氨基酸頻率構(gòu)造了23維向量來描述蛋白質(zhì)序列,進而建立多元線性回歸函數(shù)對蛋白質(zhì)折疊速率進行預(yù)測,經(jīng)jackknife檢驗相關(guān)系數(shù)達到了0.84.并與其他兩種方法進行比較使本文的結(jié)論得到較好的驗證. 同時驗證了本文提取的特征參數(shù)對蛋白質(zhì)折疊速率有一定的影響.

蛋白質(zhì)折疊;偽氨酸;線性回歸函數(shù)

0 引言

蛋白質(zhì)折疊問題的研究是計算分子生物學(xué)和生物信息學(xué)中的重要內(nèi)容,對于理解蛋白質(zhì)的折疊機理和分析蛋白質(zhì)折疊的決定性因素來說,能夠精確的預(yù)測出蛋白質(zhì)的折疊速率就顯得非常重要,只有當(dāng)?shù)鞍踪|(zhì)折疊成正確的具有三維結(jié)構(gòu)的天然構(gòu)象時才能發(fā)揮其正確的物理屬性.盡管蛋白質(zhì)的總體結(jié)構(gòu)非常復(fù)雜,但是在化學(xué)上它們都是由20種天然氨基酸按照特定的順序并且通過肽鍵連接而成的具有有限長度的多肽鏈.蛋白質(zhì)之間最根本的差別就在于其組成多肽鏈的氨基酸序列和長度有所不同.從不同生物體中發(fā)現(xiàn)的氨基酸已有180多種,但是參與蛋白質(zhì)組成的常見的氨基酸只有 20 種,即常見的天然氨基酸.近年來,許多科學(xué)家開始從蛋白質(zhì)氨基酸序列著手預(yù)測蛋白質(zhì)折疊速率,chou等人提出了經(jīng)典的偽氨酸組成方法[1]來描述蛋白質(zhì)序列的順序信息.本文在chou等人工作的基礎(chǔ)上,從氨基酸的順序信息和組成信息著手,提出一種新的偽氨酸組成方法,即利用偽氨酸序列的自相關(guān)函數(shù)、氨基酸的平均中程接觸等特征參數(shù)構(gòu)造空間向量來描述蛋白質(zhì)序列,進而建立多元線性回歸函數(shù)對蛋白質(zhì)折疊速率進行預(yù)測.

1 材料

從Guo[3-4]、Xing[5]、Cheng[6]等大量文章中選取已知實驗折疊速率的89個蛋白質(zhì),去掉重復(fù)蛋白和文章標(biāo)識長度與蛋白質(zhì)數(shù)據(jù)庫長度不符的蛋白質(zhì),最終得到65個蛋白質(zhì),其中36個二肽蛋白,29個多肽蛋白,氨基酸序列信息均從數(shù)據(jù)庫(http://www.rcsb.org/pdb/home/home.do)中獲得.

2 原理和方法

2.1 偽氨酸組成

對于蛋白質(zhì)序列S=s1s2…sL

其中氨基酸si∈ψ(i=1,2,…,20),ψ={A,W,C,D,E,F,G,H,I,Y,K,L,M,N,V,P,Q,R,S,T},考慮其在序列S中的位置,

其中,l代表氨基酸殘基在序列Sw中所在的位置,l∈[1,L].

這樣,我們把蛋白質(zhì)序列S轉(zhuǎn)換成20維的特征向量,表示為:

V(S)=(V1,V2,…,V20)

新的偽氨酸組成定義如下:

其中:

其中,spi(i=1,2,3,…,L)表示氨基酸極性值,氨基酸極性索引值如表1.

2.2 蛋白質(zhì)的平均屬性

對于蛋白質(zhì)序列S=s1s2…sL

其平均屬性定義如下:

其中,qi為第i氨基酸的某個物理化學(xué)性質(zhì),N為氨基酸殘基的個數(shù).

本文取氨基酸的平均中程接觸Nm,其索引值見表1.

2.3 實驗結(jié)果分析

為確定λ的取值,我們分別取λ從1~30從而得到30個向量φ1=(R1),φ2=(R1,R2),……,φ30=(R1,R2,…,R30),依次加入到特征向量V(S)中,得到向量(V(S),φ1), (V(S),φ2),……,(V(S),φ30),進行30次試驗,結(jié)果見圖1.

圖1 階數(shù)λ對預(yù)測結(jié)果的影響

由圖1可以看出,當(dāng)λ取2時相關(guān)系數(shù)達到0.82,固選取λ值為2.

由以上偽氨酸的組成方法使原來的蛋白質(zhì)序列S=s1s2…sL變成新序列F=F1F2…F22.

在建序列F的基礎(chǔ)上添加向量Veve,得到23維向量Vlast=(F,Veve),建立關(guān)于折疊速率與Vlast的多遠(yuǎn)線性回歸函數(shù):

利用式(6)計算了36個二肽蛋白和29個多肽蛋白的折疊速率預(yù)測值,并對預(yù)測值進行jackknife檢驗.回歸分析及jackknife檢驗結(jié)果見表2,預(yù)測值與實驗值散點圖見圖2.

表2 相關(guān)系數(shù)r和p值

由表2結(jié)果可知對于二肽蛋白,jackknife檢驗相關(guān)系數(shù)為0.48,p≤0.05,對于多肽蛋白,jackknife檢驗相關(guān)系數(shù)僅為0.30,且p≥0.05,由圖2也可以看出二肽蛋白質(zhì)的實驗值與預(yù)測值具有較顯著的線性關(guān)系,多肽蛋白質(zhì)的實驗值與預(yù)測值的線性關(guān)系不顯著,但是二肽和多肽混合蛋白質(zhì)的實驗值與預(yù)測值的線性關(guān)系顯著,jackknife檢驗相關(guān)系數(shù)達到0.84,p≤0.05.

圖2 預(yù)測值與實驗值散點圖注:□為二肽蛋白○為多肽蛋白

本文所提出的偽氨酸構(gòu)造方法預(yù)測蛋白質(zhì)折疊速率具有一定的可行性,由對多肽蛋白質(zhì)檢驗結(jié)果的p值可以推測更試用于二肽蛋白.

3 與其他方法對比

本文方法和其他兩種方法進行比較結(jié)果見表3(由jackknife檢驗得到).

表3 相關(guān)系數(shù)、p值、F值、標(biāo)準(zhǔn)誤差

注:方法Fold-rate來源于網(wǎng)站http://www.csbio.sjtu.edu.dn/bioinf/FoldingRate/;方法CI來源于網(wǎng)站http://sdbi.sdut.edu.cn/FDserver.

觀察表3可得,本文方法通過jackknife得到的相關(guān)系數(shù)r和F均大于其他兩種方法,而P值和標(biāo)準(zhǔn)誤差σ均小于其他兩種方法,這說明本文的方法優(yōu)于其他兩種方法,由此可以推測蛋白質(zhì)序列中氨基酸的物化屬性及位置信息對蛋白折疊有一定的影響.

4 結(jié)論

本文主要從蛋白質(zhì)的一級結(jié)構(gòu)出發(fā),以chou等人提出的偽氨酸組成方法為基礎(chǔ),從蛋白質(zhì)序列中氨基酸的順序信息和組成信息著手,提出一種新的偽氨酸組成方法,即利用新偽氨酸序列的自相關(guān)函數(shù)、氨基酸的平均中程接觸構(gòu)造了23維向量來描述蛋白質(zhì)序列,進而建立多元線性回歸函數(shù)對蛋白質(zhì)折疊速率進行預(yù)測,通過散點圖的描述可以直觀看出通過預(yù)測方程所得預(yù)測值與實驗值具有顯著的線性關(guān)系.本文選擇應(yīng)用jackknife檢驗方法對預(yù)測模型的可行性進行檢驗,結(jié)果顯示二肽蛋白相關(guān)系數(shù)為0.48,多肽蛋白相關(guān)系數(shù)為0.30,全部蛋白相關(guān)系數(shù)達到0.84,并與其他兩種方法進行比較使本文的結(jié)論得到較好的驗證.但是本文方法的不足之處在于對于多肽蛋白沒有通過jackknife檢驗(p≥0.05),說明本文所選取的特征參數(shù)對于多肽蛋白質(zhì)折疊速率影響不大.尋找對多肽蛋白質(zhì)折疊速率有影響的特征參數(shù)值得進一步去研究.

[1]CHOUK.Predictionofproteincellularattributesusingpesudo-aminoacidcomposition[J].Proteins,2001,43: 246-255.

[2]GROMIHAMM,THANGAKANIAM,SELVARAJS.FOLD-RATE:predictionofproteinfoldingratesfromaminoacidsequence[J].NucleicAcidsResearch,2006,34(suppl2):70-74.

[3]GUOJianxiu,RAONini,XUShanglei,etal.Predictingproteinfoldingratesusingpseudoaminoacidcomposition[J].BioinformaticsandBiomedicalEngineering,2010(1):1-4.

[4]GUOJIANIU,ZHANGHY.Directcorrelationbetweenprotein’foldingratesandtheiraminoacidcompositions:anabinitiofoldingratepredition[J].Proteins,2006,65(2):362-372.

[5]邢達杰,褚綺,林廣周,等.從序列預(yù)測蛋白質(zhì)折疊速率[J].天津理工大學(xué)學(xué)報,2008,24(6):18-21.

[6]CHENGXIANG,XIAOXUAN,WUZHICHENG,etal.SWFoldRate:Predictingfoldingratesfromaminoacidsequnencewithsliding[J].Proteins,2012,81(1):140-148.

Prediction of Protein Folding Rates based on new Pseudo-Acid Composition

SHAN Mengmeng,BAI Fenglan

(School of Mathematics and Physics,Dalian Jiaotong University,Dalian 116028,China)

Based on Pseudo-acid composition,by chou a new pseudo-acid composition is proposed from the amino acid composition information and the order of the protein sequence.Combining the autocorrelation function with the Nm and frequency of amino acids,23-dimensional vector is constructed,and a protein sequence can be described by the 23-dimensional vector and to create multiple linear regression function to predicte protein folding rate.By jackknife test,the correlation coefficient is 0.84.Comparison proves that the new method is batter than the other two methods.

predicte protein folding rate;Pseudo-acid;linear regression function

1673-9590(2015)03-0113-03

2014-05-20

單萌萌(1989-),女,碩士研究生;白鳳蘭(1963-),女,教授,博士,主要從事蛋白質(zhì)折疊速率預(yù)測方面的研究E-mail:liaimeng214@126.com.

A

猜你喜歡
方法
中醫(yī)特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數(shù)學(xué)教學(xué)改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學(xué)反應(yīng)多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學(xué)習(xí)方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲国产精品人久久电影| 青青操视频免费观看| 欧美色视频网站| 日韩AV无码一区| 亚洲有无码中文网| 日韩成人在线视频| 国产精品粉嫩| 国产极品嫩模在线观看91| 亚洲av片在线免费观看| 九九九九热精品视频| 一区二区三区四区精品视频| 久久精品91麻豆| 亚洲第一黄片大全| 内射人妻无套中出无码| 亚洲国产理论片在线播放| 欧美精品一区二区三区中文字幕| 国产在线自乱拍播放| 国产精品第页| 国产欧美中文字幕| 色婷婷综合激情视频免费看| 亚洲成人黄色在线| 欧美69视频在线| 91青青草视频| www中文字幕在线观看| 国产欧美日韩专区发布| 久久综合干| 欧美午夜在线播放| 免费看黄片一区二区三区| 国产精品区视频中文字幕| 精品免费在线视频| 亚洲中文制服丝袜欧美精品| 视频一区视频二区中文精品| 国产99视频免费精品是看6| 国产福利一区在线| 精品国产aⅴ一区二区三区| 91无码人妻精品一区| 99久久国产综合精品2020| 四虎在线高清无码| 精品国产污污免费网站| 日韩精品高清自在线| 国产无码高清视频不卡| 免费不卡在线观看av| 亚洲日本一本dvd高清| 自偷自拍三级全三级视频| 久久综合国产乱子免费| av在线手机播放| 国产精品网址你懂的| 欧美成人免费一区在线播放| 欧美综合在线观看| 国产一区二区色淫影院| 国产成人一区| 中国毛片网| 亚洲国产成人精品一二区| 四虎永久在线视频| 91精品免费高清在线| 波多野结衣二区| 国产AV无码专区亚洲精品网站| www.亚洲一区| 亚洲无卡视频| 香蕉99国内自产自拍视频| 国产资源免费观看| 亚洲一区精品视频在线| 麻豆精选在线| 最新国产成人剧情在线播放| 亚洲精品无码AV电影在线播放| 国产三级国产精品国产普男人| 久久久久人妻一区精品| 亚洲国产综合自在线另类| A级毛片无码久久精品免费| 99人体免费视频| 玖玖精品在线| 欧美一级特黄aaaaaa在线看片| 玖玖精品在线| 亚洲人成网站色7799在线播放| 无码高潮喷水在线观看| 999国产精品永久免费视频精品久久| 国产综合精品日本亚洲777| 国产成人久视频免费| 国产91蝌蚪窝| 亚洲精品第五页| 欧美一级专区免费大片| 天天综合天天综合|