999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)方法研究

2012-12-19 08:54:14渤海大學(xué)數(shù)理學(xué)院數(shù)學(xué)系
河南科技 2012年18期
關(guān)鍵詞:分類方法

渤海大學(xué) 數(shù)理學(xué)院 數(shù)學(xué)系 王 宇

蛋白質(zhì)結(jié)構(gòu)類的概念最初是由Levitt 和Chothia 在1976年提出的,他們根據(jù)蛋白質(zhì)序列中二級(jí)結(jié)構(gòu)片段的排列和拓?fù)浣Y(jié)構(gòu)的不同,將蛋白質(zhì)序列分為4 個(gè)主要的類:一是all-α類,序列中主要包含α螺旋;二是all-β類,序列中主要包含β折疊;三是α/β類,序列中α螺旋和β折疊交替出現(xiàn),而且β折疊是平行結(jié)構(gòu);四是α+β類,序列中α螺旋和β折疊被大距離地分開(kāi),而且β折疊是反平行結(jié)構(gòu)。自此以后,蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)得到了廣泛發(fā)展。

目前,多數(shù)預(yù)測(cè)方式是基于蛋白質(zhì)的一級(jí)結(jié)構(gòu)序列——氨基酸序列來(lái)進(jìn)行預(yù)測(cè),主要是用氨基酸組成來(lái)表示蛋白質(zhì)序列,無(wú)法反映蛋白質(zhì)的其他信息。本文,筆者提出了一種新的基于氨基酸的12 種重要的物理化學(xué)性質(zhì)和氨基酸的17 種分類的蛋白質(zhì)序列表示方法,以及氨基酸在蛋白質(zhì)序列中出現(xiàn)的位置來(lái)構(gòu)造特征向量,然后利用貝葉斯決策作為分類工具,對(duì)同源性不超過(guò)25%的包含640 個(gè)蛋白質(zhì)的數(shù)據(jù)集進(jìn)行結(jié)構(gòu)類型預(yù)測(cè)。

基于氨基酸在蛋白質(zhì)序列中出現(xiàn)的位置和氨基酸的12 種重要的物理化學(xué)性質(zhì),以及氨基酸的17 種分類,構(gòu)造出77-D特征向量來(lái)表示蛋白質(zhì)序列,然后借助于貝葉斯決策對(duì)于同源性不超過(guò)25%的數(shù)據(jù)集進(jìn)行蛋白質(zhì)結(jié)構(gòu)類型的預(yù)測(cè)研究,正確率達(dá)到 81.24%。

一、蛋白質(zhì)的向量表示

1.提取氨基酸位置記數(shù)矩陣的不變量。對(duì)于任一氨基酸序列,要在蛋白質(zhì)序列中考察某個(gè)氨基酸,當(dāng)遇到該氨基酸時(shí)就需要對(duì)其在蛋白質(zhì)序列中出現(xiàn)的位置進(jìn)行計(jì)數(shù),從而得到一個(gè)計(jì)數(shù)序列。對(duì)于某氨基酸序列:GKGDPKKPRGKMSSYAFFVQTSREEHKKKH,以K 為例,位置計(jì)數(shù)序列pk=(2,6,7,11,27,28,29)。對(duì)于蛋白質(zhì)序列中每一個(gè)氨基酸都這樣操作,從而一個(gè)蛋白質(zhì)序列本質(zhì)上就可以對(duì)應(yīng)19 個(gè)計(jì)數(shù)序列。對(duì)每個(gè)氨基酸的計(jì)數(shù)序列,建立一個(gè)矩陣,其元素aij=|pjpi|。這樣得到的矩陣是一個(gè)實(shí)對(duì)稱的矩陣,通常稱為線性矩陣。這樣得到的19 個(gè)矩陣能反映序列中氨基酸前后的相關(guān)性。有了矩陣,就可以從中提取不變量,這里選用矩陣的最大特征值作為序列不變量。相應(yīng)于19 個(gè)的最大特征值就可以構(gòu)造一個(gè)19 維的向量。該氨基酸序列中,字母K 的線性矩陣見(jiàn)表1。

表1 字母K 的線性矩陣

2.基于氨基酸的12 種重要性質(zhì)的(0.1)序列構(gòu)造的向量。氨基酸是蛋白質(zhì)的基本組成單位,其自身的特性必然會(huì)對(duì)蛋白質(zhì)產(chǎn)生重要的影響。表2給出了20 種氨基酸的12 種重要性質(zhì)。

表2 20 種氨基酸的12 種重要性質(zhì)

對(duì)于一條長(zhǎng)為n的蛋白質(zhì)序列S=x1,x2,…,xn,根據(jù)氨基酸間的先后位置和以上12 種性質(zhì)可以定義12 個(gè)映射(φ1,…,φ12),得到12 條(0,1)序列 (l1,l2,…,l12),構(gòu)造如下映射。

式(1)中,若Sk(xi)>Sk(xi+1),φk(xi)=0;反之,φk(xi)=1。特別的,當(dāng)i=n時(shí),φ(xn)=1;Sk為第K種性質(zhì)(k=1,2,…,12),xi為蛋白質(zhì)序列中的氨基酸。對(duì)于每條(0,1)序列,計(jì)算其LZ 復(fù)雜度及反LZ 復(fù)雜度,這樣每條氨基酸序列就會(huì)有24 個(gè)特征向量。

3.基于17 個(gè)不同分類模型構(gòu)造的向量。后34 維是基于20種氨基酸的17 個(gè)不同分類模型,結(jié)合生物信息學(xué)中LZ 復(fù)雜度和相對(duì)熵的相關(guān)理論構(gòu)造而成的34 維特征向量V,表示如下。

式(3)中,fk(k=1,2,…,19)表示位置矩陣的最大特征值,pk(k=20,21…,43)表示蛋白質(zhì)序列轉(zhuǎn)化成(0,1)序列的LZ 復(fù)雜度和反LZ 復(fù)雜度,mk(k=44,45,…,47)表示由17 種分類得出的34-D 向量,w1,w2和w3為權(quán)重系數(shù)。依據(jù)上述方法可將這640 條長(zhǎng)度不同的氨基酸序列轉(zhuǎn)化成640 個(gè)34-D 向量。

二、方法和數(shù)據(jù)

貝葉斯統(tǒng)計(jì)理論是貝葉斯在1763年創(chuàng)立的,是將歸納推論法用于概率論基礎(chǔ)理論實(shí)現(xiàn)的。貝葉斯統(tǒng)計(jì)理論方法是統(tǒng)計(jì)模型決策中的一個(gè)基本方法,其基本思想為:根據(jù)已知類條件概率密度參數(shù)表達(dá)式和先驗(yàn)概率,利用貝葉斯公式轉(zhuǎn)換成后驗(yàn)概率,根據(jù)后驗(yàn)概率大小進(jìn)行決策分類。

據(jù)此,對(duì)于給定的一個(gè)未知類別樣本,可先計(jì)算出其屬于每類的概率,然后選擇概率中最大的那個(gè)值所對(duì)應(yīng)的類別作為這個(gè)未知類別樣本的類別。對(duì)all-α類的138 個(gè)向量、all-β的154 個(gè)向量、α/β的177 個(gè)向量、α+β的171 個(gè)向量分別平均分成5 份,然后依次以這5 份中的一份作為測(cè)試集,其余作為訓(xùn)練集。這樣分5 次算出預(yù)測(cè)的結(jié)果,然后再取平均值,這個(gè)平均值作為這次的最后結(jié)果。基于上述的分類方法,隨機(jī)做20次試驗(yàn),試驗(yàn)的準(zhǔn)確度見(jiàn)表3。同時(shí),將該方法與其他其他方法進(jìn)行了比較,比較結(jié)果見(jiàn)表4。

表3 隨機(jī)20 次試驗(yàn)的準(zhǔn)確度

表4 多種方法預(yù)測(cè)準(zhǔn)確度的比較

對(duì)于方法2,3,4,在all-α類上差距比較大;在all-β類上的精度比方法2,3,4 高出很多;在α/β類上與方法(2)比較接近,與方法3,4 分別相差2.63%,3.74%;在α+β類精度上比法2,3,4 分別高出8.62%,3.92%,1.05%。在總精度上我們比法2 高出0.44%,與法2,3 相差1.86%,2.20%。與方法5,6,7,8,9,10,11 相比,除了方法比9,11 的all-α類上略低了一點(diǎn),其余無(wú)論是在總精度,還是在各個(gè)分類的精度都有較大挺高。

猜你喜歡
分類方法
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
學(xué)習(xí)方法
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
給塑料分分類吧
主站蜘蛛池模板: 国产精品成人第一区| 久久免费视频播放| 有专无码视频| 99一级毛片| 激情网址在线观看| 国产一在线| 蜜臀AV在线播放| 亚洲福利一区二区三区| 成人一级免费视频| 看av免费毛片手机播放| 深夜福利视频一区二区| 国产成年女人特黄特色毛片免| 国产黄色免费看| 欧美中文字幕在线视频| 精品国产网站| 精品无码人妻一区二区| 国产偷国产偷在线高清| 国产免费黄| 成人在线不卡视频| 国产精品成人免费视频99| 日韩精品资源| 在线毛片网站| 成人午夜视频免费看欧美| 亚洲欧美日韩成人在线| 亚洲日本中文字幕天堂网| 中文字幕亚洲综久久2021| 自偷自拍三级全三级视频| 伊人久久福利中文字幕| 99热这里只有精品免费| 亚洲色图欧美视频| 四虎AV麻豆| 亚洲区视频在线观看| 91福利免费视频| 亚洲一道AV无码午夜福利| 精品无码日韩国产不卡av| 亚洲欧美成人综合| 国产精品视频a| 亚洲无码免费黄色网址| 亚洲欧美另类久久久精品播放的| 国产十八禁在线观看免费| 亚洲日韩图片专区第1页| 久久久久久尹人网香蕉| 天天做天天爱夜夜爽毛片毛片| 中文字幕 91| 国内精品伊人久久久久7777人| www.国产福利| 国产免费人成视频网| 国产精女同一区二区三区久| 久久99国产综合精品1| 99re精彩视频| 亚洲一区波多野结衣二区三区| 亚洲色图在线观看| 日本在线亚洲| 亚洲日韩精品综合在线一区二区| 女人av社区男人的天堂| 青青热久麻豆精品视频在线观看| 在线观看的黄网| 欧美性久久久久| 综合五月天网| 动漫精品啪啪一区二区三区| 久久精品欧美一区二区| 亚洲首页在线观看| 精品色综合| 欧美国产综合色视频| 亚洲第一网站男人都懂| 欧美三级视频在线播放| 免费无码AV片在线观看国产| 国产一级精品毛片基地| 欧美一级黄色影院| 欧美激情首页| 一区二区三区高清视频国产女人| 日本午夜在线视频| 亚洲午夜天堂| 欧美区国产区| 91探花在线观看国产最新| 无码人中文字幕| 97在线公开视频| 又大又硬又爽免费视频| 波多野结衣一级毛片| 日本中文字幕久久网站| 欧美性猛交一区二区三区 | 在线免费看片a|