999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于組合向量的支持向量機算法預測酶的類型

2021-10-22 03:24:56
天津科技 2021年10期
關鍵詞:方法

王 婷

(長治職業技術學院 山西長治046000)

0 引 言

酶是具有高效催化作用的蛋白質,生物體內幾乎所有的代謝反應都需要酶的參與,而且對于物質代謝的控制也大多通過酶的活性來實現[1]。已經證實,人類的許多疾病如蠶豆病、白化病、苯丙酮尿病等,均是由于某種酶的變異、減少甚至缺失造成的[2]。酶的類型與其功能和催化性能關系密切,因此對于新發現的酶,可以通過確定它的類型來表明其生物功能。傳統的研究酶功能的生化實驗方法不僅費時、耗資,而且可能會碰到許多目前無法解決的實際困難。因此,使用機器學習算法來預測酶類型的理論方法應用越來越廣泛[3]。

本文從酶的氨基酸序列出發,在特征參數的提取上有創新:采用矩陣打分和離散增量的方法提取,再將這些參數構成的組合向量輸入支持向量機。首次使用支持向量機算法對6類酶的類型進行預測,取得了較好的預測結果。

1 材料與方法

1.1 數據庫

本文使用的是由 Shen和 Chou等[4]創建的酶家族類數據庫。選取酶序列數據遵循以下標準:①序列長度不小于 50個殘基;②不存在一個酶同時隸屬于多種類型的情況;③酶序列的同源性小于 40%。基于以上標準,最終獲得 9832條酶序列,分為以下 6個類型:①氧化還原酶1618條;②轉移酶3450條;③水解酶2791條;④裂合酶679條;⑤異構酶518條;⑥合成酶776條。

1.2 計算方法

1.2.1 矩陣打分方法

矩陣打分(S)方法已經在轉錄因子結合位點和蛋白質折疊子的預測等方面得到成功應用[5~7]。此方法通過以下3個步驟實現:

①引入偽計數pij,位點位置概率作為矩陣元:

②建立位置權重矩陣,即標準打分矩陣:

③對給定的序列片段進行打分,將打分函數定義為:

式中:Ni表示全部氨基酸在第i個位置出現的個數;nij表示第 j種氨基酸在第i個位置上出現的個數;P0j表示第j種氨基酸出現的背景概率。

1.2.2 離散增量方法

離散增量(ID)方法已經在蛋白質結構和超家族的預測[8-9]等工作中獲得廣泛使用。

兩個 S維離散源 X(n1,n2,…,ni,…,ns)和Y(m1,m2,…mi…,ms),其中 ni和 mi分別表示酶的信息參數,定義X和Y的離散量為:

定義混合離散源 X+Y(n1+m1,n2+m2,…,ni+mi,…,ns+ ms)的離散量為:

兩個離散源X與Y之間的離散增量為:

氨基酸的化學特性親疏水性質,主要由其側鏈基團決定。根據單個氨基酸的親疏水分布,將 20種氨基酸劃分為 6 類[9]:①強親水類(R,D,E,N,Q,K,H);②強疏水類(L,I,V,A,M,F);③弱親水或弱疏水類(S,T,Y,W);④脯氨酸(P);⑤甘氨酸(G);⑥半胱氨酸(C)。

1.2.3 支持向量機算法

支持向量機(SVM)算法是在統計學習理論的基礎上發展起來的一種新的機器學習方法,它根據有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折中,以期獲得最好的推廣能力。由于具有強有力的非線性建模能力和良好的泛化性能,它能夠解決小樣本、非線性和高維數等實際問題[10]。本文使用的是Chang和Lin[11]聯合開發的Libsvm程序包。

2 結果與討論

從酶序列的N端與C端分別選取80個氨基酸殘基作為保守位點,使用矩陣打分方法得到 12個打分值;再分別將氨基酸的次鄰二聯體和親疏水三聯體出現的個數作為信息參數,使用離散增量方法得到12個離散增量值;最后將這 12個打分值和 12個離散增量值構成的組合向量,輸入支持向量機中,采用Jackknife檢驗方法進行分類預測,其預測成功率見表 1。為了比較計算結果,這里還分別采用矩陣打分方法和離散增量方法對單參數進行預測,同時也把運用相同數據庫 Chou[4]的 Jackknife檢驗結果列在了表1中。

表1 Jackknife檢驗下6類酶的預測結果(%)Tab.1 Prediction results of 6 enzymes by jackknife test(%)

從表1的計算結果可以看出,分別將氨基酸的次鄰二聯體和親疏水三聯體出現的個數作為信息參數,使用離散增量方法對酶的類型預測效果不是很好,預測成功率較低。選取酶序列的N端與C端的殘基片段打分方法的預測效果明顯好于離散增量方法,說明酶序列的N端與C端均具有較強的氨基酸位點保守性。把打分值與離散增量值進行組合,共同輸入支持向量機中進行預測,獲得了非常好的結果。Jackknife檢驗總體的預測成功率為88.86%,氧化還原酶、轉移酶、水解酶、裂合酶、異構酶和合成酶的預測成功率分別為 92.34%、86.69%、83.30%、97.20%、98.26%和97.68%,結果表明此算法對于酶的分類預測非常有效。裂合酶和異構酶的預測成功率比 Chou[4]的方法分別提高了 12.1%和 14.66%,但轉移酶和水解酶的預測成功率比Chou[4]的結果差。

本文對酶的類型進行預測,當使用組合向量作為特征參數時獲得了較好的預測結果,其主要原因是:①由于不同類型酶的N端與C端所包含的特征信號具有很強的差異性,從酶序列兩端的殘基片段提取的打分值,其包含的信息更加全面;②支持向量機算法具有很強的融合性能,可以將打分值與離散增量值恰當的融合,共同作為支持向量機的特征參數,取得了更優的預測結果。

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 日韩AV无码免费一二三区| 日韩国产一区二区三区无码| 青青草国产精品久久久久| 91网在线| 四虎国产成人免费观看| 国产成人高清精品免费5388| 99热这里只有精品久久免费| 一级毛片免费的| 97狠狠操| 99草精品视频| 日韩无码精品人妻| 特级欧美视频aaaaaa| 久夜色精品国产噜噜| 视频二区亚洲精品| 日韩毛片免费| 国产精品久久久久久久久久98| 亚洲国产日韩在线成人蜜芽 | 欧美午夜在线播放| 成人午夜亚洲影视在线观看| 99资源在线| 欧美激情首页| 国产自无码视频在线观看| 国产精品漂亮美女在线观看| 这里只有精品免费视频| 婷婷午夜影院| 午夜一级做a爰片久久毛片| 欧美午夜网| 亚洲午夜国产精品无卡| 久久久久久久97| 午夜国产在线观看| 青青青国产免费线在| 毛片国产精品完整版| 国产色图在线观看| 一级毛片免费观看久| 毛片大全免费观看| 精品国产三级在线观看| 国产精品网址在线观看你懂的| 成人免费视频一区二区三区| 国产麻豆另类AV| 亚洲人人视频| 国产美女在线观看| AV色爱天堂网| 国产亚洲高清视频| 国产屁屁影院| 91在线播放国产| 伊人狠狠丁香婷婷综合色| 特级aaaaaaaaa毛片免费视频| 久久久久亚洲AV成人网站软件| 72种姿势欧美久久久大黄蕉| 亚洲欧美另类久久久精品播放的| 国产亚洲精品自在线| 99精品视频在线观看免费播放| 青青草一区二区免费精品| 日韩激情成人| yjizz国产在线视频网| 国产成年女人特黄特色毛片免| 免费精品一区二区h| 精品成人免费自拍视频| 亚洲综合在线最大成人| 性激烈欧美三级在线播放| 日本高清免费一本在线观看| 国产在线精彩视频论坛| 成人一级黄色毛片| 精品国产成人三级在线观看| 精品一区二区三区无码视频无码| 国产男女免费完整版视频| 国产av色站网站| 欧美亚洲日韩不卡在线在线观看| 欧美一区二区三区欧美日韩亚洲| 茄子视频毛片免费观看| 成人欧美日韩| 婷婷亚洲天堂| 国产精品偷伦视频免费观看国产| 亚洲综合亚洲国产尤物| 国产在线观看91精品| 91丝袜乱伦| 2020国产免费久久精品99| a级免费视频| 国产无码精品在线播放| 一区二区在线视频免费观看| 国产久操视频| 鲁鲁鲁爽爽爽在线视频观看|