999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機的蛋白質(zhì)交互界面熱點的預(yù)測的研究與改進

2014-11-19 17:22:45王毅誠陳向煌
卷宗 2014年10期
關(guān)鍵詞:分類

王毅誠 陳向煌

1 背景

隨著人類和其他物種基因組序列測定的完成,生物信息學(xué)的研究中心逐步轉(zhuǎn)移到對蛋白質(zhì)組和功能基因組的研究。本文采用的是機器學(xué)習(xí)的方法,基于現(xiàn)有的一些研究成果,計算了6個序列特征和62個結(jié)構(gòu)特征,嘗試了支持向量機這種機器學(xué)習(xí)的方法對界面熱點進行了訓(xùn)練和預(yù)測,接下來用了主成分分析繼續(xù)優(yōu)化了這種機器學(xué)習(xí)的方法.

2 材料與方法

2.1 支持向量機方法概述

SVM是一個監(jiān)督學(xué)習(xí)的基于最大間隔的分類器。這些數(shù)據(jù)點是n維實空間中的點。我們希望能夠把這些點通過一個n-1維的超平面分開。通常這個被稱為線性分類器。但是我們還希望找到分類最佳的平面,即使得屬于兩個不同類的數(shù)據(jù)點間隔最大的那個面,該面亦稱為最大間隔超平面。如果我們能夠找到這個面,那么這個分類器就稱為最大間隔分類器。它在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合等其他機器學(xué)習(xí)問題中。

2.2 組合分類器簡介

組合分類器是一個復(fù)合模型,由多個分類器復(fù)合而成。個體分類器投票,組合分類器基于投票返回類標號預(yù)測,組合分類器往往比它的成員分類器更準確。裝袋、提升和隨機森林都是流行的組合分類方法。它旨在于創(chuàng)建一個改進的復(fù)合分類模型M,使給定的數(shù)據(jù)集D創(chuàng)建k個訓(xùn)練集,其中用于創(chuàng)建。給定一個待分類的新數(shù)據(jù)元組,每個基分類通過返回類預(yù)測投票。組合分類器基于基類分類器的投票返回預(yù)測。

組合分類器往往比它的基類分類器更準確。基類可能出錯,但當且僅當超過一半的基分類器出錯時,組合分類器才會誤分類。當模型之間存在顯著差異是,組合分類器產(chǎn)生更好的結(jié)果。也就是說,理想情況下,各個基分類器之間幾乎不相關(guān)。基分類器應(yīng)該優(yōu)于隨機猜測。

先直觀的考慮裝袋如何作為一種提高準確率的方法。給定d個元素的元組D,裝袋的過程如下。對于迭代d個元組的訓(xùn)練集采用又放回的抽樣,由原始元組集D抽取。每個訓(xùn)練集都是一個自助樣本,這樣D的某些元素可能不存在中,有的可能出現(xiàn)多次,由每個訓(xùn)練集學(xué)習(xí),得到分類模型。為了對未知元組分類,每個分類器返回它的預(yù)測類,算作一票。裝袋分類器M統(tǒng)計得票,并將得票最多的賦予類X。通過給定檢驗元組的每個預(yù)測的平均值,裝袋也可以用于連續(xù)值的預(yù)測。

2.3 組合分類器對支持向量機進行交互界面熱點預(yù)測進一步優(yōu)化

程序代碼由matlab編寫,先從excel文件中讀取訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),然后隨機選取71個訓(xùn)練數(shù)據(jù),主成分分析的參數(shù)和支持向量機的參數(shù)與之前一樣,測試過后記錄反饋的結(jié)果,如果投票次數(shù)不足則繼續(xù)選取訓(xùn)練數(shù)據(jù),然后分類,足夠的話就統(tǒng)計投票結(jié)果,與測試的答案對比輸出。

2.4 支持向量機實驗結(jié)果與討論

雖然由線性標準化的支持向量機比正太標準化的支持向量機各項參數(shù)都好,但是召回率仍未過半,其原因可能是維數(shù)過高導(dǎo)致的訓(xùn)練不足,而且特征之間極高的相關(guān)性并不適合支持向量機的表現(xiàn)。經(jīng)過主成分分析預(yù)處理優(yōu)化的效果與之前沒有用主成分分析預(yù)處理的效果提高了68%。有這種提高的原因有如下,首先是因為支持向量機比較適合一些低維度的分析,在主成分分析處理過以后的數(shù)據(jù),在貢獻保留98%的情況下仍然只有四項,數(shù)據(jù)規(guī)模縮小了將近95%但是數(shù)據(jù)的質(zhì)量減少得并不多。第二個原因是用主成分分析使變量不相關(guān)以后更加有利于在坐標軸上劃分。坐標軸上的維度理論上說是獨立的,雖然不相關(guān)從數(shù)學(xué)角度上來說是退不出獨立的,但是在實際情況下,在已經(jīng)有不相關(guān)這個條件的情況下,把數(shù)據(jù)當作是獨立的來處理通常都能獲得很不錯的效果。

對所有算法的綜合比較可以發(fā)現(xiàn)主成分分析+支持向量機+組合分類器的召回率較高,貝葉斯網(wǎng)絡(luò)在召回率不低的情況下的精確度較高。并且都已經(jīng)超過現(xiàn)有的一些傳統(tǒng)算法,結(jié)果如表2.1:

圖2.2組合分類器投票次數(shù)與F值之間的關(guān)系

所以得出的結(jié)論是在訓(xùn)練樣例充足的情況下,多次投票的支持向量機與單次沒有顯著差異。并且在投票結(jié)果有很多幾乎全票投給陰性的測試數(shù)據(jù)答案是陽性,這已經(jīng)不是支持向量機所能解決的問題了。所以再次提高準確率可能需要去的是新屬性的獲取,或者是屬性質(zhì)量的提高。F值隨著組合分類器個數(shù)的變化如圖2.2所示。

3 總結(jié)

本文開始介紹了蛋白質(zhì)-蛋白質(zhì)交互界面熱點的一些相關(guān)背景,然后用了支持向量機對蛋白質(zhì)-蛋白質(zhì)相互作用界面上的熱點進行了預(yù)測,并用主成分分析對這種機器學(xué)習(xí)算法進行了優(yōu)化,而且用組合分類器對支持向量機進行了進一步的優(yōu)化,其中用主成分分析和組合分類器優(yōu)化的支持向量機得到的結(jié)果要比傳統(tǒng)的算法更優(yōu)。

猜你喜歡
分類
2021年本刊分類總目錄
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
星星的分類
我給資源分分類
垃圾分類,你準備好了嗎
分類討論求坐標
數(shù)據(jù)分析中的分類討論
按需分類
教你一招:數(shù)的分類
主站蜘蛛池模板: 国产精品夜夜嗨视频免费视频| 性欧美在线| 狠狠干综合| 特级欧美视频aaaaaa| 91精品国产福利| 国产97视频在线| 免费在线观看av| 人妻精品久久无码区| 亚洲天堂久久| 亚洲AV无码一二区三区在线播放| 国产精品视频a| 毛片在线播放a| 久久青草精品一区二区三区| 国产精品jizz在线观看软件| 国产欧美日韩va另类在线播放| 中文字幕有乳无码| 精品免费在线视频| 亚洲最大福利网站| 狠狠色噜噜狠狠狠狠色综合久 | 国产菊爆视频在线观看| 日韩欧美国产成人| A级毛片无码久久精品免费| 91毛片网| 久久久久久久久亚洲精品| 国产欧美日韩视频怡春院| 亚洲一区色| 亚洲国产欧洲精品路线久久| 伊人久久久久久久久久| 国产一级毛片在线| 69av在线| 亚洲一区黄色| 免费人成视频在线观看网站| 国产真实乱人视频| 麻豆国产精品| 久热这里只有精品6| 亚洲精品福利视频| 亚洲一区二区三区中文字幕5566| 天天综合网站| 亚洲国产天堂久久综合226114| 91人妻在线视频| 欧美亚洲一二三区| 中文无码毛片又爽又刺激| 国产亚洲视频免费播放| 91无码网站| 日韩精品免费在线视频| 2048国产精品原创综合在线| 天堂网亚洲系列亚洲系列| 久久精品国产亚洲AV忘忧草18| 国产一级视频久久| 欧美在线网| 欧美中文字幕一区二区三区| 国产亚洲精久久久久久无码AV | 三上悠亚精品二区在线观看| 日韩国产一区二区三区无码| 国产欧美日韩va| 天天色天天操综合网| 91无码视频在线观看| 美女一级免费毛片| 国产成人亚洲毛片| 午夜性刺激在线观看免费| 97青草最新免费精品视频| 国产一区二区色淫影院| 亚洲第一天堂无码专区| 在线观看国产网址你懂的| 浮力影院国产第一页| 99精品国产自在现线观看| 亚洲精品成人片在线观看 | 亚洲精品少妇熟女| 欧美成人A视频| 亚洲欧美h| 国产日本欧美在线观看| 亚洲一区二区三区麻豆| 久久香蕉国产线| 国产传媒一区二区三区四区五区| 欧美性猛交一区二区三区| 欧美午夜一区| 9久久伊人精品综合| 免费中文字幕一级毛片| 极品av一区二区| 中文字幕人妻av一区二区| 亚洲伊人电影| 午夜毛片免费观看视频 |