999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于序列功能注釋的蛋白質相互作用預測方法研究

2015-04-29 20:19:23陳霞陳浩文
安徽農業科學 2015年28期

陳霞 陳浩文

摘要蛋白質-蛋白質相互作用(PPI)是大多數細胞過程和生物功能的基礎。該研究基于蛋白質功能注釋方法(FNM)首次提出了結合蛋白的重要性的方法、結構域相互作用、基因本體論注釋序列和注釋;然后融合不同的策略,分別建立了3種方法結合的蛋白質序列特征與FNM功能注釋功能。利用蛋白質相互作用預測構建蛋白質相互作用網絡是進一步理解蛋白質功能的必要前提,也是理解細胞新陳代謝及復雜疾病形成發生的基礎和關鍵。

關鍵詞蛋白質相互作用;多源信息融合;功能預測;本體注釋

中圖分類號S126文獻標識碼

A文章編號0517-6611(2015)28-352-02

Sequence and Functional Annotationsbased Prediction of Proteinprotein Interactions

CHEN XiaCHEN Haowen2*(1.Changsha Aeronautical Vocational and Technical College,Changsha,Hunan410124; 2.School of Information Science and Engineering,Hunan University,Changsha,Hunan 410082)

AbstractProtein protein interaction (PPI) is the basis of most cellular processes and biological functions.This paper first proposed the method of binding proteins by protein functional annotation method (FNM) for the first time.And then,three methods of combining the characteristics of protein sequences and the function of FNM were established.Prediction of proteinprotein interaction network is a necessary prerequisite for understanding the function of proteins,which is the basis and key to understand the formation of cell metabolism and complex diseases.

Key wordsProtein interaction; Multisource information fusion; Functional prediction; Ontology annotation

研究人員可以從實驗檢測方法或者計算生物學2個角度研究蛋白質的相互作用。盡管生物實驗檢測方法可以得到大量的PPI數據,但這些實驗方法的成本昂貴,并且實驗所導致的高假陽性等缺陷使得它們不能作為標準使用。而計算生物學方法具有低成本、效率高等優點,從而被研究人員廣泛關注,該方法可以通過分析大規模數據來分析PPI網絡隨時間變化的特性。

2001年Bock等[1]首先提出利用支持向量機預測蛋白質相互作用方法,該方法僅依靠蛋白質序列本身的數據即可以預測其相互作用,隨后更多的研究者也提出了基于序列保守型的改進方法。但是隨著數據的不斷增加,新預測的蛋白質相互作用中存在大量的假陽性數據,因此,一些基于文本挖掘、蛋白質空間結構、基因功能注釋等多源信息的方法相繼被提出[2-3]。

1基于蛋白質序列信息及本體注釋信息融合的預測方法

單獨利用某一種信息可能難以獲得最優的效果,而將多種互補的信息融合能最大限度地預測蛋白質相互作用網絡[4-6]。該研究綜合利用蛋白質序列信息、結構信息、基因本體注釋以及序列注釋等,預測蛋白質相互作用。

圖1顯示了該研究融合策略方法的研究框架。從圖1可看出,該方法融合了4種類型的先驗知識如蛋白質重要性、域相互作用、基因及序列的本體注釋。融合策略方法基于一個重要假設即蛋白質序列信息與其他信息(基因本體注釋信息等)是互補的。根據不同的融合策略,該研究設計了多種蛋白質預測方法。該研究中蛋白質序列信息采用CT方法[9]獲取,以下分別詳細介紹4種功能注釋方法及3種融合策略。

1.1蛋白質功能注釋方法

為了從基因功能等角度獲取蛋白質相關的先驗信息以彌補蛋白質序列信息的局限性,以下采用了4種功能注釋方法:

(1)重要程度。考慮到蛋白質對某個組織器官的作用,每個蛋白質可以被劃分為重要的或者不重要的。利用公式(1)的編碼方案可以將該信息描述為一個1維向量:

fEP=vEP=當2個蛋白質都重要時

只有1個蛋白質重要時0,其他T1(1)

(2)蛋白質域相互作用。蛋白質域是蛋白質序列的一部分,是蛋白質結構的子單元及進化模塊,它們一定程度上決定了蛋白質的功能。利用公式(2)將其編碼為一個1維向量:

fDDI=vDDI=如果存在DDI

0,否則T1(2)

(3)基因本體注釋。基因本體由3個部分組成,描述了生物過程、分子功能以及細胞組成等知識。該研究采用Resnik度量[7]。從公式(3)可以看出,這里需要使用一個3維向量用于描述2個蛋白質之間的基因注釋相似性。

fGO=[gosim_bp(pp2),gosim_mf(pp2),gosim_cc(pp2)]T3 (3)

(4)序列注釋。基于蛋白質序列自身的多個角度特征,如空間結構、功能性質等,39個不同特征如激活位點、beta折疊、結合位點等被用于注釋蛋白質序列。利用方差分析進一步驗證這些特征是否與蛋白質相互作用相關,最終選出26個特征用于分析:

fSN=[v…,vi,…,v26]T26 (4)

1.2注釋信息融合

為了驗證該研究中4種注釋的先驗知識有效性,利用公式(5)將每個蛋白質表示為31維的向量,該注釋信息的融合被稱為FNM:

fFNM=[fEP,fDDI,fGO,fSN]T31(5)

1.3序列信息及注釋信息融合

該研究將利用3種融合模型以集成序列信息及先驗注釋信息。第一種融合策略JFM利用公式(6)將2類特征融合為一個特征;而第二種策略ELM是利用2個基分類器構成集成學習模型,其中一個分類器利用CT方法提取的序列信息,一個分類器用于學習注釋信息,如公式(7)所示;第三種融合策略WELM引入了一個權重因子,通過調節參數p以獲得最大的預測準確度,如公式(8)所示。

fJFM=[fCT,fEP,fDDI,fGO,fSN]T717(6)

dec_ELM=0.5×dec_CT+0.5×dec_FNM(7)

dec_WELM=(maxp×dec_CT+(1-maxp)×dec-FNM)where maxp=arg maxp∈[0,1](accuracy)(8)

2數據集及評價指標

2.1數據集

采用了2種規模的數據集用于評估該研究改進方法(融合策略方法)的性能。第一個數據集是GUO數據集[8],該數據集是已經存在的。該研究從多個數據集中收集蛋白質相互作用而構建了第二個數據集。前者僅僅包含酵母菌數據,而后者同時包含了酵母菌數據和人類數據,利用數據預處理方法最終得到5 594個蛋白質相互作用數據集。

2.2評價指標

以下采用準確度(ACC),敏感度(SN)、陽性精確度(PE)以及Matthews 關聯系數(MCC)評價該研究中的融合策略方法,如以公式(8)~(11)所示。同時,利用ROC曲線直觀描述。

ACC=TP+TNTP+FP+TN+FN(8)

SN=TPTP+FN (9)

PE=TPTP+FP (10)

MCC=

TP×TN-FP×FN(TP+FN)×(TN+FP)×(TP+FP)×(TN+FN) (11)

式中,TP表示真陽性;FP表示假陽性;TN表示真陰性;FN表示假陰性。

3結果與分析

表2中列出了6個基于序列信息的方法以及該研究提出的4個策略(FNM、JFM、ELM以及WELM)分別在GUO數據集上的試驗結果。前6個方法中CT方法具有最好的性能。因此,該研究后續的融合過程中選擇采用該方法的信息作為序列特征。FNM由于只包含了31維的特征,從而導致信息不足,但是它的計算復雜度較小。而同時融合了注釋信息以及序列信息的JFM、ELM以及WELM大大提高了性能。圖2是所有方法的ROC曲線性能圖。如圖2所示,同時融合序列信息以及注釋信息的3個方法的性能最優,并且這種優勢貫穿所有FP上。這現象表明該研究改進的基于序列功能注釋的蛋白質相互作用預測方法的假陽性和假陰性都得以降低,從而提高了真陽性和真陰性。

4結語

該研究詳細闡述了一種基于融合信息的蛋白質相互作用預測方法,該方法利用序列信息和功能注釋信息的互補性,設計不同的融合方案,然后在不同數據集上進行了試驗比較。試驗結果從多個準則上驗證了該研究改進的融合策略方法具有較好的泛化能力,且假陽性率較低。

參考文獻

[1] BOCK J R,GOUGH D A.Predicting protein-protein interactions from primary structure[J].Bioinformatics,20017(5):455-460.

[2] BUI Q C,KATRENKO S,SLOOT P M A.A hybrid approach to extract protein-protein interactions[J].Bioinformatics,20127(2):259-265.

[3] ZHANG Y,LIN H,YANG Z,et al.Hash subgraph pairwise kernel for protein-protein interaction extraction[J].IEEE/ACM transactions on computational biology and bioinformatics (TCBB),2019(4):1190-1202.

[4] SCHAEFER M H,LOPES T J S,MAH N,et al.Adding protein context to the human protein-protein interaction network to reveal meaningful interactions[J].PLoS Comput Biol,2013,9(1):1002860.

[5] CHEN G,LI J,WANG J.Evaluation of gene ontology semantic similarities on protein interaction datasets[J].International journal of bioinformatics research and applications,2013,9(2):173-183.

[6] XENARIOS I,SALW NSKI L,DUAN X J,et al.The database of interacting proteins:A research tool for studying cellular networks of protein interactions[J].Nucleic acids research,20030(1):303-305.

[7] RESNIK P.Semantic similarity in a taxonomy:An informationbased measure and its application to problems of ambiguity in natural language[J].Journal of artificial intelligence research,1999,11(7):95-130.

[8] GUO Y,YU L,WEN Z,et al.Using support vector machine combined with auto covariance to predict proteinprotein interactions from protein sequences[J].Nucleic acids research,2008,36(9):3025-3030.

[9] SHEN J,ZHANG J,LUO X,et al.Predicting proteinprotein interactions based only on sequences information[J].Proceedings of the national academy of sciences,2007,104(11):4337-4341.

主站蜘蛛池模板: 国产熟睡乱子伦视频网站| 午夜福利在线观看成人| 在线观看欧美国产| 久久伊人操| 九九免费观看全部免费视频| 国产网站免费看| 国产区网址| 国产网站一区二区三区| 日韩高清欧美| 久久国产高清视频| 成人免费午间影院在线观看| 伊人福利视频| 亚洲国产一区在线观看| 免费欧美一级| 国产高清免费午夜在线视频| 午夜国产理论| 永久免费av网站可以直接看的 | 成人永久免费A∨一级在线播放| 久久先锋资源| 一本大道视频精品人妻| 四虎精品免费久久| 久久福利网| 亚洲开心婷婷中文字幕| P尤物久久99国产综合精品| 伊人无码视屏| 久久精品丝袜高跟鞋| 五月激激激综合网色播免费| 毛片最新网址| 国产91特黄特色A级毛片| 国产成人91精品免费网址在线| 人妻出轨无码中文一区二区| 久久久久久久蜜桃| 国产精品欧美日本韩免费一区二区三区不卡 | 狠狠久久综合伊人不卡| 国产aⅴ无码专区亚洲av综合网 | 中文成人无码国产亚洲| 免费a级毛片视频| 欧美日韩专区| 97人妻精品专区久久久久| 国产人前露出系列视频| 久久国产香蕉| 91精品日韩人妻无码久久| 国产亚洲精品yxsp| 五月六月伊人狠狠丁香网| 亚洲日本在线免费观看| 国产无码网站在线观看| 免费毛片全部不收费的| 亚洲a级毛片| 欧美性精品不卡在线观看| 精品少妇人妻无码久久| 亚洲欧洲日韩国产综合在线二区| 欧美成人一区午夜福利在线| 亚洲男人天堂网址| 国产一级精品毛片基地| 欧美成人日韩| 国语少妇高潮| 国产成人亚洲精品无码电影| 自拍偷拍欧美日韩| 欧美第二区| 在线欧美一区| 美女被狂躁www在线观看| 成人免费网站在线观看| 67194成是人免费无码| 国产黄色免费看| 国产精品无码AⅤ在线观看播放| 人妻夜夜爽天天爽| 亚洲三级电影在线播放| www亚洲天堂| 2019年国产精品自拍不卡| 嫩草国产在线| 成年网址网站在线观看| 97se亚洲| 久久国产拍爱| 欧美α片免费观看| 手机在线免费不卡一区二| 九九视频免费看| 免费国产无遮挡又黄又爽| 久热re国产手机在线观看| 欧美无遮挡国产欧美另类| 国产剧情一区二区| 亚洲无码高清免费视频亚洲| 亚洲男人在线|