999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CyClus3D聚類算法的PPI網絡模體研究

2015-04-18 03:00:30浦恩祿張孟嬌張俊鵬
大理大學學報 2015年12期
關鍵詞:數據庫生物信號

浦恩祿,張孟嬌,張俊鵬

(大理大學工程學院,云南大理 671003)

隨著生物信息學技術的發展,人們已經獲得了大量生物分子之間的相互作用數據,并由此構成了龐大的生物網絡,其中蛋白質相互作用網絡是這些生物網絡數據中很重要的一類數據。蛋白質相互作用(Protein-Protein Interaction,PPI)在生物體的生命活動中起核心作用,對PPI的研究將有利于更好地了解生命體中的生物過程〔1〕。

PPI網絡的基本構造單元是網絡模體。網絡模體是一些在真實網絡中重復出現的具有特定拓撲結構特征的小規模模式單元,它在真實網絡中出現的頻率要遠高于隨機網絡〔2〕。網絡模體挖掘有利于揭示復雜網絡的更多細節和內容,將有助于深入理解生物體的內在作用機制。

1 PPI網絡模體挖掘

網絡模體是一些具有特定性質的小規模子圖,是構建整個生物網絡的基本單元,網絡模體的識別對PPI組成的生物基礎大網絡的研究和探究具有非常重要的作用。

1.1 PPI數據源 大量的PPI數據構建了很多內容豐富并且日益更新的PPI數據庫,這些數據庫為進一步深入研究PPI網絡提供了數據支持。對PPI關系的認識和研究可以更好地認識細胞生命活動的過程,揭示生物體的生理和病理現象。

目前,每個PPI數據庫都有自己獨有的特性,并且數據庫之間的PPI重合率較低。由于PPI數據庫的選擇沒有統一的標準,本文根據PPI數據庫在其他文獻中使用的頻繁程度,選擇 HPRD〔3〕,HIR〔4〕和BioGRID〔5〕3個數據庫作為PPI數據源。3個數據庫之間的PPI重合數只有7 631,整合個數為222 556,見圖1。為了更加全面地分析PPI網絡,本文整合3種PPI數據庫作為PPI數據源,其PPI數據源大小為222 556。

圖1 HPRD、HIR和BioGRID 3種PPI數據庫之間的維恩圖

1.2 CyClus3D聚類算法 CyClus3D〔6〕是一種3-點網絡模體挖掘算法。對于給定的3-點網絡模體,其邊可能是任何一種類型。假設所有模體的列表用一個3維數組T表示,如果節點(i,j,k)之間存在一個模體,那么Ti,j,k=1,否則Ti,j,k=0。由 3 個節點集(X1,X2,X3)組成的一個模體聚類可以用聚集分數來定義:

其中,|Xi|是Xi中的節點個數,如果p>1,它將扮演反精度參數的角色。為了最大化S,首先要確定T的最優秩-1逼近,即找到實數向量(x1,x2,x3)使下式最大化:

其中約束條件為||x1||p=1。

為了找到一個高分模體聚類,CyClus3D從模體集T中反復刪除不存在的模體直至沒有冗余的模體存在。由于模體數組的最優秩-1逼近等同于一個網絡鄰接矩陣的特征向量,因此CyClus3D聚類算法可以理解為二維頻譜聚類算法〔7〕的泛化。

1.3 基于3-點網絡模體的子網絡 精度參數r=1/p,其值越小,高分模體聚類將大而稀疏。相反,其值越大,高分模體聚類將小而密集。為了折中處理,r設定為0.5。由于蛋白質相互作用關系為無向邊,所使用的3-點模體邊都為無向邊。

CyClus3D聚類算法的3-點網絡模體,見圖2(a)。使用該模體挖掘的PPI子網絡圖,見圖2(b),其節點數為374,邊數為14 076。子網絡的聚類效果較好(聚類系數=0.510),蛋白質與蛋白質之間的路徑長度比較短(特征路徑長度=1.835),并且子網絡密度小而集中(網絡密度=0.165,網絡集中度=0.837),網絡緊密程度高(網絡直徑=3),見表1。另外,同一家族的蛋白質往往有更多的相互作用,例如蛋白質組(RPL10,RPL11,…,RPL19),(PSMA1,PSMA2,…,PSMA8),(HDAC1,HDAC2,…,HDAC7)。

圖2 CyClus3D聚類算法的3-點網絡模體及其子網絡圖

表1 基于3-點網絡模體挖掘的子網絡參數

2 網絡富集分析

為了研究網絡中的蛋白質與哪些生物過程和信號通道顯著性相關,功能分析軟件DAVID(http://david.abcc.ncifcrf.gov/)〔8〕用來對模體網絡進行富集分析。DAVID是一個能為大規模的基因或蛋白質列表提供系統綜合的生物功能注釋信息的在線數據庫。本文將從 GO(Gene Ontology)〔9〕生物過程和KEGG(Kyoto Encyclopedia of Genes and Genomes)〔10〕信號通道兩個方面對模體網絡進行富集分析。

2.1 GO生物過程富集分析 GO有3個結構化的網絡,分別從生物過程、分子功能、細胞組成這3個方面對基因進行分類、定義和注釋,本文重點挖掘蛋白質顯著性相關的GO生物過程。

GO生物過程富集分析針對提交蛋白質列表采用超幾何分布檢測每一個GO生物過程條目的富集顯著性。前5個GO生物過程如表2所示,其中3-點網絡模體組成的子網絡中有65個蛋白質(RPL18,RPL17,RPL19等)與生物過程:翻譯延伸(GO:0006414~翻譯延伸)顯著性相關(p=3.65E-73)。

2.2 KEGG信號通道富集分析 KEGG信號通道富集分析針對提交的蛋白質列表采用超幾何分布檢測每一個KEGG信號通道的富集顯著性,并進行KEGG信號通道圖分析。前5個KEGG信號通道如表2所示,其中有53個蛋白質(E2F1,HSP90AB1,PPARG等)與癌癥信號通道(KEGG:hsa05200~Pathways in cancer)顯著性相關(p=7.88E-13)。

表2 前5個顯著性GO生物過程和KEGG信號通道

3 結語

CyClus3D聚類算法對PPI網絡進行模體挖掘,可以將222 556個PPI縮小到14 076個PPI來進行研究。這將大大簡化PPI網絡的分析,便于進一步研究蛋白質的相互關系。在線軟件DAVID對網絡模體組成的子網絡進行GO生物過程和KEGG信號通道富集分析,能夠挖掘出與蛋白質顯著性相關的GO生物過程和KEGG信號通道??傊?,PPI網絡屬于大型的復雜網絡,從大量的PPI數據中挖掘出更多具有生物學意義的信息,有利于更好地了解生物體的生命活動中蛋白質之間的相互作用關系,從整體水平上理解某些疾病的細胞機制,預測一些蛋白質可能的生物功能。

〔1〕WAUGH D F.Protein-protein interactions〔J〕.Advances in Protein Chemistry,1954,9:325-437.

〔2〕SHEN-ORR S S,MILO R,MANGAN S,et al.Network motifs in the transcriptional regulation network of Escherichia coli〔J〕.Nature Genetics,2002,31(1):64-68.

〔3〕PRASAD T S K,GOEL R,KANDASAMY K,et al.Human protein reference database-2009 update〔J〕.Nucleic Acids Research,2009,37(S1):D767-D772.

〔4〕ZHOU X,CHEN P,WEI Q,et al.Human interactome resource and gene set linkage analysis for the functional interpretation of biologically meaningful gene sets〔J〕.Bioinformatics,2013,29(16):2024-2031.

〔5〕STARK C,BREITKREUTZ B J,REGULY T,et al.BioGRID:a general repository for interaction datasets〔J〕.Nucleic Acids Research,2006,34(S1):D535-D539.

〔6〕AUDENAERT P,VAN P T,BRONDEL F,et al.CyClus3D:a Cytoscape plugin for clustering network motifs in integrated networks〔J〕.Bioinformatics,2011,27(11):1587-1588.

〔7〕INOUE K,URAHAMA K.Sequential fuzzy cluster extraction by a graph spectral method〔J〕.Pattern Recognition Letters,1999,20(7):699-705.

〔8〕HUANG D W,SHERMAN B T,LEMPICKI R A.Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources〔J〕.Nature Protocols,2009,4(1):44-57.

〔9〕ASHBURNER M,BALL C A,BLAKE J A,et al.Gene Ontology:tool for the unification of biology〔J〕.Nature Genetics,2000,25(1):25-29.

〔10〕KANEHISA M,GOTO S.KEGG:kyoto encyclopedia of genes and genomes〔J〕.Nucleic Acids Rresearch,2000,28(1):27-30.

猜你喜歡
數據庫生物信號
生物多樣性
天天愛科學(2022年9期)2022-09-15 01:12:54
生物多樣性
天天愛科學(2022年4期)2022-05-23 12:41:48
上上生物
當代水產(2022年3期)2022-04-26 14:26:56
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
第12話 完美生物
航空世界(2020年10期)2020-01-19 14:36:20
基于FPGA的多功能信號發生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 国产精品三级专区| 综合亚洲色图| 浮力影院国产第一页| 国产精品林美惠子在线播放| 精品国产aⅴ一区二区三区| AV在线天堂进入| 色综合手机在线| 国产精女同一区二区三区久| 免费无码网站| 少妇露出福利视频| 怡红院美国分院一区二区| 精品午夜国产福利观看| 国产人成乱码视频免费观看| 欧洲亚洲欧美国产日本高清| 欧美激情第一欧美在线| 鲁鲁鲁爽爽爽在线视频观看| 久久人人妻人人爽人人卡片av| 国产一区二区三区在线观看免费| 亚洲九九视频| 久久国产毛片| 亚洲中文字幕精品| 中文无码精品a∨在线观看| 亚洲中文字幕无码爆乳| 日本亚洲最大的色成网站www| 亚洲水蜜桃久久综合网站| 国产在线拍偷自揄拍精品| 伊人久久精品无码麻豆精品| 亚洲无码精品在线播放| 免费国产黄线在线观看| 亚洲色大成网站www国产| 久久99热66这里只有精品一| 成年人免费国产视频| 亚洲成年网站在线观看| 四虎永久在线| 亚洲欧美日韩精品专区| 精久久久久无码区中文字幕| 97se亚洲综合在线韩国专区福利| 国产福利在线观看精品| 亚洲视频欧美不卡| 久久中文电影| 亚洲高清在线天堂精品| 2020亚洲精品无码| 亚洲AⅤ波多系列中文字幕| 成人福利在线观看| 免费无码一区二区| 日韩国产高清无码| 欧美色图久久| 国产成人AV综合久久| 久久精品人人做人人综合试看| 99热最新网址| 日本欧美中文字幕精品亚洲| 亚洲精品图区| 成人在线不卡视频| 日本午夜三级| 成年女人a毛片免费视频| 久久久亚洲色| 久久综合AV免费观看| 福利小视频在线播放| 蜜桃视频一区二区三区| 人人妻人人澡人人爽欧美一区| 成人国产精品网站在线看| 亚洲日本中文字幕乱码中文| 成人午夜免费视频| 美女一级免费毛片| 就去色综合| 日本91视频| 国产地址二永久伊甸园| 片在线无码观看| 婷婷开心中文字幕| 久久国产精品嫖妓| 一本大道香蕉中文日本不卡高清二区 | 欧美日韩一区二区在线播放| 色综合日本| 污网站在线观看视频| 日本精品视频一区二区| 四虎永久在线精品影院| 国产91麻豆视频| 澳门av无码| a级毛片视频免费观看| 国产成人高清精品免费| 日韩视频免费| 日韩美毛片|