999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

動態蛋白質網絡的構建、分析及應用研究進展

2017-06-23 12:47:38孟祥茂
計算機研究與發展 2017年6期
關鍵詞:方法

李 敏 孟祥茂

(中南大學信息科學與工程學院 長沙 410083)

動態蛋白質網絡的構建、分析及應用研究進展

李 敏 孟祥茂

(中南大學信息科學與工程學院 長沙 410083)

(limin@mail.csu.edu.cn)

蛋白質組學的快速發展,特別是高通量技術的發展產生了大量的蛋白質相互作用數據,為人們從更深層次理解蛋白質之間的相互作用及其在復雜疾病的作用機理提供了基礎.一個生物體內所有的蛋白質與蛋白質之間的相互作用組成的網絡稱為蛋白質網絡.傳統的研究多是基于靜態的蛋白質網絡模型.然而,由于蛋白質自身表達的動態性及蛋白質間相互作用的動態性,真實的蛋白質網絡會隨著時間和條件不斷變化,與疾病的發生和發展有關的蛋白質功能模塊也與這種動態變化密切相關.因此,研究者已經把注意力從關注蛋白質網絡的靜態屬性轉移到動態屬性上,提出了一系列的動態蛋白質網絡的構建方法.在介紹靜態蛋白質網絡的基礎上,分類討論了動態蛋白質網絡的構建方法,將現有的動態蛋白質網絡的構建方法歸納為基于蛋白質表達動態性的方法、基于多狀態下表達及相關性變化的方法和基于時空動態變化的方法這3類:第1類體現的是蛋白質自身表達隨時間演化的動態性,第2類則表現為不同條件下蛋白質之間表達相關性的改變,第3類則體現了蛋白質及蛋白質相互作用在時間和空間上的動態變化.然后,對動態蛋白質網絡的蛋白質節點和相關子網絡進行了動態分析并詳細介紹了動態蛋白質網絡在復雜疾病中的一些主流應用,如蛋白質復合物識別、蛋白質功能預測、生物標志物識別、疾病基因預測等.最后,對動態蛋白質網絡所面臨的挑戰與未來的研究方向進行了探討.

蛋白質網絡;動態;基因表達;蛋白質復合物;復雜疾病

細胞是由大量的、不同性質的分子通過高度復雜的機制協調作用,從而完成自我復制及對外部擾動的適應等生物過程.蛋白質(protein)是細胞中關鍵的功能實體,是構成一切細胞和組織結構必不可少的成分,它是生理功能的執行者,也是生命現象的直接體現者[1].隨著人類基因組等大量生物體全基因組序列的破譯和功能基因組研究的展開,生命科學家越來越關注如何用基因組研究的模式開展蛋白質組學的研究.蛋白質組學(proteomics)指在一個特定細胞或組織或個體中全部蛋白質表達圖譜,研究的內容包含蛋白質結構、功能以及相互作用.細胞的生理過程和生命活動(如DNA的復制、基因的調控表達、細胞信號的傳導、新陳代謝、細胞增殖與凋亡等)一般都是由多個蛋白質在特定條件下通過復雜的相互作用來實現的[2].在不同周期或者條件下,一個蛋白質可以和不同的蛋白質發生相互作用(protein-protein interaction, PPI)或者同時參與到不同的生命活動中.蛋白質組學的快速發展,特別是高通量技術的發展,使得人們從網絡水平深入理解蛋白質的功能、相互作用及其在復雜疾病機理中的作用成為可能.

網絡科學理論[3-5]的快速發展為探索復雜的生物體系統提供了新的研究方式.研究者將復雜的生物體系統抽象為生物分子網絡,通過構建網絡并分析網絡的成分關系和網絡特性,進而達到對生物體系統深入理解的目的.一個生物體內所有的蛋白質及蛋白質之間的相互作用組成的網絡稱為蛋白質網絡(protein-protein interaction network, PIN),它是我們了解生命活動規律、詮釋生命奧秘的基礎.基于蛋白質網絡,研究人員已經提出了許多方法來挖掘蛋白質組學數據中的信息,其中包括預測蛋白質的功能、預測和推斷蛋白質相互作用、識別關鍵蛋白質、挖掘蛋白質復合物和功能模塊、尋找致病候選基因以及識別復雜疾病的生物標志物等.

目前,大部分關于蛋白質網絡的研究是基于靜態網絡模型.然而,靜態蛋白質網絡是高度平均和理想化的網絡結構,包含了在不同條件、不同時間、甚至不同空間發生的各種相互作用.而真實情況是隨著外界條件的改變,某些蛋白質會被降解,另一些蛋白質會被翻譯出來,由此造成一些蛋白質相互作用的消失和新的蛋白質相互作用形成.蛋白質之間只有在特性條件下,在相同的時間相同的細胞位置才能發生相互作用來完成某種生物過程.顯然,傳統的靜態蛋白質網絡沒有辦法體現這種動態性.如何利用獲得的蛋白質相關的生物信息構建和分析動態的蛋白質網絡模型是當今生物信息學和系統生物學領域一個很有挑戰性的工作.

基因表達有條件和時序地打開和關閉,基因表達數據在生物過程的不同條件或不同階段能反映蛋白質存在的動態性[6].特別是基因微陣列技術、新一代測序技術產生了海量基因表達數據,為研究不同周期和不同條件下不同的細胞類型的基因表達建立了基礎.另外高通量技術的發展,使得產生的蛋白質亞細胞定位數據、質譜數據等其他數據從原來的低通量變為高通量.在多元數據的推動下,動態蛋白質網絡的構建成為可能.

本文對現有的動態蛋白質網絡的構建方法進行了詳細的分類總結,介紹了動態蛋白質網絡中蛋白質節點以及相關子網的動態分析的研究進展,并詳細介紹了動態蛋白質網絡在復雜疾病中的一些主流應用,最后對動態蛋白質網絡所面臨的挑戰與未來的研究方向進行了探討.

1 靜態蛋白質網絡

1.1 蛋白質相互作用

蛋白質之間的相互作用根據其作用方式的不同,可以分為物理相互作用(physical interaction)和遺傳相互作用(genetic interaction).物理相互作用是指2個蛋白質物理上相互綁定在一起,是一種直接的相互作用關系;而遺傳相互作用是在物理上沒有發生相互作用,更多地體現在基因之間的功能關聯,是一種間接的相互作用關系.通常情況下蛋白質相互作用主要是前者類型.

目前,大規模蛋白質相互作用獲取的方式主要有3種:1)高通量實驗篩選技術;2)生物信息學計算方法;3)文獻挖掘技術.獲取蛋白質相互作用的高通量實驗方法主要有酵母雙雜交技術(yeast two hybrid, Y2H)[7]、串聯親和純化-質譜分析技術(tandem affinity purification-mass spectrometry, TAP-MS)[8]、蛋白質芯片技術(protein chip technique)[9]等.酵母雙雜交技術可以快速、直接分析已知蛋白質之間的相互作用,分離新的與已知蛋白質相互作用的配體及其編碼基因.酵母雙雜交技術具有高度的敏感性,能夠檢測到瞬時或較弱的蛋白質相互作用,但它僅能分析細胞核內的蛋白質間的相互作用[10],同時具有較高的假陽性(被檢測到的蛋白質相互作用數據在實際中并不存在)和假陰性(潛在的未被檢測到蛋白質相互作用數據).串聯親和純化利用2個親和標簽不同時序來純化蛋白組件,它能夠在真實的生理條件下研究蛋白質的相互作用,同時結合質譜技術的自動化特性,使得大規模地分析相互作用的蛋白質在技術上成為可能[11].相比于酵母雙雜交技術,串聯親和純化質譜分析技術降低了數據的假陽性和假陰性水平[12].蛋白質芯片技術是一種強有力的蛋白質組學研究的新方法,能夠進行高通量的蛋白功能分析,它具有特異性、敏感性高等特性,可有效減少藥物研發周期并提高醫療診斷效率[13].

生物學家通過這些技術能夠方便、大規模地驗證蛋白質間的相互作用信息,但是這類技術往往成本費用較高.由于受實驗條件等諸多因素的限制,導致不同類型的高通量實驗技術以及來自不同實驗室相同的高通量實驗技術產生了相互作用重疊率較低等問題[14].

相比于高通量實驗的方法,利用計算方法預測蛋白質相互作用數據具有周期短、開銷少等優勢.它綜合利用數學、物理和信息學等多學科的理論知識,通過計算機建模來預測未知的蛋白質相互作用數據.基于計算預測的方法可以歸納為5種[15-16]:

1) 基因組信息關聯推斷;

2) 基于遺傳進化關系的方法;

3) 基于蛋白質一級序列信息推斷;

4) 基于蛋白質三維結構信息的方法;

5) 蛋白質網絡分析法.

由于計算預測方法采用不同的蛋白質相互作用數據庫,往往預測結果也有較大的差異性,目前還沒有比較好的統一評價標準.

基于文獻挖掘的蛋白質相互作用獲取方式主要是依賴于海量的關于蛋白質相互作用的文獻報道.這些文獻不僅包括了蛋白質相互作用數據信息,有的還給出了實驗的條件、環境及蛋白質注釋、亞細胞定位等多種信息,并且這些信息還在不斷地增加與更新.豐富的文獻信息為挖掘蛋白質相互作用數據提供了基礎,目前主要采用基于自然語言處理(natural language processing, NLP)的文本挖掘技術[17-18].文獻挖掘的蛋白質相互作用數據信息得到了生物學實驗的支撐,可靠性較高,同時也能為高通量實驗篩選技術和計算預測得到的蛋白質相互作用數據提供文獻參考依據.但受限于科學文本的復雜性和人類語言表述的多樣性,如何有效地提取文獻中的蛋白質相互作用數據信息仍然是很有挑戰的工作.

目前,已經產生了大量可用的蛋白質相互作用數據,而且這些數據還在持續不斷地增加.研究者已經成功地構建了多個不同的蛋白質相互作用數據庫,為蛋白質組學的相關研究提供了海量的數據來源.Pathguide網站*http://pathguide.org提供了豐富的蛋白質相互作用數據庫的相關信息,本文選取部分常用的蛋白質相互作用數據庫,如表1所示:

Table 1 The Commonly Used PPI Databases表1 部分常用的蛋白質相互作用數據庫

1.2 靜態蛋白質網絡

通常情況下,靜態蛋白質網絡可以用一個無向圖G=(V,E)表示,其中V表示圖中節點集合,E表示圖中邊的集合.映射到蛋白質網絡中,每個節點就是一個蛋白質,每條邊則是蛋白質之間的相互作用.根據邊取值的差異,無向圖又可分為加權圖和非加權圖.非加權圖中的每條邊權重相同,反映蛋白質之間的相互作用視為同等地位,通常簡單地用二進制值0和1表示2個蛋白質間是否存在相互作用關系(1表示存在,0表示不存在).加權圖中的每條邊權重不同,說明蛋白質之間的相互作用具有差異性.

對于蛋白質網絡早期的研究,研究者重點分析了網絡的拓撲特性,如連接度、網絡直徑、中心性和集聚系數等[27-30].同時,這些網絡分析發現蛋白質網絡具有無標度特性[31-33]、小世界性質[34-36]、功能模塊化結構[37-39]等.無標度特性表現為蛋白質節點的度服從冪律分布,即蛋白質網絡中大部分蛋白質只有少量鄰居相連,而個別蛋白質卻有眾多的鄰居節點相連接.這些有大量鄰居節點的蛋白質稱為hub節點,這些hub節點影響著整個蛋白質網絡,對于細胞生存至關重要.利用這種特性,研究者可以根據蛋白質在網絡中的拓撲中心性來識別關鍵蛋白質[40-44].而小世界特性和功能模塊結構則表現為網絡具有較高的集聚系數,往往形成模塊化結構,這些模塊通常對應于蛋白質復合物或者功能模塊.一般情況下,生命活動的發生與發展都需要多個蛋白質共同協作形成的大分子蛋白質復合物或者功能模塊來完成.這些蛋白質復合物或者功能模塊中有一部分是穩定的,參與生命周期中的多個生理過程,還有一部分是臨時形成、動態的.蛋白質在不同的外在條件或刺激下,具有不同的功能.生物信息學中常用圖聚類的方法,識別蛋白質網絡中的一組相互作用且具有一定功能的子圖作為蛋白質復合物或者功能模塊(一般都稱為cluster)[45-48].目前主要的蛋白質網絡圖聚類方法可分為識別稠密子圖的聚類方法、層次化的聚類方法以及融合多元信息的聚類方法等[46].大部分蛋白質網絡分析的圖聚類算法都是基于無向圖模型的,其中有些方法是基于非加權圖的,有些方法是基于加權圖的,還有些方法既可以用于加權圖又可用于非加權圖.

基于蛋白質網絡,另一個重要的研究方向是網絡比對問題[49-50]和子網絡查詢問題[51-52].蛋白質網絡的比對主要是依據網絡的相似性計算,從待比較的2個或多個蛋白質網絡中找出保守的子網,進一步預測蛋白質復合物以及特定功能的通路,預測新的蛋白質相互作用以及不同物種間的保守進化關系等[53-55].蛋白質子網絡查詢目標是從一個大規模蛋白質網絡中識別出一個與給定的查詢網絡高度相似的子網區域[56].針對查詢模式的比對問題,研究者們已開展了大量的研究工作,提出了很多有效的解決方法[57-58].

目前,基于靜態蛋白質網絡的研究已取得了較大的進展,但在實際的生物系統中分子網絡是時刻在變化的,因此構建動態蛋白質網絡才能模擬真實的生物系統的運行規律.接下來本文將對現有的一系列動態蛋白質網絡的構建方法進行系統的分類總結.

Fig. 1 Schematic diagram of the time course dynamic PIN construction圖1 一種時序動態蛋白質網絡構建示意圖[60]

2 動態蛋白質網絡的構建方法

動態蛋白質網絡可以用一個無向圖集合G={G1,G2,…,Gi,…,Gn}表示,其中Gi=(Vi,Ei)表示第i時刻或條件下的子網,Vi表示圖中第i時刻或條件下的節點集合,Ei表示圖中第i時刻或條件下的邊集合.蛋白質和蛋白質間的相互作用都會隨著外界刺激或條件改變而變化,因此由蛋白質和蛋白質間的相互作用構成的蛋白質網絡也應該是受到外界環境條件約束的,是一個時刻在動態發展的.根據蛋白質網絡所包含組件(蛋白質節點和蛋白質間的相互作用邊)屬性的動態性,本文把現有的動態蛋白質網絡的構建方法歸納為3類:基于蛋白質表達動態性的方法、基于多狀態下表達及相關性變化的方法和基于時空動態變化的方法.

2.1 基于蛋白質表達動態性的方法

蛋白質的表達具有時空動態的特性:從時間維度上分析,蛋白質表達動態性主要表現為蛋白質在某些特定的時刻表達,而在其他時刻沒有表達;從空間維度上來看,蛋白質的表達動態性體現在蛋白質只在某些特定的組織中表達,而在其他組織中不表達.因此,如果在一個細胞中或者某個時刻,2個蛋白質都不表達,那么它們之間的相互作用就不會發生[59].靜態的蛋白質網絡能夠提供細胞內蛋白質間的相互作用行為的定性描述,為動態蛋白質網絡的構建提供了一個的支架;而基因表達數據能夠反映出不同時刻/組織/條件下細胞中被轉錄的mRNA定量信息.由中心性法則可知,蛋白質是由mRNA翻譯而來,從而可以從基因表達信息中獲得蛋白質表達的動態性信息.有效結合這2種定性和定量信息,能夠闡述細胞內蛋白質之間的動態組織形式.基于蛋白質表達動態性的方法的基本思路是:1)根據基因的表達信息判斷蛋白質在各個時刻/組織/條件下表達或未表達;2)結合靜態蛋白質網絡,構建每個時刻/組織/條件的蛋白質子網;3)由這些反映蛋白質表達動態性的子網構成了動態變化的蛋白質網絡.其中每個時刻/組織/條件的蛋白質子網由這個時刻/組織/條件下表達的蛋白質及其相互作用構成.圖1給出了一種時序動態蛋白質網絡構建的示意圖.

由于微陣列技術或新一代測序技術產生的高通量基因表達數據存在不可避免的背景噪音,因此這類構建方法的關鍵在于如何判斷蛋白質在各個時刻/條件下/組織中的表達動態性.在已有的動態蛋白質網絡構建中,判斷蛋白質表達動態性的方法不盡相同,表2給出了6個主要的基于閾值的動態蛋白質網絡構建方法.本文把基于閾值的方法分為2類:固定閾值(fixed threshold)和動態閾值(active threshold).

Table 2 Dynamic PIN Construction Methods Based on Protein Presence Dynamics表2 基于蛋白質表達動態性的動態網絡構建方法

2005年,De Lichtenberg等人[61]構建了基于時序基因表達數據的酵母動態蛋白質網絡.基于時序基因表達數據,蛋白質被分為周期性表達蛋白質和持續性表達蛋白質2類[66],他們認為僅周期性表達的蛋白質存在動態性,且僅在基因表達數據中峰值所對應的時刻表達.對于周期性表達的蛋白質,蛋白質p的活性出現時刻T(p)為

T(p)={i|Max(Exp(p,i)),i=1,2,…,t},

(1)

其中,Exp(p,i)是蛋白質p在時刻i的基因表達值;對于持續性表達的蛋白質,蛋白質活性出現時刻如式(2)所示:

T(p)={i|i=1,2,…,t}.

(2)

因此,每個時刻的動態蛋白質子網由該時刻出現的周期性表達蛋白質和所有持續性表達的蛋白質以及它們之間的相互作用組成.基于預處理得到的小規模高可靠性的蛋白質相互作用以及周期性表達蛋白質識別策略,對比包含5 000多個蛋白質的酵母蛋白質網絡,這個酵母動態蛋白質網絡只包含300多個蛋白質,丟失了大量的蛋白質及其動態信息.另外,僅將基因表達數據中峰值所對應的時刻作為周期性表達蛋白質的表達時刻不符合生物事實,從而導致大量的蛋白質表達動態性信息的丟失.后續的很多研究者都開始采用閾值的方法來確定蛋白質的表達動態性.Hegde等人[62]構建了大腸桿菌在4個不同條件下的蛋白質網絡來研究不同條件下蛋白質相互作用的動態改變.他們將基因芯片中每一個區域的平均表達水平作為該區域的閾值來區別噪音值和真實表達值.對于某個條件i下的某個j扇區s(i,j),其包含基因數記為ns(i,j),則其活性閾值θ(s(i,j))為

(3)

蛋白質活性出現時刻為

T(p)={i|Exp(p,i)≥θ(s(i,j)),i=1,2,…,t}.

(4)

2011年,Tang等人[60]基于大量周期性表達的基因在酵母代謝周期中表達峰值都會大于一個常量這一現象[67],采用一個固定閾值來判斷蛋白質的表達動態性,并基于此構建了酵母的時序動態蛋白質網絡,其蛋白質活性出現的時刻計算為

T(p)={i|Exp(p,i)≥θ,i=1,2,…,t},

(5)

其中,閾值θ是一個常量.這種固定閾值的選取依賴于對酵母周期性表達基因在某個具體的基因表達數據中峰值分布的研究,因此很難應用在同一物種的其他基因表達數據以及其他物種的基因表達數據上.另外,許多在酵母細胞周期轉錄水平一直很低的mRNA很容易被這個固定閾值過濾掉,而實際上這些mRNA也可能會被翻譯成蛋白質[68],這會使得構建的動態蛋白質網絡不可避免地丟失一些蛋白質以及它們的動態表達信息.從這些問題出發,考慮到不可避免的背景噪音和每個基因各自的表達特性,Wang等人[63]提出了一個基于3-sigma法則的方法來根據每個基因的表達曲線為基因對應的蛋白質設計一個閾值,用于判斷該蛋白質在什么時刻表達并處于活性狀態.活性閾值由式(6)求出:

(6)

其中,μ(p)和σ(p)是蛋白質p的基因表達的算術平均值及標準差;蛋白質活性出現時刻如式(7)所示:

T(p)={i|Exp(p,i)≥θ(p),i=1,2,…,t}.

(7)

基于識別的每個蛋白質活性表達時刻點,構建了動態蛋白質網絡.每個時刻上的動態蛋白質子網由該時刻的處于活性的蛋白質及其相互作用組成.Xiao等人[69]則采用一個動態模型方法,將基因表達數據分為時間相關的和時間不相關的2類.和時間相關的基因表達數據更有可能是動態表示的,而不是隨機的;而和時間不相關的基因表達數據則更有可能是隨機性的.如果基因是時間獨立性的,并且它們的平均值是非常小的,那么這些基因表達數據就被認為是噪聲,通過這種動態模型來過濾基因表達數據中的無效數據.同時在3-sigma方法的基礎上,設計了新的閾值函數來計算確定過濾了噪聲后的基因(蛋白質)活性時間點,從而構建酵母的動態蛋白質網絡.而Shen等人[64]認為3-sigma方法雖然能夠取得相對較好的結果,但是會過濾掉一些一直有較高表達信息的蛋白質,造成有用數據的丟失.在3-sigma基礎上,他們提出了偏差度(deviation degree)的方法來判斷蛋白質的活性時刻,進而構建時間演化的動態蛋白質網絡,其活性閾值為

θ(p)=μ(p)+σ(p).

(8)

蛋白質活性出現時刻為

T(p)={i|Exp(p,i)≥θ(p),i=1,2,…,t}.

(9)

由于蛋白質間相互作用強度的異質性,定量描述動態蛋白質網絡中的相互作用強度對于真實反映細胞進程的作用機制有重要作用.他們采用連接親密度來量化蛋白質之間相互作用的強度,構建了加權的動態蛋白質網絡,從而降低了假陽性數據以及假陰性數據(瞬時PPI數據的丟失)對網絡可靠性的影響.Zhang等人[65]認為簡單的描述蛋白質是表達狀態或未被表達狀態不符合實際蛋白質表達的過程,而應該是蛋白質在不同的時刻組織條件下表現為具有不同水平的表達活性.基于3-sigma方法,他們設計了k-sigma(k=1,2,3)的閾值方法.當k取不同數值時,判斷蛋白質是否表達的活性閾值也隨之變化.當蛋白質實際的表達量處于不同的閾值區間,則其對應的處于活性狀態的概率值也不同.基于蛋白質在不同時刻的活性概率,他們構建了基于概率的動態蛋白質網絡,其活性閾值為

(10)

其中,k=1,2,3.當k=1時,活性閾值θk(p)記為θ1(p);當k=2時,活性閾值θk(p)記為θ2(p);當k=3時,活性閾值θk(p)記為θ3(p).基于3-sigma法則,Zhang等人[65]將蛋白質p在時刻i的活性概率Proi(p)分為4個等級,具體計算為

(11)

蛋白質p的活性概率表示其在某時刻的活躍水平,可以根據活性概率判定p在該時刻是否是活性的.

目前,基于表達動態性的蛋白質網絡的構建方法主要采用閾值來區分基因表達數據中噪音和真實表達,從而提取蛋白質的表達動態性信息.然而,大多數閾值方法缺少對噪音的系統性分析和必要的理論支持,使得在不同的基因表達數據上有較大的應用局限性.

2.2 基于多狀態下表達及相關性變化的方法

蛋白質表達水平的改變可能導致蛋白質之間相互作用強度的增加或減少,也會引起蛋白質之間表達相關性的改變,從而導致生理狀態的改變.表達方差(EV)可以用來衡量蛋白質的動態性,具有小EV值的蛋白質的動態性很低,反之,蛋白質的動態性較高.利用相關性計算方法(例如皮爾遜相關系數PCC)可以衡量一對蛋白質的表達相關性,表達相關性越高,它們在細胞中同時表達的機會越多,更容易發生相互作用;反之,表達相關性越小,它們在細胞中同時表達的機會越少,那么它們發生相互作用的可能性就越小.目前主要的基于多狀態下表達及相關性變化的動態蛋白質網絡構建方法如表3所示:

Table 3 Dynamic PIN Construction Methods Based on Multiple States Expression and Correlation Alteration表3 基于多狀態下表達及相關性變化的動態蛋白質網絡構建方法

基于包含多種狀態的基因表達數據,通過計算表達相關性,可以研究同種細胞不同狀態下的蛋白質網絡的動態性.例如Komurov等人[70]在6個不同數據集上的272個基因表達數據上計算各個蛋白質的EV,并基于EV將蛋白質分為動態蛋白質(EV>0.75)和靜態蛋白質(EV<0.25)兩類.他們提出動態蛋白質更趨向于處在一個高度表達相關的環境中,從而構建了一個由PCC計算的表達相關性大于或等于0.65的相互作用蛋白質對組成的簡單的動態蛋白質網絡,其中動態蛋白質占絕大多數.為研究人類蛋白質網絡的動態特性,Xia等人[71]基于26~106歲年齡階段的30個人的大腦基因表達數據建立了一個由正相關(PCC>0.4)和負相關(PCC<-0.4)的相互作用蛋白質對組成的動態蛋白質網絡.這個動態網絡包含了衰老過程中表達相關性較高的蛋白質以及它們之間的蛋白質相互作用.在Xia等人研究的基礎上,Xue等人[75]構建了類似的人類和果蠅的動態蛋白質網絡,用來研究在人類和果蠅衰老過程中蛋白質網絡結構的動態變化.在這些動態網絡中,大多數相關性高的相互作用的蛋白質擁有較高的EV值,但是并非所有的動態蛋白質都包含在這種動態網絡中.另外,在這種動態網絡中,包含的只是在多狀態下表達相關性高的蛋白質之間的相互作用,這些相互作用不一定都是同時發生的.因為表達相關性是通過蛋白質的表達來間接刻畫它們之間相互作用會發生的可能性,而這些相互作用到底什么時候發生就不得而知了.

近年來,一些研究者開始關注基于表達相關性的動態蛋白質網絡構建,特別是不同病理狀態下的動態蛋白質網絡.例如Zhang等人[72]基于2組不同發展狀態下的神經膠質瘤病人的基因表達數據(短存活的樣本和長存活的樣本),計算了與膠質瘤相關的蛋白質分別在2組不同發展狀態下的表達相關性,構建了膠質瘤動態蛋白質網絡,其動態性主要體現為表達相關性的變化及表達信息的變化.類似于Zhang等人的構建方法,為了研究二型糖尿病,Sun等人[73]利用2組正常小鼠和疾病小鼠在3個二型糖尿病相關組織上的時序基因表達數據以及小鼠的蛋白質網絡,分別計算每個組織在每個時刻點上相互作用的蛋白質的表達相關性,識別出各個時刻點上顯著性差異表達的蛋白質以及相關性具有顯著性差異的相互作用,構建了差異性的動態蛋白質子網.與Zhang等人不同的是,Sun等人采用了斯皮爾曼相關系數(SCC)來計算2個相互作用的蛋白質的表達相關性,并且動態蛋白質網絡不僅包含了在相關性上具有顯著性差異的相互作用和具有顯著性表達差異的蛋白質,還包含了顯著性表達差異的蛋白質之間的相互作用.Shang等人[74]采用RNA-seq數據代替基因表達數據來構建動態蛋白質網絡,他們認為相互作用的蛋白質對具有一致的表達模式.通過基因的共表達模式過濾具有一定噪聲的相互作用,然后再選取表達相關性PCC≥ 0.95的相互作用蛋白質對構建動態的蛋白質網絡.RNA-seq數據背景噪聲更小,同時還能夠檢測未知的轉錄物和亞型[76].因此,利用RNA-seq數據構建動態蛋白質網絡是今后的重要研究方向.

Fig. 2 Overview of the paradigm for constructing the spatial and temporal active PIN圖2 一種時空動態蛋白質網絡構建示意圖[84]

在上述基于多狀態下表達及相關性變化的動態蛋白質網絡的構建中,不同的相關性計算方法和差異顯著性分析方法影響動態網絡的規模,對動態蛋白質網絡的構建非常關鍵.不同樣本下的不同背景噪音不可避免地會對相關性計算以及顯著性分析造成影響.不同的物種,顯著性差異判斷的閾值顯然也不同.目前,多狀態下的動態蛋白質網絡的構建還處于初步研究階段,只刻畫了多狀態下的表達及相關性差異.由于缺少新的描述模型和構建方法,不能對各種狀態下蛋白質網絡的整體變化等進行研究.因此,提出新的精確刻畫多狀態下蛋白質網絡的描述方法非常必要.

2.3 基于時空動態變化的方法

基于蛋白質表達動態性的方法體現的是蛋白質自身表達隨時間演化的動態性;基于多狀態下表達及相關性變化的方法則表現為不同條件下蛋白質之間表達相關性的改變;而基于時空動態變化的方法則體現了蛋白質及蛋白質相互作用在時間和空間上的動態變化.現階段動態蛋白質網絡構建的研究主要體現了蛋白質在時間動態性上的信息,并且取得了一系列相關研究成果.隨著蛋白質組學研究的快速發展,體現蛋白質空間動態性上的信息數據也越來越多.結合不同組織的基因表達數據構造的組織特異性蛋白質網絡,能夠反映蛋白質在空間上的表達動態性:在不同的組織中,某些蛋白質只能在特定的組織細胞中表達,從而影響相互作用的發生.例如,Bossi等人[77]基于79個不同的人體細胞或組織的基因表達數據[78]和人類蛋白質網絡,構建了79個組織特異性的蛋白質網絡.他們也利用固定閾值的方法來區分所有基因表達數據中的噪音和真實表達[79].但蛋白質的空間動態性準確來說,是指在不同的細胞生長條件下和應對外部刺激時蛋白質在細胞中的位置會發生變化,從而影響相互作用的發生.例如,當細胞應對DNA損壞時,Boisvert等人[80]觀察到蛋白質的位置發生了改變.Zhao等人[81]和胡賽等人[82]結合時序基因表達數據、結構域信息和復合物信息,構建了動態加權蛋白質網絡.他們認為蛋白質在某時刻的表達水平超過自身的平均表達,則蛋白質在該時刻表達.不同于3-sigma方法,他們認為取消了閾值能夠提高算法的適應性.

根據蛋白質受到時間和空間的約束,蛋白質之間只有在相同時間和相同細胞位置才能發生相互作用[83],我們構建了具有時空特性的動態蛋白質網絡[84],該網絡具體的構建流程如圖2所示.首先,我們采用改進的3-sigma動態閾值方法判斷時序基因表達數據中蛋白質活性信息;然后利用蛋白質亞細胞定位數據獲得蛋白質在細胞中的位置信息;最后結合發生在相同時間相同位置的相互作用信息,構建成時空動態蛋白質網絡.相比于靜態的蛋白質網絡,我們構建的時空動態蛋白質網絡體現了蛋白質及蛋白質之間相互作用隨時間和空間位置變化的特性.

現有的動態蛋白質網絡構建方法主要還是蛋白質自身表達水平的動態變化過程,而蛋白質相互作用強度的動態變化過程研究尚處于基礎研究階段.因此,如何同時結合時間、空間動態性信息構建更加有效的動態蛋白質網絡還需要投入大量的研究精力.

3 蛋白質節點及相關子網絡的動態變化分析

蛋白質以高效的、精確的、特異性的方式來發揮功能,同時蛋白質結構與功能的動態變化使得蛋白質具有很強的適應性和進化性[85].在靜態蛋白質網絡分析中我們可知,蛋白質網絡中存在少量hub類型的蛋白質節點,這些蛋白質連接度較大,往往是在不同時刻或不同條件下形成的相互作用關系.而Han等人[86]則發現酵母動態蛋白質網絡中的這個hub類型的蛋白質又可分為party hub和date hub.party hub類型的蛋白質往往處于蛋白質功能模塊的中心位置,與多個蛋白質同時發生相互作用且具有較高的共表達水平;而date hub類型的蛋白質則處于功能模塊之間,在不同時刻或細胞位置與多個蛋白質發生相互作用且共表達水平相對較低.Taylor等人[87]受此啟發將hub類型的蛋白質分為intermodular hub和intramodular hub.他們的研究發現intermodular hub類型的蛋白質表現出較高的集聚系數,intramodular hub類型的蛋白質則表現出較高的介數.

區分蛋白質網絡中的動態節點和靜態節點,并對網絡中動態性最強的節點及屬性進行分析有助于理解蛋白質的功能和蛋白質網絡的組織結構[88].例如,在不同條件下,考慮網絡中基因表達水平的變化,可以篩選出一些差異性表達的基因,這些基因往往跟疾病的發生與發展密切相關.

在細胞中,實際的蛋白質之間的相互作用也不是一成不變的,而是隨著時間和條件不斷變化的,這就體現了蛋白質的相互作用動態性[89-90].而由蛋白質和蛋白質之間的相互作用構建的蛋白質子網也具有動態性,在不同條件下所構建的蛋白質子網稱為條件特異性子網,如蛋白質復合物/功能模塊、組織特異性子網、內容相關子網等[88].從不同層面動態分析條件特性子網有利于整體或局部理解蛋白質網絡的組織結構和生物體系統功能機制[91-92].傳統研究都是從全局角度去識別靜態的蛋白質復合物或功能模塊,并且難以精確區分二者.而實際的蛋白質復合物更多的是動態單元,特別是一些瞬時形成的蛋白質復合物在靜態蛋白質網絡中難以檢測到.部分基因只能在特定的細胞組織中表達,只有2個基因在相同的組織中,它們才能夠發生相互作用.基于組織特異性子網能夠發現組織特異性蛋白質與廣泛表達蛋白質具有顯著性的差別[77,93-94].而內容相關子網的研究重點關注的是如何識別出特定復雜疾病的生物標志物或者篩選出疾病組和對照組差異性的基因集合,這對于疾病的早期診斷、藥物設計和臨床應用具有很強的實用性[95-96].常用基于圖搜索的內容相關子網識別方法[97-99],主要分2個步驟實現:1)定義打分函數來量化不同條件下網絡結構的改變程度;2)設計搜索算法提取得分最高的條件特異性子網[88].

4 蛋白質網絡的動態模擬及可視化

網絡的動態模擬可以反映出生物細胞對于外界刺激時的響應過程,以及分子網絡隨時間的演化過程.蛋白質網絡的動態模擬可以呈現蛋白質及蛋白質之間的相互作用在細胞中所參與的生命活動過程規律,有助于理解蛋白質復合物/功能模塊的形成機制以及差異性表達基因及異常通路在疾病病變中所扮演的角色[100-101].基于計算的方法為蛋白質網絡的動態模擬提供了有效手段.常用的模擬分子網絡動態的數學模型有布爾模型、邏輯模型、貝葉斯模型和微分方程模型等[88],這些模型同樣適用于蛋白質網絡的動態建模分析.小規模蛋白質網絡,可采用微分方程模型來進行動態模擬;而對于大規模的蛋白質網絡則需借助不需要反應參數的不太精確的模型,如智能建模[88,102].

網絡可視化技術作為一種重要的輔助手段,可以幫助研究人員直觀地觀察網絡的結構并有助于進一步挖掘隱藏的信息.Cytoscape[103]是一個十分重要開源的支持插件開發的軟件系統,可用于大規模蛋白質相互作用等復雜生物網絡的可視化分析.由于Cytoscape界面友好、功能齊全、數據庫整合較好,同時還可以通過簡易插件對其功能進行擴展,Cytoscape軟件包的功能日益豐富和完善.基于Cytoscape的蛋白質網絡分析的插件有很多,例如分析節點拓撲特性的插件CytoNCA*http://apps.cytoscap-e.org/apps/cytonca[104],以及用于網絡聚類分析的插件MCODE*http://apps.cytoscape.org/apps/mcode[105],ClusterViz*http://apps.cytos-cape.org/apps/clusterviz[106]、CytoCluster*http://apps.cytoscape.org/apps/cytocluster,Cluster-ONE*http://apps.cytoscape.org/apps/clusterone[107],clusterMaker2*http://apps.cytoscape.o-rg/apps/clustermaker2等.基于Cytoscape的動態蛋白質網絡可視化插件有DyNet*http://apps.cytoscape.org/apps/dynet[108],DynNetwork*http://apps.cytoscape.org/apps/dy-nnetwork.DyNet是一個功能十分強大的動態網絡分析工具,能夠對多狀態的動態分子網絡提供實時同步的動態可視化分析,能夠識別出不同網絡狀態下的最大保守子網模塊.DynNetwork提供了多種網絡中心性測量指標,比如度中心性(degree centrality)[109]、接近中心性(closeness centrality)[110]、介數中心性(betweenness centrality)[111]等.

此外,其他一些復雜網絡的可視化分析工具也可以對動態網絡的子網進一步分析.Gephi[112]可用于動態和分層圖的交互可視化與探測.Osprey[113]使用不同顏色標識基因的功能和相互作用數據,還可以讓用戶通過基因名稱進行文本搜索和它相關的蛋白質等功能信息.Pajek[114]是大型復雜網絡分析工具,不僅實現了一整套快速有效的用來分析復雜網絡的算法,而且提供了一個用于可視化分析的界面.Pajek不僅可以對普通網絡進行可視化,還支持多關系網絡的可視化呈現.C-DEVA[115]基于Java的綜合生物網絡分析平臺,集成了多種算法應用于生物網絡功能模塊的預測、評估、可視化以及功能富集分析等,且具有很好的擴展性.

5 動態蛋白質網絡在復雜疾病中的應用研究

動態蛋白質網絡構建方法的發展,有效克服了基于靜態蛋白質網絡分析方法的局限,在蛋白復合物/功能模塊識別、生物標志物識別、疾病相關研究方面都起到了很好的作用.另外,復雜疾病藥物研究也開始由標靶某個蛋白質或基因轉向系統地標靶蛋白質及蛋白質間的相互作用構成的子網.

5.1 蛋白質復合物識別

蛋白質復合物和網絡功能模塊都是一組相互作用的蛋白質集合,它們的區別在于蛋白質復合物中的蛋白質是在同一時間同一地點發生的相互作用,而網絡功能模塊中的蛋白質是在不同時間不同地點(如細胞不同階段或條件、不同細胞位置等)發生相互作用來完成某一生物進程.靜態的蛋白質網絡沒有涉及時間和空間的信息,不能夠對蛋白質復合物和功能模塊精確區分.另外,靜態的蛋白質網絡帶來的噪聲也會影響算法檢測結果的準確性.動態的蛋白質網絡體現了真實的蛋白質復合物/功能模塊形成過程中體現的動態性,在動態蛋白質網絡上進行蛋白質復合物/功能模塊識別具有重大的優勢.

De Lichtenberg等人[61]在他們所構建的動態蛋白質網絡的上下文中,對MIPS數據庫[23]的已知蛋白質復合物進行分析,發現大部分復合物由周期性表達和持續性表達的蛋白質構成,并且這些復合物的形成機制符合一種即時組合機制(just-in-time).Tang等人[60]和Wang等人[63]分別在動態蛋白質網絡上預測蛋白質復合物,發現在動態蛋白質網絡上預測的蛋白質復合物更加準確、更加具有功能一致性.在人類蛋白質網絡中,Calvano等人[116]研究人體血液白細胞在不同時間點對內毒素的反應,且鑒別出被次內毒素刺激擾亂的重要蛋白質功能模塊.Luo等人[117]提出了一個基于條件的共調控蛋白復合物識別框架,并在細胞周期、DNA損傷等條件下對酵母數據集進行了測試.為了研究動態蛋白質網絡的模塊化結構,Xia等人[71]在只包含正相關或負相關的蛋白質對的動態蛋白質網絡中,運用層次聚類的方法識別蛋白質復合物,發現了轉錄反相關模塊是一種細胞狀態切換的開關.在有關衰老過程的研究中,Xue等人[75]分析了果蠅、人類在動態蛋白質網絡中的模塊化結構,發現只有小部分蛋白質功能模塊在表達中的變化與老化有關.Ou-Yang等人[118]利用3-sigma方法判斷每個蛋白質的活性,同時根據PCC閾值把相互作用分為瞬態相互作用(動態部分)和穩態相互作用(靜態部分)來構建動態蛋白質網絡.結果發現在構建的動態蛋白質網絡上預測的重疊的動態蛋白質復合物更能體現真實的蛋白質復合物及其動態特征.Shen等人[64]在其構建的動態蛋白質網絡上,根據連接親密度的思想,進行動態蛋白質復合物的預測,找到具有生物意義功能的蛋白質復合物.Lei等人[119]基于3-sigma方法和改進的MCL聚類算法及優化思想,在構建的動態蛋白質網絡上進行蛋白質復合物預測.相比于靜態蛋白質網絡,動態蛋白質網絡能夠預測出更加精確的蛋白質復合物,這有助于我們理解蛋白質復合物的形成機制及其在細胞中所發揮的功能作用.

5.2 蛋白質的關鍵性及功能預測

關鍵蛋白質是維持生物體生命活動必不可少的生物大分子,沒有了它們生物體將不能存活或生長[120-121].關鍵蛋白質的研究對合成生物學的基礎研究、設計新的抗菌藥物等具有很重要的幫助.基于網絡水平的關鍵蛋白質預測及其應用研究已經成為生物信息學和系統生物學領域研究的熱點方向.目前,已有的大量的關鍵蛋白質預測方法被提出.如基于拓撲特性的方法有度中心性(degree centrality)[109]、接近中心性(closeness centrality)[110]、介數中心性(bet-weenness centrality)[111]、子圖中心性(subgraph centra-lity)[122]、節點的局部平均連通性(local average connec-tivity)[123]、鄰居中心性(neighborhood centrality)[124]和集成復合物中心性(united complex centrality)[125]等;還有融合其他生物信息的方法ION[126],SON[127]等.這些方法在一定程度上都取得了較好的效果,但還遠遠不夠,其主要原因是這些方法都是基于靜態的蛋白質網絡分析的.Xiao等人[128]結合靜態蛋白質網絡和時序基因表達數據構建了一個時序動態蛋白質網絡,并在此網絡上進行關鍵蛋白質預測,結果發現動態蛋白質網絡比靜態蛋白質網絡能夠更加有效地預測關鍵蛋白質.我們基于3-sigma構建了動態蛋白質網絡,然后再結合亞細胞定位信息對動態蛋白質網絡進行了凈化處理,最后在凈化的動態蛋白質網絡上進行關鍵蛋白質預測,同樣發現動態蛋白質網絡比靜態蛋白質網絡能夠更加有效地預測關鍵蛋白質[129].

基于蛋白質網絡預測未知的蛋白質功能是生物信息學中一個十分重要的研究課題.特別是動態蛋白質網絡的快速發展,通過融合多元生物信息,能夠提供一個更加有效的網絡,提高蛋白質功能預測的準確率.Zhao等人[81]認為減少假陽性和假陰性造成的負面影響是提高蛋白質功能預測性能的關鍵和瓶頸,利用蛋白質結構域信息、蛋白質復合物信息及蛋白質網絡拓撲特性構建加權動態蛋白質網絡來進行蛋白質功能預測,實驗結果驗證了動態加權網絡的有效性.Greene等人[130]構建了一個包含144個人類組織和細胞類型的組織特異性交互網絡,從全基因關聯的角度預測蛋白質功能.

5.3 生物標志物識別

生物標志物是一種在正常生理過程、病理或治療過程中能夠客觀測量的生物信號,能夠對疾病進行早期的診斷并預測和監測治療反應和不良反應,也是生物體受到損害時的重要預警指標[131-133].傳統的生物標志物多是篩選差異性表達的單個的生物大分子[134].然而,單個蛋白質或者單個基因表達數據的傳統統計方法,經常不能識別具有生物意義的生物標志物,導致預測性能低下和有限的臨床應用.疾病的發生往往是一群相關聯的分子相互作用的結果[135],因此,網絡生物標志物作為一種新型生物標志物[136-137]被提出.相比于生物分子標志物,網絡生物標志物考慮了生物分子間的關聯性,能夠更加精確地對病人進行診斷、風險評估等.動態網絡生物標志物是在疾病發展過程中,從疾病的不同階段進行檢測和評估,表現為時間依賴性改變的網絡生物標志物[138].Chen等人[139-143]提出了一系列的動態網絡生物標志物的篩選方法,他們把疾病的發病過程分為3種狀態:正常狀態(normal state)、發病前狀態或臨界狀態(pre-disease state or critical state)和疾病狀態(disease state).正常狀態是健康階段的穩態,疾病尚處在控制中;發病前狀態是正常狀態的臨界點,這個階段是不穩定的狀態,采取合適的治療,臨界狀態到正常狀態是可逆的;疾病狀態就是越過臨界點后的另一個穩態,疾病狀態到正常狀態就不可逆.動態網絡生物標志物不僅考慮了生物分子間的關系,還關注了分子網絡隨時間演化的動態特性,這有助于更全面地精確挖掘生物標識物.基于動態蛋白質網絡的生物標志物能夠在疾病發展不同的階段和時間點被監控和估計[138],因此動態網絡的生物標志物被認為是有效的檢測疾病分水嶺相關的基因或蛋白質相互作用的方式之一.Zhang等人[72]基于2組不同發展狀態的膠質瘤動態蛋白質網絡,發現了與神經膠質瘤預后有關的生物標志物.Li等人[144]識別了與流感、急性肺炎以及二型糖尿病相關的動態蛋白質網絡標志物,為揭示復雜疾病的早期診斷以及惡化機制提供了新視角.

5.4 疾病基因預測與疾病研究

大多數疾病可以在基因層面反映出來,現有的一些研究證實了功能相似的基因或者在生物網絡中有相互作用關系的基因會導致相同或者相似的疾病[145-149].基于網絡的疾病基因識別是發現疾病基因的重要方法,從拓撲結構相似性和功能相似性來分析疾病基因間的關系,對候選基因排序,進而篩選、推斷判別出疾病基因[150-152].

相比于靜態蛋白質網絡,結合蛋白質相互作用數據和基因表達數據構建的動態蛋白質網絡能夠反映出疾病隨時間和外在環境動態變化的過程.在二型的糖尿病研究中,Sun等人[73]通過比較小鼠3個組織的動態網絡,發現當發生早期肥胖機能障礙時,肝臟和肌肉組織在整個細胞周期都發生了功能紊亂.Taylor等人[87]研究了人類蛋白質網絡的動態結構,并對2組乳腺癌病人進行比較分析,發現人類蛋白質網絡的模塊化結構的改變將很可能成為乳腺癌預測的一個新指標.Faisal等人[153]研究了年齡特異性的動態網絡,結果發現隨年齡變化,網絡的全局拓撲特性并未有很大的改變,但是局部有改變.與這種變化關聯的基因稱為年齡相關基因(aging-related genes),這些基因被驗證和多種與年齡相關疾病的發生有關系.Yu等人[154]基于動態差異性表達網絡研究了糖尿病有關生物通路問題,相比于靜態網絡,動態網絡能夠找到更精確的生物通路.

因此,基于動態蛋白質網絡識別出疾病基因和疾病通路,有助于疾病治療藥物的開發;同時還能夠篩選出更加精確地生物標志物,能夠為疾病的診斷和分類提供必要的技術手段.

6 挑戰與展望

動態蛋白質網絡可以為生物信息學和系統生物學的研究提供一個更綜合、更全面的框架.特別是在臨床疾病研究和個性化醫療中,為特殊研究目的而構建動態蛋白質網絡將變得越來越普及.然而,由于目前能夠獲得的蛋白質相互作用數據的不完整性,以及基因表達數據中存在的噪聲,如何構建更加有效的動態蛋白質網絡仍面臨諸多挑戰.

1) 數據降噪處理

目前常用的動態蛋白質網絡構建方法使用的數據主要是PPI數據和基因表達數據,由于諸多因素的影響,這2類數據存在著顯著比例的噪聲,如何降低蛋白質網絡中的假陽性問題?如何分析微陣列基因表達數據中的噪音,提出系統的方法來提取蛋白質表達的動態信息?這些問題都還有待深入研究并解決.

2) 多源數據融合

這里的多源有2種含義:①同種數據類型,不同平臺和技術產生的;②不同種數據類型,如多組學數據有PPI數據、基因本體(gene ontology, GO)數據、時間序列RNA-seq數據、時間序列的基因表達數據、亞細胞定位信息、疾病相關數據庫等多元信息.目前仍缺乏有效的計算方法能夠整合這些數據用于構建更加精確的動態蛋白質網絡的研究.如何對不同來源不同類型的數據進行有效的關聯分析與整合,構建有效的動態蛋白質網絡仍需深入研究.

3) 網絡可靠性評估

動態蛋白質網絡構建后,一個十分重要的挑戰就是如何提出有效的評估指標來判斷網絡的可靠性,而目前尚未有統一的評價標準.已知的蛋白質網絡可靠性評估手段主要分為2個方面:①結合具體的應用(如蛋白質復合物識別等),對結果進行評價.將實驗結果和已知數據庫中的參考數據相比較,比較不同方法在蛋白質網絡上的敏感性和特異性.②對結果做富集性分析,統計顯著性水平,說明結果的生物學意義.在實際應用時如何對動態蛋白質相互網絡進行量化分析以及如何有效評估動態蛋白質網絡的優劣至關重要.

4) 小樣本問題

目前動態蛋白質網絡構建及后續疾病應用研究都不同程度存在小樣本問題.例如,目前能夠獲得的時間序列的基因表達數據或者RNA-seq數據的時間點一般都比較少,這對于基于蛋白質表達動態性構建方法的準確性有一定的影響.此外,基于多狀態下表達及相關性變化的方法往往需要足夠的樣本才能比較準確地度量2個生物分子間的相關性.在真實數據中,特別涉及到疾病的臨床數據時,這樣的多樣本數據往往是難以獲得的,只能獲取小樣本甚至是單樣本數據(如手術前抽血采樣等).因此,如何利用能夠獲取的小樣本甚至是單樣本數據構建有效的動態蛋白質網絡或動態生物分子網絡是亟需待解決的重要生物計算問題.

動態蛋白質網絡構建是一個循環漸進、不斷優化的過程.動態蛋白質網絡構建應該以實際應用為目的.目前,動態蛋白質網絡已經在蛋白質復合物的識別、蛋白質功能預測、生物標志物識別等方面取得了很好的成果,正逐步應用于特定復雜疾病的分類、早期診斷與后續治療等.基于復雜網絡理論,判斷網絡是否可控、篩選可靠的藥物靶標,將為新的藥物設計以及實現精準化醫療提供重要幫助.

[1]Eisenberg D, Marcotte E M, Xenarios I, et al. Protein function in the post-genomic era[J]. Nature, 2000, 405(6788): 823-826

[2]Von Mering C, Krause R, Snel B, et al. Comparative assessment of large-scale data sets of protein-protein interactions[J]. Nature, 2002, 417(6887): 399-403

[3]Albert R, Barabási A L. Statistical mechanics of complex networks[J]. Reviews of Modern Physics, 2002, 74(1): 47-97

[4]Bullmore E, Sporns O. Complex brain networks: Graph theoretical analysis of structural and functional systems[J]. Nature Reviews Neuroscience, 2009, 10(3): 186-198

[5]Pastor-Satorras R, Castellano C, Van Mieghem P, et al. Epidemic processes in complex networks[J]. Reviews of Modern Physics, 2015, 87(3): 925-979

[6]Ocone A, Haghverdi L, Mueller N S, et al. Reconstructing gene regulatory dynamics from high-dimensional single-cell snapshot data[J]. Bioinformatics, 2015, 31(12): i89-i96

[7]Vidalain P O, Boxem M, Ge H, et al. Increasing specificity in high-throughput yeast two-hybrid experiments[J]. Methods, 2004, 32(4): 363-370

[8]Bauer A, Kuster B. Affinity purification-mass spectrometry[J]. European Journal of Biochemistry, 2003, 270(4): 570-578

[9]Hu Bin, Petela N, Kurze A, et al. Biological chromodynamics: A general method for measuring protein occupancy across the genome by calibrating ChIP-seq[J]. Nucleic Acids Research, 2015, 43(20): e132

[10]Stynen B, Tournu H, Tavernier J, et al. Diversity in genetic in vivo methods for protein-protein interaction studies: From the yeast two-hybrid system to the mammalian split-luciferase system[J]. Microbiology and Molecular Biology Reviews, 2012, 76(2): 331-382

[11]Xing S, Wallmeroth N, Berendzen K W, et al. Techniques for the analysis of protein-protein interactions in vivo[J]. Plant Physiology, 2016, 171(2): 727-758

[12]Fukao Y. Protein-protein interactions in plants[J]. Plant and Cell Physiology, 2012, 53(4): 617-625

[13]Zhu H, Qian J. Applications of functional protein microarrays in basic and clinical research[J]. Advances in Genetics, 2012, 79: 123-155

[14]Peng Xiaoqing, Wang Jianxin, Peng Wei, et al. Protein-protein interactions: Detection, reliability assessment and applications[J]. Briefings in Bioinformatics, 2016: bbw066

[15]Li Zhoujun, Chen Yiming, Liu Junwan, et al. A survey of computational method in protein-protein interaction research[J]. Journal of Computer Research and Development, 2008, 45(12): 2129-2137 (in Chinese)

(李舟軍, 陳義明, 劉軍萬, 等. 蛋白質相互作用研究中的計算方法綜述[J]. 計算機研究與發展, 2008, 45(12): 2129-2137)

[16]Keskin O, Tuncbag N, Gursoy A. Predicting protein-protein interactions from the molecular to the proteome level[J]. Chemical Reviews, 2016, 116(8): 4884-4909

[17]Papanikolaou N, Pavlopoulos G A, Theodosiou T, et al. Protein-protein interaction predictions using text mining methods[J]. Methods, 2015, 74(2015): 47-53

[18]Badal V D, Kundrotas P J, Vakser I A. Text mining for protein docking[J]. PLoS Computational Biology, 2015, 11(12): e1004630

[19]Salwinski L, Miller C S, Smith A J, et al. The database of interacting proteins: 2004 update[J]. Nucleic Acids Research, 2004, 32(suppl 1): D449-D451

[20]Licata L, Briganti L, Peluso D, et al. MINT, the molecular interaction database: 2012 update[J]. Nucleic Acids Research, 2012, 40(D1): D857-D861

[21]Szklarczyk D, Franceschini A, Wyder S, et al. STRING v10: Protein-protein interaction networks, integrated over the tree of life[J]. Nucleic Acids Research, 2015, 43(D1): D447-D452

[22]Kerrien S, Aranda B, Breuza L, et al. The IntAct molecular interaction database in 2012[J]. Nucleic Acids Research, 2012, 40(D1): D841-D846

[23]Pagel P, Kovac S, Oesterheld M, et al. The MIPS mammalian protein-protein interaction database[J]. Bioinformatics, 2005, 21(6): 832-834

[24]Prasad T S K, Goel R, Kandasamy K, et al. Human protein reference database—2009 update[J]. Nucleic Acids Research, 2009, 37(suppl 1): D767-D772

[25]Kotlyar M, Pastrello C, Sheahan N, et al. Integrated interactions database: Tissue-specific view of the human and model organism interactomes[J]. Nucleic Acids Research, 2016, 44(D1): D536-D541

[26]Chatr-Aryamontri A, Breitkreutz B J, Oughtred R, et al. The BioGRID interaction database: 2015 update[J]. Nucleic Acids Research, 2015, 43(D1): D470-D478

[27]Maslov S, Sneppen K. Specificity and stability in topology of protein networks[J]. Science, 2002, 296(5569): 910-913

[28]Jonsson P F, Bates P A. Global topological features of cancer proteins in the human interactome[J]. Bioinformatics, 2006, 22(18): 2291-2297

[29]Bu Dongbo, Zhao Yi, Cai Lun, et al. Topological structure analysis of the protein-protein interaction network in budding yeast[J]. Nucleic Acids Research, 2003, 31(9): 2443-2450

[30]Yook S H, Oltvai Z N, Barabási A L. Functional and topological characterization of protein interaction networks[J]. Proteomics, 2004, 4(4): 928-942

[31]Barabasi A L, Oltvai Z N. Network biology: Understanding the cell’s functional organization[J]. Nature Reviews Genetics, 2004, 5(2): 101-113

[32]Giot L, Bader J S, Brouwer C, et al. A protein interaction map of Drosophila melanogaster[J]. Science, 2003, 302(5651): 1727-1736

[33]Han H W W, Ohn J H H, Moon J, et al. Yin and Yang of disease genes and death genes between reciprocally scale-free biological networks[J]. Nucleic Acids Research, 2013, 41(20): 9209-9217

[34]Watts D J, Strogatz S H. Collective dynamics of ‘small-world’ networks[J]. Nature, 1998, 393(6684): 440-442

[35]Del Sol A, Fujihashi H, O’Meara P. Topology of small-world networks of protein-protein complex structures[J]. Bioinformatics, 2005, 21(8): 1311-1315

[36] Leventhal G E, Hill A L, Nowak M A, et al. Evolution and emergence of infectious diseases in theoretical and real-world networks[J]. Nature Communications, 2015, 6: 6101

[37]Newman M E J, Girvan M. Finding and evaluating community structure in networks[J]. Physical Review E, 2004, 69(2): 026113

[38]Barabási A L, Gulbahce N, Loscalzo J. Network medicine: A network-based approach to human disease[J]. Nature Reviews Genetics, 2011, 12(1): 56-68

[39]Gustafsson M, Nestor C E, Zhang H, et al. Modules, networks and systems medicine for understanding disease and aiding diagnosis[J]. Genome Medicine, 2014, 6(10): 1-11

[40]Sun Huiyan, Liang Yanchun, Chen Liang, et al. An improved sum of edge clustering coefficient method for essential protein identification[J]. Journal of Bionanoscience, 2013, 7(4): 386-390

[41]Jiang Yuexu, Wang Yan, Pang Wei, et al. Essential protein identification based on essential protein-protein interaction prediction by integrated edge weights[J]. Methods, 2015, 83: 51-62

[42]Li Min, Lu Yu, Wang Jianxin, et al. A topology potential-based method for identifying essential proteins from PPI networks[J]. IEEE/ACM Trans on Computational Biology and Bioinformatics, 2015, 12(2): 372-383

[43]Li Min, Lu Yu, Niu Zhibei, et al. United complex centrality for identification of essential proteins from PPI networks[J]. IEEE/ACM Trans on Computational Biology and Bioinformatics, 2017, 14(2): 370-380

[44]Tang Xiwei, Wang Jianxin, Zhong Jiancheng, et al. Predicting essential proteins based on weighted degree centrality[J]. IEEE/ACM Trans on Computational Biology and Bioinformatics, 2014, 11(2): 407-418

[45]Wang Jie, Liang Jiye, Zheng Wenping. A graph clustering method for detecting protein complexes[J]. Journal of Computer Research and Development, 2015, 52(8): 1784-1793 (in Chinese)

(王杰, 梁吉業, 鄭文萍. 一種面向蛋白質復合體檢測的圖聚類方法[J]. 計算機研究與發展, 2015, 52(8): 1784-1793)

[46]Wang Jianxin, Li Min, Deng Youping, et al. Recent advances in clustering methods for protein interaction networks[J]. BMC Genomics, 2010, 11(Suppl 3): S10

[47]Srihari S, Leong H W. A survey of computational methods for protein complex prediction from protein interaction networks[J]. Journal of Bioinformatics and Computational Biology, 2013, 11(02): 1230002

[48]Srihari S, Yong C H, Patil A, et al. Methods for protein complex prediction and their contributions towards understanding the organisation, function and dynamics of complexes[J]. FEBS Letters, 2015, 589(19): 2590-2602

[49]Guo Xingli, Gao Lin, Chen Xin. Models and algorithms for alignment of biological networks[J]. Journal of Software, 2010, 21(9): 2089-2106 (in Chinese)

(郭杏莉, 高琳, 陳新. 生物網絡比對的模型與算法[J]. 軟件學報, 2010, 21(9): 2089-2106)

[50]Kelley B P, Sharan R, Karp R M, et al. Conserved pathways within bacteria and yeast as revealed by global protein network alignment[J]. Proceedings of the National Academy of Sciences, 2003, 100(20): 11394-11399

[51]Zhang Shihua, Zhang Xiangsun, Chen Luonan. Biomolecular network querying: A promising approach in systems biology[J]. BMC Systems Biology, 2008, 2(1): 5

[52]Xie Jiang, Zhang Wu, Zhang Shihua, et al. A parallel method for querying target subnetwork in a biomolecular molecular network[J]. Int Journal of Numerical Analysis and Modeling, 2012, 9(2): 326-337

[53]Sharan R, Suthram S, Kelley R M, et al. Conserved patterns of protein interaction in multiple species[J]. Proceedings of the National Academy of Sciences, 2005, 102(6): 1974-1979

[54]Clark C, Kalita J. A comparison of algorithms for the pairwise alignment of biological networks[J]. Bioinformatics, 2014, 30(16): 2351-2359

[56]Zhang Xiaochi, Yu Hua, Gong Xiujun. A random walk based iterative weighted algorithm for sub-graph query[J]. Journal of Computer Research and Development, 2015, 52(12): 2824-2833 (in Chinese)

(張小馳, 于華, 宮秀軍. 一種基于隨機游走的迭代加權子圖查詢算法[J]. 計算機研究與發展, 2015, 52(12): 2824-2833)

[57]Blum T, Kohlbacher O. MetaRoute: Fast search for relevant metabolic routes for interactive network navigation and visualization[J]. Bioinformatics, 2008, 24(18): 2108-2109

[58]Tian Y, McEachin R C, Santos C, et al. SAGA: A subgraph matching tool for biological graphs[J]. Bioinformatics, 2007, 23(2): 232-239

[59]Wang Jianxin, Peng Xiaoqing, Peng Wei, et al. Dynamic protein interaction network construction and applications[J]. Proteomics, 2014, 14(4/5): 338-352

[60]Tang Xiwei, Wang Jianxin, Liu Binbin, et al. A comparison of the functional modules identified from time course and static PPI network data[J]. BMC Bioinformatics, 2011, 12(1): 339

[61]De Lichtenberg U, Jensen L J, Brunak S, et al. Dynamic complex formation during the yeast cell cycle[J]. Science, 2005, 307(5710): 724-727

[62]Hegde S R, Manimaran P, Mande S C. Dynamic changes in protein functional linkage networks revealed by integration with gene expression data[J]. PLoS Comput Biology, 2008, 4(11): e1000237

[63]Wang Jianxin, Peng Xiaoqing, Li Min, et al. Construction and application of dynamic protein interaction network based on time course gene expression data[J]. Proteomics, 2013, 13(2): 301-312

[64]Shen Xianjun, Yi Li, Jiang Xingpeng, et al. Mining temporal protein complex based on the dynamic PIN weighted with connected affinity and gene co-expression[J]. PLoS ONE, 2016, 11(4): e0153967

[65]Zhang Yijia, Lin Hongfei, Yang Zhihao, et al. Construction of dynamic probabilistic protein interaction networks for protein complex identification[J]. BMC Bioinformatics, 2015, 17(1): 186-186

[66]De Lichtenberg U, Jensen L J, Fausb?ll A, et al. Comparison of computational methods for the identification of cell cycle-regulated genes[J]. Bioinformatics, 2005, 21(7): 1164-1171

[67]Tu B P, Kudlicki A, Rowicka M, et al. Logic of the yeast metabolic cycle: Temporal compartmentalization of cellular processes[J]. Science, 2005, 310(5751): 1152-1158

[68]Greenbaum D, Colangelo C, Williams K, et al. Comparing protein abundance and mRNA expression levels on a genomic scale[J]. Genome Biology, 2003, 4(9): 117

[69]Xiao Qianghua, Wang Jianxin, Peng Xiaoqing, et al. Detecting protein complexes from active protein interaction networks constructed with dynamic gene expression profiles[J]. Proteome Science, 2013, 11(S1): S20

[70]Komurov K, White M. Revealing static and dynamic modular architecture of the eukaryotic protein interaction network[J]. Molecular Systems Biology, 2007, 3(1): 110

[71]Xia Kai, Xue Huiling, Dong Dong, et al. Identification of the proliferation/differentiation switch in the cellular network of multicellular organisms[J]. PLoS Computa-tional Biology, 2006, 2(11): e145

[72]Zhang Xiaoyu, Yang Hongbin, Gong Binsheng, et al. Combined gene expression and protein interaction analysis of dynamic modularity in glioma prognosis[J]. Journal of Neuro-Oncology, 2012, 107(2): 281-288

[73]Sun Shaoyan, Liu Zhiping, Zeng Tao, et al. Spatio-temporal analysis of type 2 diabetes mellitus based on differential expression networks[J]. Scientific Reports, 2013, 3(2): 468-473

[74]Shang Xuequn, Wang Yu, Chen Bolin. Identifying essential proteins based on dynamic protein-protein interaction networks and RNA-Seq datasets[J]. Science China Information Sciences, 2016, 59(7): 1-11

[75]Xue Huiling, Xian Bo, Dong Dong, et al. A modular network model of aging[J]. Molecular Systems Biology, 2007, 3(1): 147

[76]Oh S, Song S, Grabowski G, et al. Time series expression analyses using RNA-seq: A statistical approach[J]. BioMed Research International, 2013(3): 203681

[77]Bossi A, Lehner B. Tissue specificity and the human protein interaction network[J]. Molecular Systems Biology, 2009, 5(1): 260

[78]Su A I, Cooke M P, Ching K A, et al. Large-scale analysis of the human and mouse transcriptomes[J]. Proceedings of the National Academy of Sciences, 2002, 99(7): 4465-4470

[79]Su A I, Wiltshire T, Batalov S, et al. A gene atlas of the mouse and human protein-encoding transcriptomes[J]. Proceedings of the National Academy of Sciences, 2004, 101(16): 6062-6067

[80]Boisvert F M, Lam Y W, Lamont D, et al. A quantitative proteomics analysis of subcellular proteome localization and changes induced by DNA damage[J]. Molecular & Cellular Proteomics, 2010, 9(3): 457-470

[81]Zhao Bihai, Wang Jianxin, Li Min, et al. A new method for predicting protein functions from dynamic weighted interactome networks[J]. IEEE Trans on Nanobioscience, 2016, 15(2): 131-139

[82]Hu Sai, Xiong Huijun, Zhao Bihai, et al. Construction of dynamic-weighted protein interactome network and its application[J]. Acta Automatica Sinica, 2015, 41(11): 1893-1900 (in Chinese)

(胡賽, 熊慧軍, 趙碧海, 等. 動態加權蛋白質相互作用網絡構建及其應用研究[J]. 自動化學報, 2015, 41(11): 1893-1900)

[83]Yang J, Wagner S A, Beli P. Illuminating spatial and temporal organization of protein interaction networks by mass spectrometry-based proteomics[J]. Frontiers in Genetics, 2015, 6: 344

[84]Meng Xiangmao, Li Min, Wang Jianxin, et al. Construction of the spatial and temporal active protein interaction network for identifying protein complexes[C] //Proc of 2016 IEEE Int Conf on Bioinformatics and Biomedicine(BIBM). Piscataway, NJ: IEEE, 2016: 631-636

[85]Tokuriki N, Tawfik D S. Protein dynamism and evolvability[J]. Science, 2009, 324(5924): 203-207

[86]Han J D J, Bertin N, Hao T, et al. Evidence for dynamically organized modularity in the yeast protein-protein interaction network[J]. Nature, 2004, 430(6995): 88-93

[87]Taylor I W, Linding R, Warde-Farley D, et al. Dynamic modularity in protein interaction networks predicts breast cancer outcome[J]. Nature Biotechnology, 2009, 27(2): 199-204

[88]Liu Wei, Xie Hongwei. Construction and analysis of dynamic molecular networks[J]. Progress in Biochemistry and Biophysics, 2014, 41(2): 115-125 (in Chinese)

(劉偉, 謝紅衛. 動態分子網絡的構建與分析[J]. 生物化學與生物物理進展, 2014, 41(2): 115-125)

[89]Przytycka T M, Singh M, Slonim D K. Toward the dynamic interactome: It’s about time[J]. Briefings in Bioinformatics, 2010, 11(1): 15-29

[90]Hegele A, Kamburov A, Grossmann A, et al. Dynamic protein-protein interaction wiring of the human spliceosome[J]. Molecular Cell, 2012, 45(4): 567-580

[91]Schaefer M H, Lopes T J S, Mah N, et al. Adding protein context to the human protein-protein interaction network to reveal meaningful interactions[J]. PLoS Computational Biology, 2013, 9(1): e1002860

[92]Will T, Helms V. PPIXpress: Construction of condition-specific protein interaction networks based on transcript expression[J]. Bioinformatics, 2016, 32(4): 571-578

[93]Dezs? Z, Nikolsky Y, Sviridov E, et al. A comprehensive functional analysis of tissue specificity of human gene expression[J]. BMC Biology, 2008, 6(1): 49

[94]Fagerberg L, Hallstr?m B M, Oksvold P, et al. Analysis of the human tissue-specific expression by genome-wide integration of transcriptomics and antibody-based proteomics[J]. Molecular & Cellular Proteomics, 2014, 13(2): 397-406

[95]Lichtenstein I, Charleston M A, Caetano T S, et al. Active subnetwork recovery with a mechanism-dependent scoring function; with application to angiogenesis and organogenesis studies[J]. BMC Bioinformatics, 2013, 14(1): 59

[96]Mitra K, Carvunis A R, Ramesh S K, et al. Integrative approaches for finding modular structure in biological networks[J]. Nature Reviews Genetics, 2013, 14(10): 719-732

[97]Wu G, Stein L. A network module-based method for identifying cancer prognostic signatures[J]. Genome Biology, 2012, 13(12): R112

[98]Zhang W, Ota T, Shridhar V, et al. Network-based survival analysis reveals subnetwork signatures for predicting outcomes of ovarian cancer treatment[J]. PLoS Computational Biology, 2013, 9(3): e1002975

[99]Zhang Xindong, Gao Lin, Liu Zhiping, et al. Identifying module biomarker in type 2 diabetes mellitus by discriminative area of functional activity[J]. BMC Bioinformatics, 2015, 16(1): 92

[100]Bisson N, James D A, Ivosev G, et al. Selected reaction monitoring mass spectrometry reveals the dynamics of signaling through the GRB2 adaptor[J]. Nature Biotechnology, 2011, 29(7): 653-658

[101]Lu Xingyu, Zhao B S, He Chuan. TET family proteins: Oxidation activity, interacting molecules, and functions in diseases[J]. Chemical Reviews, 2015, 115(6): 2225-2239

[102]Hinkelmann F, Brandon M, Guang B, et al. ADAM: Analysis of discrete models of biological systems using computer algebra[J]. BMC Bioinformatics, 2011, 12(1): 295

[103]Killcoyne S, Carter G W, Smith J, et al. Cytoscape: A community-based framework for network modeling[J]. Methods in Molecular Biology, 2009, 563: 219-239

[104]Tang Yu, Li Min, Wang Jianxin, et al. CytoNCA: A cytoscape plugin for centrality analysis and evaluation of protein interaction networks[J]. Biosystems, 2015, 127: 67-72

[105]Bader G D, Hogue C W V. An automated method for finding molecular complexes in large protein interaction networks[J]. BMC Bioinformatics, 2003, 4(1): 2

[106]Wang Jianxin, Zhong Jiancheng, Chen Gang, et al. ClusterViz: A cytoscape APP for cluster analysis of biological network[J]. IEEE/ACM Trans on Computational Biology and Bioinformatics, 2015, 12(4): 815-822

[107]Nepusz T, Yu Haiyuan, Paccanaro A. Detecting overlapping protein complexes in protein-protein interaction networks[J]. Nature Methods, 2012, 9(5): 471-472

[108]Goenawan I H, Bryan K, Lynn D J. DyNet: Visualization and analysis of dynamic molecular interaction networks[J]. Bioinformatics, 2016, 32(17:btw187)

[109]Jeong H, Mason S P, Barabási A L, et al. Lethality and centrality in protein networks[J]. Nature, 2001, 411(6833): 41-44

[110]Wuchty S, Stadler P F. Centers of complex networks[J]. Journal of Theoretical Biology, 2003, 223(1): 45-53

[111]Joy M P, Brock A, Ingber D E, et al. High-betweenness proteins in the yeast protein interaction network[J]. BioMed Research International, 2005, 2005(2): 96-103

[112]Bastian M, Heymann S, Jacomy M. Gephi: An open source software for exploring and manipulating networks[J]. ICWSM, 2009, 8: 361-362

[113]Breitkreutz B J, Stark C, Tyers M. Osprey: A network visualization system[J]. Genome Biology, 2003, 4(3): R22[114]Batagelj V, Mrvar A. Pajek—Analysis and visualization of large networks[G] //LNCS 2265: Graph Drawing Software. Berlin: Springer, 2004: 77-103

[115]Li Min, Tang Yu, Wu Xuehong, et al. C-DEVA: Detection, evaluation, visualization and annotation of clusters from biological networks[J]. Biosystems, 2016, 150: 78-86

[116]Calvano S E, Xiao Wenzhong, Richards D R, et al. A network-based analysis of systemic inflammation in humans[J]. Nature, 2005, 437(7061): 1032-1037

[117]Luo Fei, Liu Juan, Li Jinyan. Discovering conditional co-regulated protein complexes by integrating diverse data sources[J]. BMC Systems Biology, 2010, 4(Suppl 2): S4

[118]Ou-Yang Le, Dai Daoqing, Li Xiaoli, et al. Detecting temporal protein complexes from dynamic protein-protein interaction networks[J]. BMC Bioinformatics, 2014, 15(1): 335

[119]Lei Xiujuan, Wang Fei, Wu Fangxiang, et al. Protein complex identification through Markov clustering with firefly algorithm on dynamic protein-protein interaction networks[J]. Information Sciences, 2016, 329(6): 303-316

[120]Clark W, Radivojac P. Analysis of protein function and its prediction from amino acid sequence[J]. Proteins, 2011, 79(7): 2086-2096

[121]Gaudet P, Livstone M, Lewis S, et al. Phylogenetic-based propagation of functional annotations within the gene ontology consortium[J]. Briefings in Bioinformatics, 2011, 12(5): 449-462

[122]Estrada E, Rodríguez-Velázquez J A. Subgraph centrality in complex networks[J]. Physical Review E, 2005, 71(5): 056103

[123]Li Min, Wang Jianxin, Chen Xiang, et al. A local average connectivity-based method for identifying essential proteins from the network level[J]. Computational Biology and Chemistry, 2011, 35(3): 143-150

[124]Wang Jianxin, Li Min, Wang Huan, et al. Identification of essential proteins based on edge clustering coefficient[J]. IEEE/ACM Trans on Computational Biology and Bioinformatics, 2012, 9(4): 1070-1080

[125]Li Min, Lu Yu, Niu Zhibei, et al. United complex centrality for identification of essential proteins from PPI networks[J]. IEEE/ACM Trans on Computational Biology and Bioinformatics, 2017, 14(2): 370-380

[126]Peng Wei, Wang Jianxin, Wang Weiping, et al. Iteration method for predicting essential proteins based on orthology and protein-protein interaction networks[J]. BMC Systems Biology, 2012, 6(1): 87

[127]Li Gaoshi, Li Min, Wang Jianxin, et al. Predicting essential proteins based on subcellular localization, orthology and PPI networks[J]. BMC Bioinformatics, 2016, 17(Suppl 8): 279

[128]Xiao Qianghua, Wang Jianxin, Peng Xiaoqing, et al. Identifying essential proteins from active PPI networks constructed with dynamic gene expression[J]. BMC Genomics, 2015, 16(Suppl 3): S1

[129]Li Min, Chen Xiaopei, Ni Peng, et al. Identifying essential proteins by purifying protein interaction networks[C] //Proc of Int Symp on Bioinformatics Research and Applications. Berlin: Springer, 2016: 106-116

[130]Greene C S, Krishnan A, Wong A K, et al. Understanding multicellular function and disease with human tissue-specific networks[J]. Nature Genetics, 2015, 47(6): 569-576

[131]Wang Jian, Wu Xiaodan, Chen Luonan, et al. Network biomarkers, interaction networks and dynamical network biomarkers in respiratory diseases[J]. Translational Medicine Research(Electronic Edition), 2014, 4(3): 40-47 (in Chinese)

(王堅, 吳曉丹, 陳羅南, 等. 網絡生物標志物, 交互網絡和動態網絡生物標志物在呼吸系統疾病中的研究進展[J]. 轉化醫學研究(電子版), 2014, 4(3): 40-47)

[132]Simon R. Development and validation of therapeutically relevant multi-gene biomarker classifiers[J]. Journal of the National Cancer Institute, 2005, 97(12): 866-867

[133]Ludwig J A, Weinstein J N. Biomarkers in cancer staging, prognosis and treatment selection[J]. Nature Reviews Cancer, 2005, 5(11): 845-856

[134]Rhodes D R, Sanda M G, Otte A P, et al. Multiplex biomarker approach for determining risk of prostate-specific antigen-defined recurrence of prostate cancer[J]. Journal of the National Cancer Institute, 2003, 95(9): 661-668

[135]Schadt E E. Molecular networks as sensors and drivers of common human diseases[J]. Nature, 2009, 461(7261): 218-223

[136]Wang Y C, Chen B S. A network-based biomarker approach for molecular investigation and diagnosis of lung cancer[J]. BMC Medical Genomics, 2011, 4(1): 2

[137]Jin Nana, Wu Hao, Miao Zhengqiang, et al. Network-based survival-associated module biomarker and its crosstalk with cell death genes in ovarian cancer[J]. Scientific Reports, 2015, 5: 1566

[138]Wang Xiangdong. Role of clinical bioinformatics in the development of network-based biomarkers[J]. Journal of Clinical Bioinformatics, 2010, 1(1): 28

[139]Chen Luonan, Liu Rui, et al. Detecting early-warning signals for sudden deterioration of complex diseases by dynamical network biomarkers[J]. Scientific Reports, 2012, 2: 342

[140]Liu Rui, Li Meiyi, et al. Identifying critical transitions and their leading biomolecular networks in complex diseases[J]. Scientific Reports, 2012, 2: 813

[141]Liu Rui, Wang Xiangdong, Aihara K, et al. Early diagnosis of complex diseases by molecular biomarkers, network biomarkers, and dynamical network biomarkers[J]. Medicinal Research Reviews, 2014, 34(3): 455-478

[142]Li Meiyi, Zeng Tao, Liu Rui, et al. Detecting tissue-specific early warning signals for complex diseases based on dynamical network biomarkers: Study of type 2 diabetes by cross-tissue analysis[J]. Briefings in Bioinformatics, 2014, 15(2): 229-243

[143]Liu Rui, Yu Xiangtian, Liu Xiaoping, et al. Identifying critical transitions of complex diseases based on a single sample[J]. Bioinformatics, 2014, 30(11): 1579-1586

[144]Li Yuanyuan, Jin Suoqin, Lei Lei, et al. Deciphering deterioration mechanisms of complex diseases based on the construction of dynamic networks and systems analysis[J]. Scientific Reports, 2015, 5: 9283

[145]Liu C C, Tseng Y T, Li Wenyun, et al. DiseaseConnect: A comprehensive Web server for mechanism-based disease-disease connections[J]. Nucleic Acids Research, 2014, 42(W1): W137-W146

[146]Zeng Tao, Zhang Chuanchao, Zhang Wanwei, et al. Deciphering early development of complex diseases by progressive module network[J]. Methods, 2014, 67(3): 334-343

[147]Cho D Y, Kim Y A, Przytycka T M. Network biology approach to complex diseases[J]. PLoS Computational Biology, 2012, 8(12): e1002820

[148]Chakravarti A, Clark A G, Mootha V K. Distilling pathophysiology from complex disease genetics[J]. Cell, 2013, 155(1): 21-26

[149]Hormozdiari F, Penn O, Borenstein E, et al. The discovery of integrated gene networks for autism and related disorders[J]. Genome Research, 2015, 25(1): 142-154

[150]Li Min, Li Qi, Ganegoda G U, et al. Prioritization of orphan disease-causing genes using topological feature and GO similarity between proteins in interaction networks[J]. Science China Life Sciences, 2014, 57(11): 1064-1071

[151]Ganegoda G U,Wang Jianxin, Wu Fangxiang, et al. Prediction of disease genes using tissue-specified gene-gene network[J]. BMC Systems Biology, 2014, 8(Suppl 3): S3

[152]Lan Wei, Wang Jianxin, Li Min, et al. Computational approaches for prioritizing candidate disease genes based on PPI networks[J]. Tsinghua Science and Technology, 2015, 20(5): 500-512

[154]Yu Xiangtian, Zeng Tao, Li Guojun. Integrative enrichment analysis: A new computational method to detect dysregulated pathways in heterogeneous samples[J]. BMC Genomics, 2015, 16(1): 918

Li Min, born in 1978. Professor and PhD supervisor. Member of CCF. She is an awardee of the NSFC Excellent Young Scholars Program in 2016. Her main research interests include bioinformatics, data mining, and deep learning.

Meng Xiangmao, born in 1989. PhD candidate at Central South University. His main research interests include bioin-formatics, complex network analysis, data mining.

The Construction, Analysis, and Applications of Dynamic Protein-Protein Interaction Networks

Li Min and Meng Xiangmao

(SchoolofInformationScienceandEngineering,CentralSouthUniversity,Changsha410083)

The rapid development of proteomics and high-throughput technologies, has produced a large amount of protein-protein interaction (PPI) data, which provides a foundation for further understanding the interactions between proteins and the biomedical mechanism of complex diseases. In an organism, a protein-protein interaction network (PIN) consists of all the proteins and their interactions. Most of the traditional studies on PINs are based on static networks. However, due to the dynamics of protein expressions and the dynamics of PPIs, the real PINs change with time and conditions. Protein function modules related with the occurrence and development of diseases are also bound with this dynamic change. Researchers have shifted their attentions from the static properties to dynamic properties, and proposed a series of methods for the construction of dynamic PINs. This paper is to review the construction, analysis and applications of dynamic PINs. Firstly, the existing dynamic PIN construction methods are discussed in three categories: the methods based on dynamic protein expressions, the methods based on multi-state expression and correlation changes and the methods based on spatial-temporal dynamic changes. The first category embodies the protein dynamic expression varying with time; the second category reflects the changes in the expression-related relationship between proteins under different conditions; while the third category describes the dynamic of proteins and the interactions in time and space. Then, the dynamic analysis of the proteins and the related subnetworks of the dynamic PINs are reviewed. Furthermore,the main applications in the complex diseases of dynamic PINs are discussed in details, such as the identification of protein complexes/functional modules, the detection of biomarkers, and the prediction of disease genes, etc. Finally, the challenges and future research directions of dynamic PINs are discussed.

protein-protein interaction network; dynamic; gene expression; protein complexes; complex diseases

2016-11-25;

2017-03-24

國家自然科學基金優秀青年科學基金項目(61622213);國家自然科學基金項目(61232001,61370024);湖南省研究生科研創新項目(CX2017B063) This work was supported by the National Natural Science Foundation of China for Excellent Young Scientists (61622213), the National Natural Science Foundation of China (61232001, 61370024), and the Hunan Provincial Innovation Foundation for Postgraduate (CX2017B063).

TP399; Q811

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲黄色高清| 国产精品爆乳99久久| 成人免费午间影院在线观看| 欧美日本激情| 四虎成人精品在永久免费| 亚洲色大成网站www国产| 国产精品无码AV中文| 99久视频| 亚洲视频一区| 国产在线观看成人91| 五月婷婷激情四射| 日本在线亚洲| 日韩欧美中文| 大陆国产精品视频| 91 九色视频丝袜| 激情六月丁香婷婷四房播| 88av在线| 国产免费网址| 91小视频在线观看免费版高清| 五月激激激综合网色播免费| 视频在线观看一区二区| 少妇人妻无码首页| 久久免费视频6| 国产系列在线| 91麻豆精品视频| 国产女人18水真多毛片18精品| 国产午夜精品一区二区三区软件| a毛片免费观看| 婷婷六月综合网| 欧美精品三级在线| 99久久国产综合精品女同| 欧美成人怡春院在线激情| 午夜精品一区二区蜜桃| 99热国产在线精品99| 亚洲第一av网站| 久久精品中文无码资源站| 日韩成人午夜| 亚洲二区视频| 夜夜操天天摸| 国产一区二区三区在线观看视频| 日韩无码一二三区| 成年片色大黄全免费网站久久| 久久精品人人做人人爽电影蜜月| 99草精品视频| 久久亚洲国产视频| 黄色一及毛片| 国产精品久久久久鬼色| 国产黄在线免费观看| 欧美精品在线视频观看| 国产综合精品日本亚洲777| 国产精品免费电影| 国产无码在线调教| 欧美日在线观看| 欧美三级视频在线播放| AV网站中文| 国产亚洲精品自在线| AV天堂资源福利在线观看| 国产成人精品亚洲77美色| 日韩免费毛片视频| 国产精品自拍露脸视频| 六月婷婷综合| 国产小视频a在线观看| 久久人体视频| 久久综合色天堂av| 色综合日本| 欧美啪啪网| 午夜国产大片免费观看| 99在线小视频| 免费人成网站在线观看欧美| 国产综合在线观看视频| 一本久道久综合久久鬼色| 国产成人亚洲综合a∨婷婷| 国产成人无码Av在线播放无广告| 久久美女精品| 亚洲国产精品美女| 亚洲日本中文字幕乱码中文| 91成人免费观看在线观看| 亚洲,国产,日韩,综合一区| 亚洲浓毛av| 99久久无色码中文字幕| 大学生久久香蕉国产线观看| 精品一区二区久久久久网站|