





摘要:活性物質的篩選在疾病預防和治療中具有至關重要的作用。然而,傳統方法在復雜疾病藥物篩選時存在一定的局限性。隨著網絡醫學的發展,基于蛋白質相互作用網絡的虛擬篩選技術為活性物質的發現提供了新的途徑。基于網絡醫學框架的網絡鄰近度計算方法表現尤為突出。本文介紹了新開發的計算平臺ZMUpredict,該平臺基于網絡鄰近度原理,整合疾病基因和活性物質的靶點,能夠快速預測候選活性物質對疾病的潛在療效。用戶提交活性物質靶點和疾病基因集后,平臺能夠自動生成分析結果,并通過Z值和P值量化活性物質靶點與疾病模塊之間的網絡距離,從而評估其治療潛力。此外,該平臺還支持聯合用藥分析和子網絡提取功能。本文通過以山茶油活性成分篩選為例,展示了該平臺在天然產物和中藥研究中的應用前景。ZMUpredict 為研究人員提供了便捷的虛擬篩選工具,即使不具備編程技能的用戶也能利用網絡醫學方法開展高效的活性物質虛擬篩選,為復雜疾病的藥物發現提供強有力的技術支持。
關鍵詞:網絡醫學;網絡鄰近度;活性物質篩選;老藥新用;中藥
中圖分類號:R914.2 文獻標志碼:A 文章編號:0253-2395(2025)02-0314-08
0引言
傳統的藥物篩選方法主要依賴于高通量篩選技術和基于靶標的篩選策略。高通量篩選通過體外測試大量化合物以發現潛在藥物,盡管該方法具有規模大、技術成熟的優勢,但其成本高昂、篩選周期較長,對復雜疾病的成功率偏低,存在明顯的局限性。基于靶標的篩選策略則聚焦于特定的生物靶點進行藥物設計與篩選。然而,隨著對疾病病理機制研究的深入,越來越多的證據表明,許多疾病的發生并非由單一靶點引發,而是由多個因素和復雜的分子網絡共同作用。單靶點策略在應對這些復雜疾病時難以有效解決多因素疾病的系統性問題,療效有限[1]。此外,傳統篩選方法往往忽略了生物網絡中基因、蛋白質的相互作用及多層次生物系統之間的復雜聯系,在復雜疾病治療中的應用存在顯著局限性。。
為克服傳統篩選方法的局限性,近年來提出了基于網絡靶標的活性物質篩選方案[2]。其中,基于疾病模塊與藥物靶標在生物網絡中的鄰近度,通過量化其在網絡中的距離,提供了一種系統化的藥物篩選策略[3]。網絡鄰近度方法與傳統網絡藥理學方法的主要區別在于預測藥物或者活性成分的原理不同。本文將系統闡述基于網絡鄰近度篩選方法的理論基礎、實施步驟及其在中藥與西藥活性物質篩選中的應用,期望為藥物研發和疾病機制研究提供更具系統性和前瞻性的理論支持與實踐參考。
1基于網絡鄰近度的活性物質篩選原理與方法
1.1網絡鄰近度的原理
網絡醫學是一種基于人類蛋白質相互作用組(interactome)研究疾病機制的理論框架,最早由美國哈佛醫學院的Barabsi 教授及其團隊提出[4]。網絡醫學的核心觀點是,由于細胞內外復雜的分子功能相互依賴,大多數疾病的發生并非由單一基因異常引起,而是由多個分子網絡的紊亂所導致[4]。通過對這些復雜網絡的深入分析,研究者能夠更加全面地理解疾病的分子基礎。基于網絡醫學的研究結果表明,某些疾病的相關基因或蛋白質往往聚集于人類蛋白質相互作用組的特定區域,形成所謂的“ 疾病模塊”[4]。這些模塊由疾病的分子決定因素組成。精確識別并分析這些模塊對于系統性理解疾病的病理機制至關重要。通過量化“ 疾病模塊”之間的重疊與分離程度,學者們引入了基于網絡的分離度(sAB)這一指標,以評估不同模塊間的相互關系。如果兩個“ 疾病模塊”在蛋白質相互作用組中存在重疊,提示這兩種疾病可能具有相似的分子機制和臨床表現[5]。因此,基于人類蛋白質相互作用網絡的研究不僅能夠揭示疾病-疾病之間的關聯,還為藥物-疾病、藥物-藥物關系的研究提供策略。
在此基礎上,基于網絡醫學框架的網絡鄰近度(network proximity)方法應運而生。該方法通過收集疾病基因集合與活性物質靶點,量化二者在網絡中的距離,從而實現藥物的快速篩選[6-7]。本文中,活性物質包括中藥、功能食品的活性成分以及西藥化合物。研究表明,活性物質與疾病之間的網絡鄰近度越小,表明該物質對特定疾病的干預潛力越大。這種研究方法的思路屬于網絡藥理學的研究范疇,強調從系統角度解釋藥物作用機制[8],并與中醫通過調節生物網絡以恢復機體平衡的理念[6]具有相似性。此外,基于該方法的網絡分析,優勢之一是特別適用于復雜疾病的“ 老藥新用”篩選[9]。
在網絡鄰近度方法中,復雜的細胞系統被簡化概括為由節點和邊構成的網絡,其中節點代表系統的組成部分,包括代謝物、蛋白質、RNA 分子和基因,邊則表示它們之間的物理、生化或功能的相互作用。通過這種方式,可以構建細胞成分的相互作用網絡[10]。在基于人類蛋白質相互作用網絡的虛擬藥物篩選中,“網絡鄰近度”用于量化活性物質靶點與疾病基因(疾病模塊)之間的相互作用[11]。原理如圖1 所示,紅色節點代表與疾病相關的基因,綠色和藍色節點分別代表藥物成分A 和成分B 的靶點。通過計算各成分的靶點與疾病基因之間的距離,可以評估不同成分對特定疾病的治療潛力。通常,活性物質靶點距離疾病模塊越近,說明其對該疾病的潛在治療效果越顯著[3]。右下方的公式展示了如何通過統計值計算成分的排名,以確定成分A 而非成分B 更適合治療某一疾病。圖2(a)列舉了該方法在不同生物活性物質中的應用實例,包括解酒及預防酒精性肝病[12-13]、改善睡眠[14-16]以及防治結腸癌[17]。
1.2網絡鄰近度的應用與方法
在人類蛋白質相互作用網絡中,有多種方法可用于量化藥物-疾病之間的距離。Barabási等提出了一種基于網絡的無監督和無偏見的框架,用于評估藥物靶點與疾病基因之間的關聯性。他們的研究比較了五種量化方法,通過測量藥物與疾病在蛋白質相互作用組中的距離來評估藥物- 疾病的關系[11]。其中,最近距離[dc,公式(1)]在識別已知藥物-疾病關聯方面表現出了最佳的準確性。該方法通過計算每個藥物的靶點到最近疾病基因的平均距離,作為藥物-疾病的鄰近度[11]。
其中,最近距離dc (S,T ) 用于表征藥物-疾病的鄰近度,S表示疾病基因集合,T表示活性物質靶點集合;s 表示集合S中的元素,即單個疾病基因;t表示集合T中的元素,即單個活性物質靶點;min 函數用于取最小值;‖T ‖表示活性物質靶點的數量。在計算藥物- 疾病網絡鄰近度后,還需考慮活性物質靶點和疾病基因的數量及其在蛋白質- 蛋白質相互作用(Protein-ProteinInteraction Networks,PPI)網絡中的連接狀態,以構建參考鄰近度分布。接下來,通過公式(2)計算鄰近度的相對大小Z 值和P 值。其中,μd (S,T ) 表示參考分布的均值,σd ( S,T ) 表示參考分布的標準差。當Z 值小于0且P值小于0.05 時,預測結果表明識別的活性成分極有可能對該疾病有效[18],根據Z 值倒序可以對候選的活性成分進行排序。
盡管網絡鄰近度方法在活性物質篩選中具有廣闊的應用前景,但其實施過程需要一定的編程技能,這對缺乏編程背景的醫藥研究人員構成了挑戰。為此,我們建立了在線平臺ZMUpredict(http://www. zmupredict. cn/),集成了鄰近度計算、子網絡提取和聯合用藥分析三個模塊(圖2(b))。研究人員只需上傳包含活性成分靶點和疾病基因的CSV 文件,系統即可自動計算網絡鄰近度,并生成相應的Z 和P 值,快速識別潛在的有效成分。
1.3聯合用藥功能
ZMUpredict 的聯合用藥模塊通過計算網絡鄰近度,評估藥物組合的潛在效果。聯合用藥常用于復雜疾病的治療,能夠在提高療效的同時降低毒性[19]。該系統通過計算活性物質靶點與疾病基因之間的分離度,預測藥物間的相互作用及副作用風險[20]。用戶可以提交多個藥物的靶點數據,系統將計算它們在PPI 網絡中的相對位置,并提供藥物組合的分離度得分。分離度越高,表明藥物組合的副作用風險越低。該模塊結合網絡鄰近度計算模塊共同使用以評估聯合用藥的效果。用戶可以通過輸入網絡鄰近度計算所得的Z 值較小的有效物質,判斷其組合物是否能夠提供更優的治療效果并減少不良反應。用戶提交的CSV 文件需包含藥物與靶點的對應關系(輸入格式參考網絡鄰近度計算模塊)。系統將計算這些藥物在人類蛋白質相互作用網絡中的相對位置,并預測它們的聯合治療效果。計算完成后,用戶將獲得一個包含藥物組合相互作用信息的CSV 文件,展示不同有效物質組合的分離度得分。得分越高,說明兩個有效物質的靶點重疊越少,副作用風險越低。
1.4提取子網絡功能使用介紹
ZMUpredict的“提取子網絡”模塊為用戶提供了分析活性物質靶點網絡與疾病基因網絡局部結構的工具。該模塊根據用戶輸入,提取特定活性物質或疾病的PPI 網絡子圖,幫助用戶理解藥物作用機制和疾病網絡基礎。用戶需提供藥物- 靶點、疾病- 基因及藥物- 疾病關系的CSV 文件(包含disease 和chemical 兩列)。通過調整是否包含內部邊及最大連接距離等參數(最大連接距離建議不超過3),計算完成后系統將返回包含邊列表和節點列表的壓縮文件,用戶可將其導入Gephi 生成可視化的活性物質- 疾病網絡圖。該功能能夠幫助用戶直觀分析藥物對疾病的分子影響,揭示其在疾病發生中的作用,并識別藥物與疾病、疾病與疾病之間的關聯及共同靶點,生成簡明的網絡圖[21]。
2具體應用實例
2.1預測山茶油抗動脈粥樣硬化的有效成分
本研究以山茶油為例,利用網絡鄰近度方法預測其抗動脈粥樣硬化的活性成分。山茶油是一種具有較高藥用和營養價值的食用油,主要從我國山茶科油茶樹的種子提取。我們前期的研究表明山茶油具有調節脂質代謝、抗炎以及抗動脈粥樣硬化等多種功能[22]。然而其有效物質基礎尚未明確。為此,本研究對山茶油的抗動脈粥樣硬化的活性物質進行了預測分析。首先,采用超高效液相色譜-串聯質譜法測定山茶油中的化學成分[23]。接著,將檢測到的每個化學成分的名稱輸入到五個不同的數據庫中,以檢索其靶點信息。成分靶點檢索的主要數據庫包括:BindingDB[24]、DrugBank[25]、TherapeuticTarget Database (TTD)[26] 、Comparative ToxicogenomicsDatabase (CTD)[27]和HIT2.0[28],最終收集了43 種成分和98 個靶點。然后,收集動脈粥樣硬化基因。根據之前的研究方法[15],采用醫學主題詞表(Medical Subject Headings,MeSH)和統一醫學語言系統(Unified" MedicalLanguage System, UMLS)對疾病名稱進行標準化。疾病基因來源于多個數據庫,如CTD[27]、GWAS(Genome-Wide Association Study Catalog)[29]、DisGeNET(Disease Gene Network )[30]和OMIM(Online Mendelian Inheritance in Man)[31]。為保證數據的質量,僅納入通過實驗驗證的、與有效物質或疾病具有直接因果關系的基因,如通過基因敲除或過表達實驗影響疾病發生的基因。最終共收集了538 個動脈粥樣硬化相關的基因。所有Entrez 基因的ID(entrez_id)均來自NCBI(National Center for Biotechnology Information),并以CSV 格式存儲以備后續使用。
上傳的活性物質靶點文件應包含三個關鍵字段:chemical(活性成分名稱)、symbol(靶點名稱)和entrez_id。相應地,疾病基因文件也應包含三列:disease(疾病名稱)、symbol(疾病基因名稱)和entrez_id。本研究通過PPI 網絡對靶點與疾病基因的Entrez ID 進行映射,并基于此計算Z 值及其對應的P 值。Z 值越小,表明活性物質靶點與疾病基因在網絡中的鄰近度越高,提示該活性物質對該疾病的潛在治療效果越顯著。結果以CSV 格式輸出,用戶可通過計算ID 提取相應的計算結果。表1 顯示了排名前五的活性成分的計算結果。在本研究中,亞油酸、硬脂酸、柚皮素、麥角固醇和β-谷甾醇被鑒定為山茶油潛在的抗動脈粥樣硬化關鍵成分。
2.2提取子網絡
在本研究中,為進一步探討山茶油活性成分靶點(藥物靶點)與動脈粥樣硬化相關基因之間的相互關系,參考文獻[12]方法,構建了活性成分-靶點-疾病基因的網絡圖(圖3)。首先,通過計算山茶油各成分與動脈粥樣硬化基因的網絡鄰近度,識別出可能的活性成分(如亞油酸和硬脂酸等)。隨后,創建包含這些成分靶點及動脈粥樣硬化基因的CSV文件,并將其輸入在線平臺的“ 提取子網絡”模塊。該平臺生成了對應活性物質- 疾病對的邊列表和節點列表,將文件導入Gephi軟件,生成活性成分與動脈粥樣硬化基因之間的網絡圖。該網絡圖直觀展示了山茶油潛在活性成分、其靶點及與動脈粥樣硬化相關的基因之間的關聯。基于網絡醫學框架的分析結果顯示,亞油酸、β-谷甾醇和柚皮素等成分是山茶油的主要生物活性成分,可能通過調控關鍵基因,如ESR1(雌激素受體α基因)、PPARA(過氧化物酶體增殖物激活受體)、AHR(芳烴受體)和CYP1A1(細胞色素P450家族1亞家族A成員1)等,發揮預防動脈粥樣硬化的作用。
2. 3兩種活性物質聯用的實例
適當的藥物聯合使用不僅能夠有效降低藥物的毒副作用,還可顯著提高治療效果。在以前的研究中,我們基于網絡的方法,采用“互補暴露”模型,初步篩選出對特定疾病可能產生協同作用的成分組合物[14]。在該模型中,當ZCAlt;0,ZCBlt;0,Plt;0.05,并SABgt;0時,提示兩種活性物質的聯合使用可能存在潛在的有益相互作用[20]。為了進一步探索這些成分的聯合協同效應,我們對已收集的活性成分及其潛在靶點數據上傳至網站中的聯合用藥功能模塊。基于網絡的預測方法生成了若干具有抗動脈粥樣硬化潛力的候選成分組合。最終分析結果支持肉桂酸(cinnamicacid)與硬脂酸(stearic acid)的聯用(圖4)。
在該組合中,ZCA 和ZCB 分別表示活性成分A(肉桂酸)和活性成分B(硬脂酸)靶點與動脈粥樣硬化基因C之間的網絡鄰近度(即Z 值),SAB則表示成分A 與成分B靶點之間的分離度值。具體分析結果顯示,肉桂酸的網絡鄰近度ZCA 為-4.70,硬脂酸的網絡鄰近度ZCB為-7.08,二者的分離度SAB值為0.21。以上數據表明,肉桂酸與硬脂酸在治療動脈粥樣硬化時可能具有協同作用。多種成分之間的互補或協同作用,可能是山茶油有效預防動脈粥樣硬化的機制之一。
3結論
本文基于網絡鄰近度的有效物質虛擬篩選方法為藥物發現提供了一種新型且高效的工具[3]。其中,ZMUpredict 平臺通過網絡鄰近度計算、聯合用藥分析和子網絡提取等功能模塊,為研究人員提供了便捷且高效的有效物質篩選途徑。未來,隨著對疾病基因、活性物質靶點和PPI 網絡研究的不斷深入,網絡醫學技術將為解析活性物質靶點與疾病基因之間的復雜相互作用提供更全面的分析。同時,人工智能技術在數據收集、處理及模型優化中的應用,將為復雜的分子網絡的分析提供強有力的技術支持。特別是在中藥研究領域,鑒于其多成分、多靶點的復雜系統特性,網絡醫學與人工智能的結合應用,將有助于更有效地揭示其藥理機制,加速發現具有治療潛力的新型成分及組合物,推動中藥現代化進程,并進一步促進其在全球醫療體系中的應用。