劉玥佩 鐘穎 張萍 楊冉瀲 李雷益
[摘要]?目的?采用生物信息學方法對特發性非肝硬化門靜脈高壓癥(idiopathic?non-cirrhotic?portal?hypertension,INCPH)的基因芯片數據進行分析,獲取疾病發生發展的關鍵基因和信號通路,預測治療INCPH的潛在中藥。方法?從基因表達綜合數據庫(gene?expression?omnibus,GEO)數據庫下載關于INCPH的基因芯片數據集GSE77627,利用R語言對數據進行標準化并篩選INCPH的差異基因(differential?genes,DEGs),并利用Metascape數據庫對所有DEGs進行基因本體(gene?ontology,GO)和京都基因與基因組百科全書(Kyoto?encyclopedia?of?genes?and?genomes,KEGG)富集分析,并通過STRING數據庫構建蛋白-蛋白互作網絡;同時,利用CytoHubba插件篩選Degree值排名前15的DEGs作為關鍵基因。隨后將關鍵基因與醫學本體信息檢索平臺互相映射,以P<0.05為標準篩選治療INCPH的潛在中藥,并從TCMSP數據庫中篩選潛在中藥有效成分,導入Cytoscape軟件構建中藥相關網絡圖,并預測關鍵作用靶點。結果?共獲得1880個DEGs,其中表達上調的基因有1061個,表達下調的基因有819個。利用STRING數據庫以及Cytoscape環境下的cytoHubba插件分析DEGs,篩選Dgree值排名15位的基因作為關鍵基因,分別是RPS27A、CDC42、EIF4E、MAPK1、PIK3R1、RPS6、RPS9、RPS8、RPL15、RPL27A、RPL24、RPL27、RPL26、RPL12和MAPK14。GO、KEGG分析顯示DEGs主要參與配子生成、糖尿病并發癥中的AGE-RAGE信號通路等信號通路。結論?篩選得到干預INCPH的潛在中藥為人參、丹參、黃芪等,可能成為INCPH治療的潛在分子藥物來源。
[關鍵詞]?特發性非肝硬化性門靜脈高壓癥;生物信息學;中藥預測
[中圖分類號]?R319????[文獻標識碼]?A ????[DOI]?10.3969/j.issn.1673-9701.2024.02.012
Screening?of?hub?genes?and?pathways?of?idiopathic?non-cirrhotic?portal?hypertension?and?prediction?of?traditional?Chinese?medicine
LIU?Yuepei,?ZONG?Ying,?ZHANG?Ping,?YANG?Ranlian,?LI?Yilei
School?of?Clinical?Medicine,?Chengdu?University?of?Chinese?Medicine,?Chengdu?611137,?Sichuan,?China
[Abstract]?Objective?To?with?analyzing?the?gene?expression?profile?of?idiopathic?non-cirrhotic?portal?hypertension?(INCPH)?by?bioinformatics?methods,?we?may?obtain?its?key?genes?and?signaling?pathways?to?explore?the?molecular?mechanism?of?INCPH?and?predict?the?potential?traditional?Chinese?medicine.?Methods?The?gene?microarray?dataset?GSE77627?on?INCPH?was?downloaded?from?gene?expression?omnibus?(GEO)?database,?the?data?were?normalized?and?screened?for?differential?genes?(DEGs)?of?INCPH?using?R?language,?and?all?DEGs?were?analyzed?for?gene?ontology?(GO)?and?Kyoto?encyclopedia?of?genes?and?genomes?(KEGG)?enrichment?using?Metascape?database,?and?protein-protein?interaction?network?was?constructed?by?STRING?database;?meanwhile?DEGs?with?the?top?15?Degree?values?were?screened?as?key?genes?using?CytoHubba?plugin.?Subsequently,?the?key?genes?were?mapped?to?each?other?with?the?medical?ontology?information?retrieval?platform?(coremine?medical)?to?screen?potential?Chinese?herbal?medicines?for?the?treatment?of?INCPH?with?P<0.05,?and?the?potent?components?that?potential?Chinese?medicines?have?were?screened?from?the?TCMSP?database,?imported?into?Cytoscape?software?to?construct?a?Chinese?medicine?correlation?network?map?and?predict?the?key?targets.?Results?A?total?of?1880?DEGs?were?screened,?including?1061?up-regulated?and?819?down-regulated?genes.?DEGs?were?analyzed?using?the?protein?interaction?database?STRING?and?cytoHubba?in?Cytoscape?software?to?obtain?key?genes,?which?were?RPS27A,?CDC42,?EIF4E,?MAPK1,?PIK3R1,?RPS6,?RPS9,?RPS8,?RPL15,?RPL27A,?RPL24,?RPL27,?RPL26,?RPL12?and?MAPK14.?The?GO?and?KEGG?analysis?mainly?involved?gamete?production?and?AGE-RAGE?signaling?pathway?in?INCPH.?Conclusion?The?potential?traditional?Chinese?medicines?screened?for?INCPH?are?Ginseng?Radix?et?Rhizoma,?Salviae?Miltiorrhizae?Radix?et?Rhizoma,?Scutellariae?Radix,?etc,?which?may?be?a?potential?source?of?molecular?drugs?for?the?treatment?of?INCPH.
[Key?words]?Idiopathic?non-cirrhotic?portal?hypertension;?Bioinformatics?(INCPH);?Prediction?of?traditional?Chinese?medicine
特發性非肝硬化性門靜脈高壓癥(idiopathic?non-cirrhotic?portal?hypertension,INCPH)是一種病因尚未清晰闡明的,由非肝硬化因素所致的肝內中小門靜脈阻塞所引起的血管性肝病[1]。Baveno?VI共識會議指出,特發性門靜脈高壓(idiopathic?portal?hypertension,IPH)、非肝硬化門靜脈纖維化(non-?cirrhotic?portal?fibrosis)和INCPH提示的臨床疾病相同[2]。其組織學特征[3]涉及多種非特異性改變,包括正竇擴張、靜脈硬化、門脈纖維化和結節性再生性增生。
INCPH在全球范圍內分布,并且在亞洲較為普遍。在過去的幾十年中,INCPH在日本和印度等已得到廣泛認可,約占PH病例的30%~40%[4]。與之不同的是,在北美和歐洲,INCPH被認為是一種罕見疾病,其僅占PH病例的3%~5%左右[5]。然而,由于對該疾病的識別經常不足,其發病率可能被低估。
迄今為止,INCPH的病理生理機制在很大程度上仍不為人知,現存相關文獻仍然較少,多種病理學實體高度依賴于組織學特征。因此,明確INCPH進展中準確可靠的基因和重要生物途徑,對于提高對INCPH的認識以期更好地服務于臨床具有重要意義。
本研究基于基因表達綜合數據庫(gene?expression?omnibus,GEO)數據庫對INCPH的基因芯片數據進行處理,篩選與INCPH相關的差異基因,并對其進行基因本體(gene?ontology,GO)富集功能與京都基因與基因組百科全書(Kyoto?encyclopedia?of?genes?and?genomes,KEGG)信號通路分析,構建蛋白互作網絡,確定關鍵基因,預測潛在治療中藥,以期為INCPH的臨床診斷和治療以及后續的相關研究提供參考。
1??資料與方法
1.1??數據提取
查找GEO(https://www.ncbi.nlm.nih.gov/geo),下載編號為GSE77627的基因表達數據集。GSE77627數據集包含18例INCPH患者和14例正常人肝組織的基因表達數據,該數據集平臺為GPL14951。
1.2??數據標準化處理
采用R4.2.1環境下的GEOquery[6]軟件包獲取GPL14951的平臺信息,并將探針名轉換為基因名,當一個基因對應多個探針時取其平均值。針對數據預處理結果,利用R語言繪制箱線圖和主成分分析圖。
1.3??差異表達基因(differentially?expressed?genes,DEGs)的篩選
以P<0.05且log2(fold?change)的絕對值>2[7]為篩選條件,使用limma包研究INCPH患者和正常人肝組織樣本之間的DEGs。同時,利用pheatmap和ggplot2軟件包分別繪制熱圖和火山圖。
1.4??關鍵基因的功能注釋
將上述DEGs導入Metascape[8]數(https://metascape.?org)據庫對上調、下調的差異基因進行GO生物功能分析與京都基因與KEGG通路富集分析。
1.5??蛋白-蛋白互作(protein-protein?interaction,PPI)網絡分析與關鍵基因篩選
以“medium?confidence>0.9”為篩選條件,利用STRING數據庫(https://string-db.org)進行PPI分析。利用Cytoscape軟件(Version?3.7.1)進行可視化分析,并繪制PPI圖。同時利用CytoHubba插件篩選出Degree值排名前15的DEGs作為關鍵基因。
1.6??潛在干預中藥預測
將上述15個關鍵基因與Coremine?Medical數據庫(https://www.coremine.com)相互映射[9],以P<0.05為標準篩選得出具有潛在干預作用的中藥。結合臨床常用藥篩選出現次數排名前3的中藥進行預測,從TCMSP數據庫(https://tcmsp-e.com)中以OB≥30%,DL≥0.18為條件篩選這3味中藥的有效成分、作用靶點,并使用Uniprot數據庫(https://?www.uniprot.org)對靶點名稱進行標準化。通過Cytoscape構建“中藥-成分-靶點”網絡圖,并分別使用CytoHubba插件中的MCC、degree、EPC算法篩選出排列前25的靶點,并最終得到其交集靶點進行可視化處理。
2??結果
2.1??芯片數據標準化和預處理結果
經過數據規范化后得到的箱式圖可見各樣本對齊較好,符合預期要求。PCA圖可以明顯觀察到INCPH患者與正常人肝組織的兩組樣本分離顯著,樣本歸一化程度較好,見圖1。
2.2??DEGs篩選結果
依據log2FC的絕對值>2的篩選條件對GSE77627數據集的基因數據進行篩選,共得到1880個DEGs。其中,呈現上調狀態的基因為1061個,呈現上調狀態的為819個,DEGs火山圖見圖1C。
2.3??上述DEGs的GO生物功能分析和KEGG富集分析
使用Metascape數據庫,選擇P<0.05,可以得到上述DEGs的GO生物功能分析與KEGG富集分析主要參與的信號通路。GO分析結果顯示,呈現上調表達的基因主要參與配子生成、細胞連接組織等生物功能;呈現下調表達的基因主要參與單羧酸代謝過程的生物功能。KEGG通路富集分析結果顯示,呈現上調表達的基因主要富集在造血細胞譜系、糖尿病并發癥中的AGE-RAGE信號通路等信號通路;呈現下調表達的基因則主要富集在癌癥中的蛋白聚糖、不飽和脂肪酸的生物合成等信號通路。
2.4??DEGs的PPI網絡構建與關鍵基因篩選
利用STRING數據庫導入Cytoscape繪制PPI網絡分析圖見圖2;利用CytoHubba提供的Degree值算法,篩選網絡圖中互作程度較高的前15個差異基因作為關鍵基因,見圖3。關鍵上調基因分別為RPS27A、CDC42、EIF4E;下調基因分別為MAPK1、PIK3R1、RPS6、RPS9、RPS8、RPL15、RPL27A、RPL24、RPL27、RPL26、RPL12、MAPK14(P均<0.01),見表1。
2.5??潛在治療中藥的預測
上述15個關鍵基因與Coremine?Medical數據庫相互映射,結合臨床常用藥物篩選出現次數排名前3中藥,即人參、(膜莢)黃芪、丹參。通過TCMSP?數據庫、Uniprot數據庫進行數據處理后,將篩選過后的清潔數據導入Cytoscape軟件,并繪制“中藥-成分-靶點”網絡圖,見圖4。使用CytoHubba插件分別按照MCC、degree、EPC算法篩選出排列前25的靶點,取交集共得到16個靶點。靶點間的不同顏色代表了值的大小,顏色越深則值越大,相關性越強。結果顯示,上述3味中藥的活性成分主要參與調控PTGS2、PTGS1、ADRB2、SCN5A等基因,可能成為治療INCPH的潛在中藥,見圖5。
3??討論
INCPH的發病機制十分復雜,目前尚不清楚。內臟血流增加和門靜脈病(由繼發于自身免疫性損傷、內皮損傷或高凝狀態的血栓形成或閉塞引起)可作為致病因素[10]。目前,對于INCPH的研究在不斷深入,但仍然缺乏對于該疾病生理病理的實體認識,且臨床可用的治療方法十分有限。本研究通過GEO數據庫提取芯片GSE77627的數據信息,通過R語言環境篩選DEGs,共識別INCPH患者與正常人肝組織的1880個差異表達基因,其中包括上調基因1061個,下調基因819個。
GO、KEGG富集分析結果證明,DEGs主要參與配子生成、糖尿病并發癥中的AGE-RAGE信號通路等生物學過程。研究已經證實,遺傳性危險因素與INCPH存在明顯的相關性[11]。配子生成素結合蛋白2(gametopoietin-binding?protein?2,GGNBP2)是配子生成素的結合蛋白,在哺乳動物配子發生等生殖相關過程發揮重要作用。研究表明,GGNBP2可以通過影響SOX9陽性Sertoli細胞的形態和功能在精子發生中起關鍵作用[12]。此外,門靜脈血管系統異常往往與纖維化的增加有關[13]。70%的患者會出現閉塞性門靜脈病變,這被認為是INCPH的標志,特點是門靜脈分支壁纖維化和不規則增厚[14]。AGE-RAGE信號通路可級聯激活與纖維化相關的生長因子,促進組織纖維化的發展,并影響RAGE的表達增加[15]。
研究表明,INCPH的發病機制與諸多免疫性疾病相關,包括系統性紅斑狼瘡[16]、常見變異型免疫缺陷癥[17]等,這些數據均表明免疫紊亂與INCPH的發病機制有關。CDC42是Rho?GTPases(Rho?GTP酶)家族的成員,CDC42分子在細胞周期調節和廣泛的組織特異性功能中起著關鍵作用[18]。研究表明,CDC42失調可能會阻礙B細胞發育和親和力成熟的多個階段,導致異常的生發中心反應和免疫缺陷,以及自身免疫和淋巴細胞增生[19]。由此推測,CDC42的失調可以誘導免疫失調,引發INCPH。
INCPH患者的治療主要集中在根據肝硬化指南預防和管理門靜脈高壓并發癥方面[20],目前暫無特效的治療方法。中醫藥傳承千年,具有其獨特的優勢。本研究基于上述15個關鍵基因,使用Coremine?Medical數據庫,結合臨床常用藥物篩選出現頻次排名前3中藥,即人參、黃芪、丹參。陸雄等[21]發現,丹酚酸B能夠降低ET-1誘導的門脈高壓。王皎皎等[22]通過實驗證實,人參皂苷Rg3能夠通過激活PI3K-Akt/PKB信號通路,抑制VEGF和ICAM-1蛋白的表達,降低門脈高壓。秦合偉等[23]則發現,黃芪甲苷能夠通過靶向調控VLDLR等抑制血管炎性反應,減輕血管內皮細胞損傷。以上眾多研究和報告證明了本研究預測的結果中藥在INCPH的干預中可能發揮確切的有效作用。
迄今為止,INCPH的病理生理機制仍未完全闡明,目前對其的研究更多集中在臨床病例研究,較少從分子角度探究INCPH的生理病理機制;且研究探析了中藥治療的可能性,有一定的創新性和研究價值。研究對INPCH的所有DEGs進行GO、KEGG富集分析,結果證明其主要參與配子生成、糖尿病并發癥中的AGE-RAGE信號通路等生物學過程。通過15個關鍵基因與Coremine?Medical數據庫的相互映射預測出的頻次排名前3位的有效中藥,即人參、黃芪、丹參主要通過調節PTGS2、PTGS1、ADRB2、SCN5A等靶點防治INCPH,這也不失為一個有意義的研究方向。綜上來看,本研究為后續INCPH的生理病理機制以及治療藥物的研究提供了可參考的方向和思路,但后續仍然需要進行多項實驗來驗證研究的真實性和準確性,以便更好地探究INCPH的生理病理機制,加強對于該疾病的實體認識,更好地指導臨床診斷和治療。
利益沖突:所有作者均聲明不存在利益沖突。
[參考文獻]
[1] 張博靜.?TIPS治療特發性非肝硬化vs.?肝硬化門脈高壓靜脈曲張出血的病例—對照研究[D].?西安:?第四軍醫大學,?2016.
[2] DE?FRANCHIS?R,?BAVENO?V.?Expanding?consensus?in?portal?hypertension:?Report?of?the?Baveno?VI?Consensus?Workshop:?Stratifying?risk?and?individualizing?care?for?portal?hypertension[J].?J?Hepatol,?2015,63(3): 743–752.
[3] SIRAMOLPIWAT?S,?SEIJO?S,?MIQUEL?R,?et?al.?Idiopathic?portal?hypertension:?natural?history?and?long-term?outcome[J].?Hepatology,?2014,?59(6):?2276–2285.
[4] GUIDO?M,?SARCOGNATO?S,?SACCHI?D,?et?al.?Pathology?of?idiopathic?non-cirrhotic?portal?hypertension[J].?Virchows?Arch,?2018,?473(1):?23–31.
[5] LEE?H,?REHMAN?A?U,?FIEL?M?I.?Idiopathic?noncirrhotic?portal?hypertension:?an?appraisal[J].?J?Pathol?Transl?Med,?2016,?50(1):?17–25.
[6] 吳丹,?王雪,?楊靜,?等.?生物信息學方法下腦老化關鍵基因與通路的篩選及中藥預測研究[J].?中國中藥雜志,?2021,?46(21):?5701–5709.
[7] 李霞,?于逸,?左海維,?等.?circRNAs對結直腸癌的抑制作用及其生物信息學分析[J].?吉林大學學報(醫學版),?2020,?46(6):?1283–1287.
[8] ZHOU?Y,?ZHOU?B,?PACHE?L,?et?al.?Metascape?provides?a?biologist-oriented?resource?for?the?analysis?of?systems-?level?datasets[J].?Nat?Commun.?2019,?10(1):?1523.
[9] 肖祥,?吳宣諭.?胰腺癌“炎-癌”轉化關鍵基因篩選及干預中藥的預測分析[J].?中草藥,?2022,?53(15):?4795–4806.
[10] SCHOUTEN?J?N,?VERHEIJ?J,?SEIJO?S.?Idiopathic?non-cirrhotic?portal?hypertension:?A?review[J].?Orphanet?J?Rare?Dis,?2015,?10:?67.