代華磊,胡成成,張桂敏,陶四明,陳建昆
(云南大學附屬醫院心血管病中心,云南 昆明 650021)
高血壓是心血管疾病共同的危險因素,高血壓的長期壓力超負荷必將引起心臟結構和功能的改變,即心室重構。心室重構是心肌細胞凋亡、心臟肥大和心肌纖維化的復雜病理過程,主要表現為左室肥厚和慢性心力衰竭,其發生率會隨著高血壓的進程逐漸上升,是人類健康的一大威脅[1]。心室重構會進一步損害心功能,最終引發心律失常、心衰、心肌梗死、猝死等嚴重并發癥[2]。
黃芪(Astragalus membranaceus)是一種傳統的中草藥,其主要成分為黃芪多糖、皂苷、黃酮類化合物等。研究表明,黃芪對心肌具有良好的保護作用,可在一定程度內控制高血壓[3-4],但其作用的分子機制尚不明確。因此,借助網絡藥理學的方法挖掘黃芪治療高血壓心室重構作用的靶點與通路,從微觀的角度科學論證黃芪治療高血壓心室重構的作用機制具有重要意義。
網絡藥理學以生物學與藥理學的交叉學科理論為基礎,從整體的角度探索藥物與疾病間的關聯性,運用各組學、高通量篩選、網絡分析等多種前沿技術,揭示 “疾病-基因-靶點-藥物”之間復雜的網絡關系,具備整體性和系統性的特點。與中藥及其方劑多組分、多靶點干預及系統調控的原理觀念基本一致,能夠多維度了解疾病的分子基礎,預測藥物潛在的藥理作用機制[5-6]。本研究基于網絡藥理學原理,結合分子對接,全面分析黃芪治療高血壓心室重構的分子機制,篩選出關鍵生物標記物,為黃芪治療高血壓心室重構提供更多潛在的生物標記物以供后續的研究。
利用TCMSP(http://tcmspw.com/tcmsp.php)數據庫搜索關鍵詞黃芪的有效成分,共獲得87 個活性藥物。使用ETCM(http://www.tcmip.cn/ETCM/index.php/Home/)數據庫獲得黃芪的有效成分,共獲得20 個活性藥物。在TCMSP 數據庫及ETCM 數據庫中篩選每種藥物活性成分對應的靶點。其中,TCMSP 數據庫共獲得藥物靶點181 個,ETCM 數據庫共獲得藥物靶點254 個。對兩個數據庫獲得的藥物靶點取并集,共獲得390 個藥物靶點。利用Genecards(https://www.genecards.org/)數據庫獲取高血壓心室重構的疾病靶點,僅保留Category為Protein Coding 的基因,共獲得3 281 個相關靶點。利用GEO 數據庫(https://www.ncbi.nlm.nih.gov/geo/)下載數據集GSE74144 的高血壓心室重構及正常樣本全血的mRNA 測序數據及樣本信息。
將高血壓心室重構作為WGCNA 的性狀數據,使用R 包“WGCNA”篩選高血壓心室重構相關的關鍵模塊及其基因。對樣本進行聚類,軟閾值β=12,構建共表達網絡,并且使用動態樹切割算法獲得模塊并分析各模塊與高血壓心室重構的相關性,篩選出關鍵模塊。利用limma 包(version3.46.0)比較基因表達水平的差異性,使用R 語言ggplot2(version3.3.3)繪制火山圖來展示基因差異表達的情況。利用R 語言VennDiagram 包(version1.6.20)對差異表達基因及相關關鍵模塊基因取交集,獲得關鍵模塊基因[7-8]。
使用R 語言VennDiagram 包對藥物靶點、疾病靶點及差異的關鍵模塊基因取交集,并使用R語言ClusterProfiler 包進行GO 功能/KEGG 通路富集分析[9]。利用Cytoscape(version3.8.2)軟件對關鍵靶點-功能、關鍵靶點-通路的調控網絡圖進行可視化[10]。
針對關鍵靶點利用STRING(https://string-db.org)網站置信度為0.4(Confidence=0.4)繪制PPI網絡,并采用cytoscape 進行可視化。
利用LASSO[11]及RF 構建高血壓心室重構的診斷模型并進行評估,并使用R 語言Venn-Diagram 包對模型基因取交集獲得生物標記物。對生物標記物進行Pearson 相關性分析,并利用R 語言ggpubr 包繪制散點圖進行可視化[12]。
對生物標記物、藥物活性成分繪制中藥藥理調控網絡,并使用Cytoscape 進行可視化。
利用 PubChem(https://pubchem.ncbi.nlm.nih.gov/)數據庫下載藥物活性成分的3D 結構。并從PDB(https://www1.rcsb.org/)數據庫得到關鍵靶點的蛋白結構,通過AutoDockTools(version1.5.6)完成蛋白質加氫、計算電荷。從PubChem(https://pubchem.ncbi.nlm.nih.gov/)數據庫下載活性成分結構,使用AutoDockvina 進行分子對接,最后利用PyMol(version2.5)軟件進行可視化以及美化。
使用R 包“WGCNA”構建共表達網絡(圖1),篩選高血壓心室重構相關的關鍵模塊及基因。通過聚類分析篩選表達譜相似的基因模塊(圖1A,1B)。為保證基因間相互作用最大限度符合無尺度分布,選擇軟閾值β 為12(圖1C),以合并動態剪切樹算法分析獲得11 個模塊(圖1D,1E)。通過模塊與性狀相關性分析(圖1F,1G),可以知道MEgrey60 模塊與高血壓心室重構具有最高的基因顯著性(Cor=0.78,P=3e-4),且相關系數的絕對值最大,MEgrey60 基因與高血壓心室重構性狀的相關系數為0.64(P< 0.05),MEgrey60 模塊共4 278 個基因,故我們選擇模塊MEgrey60 作為高血壓心室重構的關鍵模塊進行后續分析。

圖1 高血壓心室重構關鍵模塊及其關鍵基因的篩選Fig.1 Screening of key modules of hypertensive ventricular remodeling and their key genes
通過R 語言ggplot2(version3.3.3)繪制火山圖來展示差異基因及其表達情況(圖1H)。共存在5 073 個差異表達的基因,其中3 132 個基因表達上調,1941 個基因表達下調。
R 語言VennDiagram 包(version1.6.20)對高血壓心室重構vs 對照組之間差異表達基因及WGCNA 獲得的高血壓心室重構相關關鍵模塊基因取交集(圖1I),結果共獲得2 103 個差異表達的關鍵模塊基因。
使用R 語言VennDiagram 包對上述獲得的差異表達的關鍵模塊基因、藥物靶點及高血壓心室重構疾病靶點取交集,共獲得24 個關鍵靶點(圖2A)。

圖2 關鍵靶點篩選及其調控網絡Fig.2 Screening of key targets and their regulatory networks
使用R 語言“enrichplot”(version1.10.2)對關鍵靶點基因進行功能富集分析,繪制結果圖。GO 功能富集分析結果條形圖(圖2B)。在生物過程方面,共獲得288 個Terms,關鍵靶點基因與細胞對非生物刺激的反應、細胞對化學應激的反應及對氧化應激的反應顯著相關。在分子功能方面,共獲得15 個Terms,關鍵靶點基因與異構酶活性、轉氨酶活性、有機酸結合、激酶調節活性功能等顯著相關。在細胞組成方面,共獲得29個Terms,關鍵靶點基因與膜區、膜微區、質膜結合細胞投射細胞質等顯著相關。KEGG 通路富集分析結果氣泡圖(圖2C)。結果顯示,關鍵靶點基因與長壽調節途徑、精氨酸生物合成、酪氨酸代謝、甲狀腺激素信號通路等顯著相關。
將GO_BP、GO_CC、GO_MF 的Terms 其 對應的的關鍵靶點提出來,構建了關鍵靶點-功能的調控網絡圖,并進行可視化(圖2D),圖中包含30 個Term,22 個關鍵靶點,共131 個關系對。將KEGG TOP50 Pathways 及其對應的的關鍵靶點提出來,構建關鍵靶點-通路的調控網絡圖,并進行可視化(圖2E),網絡包含20 條KEGG Pathways,16 個關鍵靶點,共73 個關系對。
利用STRING(https://string-db.org)網站對24個關鍵靶點進行PPI 網絡構建(圖2F)。置信度為0.4(Confidence=0.4),去除離散的蛋白,得到21個蛋白的互作網關系,包括21 個節點,88 條邊。
合并后數據集的所有樣本(n=22)以5∶5 的比例隨機分為訓練集(n=11)及驗證集(n=11)用來進行診斷模型的構建及驗證(圖3)。LASSO 分析工具為R 語言glmnet 包(version4.1-1),得到了LASSO 回歸常見的有兩個圖形(圖3A),一個是基因系數的圖形,一個是交叉驗證的誤差圖。使用R 語言pROC(version1.17.0.1)繪制訓練集及驗證集的ROC(receiver operating characteristic curve)曲線,并計算AUC(Area Under Curve)值,一般AUC 值越大,說明預測的越準確(圖3B)。圖中訓練集及驗證集的AUC 均大于0.9,說明該診斷模型對高血壓心室重構具有較高的預測能力。

圖3 高血壓心室重構最佳診斷模型Fig.3 Best diagnostic model for hypertensive ventricular remodeling
基于得到的24 個關鍵靶點在GSE74144 數據庫(高血壓心室重構=14,Normal=8)中各個樣本的表達值,結合樣本的分組信息,其中以樣本分組作為響應變量,24 個關鍵靶點作為解釋變量,我們采用R 語言“caret”包(version6.0-86)構建RF 模型,并使用R 語言DALEX 包(version2.3.0)包的explain 函數對RF 模型進行解釋性分析,并用plot 函數對模型表現分布進行可視化,分別繪制累積殘差分布圖和箱線圖分布圖(圖3C,D),接著分析在RF 模型中,不同變量對于模型預測的相對重要性程度(圖3E),由表1 可知,在RF模型中,CSNK2B,MAPK1,GHR,MBL2,SELE,IL2 這6 個變量對響應變量(group,score=0.136 6)的預測值有較大的影響(響應變量以上的基因被選為特征基因),因此本研究將這6 個基因作為候選診斷標志物用作下一步分析。本研究對RF 模型的診斷價值進行了評估,結果RF 模型的AUC 為0.955,說明RF 模型對高血壓心室重構具有較高的預測能力(圖3F)。

表1 基因在RF 模型中的重要性排序Tab.1 Ranking of importance of genes in the RF model
使用R 語言VennDiagram 包(version1.6.20)對LASSO 及RF 算法獲得的基因取交集,結果共獲得4 個候選基因(MAPK1,IL2,CSNK2B,SELE)(圖4A),并且本研究對4 個基因繪制單基因ROC 曲線(圖4B),并計算AUC 值,所有交集基因的AUC 值均在0.8 以上。因此,本研究將MAPK1,IL2,CSNK2B,SELE 作為生物標記物進行后續分析。

圖4 關鍵基因的篩選及其表達分析Fig.4 Screening and expression analysis of key genes
對4 個生物標記物在高血壓心室重構樣本及正常樣本之間的表達情況進行了研究,并使用R 語言ggpubr 包(version0.4.0)及ggplot2 包(version3.3.3)繪制散點圖進行可視化(圖4C)。由圖可知,MAPK1 和CSNK2B 在高血壓心室重構樣本中上調表達;而IL2 和SELE 在高血壓心室重構樣本中下調表達。同時,本研究對生物標記物之間進行了Pearson 相關性分析,并繪制相關性熱圖(圖4D)??芍?,生物標記物之間存在較強的相關性。
將上述獲得4 個生物標記物對應的活性成分提出來,構建了藥物-活性成分-關鍵靶點基因網絡關鍵,并用Cytoscape 進行可視化(圖5),網絡包含1 個藥物(黃芪),3 個藥物活性成分,4 個生物標記物,共12 個關系對。

圖5 生物標記物的中藥藥理調控網絡Fig.5 TCM pharmacological regulatory network of biomarkers
提取了生物標記物的靶向活性分子,分別進行了分子對接(圖6)。SELE 與Kaempferol 進行分子對接(圖6A),其中ASN-83、LYS-55、GLU-71 及LYS-74 殘基與Kaempferol 分子有氫鍵相互作用?;钚苑肿优c蛋白之間的對接親和力為-5.9 kcal/mol。MAPK1 與quercetin 進行分子對接(圖6B),其中LYS-114、MET-108、ASP-167、LYS-54 及ILE-31 殘基與quercetin 分子有氫鍵相互作用?;钚苑肿优c蛋白之間的對接親和力為-8.3 kcal/mol。IL2 與quercetin 進行分子對接(圖6C),其中GLU-52,SER-127 及GLN-126殘基與quercetin 分子有氫鍵相互作用。活性分子與蛋白之間的對接親和力為-6.8 kcal/mol。CSNK2B 與Kumatakenin 進行分子對接(圖6D),其中 GLN-96,ARG-92 及 LYS-100 殘基與Kumatakenin 分子有疏水鍵相互作用。活性分子與蛋白之間的對接親和力為-6.2 kcal/mol。

圖6 分子對接結果圖Fig.6 Molecular docking result
高血壓是心血管疾病發生的基礎,其與心血管疾病的發病率呈線性相關,長期的高血壓可誘導心室重構發生,進而增加患者死亡率[13]。特別在頑固性高血壓人群中,血壓往往難以控制,需使用的降壓藥物種類多,增加了藥物不良反應[14]。黃芪能夠通過抑制通路的活化改善心臟的功能、減輕心室重構[15],但大劑量使用會引起胃腸不適、腹瀉、惡心和嘔吐等癥狀。因此,探索黃芪治療高血壓心室重構新的治療靶點和方法顯得尤為重要。
利用網絡藥理學原理篩選出黃芪治療高血壓心室重構的關鍵生物標記物主要為MAPK1、IL2、CSNK2B、SELE。絲裂原活化蛋白激酶(mitogenactivated protein kinase,MAPK)是一組絲氨酸-蘇氨酸蛋白激酶,其介導調節多種細胞過程的關鍵信號通路,與細胞的增值、分化、凋亡有關。MAPK 通路能夠促進平滑肌增殖和膠原合成,改變細胞外基質(extracellular matrix,ECM)的構成,從而使血管重塑加重[16]。MAPK1(也稱為細胞外信號調節蛋白激酶2,ERK2)是MAPK 家族的成員,研究表明,ERK1/2 信號通路可調節心臟偏心性和向心性生長之間的平衡[17]。MEK-ERK1/2信號傳導有促心室重構的作用,可對大多數已知誘導肥厚生長的壓力刺激作出反應,而抑制MEKERK1/2 信號通路對壓力超負荷所致的心臟肥大具有保護作用[18]。
炎癥與高血壓等心血管疾病的發展有關[19]。先天性和適應性的免疫反應都是通過與腎臟、血管和大腦相關的炎癥變化,從而促進了高血壓的病理發展[20]。炎癥介質通過增加血管通透性,釋放細胞因子、ROS、NO 和MMP 促進高血壓的發生發展。細胞因子的釋放會導致阻力血管管腔直徑縮小,血管阻力和硬度進而增加[21]。IL2 是一種多效細胞因子,對T 細胞增殖、效應細胞和記憶細胞的產生有至關重要的作用[22]。有研究表明,由IL2 和抗IL2 mAb(JES2-6)組成的IL2 免疫復合物可抑制炎癥反應并減輕心肌梗死后的心室重塑[23]。
CSNK2B 編碼絡蛋白激酶Ⅱ(casein kinase2,CK2)的β 亞基,可調節信號轉導、代謝途徑、復制、轉錄和翻譯[24]。CSNK2B 參與炎性細胞因子的表達,促使內質網應激[25]。內質網應激在高血壓及其并發疾病中發揮重要作用,其通過損傷血管內皮介導的血管舒張功能參與高血壓的形成[26-27],內質網應激還參與了心室重構過程,導致心肌細胞肥大和心臟纖維化[28-29]。
高血壓的發生還與內皮細胞功能障礙有關[30]。SELE 編碼的E-選擇素,存在于細胞因子刺激的內皮細胞中,是一種內皮細胞粘附分子,對內皮細胞活化具有特異性,被認為是介導細胞與血管壁粘附從而導致白細胞在炎癥部位積聚的原因[31]。SELE 在mRNA 和蛋白質水平表達的增加與高血壓有顯著的相關性[32]。而在中國人群中SELE 基因多態性(A561C)的C 等位基因攜帶者易患高血壓[33]。
綜上所述,結合我們的研究結果,所篩選出的4 個生物標記物MAPK1、IL2、CSNK2B、SELE具有較高生物學活性,闡明了黃芪對高血壓心室重構治療可能的分子機制,可以作為黃芪治療高血壓心室重構的潛在生物標志物和關鍵治療靶點,為高血壓心室重構治療提供了新的治療靶點和思路方法。