張清泉, 吳春宇, 范勐慷, 潘海燕, 潘 閩
(南通大學附屬醫院心內科,江蘇省南通市 226001)
擴張型心肌病(dilated cardiomyopathy,DCM)是一種涉及遺傳等多種因素的原發性心臟病,其特點是心室腔擴張和心肌收縮能力受損,是最常見的心肌病之一[1]。目前加權基因共表達網絡分析(weighted gene co-expression network analysis,WGCNA)是一種新興的生物信息學技術[2],該技術通過分析基因表達譜,構建相應模塊,將模塊與感興趣的臨床信息關聯起來。評估組織中免疫細胞浸潤情況的CIBERSORT算法已成為免疫學領域常用的技術方法[3],但目前在DCM組織中暫未使用。本研究通過分析GEO數據庫中相應的數據集,探討與DCM發生相關的核心基因和免疫細胞浸潤情況。
從GEO基因表達綜合數據庫(https://www.ncbi.nlm.nih.gov/geo/)[4]下載基因芯片數據集(GSE79962、GSE3585和GSE42955)。將3組數據集的DCM樣本以SVA程序包進行批次矯正后合并,用于后續免疫細胞浸潤分析。GSE79962數據集包括11個健康對照樣本及7個DCM樣本;GSE3585數據集包括5個健康對照樣本及7個DCM樣本;GSE4295數據集包括5個健康對照樣本及12個DCM樣本。所有數據集以Affy程序包依據各自平臺文件,進行背景消除,去除缺失、低表達、無對應的基因探針,最終共注釋到21 632個基因。
采用Limma程序包在GSE79962數據集中,從21 632個基因中進行差異表達基因的篩選,閾值設置為|log2fold change (FC)|≥1.5,矯正后P<0.05。采用WGCNA程序包[2]對GSE79962數據集中所有納入樣本及基因進行聚類,以合適的剪切線剔除離群樣本?;虻南嚓P矩陣由基因間的相關系數組成,根據適當的軟閾值(本研究軟閾值為8)將鄰接矩陣轉換為拓撲重疊矩陣,并將相似的基因放入同一個模塊(本研究每個模塊基因最小為50,切割高度為0.25)中。將臨床信息與基因模塊相結合,以分析基因顯著性(gene significance,GS)和模塊成員(module membership,MM)。
將核心模塊中的基因與差異表達基因進行重疊,鑒定出共同基因。將共同基因輸入在線STRING數據庫(https://string-db.org)[5]預測蛋白質水平的互作關系,然后輸入Cytoscape軟件,進行PPI網絡的構建。根據最大集團中心(maximal clique centrality,MCC)的方法選擇核心樞紐基因。將上述核心基因在外部基因集中進行驗證,確定核心基因在DCM組織中的表達異常,并采用ROC曲線下面積(AUC)值對核心基因的診斷效能進行判定。
利用R軟件中的相關程序包(Cluster profiler、GOplot以及ggplot2)對來自核心模塊基因進行基因本體論(gene ontology,GO)和京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)分析。
CIBERSORT是一種使用547個基因表達值來估算組織中22個免疫細胞含量的算法,可用于腫瘤、非腫瘤組織、血液樣本[6]。計算DCM組織中22個免疫細胞的比例,并與正常心肌進行對比。
應用R軟件v3.6.3版本對轉錄組數據進行統計學分析。其中Fisher精確檢驗計算GO及KEGG富集條目值,Pearson法進行相關性分析,Wilcox檢驗分析免疫細胞含量差異。P<0.05為差異具有統計學意義。
在GSE79962數據集中鑒定出35個差異表達基因(圖1)。其中相對于正常心肌組織的顯著上調基因共計21個,下調基因共14個。

圖1 篩選GSE79962數據集中的差異表達基因
在GSE79962數據集中共富集出5個基因模塊(圖2A),藍色模塊與DCM發生的相關性最高(圖2B),相關系數為0.91,該模塊共包含114個基因。

圖2 加權共表達網絡中核心模塊的鑒定
核心模塊中的114個基因與35個差異表達基因有11個交集基因(圖3A),構建PPI網絡(圖3B),篩選出5個核心基因F13A1、VSIG4、CD163、RNASE2及LYVE1(圖3C)。篩選數據集GSE79962中,核心基因在DCM心肌組織中顯著低表達,外部數據集GSE42955和GSE3585同樣顯示核心基因在DCM心肌組織中表達下調(P<0.05),且核心基因均具有較好的診斷效能(AUC>0.7;圖3D)。

圖3 DCM中核心基因的鑒定與表達驗證
核心模塊中的114個基因主要富集在急性炎癥反應、炎癥反應調節等生物學過程,并且與吞噬體、補體、凝血級聯等通路有關(圖4)。

圖4 核心模塊中的基因富集分析
DCM組織中漿細胞、Tregs細胞、中性粒細胞較健康心肌組織的含量更高(P<0.05),而記憶B細胞和M2型巨噬細胞的含量低于健康心肌組織(P<0.05;圖5)。

圖5 健康心肌組織及DCM心肌組織中的免疫細胞的浸潤差異
DCM是全球猝死和心力衰竭的主要原因之一[6],然而,導致DCM的病因尚不完全清楚,可能包括感染、非感染性炎癥、中毒、內分泌代謝紊亂、遺傳、外傷等原因[7]。本文GO和KEGG富集分析結果顯示,與DCM發生有關的基因模塊顯著富集于吞噬體、補體系統等相關通路。這提示原發性DCM發生發展過程中,免疫也參與了主要環節,相關文獻[8]也揭示了使用免疫吸附方法可改善DCM的左心室功能。CIBERSORT算法結果顯示DCM組織中漿細胞、Tregs細胞、活化NK細胞和中性粒細胞表現出較健康心肌組織更高的浸潤模式,而記憶B細胞和M2型巨噬細胞浸潤的程度較低。在一項163例DCM患者心肌組織的免疫組化研究中[9],多因素回歸分析中提示CD163與膠原面積顯著相關,提示M2型巨噬細胞與膠原形成之間的關聯,并表明巨噬細胞向M2型分化與CD163表達可能與DCM中的心室重構有關。RNASE2基因作為一種RNA結合蛋白相關基因已參與包括胃癌[10]、腎透明細胞癌[11]的預后鑒定,該基因在所有入組的自身免疫性疾病患者中均較健康患者下調[12]。相關的生物信息學文章將該基因鑒定為M2型巨噬細胞共表達因子,并可參與調節腫瘤的免疫微環境[13]。與VSIG4基因類似,F13A1與IL-1Ra、IL-10和MMP9被鑒定為動脈粥樣硬化中NOR1的潛在靶基因,并在人類替代性巨噬細胞極化時被誘導,并刺激M2表型標志物的表達[14]。
心肌組織微環境中的免疫細胞是免疫療法的核心,在DCM病理過程中,由單核細胞/巨噬細胞、中性粒細胞和嗜酸性粒細胞介導的先天反應與適應性反應發揮最終效應。另外Th17是導致DCM過程的主要驅動因素[15]。本文結果僅CD163基因與活化的肥大細胞呈正相關性,可能由于CD163基因表達巨噬細胞特異性蛋白,提示在DCM免疫微環境中,被鑒定出的核心基因CD163與肥大細胞的增殖互為因果。
綜上所述,本研究基于生物信息學方法,針對DCM患者心肌組織的測序集,進行靶向基因及免疫微環境的探究。但該研究有仍一些局限性。①必須要對核心基因進行體外、體內實驗驗證,來進一步解釋DCM的潛在機制;②雖然CIBERSORT算法作為經典的bulk-RNA反卷積工具,但也需要進一步的實驗來明確相關免疫細胞浸潤的豐度。③目前臨床上將DCM主要分為原發性和繼發性,本文納入的測序數據雖僅關注原發性DCM,但原發和繼發并不相互排斥。