姜晨陽 李 爍 巢瀟鶯 鐘國強
廣西醫科大學第一附屬醫院心血管內科,廣西南寧 530021
急性心肌梗死(acute myocardial infarction,AMI)是全世界發達國家的主要死亡原因之一[1]。每年有790 000 人被診斷出患有AMI[2]。慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是一種由慢性炎癥引起的不可逆轉的肺部疾病,會導致氣道和肺實質的損害[3]。全球估計6500 萬人患有重度的COPD 并導致死亡[4]。心血管疾病是COPD 患者最常見的并發癥[5-6]。AMI 是COPD 患者住院和死亡的主要原因[7]。一項系統評價和meta 分析顯示,COPD 患者發生心肌梗死(myocardial infarction,MI)的風險增加[8]。在這項研究中,筆者通過生物信息學方式尋找差異表達基因(differentially expressed gene,DEG),并進行富集分析然后篩選潛在的治療藥物。因此,識別AMI 和COPD 的中樞基因可能為疾病的診斷治療提供新的生物信息學依據,獲得的分子機制和信號通路可能有助于解釋AMI 與COPD 之間的聯系。
2012 年1 月至2021 年2 月,從公共的GEO 數據庫篩選AMI 和COPD 的微陣列數據集。最終選擇了3 個包含患者和健康對照的微陣列數據集GSE66360、GSE106986 和GSE38974 作為分析數據集。見表1。

表1 芯片數據信息
將GSE106986 和GSE38974 表達矩陣標準化后合并為COPD 數據集,后使用limma 包分析患者和對照之間的差異基因。AMI 數據集標準設為P <0.05,|logFC|>1。COPD 數據集閾值設為P <0.05 和|logFC|>0.5。維恩圖確定交集基因。
“cluster Profiler”包對常見的DEG 進行了GO 和KEGG 富集分析,P <0.05 定義為顯著富集。Metascape 對DEG 進行了富集分析,以P <0.05 為標準。
為了進一步探索上面獲得基因之間的相互作用,本研究將交集DEG 導入了STRING 在線數據庫,以預測和跟蹤PPI 網絡并設置中等可信度(0.400)。本研究使用了cytoHubba 插件來識別PPI 網絡中的關鍵基因,并將4 種不同算法(MCC、MNC、EPC 和Degree)評分排名前10 位的基因再通過維恩圖取得共同的交集以確定中樞基因。
藥物基因相互作用數據庫(DGIdb)是一個提供有關藥物基因相互作用和藥用基因的數據庫。根據在PPI 網絡中篩選的中樞基因尋找潛在藥物,綜合數據庫資料來源及藥物互動評分選取評分排名前5 位的藥物作為潛在藥物。
AMI 和COPD 數據集分別篩選出351 和1526 個DEG,見圖1A~B。使用維恩圖顯示兩種疾病的61 個交集基因,見圖1C。

圖1 AMI 和COPD 表達差異基因
對61 個交集基因進行GO 功能富集和KEGG 通路分析,GO 中的生物學過程的變化主要包括嗜中性粒細胞效應(P <0.01)、白細胞效應(P <0.01)和炎癥反應(P <0.01)的調節。細胞組成的變化集中在線粒體(P <0.01)、細胞器的外膜(P <0.01)和一些顆粒內腔(P <0.01)的富集。此外,分子功能中包括碳水化合物結合(P <0.01)、糖皮質激素受體結合(P <0.01)等其他與結合有關的功能,以及受體-配體活性和信號受體激活劑活性等發生了顯著變化。KEGG 途徑的變化主要集中在幾種疾病,例如大腸癌(P <0.01)、甲狀腺癌(P <0.01)、小細胞肺癌(P <0.01)和類風濕關節炎(P <0.01)。這些變化還涉及免疫(P <0.01)、炎癥(P <0.01)、凋亡(P <0.01)和其他相關途徑,數目及分類見圖2A。Metascape 富集分析顯示,常見的DEG 與白細胞趨化性(P <0.05)、炎癥(P <0.05)和凋亡(P <0.05)相關功能的白細胞調節功能有關,數目及分類見圖2B。

圖2 富集分析結果
交集基因導入到STRING 數據庫獲得由43 個節點和108 個邊組成的PPI 網絡,見圖3A。4 種算法(MCC、MNC、EPC 和Degree)最終確定了8 個基因作為中樞基因。這些基因是CCL20、BCL2A1、IL1RN、IL1B、TNFAIP3、TLR2、S100A9、FN1。4 種算法的維恩圖和這些中樞基因的得分情況見圖3B~C。

圖3 PPI 網絡構建和中心基因
8 個中樞基因共篩選了74 種可能相關的治療藥物。CCL20、BCL2A1、IL1R、IL1BN、TNFAIP3、TLR2、S100A9 和FN1 分別鑒定出1 種、1 種、4 種、47 種、2 種、7 種、5 種、7 種潛在藥物,見圖4。綜合數據庫資料來源以及互動評分,發現與TLR2 相關的藥物結核菌素(得分:24.35)、托馬利拉單抗(得分:16.23)、白藜蘆醇己酸(得分:16.23),以及與S100A9 有關的塔斯奎尼德(得分:11.36)、帕尼莫德(得分:11.36)與疾病的關聯性高。

圖4 DGIdb 預測了潛在的治療藥物
AMI 和COPD 已引起世界各地學者越來越多的關注。AMI 患者伴發COPD 的死亡率顯著高于無COPD的患者。因此,有必要探索這兩種疾病預防和控制的早期靶標。本研究使用GEO 數據庫搜索了AMI 和COPD 數據集,并確定了兩種疾病之間的61 種常見DEG。采用不同的方法進行GO、KEGG、Metascape 富集分析,并構建了PPI 網絡。確定的8 個中樞基因可能具有預測AMI 和COPD 風險的重要能力。最后,通過藥物基因相互作用數據庫為這些中樞基因鑒定了一些潛在的治療藥物。
Lin 等[12]研究顯示,AMI 患者的血液樣本中CCL20顯著升高,提示CCL20 是AMI 患者的生物標志物[13-14],Demedts 等[15]研究發現COPD 患者CCL20 蛋白的水平升高。Iwata 等[16]研究顯示,BCL2A1 可以顯著減少心肌再灌注損傷,Yang 等[17]發現BCL2 參與COPD 的發生。IL1B 是MI 后炎癥反應的關鍵調節劑[18]。AMI后TNFAIP3 的過量表達可抑制心臟重塑[19]。TNFAIP3-DREAM 軸在COPD 氣道炎癥中起重要作用[20]。Sheng等[21]發現TLR2 是AMI 的重要靶標,TLR2 的激活可能是治療COPD 新策略[22]。AMI 后期S100A9 阻滯可改善心臟功能[23]。Railwah 等[24]發現COPD 患者血漿中的S100A9 升高。FN1 的上調只能在嚴重哮喘患者的肺泡灌洗液中發現[25]。針對8 個中樞基因尋找到的74 種藥物可能作為AMI 合并COPD 的潛在治療藥物,結核菌素、托馬利拉單抗、白藜蘆醇己酸、塔斯奎尼德、帕尼莫德與疾病的關聯性高,但相關機制有待進一步研究。本項研究仍需要大量實驗數據的證實,但也為AMI 患者合并COPD 的發病機制研究提供了新的研究方向。