徐波 邵碧波
1黃石市中心醫院(湖北理工學院附屬醫院)急診醫學科,黃石 435000;2腎臟疾病發生與干預湖北省重點實驗室,黃石 435000
膿毒血癥是臨床較為常見的一種危急重疾病,由明確或未知感染導致病原菌進入患者血液循環系統,繼而引發嚴重的全身性炎性反應[1]。一項統計近40年來全球膿毒血癥相關數據顯示,高收入國家中該病每年患病人數由1 940千萬升至3 150 千萬,其院內病死率高達17%~26%[2]。龐大的發病人群以及不低的病死率無疑是基礎和臨床工作者所面臨的巨大且棘手的“挑戰”。膿毒血癥患者早期癥狀不典型導致早期診斷困難,且其發病的分子機制尚未得到明確闡明。因此,積極尋求該疾病相關的敏感生物標志物,不僅有益于臨床醫生采取合適的臨床決策,而且能夠提供新的治療靶點,最終有效改善患者預后。鐵死亡是一種依賴鐵的特殊細胞死亡方式,其主要機制是隨著鐵離子濃度的升高,進而抑制谷胱甘肽-過氧化物酶活性、而活性氧自由基和脂質過氧化物增多[3]。目前,已有大量可信的證據表明,鐵死亡參與了許多腫瘤的發生和發展[4],也有研究發現,其參與了包括膿毒血癥在內等多種非腫瘤疾病的進程中[3,5]。但目前缺乏對鐵死亡相關基因在膿毒血癥中作用和相關機制的系統研究。本研究擬通過公共數據庫,通過生物信息學聯合機器學習算法篩選膿毒血癥中的核心鐵死亡相關基因,明確其中診斷價值較高的鐵死亡相關生物標志物,繼而為膿毒血癥的診斷和治療提供一定理論依據。
在公共數據庫GEO(Gene Expression Omnibus)中以“sepsis”為關鍵詞檢索,獲取GEO數據中的GSE185263芯片中所有數據,其中包括348 例膿毒血癥患者和44 例正常人群的全血樣本RNA測序數據以及一般臨床資料。
首先使用R 語言(4.1.3版本)包將“Ensemble gene id”轉化為基因名字,然后將基因表達的count 值轉化為FPKM值。進一步用Sva 包對基因表達矩陣進行校正后,從midsigib 網站中獲取382 個鐵死亡相關基因,獲取382 個基因在348例膿毒血癥患者和44例正常人群的全血樣本的表達含量矩陣后,用limma包篩選膿毒血癥和正常人群中差異表達基因(differentially expressed genes,DEGs),篩選條件為log2FC 絕對值>2 和校正后的P<0.05,分別用ggpolt2 包和pheatmap包繪制DEGs的火山圖和熱圖。
用R 語言軟件的Bioconductor 包對DEGs 分別進行基因本論(gene ontology,GO)富集分析、京都基因與基因組百科全書(Kyotoencyclopedia of genes and genomes,KEGG)通路分析。另外疾病本體(disease ontology,DO)富集分析與膿毒血癥關系密切的其他疾病。
具體機器學習算法采用最小的絕對值∕收斂∕選擇算子(LASSO)、支持向量機-遞歸的特征消除(SVM-RFE)。LASSO 和SVM-RFE 分別由glmnet 包和e1071 包完成,最后取兩者的交集作為核心鐵死亡相關基因。
另將GSE 芯片作為外部驗證的數據集,分析機器學習篩選的核心鐵死亡相關基因在膿毒血癥和正常對照組之間的表達,另外也根據受試者工作特征曲線(receiver operating characteristic curve,ROC)來評估相關基因的診斷價值。
利用5 方法中獲取的鐵死亡核心基因的表達含量,在其基礎上采用邏輯回歸來構建列線圖的預測模型,預測膿毒血癥的發生,另外采用ROC評估其診斷價值。
基于22 種人類免疫的細胞亞型的基因表達矩陣,采用CIBERSORT 算法進行卷積分析,從而計算每個樣本中免疫細胞的比例,以P<0.05 為膿毒血癥和正常對照組之間免疫細胞浸潤有差異。利用R 語言“graphics”包的barplot 函數繪制兩組樣本中每種免疫細胞構成比的柱狀圖;利用R 語言中的“corrplot”包對膿毒血癥患者外周血清中的免疫細胞進行相關性分析;利用R語言中的“vioplot”包對膿毒血癥患者和正常人群外周血清中免疫細胞占比進行比較分析并繪制小提琴圖。
根據方法里所提的篩選標準,獲得43 個表達下調的DEGs、44 個表達上調的DEGs,繪制的火山圖和熱圖分別見圖1A和圖1B。
圖1 膿毒血癥鐵死亡相關的差異表達基因(DEGs)的火山圖(A)和熱圖(B)
GO 富集顯示鐵死亡相關的DEGs生物學過程主要富集在氧化應激、凋亡信號的調控路徑、細胞衰老、神經元死亡的調節等方面;在細胞組分富集在自噬體、核包膜和二級溶酶體等方面;在分子功能富集在促分裂原活化蛋白激酶(MAP 激酶)的激酶活性、鐵離子結合等方面(圖2A)。KEGG 通路主要富集在FoxO 信號傳導途徑、缺氧誘導因子(HIF)-1 信號傳導途徑、PI3K-Akt 信號傳導途徑和鐵死亡等方面(圖2B)。DO 分析結果顯示膿毒血癥與神經系統腫瘤、神經母細胞瘤、骨癌等疾病關系密切(圖2C)。
用LASSO 回歸和SVM-RFE 對87個DEGs進行篩選,分別獲得了20 個、25 個基因,取兩者交集獲得了5 個基因PRDX1、IDH1、DUSP1、YWHAE和SOCS1,見圖3。
在GSE154918 芯片中,PRDX1、IDH1、DUSP1、YWHAE和SOCS1 在膿毒血癥患者中表達均上升(均P<0.05),見圖4。
圖4 膿毒血癥鐵死亡相關核心基因的表達驗證:DUSP1(A)、IDH1(B)、PRDX1(C)、SOCS1(D)和YWHAE(E)
GSE185263 和GSE154918 中,PRDX1、IDH1、DUSP1、YWHAE 和SOCS1 基因的診斷價值均較高[曲線下面積(AUC)均>0.7],具體見圖5,另外基于上述基因表達矩陣通過邏輯回歸構建的列線圖如圖5 所示,且兩個芯片的AUC分別為0.958(0.935~0.978)和0.981(0.951~0.999),均具有極高的診斷價值。
圖5 膿毒血癥鐵死亡相關的核心基因(PRDX1、IDH1、DUSP1、YWHAE 和SOCS1)預測膿毒血癥列線圖(A)、受試者工作特征曲線(ROC)(B)和外部驗證列線圖(C)、ROC(D)
根據GSE185263 芯片的基因表達矩陣,22 種不同免疫細胞在各個樣本中浸潤程度分布差異,見圖6A。相關性分析結果顯示,靜止的自然殺傷(NK)細胞和CD8+ T 細胞之間的關系最為明顯,兩者浸潤程度呈正相關(r=0.60),其余免疫細胞相關性見圖6B。同正常人群比較,膿毒血癥患者中浸潤程度有差異的免疫細胞(P<0.05)包括13 種,其中幼稚B 細胞、CD8+ T 細胞、CD4+記憶靜止T 細胞、濾泡輔助性T 細胞、靜止NK 細胞、靜止樹突狀細胞、活動期樹突狀細胞活動受到抑制,漿細胞、幼稚T 細胞、活動期記憶CD4+ T 細胞,δ T細胞、巨噬細胞M0、中心粒細胞活動活躍,見圖6C。
圖6 免疫細胞浸潤分析:每個樣本中22種免疫細胞的比例柱狀圖(A)、22種浸潤性免疫細胞的相關熱圖(B)、正常對照組和膿毒血癥組的22種免疫細胞免疫浸潤程度差異(C)
膿毒血癥的發病率有逐年升高的趨勢,且病死率不低,這給個人和社會均帶來了沉重的負擔。有研究指出,提高膿毒血癥的早期確診率,繼而盡早做出正確的臨床決策,有助于患者預后的改善[6]。而常規的臨床檢查指標對于膿毒血癥患者早期診斷靈敏度和特異度均不高,臨床上亟需尋求更加敏感且特異度高的生物標志物或更為精確的診斷模型。近年來,基于機器學習算法的各種預測模型,已經廣泛應用于各種疾病中。如范可欣等[7]基于孕婦的臨床信息和相關檢查結果,利用機器學習構建了預測胎母輸血綜合征發生的臨床模型,該模型在內部驗證和外部中均表現了較高的預測價值(AUC 值均>0.8)。宿家銘等[8]基于公共數據庫,針對2 型糖尿病腎病腎小管間質損傷,利用機器學習篩選出具有高預測價值的核心基因。本研究結果顯示,通過LASSO 和SVM-RFE 算法,篩選出5 個鐵死亡相關核心基因(PRDX1、IDH1、DUSP1、YWHAE 和SOCS1),對于膿毒血癥均具有較高的診斷價值,在內部和外部驗證中所有AUC 值均>0.7。而基于其表達含量所構建的臨床預測列線圖,在內部驗證AUC 值高達0.958,而外部驗證數據集中的AUC為0.981,這表明機器學習在面對醫療臨床相關的復雜數據,具有強大且可靠的分析和預測能力。
鐵死亡是近年來基礎和臨床的研究熱點,已有研究通過體內和體外研究發現,其對腫瘤具有抑制作用。如有研究發現,魯斯可皂苷元可以通過誘導鐵死亡的發生,繼而促進胰腺癌細胞發生死亡[9]。在動物實驗中,也有研究發現化瘀祛痰方能夠抑制p53∕xCT∕GPX4 信號通路的激活,促進肝細胞發生鐵死亡,從而降低了小鼠肝癌的發生率[10]。在非腫瘤疾病中,也有大量可信的證據表明鐵死亡參與其發生發展。如李秋暢等[11]發現,抑制鐵死亡的發生能夠保護腦出血大鼠的神經功能。劉暢等[12]研究結果顯示,鐵死亡的抑制能夠改善心肌梗死的大鼠模型的心肌功能。鐵死亡與膿毒血癥同樣關系密切[13]。如在一項動物模型研究發現,鐵死亡在膿毒血癥導致急性肺損傷小鼠模型中表現活躍[14]。Li等[15]體外研究發現,Sesn2能夠通過保護樹突狀細胞而抑制膿毒血癥誘發的鐵死亡發生。但鐵死亡在膿毒血癥中的研究相當有限。本研究通過對于348 例膿毒血癥患者和44 例正常人群的相關數據挖掘,最終獲得PRDX1、IDH1、DUSP1、YWHAE 和SOCS1 5個鐵死亡相關核心基因,此外,外部驗證中,也證實上述基因在膿毒血癥患者外周血中表達含量較正常對照組均上升。在脂多糖誘導的膿毒血癥小鼠模型中,發現PRDX1 同小鼠炎性反應嚴重程度呈正相關關系[16],但其是否通過鐵死亡而調控炎性反應需進一步研究和證實。Wang 等[17]研究也發現IDH1 在膿毒血癥患者外周血中表達升高。DUSP1也被發現參與膿毒血癥中炎性反應的調控[18]。目前,尚無關于YWHAE 和膿毒血癥的研究,YWHAE 在乳腺癌中表現為癌基因[19]。在小鼠動物模型中,發現小鼠外周血中SOCS1 的含量同膿毒血癥的嚴重程度呈正比[20]。但上述基因是否通過鐵死亡而參與膿毒血癥的發生發展,仍需進一步開展這種高級別證據予以證實。
近年來,免疫微環境在各種疾病中的重要作用逐漸被人們所重視。如研究發現,由于免疫微環境的異質性,導致腫瘤患者對于免疫治療響應結果不同[21]。免疫微環境在膿毒血癥中的作用機制也受到醫學界所重視[22]。膿毒血癥是一種同機體免疫功能關系密切的疾病,炎性反應導致患者體內的免疫細胞功能異常,而紊亂的免疫細胞可能導致其分泌細胞因子失衡,而加重機體內的炎性反應。本研究結果顯示,在正常對照組和膿毒血癥組中,13種免疫細胞浸潤程度表現差異。大部分同炎性反應關系密切的巨噬細胞、漿細胞和中性粒細胞表現為在膿毒血癥患者中活動活躍,而對炎性反應具有保護作用的CD8+ T 細胞和樹突細胞活動受到抑制,國外有研究通過單細胞測序也揭示了免疫微環境在膿毒血癥患者中的異質性[23]。這為臨床上治療膿毒血癥患者提供理論基礎和新的治療靶點。
總之,基于GEO數據庫和機器學習算法,我們篩選出關于膿毒血癥患者診斷的鐵死亡相關核心基因。并通過生物信息學的方法,為上述基因的功能作用提供理論依據。另外不僅為早期診斷膿毒血癥提供新且敏感的生物標志物,而且還為其治療提供新的靶點。但需開展前瞻性、多中心的研究,并進行體內體外實驗,繼而提高本研究的循證醫學級別。