劉瓊芝,黃文麗
(1.長沙市中心醫院,長沙 410028;2.長沙金域醫學檢驗實驗室有限公司,長沙 410205)
急性髓系白血病(acute myeloid leukemia,AML)是成人急性白血病中最常見的一種,其發病率隨著年齡增長逐漸增加,且患者預后較差[1]。現今,AML的主要治療方式為化療、靶向治療和造血干細胞移植,這使AML患者病情有所緩解[2],但在臨床表現和治療預后方面,患者之間存在較大的異質性。進一步探究發現,這種異質性更加體現在基因層面,復發的原因可能與部分白血病細胞發生免疫逃逸,從而在骨髓中形成殘留病灶有關[3-4]。因此,進一步探究AML的骨髓微環境對于優化治療方案以及提高 AML患者的生存率具有重要的意義。雖然既往有許多分析腫瘤微環境中免疫細胞構成與預后之間關系的研究,但關于AML的研究較少[5]。本研究根據免疫基因構建預后風險模型,比較高風險組和低風險組AML患者之間骨髓微環境中免疫細胞的分布比例,進而分析風險模型與AML的免疫細胞浸潤模式的相關性及其預后價值,旨在為改善AML治療和預后效果提供新的方向。
通過癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數據庫(https://portal.gdc.cancer.gov/)下載141例AML(TCGA-LAML)樣本的RNA表達數據以及生存等臨床信息。本研究通過基因表達綜合(Gene Expression Omnibus,GEO)數據庫(http://www.ncbi.nlm.nih.goc/geo/)下載轉錄組RNA測序數據集GSE15601,其中包括69例正常對照和202例AML患者的骨髓樣本。
通過R軟件包limma,以P<0.05為閾值,篩選數據集GSE15601中正常對照與AML患者的骨髓樣本間的差異表達基因。從IMMPORT數據庫(https://www.immport.org/home)中下載人類免疫及免疫相關基因。利用jvenn工具(http://jvenn.toulouse.inra.fr/)取數據集GSE15601中差異表達基因與免疫基因的交集,并繪制Venn圖,得到候選基因。
使用TCGA-LAML數據集,采用R語言包survival對55個免疫基因進行單因素COX回歸分析以及多因素COX回歸分析,建立預后風險模型,并計算回歸模型下每位患者的風險評分。風險評分=各基因回歸系數×其表達水平之和。
根據風險評分的中位值將患者分為高風險組和低風險組,并進行Kaplan-Meier生存分析,以比較高風險組和低風險組之間的總體生存期(overall survival,OS)差異,選擇P<0.05作為截止值。同時繪制風險曲線和生存狀態圖,并基于R軟件包pheatmap繪制4個預后基因在高風險組和低風險組中表達的熱圖。采用R軟件包timeROC進行分析,繪制接受者操作特性曲線(receiver operating characteristic curve,ROC)以評估預后風險模型的準確性。
基于TCGA-LAML數據集中AML患者的年齡(≤65和>65)、性別(男和女)進行分組,比較組間風險評分的差異。根據患者臨床信息(年齡、性別、生存時間)以及風險評分,采用R軟件包rms繪制列線圖,以評估AML患者的預后。
ESTIMATE是一種預測腫瘤純度的工具,可基于基因表達數據預測腫瘤組織中浸潤的基質/免疫細胞的存在。ESTIMATE算法基于單樣本基因集富集分析生成三個評分:基質評分(捕獲腫瘤組織中基質的存在)、免疫評分(表示免疫細胞在腫瘤組織中的浸潤)、ESTIMATE評分(綜合基質評分和免疫評分,推斷腫瘤純度)[6]。我們使用R軟件包estimate(https://r-forge.r-project.org/projects/estimate/)計算高風險組和低風險組的基質評分、免疫評分、ESTIMATE評分以及重量純度,并進行組間比較。
通過CIBERSORT算法估計TCGA-LAML數據集中22種免疫細胞的浸潤比例,模擬次數為1 000次[7]。基于R軟件包corrplot(https://CRAN.R-project.org/package=corrplot)對預后基因或風險評分與免疫細胞含量進行相關性分析,以|r|>0.2且P<0.05為標準閾值,其中r為相關系數。
收集47個常見的免疫檢查點,分別為:IDO1、LAG3、CTLA4、TNFRSF9、ICOS、CD80、PDCD1LG2、TIGIT、CD70、TNFSF9、ICOSLG、KIR3DL1、CD86、PDCD1、LAIR1、TNFRSF8、TNFSF15、TNFRSF14、IDO2、CD276、CD40、TNFRSF4、TNFSF14、HHLA2、CD244、CD274、HAVCR2、CD27、BTLA、LGALS9、TMIGD2、CD28、CD48、TNFRSF25、CD40LG、ADORA2A、VTCN1、CD160、CD44、TNFSF18、TNFRSF18、BTNL2、C10orf54、CD200R1、TNFSF4、CD200、NRP1。首先,篩選出高風險組和低風險組間差異表達的免疫檢查點,然后,進一步基于R軟件包corrplot分析免疫檢查點表達與風險評分的相關性,以|r|>0.3以及P<0.05為標準閾值進行篩選。
通過GEO數據庫得到AML患者和正常對照的骨髓樣本的轉錄組RNA-seq數據集GSE15061,以P<0.05為閾值篩選出差異表達的基因,選取差異表達最為顯著的前500個基因(圖1a)。同時,從IMMPORT數據庫中下載到1 793個免疫相關基因,取差異表達的基因與免疫相關基因的交集,獲得AML患者中差異表達顯著的55個免疫相關基因(圖1b)。

圖1 AML中差異表達的免疫基因的篩選Fig.1 Screening of differentially expressed immune genes in AML
在TCGA數據庫中下載AML的轉錄組RNA測序數據集TCGA-LAML,其中包含141例AML患者的骨髓樣本以及臨床信息。首選以上55個免疫基因進行單因素COX分析(以P<0.05為閾值),發現其中6個基因(FLT3、FGF13、CRLF3、GZMB、KLRD1、IGF2R)與AML患者的生存情況顯著相關(圖2a)。隨后,通過多因素COX分析構建包含4個免疫基因(FGF13、GZMB、FLT3、CRLF3)的風險模型,根據以下公式計算每位患者的風險評分:風險評分=(-1.645 7×ExpFGF13)+(0.064 9×ExpGZMB)+(0.002 9×ExpFLT3)+(-0.064 6×ExpCRLF3),其中Exp表示基因表達。以風險評分中位數為分界線,將患者劃分為高風險組和低風險組(圖2b)。通過進一步對風險模型中AML患者的生存狀態進行統計,結果發現,高風險組中死亡患者的數目要多于低風險組,并且其生存時間普遍更短(圖2c)。4個免疫基因在低風險組與高風險組間也存在一定的差異表達(圖2d)。

圖2 基于TCGA-LAML數據集構建預后風險模型Fig.2 Construction of a prognostic risk model based on the TCGA-LAML dataset
Kaplan-Meier生存曲線分析結果表明,低風險組患者的存活時間明顯高于高風險組患者(圖3a)。ROC分析結果也顯示了風險模型1、2、3 年總生存率的良好預測準確性(圖3b)。進一步分析該風險模型與AML患者臨床參數的相關性,結果顯示,高風險組和低風險組患者的性別無明顯差異(圖3c),高風險組患者的年齡顯著高于低風險組(圖3d)。繪制列線圖展示了風險評分、年齡和性別對患者生存的預測能力,總得分可用于預測AML患者1、2、3年生存率(圖3e),并繪制了1年生存率的校正曲線(圖3f)。以上結果表明,由4個免疫基因(FGF13、GZMB、FLT3、CRLF3)構建的風險模型可準確預測AML患者的預后。

圖3 風險模型在AML患者預后中的預測價值Fig.3 Predictive value of risk models in the prognosis of AML patients
在腫瘤微環境中,免疫細胞和基質細胞是兩種主要類型的非腫瘤組分,并且已被提出對于腫瘤的診斷和預后評估是有價值的。為了探究4個免疫基因構建的風險模型與AML腫瘤微環境是否相關,我們基于EATIMATE算法計算基質評分、免疫評分、ESTIMATE評分以及腫瘤純度,評分越高說明細胞含量越高。結果表明:高風險組和低風險組基質評分無顯著差異(圖4a);高風險組免疫評分顯著高于低風險組(圖4b);高風險組綜合評分顯著高于低風險組(圖4c);高風險組腫瘤純度顯著高于低風險組(圖4d)。這說明,由FGF13、GZMB、FLT3、CRLF3構建的風險模型與免疫浸潤密切相關。

圖4 高風險組和低風險組AML樣本的腫瘤微環境分析Fig.4 Tumor microenvironment analysis of AML samples in high-risk group and low-risk group
前面結果顯示,該風險模型與免疫浸潤存在顯著相關性。我們進一步通過CIBERSORT算法估計了TCGA-LAML數據集中22種免疫細胞的浸潤比例,并分析了兩組免疫細胞含量的差異。結果顯示:高風險組中未激活的B細胞、CD8+T細胞、激活的自然殺傷細胞的含量顯著高于低風險組,同時,以上免疫細胞的含量與風險評分顯著正相關(圖5a~5c、5e);高風險組中未激活的CD4+T細胞、靜息的肥大細胞的含量顯著低于低風險組,同時,以上免疫細胞的含量與風險評分顯著負相關(圖5a、5d、5f)。

圖5 基于CIBERSORT算法估計高風險組和低風險組免疫細胞含量Fig.5 Estimation of immune cell content in high-risk group and low-risk group based on CIBERSORT
本文分析了47個常見的免疫檢查點在高風險組和低風險組的表達,其中15個免疫檢查點的表達存在顯著差異(圖6a)。相關性分析結果顯示,其中4個免疫檢查點(CTLA4、PDCD1、KIR3DL、LAG3)與風險評分的相關性顯著,且均為正相關(圖6b~6f)。這也進一步體現了該風險模型在AML患者免疫治療中的應用潛力。

圖6 風險模型與免疫檢查點相關性分析Fig.6 Correlation analysis between risk model and immune checkpoint
為了進一步探究風險模型中4個免疫基因(FGF13、GZMB、FLT3、CRLF3)與AML患者生存、免疫細胞含量的相關性。我們基于TCGA-LAML數據集,根據基因高/低表達進行分組。Kaplan-Meier生存曲線分析結果表明:高表達FGF13、CRLF3組患者的存活時間明顯高于低表達組患者(圖7a、7g);高表達GZMB、FLT3組患者的存活時間明顯低于低表達組患者(圖7c、7e)。免疫細胞的含量差異分析結果表明:高表達和低表達FGF13組間靜息的CD4+記憶T細胞、單核細胞、M2巨噬細胞、靜息的肥大細胞含量存在顯著差異(圖7b);高表達和低表達GZMB組間未激活的B細胞、漿細胞、CD8+T細胞、激活的CD4+T細胞、靜息的自然殺傷細胞、靜息的樹突狀細胞、靜息的肥大細胞、嗜酸性粒細胞的含量存在顯著差異(圖7d);高表達和低表達CRLF3組間γδ T細胞、M2巨噬細胞、嗜酸性粒細胞、中性白細胞含量存在顯著差異(圖7h);高表達和低表達CRLF3組間靜息的CD4+T細胞、激活的自然殺傷細胞含量存在顯著差異(圖7f)。

圖7 FGF13、GZMB、FLT3、CRLF3與AML患者生存、免疫細胞含量的相關性Fig.7 Correlation between FGF13, GZMB, FLT3, CRLF3 and survival and immune cell content in AML patients
AML作為一種侵襲性的血液惡性腫瘤,疾病進展快速且預后較差,目前認為這與骨髓微環境相關[8]。骨髓微環境是由免疫細胞、基質細胞、細胞外基質以及細胞因子等一起構成的動態系統。其中,基質細胞和免疫細胞是AML發生發展所必需的主要成分[9]。AML的骨髓微環境在患者治療和預后中發揮著極其重要的作用,然而,其中相關細胞及分子在AML預后中的作用并不清楚[10]。本研究基于141例TCGA-LAML樣本,通過EATIMATE算法計算高風險組和低風險組的基質評分、免疫評分、ESTIMATE評分以及腫瘤純度,結果顯示,免疫細胞浸潤可能在AML腫瘤微環境中發揮了重要作用。鑒于AML患者骨髓微環境的免疫特征仍然不是很清楚,我們有必要對于骨髓微環境中免疫細胞浸潤模式進行進一步的探究,篩選免疫相關預后基因,建立準確性良好的預后風險模型,并為AML患者個體化治療提供重要的參考價值。
目前尚缺乏免疫基因相關AML預后評估模型。本研究首次提出4個重要的免疫基因(FGF13、GZMB、FLT3、CRLF3)構建的風險評估模型可準確預測AML患者的預后,其中,FGF13、CRLF3為低風險基因,GZMB、FLT3為高風險基因。研究發現,FGF13在多種腫瘤中均發揮了一定的功能[11-12],其中,FGF13與肝細胞癌微環境中免疫細胞浸潤密切相關[13]。GZMB編輯的蛋白可由自然殺傷細胞和細胞毒性T淋巴細胞分泌,被認為是一種細胞毒性的促凋亡蛋白酶[14]。值得一提的是,GZMB在乳腺癌等腫瘤免疫浸潤中具有一定的功能[15]。本研究也發現,與低表達GZMB組相比,高表達GZMB組CD8+T細胞、靜息的自然殺傷細胞等的含量顯著升高,靜息的肥大細胞、嗜酸性粒細胞等的含量顯著降低。目前已有較多的研究表明,FLT3與AML發生發展存在關聯[16-17],并在臨床治療上展現了一定的價值[18]。如Patnaik等[16]發現,FLT3-ITD是一個負面的預后因素,即使在化療或干細胞移植后仍具有預后相關性,這也與本研究結果一致。CRLF3在血小板形成的最后階段發揮了關鍵作用,是血小板血癥潛在的治療靶點[19]。雖然暫無研究顯示CRLF3與骨髓微環境存在關聯,但有證據表明,CRLF3在改善AML患者預后中可能存在一定的價值[20]。此外,本研究單基因預后分析結果也顯示,FGF13、GZMB、FLT3、CRLF3與AML預后顯著相關,同時與骨髓微環境中多種免疫細胞的含量密切相關。各免疫基因發揮作用的具體機制亟待進一步探究。
越來越多的研究顯示,腫瘤浸潤性免疫細胞在預測腫瘤治療和預后效果中發揮了重要作用,部分免疫細胞亞群的作用尤為突出[21-22]。基于去卷積原理的CIBERSORT算法可以利用標準化的基因表達數據去計算不同免疫細胞亞群的相對比例,進而量化特定細胞類型的豐度,在一定程度上克服了傳統分析方法的缺陷[23],目前已應用于多種腫瘤中[24-25]。本研究采用CIBERSORT算法估計AML骨髓樣本中22種免疫細胞的分布比例,并依據風險評分將樣本分為高風險組和低風險組,同時比較組間免疫細胞含量的差異。在過去的十年里,免疫治療在腫瘤治療方面取得了巨大的進步,實現腫瘤免疫治療的一個極有希望的方法是阻斷免疫檢查點途徑[26]。本研究構建的預后風險模型與4個免疫檢查點(CTLA4、PDCD1、KIR3DL、LAG3)顯著相關。結合研究表明,以上免疫檢查點已在臨床上應用廣泛[27-28]。這也進一步明確了該免疫相關的風險模型在AML免疫治療中的應用潛力。
綜上所述,本研究依據多種數據庫,通過生物信息學構建了包含4個免疫相關基因(FGF13、GZMB、FLT3、CRLF3)的預后風險模型。該模型與免疫細胞以及CTLA4等免疫檢查點密切相關,同時可預測AML患者的預后。需說明的是,本研究的結論是基于公共數據庫數據以及生物信息學分析所得,仍有待開展相關體內外試驗加以驗證,這也是本項目組今后工作的重點。本研究為探究免疫相關基因在AML骨髓微環境中的作用機制提供了生物信息學證據,為后續改善AML治療和預后提供了新的靶點,具有較好的理論指導價值。