陳小梅 王安奇 楊積禎 于淼
甘肅省人民醫院1國家胃腸腫瘤診治重點實驗室,2臨床研究與轉化醫學研究所,3超聲醫學科(蘭州 730000)
目前,胃癌患者的預后主要通過檢查病理分型和臨床分期來評估。早期發現、及時適當的干預、合理的預后評價是影響胃癌預后的關鍵因素。因此,探索與胃癌顯著相關的獨特生物分子對于提高患者的長期生存至關重要。研究[1]表明,表觀遺傳調控在間充質腫瘤的發生中起重要作用。由于其對基因表達的顯著影響,RNA 修飾近年來受到越來越多的關注。甲基化是已知RNA 修飾中最常見的,包括n1-甲基腺苷(m1A)、5-甲基胞嘧啶(m5C)、n6-甲基腺苷(m6A)和7-甲基鳥苷(m7G)[2]。作為RNA 修飾研究的熱點,m1A、m5C、m6A、m7G甲基化修飾在多種生物過程中發揮重要作用[3]。異常甲基化與人類癌癥進展有關,特別是在胃癌中[4]。
胃癌在分子和表型上都是一種高度異質性的惡性腫瘤。腫瘤微環境除腫瘤細胞外,還含有細胞外基質和基質細胞、免疫細胞等多種細胞,共同構成腫瘤免疫微環境(tumor immune microenvironment, TIME)。癌癥中有許多重要的過程導致了TIME 的復雜性,包括不受控制的癌細胞增殖、代謝和血管發育缺陷[5-6]。TIME類似于腫瘤免疫促進和抑制的戰場,極大地影響免疫治療的反應性,基于甲基化調控基因的基因表達特征可能是預測癌癥患者免疫檢查點阻斷(immune checkpoint blockade, ICB)治療反應的有力方法[7]。為了充分闡明m1A/m5C/m6A/m7G 調控基因在胃癌進展中的作用及其對TIME 的影響,這項研究分析了來自TCGA和GEO 數據集的707 個胃癌樣本的基因組變化,建立了基于m1A/m5C/m6A/m7G 調控基因的新型預后RS 模型,檢驗其對胃癌患者預后的預測能力,并進一步分析該模型與TIME 的關聯性。
1.1 數據收集和預處理 TCGA-胃癌數據集(n=407)來自UCSC-Xena 數據庫,包括具有臨床信息的32 個正常對照樣本和350 個胃癌樣本,作為訓練數據集。GSE62254 數據集(n= 300)可從Gene Expression Omnibus (GEO)數據庫獲得[8],此數據集被指定為驗證數據集。
1.2 鑒定m1A/m5C/m6A/m7G 調控基因在胃癌中的差異表達 從文獻中獲得m1A/m5C/m6A/m7G 調控基因[9-10]。對于訓練數據集,使用R4.2.1中的“limma”軟件包 (v3.54.1)來識別正常和胃癌樣本之間的差異表達基因(differentially expressed genes, DEGs),選擇FDR < 0.05 和|Log2 FC| > 0.5作為篩選閾值;采用“cor”函數計算DEGs 之間的相關性。
1.3 RS 模型的建立與驗證 使用R4.2.1 中的survival包(v3.5-0),進行單因素Cox回歸分析,選取P< 0.05 作為篩選顯著相關的閾值,篩選與疾病預后顯著相關的基因。利用lars 包(v1.3)中的LASSO算法對目標基因集進行回歸分析,篩選最佳基因組合。最后,根據各基因的LASSO 預后系數和表達水平,構建RS模型:Risk Score(RS) = ∑Coefgenes×Expgenes。Coefgenes為靶基因的LASSO 預后系數,靶基因的表達量用Expgenes表示。分別計算TCGA-胃癌和GSE62254 數據集的RS 值,并以RS 中值為界將樣本分為低、高風險兩個風險組。在R4.2.1中使用survival 包(v3.5-0)的Kaplan-Meier 曲線統計方法對模型可靠性進行驗證。
1.4 建立具有獨立生存預后因素的nomogram 生存模型 在R4.2.1 中使用survival 包(v3.5-0)對樣本的臨床因素進行單因素和多因素Cox 回歸分析,檢測顯著相關性的閾值均設置為P< 0.05。將上述步驟得到的獨立預后因素與預后RS 模型判別出的風險信息結合使用R4.2.1 中rms 包(v6.2-0)構建nomogram 生存模型。使用R4.2.1 中的survcomp 包(v1.48.0)計算nomogram預后模型的C-index系數。
1.5 胃癌細胞與正常胃細胞的培養 人胃癌細胞系AGS、HGC27、MKN45 和SNU1 來源于武漢普諾賽生命科學技術有限公司,人胃黏膜上皮細胞系(GES-1)由上海賽百慷生物科技有限公司提供。培養條件均為含10%胎牛血清的RPMI-1640 培養基,37 ℃, 5% CO2。
1.6 RT-qPCR 驗證 使用Trizol 試劑(批號:15596018,Ambion, Life Technologies,USA)從細胞系中提取總RNA。使用FastKing gDNA RT 試劑盒(批號:KR118,天根生物科技有限公司,中國)進行逆轉錄合成cDNA。使用TB Green Premix DimerEraser (批號:RR037A,TaKaRa,日本)和Quant-Studio DX PCR 儀(Applied Biosystems, Inc.,美國)進行qPCR 分析。引物由上海生工提供。
1.7 免疫基因景觀分析 采用CIBERSORT 算法計算TCGA-胃癌數據集中22 個免疫細胞的比例,并評估兩組之間免疫細胞亞群分布的差異。在R4.2.1 中使用estimate 包來計算比較兩組中各免疫評分分布的差異,使用ggpubr 包分析兩組中免疫檢查點基因的表達差異。
1.8 統計學方法 所有分析均使用R語言(v4.2.1)進行。采用學生t檢驗和χ2檢驗進行配對比較。對于兩組以上的方差,采用單因素方差分析或Kruskal-Wallis 檢驗。為了評估變量之間的關系,采用Spearman 相關檢驗。P< 0.05 為差異有統計學意義。
2.1 差異基因識別 在訓練集中鑒定出29個差異表達的m1A/m5C/m6A/m7G 調控基因(P< 0.005)(圖1)。

圖1 胃癌患者m1A/m5C/m6A/m7G 調控基因DEGs 的篩選Fig.1 Screening for DEGs of m1A/m5C/m6A/m7G regulated genes in GC patients
2.2 建立m1A/m5C/m6A/m7G 調控基因相關RS模型 單因素Cox回歸分析產生11個與生存有顯著預后相關性的基因(圖2A),之后利用LASSO算法獲得8 個最佳組合基因(圖2B)。利用TCGA-胃癌數據集中8 個基因及其表達量的LASSO 回歸系數,構建RS 公式:Risk score = (-0.003627555) × ExpTRMT10C+ (-0.030350865) × ExpTRMT6+ (-0.100825842) ×ExpRBM15+ (-0.025329733) × ExpWDR4+ (-0.015785251)× ExpHNRNPA2B1+ (0.057529045) × ExpNUDT10+(0.076060498) × ExpNUDT11+ (0.146531852) × ExpDCP2。

圖2 森林圖描繪了與預后有顯著關系的11 個基因Fig.2 A forest plot depicting the 11 genes that have a significant relationship with prognosis
2.3 RS模型的效能評價 Kaplan-Meier曲線算法分析表明,在驗證集(HR= 1.805,P= 0.000 53;圖3A)和訓練集(HR= 1.779,P= 0.000 44;圖4A) 中,患者OS 與分組狀態之間顯著相關。圖3B 和圖4B 分別顯示了兩個數據集中兩個風險組的RS 值和生存時間分布。圖3C 和4C 顯示了基于RS 模型的受試者工作特征(ROC)曲線的結果,TCGA-胃癌數據集的AUC 為 0.863(95%CI:0.724 ~ 0.858,P<0.001);GSE62254 數據集的AUC 為 0.810(95%CI:0.621 ~ 0.847,P< 0.001)。

圖3 TCGA 訓練數據集Fig.3 TCGA training dataset.

圖4 GSE62254 驗證數據集Fig.4 GSE62254 validation dataset.
2.4 Nomogram 生存模型的建立 單因素和多因素Cox 分析表明,RS 模型、放療、腫瘤復發、病理分期和年齡是與OS 相關的獨立預后因素(表1)。構建的nomogram 生存模型可以很好的預測胃癌患者的生存期(圖5A),校準曲線(圖5B)顯示通過nomogram 生存模型預測的1 年(C-index=0.703)、3 年(C-index=0.729)和5 年(C-index=0.734)生存率與實際生存率的一致性較好(P< 0.001)。

表1 臨床預后因素與預后的相關性分析Tab.1 Analysis of the correlation between clinical prognostic factors and prognosis

圖5 構建生存預測nomogram 模型并評估其預測能力Fig.5 Creating a survival prediction nomogram and assessing its predictive power
2.5 驗證RS模型基因在胃癌細胞系中的表達 與胃黏膜細胞相比,胃癌細胞中DCP2、HNRNPA2B1、NUDT10、NUDT11、RBM15、TRMT10C、TRMT6 和WDR4 的mRNA 表達水平顯著升高(P< 0.05)(圖6)。

圖6 利用RT-qPCR 方法驗證8 個優化基因在胃癌細胞系中的mRNA 表達水平Fig.6 Verifying mRNA expression levels of the 8 optimized genes in GC cell lines using RT-qPCR method
2.6 免疫浸潤模式的鑒定 免疫細胞浸潤分析(圖7A)共篩選到8 種免疫細胞(記憶B 細胞、濾泡輔助T 細胞、調節性T 細胞、活化肥大細胞、靜息肥大細胞、巨噬細胞M0、巨噬細胞M1、巨噬細胞M2)在各組間的分布具有顯著差異(P< 0.05)。各組之間的ESTIMATE 評分亦具有顯著差異(P<0.001)(圖7B)。圖7D顯示了8個RS模型基因與免疫細胞和ESTIMATE評分之間的相關性。免疫檢查點基因差異分析結果顯示,高危組有14 個免疫檢查點基因(BTLA、CD200、CD200R1、CD226、CD28、CD40LG、CD44、CD48、CD86、CD96、HAVCR2、IDO2、LAIR1、NRP1、PDCD1LG2、TIGIT、TNFSF14、TNFSF4)上調,而低危組只有3 個免疫檢查點基因(LGALS9、PVR、TNFRSF12A)上調(圖7C)。

圖7 風險分組與免疫浸潤模式的相關性分析Fig.7 Analysis of correlations between risk grouping and immune infiltration patterns.
最近的證據表明,活躍的RNA 甲基化在癌癥進展中起重要作用,并可能成為癌癥患者的新藥靶點[11]。然而,對胃癌中RNA 甲基化的研究主要集中在少數RNA 甲基化調控基因上,特別是m6A相關的調控基因,其他類型的RNA 修飾及其綜合作用尚不清楚。盡管許多研究使用生物標志物預測胃癌預后,但沒有研究將m1A/m5C/m6A/m7G 調節基因作為預后生物標志物。因此,建立基于m1A/m5C/m6A/m7G 調控基因的胃癌預后RS 模型至關重要,且有助于闡明胃癌TIME 的特征和開發新的胃癌治療策略。
本研究利用TCGA-胃癌數據集構建并驗證了m1A/m5C/m6A/m7G 調控基因相關RS 模型。與正常樣本相比,胃癌樣本中DCP2、WDR4、HNRNPA2 B1、NUDT10、NUDT11、RBM15、TRMT10C和TRMT6基因表達顯著上調,這8 個基因的mRNA 表達水平亦在胃癌細胞株中得到了驗證。HNRNPA2B1作為m6A 結合蛋白之一,通過抑制細胞凋亡、促進細胞增殖和增加細胞遷移侵襲,參與維持胃癌的惡性表型[12]。HNRNPA2B1 高表達的胃癌患者預后不良[12]。RBM15 是m6A 甲基轉移酶之一,在喉癌和肝細胞癌中被發現顯著升高[13]。作為m1A甲基化的編輯器,TRMT6 和TRMT10C 參與婦科癌癥的惡性行為,并與肝細胞癌患者的不良預后相關[10,14]。DCP2 是第一個也是研究最廣泛的真核解旋酶,通過影響細胞遷移和凋亡等過程參與癌癥的發病機制[15]。作為Nudix 蛋白家族(NUDT)的成員,NUDT10 與胃癌的TNM 分期、淋巴結轉移和局部浸潤深度顯著相關[17];NUDT11 可促進結腸癌、前列腺癌、乳腺癌和肺癌的細胞增殖[18]。WDR4 是一種m7G 甲基轉移酶,目前已知WDR4在多種惡性腫瘤中作為腫瘤啟動子[19]。因此,這八個RS 模型基因與腫瘤密切相關,它們在胃癌中的作用機制值得深入研究。這項研究中,低危組和高危組的臨床結局存在顯著差異,表明該RS 模型能夠有效預測胃癌預后。此外,K-M 驗證結果表明,該RS 模型在訓練集和驗證集中的5 年AUC分別為0.863 和0.810,表明其在長期隨訪中具有更好的預測價值,高于近期一些研究[20-21]。
近年來,免疫浸潤評估在腫瘤治療和預后預測中越來越重要。免疫療法在很大程度上依賴于TIME。對接受ICB 治療的患者的回顧性分析顯示,對ICB 有反應的腫瘤與其TIME 模式相關[22]。有研究發現M2 巨噬細胞與腫瘤進展密切相關,M2 巨噬細胞有助于胃癌腹膜播散[23]。肥大細胞激活特征與胃癌患者腫瘤進展加快和患者生存率降低相關[24]。在小鼠胃癌模型中觀察到使用肥大細胞穩定劑色甘酸鈉可以防止肥大細胞活化,從而有效降低腫瘤生長[25]。這些證據表明豐富的M2 巨噬細胞和活化的肥大細胞浸潤對胃癌的臨床結局和治療反應效果有負面影響。相反,一些免疫細胞的豐度與良好的腫瘤預后密切相關,如濾泡輔助性T 細胞和M1 巨噬細胞。M1 巨噬細胞具有促炎特性(如分泌IL-12 和活性氧),從而促進抗腫瘤活性[26]。腫瘤中M1 巨噬細胞的高密度預示著更長的總生存期[25]。濾泡輔助性T 細胞作為主要的IL-21 產生細胞,在實體瘤的免疫應答中發揮積極作用;濾泡輔助性T 細胞通過分泌IL-21 間接增強CD8+T 細胞介導的抗腫瘤免疫[27]。同樣,我們的研究結果提示,預后較好的患者有較高水平的濾泡輔助T 細胞浸潤和M1 巨噬細胞浸潤。這些發現很好地解釋了我們研究結果中不同風險組的預后差異,這可能在很大程度上是由于免疫浸潤細胞分布的差異。我們還發現在高危組患者中,高ESTIMATE 評分伴隨著低水平的腫瘤純度,提示免疫評分低的胃癌患者比免疫評分高的胃癌患者生存期更長,而腫瘤純度低的胃癌患者生存期更短。我們的觀察結果與GONG 等人和ZENG等人的一致[28-29]。此外,這項研究顯示大多數免疫檢查點基因在高危組中過度表達。免疫檢查點基因的高表達可形成免疫抑制TIME,促進腫瘤免疫逃逸。因此,不同的免疫細胞浸潤模式是影響胃癌預后的重要因素。總體來說,m1A/m5C/m6A/m7G調控基因參與了TIME 的重編程。
綜上所述,我們基于m1A/m5C/m6A/m7G 調控基因建立的胃癌預后相關的RS 模型展現出優秀的預測能力,同時在免疫治療和化療用藥評估方面也顯示出潛力,為胃癌的預后和治療提供了新的視角。
【Author contributions】The study protocol was co-created by CHEN Xiaomei and YU Miao. The manuscript was written by CHEN Xiaomei.CHEN Xiaomei and YU Miao worked together to analyze data from public databases. The qRT-PCR experiments were carried out by WANG Anqi and YANG Jizhen. All authors read and approved the final manuscript as submitted.
【Conflict of interest】The authors declare no conflict of interest.