崔??? 張旭東, 李曉寧, 楊 希, 楊 蘭,2, 張文杰,2
(1.石河子大學醫學院病理系,新疆 石河子 832002;2.新疆地方與民族高發病教育部重點實驗室,新疆 石河子 832002)
胃癌(gastric carcinoma,GC) 是我國常見的惡性腫瘤之一。雖然近些年我國對GC 的防治已經取得了明顯的進步,GC 患者5 年生存率已從27.4% 上升到35.1%,但與日本[1](80.1%) 和韓國[2](75.4%)比較,我國GC 患者5 年生存率仍然較低。因此急需尋找有效的GC 分型和預后標志物提高我國GC 患者的生存率。焦亡作為細胞程序性死亡的一種,可以為腫瘤的生長提供適宜的微環境,促進腫瘤的發生發展[3]。因此本研究選用焦亡相關基因作為胃癌的分型依據,并對差異預后基因采用Lasso 和Cox 回歸分析構建風險預后模型,探討載脂蛋白D(apolipoprotein D,APOD)與胃癌患者的預后及臨床表現的相關性。
APOD 作為脂蛋白超家族中的成員,在脂質運輸、炎癥、抗氧化和多種癌癥的發展中起重要作用[4]。然 而 目 前 關 于APOD 與GC 關 系 的 研 究 較少,本研究基于生物信息學方法分析APOD 對GC患者預后的影響及其與GC 患者常見臨床特征的相關關系,并初步探討APOD 對GC 免疫微環境的影響以及其作為胃癌治療新靶點的潛力。
1.1 數據收集和整理從癌癥基因圖譜(The Cancer Genome Atlas,TCGA)數據庫(包含32例癌旁正常組織和375 例腫瘤組織)(https://portal.gdc.cancer.gov/) 和GSE84437(包含433 例腫瘤組織)數據庫(https://www.ncbi.nlm.nih.gov/geo/)中分別下載GC 患者的臨床數據和相應的轉錄組數據,采用sva 數據包[5]進行批次矯正后,將2 個數據庫中提取的數據進行合并,形成新的數據庫Merge。同時下載GSE66229 數據集(包含100 例癌旁正常組織和300 例腫瘤組織)作為驗證數據集。
1.2 焦亡分型和分型間的相關性分析從基因富集 分 析(Gene Set Enrichment Analysis,GSEA)官網(http://www.gsea-msigdb.org/gsea) 下載52 個焦亡相關基因,并提取Merge 數據庫中所有GC 樣 本 焦 亡 相 關 基 因 的 表 達, 采 用ConsensusClusterPlus 數 據 包[6]對GC 樣 本 進 行 聚類分型(A 分 型 和 B 分 型), 聚 類 算 法 為k-means[7],篩選原則為分型內部相關性高,分型間相關性低。采用pheatmap 數據包繪制熱圖,采用survminer 和survival 數據包進行生存分析,采用ssGSEA 算法比較不同分型患者免疫浸潤的差異。
1.3 不同焦亡分型樣本組間差異預后基因的篩選采用limma 數據包篩選出分型之間的差異預后基因,設置過濾條件為倍數變換(fold changes,FC) 對數的絕對值|log2FC|>0.585 和矯正后P<0.05。然后將差異預后基因進行整理(對在相同樣本中重復出現的基因取平均值,刪除所有樣品中表達量均為0 的基因)。采用survival 數據包將差異預后基因的表達量和生存數據進行合并,然后采用單因素Cox 回歸分析進行循環,設置CoxP<0.05 為過濾條件。
1.4 構建GC 患者預后模型將Merge 數據庫中的GC 樣本進行隨機分組,分為樣本組(402 例)和驗證組(401 例),采用glmnet 數據包進行Lasso Cox 比例風險回歸(迭代次數=1 000)構建風險預后模型。風險得分=模型基因的表達量×風險系數之和,根據公式計算每個樣本的風險得分,根據打分中位值將樣本組劃分為低和高風險組,將驗證組劃分為低和高風險組。
1.5 目的基因篩選將TCGA 數據庫中379 例具有完整臨床信息的GC 患者納入分析,對構建模型的6 個基因進行臨床性狀過濾。采用TCGA 數據庫、GSE66229 數據庫和基于基因表達水平值的交互 式 分 析 平 臺 (Gene Expression Profiling Interactive Analysis, GEPIA) (http://gepia.cancer-pku.cn/)探討癌旁正常組織和腫瘤組織中APOD mRNA 表達水平的差異,同時采用人類蛋白圖庫(The Human Protein Atlas,HPA)數據庫中的免疫組織化學結果進行驗證。
1.6 APOD 獨立預后分析和生存分析在TCGA和GSE84437 數據庫中將APOD mRNA 表達水平、年齡、性別及TNM 分期等多個臨床因素與總生存期進行單因素和多因素Cox 回歸分析,并繪制森林圖進行可視化。將GC 患者按照APOD 表達水平的中位值分為低表達組和高表達組,采用Survival 數據包繪制生存曲線。
1.7 不同 APOD mRNA 表達水平患者臨床特征分析在TCGA 數據庫(379 例具有完整年齡、性別、分級、Stage分期和TNM分期胃癌患者)對不同APOD mRNA 表達水平患者進行臨床特征分析,并采用GSE84437(包含433 例具有完整年齡、性別、T 和N 分期胃癌患者)數據庫進行驗證,采用ggpubr 數據包繪制箱式圖對分析結果進行可視化。
1.8 APOD 表達水平的GSEA 分析和免疫浸潤分析將TCGA 數據庫中的GC 樣本按照APOD 表達水平的中位值分為低表達組和高表達組,采用GSEA 軟件進行京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集分析。采用CIBERSORT 反卷積算法[8]評估GC 樣本中22 種免疫細胞含量,根據P<0.05 進行過濾,篩選出367 例符合條件的樣本。采用ggpubr 和reshape2 數據包對免疫細胞差異結果進行可視化。采用corrplot 數據包繪制22 種免疫細胞含量相關性矩形圖,繪制棒狀圖分析APOD 與免疫細胞含量的相關性,采用GSE84437 數據集對結果進行驗證。采用TISIDB在線數據庫[9](http://cis.hku.hk/TISIDB/) 分析GC 患者中APOD 與免疫激活劑、免疫抑制劑、趨化因子和受體之間的相關性。
1.9 APOD 藥物敏感性分析通過GSCA 在線網站(http://bioinfo.life.hust.edu.cn/GSCA/) 中的抗癌藥物敏感性基因組學(Genomics of Drug Sensitibity in Cancer,GDSC)[10]和癌癥治療反應門 戶(The Cancer Therapeutics Response Portal,CTRP)數據庫對APOD 進行藥物敏感性分析,在TISIDB 數據庫中發掘以APOD 為治療靶點的藥物。
1.10 統計學分析采用R 統計軟件(4.2.0 版本)和SPSS 27.0 統計軟件進行統計學分析。細胞焦亡分型在胃GC 患者分布中的差異比較采用χ2檢驗。TCGA 和GEO 數據庫中APOD mRNA 表達水平不符合正態分布,腫瘤組織和癌旁正常組織中APOD mRNA 表達水平比較采用Wilcoxon 秩和檢驗;APOD mRNA 表達水平與患者臨床特征的相關性分析采用Wilcoxon 和Kruskal-Wallis 秩和檢驗;生存分析采用Kaplan-Meier 方法(Log-rank 檢驗);采用受試者工作特征曲線(receiver operating characteristic curve,ROC) 數據包繪制ROC 曲線評估患者預后模型的準確性;采用Spearman 相關分析探討APOD 與免疫因子表達之間的相關性。以P<0.05 為差異有統計學意義。
2.1 焦亡分型和分型間的相關性分析結果按照聚類分型原則將Merge 數據庫中的GC 樣本分為A 分型(342 例)和B 分型(465 例)(圖1A)。焦亡分型相關分析結果顯示:A 分型中焦亡相關基因表達水平高于B 分型(圖1B);生存曲線顯示:A 分 型GC 患 者 預 后 更 好(P=0.02,圖1C);A 分型中激活B 淋巴細胞、激活CD4+T 淋巴細胞和激活CD8+T 淋巴細胞等22 種免疫細胞均高于B 分型(P<0.01,圖1D)。焦亡分型在胃癌中的差異分布結果顯示:不同年齡(P<0.01)和N 分期(P=0.04) GC 患者A 分型和B 分型百分率比較差異有統計學意義。見表1。

表1 不同臨床病理特征GC 患者細胞焦亡分型的分布Tab.1 Distributions of subtypes of pyroptosis in GC patients with different clinicopathological characteristics

圖1 2 種焦亡分型的差異分析Fig.1 Differential analysis on two subtypes of cell pyroptosis
2.2 預后模型的構建采用Lasso 回歸和Cox 回歸對A 和B 分型的差異預后基因構建GC 風險預后模型, 參與構建模型的基因有載脂蛋白D(apolipoprotein D,APOD)、細胞程序性死亡蛋白1(programmed cell death 1,PDCD1)、葡萄糖轉運體3(solute carrier family 2 member 3,SLC2A3)、轉谷氨酰胺酶2(transglutaminase 2,TGM2)、角蛋 白 7 (keratin 7, KRT7) 和 印 記 基 因 10(paternally expressed gene 10,PEG10)。生存曲線結果顯示:高風險組GC 患者預后較差(P<0.01,圖2A)。ROC 曲線結果顯示:驗證組患者預測第1、3 和5 年生存率的ROC 曲線下面積(area under curve,AUC) 為0.634、0.666 及0.674,樣本組患者預測第1、3 和5 年生存率的AUC 為0.635、0.625 及0.637(圖2B)。表明該模型可以用來評估GC 患者預后水平,并且具有一定的可靠性。

圖2 GC 患者的Kaplan-Meier 曲線和ROC 曲線Fig.2 Kaplan-Meier curve and ROC curve of GC patients
2.3 APOD mRNA 表達水平與GC 患者臨床特征的關聯性本研究在TCGA 數據庫中對預后模型基因進行臨床相關性過濾,結果顯示:APOD 是與GC 患者臨床性狀聯系最為緊密的基因(表2)。TCGA 數 據 庫、GSE66229 數 據 集 和GEPIA 檢 索結果顯示:GC 組織中APOD mRNA 表達水平低于癌旁正常組織(P<0.05),見圖3。由于GC 患者腫瘤組織和癌旁正常組織中APOD mRNA 表達水平有差異,因此本研究將其作為目的基因進行后續分析。

表2 與GC 患者臨床特征有關聯的基因Tab.2 Genes related to clinical characteristics of GC patients

圖3 癌旁正常組織和腫瘤組織中APOD 表達水平的差異性分析Fig.3 Differential analysis on expression levels of APOD in adjacent normal tissue and GC tissue
2.4 GC 患者預后的生物標志物TCGA 數據庫中單因素Cox 回歸分析結果顯示:年齡、Stage 分期、T 分期、N 分期、APOD 與GC 患者的生存有關聯。多因素Cox 回歸分析結果顯示:年齡和APOD 是影響GC 患者生存的獨立因素。GEO 數據庫中單因素和多因素Cox 回歸分析結果顯示APOD能夠獨立影響GC 患者生存。為了進一步探討APOD 對GC 患者預后的影響,本研究將GC 組織樣本按照APOD 表達水平的中位值分為APOD 低表達組和APOD 高表達組,分別進行生存分析,結果顯示:APOD 高表達不利于GC 患者的預后(P<0.05)。見圖4。

圖4 APOD 表達與GC 患者預后的關系Fig.4 Relationship between APOD expression and prognosis of GC patients
2.5 APOD 表達水平與GC 患者臨床特征的關系TCGA 數據庫中,不同年齡、性別、Stage 分期和T 分期患者的APOD 表達水平比較差異有統計學意義(P<0.05),且APOD 表達水平隨著T 分期的增高而增長。GEO 數據庫中,T2 和T3組、T2 和T4 組、N0 和N2 組患者APOD 表達水平比較差異有統計學意義(P<0.05),在T2~T4 組,隨著T 分期的增長,患者APOD 表達水平升高。見圖5。

圖5 APOD 表達水平與GC 患者臨床特征的關系Fig.5 Correlation between expression levels of APOD and clinical characteristics of GC patients
2.6 APOD 表達對免疫等通路中的調控作用本研究將TCGA 數據庫中的GC 組織樣本按照APOD表達水平分為APOD 低表達組和APOD 高表達組,分別進行GSEA 分析,采用GSE84437 數據集對結果進行驗證。GSEA 分析結果顯示:2 個數據庫中APOD 高表達組均在免疫相關通路(細胞黏附通路和白細胞內皮遷移通路) 和縫隙連通路中富集,APOD 低表達組均在DNA 復制、錯配修復及堿基切除修復通路中富集。見圖6。

圖6 APOD 低表達組和APOD 高表達組的GSEA 分析Fig.6 GSEA analysis on APOD low expression group and APOD high expression group
2.7 APOD 表達與 GC 免疫微環境的關系在TCGA 數據庫和GSE84437 數據集中探討了APOD低表達組和APOD 高表達組之間免疫細胞含量的差異。APOD 高表達組中幼稚B 淋巴細胞、單核細胞、樹突狀細胞靜息和靜息肥大細胞含量較為豐富,而濾泡輔助細胞、CD4+記憶激活T 淋巴細胞、靜息NK 細胞和中性粒細胞含量相對較少。免疫細胞相關性分析結果顯示:CD4+記憶靜息T 淋巴細胞和CD8+T 淋巴細胞含量呈負相關關系,激活肥大細胞和靜息肥大細胞含量呈負相關關系。APOD 與濾泡輔助細胞、CD4+記憶激活T 淋巴細胞、靜息NK 細胞和中性粒細胞含量呈負相關關系。TISDB 分析結果顯示:APOD 在GC 組織中和免疫刺激劑CXC 趨化因子配體12(CXC chemokine ligand 12,CXCL12)(r=0.500,P<0.01)、免疫抑制劑轉化生長因子B1(transforming growth factor beta 1,TGFB1)(r=0.313,P<0.01)、趨化因子CC 趨 化 因 子 配 體 19(CC chemokine ligand 19,CCL19)(r=0.518,P<0.01)和受體CX3C 趨化因子受體1(CX3C chemokine receptor 1,CX3CR1)(r=0.444,P<0.01)呈正相關關系。見圖7。

圖7 APOD 表達與 GC 免疫微環境的關系Fig.7 Relationship between APOD expression and GC immune microenvironment
2.8 GDSC 數據庫藥物敏感性分析結果GDSC數據庫藥物敏感性分析結果顯示:APOD 與抗腫瘤藥物達拉非尼,B-Raf 抑制劑PLX4720、SB590885呈負相關關系(-0.4 圖8 APOD 藥物敏感性分析Fig.8 Drug sensitivity analysis on APOD 早期GC 起病隱匿,不易被發現,一旦確診基本已經進入晚期,患者將會錯過最佳治療期。即使后期接受手術治療,其5 年生存率仍低于30%[11]。鑒于晚期GC 患者手術治療效果較差,本研究旨在尋找新的GC 分型和生物學標志物以實現對GC 的早期診斷和早期治療, 從而提高GC 患者的生存率。 細胞焦亡是一種由 Gasdermin(GSDM)家族蛋白進行誘導的程序性細胞死亡,在神經退行性變[12]、動 脈 粥 樣 硬 化[13]和 癌 癥[14]等 疾 病 中 發 揮重要作用。在癌癥組織中,細胞焦亡可以促進炎性細胞的死亡,抑制癌細胞的增殖和遷移。本研究采用細胞焦亡相關基因將GC 患者分為A 和B 2 種分型,相關分析結果顯示:A 分型患者細胞焦亡相關基因的表達水平較高,且預后更好;A 分型患者中22 種免疫細胞含量均高于B 分型。目前已有相關報道顯示:依據細胞焦亡相關基因可以對乳腺癌[15]、膀胱癌[16]和結腸癌[17]等患者進行分型,并且根據分型可對患者進行預后評估,細胞焦亡相關基因的表達影響癌癥患者的腫瘤微環境,這與本研究結論一致。 本研究采用Lasso 回歸和Cox 回歸分析構建風險預后模型,并對參與構建模型的基因進行臨床相關性過濾,篩選出聯系最為緊密的APOD 基因進行后續分析。APOD 是一種多功能蛋白,在不同組織中其表達水平對預后的影響有差異。乳腺癌組織[18]中APOD 蛋白表達水平低于癌旁正常組織,APOD 高表達對患者預后有利。在結腸癌組織[19]中APOD 蛋白表達水平低于癌旁正常組織,而APOD 高表達卻不利于患者預后。本研究結果顯示:在GC 患者腫瘤組織中APOD 蛋白表達水平低于癌旁正常組織,并且APOD 高表達不利于GC 患者預后。此外本文作者發現:APOD 可以獨立對GC 患者進行預后評估,APOD 蛋白表達水平還會隨著T 分期的增高而升高,因此認為APOD 具有成為GC 預后標志物的潛力。 APOD 高表達組在細胞黏附和白細胞內皮遷移等免疫通路及縫隙連接通路中富集。細胞黏附在癌癥進展中起到非常重要的作用,被認為是腫瘤免疫逃逸和轉移性擴散的標志。細胞黏附分子常通過糖基化的改變,影響癌細胞和細胞外基質蛋白之間的相互作用[20]。白細胞在參與炎癥反應時會通過阿米巴運動的方式穿過緊密相連的內皮細胞,通過間質 組 織 進 行 遷 移[21]。縫 隙 連 接(gap junction,GJ) 是一種連接2 個相鄰細胞通道構成的膜結構,相鄰細胞通過GJ 可以進行信息、能量和物質等交換,并且GJ 對細胞新陳代謝、內環境穩定及增殖分化等起重要調控作用[22]。APOD 可能是通過調控這些通路影響GC 浸潤深度,進而影響GC 的發展,導致患者預后較差。 腫瘤微環境(tumor microenvironment,TME)與腫瘤發展關系密切,腫瘤細胞增殖常會導致TME 發生相應重構,TME 又在影響患者預后和抗癌療效等方面具有較大優勢,因此目前人們越來越重視TME 的靶向治療[23]。本研究結果顯示:APOD 高表達組中濾泡輔助T 淋巴細胞、CD4+記憶激活T 淋巴細胞、靜息NK 細胞和中性粒細胞含量較低,并且APOD 蛋白表達水平與上述4 種免疫細胞的豐度呈負相關關系。而這4 種免疫細胞在腫瘤的發展中起抵抗作用,濾泡輔助T 淋巴細胞屬于輔 助B 細 胞 的CD4+T 淋 巴 細 胞 亞 群[24],有 研究[25]顯示:在乳腺癌和結腸癌患者中,濾泡輔助T 淋巴細胞相關的細胞越少,患者預后越差,也有研究[26]顯示:濾泡輔助T 淋巴細胞缺失會導致CD8+T 淋巴細胞功能障礙。NK 細胞作為一種可以參與抗擊腫瘤的天然免疫細胞,不依賴抗原呈遞細胞(antigen-presenting cells,APCs)的刺激也可以直接殺傷腫瘤細胞,與腫瘤相互作用后,NK 細胞可以殺死其靶點并分泌細胞因子、腫瘤壞死因子α 和生長因子[27]。 CD4+記憶T 淋巴細胞是TME 的重要組成部分,影響腫瘤的發生發展,有研究[28]顯示在GC中高豐度CD4+記憶T 淋巴細胞的患者預后較好。中性粒細胞作為人體最主要的免疫細胞之一,具有免疫防御作用,可以抵抗細菌、真菌和病毒的侵襲,清除凋亡細胞有利于受損組織血管再生[29]。鑒于上述免疫細胞的腫瘤抵抗性,本文作者認為是APOD 表達降低了4 種免疫細胞的豐度,從而導致GC 患者預后較差。 本研究結果顯示:APOD 表達與CXCL12、TGFB1、CCL19 和CX3CR1 表達呈正相關關系。CXCL12 是一種內穩態趨化因子,在自身免疫炎癥反應中扮演抗炎趨化因子的作用,在癌細胞中可以促進血管生成,調節腫瘤細胞凋亡。研究[30]顯示:CXCL12 在卵巢癌、小細胞肺癌、胰腺癌和前列腺癌等癌癥中可以刺激腫瘤細胞增殖。TGF-B1 作為一種免疫抑制劑,可以通過抑制T 淋巴細胞中白細胞介素2(interlukin-2,IL-2) 的表達和許多關鍵調節因子的分泌來抑制T 淋巴細胞的生長。在腫瘤細胞中TGF-B1 可以在惡性轉化后期促進上皮細胞間充質轉化和轉移[31]。CCL19 是一種穩態趨化因子,在腫瘤細胞中可以誘導腫瘤異質性,抑制細胞凋亡,促進腫瘤細胞的轉移[32]。CX3CR1 作為趨化因子受體家族中的一員,與其配體形成的CX3CR1-CX3CL1 軸可以誘導具有促進腫瘤活性的免疫細胞的增殖、遷移、侵襲和黏附,從而導致腫瘤的發生發展[33]。本文作者認為:APOD 有可能通過調控上述免疫相關分子,促進GC 發展,導致患者預后較差。 藥物敏感性分析結果顯示:APOD 和細胞周期檢 測 點 激 酶(checkpoint kinase, Chk) 抑 制 劑AZD-7762、多重激酶抑制劑KW-2449 和JAK2 抑制劑TG-101348 呈正相關關系。有研究[34]顯示:Chk 抑制劑在治療肺癌時已經取得了顯著成效,其通過誘導細胞凋亡,阻滯細胞周期的方式,可以逆轉因細胞周期失調而引起的獲得性耐藥。多靶點激酶抑制劑可以同時阻斷多個細胞生長的信號傳導通路,目前已經成為腫瘤新藥研發的重點[35]。JAK2抑制劑也對部分存在JAK2 信號通路異常的實體腫瘤具有一定療效,可以在一定程度上減慢腫瘤生長[36]。 本研究結果顯示:依據細胞焦亡分型可以很好地對GC 患者的預后進行評估,且APOD 有可能成為GC 新的預后標志物。臨床醫生在對GC 患者進行診療時可以采用細胞焦亡分型,同時應重視APOD 蛋白表達水平。但是APOD 在GC 中的調節機制仍需進一步研究,其對GC 預后水平的評估作用也需要在臨床中進一步驗證。
3 討 論