章海斌,王 練
(蚌埠醫(yī)學院第一附屬醫(yī)院腫瘤內(nèi)科1,中醫(yī)科2,安徽 蚌埠 233000)
三陰性乳腺癌(triple-negative breast cancer,TNBC)是一類特殊類型的乳腺癌,由于其缺乏雌激素和孕激素受體以及人表皮生長因子受體2(Her-2)的表達,表現(xiàn)出不同組織學類型,基因組和免疫特征,因而被單列為一類疾病[1]。流行病學資料顯示[2],TNBC 的發(fā)生率占所有乳腺癌的15%~20%,好發(fā)于絕經(jīng)前40 歲以下的年輕女性。TNBC 具有高侵襲的特性,術(shù)后復發(fā)率高,約25%,且術(shù)后復發(fā)時間僅為19~40 個月,遠低于非TNBC 患者的35~67 個月。遠處轉(zhuǎn)移發(fā)生率約46%,多累及腦及其他內(nèi)臟器官,轉(zhuǎn)移后的中位生存時間為13.3 個月。因此其5 年死亡率遠高于其他類型乳腺癌,達40%。復發(fā)后TNBC患者發(fā)生3 個月內(nèi)概率高達75%[3]。基于TNBC 的異質(zhì)性與難治性,建立有效的預(yù)后生物標志物對TNBC 患者準確預(yù)后和合理治療策略至關(guān)重要。越來越多的證據(jù)表明,有氧糖酵解是癌細胞的重要代謝過程。不管是否有充足的氧氣,腫瘤細胞主要利用糖酵解來產(chǎn)生能量,并且具有較高的糖酵解率。這種有氧糖酵解表型被稱為Warburg 效應(yīng)[4]。Warburg 效應(yīng)已在不同類型的實體腫瘤中得到證實,包括乳腺癌[5]。因此,靶向糖酵解過程可能成為TNBC 的潛在治療靶點。GFUS 又稱組織特異性移植抗原P35B,是一種NADP(H)結(jié)合蛋白,催化GDP-D-甘露糖代謝中的兩步外聚酶和還原酶反應(yīng),將GDP-4-酮-6-D-脫氧甘露糖轉(zhuǎn)化為GDP-L-巖藻糖,在糖基化過程中起著關(guān)鍵作用[6]。GFUS 表達的增加可以同時誘導核心巖藻糖蛋白和巖藻糖蛋白的升高。這種異常的巖藻糖基化在結(jié)直腸癌、肝癌、肺癌、黑色素瘤、食管癌等腫瘤中都普遍存在,其調(diào)控腫瘤細胞的增殖、侵襲和遷移、血管生成、轉(zhuǎn)移、免疫逃逸等方面發(fā)揮作用[7-9]。研究發(fā)現(xiàn)[10],GFUS 的高表達在乳腺癌的發(fā)生發(fā)展中起重要作用,可作為乳腺癌的獨立分子標志物。因此,本研究通過應(yīng)用多種生物信息學方法,實現(xiàn)GFUS 共表達基因鑒定,構(gòu)建了TNBC 的預(yù)后模型,以期對指導TNBC 個體化治療提供新思路。
1.1 資料來源 從TCGA(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)獲取160 例TNBC 腫瘤樣本與113 例癌旁正常組織樣本的基因轉(zhuǎn)錄組數(shù)據(jù)及臨床數(shù)據(jù)。
1.2 方法
1.2.1 GFUS 在TNBC 中的表達差異及的功能分析使用R 軟件v4.0.3 進行統(tǒng)計分析,對GFUS 表達水平在癌與癌旁進行差異分析,P<0.05 被認為差異有統(tǒng)計學意義。使用c2.cp.kegg.v2022.1.Hs.symbols.gmt集合,采用基因富集分析(gene set enrichment analysis,GSEA)分析GFUS 高表達組和低表達組之間主要富集在的信號通路和表現(xiàn)的相應(yīng)生物學功能。
1.2.2 差異基因的篩選及共表達基因鑒定 使用limma R 包對腫瘤和正常組織之間的DEG 進行鑒定(FDR<0.05 and |log2FC|>1),得到在TNBC 中差異表達的基因。通過皮爾森相關(guān)性分析選擇得到共表達基因(閾值相關(guān)性系數(shù)在0.4 及P<0.05)。
1.2.3 基因篩選與模型構(gòu)建 對差異共表達基因的表達量以及生存數(shù)據(jù)進行單變量Cox 比例風險回歸分析,利用R 包survival coxph function,選擇P<0.05作為閾值得到預(yù)后顯著基因。通過Lasso 壓縮估計構(gòu)建模型:使用R 軟件包glmnet 進行l(wèi)asso cox 回歸分析,首先分析每個自變量的變化軌跡,隨著lambda 的逐漸增大而逐漸增加自變量系數(shù)趨于0 的個數(shù),后使用5-fold 交叉驗證進行模型構(gòu)建,分析每個lambda 下的置信區(qū)間,最終當lambda=0.042 357 2時模型達到最優(yōu),最終模型公式如下:
1.2.4 預(yù)后模型驗證 采用外部驗證來評估該模型的預(yù)測價值,外部驗證集和訓練集具有相同的模型和系數(shù)。同樣,每個樣本的風險得分由樣本的表達水平計算的而來。使用R 軟件包timeROC 對RiskScore進行預(yù)后分類的生存分析及受試者工作特征(receiver operating characteristic,ROC)分析,分別分析3、5 年的預(yù)后預(yù)測分類效率。
1.3 統(tǒng)計學分析 R 軟件(R 版本:4.0.3)進行所有數(shù)據(jù)統(tǒng)計分析。Wilcoxon 檢驗用于連續(xù)變量分析,χ2檢驗用于分類數(shù)據(jù)分析。Kaplan-Meier 分析和Log-rank 檢驗用于生存差異計算。分析結(jié)果均以P<0.05 為差異有統(tǒng)計學意義。
2.1 基于TCGA 數(shù)據(jù)分析GFUS 在TNBC 中的表達差異 從TCGA 數(shù)據(jù)庫中獲得的mRNA 水平顯示,癌旁正常組織中的GFUS 水平低于癌組織(P<0.05),見圖1。
2.2 GFUS 在TNBC 中的高表達與較差預(yù)后相關(guān) 與GFUS 低表達患者相比,GUFS 高表達患者具有更差的總生存率(overall survival,OS)(P<0.05),見圖2A。同樣,高表達GFUS 的TNBC 患者具有更差的無進展生存期(progress free survival,PFS)、無病生存期(disease free survival,DFS)及疾病特異性生存期(disease free survival,DSS)(P<0.05),見圖2B~圖2D。

圖2 GFUS 高低表達組生存指標差異
2.3 GFUS 高低表達組的功能分析 運用GSEA 分析GFUS 高表達組和低表達組的基因主要富集的信號通路和生物學功能見圖3A~3F。結(jié)果表明,高表達組主要富集在RENIN_ANGIOTENSIN_SYSTEM、GLUTATHIONE_METABOLISM、OXIDATIVE_PHOS PHORYLATION 等通路;低表達組主要富集在SMALL_CELL_LUNG_CANCER、WNT_SIGNALING_PATHWAY、TGF_BETA_SIGNALING_PATHWAY 等通路。

圖3 基因集富集分析(GSEA)結(jié)果
2.4 疾病差異表達基因鑒定 為了進一步探索三陰性乳腺癌中差異表達的基因,使用limma R 包對腫瘤和正常組織之間的DEG 進行鑒定(FDR<0.05 and|log2FC|>1),得到3050 個基因,其中在腫瘤組織中上調(diào)基因共有1099 個,下調(diào)基因有1951 個,差異表達基因的火山圖見圖4A,上下調(diào)前100 個基因的表達熱圖間圖4B。

圖4 差異表達火山圖和熱圖
2.5 GFUS 共表達基因鑒定 為了進一步鑒定GFUS共表達基因,通過皮爾森相關(guān)性分析選擇閾值相關(guān)性系數(shù)在0.4 及P<0.05,共得到340 個共表達基因,其中正相關(guān)基因有308 個,負相關(guān)基因有32 個,相關(guān)性散點圖見5A,相關(guān)性基因的表達熱圖見5B。
2.6 模型構(gòu)建 最終得到77 個差異共表達基因圖6A,對這77 個基因的表達量以及生存數(shù)據(jù)進行單變量Cox 比例風險回歸模型。利用R 包survival coxph function,選擇P<0.05 作為閾值,最終得到了36 個預(yù)后顯著的基因。應(yīng)用Lasso [Least absolute shrinkage and selection operator,Tibshirani(1996)]方法進行壓縮估計并構(gòu)建模型,該算法可以進一步縮小基因范圍,同時保證較高準確率。使用R 軟件包glmnet 進行l(wèi)asso cox 回歸分析,首先對每一個自變量的變化軌跡進行分析,自變量系數(shù)趨于0 的個數(shù)隨著lambda 的逐漸增大而增多,接著使用5-fold 交叉驗證構(gòu)建模型,以分析每個lambda 下的置信區(qū)間。圖6B、圖6C 可以看出當lambda=0.042 357 2 時模型達到最優(yōu),最終模型公式如下:

圖6 篩選構(gòu)建模型的相關(guān)基因
依據(jù)樣本的表達水平分別計算了每個樣本的風險得分,并繪制出樣本的RiskScore 分布。如圖7A所示,風險得分高的樣本OS 顯著低于得分較低的,這提示了高的RiskScore 樣本預(yù)后更差。4 個不同的signature 基因隨著風險值的增加表達情況發(fā)生變化,鑒定了GPLD1 的高表達和低風險相關(guān),為保護因素;鑒定了GFUS、ATP6V0B、MFSD3 的高表達和高風險相關(guān),為危險因素。根據(jù)RiskScore 中值將樣本劃分高低風險組,并繪制KM 曲線,如圖7B 所示,從中可以看出兩組差異及其顯著Log-rankp=0.004 59,HR=3.476(95%CI:1.469~8.229),其中80個樣本被劃分為高風險組,80 個樣本為低風險組;進一步使用R 軟件包timeROC 對CubScore 進行預(yù)后分類的ROC 分析,分別分析了1、3、5 年的預(yù)后預(yù)測分類效率,如圖7C 所示,從中可以看出模型具有很高的AUC 線下面積,在0.687 以上。

圖7 預(yù)測風險模型的構(gòu)建
2.7 外部數(shù)據(jù)驗證 采用和訓練集相同的模型和系數(shù)來實現(xiàn)外部驗證,以評估該模型的預(yù)測價值。外部驗證集中采用與訓練集相同的模型和相同的系數(shù)。根據(jù)樣本的表達水平來依次計算樣本的風險得分,使用R 軟件包timeROC 對RiskScore 進行預(yù)后分類的ROC 分析,對3、5 年的預(yù)后預(yù)測分類效率進行了分別分析,如圖8C 所示,從中可以看出該模型具有很高的AUC 曲線下面積,5 年的在0.68 以上,接下來對Riskscore 進行劃分高低分線,并繪制KM 曲線,從中可以看出他們存在極顯著的差異Log -rankp=0.0446,HR=2.137(95%CI:1.018~4.483),其中高風險組的樣本數(shù)為45 個,低風險組的樣本數(shù)為62 個,見圖8A、圖8B。

圖8 外部數(shù)據(jù)集驗證風險模型
三陰性乳腺癌是一種具有侵襲性的乳腺癌亞型,因缺少特異靶向藥物,化療仍是當前的主要治療手段[11]。隨著精準醫(yī)學的發(fā)展,現(xiàn)已進入腫瘤管理的新時代。發(fā)現(xiàn)新的標志物對于提高TNBC 的診療效果有著重大意義。
癌細胞經(jīng)歷了新陳代謝的改變,以滿足對能量、構(gòu)建模塊和氧化還原電位的巨大需求。腫瘤即使在有氧氣的情況下也會表現(xiàn)出分泌葡萄糖和乳酸的行為,這一過程被稱為有氧糖酵解[12]。糖酵解是癌細胞代謝的支柱,而癌細胞已經(jīng)進化出各種機制來加強它。葡萄糖代謝與其他代謝途徑交織在一起,使癌癥代謝變得多樣化和異質(zhì)化,其中糖酵解發(fā)揮著核心作用[13]。致癌信號傳導加速了糖酵解酶的代謝活動,主要是通過增強其表達或翻譯后修飾。有氧糖酵解將葡萄糖發(fā)酵成乳酸,通過各種機制支持腫瘤的生長和轉(zhuǎn)移[14]。最新研究也證實[15],糖酵解與腫瘤治療耐藥相關(guān)。已知糖酵解中間產(chǎn)物的積累可激活磷酸戊糖途徑產(chǎn)生NADPH。NADPH 的產(chǎn)生使癌細胞能夠維持足夠水平的還原性谷胱甘肽(GSH)。GSH 是一種關(guān)鍵的非酶抗氧化劑,通過維持氧化還原狀態(tài)以抵消化療藥物的作用,在保護癌細胞免受抗腫瘤藥物的侵害方面發(fā)揮著關(guān)鍵作用[16]。同時,對糖酵解依賴性的增加是腫瘤代謝重編程的重要特征,這一過程參與了腫瘤微環(huán)境與腫瘤免疫調(diào)節(jié)[17]。因此,靶向糖酵解過程不僅可以抑制腫瘤生長、遷移和侵襲,同時,有望通過抑制糖酵解來提高抗腫瘤免疫治療效果。
與其他亞型相比,三陰性乳腺癌更加依賴糖酵解過程[18]。缺氧時HIF-1α 水平升高也與有氧糖酵解增加有關(guān),與非TNBC 細胞相比,HIF-1α 穩(wěn)定在TNBC 細胞中更常見。然而,HIF-1α 的穩(wěn)定并不局限于缺氧條件,在有氧條件下也能穩(wěn)定,這足以驅(qū)動常氧條件下的糖酵解。有研究發(fā)現(xiàn)[19],50%在常氧條件下表現(xiàn)出HIF-1α 穩(wěn)定的癌細胞系是高度糖酵解和高侵襲性的。在常氧條件下HIF-1α 穩(wěn)定背后的機制來自于乳酸和丙酮酸(有氧糖酵解的最終產(chǎn)物)通過刺激HIF-1α 的積累來調(diào)節(jié)缺氧誘導的基因表達,即使是在缺氧獨立的條件下。Sadeghalvad M[20]等證實與ER+腫瘤相比,TNBC 中的丙酮酸和乳酸顯著增加;TNBC 與ER+腫瘤相比,幾乎所有糖酵解中間體都上調(diào),這表明TNBC 糖酵解過程增加。
GFUS 作為參與糖酵解過程的關(guān)鍵基因,在多種腫瘤中高表達。本研究結(jié)果顯示:GFUS 在TNBC中的表達顯著高于正常組織,且這種高表達與不良預(yù)后密切相關(guān)。基因富集分析結(jié)果顯示:高GFUS表達組多參與腫瘤代謝過程。基于對GFUS 共表達基因篩選發(fā)現(xiàn),GPLD1 的高表達和低風險相關(guān),為保護因素;鑒定了GFUS、ATP6V0B、MFSD3 的高表達和高風險相關(guān),為危險因素。將篩選出的基因構(gòu)建模型,根據(jù)該模型將TNBC 患者分為高低風險組。生存分析顯示出高風險組OS 顯著低于低風險組,提示GFUS、ATP6V0B、MFSD3 與TNBC 患者預(yù)后密切相關(guān)。風險評分可作為獨立預(yù)后因素。另外,該模型可以有效預(yù)測不同風險組中乳腺癌患者3、5年生存率。本研究尚有一定局限性,數(shù)據(jù)均來自TCGA 數(shù)據(jù)庫,在其他數(shù)據(jù)庫和臨床樣本中的驗證需進一步進行。
綜上所述,基于GFUS 構(gòu)建的預(yù)后模型可以很高的評估TNBC 患者預(yù)后,并可為TNBC 靶向治療藥物發(fā)展及增強免疫治療效果提供新思路。