朱釗雯,賈衛(wèi)娟,劉潔瓊
胞膜蛋白(plasma membrane proteins,PMPs)癌細胞增殖、轉(zhuǎn)移和免疫逃逸等過程有關(guān),隨著這些基因表達水平的改變,細胞無限增殖、粘附細胞外基質(zhì)、侵入血管或淋巴管、于靶器官定植的能力也發(fā)生了相應(yīng)的變化[1-3]。乳腺癌現(xiàn)已成為危害女性健康最常見的癌癥[4],而luminal型乳腺癌占所有乳腺癌的70%以上[5]。
由于PMPs在腫瘤發(fā)生發(fā)展中經(jīng)過受體配體結(jié)合發(fā)揮相應(yīng)的生物效應(yīng),成為許多抗癌藥物研發(fā)的目標靶點[6],如多種細胞表面受體和離子通道[7-9]。然而,近來除了CDK4/6抑制劑外,應(yīng)用于Luminal型乳腺癌的新型PMPs相關(guān)治療靶向有限[10]。同時,鑒于PMPs表達于細胞膜上,便于臨床上的定性定量檢測,更能快速有效地獲取每一位患者的相應(yīng)腫瘤表達特點,進而運用于臨床工作。本研究旨在獲得一種有效的Luminal型乳腺癌PMPs相關(guān)預后預測模型,同時盡可能為Luminal型乳腺癌患者篩選出潛在的PMPs相關(guān)治療靶點。
從TCGA數(shù)據(jù)庫中下載Luminal型乳腺癌轉(zhuǎn)錄組RNA測序數(shù)據(jù)和這些患者的臨床信息作為訓練集,包括769例Luminal型乳腺癌和111例正常組織樣本。排除標準包括:患者①無乳腺癌分子分型信息;②不具備完整的臨床數(shù)據(jù):包括總生存期(overall survival,OS)、生存狀態(tài)、診斷年齡、腫瘤大小(T)和淋巴結(jié)轉(zhuǎn)移情況(N)。另外,我們從GEO數(shù)據(jù)庫下載了兩個微陣列數(shù)據(jù)集GSE20685和GSE37751中的RNA測序數(shù)據(jù)及臨床信息作為外部驗證集。最終,246例Luminal型乳腺癌患者被納入驗證集。同時我們從人類蛋白質(zhì)圖譜數(shù)據(jù)庫中獲得了相應(yīng)的PMPs基因列表。
利用R軟件中Limma包將腫瘤組織與正常組織進行比較,得到所有差異表達基因(deferentially expressed genes,DEGs)和差異表達PMPs(DEPMPs)。篩選條件為logFC>0.5,P<0.05。
首先,將DEPMPs的基因表達量與相應(yīng)患者的OS和生存狀態(tài)相結(jié)合,篩選出影響預后的DEPMPs,進一步運用多因素Cox回歸分析建立PMPs相關(guān)預后預測模型。將構(gòu)建模型中相關(guān)基因表達水平與各自的Cox回歸系數(shù)相乘,得到每個患者的風險評分(RiskScore)根據(jù)RiskScore中位數(shù)將訓練集中的患者劃分為高危組和低危組。兩組生存差異采用Kaplan-Meier生存分析及l(fā)og-rank檢驗,并計算ROC曲線下面積,驗證RiskScore的有效性和預測模型的準確性。
利用驗證集中246例Luminal型乳腺癌患者的數(shù)據(jù)驗證上述模型的臨床有效性。計算風險評分,根據(jù)中位風險評分將患者分為高、低風險組,構(gòu)建K-M生存分析和ROC曲線驗證預后預測模型的有效性。
使用R軟件通過Survival ROC包計算ROC曲線的AUC以檢驗預后模型的有效性。對于K-M曲線,通過log-rank和單因素Cox風險回歸分析得到95%置信區(qū)間的P值和風險比(HR)。所有的統(tǒng)計檢驗都是雙向的。P<0.05被認為是具有統(tǒng)計學差異的。
首先,從訓練集中得到所有的DEGs(圖1A),進一步發(fā)現(xiàn)Luminal型乳腺癌的DEPMPs基因中有59個上調(diào)基因和85個下調(diào)基因(圖1B)。
通過單因素Cox回歸分析,從DEPMPs中篩選出30個預后相關(guān)基因(圖2),進一步通過多變量Cox回歸分析,構(gòu)建出一個包含11個基因的預后預測模型,模型計算公式如下:[ADRA1B的基因表達量*(0.164496)]+[CD99L的基因表達量*(0.35221)]+[EZR的基因表達量*(0.33013)]+[IYD的基因表達量*(0.119785)]+[RGS9BP的基因表達量*(0.125277)]+[SLC16A2的基因表達量*(0.165859)]+[DUS1L的基因表達量*(-0.57798)]+[KIT的基因表達量*(-0.07974)]+[MS4A1的基因表達量*(-0.06685)]+[PI3的基因表達量*(-0.0783)]+[SUSD2的基因表達量*(-0.07928)]。由圖2可知,ADRA1B、CD99L2、EZR、IYD、RGS9BP及SLC16A2高表達和DUS1L、KIT、MS4A1、PI3及SUSD2的低表達均與患者預后不良有關(guān)。據(jù)此計算所有患者的風險評分,根據(jù)風險評分中位數(shù)將患者分為高危組和低危組(圖3A)。同時我們繪制得到了患者的生存狀態(tài)圖(圖3B)和11個預后基因的生存熱圖(圖3C)。單因素Cox回歸分析顯示,包括診斷年齡、分期、T、N在內(nèi)的臨床特征和風險評分都不同程度地影響患者的預后(圖4A)。多因素Cox風險回歸分析表明診斷年齡、分期和風險評分的P值具有統(tǒng)計學意義(圖4B)。為了預測患者的OS,我們得到了高危組和低危組之間的K-M生存曲線,發(fā)現(xiàn)高危組的總生存期明顯低于低危組(圖4C)。此外,風險評分的AUC為0.825,表明該模型可能具有較好的預后預測潛力(圖4D)。

圖1 DEGs基因(圖1A)與DEPMPs基因(圖1B)

圖2 預后相關(guān)DEPMPs基因紅色為HR>1,綠色為HR<1
利用驗證集的RNA測序數(shù)據(jù)對預后預測模型進行驗證,計算驗證集中所有患者的風險評分并將患者分為高危組和低危組。結(jié)果提示高危組患者預后較低危組差(圖5A),且風險評分ROC曲線下面積為0.861(圖5B),進一步證明該模型具有一定的臨床應(yīng)用價值。
本研究中,我們建立并驗證了可行的Luminal型乳腺癌PMPs預后預測模型。通過分析Luminal型乳腺癌PMPs預后相關(guān)基因,我們構(gòu)建了一個包含高風險相關(guān)基因ADRA1B、CD99L2、EZR、IYD、RGS9BP和SLC16A2,以及低風險相關(guān)基因DUS1L、KIT、MS4A1、PI3和SUSD2的預后預測模型。

圖3 預后模型的特征患者風險評分(圖3A)、生存狀態(tài)圖(圖3B)和模型中預后基因的生存熱圖(圖3C)
據(jù)報道,ADRAIB(腎上腺素受體α1B)增加細胞增殖的同時減少細胞的凋亡,導致較長的腫瘤生存時間和腫瘤復發(fā)[11]。CD99L2可以幫助中性粒細胞突破內(nèi)皮基膜并遷移到炎癥組織中[12]。EZR已被證實在多種癌癥的增殖、遷移和侵襲中發(fā)揮重要作用[13,14]。Ezrin由EZR編碼,交聯(lián)胞膜和構(gòu)建細胞骨架,Ezrin的磷酸化依賴于TGF-β和MAPK通路的激活,參與癌癥的生長和轉(zhuǎn)移,導致疾病進展和低生存率[15,16]。有研究報道IYD能夠抑制肝癌細胞糖酵解,進而通過增加有氧糖酵解支持癌細胞的存活和增殖,并導致癌癥患者預后較差[17]。RGS9BP在趨化因子誘導的淋巴細胞遷移中發(fā)揮作用,負調(diào)控naive和調(diào)節(jié)T細胞遷移的能力,從而影響T淋巴細胞的免疫應(yīng)答[18]。作為SLC16基因家族中與生存相關(guān)的代謝基因,編碼MCT8的SLC16A2的表達減少與部分頭頸部癌癥患者生存的改善相關(guān)[19]。
在乳腺癌中,KIT編碼的CD117+造血祖細胞,可在腫瘤發(fā)生遠處轉(zhuǎn)移之前,便被富集至肺部誘導細胞外基質(zhì)重構(gòu),進而為腫瘤的肺部轉(zhuǎn)移與定植提供條件[20]。而在血液系統(tǒng)疾病中,抗人CD117嵌合抗原受體T細胞可有效治療骨髓增生異常綜合征與急性髓系白血病,這也為乳腺癌肺轉(zhuǎn)移患者的靶向治療提供了啟示[21]。SUSD2編碼含822個氨基酸的蛋白,與半凝集素-1相互作用,促進乳腺癌細胞的免疫逃逸與轉(zhuǎn)移、腫瘤血管新生,并顯著減少CD4腫瘤浸潤淋巴細胞,這表明SUSD2可能是乳腺癌甚至其他癌癥的新靶點[22,23]。

圖4 模型的預后價值單因素Cox回歸分析(圖4A);多因素Cox回歸分析(圖4B);高低風險組患者生存曲線(圖4C)和ROC曲線(圖4D)

圖5 預后模型效能的驗證:高低風險組患者生存曲線(圖5A)和ROC曲線(圖5B)
無論在訓練集還是驗證集中,高危患者的預后都明顯較差。進一步采用多因素Cox回歸分析,風險評分的AUC均大于0.8。在類似的研究中,腫瘤突變負荷、自噬、不同表達的mRNA或免疫相關(guān)預后信號的AUC分別為0705、0.742、0.785、0.83[24,25]。因此,我們的基于11個基因的預后預測模型可能有更好的臨床應(yīng)用潛力,而其中一些基因甚至可能成為有效的治療靶點。基于11個預后模型相關(guān)基因,我們認為可以為深入的實驗研究提供一些新的研究思路。
同時,本研究也存在一些局限性。首先,我們還需要更多的功能性實驗來探索和驗證我們的PMPs預后預測模型的有效性,以及它們是否有可能成為精準治療的治療靶點。其次,基于研究現(xiàn)狀,我們暫且僅能關(guān)注于已被發(fā)現(xiàn)及驗證的在PM上表達的蛋白質(zhì),而不是所有的PMPs。