劉一笑,受夢媛,張 瑩,張榮強,孫 娜
(陜西中醫藥大學公共衛生學院流統教研室,陜西 咸陽 712046)
惡性腫瘤是人類機體在各種致癌因素下,局部組織細胞異常增生并轉移擴散至其他組織的一類疾病,2020 年全球新發癌癥病例約1 930 萬例,每4 個人中就會有1 人患有癌癥的風險[1]。癌癥是世界范圍內僅次于心臟病的第二大死亡原因[2],嚴重危害人類生命健康[3],給社會帶來了重大的健康和經濟問題,隨著病例數量的持續增加,癌癥的負擔無疑會變得更加嚴重。
小凹蛋白-1(caveolin 1,CAV1)是細胞質膜小凹中一種重要的結構功能蛋白,結構可分為3 個區域,包括C 端跨域、N 末端支架結構和支架結構 域(caveolin-scaffolding domain,CSD),其 中CSD 區域能特異性地與多種信號分子結合[4],成為多條信號通路的樞紐,影響細胞的增殖、遷移和分化并具有介導內吞、胞吞、機械保護、細胞代謝和脂質穩態等豐富的功能[5]。CAV1 的廣泛分布也決定了其功能的重要性,研究學者[6-10]發現CAV1 與逆轉腫瘤耐藥細胞耐藥性有關,下調CAV1 的表達使ERK(extracellular regulated protein kinases)通路激活會促進黑色素瘤細胞的體內體外增殖,敲低CAV1 表達可抑制肺腺癌H1299 細胞增殖、遷移和侵襲并影響其生物學行為,CAV1在膠質瘤細胞中與ER-α36 相互作用共同參與腫瘤細胞生長;抑制CAV1 的活化和脂筏的聚集可以逆轉胃癌細胞的遷移[11];紹偉偉等認為CAV1的表達與腫瘤患者的預后存在聯系[12],并有多項研究指出其與腫瘤的發生發展關系密切[13]。
目前,臨床上針對癌癥的治療主要包括手術、化療、放療、靶向治療和免疫治療[14],但由于耐藥、副作用等問題,患者的預后和生存率仍不令人滿意。因此,深入研究癌癥的生存預后靶點,為臨床治療提供新的方向和策略就顯得尤為重要。隨著近年來生物信息學技術和遺傳科學的發展,基因在各種腫瘤中的預后價值正在廣泛被探討,使用基因來識別、診斷和確定潛在腫瘤風險成為可能。本研究以CAV1 基因為研究對象,基于多種數據庫探索該基因在人類腫瘤組織中的mRNA表達、蛋白表達、患者的預后、腫瘤免疫浸潤相關性、相似基因功能富集與Nomogram 模型建立與驗證,旨在揭示CAV1 在人類腫瘤發生發展過程中的影響,為其在腫瘤的預防、識別、診斷及其治療提供參考依據。
使 用 R 包:ggplot2[3.3.6]、stats[4.2.1]和car[3.1-0]分析經Toil 流程[15]統一處理TCGA 數據庫(The Cancer Genome Atlas,TCGA)和GTEx 數據庫(Genotype-Tissue Expression)中的TPM(transcripts per million reads)格式的RNAseq 數據,并對TPM格式的RNAseq 數據進行log2 轉化,利用Mann-Whitney U 檢驗(Wilcoxon rank sum test)分析CAV1基因在33 種不同正常組織和腫瘤組織中的mRNA差異表達水平。
使用UALCAN 數據庫(http://ualcan.path.uab.edu/analysis-prot.html)分析癌癥組學數據,先將每個樣品譜內歸一化,然后再樣品間歸一化,Z 值代表給定癌癥類型的樣本中值的標準差,對CPTAC(Clinical proteomic tumor analysis consortium)數據庫的11 種腫瘤進行蛋白表達分析[16],比較CAV1在人類正常組織和腫瘤組織中的蛋白表達水平。
選擇TCGA 數據庫中mRNA 表達具有差異統計學意義的腫瘤臨床數據,使用R 包:survival[3.3.1]進行比例風險假設檢驗并進行擬合生存回歸,數據格式為TPM,預后參數類型選擇總生存期(overall survival,OS),使用單因素Cox 回歸分析計算比較患者樣本CAV1 表達高低組與患者生存之間的關系,利用survminer 包以及ggplot2 進行結果可視化處理。
利用Mann-Whitney U 檢驗(Wilcoxon rank sum test)單獨分析CAV1 在具有生存預后意義的腫瘤表達差異,通過HPA(Human Protein Atlas)(http:www.proteinatlas.org/)數據庫下載TCGA 數據庫中CAV1在正常組織和腫瘤組織中的免疫組織染色圖,并對進行分析。
基于R 包-GSVA[1.46.0]中的ssGSEA 算法,利用Immunity 提供的24 種免疫細胞[17]的markers計算對應的免疫浸潤數據,主分子為CAV1,對數據中主變量的腫瘤和免疫浸潤矩陣數據之間進行Spearman 相關性分析,分析結果用ggplot2 包進行可視化。
從TCGA 數據庫(https://portal.gdc.cancer.gov)下載整理腫瘤項目STAR 流程的RNAseq 數據并提取TPM 格式的數據以及臨床數據,剔除無效數據。以CAV1 基因表達數據與主要臨床信息參數作為自變量,以與CAV1 表達量具有生存預后意義的腫瘤總生存期(overall survival,OS)為因變量,進行單因素與多因素COX 回歸模型,分析腫瘤總生存期的影響因素。使用R 軟件“rms”包構建nomogram 相關模型并進行可視化,利用校準曲線對模型進行驗證和評估。
通過對TCGA 和GTEx 數據庫CAV1 基因進行分析,與正常組織相比,33 種腫瘤組織中有26 種mRNA 表達差異具有統計學意義(P<0.05),其中CAV1 基因在ACC 腎上腺皮質癌(ACC)、膽管癌(CHOL)、彌漫性大B 細胞淋巴瘤(DLBC)、多形性成膠質細胞癌(GBM)、頭頸鱗狀細胞癌(HNSC)、腎嫌色細胞癌(KICH)、腎透明細胞癌(KIRC)、急性髓性白血病(LAML)、腦低級別膠質癌(LGG)、肝臟肝細胞癌(LIHC)、胰腺癌(PAAD)、胸腺瘤(THYM)、12 種腫瘤組織中高表達(P<0.05);CAV1 基因在膀胱癌(BLCA)、乳腺癌(BRCA)、宮頸鱗癌(CESC)、結腸癌(COAD)、食管癌(ESCA)、肺腺癌(LUAD)、肺鱗癌(LUSC)、卵巢漿液性囊腺癌(OV)、前列腺癌(PRAD)、直腸腺瘤(READ)、皮膚黑色素瘤(SKCM)、THCA(甲狀腺癌)、子宮內膜癌(UCEC)、子宮肉瘤(UCS)14 種腫瘤組織中呈現低表達(P<0.05),見圖1。

圖1 CAV1 基因在人類腫瘤組織和正常組織中的mRNA 表達分析Fig.1 mRNA expression analysis of CAV1 gene in human tumor tissues and normal tissues
從CPTAC 數據集獲得11 組蛋白質差異表達數據,結果表明:與正常組織相比,CPTAC 數據庫中CAV1 蛋白在結腸癌(COAD)、乳腺癌(BRCA)、頭頸鱗狀細胞癌(HNSC)、肝臟肝細胞癌(LIHC)、肺腺癌(LUAD)、肺鱗癌(LUSC)、卵巢漿液性囊腺癌(OV)、子宮內膜癌(UCEC)這8種腫瘤組織中的表達降低,而在腎透明細胞癌(KIRC)中表達增高,差異均具有統計學意義(P<0.05),在多形性成膠質細胞癌(GBM)、胰腺癌(PAAD)這2 種腫瘤中表達,差異無統計學意義(P>0.05),見圖2。

圖2 CAV1 基因在不同癌癥組織和正常組織中的總蛋白表達分析Fig.2 Total protein expression analysis of CAV1 gene in different cancer tissues and normal tissues
TCGA 數據庫中分析CAV1 表達與mRNA 表達具有統計學差異的26 種腫瘤生存預后之間的相關性,結果顯示CAV1 只在BLCA(HR=1.49,95%CI[1.11~2.00]),LGG(HR=2.43,95%CI[1.67~3.54])和HNSC(HR=1.43,95%CI[1.09~1.87])中存在預后相關,且差異均具有統計學意義(P<0.01),而與其他腫瘤預后相關無統計學意義。K-M 生存曲線結果顯示LGG、HNSC、BLCA這3 種腫瘤中的高表達組生存預后較低表達組更差,見圖3,提示CAV1 高表達是其危險因素,可能表現為促癌基因,因此CAV1 可能作為LGG、HNSC 和BLCA 患者預后的候選基因。

圖3 CAV1 基因在BLCA、LGG 與HNSC 腫瘤組織中的預后KM 曲線圖Fig.3 Prognostic KM curve of CAV1 gene in BLCA,LGG and HNSC tumors
通過對HPA 數據庫提供的免疫組化結果進行分析,結果表明CAV1 在膀胱組織中低表達,在BLCA 組織中高表達,與其mRNA 基因表達結果相反。CAV1 在LGG 和HNSC 中免疫組化結果顯示CAV1 在大腦與頭頸部均低表達,在LGG 與HNSC 中均高表達,mRNA 表達結果與其免疫組化數據一致,IHC 染色均為中等或強染色,見圖4。

圖4 BLCA、LGG 和HNSC 腫瘤組織和正常組織的免疫組化圖(×100)Fig.4 Immunohistochemical maps of BLCA,LGG and HNSC tumor tissue and normal tissue(×100)
TCGA 數據庫中CAV1 在3 種具有生存預后意義的腫瘤與24 種免疫浸潤細胞數據的相關性結果顯示,CAV1 在LGG 中與21 種免疫浸潤細胞具有相關性,其中與Macrophages、Neutrophils等18 種免疫浸潤細胞表達呈正相關,與Treg 細胞、pDC 細胞和NK CD56bright 細胞表達呈負相關,與Mast 細胞、Tem 細胞和TFH 細胞表達無統計學意義,其中正相關最高的為Macrophages細胞(R=0.518),負相關最高的是NK CD56bright細胞(R=-0.248)。CAV1 在HNSC 中與14 種免疫浸潤細胞具有相關性,正負相關各有7 種,其中正相關最高的為Tgd 細胞(R=0.488),負相關最高的是B 細胞(R=-0.250)。CAV1 在BLCA 中與23 種免疫浸潤細胞具有相關性,其中正相關為21 種,與其負相關的細胞為Th17 細胞和NK CD56bright 細胞,與其無統計學意義的細胞為T helper 細胞,正相關最高的是Macrophages 細胞(R=0.629),負相關最高的是NK CD56bright 細胞(R=-0.339),見圖5。

圖5 CAV1 基因在3 種不同腫瘤組織中與免疫浸潤細胞相關性棒棒糖圖Fig.5 Lollipop map of CAV1 gene correlation with immunoinfiltrating cells in three different tumor tissues
單因素COX 回歸分析表明,CAV1 和年齡是BLCA 患者生存預后的危險因素且均具有統計學差異(P<0.05),多因素COX 回歸顯示年齡是影響BLCA 生存預后的獨立危險因素。CAV1 表達量與BLCA 臨床病例相關數據構建Momogram 模型的一致性良好(Concordance,C-index=0.643,95%CI[0.619~0.668],多因素模型滿足比例風險假設且不存在多重共線性(0<VIF<10),該模型校準曲線穩定,見圖6。

圖6 CAV1 表達對BLCA 總生存期的影響因素COX 回歸分析及其Nomogram 模型的構建與評估Fig.6 COX regression analysis of influencing factors of CAV1 expression on overall survival of BLCA and Nomogram model construction and evaluation
單因素COX 回歸分析顯示,CAV1 與WHO grade 是LGG 患者生存預后的危險因素,均具有統計學意義(P<0.05),種族、病灶位置和性別均無統計學意義(P> 0.05);同時多因素COX 回歸分析表明CAV1 與WHO grade 是影響LGG 患者OS 的獨立危險因素,均具有統計學意義(P<0.05)。通過CAV1 表達量與LGG 臨床病例相關數據構建的Nomogram 模型結果顯示,CAV1、WHO grade和年齡對LGG 患者的OS 具有良好效果,模型的一致性良好(Concordance,C-index=0.770),95%CI[0.748~0.792],多因素模型滿足比例風險假設,不存在多重共線性(0<VIF<10),該模型校準曲線穩定,見圖7。
單因素COX 回歸分析表明CAV1 和臨床病理分型是HNSC 患者生存預后的危險因素,均具有統計學差異(P<0.05),多因素COX 回歸分析顯示CAV1 與臨床病理分型是影響HNSC 患者OS 的獨立危險因素,均具有統計學差異(P<0.05)。基于CAV1 表達量與HNSC 患者臨床相關數據構建的Nomogram 模型一致性良好一致性(Concordance,C-index=0.615),95%CI[0.592~0.638],滿足比例風險假設且不存在多重共線性(0<VIF<10),該模型校準曲線穩定,見圖8。

圖8 CAV1 表達對HNSC 總生存期的影響因素COX 回歸分析及其Nomogram 模型的構建與評估Fig.8 COX regression analysis of factors influencing CAV1 expression on HNSC overall survival and Nomogram model construction and evaluation
2020 年全球近1 000 萬人因腫瘤而死亡,腫瘤的高發病率和高死亡率嚴重威脅著人類的健康[18],現有的研究證實大多數環境致癌物并不能直接導致腫瘤的發生,需要先在人體內激活活化并結合形成親電子中間產物才呈現致癌性[19],而基因異常表達是腫瘤發生的內在因素[20],其與各種癌癥的發生發展存在一定聯系[21-24],從基因角度探索人類腫瘤的發生發展關系,對其生存預后的預測與治療進行研究是重點。
CAV1 具有與多種信號分子相同的氨基酸序列,其表達量的差異會影響細胞的增殖與遷移[25],通過互補結合調控相關信號通路,形成樞紐中心,調控細胞分化、增殖與衰老,從而參與到腫瘤的形成過程中。生物學中蛋白質合成是通過mRNA分子中堿基排列順序轉變或多肽鏈中的氨基酸排列組合形成的,本研究結果顯示,CAV1 基因在26 種腫瘤中mRNA 表達不同,且差異有統計學意義(P<0.05),CAV1 在HNSC 腫瘤組織中mRNA表達上調,但在蛋白水平上卻顯示為低表達,這有可能與mRNA 的翻譯調控或蛋白質穩定性有關[26]。
通過對TCGA 數據庫中CAV1 有差異表達結果的腫瘤與其OS 的相關性分析表明:CAV1 表達與BLCA、LGG 和HNSC 患者預后不良密切相關,K-M 生存曲線顯示CAV1 的高表達不利于BLCA、LGG 和HNSC 患者的生存預后。mRNA 基因通過翻譯為蛋白質進而在人體內行使復雜的生物學活動,通過HPA 數據庫對BLCA、LGG 和HNSC 及其正常組織進行免疫組化分析發現CAV1 在BLCA 中的mRNA 表達與免疫組化結果相反,提示CAV1 在BLCA 患者中行使某些生物學功能表達與mRNA 表達有區別,不過這也可能與HPA數據庫中的組織樣本量較少有關。
免疫浸潤細胞能夠影響臨床治療療效及患者生存期長短[27]。CAV1 在BLCA、LGG 和HNSC這3 種腫瘤中與24 種免疫浸潤細胞具有緊密相關性且正相關較多,提示CAV1 參與了免疫反應過程,可能是這3 種腫瘤患者生存預后的潛在免疫調節基因。單因素COX 回歸發現CAV1 均是BLCA、LGG 和HNSC 腫瘤患者生存預后的危險因素,其低表達可能會對這3 種腫瘤患者的不良預后具有一定的抑制效果。
綜上所述,本研究從多個角度探討了CAV1在人類腫瘤生存預后中的潛在價值,抑制CAV1在體內的表達對惡性腫瘤的發生可能具有一定作用,CAV1 在多種腫瘤中 與正常組織有差異表達,與BLCA、LGG、HNSC 患者的預后有關且在免疫調節中發揮著巨大作用。但同時也存在著一些局限性:(1)研究基于多個數據庫進行分析,各個數據庫中存在的組織樣本數有一定差別,可能導致分析結果存在偏差;(2)未進行實驗分析,缺乏體內體外驗證。
本研究對CAV1 在人類腫瘤中的分析結果表明,CAV1 在BLCA、LGG 與HNSC 中可能是一個新的診斷、治療和預后標志物基因,通過介導多條信號通路從而影響腫瘤的發生發展過程,為癌癥的臨床服務提供一定的理論基礎。