劉細幫 胡旭鋼 唐夏莉 陳清勇
肺癌是全球發病率和死亡率最高的惡性腫瘤。肺腺癌(lung adenocarcinoma,LUAD)是肺癌最常見的病理亞型,患者5年平均生存率僅為15%[1-2]。盡管近年來診斷和治療方法不斷改進,但LUAD患者的總體生存率并未提高。因此,有必要尋找新的預后生物標志物,這不僅有助于改善個體化治療,還能為開發新的治療靶點提供參考。胞質分裂蛋白調節因子1(protein regulator of cytokinesis 1,PRC1)基因位于人體15號染色體上(15q26.1),編碼含有620個氨基酸的蛋白;屬于微管相關蛋白家族,參與細胞有絲分裂和細胞周期調控[3]。研究發現,PRC1 是乳腺癌[4]、膀胱癌[5]、肝細胞癌[6]和胃癌[7]等腫瘤的致癌因子,并且PRC1的表達與LUAD細胞的增殖、侵襲和凋亡相關,可能是LUAD潛在的治療靶點[8-9]。但目前PRC1對LUAD患者總體預后影響的相關研究較少。本研究旨在通過對公共數據庫的挖掘,分析PRC1 mRNA表達水平與LUAD患者總體預后的相關性,探討其作為LUAD預后標志物的可行性,為今后有關PRC1的機制研究提供一定的理論基礎。
1.1 PRC1數據的獲取 33種腫瘤數據來自腫瘤免疫評估資源(tumor immune estimation resource,TIMER)數據庫(https://cistrome.shinyapps.io/timer/),通過 Diff Exp模塊檢索PRC1在腫瘤組織與正常對照組織中的表達情況。通過腫瘤基因圖譜(the cancer genome atlas,TCGA)數據庫(https://portal.gdc.cancer.gov/)獲取 PRC1表達的RNASeq數據,獲得的數據中包含517例原發性LUAD患者和59例正常肺組織,其中504例LUAD患者記錄了生存數據,并以PRC1 mRNA表達的中位數分為高表達組和低表達組。利用基因表達綜合(gene expression omnibus,GEO)數據庫(https://www.ncbi.nlm.nih.gov/geo)分別下載包含LUAD組織及正常對照組織或癌旁正常組織的基因表達譜芯片數據集GSE31210、GSE75037和 GSE68465,其中 GSE31210、GSE68465 數據集各包含226、362例LUAD患者完整的臨床資料以及生存信息,并以PRC1 mRNA表達的中位數分為高表達組和低表達組。同時,從人類蛋白質圖譜(human protein atlas,HPA)數據庫(https://www.proteinatlas.org/)獲取腫瘤以及正常對照組織中PRC1蛋白免疫組化染色數據。
1.2 基因集富集分析(gene set enrichment analysis,GSEA)采用GSEA 4.0進行分析。根據TCGA數據庫中PRC1 mRNA表達的中位數分為高表達組和低表達組,以Hallmark基因集作為參考基因集,通過GSEA分析PRC1參與LUAD發展的可能機制,設置置換次數為1 000次,以P<0.05、錯誤發現率(false discovery rate,FDR)<0.25為顯著富集基因集。
1.3 統計學處理 采用R 3.6和GraphPad 8.0統計軟件。計量資料以表示,兩組比較采用兩獨立樣本t檢驗或配對t檢驗;多組比較采用單因素方差分析。生存曲線分析采用Kaplan-Meier法,組間比較采用log-rank檢驗。采用R軟件ROC的時間序列分析(timeROC)包繪制ROC曲線并計算AUC值。Cox回歸模型分析PRC1與LUAD患者總生存期(overall survival,OS)、無進展生存期(progression-free survival,PFS)的關系,并計算HR值及其95% CI。P≤0.05為差異有統計學意義。
2.1 腫瘤組織中PRC1 mRNA表達 在TIMER數據庫提供的33種腫瘤數據中,膀胱尿路上皮癌(bladder urothelial carcinoma,BLCA)、乳腺浸潤癌(breast invasive carcinoma,BRCA)、膽管癌(cholangiocarcinoma,CHOL)、結腸癌(colon adenocarcinoma,COAD)、食管癌(esophageal carcinoma,ESCA)、頭頸鱗狀細胞癌(head and neck squamous cell carcinoma,HNSC)、腎嫌色細胞癌(kidney chromophobe,KICH)、腎透明細胞癌(kidney renal clear cell carcinoma,KIRC)、乳頭狀腎細胞癌(kidney renal papillary cell carcinoma,KIRP)、肝細胞肝癌(liver hepatocellular carcinoma,LIHC)、LUAD、肺鱗癌(lung squamous carcinoma,LUSC)、胰腺癌(pancreatic adenocarcinoma,PRAD)、直腸腺癌(rectum adenocarcinoma,READ)、胃癌(stomach adenocarcinoma,STAD)、甲狀腺癌(thyroid car-cinoma,THCA)、子宮內膜癌(uterine corpus endometrial carcinoma,UCEC)17種腫瘤組織中PRC1 mRNA表達水平均高于正常對照組織,見圖1。

圖1 腫瘤組織中胞質分裂蛋白調節因子1(PRC1)表達
2.2 LUAD組織和正常對照組織中PRC1的表達 在TCGA數據庫和GSE31210數據集中,LUAD組織中PRC1 mRNA表達水平均明顯高于正常對照組織,差異均有統計學意義(均P<0.01),見圖2a-b。在GSE75037數據集中,LUAD組織中PRC1 mRNA表達水平明顯高于癌旁正常組織,差異有統計學意義(P<0.01),見圖2c。在HPA數據庫中,PRC1免疫組化染色結果顯示,PRC1蛋白在正常對照組織中弱表達,而在LUAD組織中強表達,見圖2d-e。

圖2 肺腺癌(LUAD)組織和正常對照組織中胞質分裂蛋白調節因子1(PRC1)的表達[a-b:腫瘤基因圖譜(TCGA)數據庫、GSE31210數據集中LUAD組織和正常對照組織中PRC1 mRNA表達水平比較,與正常對照組織比較,**P<0.01;c:GSE75037數據集中LUAD組織和癌旁正常組織中PRC1 mRNA表達水平比較,與癌旁正常組織比較,**P<0.01;d-e:正常對照組織和LUAD組織中PRC1蛋白表達的比較,免疫組化染色,×40]
2.3 PRC1 mRNA表達水平與LUAD患者臨床特征的關系 通過TCGA數據庫分析發現PRC1 mRNA表達水平與LUAD患者的年齡、M分期均無關(均P>0.05),但與LUAD患者的性別、吸煙、T分期、N分期和TNM分期均有關(均P<0.01),見表1。

表1 TCGA數據庫中不同臨床特征LUAD患者PRC1表達水平比較
2.4 PRC1 mRNA表達與LUAD預后的關系
2.4.1 PRC1 mRNA表達與OS和PFS的關系 在TCGA數據庫、GSE31210和GSE68465數據集中,通過Kaplan-Meier生存曲線分析發現,除GSE68465數據集中的PFS外,其余PRC1高表達組患者PFS和OS均差于低表達組(均 P<0.05),見圖 3(插頁)。

圖3 胞質分裂蛋白調節因子1(PRC1)表達與總生存期(OS)和無進展生存期(PFS)的關系[a-b:腫瘤基因圖譜(TCGA)中PRC1高表達組與低表達組OS和PFS生存曲線比較;c-d:GSE31210數據集中PRC1高表達組與低表達組OS和PFS生存曲線比較;e-f:GSE68465數據集中PRC1高表達組與低表達組OS和PFS生存曲線比較]
2.4.2 影響LUAD患者預后的臨床特征分析 在TCGA數據庫中,ROC曲線模型的OS顯示,1、3、5年生存率AUC值分別為0.674、0.632、0.590;ROC曲線模型的PFS顯示,1、3、5年生存率 AUC 值分別為 0.611、0.583、0.506,見圖4a-b。單因素Cox回歸分析結果顯示LUAD患者的性別、年齡和吸煙與OS均無關(均P>0.05),但T分期、N分期、TNM分期和PRC1 mRNA表達水平與OS均有關(均P<0.05);單因素Cox回歸分析結果顯示LUAD患者的性別、年齡、TNM分期和吸煙與PFS均無關(均P>0.05),但T分期、N分期和PRC1 mRNA表達水平均與PFS均有關(均P<0.05)。將以上所有單因素納入多因素Cox回歸分析顯示,T分期、N分期和PRC1 mRNA表達水平均是影響LUAD患者OS和PFS的獨立危險因素(均P≤0.05),見圖4c-f。

圖4 影響肺腺癌(LUAD)患者預后的臨床特征分析[a-b:腫瘤基因圖譜(TCGA)數據庫中總生存期(OS)和無進展生存期(PFS)的ROC曲線;c-d:TCGA數據庫中OS單因素和多因素Cox分析;e-f:TCGA數據庫中PFS單因素和多因素Cox分析]
2.5 GSEA識別與PRC1相關的信號通路 為了確定PRC1作用的潛在信號通路,在TCGA數據庫中,GSEA分析結果顯示,PRC1高表達樣本富集在有絲分裂紡錘體、G2M檢查點、E2F信號通路、DNA修復等基因集中,見圖5。

圖5 基因集富集分析(GSEA)識別與胞質分裂蛋白調節因子1(PRC1)相關的信號通路
細胞周期是哺乳動物細胞生長和發育所必需的進化保守過程,因為細胞周期畸變是癌癥的標志[10]。PRC1被認為是細胞周期蛋白依賴性激酶(CDK)底物,在早期細胞分裂中,是維持紡錘體中段所需的微管相關蛋白[11-12]。細胞分裂是一個復雜的過程,涉及復雜的生化和細胞動力學因素[10],而PRC1作為細胞分裂的關鍵蛋白,其表達異常可引起細胞分裂的紊亂。研究表明,PRC1的過表達通過調節Wnt信號通路促進肝癌細胞增殖和轉移,并與早期復發和患者預后不良相關[6]。敲除PRC1可顯著抑制胃癌細胞增殖,減少胃癌細胞克隆形成并抑制其侵襲和遷移[7]。但是,目前PRC1在肺癌的發生、發展機制方面的研究較少,尤其是與患者臨床預后生存及標志物篩查的研究鮮有報道。
本研究中,筆者通過對多個大樣本數據庫進行分析發現,PRC1的表達水平在包括LUAD在內的多種腫瘤組織中上調,LUAD組織中PRC1表達也明顯高于正常對照組織和癌旁正常組織;且免疫組化結果提示,LUAD組織中PRC1蛋白表達水平明顯高于正常對照組織。在TCGA數據庫和GSE68465數據集中,PRC1表達與腫瘤的T分期、N分期和TNM分期均有關,提示PRC1可能參與LUAD的進展。基于多個數據庫的生存分析結果,表明PRC1 mRNA表達水平與LUAD患者的PFS、OS呈負相關,其表達水平越高,LUAD患者預后越差。并且該結果與Bu等[13]研究結果類似,該研究發現在卵巢癌組織PRC1呈高表達,并且PRC1的表達與生存時間呈負相關。
單因素及多因素Cox回歸分析顯示,T分期、N分期和PRC1 mRNA表達水平均是影響LUAD患者的獨立危險因素。為了進一步探討PRC1在LUAD中的潛在功能,GSEA分析結果表明,在有絲分裂紡錘體、G2M檢查點、E2F信號通路、DNA修復等通路高度富集。G2M檢查點能在DNA損傷的情況下阻止細胞周期,使細胞在進入下一個細胞周期階段前修復DNA損傷,從而維持基因組完整性[14]。因此,PRC1過表達時可能通過影響細胞周期和DNA修復,從而促進LUAD細胞的增殖分化。CDK-RB-E2F軸是細胞周期進程的核心轉錄機制,該軸的一個或多個關鍵組成部分的變化幾乎發生在所有腫瘤中,并導致致癌E2F活性增強,使腫瘤細胞增殖不受控制,進而導致腫瘤進展[15]。而PRC1作為CDK底物,過表達時可能促進該軸的轉錄,進一步增加E2F活性,導致腫瘤進展。由此可見,PRC1可能參與LUAD發生、發展過程,可能是LUAD治療的潛在靶點。
綜上所述,PRC1基因在LUAD中可能是一個潛在的致癌基因。PRC1在LUAD中的表達與腫瘤的發生、發展以及患者的預后有著非常密切的關系,可作為一個重要的候選生物標志物。因此,有必要對該基因在LUAD中的機制以及功能進一步研究,為全面掌握PRC1在腫瘤中的作用以及LUAD的預防診治提供更多依據。