漆處梅,唐小龍
(1.達州市婦女兒童醫院檢驗科,四川 達州 635000;2.濱州醫學院第一臨床醫學院,山東 濱州 256600)
胰腺腺癌(pancreatic adenocarcinoma,PAAD),通常稱為胰腺癌(pancreatic cancer,PC)。目前,胰腺癌仍然是最致命的癌癥類型之一[1],預計其發病率會持續增加,到2030 年將成為癌癥相關死亡的第2大常見原因[2]。由于診斷晚、轉移早、對化療或放療反應有限,因此死亡率并未明顯下降[3]。手術切除后的輔助化療通常是治療早期胰腺癌的首選方案,盡管化療藥物聯合治療可顯著改善晚期胰腺癌患者的預后,但耐藥的出現仍導致結局較差[3]。因此,胰腺癌新型預后標志物的再挖掘及鑒定是合理評估胰腺癌患者預后的關鍵點。為更加全面了解胰腺癌患者的預后狀況,從而提高治療效果,近年來在表達譜的廣泛應用下,大量的基因組和轉錄組學數據得以積累,對其進行深度的挖掘和解讀,無疑是推動醫學發展的一項重要手段。由美國國家癌癥研究所和美國人類基因組研究所共同開發的大型腫瘤研究項目-癌癥基因組圖譜(The Cancer Genome Atlas,TCGA),其利用高通量和多組學的腫瘤基因組分析技術,加深人類對腫瘤的認知,提高腫瘤的預防、診斷和治療?;蛐?組織表達(Genotype-Tissue Expression,GTEx)數據庫包含了838 個捐贈者和17 382 個來自52 個組織和兩個細胞系的樣本,均為正常組織的測序結果。因此,聯合GTEx 數據庫分析可彌補TCGA 數據庫中正常組織少的缺陷,從而提高差異分析結果的準確性。基本亮氨酸拉鏈和含W2 結構域的蛋白質1 和2(Basic leucine zipper and W2 domain-containing proteins 1 and 2,BZW1 和BZW2)在維持啟動密碼子選擇的穩態嚴格性方面具有重要作用[4]。然而,有報道稱[5,6],BZW1 和BZW2 的過表達與肺腺癌的不良預后有關。除此之外,BZW1 促進前列腺癌細胞的增殖及卵巢癌細胞遷移和侵襲[7,8]。BZW2 通過調控不同的信號通路可促進肝細胞癌和骨肉瘤等疾病的進展[9,10]。目前,尚未報道關于BZW1或BZW2 在胰腺癌中的作用,本研究通過整合生物信息學手段,構建分子蛋白網絡并鑒定BZW1 和BZW2 涉及的生物學功能;其次,進一步利用TCGA和GTEx 數據庫,鑒定BZW1 和BZW2 是否為胰腺癌患者潛在的預后標志物,以期為胰腺癌的發生發展調控機制提供一些科學依據。
1.1 資料來源 截至2021 年12 月,提取TCGA 數據庫(https://portal.gdc.cancer.gov/)中4 名健康人和178 例胰腺癌患者的RNA-seq 數據和對應的臨床信息以及GTEx 數據庫(https://www.gtexportal.org/)中167 名健康人胰腺組織的RNA-seq 數據。根據BZW1 和BZW2 表達量的中位數將胰腺癌患者分為BZW1 和BZW2 高、低表達組。缺失或未知的臨床特征被認為是缺失值。
1.2 方法
1.2.1 數據處理 在TCGA 數據庫中下載轉錄組表達數據及相應的臨床信息,將數據格式從HTSeq FPKM 轉化為TPM 進行后續的分析。GTEx 數據庫中TPM 格式的RNA-seq 數據來自于經Toil 流程統一處理的UCSC XENA 數據庫(https://xenabrowser.net/datapages/)[11]。此外,在所有分析之前對RNA-seq 數據進行了log2轉換。
1.2.2 受試者工作特征曲線(receiver operator characteristic curve,ROC)判斷BZW1 和BZW2 在腫瘤及正常組織中的預測準確性。其中,胰腺癌組織178份,健康胰腺組織171 份,并利用R 包“pROC”進行分析和R 包“ggplot2”進行可視化。
1.2.3 時間依賴ROC 曲線 分析BZW1 和BZW2 的表達與時間相關的結局的預測效能,利用R 包“timeROC”進行分析和R 包“ggplot2”進行可視化。
1.2.4 蛋白-蛋白互作網絡(protein-protein interaction networks,PPI)提取與BZW1 和BZW2 相互作用的基因并通過STRING 數據庫(https://cn.string-db.org/)構建一個交互評分為0.400 的PPI 網絡。然后,將STRING 中的數據導入Cytoscape 軟件中進一步的美化圖片。
1.2.5 京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)和基因本體論(gene ontology,GO)富集分析 通過KEGG 和GO 功能富集分析確定BZW1,BZW2 及其共表達基因的獨特生物學特性,并使用R 包“clusterProfiler”進行分析。KEGG 用于相關途徑的富集,而GO 用于識別獨特的生物功能,包括生物過程(biological processes,BP)、細胞成分(cellular components,CC)和分子功能(molecular functions,MF)。
1.2.6 免疫浸潤分析 腫瘤微環境中免疫細胞的相對浸潤水平采用R 包“GSVA”中的ssGSEA 算法進行量化,這24 種免疫細胞的具體標記和分類已在Bindea G 等[12]發表的論文中確定。
1.2.7 Kaplan-Meier 生存分析 提取TCGA 數據庫中的178 例胰腺癌患者進行生存分析,利用R 包“survival”對BZW1 和BZW2 高、低表達組的患者進行總生存期(overall survival)、疾病特異性生存期(disease specific survival)和無進展間期(progression free interval)分析,利用R 包“survminer”進行可視化。
1.3 統計學方法 所有統計分析在R Studio 軟件上完成。計量資料以()表示,比較采用t檢驗;計數資料以(n)表示,比較采用χ2檢驗和Wilcoxon 秩和檢驗;相關性分析采用Spearman 法;Kaplan-Meier生存分析采用Cox 回歸分析。以P<0.05 表示差異有統計學意義。
2.1 BZW1 和BZW2 在胰腺癌組織中的表達及診斷效能 表達差異分析顯示,BZW1 和BZW2 在胰腺癌組織中的表達量高于癌旁組織,差異有統計學意義(P<0.05),見表1、圖1A。為了明確BZW1 和BZW2 對胰腺癌組織和正常胰腺組織的鑒別價值,ROC 曲線分析顯示,BZW1 和BZW2 的曲線下面積(AUC)和95%置信區間(CI)分別為0.974(0.954~0.994)和0.944(0.918~0.970),見圖1B。時間依賴ROC 曲線分析顯示,BZW1 的表達預測胰腺癌患者1、3、5 年總生存期的概率分別為0.611、0.673、0.825,見圖1C;此外,BZW2 的表達預測胰腺癌患者1、3、5 年總生存期的概率分別為0.623、0.584、0.601,見圖1D。
表1 BZW1 和BZW2 在胰腺癌組織中的表達比較()

表1 BZW1 和BZW2 在胰腺癌組織中的表達比較()

圖1 BZW1 和BZW2 在胰腺癌中的表達及診斷效能
2.2 BZW1 和BZW2 的生物學功能 利用STRING 數據庫構建一個由18 個節點和41 條線組成的PPI 網絡,并利用Cytoscape 軟件進行PPI 網絡美化(圖2A)。為了進一步驗證這些共表達基因在胰腺癌中的相關性,利用TCGA-PAAD 數據庫中的RNA-seq數據繪制了相關性熱圖,發現這些基因具有相關性(圖2B)。最后,將共表達基因進行GO 生物學功能富集分析和KEGG 途徑富集分析,其中GO 分析顯示這些基因主要定位于細胞核膜上,具有翻譯啟動因子活性,參與細胞質翻譯起始復合物的形成;KEGG 分析顯示這些基因主要參與RNA 的運輸和mRNA 的監測(圖2C)。

圖2 BZW1 和BZW2 的生物學功能
2.3 BZW1 和BZW2 的表達與免疫浸潤細胞的相關性分析 BZW1 與Th2 細胞(r=0.589,P<0.05)、T 輔助細胞(r=0.381,P<0.05)、Tcm 細胞(r=0.264,P<0.05)、Th1 細胞(r=0.227,P<0.05)、中性粒細胞(r=0.193,P<0.05)和巨噬細胞(r=0.161,P<0.05)呈正相關,而與pDC 細胞(r=-0.381,P<0.05)和Th17 細胞(r=-0.185,P<0.05)呈負相關(圖3A)。BZW2 僅與Th2 細胞(r=0.420,P<0.05)呈正相關,與NK 細胞(r=-0.381,P<0.05)、TFH(r=-0.380,P<0.05)、pDC(r=-0.353,P<0.05)、肥大細胞(r=-0.317,P<0.05)、細胞毒性細胞(r=-0.281,P<0.05)、iDC 細胞(r=-0.269,P<0.05)、B 細胞(r=-0.218,P<0.05)、T 細胞(r=-0.215,P<0.05)、CD8T 細胞(r=-0.214,P<0.05)、嗜酸性粒細胞(r=-0.193,P<0.05)、樹突狀細胞(r=-0.168,P<0.05)、Tem 細胞(r=-0.168,P<0.05)呈負相關(圖3B)。NK CD56dim 細胞、中性粒細胞、T 輔助細胞、Tcm 細胞、Th1 細胞和Th2 細胞在BZW1 高表達組中富集更多,而pDC 細胞富集于BZW1 低表達組(圖3C)。BZW2 高表達組中的Th2 細胞富集分數高于低表達組,而T 細胞、pDC 細胞、NK 細胞、肥大細胞、iDC 細胞、細胞毒性細胞、CD8T 細胞、B 細胞和TFH 細胞富集于BZW2 低表達組(圖3D)。

圖3 BZW1 和BZW2 的表達與免疫浸潤細胞的相關性分析
2.4 BZW1 和BZW2 的表達與臨床病理特征的關系在TCGA 數據庫中共納入178 例胰腺癌患者,但由于部分患者臨床信息的缺失,每個病理特征分組的具體患者情況見表2。高表達BZW2 與T 分期(T3&T4 vs T1&T2)、M 分期(M1 vs M0)、腫瘤分期(Ⅱ~Ⅲ期vs Ⅰ期)和病理分級(G3&G4vs G1&G2)有關,而高表達BZW1 僅與主要治療結果有關(P<0.05)。此外,胰腺癌患者的N 分期、殘余瘤狀態、年齡和腫瘤部位與BZW1 和BZW2 的高、低表達無關(P>0.05),見圖4。

表2 BZW1 和BZW2 的表達與臨床病理特征的關系(n)

表2 (續)

圖4 BZW1 和BZW2 的表達與臨床病理特征的關系

圖4 BZW1 和BZW2 的表達與臨床病理特征的關系(續)
2.5 BZW1 和BZW2 的高表達與胰腺癌患者的不良預后的關系 單因素Cox 回歸分析顯示,BZW1 和BZW2 是影響胰腺癌患者總生存期的獨立風險因子,見表3。Kaplan-Meier 生存分析顯示,與低表達BZW1 的胰腺癌患者相比,高表達BZW1 的患者具有更短的總生存期(19.7 個月vs 23.4 個月,P=0.013)、疾病特異生存期(P=0.007)和無進展間期(12.6 個月vs 18.9 個月,P=0.003)(圖5A~圖C)。另外,高表達BZW2 的胰腺癌患者同樣具有更短的總生存期(17.2個月vs 23.2 個月)和無進展間期(13.1 個月vs 17.5個月)(圖5D、5F)。然而,BZW2 的表達量的高低與胰腺癌患者的疾病特異生存期無差異,見圖5E。

圖5 BZW1 和BZW2 的表達與胰腺癌患者不良預后的關系(續)

表3 胰腺癌患者OS 的單因素Cox 回歸分析

圖5 BZW1 和BZW2 的表達與胰腺癌患者不良預后的關系
胰腺癌惡性程度高,預后極差,且5 年生存率約為5%[1]。目前,AJCC 分期是最有效的胰腺癌預后預測工具。此外,分子預后標志物可作為AJCC 分期的有益補充,進一步提高預后預測的準確性對提高胰腺癌患者的生存具有重要意義[13]。到目前為止,預測胰腺癌預后的生物標志物有限,因此篩選和鑒定與胰腺癌預后相關的分子標志物對了解胰腺癌的發展過程至關重要,并為改善癌癥的臨床管理提供新的機會。雖然已有表明BZW1 和BZW2 在各種癌癥類型中的具有重要臨床意義,但迄今為止BZW1 和BZW2 在胰腺癌中的作用報道較少。因此,需要更好地了解其在胰腺癌中的預后價值及其潛在的作用機制。
研究表明,BZW1 的過表達可促進肺腺癌的轉移,且與患者的不良預后有關[5];其次,通過調節TGF-β1/Smad 通路促進前列腺癌細胞增殖[7];此外,在粘液表皮樣癌、卵巢癌、膠質瘤中也可促進惡性增殖[8,14-16]。同樣地,BZW2 通過PI3K/AKT/mTOR 途徑促進肝細胞癌和骨肉瘤的進展[9,10],還可以激活ERK/MAPK 途徑來驅動結腸癌的進展[17]。本研究結果表明,高表達BZW2 的胰腺癌患者可能更容易發生遠端轉移和進展到疾病晚期。因此,這些數據共同表明BZW2 在驅動腫瘤的進展方面具有獨特的作用。除此之外,BZW2 可調控膀胱癌細胞的生長[18],并且與肺腺癌患者預后不良有關[6]。上述多項研究指出BZW1 和BZW2 的表達極大促進腫瘤細胞的增殖。本研究基于GO 和KEGG 分析推測其原因可能是在轉錄后水平上進行調控,通過形成翻譯起始復合物,加快腫瘤細胞生長必需物的合成,從而導致腫瘤細胞的惡性增殖。此外,高表達BZW2 與腫瘤微環境中免疫浸潤細胞的大量減少有關,表明高表達BZW2 有利于腫瘤逃避機體的免疫監視,從而促進胰腺癌的進展。
本研究主要利用TCGA 和GTEx 數據庫確定了BZW1 和BZW2 可作為胰腺癌患者潛在的預后標志物,該方法基于大樣本大數據,避免樣本量不足,弱化了個體差異,與少量胰腺癌患者樣本進行分析相比更加準確和高效。另外,采用總生存期、疾病特異生存期、無進展間期這三個指標來衡量BZW1 和BZW2 對胰腺癌患者預后的影響,能夠極大限度的保證預后準確性。然而,本研究存在一定的局限性:首先,患者的臨床信息主要來源是TCGA 數據庫,絕大部分是白人或非洲人。因此,將此次研究的結果外推到其它種族時需謹慎。雖然此次為回顧性研究,但也為BZW1 和BZW2 在胰腺癌中的功能研究提供了線索,并為胰腺癌的治療提供了靶點。