高夏青,楊春婷,郭雙銘,韓 靜,樊 濤,楊 霄,李海龍*
(1.甘肅中醫藥大學第一臨床醫學院,甘肅 蘭州730000;2.甘肅中醫藥大學附屬醫院 科研科,甘肅 蘭州730000)
胃癌是全球最常見的消化系統惡性腫瘤。流行病學資料顯示,2022年中國大約有51萬新發胃癌病例和40萬胃癌死亡病例[1]。到目前為止,手術治療仍然是早期胃癌最重要的治療手段。因此,探索胃癌發生、發展機制,尋找可靠的分子標記物對于提高胃癌的早期診斷和靶向治療水平均有重要的臨床意義。人類腫瘤蛋白D52(human tumor protein D52,hTPD52)家族是近年來新發現的一類原癌基因,其家族成員包括腫瘤蛋白D52(TPD52)、腫瘤蛋白D52樣1(TPD53、TPD52L1)、腫瘤蛋白D52樣2(TPD54、TPD52L2)和腫瘤蛋白D52樣3(TPD55、TPD52L3)[2]。眾多研究表明,hTPD52家族在腫瘤的進展中扮演著重要角色[3-14]。但鮮見TPD52和TPD52L2與胃癌的研究報道,本研究借助于生物信息學方法評估TPD52和TPD52L2在胃癌中的差異表達及其與臨床病理特征的相關性,分析TPD52和TPD52L2的表達和胃癌患者預后的關系,并探討TPD52和TPD52L2共表達基因參與胃癌發生發展的相關信號通路,以期為胃癌的基因靶向治療提供依據。
從TCGA數據庫的胃癌項目獲取基因表達數據(407例,包括32例癌旁組織樣本和375例腫瘤組織樣本),使用R語言軟件包pROC和ggplot2進行TPD52和TPD52L2的差異表達和ROC曲線分析。
基于從TCGA獲取的407例胃癌患者的數據信息,借助R語言軟件包ggplot2比較TPD52和TPD52L2的表達與胃癌患者的病理分期、組織學分級、幽門螺旋桿菌感染和Barretts食管的相關性。
通過Human Protein Atlas數據庫[15](https://www.proteinatlas.org/)分析TPD52和TPD52L2在胃癌組織和癌旁組織中的免疫組化染色情況。
通過單樣本基因集富集分析(ssGSEA)的方法分析TCGA數據庫中胃癌與免疫細胞的浸潤情況,以及選取Spearman秩相關性分析與免疫細胞的相關度,使用R語言軟件包GSVA進行統計分析和可視化。
借助于Kaplan-Meier Plotter數據庫[16](https://kmplot.com/analysis/)在線評估TPD52和TPD52L2在胃癌中的表達與總生存期(OS)、首次進展生存期(FP)和再次進展生存期(PPS)的關系,并使用R語言軟件包rms、survival對TCGA數據建立Nomogram(列線圖)模型、繪制Calibration(校準曲線)圖、單因素和多因素Cox回歸分析。
通過cBioPortal數據庫[17](https://www.cbioportal.org/)中(TCGA,PanCancer Atlas)胃癌患者的數據,提取TPD52和TPD52L2的共表達基因,隨后將Spearman秩相關系數(r)的絕對值≥0.3的共表達基因輸入SangerBox數據分析軟件[18](http://vip.sangerbox.com/home.html)進行KEGG富集分析并繪圖。
基于cBioPortal數據庫篩選的共表達基因,結合STRING數據庫[19](https://cn.string-db.org/)構建PPI網絡,以相互作用分數≥0.7作為閾值,并使用Cytoscape 3.9軟件中CytoNCA插件篩選核心基因。
使用Kaplan-Meier Plotter數據庫驗證核心基因與胃癌患者總生存期的關系,進一步借助R語言軟件包ggplot2探索核心基因與TPD52和TPD52L2的相關性。
R語言軟件包(v.3.6.3)用于統計學分析。兩組間的差異表達采用t檢驗。與臨床病理特征的相關性分析使用F檢驗;Spearman秩相關系數分析TPD52和TPD52L2的免疫細胞浸潤和共表達基因;生存分析采用log-rank檢驗;單因素和多因素的生存分析使用Cox比例風險模型;富集分析使用FDR方法;Pearson相關系數分析TPD52和TPD52L2與核心共表達基因的相關性。P<0.05為差異具有統計學意義。
為了探索TPD52和TPD52L2在胃癌進展中的作用,使用TCGA數據庫(32例癌旁組織樣本和375例腫瘤組織樣本)預測基因的差異表達,結果表明:與癌旁組織相比,TPD52和TPD52L2在胃癌組織中均高表達(P<0.001)(圖1A,C)。TPD52表達水平的ROC曲線下面積為0.794(95%CI=0.730~0.859)(圖1B),TPD52L2為0.809(95%CI=0.728~0.890)(圖1D),提示均有一定的診斷價值。

圖1 TPD52(A,B)和TPD52L2(C,D)在胃癌組織與癌旁組織中的差異表達和ROC曲線
進一步分析胃癌組織與癌旁組織中TPD52和TPD52L2的表達水平與臨床病理特征的關系。結果表明:與癌旁組織相比,TPD52和TPD52L2高表達與病理分期、組織學分級、幽門螺旋桿菌感染和Barretts食管均密切相關,差異有統計學意義(P<0.05)(圖2A-H)。

圖2 TPD52和TPD52L2分別在胃癌不同分期(A,E)、不同分級(B,F)、幽門螺旋桿菌感染(C,G)和Barretts食管(D,H)中的表達
通過Human Protein Atlas數據庫下載TPD52和TPD52L2在胃癌組織和癌旁組織的免疫組化染色結果圖片。分析結果顯示:TPD52在癌旁組織(圖3A)和胃癌組織(圖3B)中均染色成陽性;TPD52L2在癌旁組織(圖3C)中染色成陰性,在胃癌組織(圖3D)中染色成陽性。

圖3 TPD52(A,B)和TPD52L2(C,D)分別在癌旁組織和胃癌組織的免疫組化染色結果
通過Spearman秩相關性分析發現,TPD52的表達與免疫細胞Th2 cells(輔助性T細胞2)和T helper cells(輔助性T細胞)等細胞的浸潤豐度呈正相關,與免疫細胞NK cells(自然殺傷細胞)、pDC(漿細胞樣樹突狀細胞)等細胞的浸潤豐度呈負相關(P<0.05)(圖4A);TPD52L2的表達與免疫細胞Th2 cells的浸潤豐度呈正相關,與免疫細胞pDC和Mast cells(肥大細胞)等細胞的浸潤豐度呈負相關(P<0.05)(圖4B)。

圖4 TPD52(A)和TPD52L2(B)與胃癌免疫細胞浸潤的相關性
Kaplan-Meier生存曲線結果表明:TPD52高表達組胃癌患者的OS、FP和PPS高于低表達組,可能由于樣本量的差異與預期結果不符(圖5A-C)。TPD52L2高表達組胃癌患者的OS、FP和PPS低于低表達組(P<0.05)(圖5D-F),表明高表達組的生存期明顯縮短。然后使用TNM分期、病理分期、組織學分級、組織學類型、TPD52和TPD52L2的表達作為預測胃癌患者1年OS的指標(圖6A,C)。校準曲線圖顯示了1年臨床結果的理想預測(圖6B,D)。TPD52和TPD52L2的單因素Cox分析結果表明,T期、N期、M期和病理分期與胃癌患者的預后不良相關,多因素Cox分析結果表明,M分期是影響胃癌患者OS的獨立危險因素(P<0.05)(表1)。

表1 單因素和多因素Cox回歸分析TPD52和TPD52L2的表達與OS的相關性

圖5 TPD52和TPD52L2表達水平與胃癌患者的OS(A,D)、FP(B,E)和PPS(C,F)生存曲線分析

圖6 TPD52(A,B)和TPD52L2(C,D)表達的列線圖的構建與驗證
通過cBioPortal數據庫和SangerBox數據平臺分析TPD52和TPD52L2共表達基因的KEGG富集分析。分析結果表明:與TPD52有相關性的1 365個共表達基因主要富集在代謝通路、癌癥的轉錄失調和TNF信號通路等信號通路中(圖7A)。與TPD52L2有相關性的412個共表達基因主要富集在癌癥通路、剪接體和小細胞肺癌等信號通路中(圖7B)。

圖7 TPD52(A)和TPD52L2(B)共表達基因的KEGG富集分析
通過STRING數據庫構建TPD52和TPD52L2共表達基因的PPI網絡分析,TPD52的平均節點度為1.08,TPD52L2的平均節點度為1.33,PPI網絡富集均P<0.001,隨后分別下載PPI網絡數據導入Cytoscape 軟件中,使用CytoNCA插件篩選PPI網絡中的核心共表達基因。分析結果顯示:TPD52位于前10的核心共表達基因包括PLCG1、PRKACA、MAPK11、CYCS、NGFR、PTK2、NCOR2、NOTCH3、PSEN1和ST3GAL3(圖8A),TPD52L2位于前10的核心共表達基因包括RUVBL1、NOP56、HSP90AB1、JAK2、CCT6A、PLCG1、PSMA7、EIF6、HJURP和TAF4(圖8B)。

圖8 TPD52(A)和TPD52L2(B)共表達基因的PPI網絡
使用Kaplan-Meier Plotter數據庫驗證TPD52和TPD52L2前5位核心共表達基因與胃癌患者總生存期的關系。結果表明:TPD52核心共表達基因PLCG1、PRKACA、MAPK11和NGFR高表達組比低表達組患者的總生存期低(P<0.05),CYCS高表達組比低表達組患者的總生存期高(P<0.05)(圖9A-E)。TPD52L2核心共表達基因HSP90AB1高表達組比低表達組患者的總生存期低(P<0.05),核心共表達基因RUVBL1、NOP56、JAK2和CCT6A高表達組比低表達組患者的總生存期高(P<0.05)(圖9F-J)。進一步借助R語言軟件包ggplot2驗證TPD52和TPD52L2與前5位核心共表達基因的關系,結果發現MAPK11、CYCS和NGFR是與TPD52關系最緊密的基因(P<0.05)(圖10A-C),RUVBL1、NOP56、HSP90AB1和CCT6A是與TPD52L2關系最緊密的基因(P<0.05)(圖10D-G)。

圖9 TPD52(A-E)和TPD52L2(F-J)核心共表達基因在胃癌中的生存分析

圖10 TPD52(A-C)和TPD52L2(D-G)與核心共表達基因的相關性
TPD52最初在人類乳腺癌中被發現高表達,位于染色體8q21[20],是腫瘤中常見的染色體擴增區域,與細胞的增殖、凋亡和轉移密切相關。miRNA是一種內源性非編碼單鏈RNA分子,在動植物中參與轉錄后基因表達調控[21],miRNA通過結合靶信使mRNA的3′-UTR抑制mRNA轉錄,促進RNA降解。然而,TPD52和TPD52L2在不同腫瘤中可作為多種miRNA的靶點。有研究表明,miR-449、miR-34a、miR-1323和miR-218-5p通過靶向調節TPD52抑制乳腺癌細胞的增殖和轉移[22-25],miR-107通過Wnt/β-連環蛋白信號通路下調TPD52的表達水平來增加乳腺癌細胞對紫杉醇的敏感性[26]。miR-218、miR-224和miR-103a-3p通過下調TPD52的表達抑制前列腺癌細胞的生長、侵襲和轉移,促進細胞凋亡[27-29],外源性表達的TPD52也可激活PKB/Akt信號通路,通過ανβ3整合素促進前列腺癌細胞的遷移[30],另一方面,TPD52通過與PRDX1相互作用增加PRDX1過氧化物酶活性,外源性TPD52在前列腺癌細胞中的表達促進了PRDX1的二聚化,下調TPD52和PRDX1可協同抑制前列腺癌細胞的增殖[31]。miR-139-5p通過下調TPD52抑制子宮平滑肌瘤細胞的增殖,誘導細胞凋亡和G1期阻滯[32]。LEWIS等[33]研究發現,小鼠TPD52(mD52)在3T3細胞中的表達誘導多個參與促進轉移的基因上調,而預防腫瘤形成和轉移的基因則被下調。WANG等[34]沉默TPD52通過降低Akt在Ser473位點的磷酸化來抑制胰腺癌細胞的增殖、遷移和侵襲,并誘導細胞凋亡。TPD52在維甲酸誘導的IMR-32神經母細胞瘤細胞的體外神經元分化中也發揮了重要作用[35]。LI等[36]報道TPD52在結直腸癌中過表達通過誘導上皮-間充質(EMT)轉化并激活黏著斑激酶介導的整合素和PI3K/Akt信號通路來促進癌細胞的遷移和侵襲。在腎細胞癌中,TPD52過表達可顯著上調E-鈣黏蛋白和下調N-鈣黏蛋白與波形蛋白的表達,表明TPD52能抑制EMT轉化,從而影響腫瘤的進展[7]。沉默TPD52還可抑制胃癌[37]、血管瘤內皮細胞[38]、鼻咽癌細胞[39]和肺鱗狀細胞癌細胞[40]的進展,其TPD52的表達水平與膽管癌患者的病理分化和TNM分期密切相關[41]。
TPD52L2基因定位于染色體20q13[42],在人類腫瘤中廣泛表達。有學者發現TPD52L2可以和一種在進化上非常保守的非跨膜ATP結合蛋白hABCF3結合,在體外促進肝癌細胞的增殖[43]。miR-485-5p直接下調其靶點TPD52L2顯著抑制膠質瘤細胞的增殖、遷移和侵襲[44],TPD52L2的表達還可通過調節Wnt/β-連環蛋白/snail信號通路影響膠質母細胞瘤的惡性生物學行為[45]。miR-217通過沉默TPD52L2顯著抑制胰腺癌細胞的增殖和轉移,誘導細胞凋亡和G0/G1期阻滯[46]。REN等[47]研究顯示TPD52L2高表達與前列腺癌患者的預后不良相關,沉默TPD52L2可抑制前列腺癌細胞的增殖和集落形成[48]。MUKUDAI等[49]發現TPD52L2通過talin 1介導的細胞外基質調節整合素的激活,從而影響口腔鱗狀細胞癌細胞的遷移、細胞外基質的黏附和PKB/Akt的激活。ZHUANG等[50]對TPD52L2的敲除可增加PDH-E1α蛋白的降解,導致PDH酶活性降低,減少線粒體的耗氧量和活性氧的產生,從而促進了乳腺癌細胞對二甲雙胍的耐藥。
本研究結果表明,TPD52和TPD52L2在胃癌組織中高表達,其表達水平與臨床病理特征和免疫細胞浸潤密切相關,ROC曲線結果顯示,TPD52和TPD52L2具有一定的診斷價值。生存曲線結果表明,TPD52L2高表達組比低表達組生存期明顯縮短,TPD52和TPD52L2的單因素Cox分析結果表明,TNM分期和病理分期與胃癌患者的預后不良相關,多因素Cox分析結果表明,M分期是影響胃癌患者OS的獨立危險因素,提示TPD52和TPD52L2可作為診斷胃癌的潛在分子靶標,進一步增強了TPD52和TPD52L2作為預后指標的可信度。通過對KEGG富集分析結果發現,TPD52相關基因主要參與了代謝通路和癌癥的轉錄失調等信號通路,TPD52L2相關基因主要參與了癌癥通路和剪接體等信號通路,表明TPD52和TPD52L2可能通過以上通路調控胃癌的發生發展。PPI網絡中核心基因生存分析結果表明,高表達組的PLCG1、PRKACA、MAPK11、NGFR和HSP90AB1預后較差,相關性分析發現MAPK11、CYCS和NGFR是與TPD52關系最緊密的基因,RUVBL1、NOP56、HSP90AB1和CCT6A是與TPD52L2關系最緊密的基因,可作為探討TPD52和TPD52L2參與胃癌惡性生物學行為的候選基因。
綜上所述,本研究通過生物信息學的方法對TPD52和TPD52L2的深入挖掘,進一步證明了TPD52和TPD52L2與胃癌的發生發展存在密切的關系,可作為未來胃癌早期診斷和基因治療的潛在靶點。但由于TPD52和TPD52L2影響胃癌患者預后的確切機制尚未完全闡明,應進一步進行實驗來驗證本研究的結論。