張捷,龔慶豪,章波,朱松明
作者單位:上海交通大學醫學院附屬新華醫院崇明分院普外科,上海202150
胃癌是全世界最常見的消化系統惡性腫瘤之一,在我國,胃癌的病死率位列惡性腫瘤的第2 位,嚴重危害我國人民群眾的生命健康,胃癌的診療任重而道遠[1-2]。盡管手術、放療、化療以及靶向治療的聯合應用延長了胃癌病人的生存時間,但其發病發展機制尚未完全闡明,沒有有效地預測診療的標志物和分子靶點,胃癌病人的預后依然不理想[3]。因此,從分子水平探討胃癌的發病機制,尋找治療藥物作用的關鍵靶點,對于延長胃癌病人的生存時間意義重大。
多功能蛋白聚糖(Versican,VCAN)基因屬于蛋白聚糖家族,一種硫酸軟骨素蛋白多糖,是細胞外基質的主要成分,也是為哺乳動物細胞外基質中最為豐富的蛋白聚糖,在組織形態形成和維持中起著重要作用,VCAN 蛋白通過與多種蛋白分子相互作用,在發育和疾病早期形成的臨時基質中富集,參與細胞分類、黏附、增殖、遷移和血管生成[4-6]。VCAN 在多種惡性腫瘤中呈過表達,在惡性腫瘤的發生發展中發揮著關鍵的作用,并且與癌癥復發及生存預后不良關系密切[7]。有研究報道VCAN 在胃癌中高表達,VCAN 高表達與胃癌病人的生存相關,VCAN 可能是胃癌病人生存的重要的預后標志物[8-9],但目前VCAN 在胃癌中的表達及作用尚未完全闡明。本研究于2019 年7—9 月通過檢索癌癥基因組圖譜(The Cancer Genome Atlas,TCGA),Oncomine 和 Kaplan-Meier Plotter 等大型開放性癌癥公共數據庫中胃癌組織VCAN 的基因組表達及臨床數據,對VCAN 在胃癌中的表達水平及其臨床預后意義和可能參與的信號通路進行了深度挖掘分析。
1.1 TCGA胃癌數據下載與整理從TCGA 官方網站(http://www.tcga.org)基因組數據共享(Genomic Data Commons,GDC,https://portal. gdc. cancer.gov/)鏈接中下載胃癌轉錄組及臨床相關數據,包括 407 個文件和 380 個病例,使用 R 及 perl 軟件整理合并數據文件。轉錄組數據(HTSeq-FPKM 3級)包括375 例胃癌組織和32 例癌旁正常組織樣本,用于VCAN mRNA 差異表達分析。篩選出368例生存信息完整的胃癌病人數據用于臨床相關性和生存分析,全組胃癌病人的一般資料情況詳見表l。
1.2 Oncomine數據庫分析VCAN表達水平使用Oncomine 數據庫(https://www.oncomine.org/)分析VCAN mRNA 在胃癌和正常胃組織中的表達差異。設置篩選數據的參數如下:(1)Gene:VCAN;(2)Analysis Type:Cancervs.Normal Analysis;(3)Data Type:mRNA;(4)Cancer Type:Gastric Cancer;(5)Threshold by:P value<1E-4,foldchange>2,gene rank=top10%。
1.3 Kaplan-Meier Plotter生存分析使用Kaplan-Meier Plotter 在線數據庫(https://kmplot.com/analysis/)分析VCAN mRNA的表達與胃癌病人生存時間的關系。設置篩選數據的參數如下:(1)Gene:VCAN;(2)Split patients by:media;(3)Survival:OS(n=882);(4)Probe set options:only JetSet best probe set;(5)Array quality control:exclude biased arrays(n=1 060)。
1.4基因集富集分析采用基因集富集分析(gene set enrichment analysis,GSEA)軟件(3.0 版)進行分析。以中位數為界將VCAN mRNA表達數據分為高表達組及低表達組。利用GSEA 網站中獲得的c2.cp.kegg.v6.0.symbols.gmt 規范化信號通路進行富集分析。按缺省加權富集統計的方法進行富集分析,設置隨機組合次數為1 000 次。將錯誤發現率(False discovery rates,FDR)<0.25 定義為顯著富集。
1.5統計學方法根據胃癌組織中VCAN mRNA表達水平的中位數將全組病人分為高表達組和低表達組。使用SPSS 21.0軟件進行統計學分析,使用Graphpad prim 7 進行統計結果的可視化。VCAN mRNA表達水平的兩組間比較采用獨立樣本t檢驗,多組間比較采用單因素方差分析(兩兩比較采用Dunnett-t檢驗)。VCAN mRNA 表達與臨床病理參數(年齡、性別、病理分級、TNM分期、T分期、N分期和M分期)相關性分析采用χ2檢驗。生存分析采用Kaplan-Meier 法,應用log-rank 檢驗生存差異,單因素和多因素分析采用Cox回歸模型,Cox多因素分析采用Wald 檢驗輸入法。采用自適應線性向上控制方法(a-daptive linear step-up,ALSU)計算FDR。P<0.05為差異有統計學意義。
2.1 VCAN在胃癌癌和正常胃組織差異表達對TCGA 數據庫中VCAN 在正常胃組織和胃癌組織中的表達水平進行分析,結果顯示:VCAN mRNA在胃癌組織中的表達水平(15.138±0.654)明顯高于正常胃組織(3.678±0.346),差異有統計學意義(t=5.103,P<0.001),見圖1A。將27 例胃癌和相配對的非腫瘤胃組織進行配對t檢驗[(3.534±0.402)比(9.833±1.411),t=4.931,P<0.001]結果顯示VCAN mRNA在胃癌組織中的表達顯著增多,見圖1B。進一步在Oncomine 數據庫中分析VCAN mRNA 在胃癌組織及正常胃組織中的表達差異,結果如圖1C~1F所示,VCAN 表達水平在胃癌中均顯著升高(P<0.05)。
2.2 VCAN差異表達與病人臨床病理參數之間的相關性TCGA 數據庫中VCAN 差異表達亞組分析結果表明,I-IV 期病人胃癌組織VCAN 表達分別為(10.40± 9.63)、(14.76±11.69)、(15.29±11.99)和(16.94±15.04),T1-T4 病人胃癌組織VCAN 表達分別為(4.428±4.112)、(14.377±12.016)、(15.036±12.644)和(16.282±12.125),病理分級G1-2 和G3 病人胃癌組織VCAN 表達分別為(12.864±11.613)和(16.428±12.984),在胃癌的不同 TNM 分期(F=3.192,P=0.038)、T 分期(F=4.703,P=0.003)及病理分級(t=2.642,P=0.008)中VCAN表達差異有統計學意義,整體趨勢為TNM分期、T分期及病理分級越高,VCAN 表達水平越高,見圖2。進一步以中位值為界限將368例胃癌病人分為VCAN高表達組和低表達組各184 例,分析胃癌病人VCAN mRNA 表達與臨床病理參數的關系,如表1 示,VCAN mRNA表達與T 分期相關,差異有統計學意義(P<0.05),而與年齡、性別、病理分級、TNM分期、N分期和M分期無關(P>0.05)。
2.3 VCAN的表達與胃癌病人預后的相關性TCGA 中胃癌病人生存分析結果表明VCAN mRNA 高表達病人與低表達病人相比生存率較低,差異有統計學意義(P=0.015),圖3A。采用Kaplan-Meier Plotter 在線生存分析數據庫對TCGA 生存分析結果進行驗證,全組胃癌病人中VCAN mRNA 高表達組生存率明顯降低,差異有統計學意義(P=0.003),圖3B;亞組分析結果表明I 期(P=0.008,圖3C)、III 期(P=0.01,圖3E)和IV期(P=0.003,圖3F)胃癌病人中VCAN mRNA高表達組生存率也明顯低于低表達組,而II期(P=0.12,圖3D)病人兩組生存率差異無統計學意義。

圖1 多功能蛋白聚糖(VCAN)基因在胃癌組織及正常胃組織之間的表達差異:A為癌癥基因組圖譜(TCGA)數據庫中VCAN mRNA在胃癌及正常胃組織中的表達水平;B為TCGA數據庫中VCAN mRNA在配對癌及癌旁正常組織中的表達水平;C~F為Oncomine數據庫中4項關于VCAN在胃癌組織及正常胃組織之間的表達差異(Chen、Cui、DErrico、Wang的胃癌數據)

表1 多功能蛋白聚糖(VCAN)mRNA表達水平與胃癌病人臨床病理特征的相關性/例
采用單因素和多因素Cox 回歸分析TCGA 胃癌數據(表2),其中單因素分析結果表明,年齡、TNM分期、T分期、N分期、M分期及VCAN表達與胃癌病人的不良預后相關(P<0.05)。多因素分析結果表明,VCAN 表達和年齡可能是胃癌病人不良預后的獨立風險因素(P=0.006)。
2.4基因富集分析預測VCAN的功能GSEA 富集分析共篩選出與VCAN 高表達相關的85 個FDR<0.25的基因集,72個P<0.05的基因集,進一步結合既往對胃癌研究的靶點基因,選取有意義的信號通路,結果如圖4所示,VCAN 高表達主要富集在腫瘤(FDR<0.001,P<0.001),絲裂原活化蛋白激酶(MAPK)信號通路(FDR<0.001,P<0.001),Janus激酶/信號轉導和轉錄激活因子(JAK-STAT)信號通路(FDR<0.001,P=0.002),Wnt 信號通路(FDR=0.001,P<0.001),Toll 樣受體信號通路(FDR=0.003,P=0.004),哺乳動物雷帕霉素靶蛋白(mTOR)信號通路(FDR=0.008,P=0.004)等信號通路。
既往相關研究表明,VCAN 在腎癌[10]、肝細胞癌[11-12]、結直腸癌[13-14]、膽管癌[15]、子宮內膜癌[16]和胃癌[8-9]等多種惡性腫瘤中高表達,VCAN 高表達與腫瘤的高分期、低分化、高轉移率及不良預后正相關。VCAN主要由基質細胞與巨噬細胞可以合成并分泌,腫瘤的進展也與細胞外基質的擴張和腫瘤間質內非惡性細胞的活化有關,與腺瘤相比,結腸癌中的糖蛋白VCAN 在mRNA 水平上過度表達,并與腫瘤間質形成相關[14],間質VCAN表達可作為Ⅱ-Ⅲ期結腸癌復發的潛在預后生物標志物。VCAN在多種腫瘤細胞系中高表達,且多種腫瘤細胞系的表達水平差異較大,VCAN 片段獨特地定位于腫瘤血管內皮,對腫瘤生長和血管生成具有潛在的促進作用[17]。間質VCAN表達與晚期乳腺癌中腫瘤相關巨噬細胞的積累、原發腫瘤的促炎和促血管生成狀態有關,VCAN 可促進肺轉移性結節數量的增加[18]。VCAN 表達上調可促進包括肝細胞癌的增殖、侵襲和轉移,VCAN 外顯子區基因變異可預測早期乙型肝炎病毒相關肝癌切除病人的生存時間[12]。卵巢癌中FOXA2 和VCAN mRNA 水平呈負相關,miR-590-3p 通過一種新的FOXA2-VCAN 通路促進卵巢癌的發生發展[19]。VCAN作為骨髓微環境中細胞外基質蛋白多糖的主要成分在多發性骨髓瘤細胞的生存、增殖、遷移及耐藥中均具有重要作用,并且影響疾病的臨床表現及預后[7,20]。

表2 影響胃癌病人預后參數的單因素和多因素分析
Jiang 等[8]學者采用生物信息學方法挖掘胃癌潛在的預后標志物,結果發現VCAN 在胃癌組織中顯著高表達,VCAN 作為蛋白網絡互作中的關鍵樞紐基因與胃癌病人的生存期和無進展生存期關系密切,VCAN 高表達病人預后欠佳。Sanei 等[9]利用免疫組化實驗對80 例胃腺癌病人胃切除術后的病理資料分析發現,胃癌上皮細胞和間質細胞中VCAN蛋白陽性表達分別占39.5%和22.4%,胃上皮腫瘤細胞中VCAN 蛋白的表達主要集中在胃體部(50.0%),而間質腫瘤細胞中VCAN蛋白主要集中在胃竇部(41.2%),生存分析發現胃癌上皮細胞和間質細胞的VCAN 蛋白高表達的病人預后較差,但該研究病例數較少,沒有對VCAN 蛋白表達與臨床病理資料相關性進行分析,關于VCAN 在胃癌中的具體作用及潛在分子功能尚不清楚。與上述研究結果一致,本研究利用TCGA 和Oncomine 數據庫分析VCAN 在胃癌和癌旁正常胃組織中的差異表達水平,發現VCAN 在胃癌組織中表達水平明顯高于癌旁正常胃組織,VCAN表達水平與TNM分期、T分期及病理分級相關,腫瘤惡性程度越高,VCAN表達越高。進一步結合Kaplan-Meier Plotter 生存數據庫分析VCAN 的表達對胃癌病人生存預后的影響,結果提示VCAN 高表達病人預后不良,Cox 單因素和多因素分析發現,VCAN 表達與是影響胃癌病人預后的獨立因素。
GSEA 分析發現在VCAN 高表達的胃癌病人中存在 MAPK,JAK-STAT,Wnt,Toll 樣受體,mTOR 等腫瘤相關信號通路的富集,上述結果提示VCAN 可能是胃癌靶向治療新的作用靶點,該結果為進一步實驗驗證VCAN參與調控胃癌生物學功能的分子機制提供了一定的線索。既往Tang 等[21]研究發現腫瘤細胞中VCAN可以通過激活Toll樣受體抑制樹突狀細胞的功能,從而誘導免疫抑制或者免疫缺陷。Wnt/β-連環蛋白(β-catenin)信號通路與多種癌細胞的分化、增殖、凋亡及轉移相關,在多發性骨髓瘤細胞中可通過激活β-catenin介導VCAN的轉錄[22]。
由于本研究是采用多種癌癥相關數據庫對VCAN在胃癌中的表達及臨床意義進行了初步的探討,結果提示VCAN在胃癌組織中高表達,其高表達與胃癌病人的臨床病理特征及不良預后密切相關,也是影響胃癌病人預后的獨立危險因素,VCAN 可能通過調節Wnt、Toll樣受體等信號通路在胃癌的發生、發展中起重要作用,VCAN可能是胃癌靶向治療新的作用靶點。在后續研究中,將收集相關臨床資料對上述結果予以驗證,并進一步通過細胞和動物實驗深入探討VCAN在胃癌中的功能和作用機制。
(本文圖3,4見插圖9-5)

圖3 Kaplan-Meier分析多功能蛋白聚糖(VCAN)表達與胃癌病人總生存期的關系:A為癌癥基因組圖譜(TCGA)數據庫中VCAN表達與胃癌病人生存期的關系;B~F為Kaplan-Meier Plotter數據庫中不同TNM分期胃癌病人VCAN表達與生存期的關系

圖4 多功能蛋白聚糖(VCAN)在胃癌中的相關通路:A為腫瘤信號通路;B為絲裂原活化蛋白激酶(MAPK)信號通路;C為Janus激酶/信號轉導和轉錄激活因子(JAK-STAT)信號通路;D為Wnt信號通路;E為Toll樣受體信號通路;F為哺乳動物雷帕霉素靶蛋白(mTOR)信號通路