張紫涵,陳明明,劉 君,桑圣剛,張榮光,
(1.海南醫學院公共衛生與全健康國際學院,海南 海口 571199;2.海南醫學院基礎醫學與生命科學學院,海南 海口 571199;3.海南醫學院第一附屬醫院檢驗科,海南 海口 570102)
胃癌細胞起源于消化道上皮細胞,患病率高且患病年齡年輕化,由于初期表現不明顯確診難度較大[1]。最新研究表明,2020 年全球范圍內新增的胃癌病例已超百萬,且發病率已經超越肺癌、乳腺癌、結直腸癌和前列腺癌[2]。每年約76.9 萬人死于胃癌,死亡率位于癌癥的前列[3,4]。目前綜合治療方案主要為手術、化學療法和免疫治療,這些方法雖有助于提高患者的生存率和生活質量,但中晚期胃癌的轉移或復發常導致治療失敗[5-7]。因此深入了解胃癌的分子機制和生物學特性,尋找早期生物標記,并開發精準的治療手段,可提高早期胃癌患者的治療效果,減少中晚期胃癌的復發和轉移風險,從而為患者爭取更好的生存和生活質量。GEPAI數據庫具有基因表達分析和自定義數據分析的功能,能提供預后分析、腫瘤及正常組織差異表達分析、基因相關分析等數據,可以對各種癌癥和正常組織的基因表達差異及整體生存率等進行分析。本研究通過GEPIA 生物信息數據庫篩選出胃癌與正常組織表達具有差異的前10 個基因,并對篩選的差異基因進行生存預后分析,討論其在胃癌發生、發展以及疾病進展中的作用,為胃癌的診斷治療提供參考。
訪問GEPAI 數據庫(http://gepia.cancer.pku.cn/),點擊“Differential Genes”(差異基因)功能按鈕,定義篩選條件為“Dataste”(數據集),疾病類型設 為“STAD”[胃 癌(Stomach adenocarcinoma,STAD)],調整|log2FC|和q-value 的cut off 值,分別為1.0 和0.01,最后,在“Differential Methods”(差異方式)部分選擇“ANOVA”作為方法,并在“Chromosomal Distribution”(染色體分布)下拉菜單中選擇“over-expressed”(過表達),對數據進行相關分析。
進入GEPAI 數據庫首頁選擇“Surval”(生存)與“Surval Plots”(生存圖)選項,在Gene 框中依次輸入腫瘤組織和正常組織中表達差異較大的基因。然 后 從“Methods” (方 法)中 選 取“Overall Survival and Disease Free Survival” (總體生存期和無病生存期),設定Group cut off(截斷值)為 “Median” (中位數),同時設置cut off-High(%)(最高截斷)和cut off-Low(%)(最低截斷)分別為“50”,對于“Hazards Ratio” (風 險 比 率)和 “95% Confidence Interval”(95%置信區間)分別勾選“Yes” ,確定“Axis Units”(橫 軸 的 單 位)為“Months” (月),“Datasets Selection” (數據集選擇)選擇“STAD”,最后點擊“Plot”繪制在腫瘤和正常組織中差異表達基因的生存曲線和無病生存期(RFS)曲線。
在GEPAI 數據集中篩選了符合TCGA(癌癥基因組圖譜)、正常組織和GTEx(基因型和基因表達量數據庫)一致性的樣本619 例,其中包括408 例胃癌組織樣本和211 例正常組織樣本。篩選出了4 644 個胃癌組織與正常組織存在差異的基因。前10 名基因依次為:PRR11、CLDN7、TPX2、GNL3L、SKA3、ADHFE1、MTDH、CEP55、KIF11、KIF20B。對408 例胃癌組織和211 例正常胃組織樣本進行基因表達差異分析。與正常胃組織相比,胃癌組織中PRR11、CLDN7、TPX2、GNL3L、SKA3、MTDH、CEP55、KIF11、KIF20BmRNA 表達水平升高,見圖1~10,ADHFE1mRNA 表達水平降低,見圖6。圖1~10 中紅色模塊代表胃癌組織,灰色模塊代表正常組織。

圖1 PRR11 基因在胃癌和正常組織的表達Fig 1 Expression of PRR11 gene in gastric cancer and normal tissue

圖2 CLDN7 基因在胃癌和正常組織的表達Fig 2 Expression of CLDN7 gene in gastric cancer and normal tissue

圖3 TPX2 基因在胃癌和正常組織的表達Fig 3 Expression of TPX2 gene in gastric cancer and normal tissue

圖4 GNL3L 基因在胃癌和正常組織的表達Fig 4 Expression of GNL3L gene in gastric cancer and normal tissue

圖5 SKA3 基因在胃癌和正常組織的表達Fig 5 Expression of SKA3 gene in gastric cancer and normal tissue

圖6 ADHFE1 基因在胃癌和正常組織的表達Fig 6 Expression of ADHFE1 gene in gastric cancer and normal tissue

圖7 MTDH 基因在胃癌和正常組織的表達Fig 7 Expression of MTDH gene in gastric cancer and normal tissue

圖8 CEP55 基因在胃癌和正常組織的表達Fig 8 Expression of CEP55 gene in gastric cancer and normal tissue

圖9 KIF11 基因在胃癌和正常組織的表達Fig 9 Expression of KIF11 gene in gastric cancer and normal tissue

圖10 KIF20B 基因在胃癌和正常組織的表達Fig 10 Expression of KIF20B gene in gastric cancer and normal tissue
通過GEPIA 分析差異基因表達水平與胃癌患者預后的關系,對胃癌患者進行生存預后分析,得到生存曲線和RFS 曲線,結果顯示:胃癌患者中PRR11、CLDN7、TPX2、GNL3L、SKA3、MTDH、KIF11、KIF20B高表達組與低表達組生存分析(見圖11~20A)和RFS 分析(見圖11~20B)無統計學差異。胃癌患者中ADHFE1高表達組生存時間(HR=1.4,LogrankP=0.047,見圖16A)以及RFS(HR=1.7,LogrankP=0.0082,見圖16B)均低于低表達組,兩者具有統計學差異。胃癌患者中CEP55高表達組生存時間高于低表達組,兩者具有統計學差 異(HR=0.69,LogrankP=0.021,見 圖18A),CEP55高表達組與低表達組RFS 分析無統計學差異(見圖18B)。

圖11 基于PRR11 基因表達的胃癌患者生存分析(A)和RFS 分析(B)Fig 11 Survival analysis (A) and RFS analysis (B) of gastric cancer patients with PRR11 gene expression

圖12 基于CLDN7 基因表達的胃癌患者生存分析(A)和RFS 分析(B)Fig 12 Survival analysis (A) and RFS analysis (B) of gastric cancer patients with CLDN7 gene expression

圖13 基于TPX2 基因表達的胃癌患者生存分析(A)和RFS 分析(B)Fig 13 Survival analysis (A) and RFS analysis (B) of gastric cancer patients with TPX2 gene expression

圖14 基于GNL3L 基因表達的胃癌患者生存分析(A)和RFS 分析(B)Fig 14 Survival analysis (A) and RFS analysis (B) of gastric cancer patients with GNL3L gene expression

圖15 基于SKA3 基因表達的胃癌患者生存分析(A)和RFS 分析(B)Fig 15 Survival analysis (A) and RFS analysis (B) of gastric cancer patients with SKA3 gene expression

圖16 基于ADHFE1 基因表達的胃癌患者生存分析(A)和RFS 分析(B)Fig 16 Survival analysis (A) and RFS analysis (B) of gastric cancer patients with ADHFE1 gene expression

圖17 基于MTDH 基因表達的胃癌患者生存分析(A)和RFS 分析(B)Fig 17 Survival analysis (A) and RFS analysis (B) of gastric cancer patients with MTDH gene expression

圖18 基于CEP55 基因表達的胃癌患者生存分析(A)和RFS 分析(B)Fig 18 Survival analysis (A) and RFS analysis (B) of gastric cancer patients with CEP55 gene expression

圖19 基于KIF11 基因表達的胃癌患者生存分析(A)和RFS 分析(B)Fig 19 Survival analysis (A) and RFS analysis (B) of gastric cancer patients with KIF11 gene expression

圖20 基于KIF20B 基因表達的胃癌患者生存分析(A)和RFS 分析(B)Fig 20 Survival analysis (A) and RFS analysis (B) of gastric cancer patients with KIF20B gene expression
胃癌是世界上最常見的腫瘤之一,發病率和死亡率較高[8]。盡管近些年對該病的診療技術有所發展,然而在中國,由于胃癌早期無顯著征兆,多數病例病情惡化后才被救治,病死率高[9,10]。尋找能夠預測其生存時間的指標具有重要意義[11]。在胃癌疾病發展過程中,某些基因的異常表達會改變腫瘤組織細胞的結構和功能,這些差異表達的基因可能對早期診斷和預后預測具有重要價值。
本研究利用GEPIA 數據庫篩選出正常組織和胃癌組織的差異基因,差異排名前10 位的基因為PRR11、CLDN7、TPX2、GNL3L、SKA3、ADHFE1、MTDH、CEP55、KIF11、KIF20B。通過分析這些基因,發現與胃癌患者生存時間密切相關的基因為ADHFE1和CEP55基因。對上述基因進行RFS 曲線分析,發現ADHFE1基因表達與患者的預后存在關聯。這些基因有可能成為胃癌診斷和預后分析的重要生物標志。
ADHFE1( Alcohol dehydrogenase 1 containing iron)基因編碼的含鐵的醇脫氫酶1 是鐵活化醇脫氫酶家族的成員,在多種生理過程中起著多種作用[12,13]。研究表明,ADHFE1在結直腸癌組織中表達下調和高甲基化,ADHFE1高表達水平與腫瘤患者的良好預后呈正相關,表明其在結直腸癌中具有抑瘤作用[14-16]。本研究結果顯示,胃癌組織中ADHFE1基因的表達顯著低于正常組織,ADHFE1基因高表達組患者生存時間明顯低于低表達組。RFS分析結果顯示ADHFE1基因與胃癌患者的無病生存期呈現負相關。
CEP55(Centrosome protein 55)基 因 編 碼 的 中心體蛋白55 是中心體相關蛋白家族的成員[17]。此基因位于第10 號染色體長臂2 區3 帶[18]。已有研究證實,在許多人類腫瘤組織中發現了CEP55的高表達,例如乳腺癌和子宮內膜癌, 并且CEP55基因與腫瘤的惡性程度、侵襲以及不良預后密切相關[19,20]。在本研究中,CEP55基因高表達組和低表達組的生存時間存在顯著差異,CEP55基因高表達組患者生存時間顯著高于低表達組。
綜上所述,差異基因的不同表達水平在胃癌的發生、發展中可能起到重要的作用,并與胃癌的生存預后密切相關,其中ADHFE1的低表達和CEP55的高表達是發生胃癌的危險因素。這些發現為胃癌早期診斷和預后預測研究提供了新的重要線索和基礎,探明這些基因在胃癌發生、發展中的作用及分子機制是值得未來研究關注的方向。
作者貢獻度說明:
張紫涵:數據處理、作圖并撰寫論文;陳明明:文獻檢索并處理數據;劉君:論文的審閱與修改;桑圣剛、張榮光:全程參與、指導數據分析和作圖并修改論文。
所有作者聲明不存在利益沖突關系。