鄧建忠,劉秀玲,陸文斌,張華,李文晶,吳頡,劉遷
江蘇大學附屬武進醫院 徐州醫科大學武進臨床學院,江蘇常州213017
胃癌是臨床常見的消化系統惡性腫瘤,在我國其發病率僅次于肺癌,居第2位,死亡率居腫瘤相關死亡的第3位[1]。我國早期胃癌發現占比較低,僅占20%左右,大多數患者首診時已屬進展期,5 年總體生存率不足50%[2-3]。目前,胃癌發病的確切分子機制尚不清楚,臨床亦缺乏早期診斷和預后判斷的生物標志物。近年來,隨著高通量技術迅速發展,有力地推動了疾病基因組學發展和進步。有研究認為,利用生物信息學方法探索分子改變與疾病預后的關系,能夠挖掘對疾病預后判斷有效的分子標志物[4]。2020 年8 月,本研究應用生物信息學方法通過GEO數據庫獲取早期胃癌發生、發展過程中顯著差異表達基因(DEGs),然后通過GO 功能注釋、KEGG 富集分析和蛋白質相互作用網絡(PPI)篩選核心基因,通過Kaplan-Meier 生存分析進一步篩選與預后相關的核心基因,旨在為早期胃癌的預后判斷提供新的視角。現報告如下。
1.1 微陣列數據庫檢索 以“early gastric cancer,Homo”為關鍵詞,從GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)中獲得人類早期胃癌基因芯片數據集。數據集需要同時提供早期胃癌組織和正常胃組織的基因芯片,共篩選出GSE3438、GSE55696 兩個微陣列數據集。GSE3438數據集基于GPL2912平臺(人類基因組功能分析中心KUGI 14K),GSE55696 數據集基于GPL6480 平 臺(Agilent-014850全人類基因組芯片4×44K G4112F)。所有數據在線免費獲取。
1.2 DEGs 數據處理 利用GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)在線分析工具篩選早期胃癌組織與正常胃組織的DEGs,以調整后的P 和|logFC|為篩選指標。調整后的P<0.05 且|logFC|≥1.0,則認為早期胃癌組織與正常胃組織存在DEGs,然后采用維恩圖(http://bioinformatics. psb. ugent.be/webtools/venn/)確定GSE3438、GSE55696 數據集的交集基因。
1.3 GO 功能注釋和KEGG 富集分析 利用生物學信息注釋數據庫DAVID(http://david.ncifcrf.gov/)對早期胃癌DEGs 進行GO 功能注釋和KEGG 富集分析[4]。其中,GO 功能注釋包括生物學過程、細胞學組分和生物學功能。
1.4 PPI構建和核心基因篩選 應用STRING在線數據庫(http://string-db. org),以medium confidence>0.4為條件構建DEGs 的PPI,并通過Cytoscape(http://www. cytoscape. org/)的CytoHubba 插件按基因節點的連接度篩選前6位核心基因。
1.5 核心基因表達與早期胃癌預后關系分析 應用在線分析工具Kaplan-Meier(http://kmplot. com/analysis/)中mRNA 胃癌數據庫評估核心基因對早期胃癌預后判斷的價值。以核心基因mRNA表達的最佳截斷值為臨界值,將早期胃癌患者分為高表達者與低表達者,比較不同表達者的總生存期(OS)。
1.6 統計學方法 計數資料比較采用χ2檢驗。生存分析采用Kaplan-Meier法。P<0.05為差異有統計學意義。
2.1 DEGs 篩選結果 經GEO2R 在線分析工具篩選GSE3438、GSE55696 兩個微陣列數據集,GSE3438 數據集含早期胃癌組織標本10 例份、正常胃組織標本10 例份,GSE55696 數據集含早期胃癌組織標本19 例份、正常胃組織標本19 例份。按P<0.05 且|logFC|≥1.0 標準,從GSE3438 數據集中篩選出DEGs 687 個,其中表達上調基因312 個、表達下調基因375 個;從GSE55696 數據集中篩選出DEGs 2 686 個,其中表達上調基因1 911個、表達下調基因775個。通過維恩圖分析獲得GSE3438、GSE55696數據集的DEGs交集(見圖1),結果在DEGs交集中共有30個基因,其中表達上調基因11個、表達下調基因19個。

圖1 GSE3438、GSE55696數據集中DEGs的維恩圖
2.2 DEGs 的GO 功能注釋和KEGG 富集分析結果 GO 功能注釋顯示,早期胃癌的DEGs 主要存在于細胞外外來體的細胞學組分,介導煙酰胺腺嘌呤二核苷酸(NAD)或煙酰胺腺嘌呤二核苷酸磷酸(NADP)為受體的氧化還原酶活性的生物學功能,參與細胞增殖調控的生物學過程。KEGG 富集分析顯示,DEGs主要參與糖酵解和糖異生以及細胞色素P450信號通路的調控。見表1。

表1 DEGs的GO富集分析和KEGG信號通路分析結果
2.3 PPI 構建和核心基因篩選結果 通過STRING構建DEGs 的PPI,并通過Cytoscape 的CytoHubba 插件按基因節點的連接度篩選前6 位核心基因,分別為CDKN2A(連接度為9)、ANXA2(連接度為8)、CTSB(連接度為7)、ATF3(連接度為6)、CD59(連接度為6)、CCND2(連接度為6)。見圖2。
2.4 早期胃癌不同核心基因表達患者OS比較 不同ANXA2、CTSB 表達與早期胃癌患者預后有關(P均<0.01),其余4 個核心基因(CDKN2A、ATF3、CD59、CCND2)表達與早期胃癌患者預后無關(P均>0.05)。見表2 及圖3、4。
早期胃癌可能無癥狀,或表現為消化不良、上腹部不適感等癥狀,但這些癥狀無特異性,亦可見于慢性胃炎、胃潰瘍等疾病,常常不被重視,待出現貧血、體質量減輕或伴有便血等并發癥狀就診時,病情已進展到中晚期,患者生活質量明顯降低、生存時間明顯縮短。因此,尋找一種便捷診斷早期胃癌的分子標志物具有重要意義。目前,以篩選差異表達分子和基于網絡的核心基因及生存分析為主要內容的生物信息學分析已被廣泛用于尋找與胃癌診斷、治療和預后相關的潛在生物標志物[5]。RONG 等[6]采用生物信息學方法篩選出與胃癌早期診斷相關的生物標志物,并可能有助于進一步評估胃癌患者預后。但鮮有報道通過生物信息學方法篩選與早期胃癌預后相關的核心基因。

圖2 DEGs的PPI示意圖

表2 早期胃癌不同核心基因表達患者OS比較

圖3 早期胃癌不同ANXA2表達患者生存曲線

圖4 早期胃癌不同CTSB表達患者生存曲線
本研究整合了GSE3438、GSE55696 兩個微陣列數據集,利用GEO2R 在線分析工具篩選出30 個共同DEGs,其中表達上調基因11個、表達下調基因19個。GO 功能注釋表明,早期胃癌的DEGs 主要存在于細胞外外來體的細胞學組分,介導以NAD 或NADP 為受體的氧化還原酶活性的生物學功能,參與細胞增殖調控的生物學過程。KEGG 富集分析顯示,DEGs 主要參與糖酵解和糖異生以及細胞色素P450 信號通路的調控。結果提示,這些DEGs 可能在早期胃癌的發生、發展中具有重要作用。
通過PPI的核心基因分析篩選出6個核心基因,分 別 為CDKN2A、ANXA2、CTSB、ATF3、CD59、CCND2。CDKN2A 能夠參與細胞周期調控、細胞分化和凋亡等生物學過程,該基因突變在胰腺導管癌中常見[7]。YANG 等[8]研究發現,CDKN2A 高表達不能預示脊索瘤患者預后不良。本研究結果發現,CDKN2A 表達與早期胃癌患者預后無關。ATF3是ATF/CREB 家族的轉錄因子,已被證實在乳腺上皮細胞癌變過程中發揮重要作用,ATF3過表達可抑制細胞周期G2/M 期阻滯,抑制細胞凋亡,提高克隆成活率[9]。結直腸癌患者血清ATF3 水平升高,ATF3 可能是結直腸癌診斷的潛在生物標志物[10]。CD59是一種膜結合的補體調節蛋白,該基因缺陷會加重DNA 損傷,阻礙細胞增殖,導致細胞周期G2/M期阻滯和細胞衰老。有研究發現,CD59高表達與接受放療的食管鱗癌患者OS 和無病生存期較短有關[11]。在肺癌和乳腺癌組織中存在CCND2 啟動子高甲基化狀態,而CCND2啟動子高甲基化是患者預后不良的一個獨立危險因素。研究表明,CCND2 過表達能夠抑制腫瘤細胞增殖和遷移,并促進其細胞凋亡[12]。本研究結果發現,雖然CDKN2A、ATF3、CD59 在早期胃癌組織與正常胃組織中存在差異表達,但其表達差異與早期胃癌預后無關,與以往研究結果并不一致[10-12]。
ANXA2是膜聯蛋白家族的一個重要成員,是一種鈣依賴性磷脂結合蛋白,可參與細胞骨架重排和纖溶酶原激活等生物學過程[13]。與癌旁正常組織比較,胃癌組織ANXA2表達上調,沉默ANXA2可導致胃癌細胞增殖、侵襲和遷移能力減弱[14]。在肝癌組織中ANXA2高表達,其高表達能夠通過調節肌動蛋白重構,促進肝癌細胞的侵襲和遷移;ANXA2 高表達與肝癌肝內轉移、門靜脈血栓形成等顯著相關,生存分析發現ANXA2 高表達者預后較差[15-16]。本研究結果顯示,ANXA2 在早期胃癌組織中高表達,并且ANXA2 高表達者OS 明顯高于ANXA2 低表達者,與ZHANG等[15]研究結果并不一致。CTSB是半胱氨酸蛋白酶家族成員之一,在蛋白質降解和加工過程中發揮重要作用[17]。CTSB 在多種惡性腫瘤組織中高表達,可作為一種促癌基因,參與腫瘤的發生、發展[18]。由于CTSB 蛋白在自噬相關事件中發揮關鍵性作用,其表達調控引起人們廣泛關注。本研究結果發現,CTSB 在早期胃癌組織中低表達,并且CTSB低表達者OS 明顯高于CTSB 高表達者。因此,ANXA2、CTSB 可作為預測早期胃癌患者預后的生物標志物。
總之,在早期胃癌組織中存在多種DEGs,如CDKN2A、ANXA2、CTSB、ATF3、CD59、CCND2等,其中ANXA2、CTSB 表達變化可能與早期胃癌患者預后有關。這為早期胃癌的預后判斷提供了新的視角,但這些DEGs 在胃癌發生、發展中的具體分子機制仍不清楚,尚需進一步研究。