楊嬋君,陳雯恬,劉 靜
(1.汕頭大學醫學院第二附屬醫院輸血科,廣東汕頭 515041;2.汕頭大學醫學院長江學者實驗室/廣東省乳腺癌診療重點實驗室/生理學教研室,廣東 汕頭 515041)
根據《2020年癌癥統計》的報告,惡性腫瘤是全球主要的公共衛生問題之一,已成為僅次于心腦血管疾病的非傳染性疾病死亡原因。在各種惡性腫瘤中,胃癌是全球范圍內癌癥死亡的第3大原因。每年約有72萬人死于胃癌,70%的確診病例發生在發展中國家,尤其是在東亞。目前,胃癌的診斷技術包括內鏡檢查、影像學檢查、病理組織學檢查及腫瘤標志物檢測等,手術聯合化療和放療是胃癌患者的主要治療方法。然而,由于缺乏特異性標志物,胃癌的早期診斷率非常低,2/3的胃癌患者確診時已是晚期。更糟糕的是,有轉移的胃癌患者的5年生存率只有20%~30%。因此,迫切需要尋找特異性高的生物標志物,用于胃癌的篩查、早期診斷和治療。本研究擬利用GEO數據庫篩選胃癌組織與正常組織的差異表達基因(differentially expressed genes,DEGs),并使用相關生物信息學軟件和方法識別出潛在的關鍵基因,以期發現可用于胃癌的診斷、預后判斷和治療的新的生物標志物。
P
≤0.05。使用在線韋恩圖工具(http://bioinformatics.psb.ugent.be/webtools/Venn/)對從每個數據集中獲得的結果進行計算和圖形重疊,得出胃癌中的DEGs。P
<0.05。為了探索胃癌的潛在分子機制,本研究利用STRING數據庫(http://string-db.org/)預測DEGs的蛋白質-蛋白質相互作用(protein-protein interactions,PPIs),并用Cytoscape軟件及其cytoHubba插件計算了蛋白質間的相互作用系數得分(hub score)。Hub score>1 000的基因被鑒定為胃癌中的核心基因,在PPIs網絡中具有高連通性。
miRNAs在胃癌中的功能因其調節通路的不同而不同。使用miRBD(http://mirdb.org)在線分析工具預測核心基因相關的miRNA,并用Cytoscape軟件繪制miRNA靶向調控網絡圖。
為了評價和驗證核心基因在胃癌中的生物學意義,本研究使用The Human Protein Atlas工具(https://www.proteinatlas.org)分析核心蛋白在胃癌組織和正常組織中的表達及定位情況;使用Oncomine數據庫(https://www.oncomine.org/resource/main.html)在 線 分 析工具對核心蛋白mRNA表達水平在正常組織和胃癌組織中的表達差異進行分析;使用UALCAN數據庫(http://ualcan.path.uab.edu)分析核心基因在不同種族胃癌患者中的表達情況。
為了評估核心基因在胃癌患者中的預后價值,使用Kaplan-Meier數據庫(http://kmplot.com/analysis)分析核心基因對胃癌患者生存的影響。
在GEO數據庫獲得GSE65801、GSE79973和GSE118916等3個胃癌基因表達數據集,火山圖(圖1A~C)顯示,大多數基因的表達無明顯改變,少數基因表達水平發生了顯著變化,這可能是胃癌發生發展的關鍵因素。圖1中D~F的聚類熱圖顯示出了核心基因表達的顯著變化,有助于區分胃癌組織和正常組織。
P
≤0.05且差異倍數|logFC|≥2進行篩選;分別篩選GSE65801、GSE79973和GSE118916的上調和下調基因,在線繪制韋恩圖,獲得了25個上調差異表達基因和85個下調差異表達基因(圖1G~I)。
圖1 數據集的基因表達模式及胃癌組織中3個DEGs
生物過程功能富集分析發現DEGs主要富集于消化、骨骼系統發育和膠原纖維組織(圖2A);細胞組分功能富集分析主要涉及膠原蛋白、纖維膠原蛋白、胞外區、細胞外基質部分,以及蛋白質類細胞外基質(圖2B);分子功能分析顯示其與細胞外基質結構成分顯著相關(圖2C);根據KEGG分析,DEGs主要富集于細胞外基質受體相互作用和局部黏附(圖2D)。

圖2 通過GO和KEGG通路對DEGs的功能富集分析
為了進一步分析胃癌中DEGs之間的相關性,構建了PPIs網絡并計算了蛋白與其他蛋白間相互作用分數,揭示了所識別DEGs之間的密切關系。蛋白間相互作用分數高(hub score>1 000)的DEGs與其他DEGs具有較強的相關性,被認為是胃癌中的核心基因,即COL1A1、COL1A2、COL12A1、COL6A3、COL2A1和COL10A1。所有的核心基因都屬于膠原家族成員,與細胞外基質的調控密切相關(圖3)。

圖3 蛋白-蛋白互作網絡(PPIs)與hub評分
在miRDB數據庫預測miRNAs調控核心基因的基礎上,進一步篩選出得分大于80的miRNA。通過Cytoscape軟件構建了miRNA-mRNA網絡,表明屬于miR-29s家族的hsa-miR-29a-3p、hsa-miR-29b-3p和hsa-miR-29c-3p可以同時調控多個核心基因(圖4)。

圖4 核心基因的miRNA-mRNA網絡
P
<0.05,見圖5)。
圖5 核心基因在正常組織和胃癌組織中的表達差異
由于胃癌在不同種族人群中的發病率不同,我們進一步利用TCGA數據庫分析核心基因mRNA在胃癌組織中的表達情況,發現不同種族的胃癌患者中COL1A1、COL1A2和COL10A1的表達均高于正常胃組織(均為P
<0.05,圖6A、B和F)。除非洲裔美國人外,與正常胃組織相比,白種人和亞洲人胃癌患者COL12A1和COL6A3的表達增加(P
<0.05,圖6C和D)。在不同種族背景的胃癌患者中未發現COL2A1的異常表達(圖6E)。
圖6 TCGA數據庫中不同民族胃癌患者hub基因表達的差異
除了核心基因的mRNA水平外,人類蛋白質圖譜Human Atlas也提供了不同組織中相關蛋白的表達情況。典型圖片提示,與正常胃組織相比,胃癌組織中COL1A1和COL12A1的蛋白表達水平升高(圖7),而其他核心基因在胃癌和正常胃組織之間蛋白表達未見顯著差異。

圖7 胃癌和正常胃組織中核心基因的蛋白表達水平
P
<0.05)。相反,核心基因mRNA低表達的胃癌患者生存期較長(圖8)。
圖8 核心基因表達情況對胃癌患者生存期的影響
胃癌作為臨床常見的惡性腫瘤,其發病具有明顯的地域差異性,我國東部沿海和西北部地區的發病率明顯高于南方地區。盡管在過去的一個世紀里發現胃癌的發病率有所下降,但在我國它仍居男性常見癌癥第2位,女性常見癌癥第5位。因此,揭示胃癌發生發展的機制,挖掘可用于胃癌診斷、治療和預后判斷的特異性生物標志物尤為重要。隨著高通量技術的發展和普及,以及多種生物信息學工具的開發,極大地促進了基因圖譜的研究,為胃癌患者的早期篩查和臨床治療提供了顯著的優勢。
為了探索胃癌患者的潛在生物標志物,本研究利用3個基因芯片數據集,建立了胃癌組織和正常組織的基因表達譜。GO功能富集分析和KEGG通路分析表明,COL1A1、COL1A2、COL12A1、COL6A3、COL2A1和COL10A1等膠原蛋白基因在細胞外基質相關功能或通路中富集。人們普遍認為,細胞外基質(extracellular matrix,ECM)重構的穩態,即受損分子或舊分子在降解的同時被新分子替換,是維持組織穩態的關鍵過程。ECM的組成和數量的改變對腫瘤和基質細胞的性質有很大的影響,這些改變會激活下游信號,從而調節細胞行為,促進腫瘤的進展。
據報道,相關研究發現ECM在惡性腫瘤中通常是失調的,并參與惡性細胞增殖、黏附、遷移、血管生成和藥物代謝。膠原蛋白基因參與腫瘤ECM與受體的相互作用和局灶性黏附途徑,在腫瘤的侵襲、轉移過程中擔任著重要的角色。大多數的研究表明,膠原蛋白基因的高表達促進了癌細胞的增殖和腫瘤的發生。Liu等發現,COL1A1在宮頸癌組織中的表達水平顯著增加,并抑制了輻射誘導的宮頸癌細胞凋亡,而COL5A1的過度表達誘導了肺癌的轉移。COL1A1在結直腸癌中高表達,是一種潛在的診斷性生物標志物和治療靶點。COL3A1和POSTN在食管癌中高表達,與病理分期呈正相關,可能在食管癌的發生和發展中起重要作用。而COL12A1在結腸直腸癌中高表達,提示預后不良,可作為其預后的生物標志物。COL1A2
、COL6A3
和THBS2
基因沉默可通過PI3K-Akt信號通路抑制胃癌細胞增殖、遷移和侵襲,同時促進細胞凋亡。I型膠原還破壞細胞間鈣黏蛋白,增加胰腺癌細胞的遷移,破壞PTHrP、IL-6和IL-8的表達。本研究發現COL1A1、COL1A2和COL6A3在胃癌組織中的表達顯著高于正常胃組織,而生存結果分析顯示COL1A1和COL6A3高表達與預后不良相關。對不同種族的基因表達分析和生存分析顯示,COL1A1、COL1A2和COL6A3在不同種族胃癌中表達均上調。盡管COL2A1在GEO數據集中顯著上調,但在腫瘤數據庫中,COL2A1在胃癌和正常組織之間的表達無顯著差異。功能富集分析表明,COL2A1可能在腫瘤細胞外基質與受體的相互作用和局灶性黏附過程中起作用。提示COL2A1可能是一個新的潛在診斷胃癌的生物標志物和治療靶點。
如上文所述,膠原蛋白是腫瘤細胞外基質的主要成分,因此在胃癌組織中發現了多種不同膠原蛋白類型。Sun證實了與正常組織相比,COL1A1在胃癌中表達上調,表明其在胃癌細胞侵襲和轉移中發揮了重要作用。Guo等進一步發現COL1A1過表達可誘導TGF-β信號通路激活,促進胃癌細胞增殖和遷移。為了探討胃癌發生、發展和多樣性的潛在機制,Hippo等在22例原發性人類晚期胃癌組織和8例正常組織中進行了高密度寡核苷酸芯片研究,揭示了一些基因在癌組織中高表達,即與細胞周期、生長因子、細胞運動、細胞黏附和基質重塑等相關的基因。在異常表達的基因中,發現胃癌組織中膠原降解增加,而膠原降解是腫瘤細胞侵襲周圍組織的重要步驟。Yasui等報道COL1A1和COL1A2是胃癌的新生標記物,因為它們在胃癌中普遍過表達,與侵襲和轉移相關。此外,一項基于Oncomine數據庫的分析發現,在mRNA轉錄水平上,與正常胃組織相比,COL1A2
基因在胃癌組織中高表達;進行在線生存分析發現,與COL1A2
基因低表達組相比,高表達組的胃癌患者總體生存期降低;進一步分析發現,COL1A2
基因高表達的腸型、彌漫型胃癌患者總體生存期降低。膠原蛋白家族的另一成員COL10A1受miR-26a-5p調控,并在胃癌細胞中高表達,以促進癌細胞的增殖、遷移和侵襲。Jiang等通過定量PCR和免疫組織化學檢測,發現COL12A1在胃癌組織中表達增加,與腫瘤侵襲、轉移和臨床晚期顯著相關。重要的是,COL12A1表達增加導致總生存率降低,多變量Cox分析表明COL12A1高表達是胃癌患者一個強有力的獨立預后指標。敲低胃癌細胞SGC-7901中COL12A1的表達水平后,細胞的生長和增殖能力被顯著抑制,細胞的侵襲能力也顯著降低,表明COL12A1具有促進細胞生長和侵襲能力的效應,提示其可能在胃癌的生長和侵襲轉移中發揮了重要作用。另外,miR-29被認為是多種惡性腫瘤的抑 癌基因。Qi等通過Meta分析評估了miR-49在多種人類惡性腫瘤中的預后價值,并指出miR-29的低表達與惡性腫瘤的侵襲性和預后不良有關,可能成為預測人類惡性腫瘤復發和進展的關鍵生物標志物。Cushing等報道了miR-29通過抑制ECM,包括膠原蛋白,以及調節膠原合成、交聯和降解的酶發揮作用。為了證實miR-29a在癌細胞增殖和侵襲中的功能作用,Muniyappa等對人工改變miR-29a表達的細胞進行了2D-DIGE蛋白質組學分析,發現了幾種候選蛋白,包括RAS癌基因家族成員RAN
,顯著降低了癌細胞的侵襲能力。核糖體蛋白S15a(RPS15A)被證實通過激活Akt/IKK-β/NF-κB信號通路促進胃癌的進展,并且通過沉默RPS15A抑制胃癌細胞的增殖和遷移。Zhang等發現miR-29s直接結合到RPS15A的3′-UTR,并通過抑制肝細胞中RPS15A的表達抑制細胞生長和細胞周期。An等發現miR-29a-3p可以結合到COL1A1并抑制其蛋白表達,并證實了circKRT7通過EMT途徑吸收miR-29a-3p,可促進卵巢癌細胞的增殖和轉移。在本研究中,miR-29s被認為是多種膠原基因的調節因子,可能在胃癌的發生發展中起到癌基因的作用。miR-29-3p在鼻咽癌細胞中直接結合和調節COL1A1,被證實介導癌細胞的放射敏感性。在結直腸癌中,干擾素-γ通過將干擾素調節因子1(interferon regulatory factor 1,IRF-1)吸引到miR-29b啟動子區域的結合位點來增加miR-29b的表達水平,并且miR-29b增加了IRF-1的表達,形成了一個正的IRF1/miR-29b反饋環。此外,IGF1被證實為miR-29b的靶點,而IGF1是PI3K/Akt信號通路的激活因子,miR-29b可通過阻斷PI3K/Akt信號通路從而抑制結直腸癌細胞生長和侵襲。Wang等證實了miR-29b對肺動脈平滑肌細胞膠原Ⅰ合成的調節作用,預測了miR-29s在ECM膠原沉積中的重要作用。此外,Yu等研究發現,miR-29c在胃癌組織和細胞系中下調,miR-29c過表達可抑制細胞增殖,促進細胞凋亡,阻滯G1/G0期細胞周期。van Rooij等發現miR-29是一群編碼纖維化相關蛋白(如膠原蛋白、纖維蛋白和彈性蛋白)的miRNAs,上調miR-29的表達可以降低體內外膠原蛋白的表達。在腫瘤微環境中,miR-29可能通過不同的分子生物學過程參與膠原蛋白的調控。然而,目前miR-29家族的研究尚在初級階段,其在腫瘤學研究中的意義有待挖掘,miR-29家族與膠原蛋白家族的相互調控機制尚需進一步闡明。
綜上所述,本研究在胃癌組織中發現了一組膠原基因,其在胃癌組織中高表達,與胃癌患者的預后密切相關,在胃癌中具有潛在診斷作用,可作為新的治療靶點,且其表達和相關生物學過程可能受miR-29s的調控。