丁志祥 史兵偉 王永仿 葛 賢 劉 遷
(南京中醫藥大學附屬常州市中醫醫院檢驗科,常州 213003)
2019年癌癥統計數據顯示消化系統腫瘤新增病例數和死亡人數均位居第一,而結腸癌(colon cancer,CC)新增病例數和死亡人數均位居消化系統榜首,其新增病例數遠高于其他消化系統腫瘤[1]。在中國,結直腸癌的發病率與死亡率也位居前列,嚴重威脅公眾的健康并給社會帶來沉重的經濟負擔[2]。CC的發病機制還不甚清楚,目前普遍認為其與遺傳、飲食、炎癥、免疫、腸道微生態等多種因素有關[3]。CC的治療方法主要包括手術、放化療和靶向藥物治療等,隨著技術的創新及新靶向藥物的應用,較大地改善了CC患者預后,但對于進展期CC總體療效欠佳,許多患者對放化療及靶向藥物治療產生抗性。因此,尋找更加有效的靶點基因對于優化CC患者的治療方案及改善預后至關重要。本研究通過生物信息學方法篩選CC差異表達基因,并對差異表達基因進行基因本體(gene ontology,GO)分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)分析,進一步構建蛋白相互作用(protein-protein interaction,PPI)網絡,篩選出與CC發生密切相關的樞紐基因(hub gene),為CC的分子機制和靶點研究提供理論依據。
1.1數據來源 從美國國立生物技術信息中心的GEO數據庫(http://www.ncbi.nlm.gov/gds)中通過檢索“colon cancer”篩選出GSE41258、GSE41328和GSE44861 3組芯片,GSE41258數據集包含36例CC及癌旁配對組織,GSE41328包含5例CC及其癌旁配對組織,GSE44861數據集包含56例CC及55例癌旁組織,3組芯片數據集分別于GPL96、GPL570和GPL3921平臺測得。
1.2方法
1.2.1差異基因篩選 對3組芯片數據進行GEO2R在線分析,篩選條件包括P<0.05和|logFC|>1,分別得到3組芯片相應的差異基因。獲得的差異基因通過在線網頁工具(http://bioinformatics.psb.ugent.be/webtools/Venn/)繪制韋恩圖獲取3組芯片差異基因的交集。
1.2.2GO和KEGG富集分析 利用生物學信息注釋數據庫DAVID(http://dabid.ncifcrf.gov/)對3組芯片差異基因的交集進行GO富集分析和KEGG通路富集分析,分析差異基因主要參與的生物學過程以及主要涉及的腫瘤相關通路,以P<0.01為入選標準。
1.2.3PPI網絡構建及Hub基因的篩選 應用STRING在線數據庫(http://string-db.org)對差異基因進行PPI網絡分析,然后將網絡導入Cytoscape 3.6.1(http://www.cytoscape.org/)軟件可視化,通過cytoHubba插件篩選hub基因。
1.2.4Hub基因的表達驗證及CC患者生存分析 采用GEPIA數據庫(http://gepia.cancer-pku.cn/index.html)驗證篩選出的hub基因在CC組織和正常組織中的表達,同時采用生存分析評價hub基因在CC患者預后中的價值。
2.1CC差異表達基因的篩選 3組芯片數據分別得到733、678和411個差異基因。利用韋恩圖獲取3個數據集表達差異基因的交集,得到共表達差異基因142個,其中上調基因67個,下調基因75個,見圖1。
2.2CC差異基因GO富集分析 利用DAVID數據庫對142個差異表達基因進行GO富集分析發現,差異基因在細胞組成主要富集于胞外區、細胞外隙、蛋白質細胞外基質及膠原蛋白三聚體,生物過程主要富集于細胞黏附、細胞外基質形成、膠原蛋白分解代謝過程、骨骼系統生長、骨化作用、膠原原纖維形成,分子功能主要富集于細胞外基質結構形成及趨化因子受體結合,見圖2。

圖1 CC組織3組芯片差異表達基因篩選Fig.1 Screening of differentially expressed genes in 3 datasets of CC tissues

圖2 CC組織差異基因GO富集分析Fig.2 GO enrichment analysis of differentially expressed genes of CC tissues
2.3CC差異基因KEGG信號通路分析 利用DAVID數據庫對142個差異表達基因進行KEGG通路富集分析發現,差異基因主要富集于PI3K-AKT信號通路、細胞因子與細胞因子受體相互作用、癌癥通路、局部黏附等通路,見圖3。
2.4CC差異基因的PPI分析及hub基因篩選 應用STRING數據庫對142個CC差異基因進行PPI分析,應用Cytoscape將蛋白網絡可視化,cytoHubba插件根據節點數篩選出前10個hub基因,包括CCND1、COL1A1、COL1A2、CXCL1、CXCL8、CXCL12、MMP1、MMP3、MYC和SPP1,顏色越紅代表節點數越多,見圖4。
2.5結腸腺癌組織和正常組織中hub基因表達的驗證 應用TCGA數據庫在線分析工具GEPIA 對hub基因在結腸腺癌中的表達進行驗證,發現 CCND1、COL1A1、COL1A2、CXCL1、CXCL8、MMP1、MMP3、MYC和SPP1在結腸腺癌組織中表達增高,而CXCL12在癌組織中表達降低,差異有統計學意義(P<0.01),見圖5。

圖3 CC差異基因KEGG信號通路密集分析Fig.3 KEGG pathway enrichment analysis of differentially expressed genes of CC

圖4 142個差異基因PPI分析及hub基因篩選Fig.4 PPI of 142 differen-tially expressed genes and screening of hub genes
2.6hub基因與結腸腺癌患者預后的關系 10個hub基因中COL1A2高表達與結腸腺癌總生存率呈負相關(P<0.05),COL1A1和COL1A2高表達均與結腸腺癌DFS呈負相關(P<0.05),其余差異無統計學意義,見圖6。

圖5 hub基因在結腸腺癌和正常腸組織表達水平的驗證Fig.5 Validation of expression levels of hub genes in colon adenocarcinoma tissues and normal colon tissues

圖6 hub基因表達與結腸腺癌預后的生存地圖及生存曲線Fig.6 Prognostic survival map and curves of hub genes expression in colon adenocarcinoma
本研究通過分析GSE41258、GSE41328和GSE44861芯片數據集得到共表達差異基因142個,其中上調基因67個,下調基因75個。通過GO分析發現差異基因在細胞組成中主要富集于胞外區、細胞外隙、蛋白質細胞外基質及膠原蛋白三聚體,生物過程主要富集于細胞黏附、細胞外基質形成、膠原蛋白分解代謝過程、骨骼系統生長、骨化作用、膠原原纖維形成,分子功能主要富集于細胞外基質結構形成及趨化因子受體結合。KEGG分析發現差異基因主要富集于PI3K-AKT信號通路、細胞因子與細胞因子受體相互作用、癌癥通路、局部黏附等信號通路。通過PPI分析篩選得到10個hub基因,包括CCND1、COL1A1、COL1A2、CXCL1、CXCL8、CXCL12、MMP1、MMP3、MYC和SPP1。驗證上述hub基因發現CCND1、COL1A1、COL1A2、CXCL1、CXCL8、MMP1、MMP3、MYC和SPP1在CC中表達增高,而CXCL12在CC中表達降低。
在篩選出的hub基因中,CCND1和MYC與細胞周期、細胞增殖密切相關。CCND1是一個重要的細胞周期調節因子,協同細胞周期蛋白依賴性激酶4和6,調節細胞周期從G1期向S期轉變[4]。近期研究發現,CCND1可參與不同通路,通過調節細胞周期及腫瘤增殖參與結直腸癌的發生發展,同時在藥物抵抗中也發揮作用[5-7]。轉錄因子MYC是一種普遍存在的致癌基因,可誘導脂肪酸、氨基酸和核苷酸攝取和合成所需基因的轉錄,為細胞持續增殖提供物質基礎,是腫瘤代謝重編譯的主要驅動因素[8]。研究發現,MYC不僅可參與結直腸癌整體代謝的調節,還可通過誘導LEF1激活WNT通路促進結腸癌細胞增殖分化,另外MYC可通過驅動致癌基因HOXB8增強結直腸癌的侵襲性[9-11]。SPP1又稱骨橋蛋白,是一種重要的細胞外基質蛋白,參與多種病理生理過程,包括腫瘤的侵襲和轉移。研究發現,SPP1在結直腸組織中高表達,與結直腸癌預后密切相關,可通過激活EMT通路促進結直腸癌的轉移,有望成為結直腸癌治療的新靶點[12-13]。基質金屬蛋白酶包括MMP1和MMP3,在多種腫瘤組織中高表達,在腫瘤進展及侵襲轉移中發揮重要作用[14]。近期研究發現,一些中藥組分在結直腸癌中可通過不同機制下調MMP1和MMP3的表達從而抑制腫瘤細胞增殖和侵襲[15-16]。
趨化因子是一類分子量低、具有趨化效應的細胞因子,可分為C、CC、CXC和CX3C 4個亞家族,在調節免疫細胞運輸和淋巴組織發育中發揮重要作用。在腫瘤微環境中,趨化因子可由腫瘤細胞和包括免疫細胞和基質細胞在內的其他細胞表達,在特定趨化因子的作用下,不同免疫細胞亞群遷移至腫瘤微環境,共同參與腫瘤及微環境免疫應答;此外,趨化因子可直接作用于腫瘤微環境中的非免疫細胞,包括腫瘤細胞和血管內皮細胞,調節腫瘤細胞增殖、腫瘤干細胞樣特性及腫瘤侵襲和轉移[17]。HSU等[18]研究發現,腫瘤相關樹突狀細胞可通過CXCL1促進CC細胞增殖,增強CC中干細胞特性,并通過增強細胞遷移、MMP7的表達和EMT提升CC的侵襲轉移能力。研究發現,CXCL8可通過NF-κB/PI3K/AKT信號軸誘導EMT,促進CC細胞增殖、遷移和侵襲[19]。通過阻斷CXCL8或其受體CXCR1,對CC體外增殖和血管生成均有顯著的抑制作用,致瘤性顯著降低[20]。CXCL12可靶向血管內皮細胞,與VEGF協同促進腫瘤血管新生,并可通過多種通路促進CC細胞的增殖及侵襲[17,21-22]。令人疑惑的是,CXCL12在CC組織中表達并未增高。MOUSAVI等[23]和YOSHUANTARI等[24]研究發現,CXCL12在CC組織與正常組織表達中無差異。本研究顯示,CXCL12在結腸腺癌組織中的表達顯著低于正常組織,與KHEIRELSEID等[25]的研究結果一致。因此,關于CXCL12在CC及其微環境中的作用有待進一步研究。
COL1A1和COL1A2均屬于膠原蛋白家族,是細胞外基質的重要組成部分。而細胞外基質作為腫瘤微環境的組成部分,在腫瘤的發生發展及轉移過程中發揮重要作用。研究發現,COL1A1可通過調節WNT通路促進CC轉移,并有望成為CC治療的潛在靶點[26-27]。 目前關于COL1A2在CC中的作用仍存在爭議。YU等[28]研究發現,COL1A2對CC細胞的增殖、遷移及侵襲具有抑制作用,而ZHU等[29]研究發現,COL1A2可增強CC細胞的生存及遷移,促進EMT進程。本研究生存分析顯示COL1A2高表達與結腸腺癌總生存率呈負相關,COL1A1和COL1A2高表達均與結腸腺癌DFS呈負相關。ZHOU等[30]選取了與本研究不同的3組CC芯片作為研究對象,同樣發現COL1A1和COL1A2與CC的預后密切相關。
綜上所述,本研究通過對CC及癌旁組織的差異表達基因分析發現CCND1、COL1A1、COL1A2、CXCL1、CXCL8、CXCL12、MMP1、MMP3、MYC和SPP1 10個與CC相關的hub基因及2個預后相關基因COL1A1和COL1A2,為CC的分子機制研究及預后判斷提供了新靶點。