向 琳,宮美恒,王 蘋,尹萬忠,杜 波
(吉林大學第一醫院 耳鼻咽喉頭頸外科,吉林 長春130021)
頭頸部鱗狀細胞癌相關基因的生物信息學分析
向 琳,宮美恒,王 蘋,尹萬忠,杜 波*
(吉林大學第一醫院 耳鼻咽喉頭頸外科,吉林 長春130021)
目的 從基因和分子水平探討頭頸部鱗狀細胞癌(head and neck squamous cell carcinoma,HNSCC)的發生機制。方法 從GEO數據庫下載人HNSCC相關基因芯片數據,使用BRB-Array Tools軟件篩選差異表達基因,采用DAVID、 ToppGene、STRING、Cytoscape工具進行生物信息學分析。結果 BRB分析共篩選出263條差異表達基因,其中上調基因134個,下調基因共129個,對其進行生物信息學分析發現COL1A1、MMP9、COL1A2、COL3A1、MMP1等基因調節HNSCC細胞外基質受體相互作用、小細胞肺癌、腫瘤通路等,影響腫瘤的發生發展。結論 利用生物信息學分析能有效挖掘基因芯片內在數據,為進一步探討HNSCC的發生機制提供理論參考。
頭頸部鱗狀細胞癌;差異表達基因;基因芯片;生物信息學
(ChinJLabDiagn,2017,21:0381)
頭頸部鱗狀細胞癌(head and neck squamous cell carcinoma,HNSCC)全球每年大約有500,000例新發患者[1],新發病例死亡率約為20%[2],尤其是鼻咽癌和下咽癌的死亡率更高[3]。HNSCC給患者及其家庭帶來沉重的生活負擔[4]。目前,頭頸部鱗狀細胞癌的分子機制仍不清楚,從基因水平研究HNSCC的發生發展,對其預防和治療具有重要意義。分子生物技術、多學科評估和準確分期可能在未來診斷和治療HNSCC方面發揮重要作用[5]。生物信息學是一門交叉學科,通過聚類分析、通路分析等各種方法篩選大規模基因芯片數據,挖掘出潛在的重要分子,理論上探討疾病的發病機制。本文采用BRB-Array Tools軟件篩選HNSCC差異表達基因,聯合其他生物信息學分析工具和數據庫,從基因和分子水平探討頭頸部鱗狀細胞癌的發生機制。
1.1 材料 人頭頸部鱗狀細胞癌和正常組織基因芯片數據來源于GEO database數據庫(http://www.ncbi.nlm.nih.gov/gds/),登錄號為GSE29330和GSE6631。GSE29330由Demokan等[6]提交,研究中包括13例HNSCC標本和5例正常組織標本,芯片平臺采用Affymetrix GPL570(HG-U133_Plus_2)。GSE6631由Kuriakose等[7]提交,采用Affymetrix GPL8300(HG_U95Av2)芯片平臺,研究包括22例HNSCC標本并配對22例正常組織標本。
1.2 數據篩選與過濾 使用BRB-Array Tools(v4.5.0 stable)軟件(http://linus.nci.nih.gov/BRB-ArrayTools/download.html)的MAS5.0解析方法進行數據處理。點樣篩選的排除標準為直徑小于10的點樣,數據標準化采用中位值法,基因篩選排除標準為:樣本表達中位值至少改變3倍以上,并且這種改變不少于20%樣本數,數據缺失不超過50%。
1.3 統計學方法 相同實驗對象基因差異表達分析采用配對t檢驗(隨機方差模型),不同試驗對象基因差異表達分析采用獨立樣本t檢驗,顯著性水平為0.001,假陽性率為10%。
1.4 GO分析和KEGG通路分析 采用DAVID(v6.7)(https://david.ncifcrf.gov/home.jsp)在線工具對差異表達基因進行GO本體分析和KEGG通路分析,顯著性水平為0.01。
1.5 共表達分析 使用ToppGene(https://toppgene.cchmc.org/)在線工具對差異表達基因進行共表達分析,顯著性水平為0.01。
1.6 蛋白互作用網絡 采用STRING(v10.0)(http://string-db.org/)在線分析工具繪制差異表達基因編碼蛋白質互作用網絡,將數據導入Cytoscape(v3.3.0)軟件計算網絡拓撲特性。
2.1 差異表達基因篩選 采用BRB-Array Tools對GSE29330和GSE6631進行分析后結果顯示:GSE29330數據中共篩選出258 個差異表達基因,其中上調144個,下調114個(表1)。其中31條基因注釋不完整,利用現有數據庫http://www.genecards.org/、http://www.ebi.ac.uk/和http://www.ncbi.nlm.nih.gov/gene/搜索相關基因信息后,對21條基因進行了重新注釋,另外10條基因注釋未知,基因符合未能確定。GSE6631數據中共 93個差異表達基因,其中上調46個,下調47個(表1)。Venny工具去除重復和注釋未知的基因后共獲得263條差異表達基因,其中上調134個,下調129個。

表1 人頭頸部鱗狀細胞癌差異表達基因(部分)
2.2 GO分析 采用DAVID對263條差異表達基因進行GO分析,結果顯示差異表達的基因主要分布在細胞外、質膜,參與多細胞生物過程、發育過程,發揮蛋白結合、鈣離子結合、受體結合、結構活性分子等功能(表2)。

表2 差異表達基因的GO分析
2.3 KEGG通路分析 采用DAVID對263條差異表達基因進行KEGG通路分析,差異表達基因主要參與細胞外基質受體相互作用、黏合斑、小細胞肺癌、腫瘤通路、細胞因子-細胞因子受體相互作用、細胞色素P450外源性物質代謝、藥物代謝、視黃醇代謝和糖酵解途徑等通路(表3)。

表3 差異表達基因的KEGG通路分析
2.4 共表達分析 使用ToppGene在線工具對差異表達基因進行共表達分析,結果顯示這些差異表達基因主要集中在早期人頭頸部鱗狀細胞癌上調和下調功能基因中(表4)。

表4 差異表達基因的共表達分析
2.5 蛋白互作用圖 使用STRING在線軟件繪制差異表達基因蛋白質互作用圖,可見COL1A1、MMP9、COL1A2、COL3A1等處于中心地位,刪除這些關鍵節點后,蛋白互作用網絡結構渙散(圖1)。將STRING繪制的蛋白質互作用數據導入Cytoscape軟件中,去除連接渙散的部分節點后,利用network analysis計算網絡拓撲特性。結果顯示互作用網絡中共有120個節點,320條邊;最小度值為1,最大度值29,平均度值5.333±6.067;平均中介中間性為0.023,平均接近中心性為0.287。按照度值≥均數+1SD,中介中間性≥其平均值,接近中心性≥其平均值篩選核心節點,共篩選出COL1A1、MMP9、COL1A2等16個核心蛋白(圖2,表5)。
頭頸部腫瘤約占所有惡性腫瘤的3%,其中90%是鱗狀細胞癌[4]。目前HNSCC的發病機制仍不清楚,涉及多個基因、多條通路,呈現出復雜的生物學行為。基因芯片由于其高通量、快速檢測的特點在基因表達譜分析、基因測序、疾病診斷等方面發揮著重要作用,生物信息學就是通過各種分析處理數據的方法,挖掘基因芯片數據的內在信息。
本研究通過生物信息學方法對基因芯片數據進行挖掘,發現263條差異表達基因,涉及多條作用通路,參與HNSCC的上調和下調。共發現16個關鍵作用基因,其中關于COL3A1的研究較少,最新一篇發表在PLoS One的研究證實PDGFRβ是口腔鱗狀細胞癌新的腫瘤標志物。膠原相關基因COL1A1、COL1A2和COL3A1在口腔鱗狀細胞癌相關成纖維細胞中高表達[8]。COL1A1、COL1A2和COL3A1參與細胞外基質受體相互作用通路和黏合斑。研究發現ECM受體相互作用和黏合斑在口腔鱗狀細胞癌被顯著激活[9]。細胞粘附是二者發揮作用的基礎[10],細胞和細胞外基質粘附在腫瘤的發生中起到顯著作用[11]。通過細胞粘附細胞與細胞外基質相互作用促進腫瘤的發生發展。ITGA2 是一種I型膠原受體,它通過激活NF-κB配體表達明顯抑制細胞粘附,抑制細胞凋亡,促進頭頸部鱗狀細胞癌發生[12]。NF-κB配體激活誘導HNSCC上皮間質轉化和血管生成,與腫瘤分化程度相關[13]。I型膠原可能通過NF-κB促進腫瘤細胞生成。本研究發現FN1涉及細胞外基質受體相互作用、黏合斑、小細胞肺癌、腫瘤通路4條通路。Yen等[14]研究發現FN1可能是評價口腔鱗狀細胞癌預后的標志物,其靈敏度/特異性可達80%/84%。FN1能使FAK磷酸化導致VEGF-C高表達,通過下游信號分子活化口腔鱗狀細胞癌淋巴結轉移[15]。本研究發現COL4A1在HNSCC組織中高表達,Tanaka等[16]研究發現COL4A1的差異表達還與癌細胞侵襲能力相關。Kwon等[17]研究發現上調ITGA6的表達能促進腫瘤細胞增殖、侵襲和集落形成。本研究中,相關基因上調激活細胞外基質受體相互作用等細胞通路,促進腫瘤的發生發展。

圖1 差異表達基因蛋白互作用圖

圖2 蛋白互作用圖中的核心節點
表5 核心蛋白列表

GenesDegreeBetweennessCentralityClosenessCentralityCOL1A1290.075922560.40753425MMP9270.186480270.43911439COL1A2250.03926630.39144737COL3A1230.052821610.39403974MMP1220.17081790.42805755FN1170.085678290.38263666TNC170.083465880.38636364POSTN170.045917650.39273927SERPINE1150.038466830.38762215MMP3140.070641640.39403974LOX140.06596690.37777778ITGA6140.05477970.371875SPP1130.042702960.36842105ITGB6130.023331580.33903134MMP13120.050263810.36060606LUM120.035058590.34293948
本研究中下調基因主要參與細胞因子-細胞因子受體相互作用、細胞色素P450外源性物質代謝、藥物代謝等通路,CYP3A5顯著富集在細胞色素P450外源性物質代謝、藥物代謝通路。Scheer等[18]敲除小鼠CYP3A5基因后發現小鼠肝臟的解毒能力明顯下降。煙草影響CYP3A5和谷胱甘肽-S-轉移酶活性,導致不同個體頭頸部鱗狀細胞癌發展的風險,這可能與降低細胞色素P450外源性物質代謝通路和藥物代謝通路活性有關[19]。
共表達分析中,所有差異表達基因主要集中在早期頭頸部鱗狀細胞癌上調或下調基因集中,GO分析發現這些差異表達基因主要分布在細胞外、質膜,主要參與細胞的生長發育過程,這些差異表達基因能促進或抑制HNSCC的增殖、侵襲。因此,探討HNSCC差異表達基因的作用通路,了解HNSCC發病的分子機制,可為腫瘤診斷與治療找到一些標志分子。蛋白-蛋白互作用網絡中,COL1A1、MMP9、COL1A2占據最核心位置。MMP9可能通過上皮-間質特異性炎癥通路介導鱗狀細胞癌的侵襲,與高TNM分期相關[20]。MMP9水平與腫瘤臨床病理特征相關,但是并不能作為診斷預后的標志物[21]。因此,還需要進一步的研究尋找相關腫瘤標志物。總之,利用生物信息學分析能有效挖掘基因芯片內在數據,為進一步探討頭頸部鱗狀細胞癌的發生機制提供理論參考。
[1]Torre LA,Bray F,Siegel RL,et al.Global cancer statistics,2012[J].CA Cancer J Clin,2015,65(2):87.
[2]Siegel RL,Miller KD,Jemal A.Cancer statistics,2015[J].CA Cancer J Clin,2015,65(1):5.
[3]Baxi SS,Pinheiro LC,Patil SM,et al.Causes of death in long-term survivors of head and neck cancer[J].Cancer,2014,120(10):1507.
[4]Rigoni L,Bruhn RF,De Cicco R,et al.Quality of life impairment in patients with head and neck cancer and their caregivers:a comparative study[J].Braz J Otorhinolaryngol,2016,82(6):680.
[5]Marur S,Forastiere AA.Head and Neck Squamous Cell Carcinoma:Update on Epidemiology,Diagnosis,and Treatment[J].Mayo Clin Proc,2016,91(3):386.
[6]Demokan S,Chuang AY,Chang X,et al.Identification of guanine nucleotide-binding protein gamma-7 as an epigenetically silenced gene in head and neck cancer by gene expression profiling[J].Int J Oncol,2013,42(4):1427.
[7]Kuriakose MA,Chen WT,He ZM,et al.Selection and validation of differentially expressed genes in head and neck cancer[J].Cell Mol Life Sci,2004,61(11):1372.
[8]Kartha VK,Stawski L,Han R,et al.PDGFRbeta Is a Novel Marker of Stromal Activation in Oral Squamous Cell Carcinomas[J].PloS one,2016,11(4):e0154645.
[9]He Y,Shao F,Pi W,et al.Largescale Transcriptomics Analysis Suggests Over-Expression of BGH3,MMP9 and PDIA3 in Oral Squamous Cell Carcinoma[J].PloS one,2016,11(1):e0146530.
[10]Gumbiner BM.Cell adhesion:the molecular basis of tissue architecture and morphogenesis[J].Cell,1996,84(3):345.
[11]Tamkun JW,DeSimone DW,Fonda D,et al.Structure of integrin,a glycoprotein involved in the transmembrane linkage between fibronectin and actin[J].Cell,1986,46(2):271.
[12]Yamada T,Tsuda M,Wagatsuma T,et al.Receptor activator of NF-kappaB ligand induces cell adhesion and integrin alpha2 expression via NF-kappaB in head and neck cancers[J].Scientific reports,2016,(23):545.
[13]Yamada T,Tsuda M,Takahashi T,et al.RANKL expression specifically observed in vivo promotes epithelial mesenchymal transition and tumor progression [J].Am J Pathol,2011,178(6):2845.
[14]Yen CY,Huang CY,Hou MF,et al.Evaluating the performance of fibronectin 1 (FN1),integrin alpha4beta1 (ITGA4),syndecan-2 (SDC2),and glycoprotein CD44 as the potential biomarkers of oral squamous cell carcinoma (OSCC) [J].Biomarkers,2013,18(1):63.
[15]Morita Y,Hata K,Nakanishi M,et al.Cellular fibronectin 1 promotes VEGF-C expression,lymphangiogenesis and lymph node metastasis associated with human oral squamous cell carcinoma[J].Clinical & experimental metastasis,2015,32(7):739.
[16]Tanaka K,Iyama K,Kitaoka M,et al.Differential expression of alpha 1(IV),alpha 2(IV),alpha 5(IV) and alpha 6(IV) collagen chains in the basement membrane of basal cell carcinoma[J].Histochem J,1997,29(7):563.
[17]Kwon J,Lee TS,Lee HW,et al.Integrin alpha 6:a novel therapeutic target in esophageal squamous cell carcinoma[J].Int J Oncol,2013,43(5):1523.
[18]Scheer N,McLaughlin LA,Rode A,et al.Deletion of 30 murine cytochrome p450 genes results in viable mice with compromised drug metabolism[J].Drug metabolism and disposition,2014,42(6):1022.
[19]Ali S,El-Rayes BF,Heilbrun LK,et al.Cytochrome p450 and glutathione transferase expression in squamous cell cancer[J].Clinical cancer research,2004,10(13):4412.
[20]Papadas TA,Naxakis SS,Mastronikolis NS,et al.Determination of matrix metalloproteinase 9 (MMP-9) protein expression in laryngeal squamous cell carcinomas based on digital image analysis[J].J BUON,2013,18(4):977.
[21]Kalfert D,Ludvikova M,Topolcan O,et al.Analysis of preoperative serum levels of MMP1,-2,and -9 in patients with site-specific head and neck squamous cell cancer[J].Anticancer research,2014,34(12):7431.
Bioinformatics analysis of head and neck squamous cell carcinoma
XIANGLin,GONGMei-heng,WANGPing,etal.
(DepartmentofOtorhinolaryngologyHeadandNeckSurgery,TheFirstHospitalofJinlinUniversity,Changchun130021,China)
Objective To investigate the mechanism of head and neck squamous cell carcinoma (HNSCC) from the gene and molecular level.Methods Download HNSCC related genes microarray data from GEO database,Screening differentially expressed genes using BRB-Array Tools software.Bioinformatics analysis was carried out using DAVID,ToppGene,STRING and Cytoscape tools.Results Two hundred and sixty-three differentially expressed genes,134 up-regulated and 129 down-regulated,were screened out by BRB.The COL1A1,MMP9,COL1A2,COL3A1,MMP1 gene,etc regulated ECM-receptor interaction,small cell lung cancer and pathways in cancer.Conclusion The use of bioinformatics to analyze microarray data can provide theoretical reference for in order to further explore the mechanism of HNSCC.
head and neck squamous cell carcinoma;differentially expressed genes;gene chip;bioinformatics
國家自然科學基金子課題(81372900)
1007-4287(2017)03-0381-05
R739.91
A
2016-12-23)
*通訊作者