任秀玲,張江林,李偉,喬芳
(1.中南大學湘雅公共衛(wèi)生學院 流行病與衛(wèi)生統(tǒng)計學系,湖南 長沙 410008;2.中南大學湘雅醫(yī)院 皮膚科,湖南 長沙 410008;3.中南大學湘雅醫(yī)院 老年醫(yī)學科,湖南 長沙 410008)
近年來,隨著人類居住環(huán)境的日益惡劣,皮膚癌發(fā)病率逐年上升,已成為當前一個全球性的公共健康問題。皮膚癌分為惡性黑色素瘤和非黑色素瘤性皮膚癌兩大類,其中非黑色素瘤皮膚癌是當前全球人類癌癥中最流行的惡性腫瘤之一,約占所有皮膚癌患者的95%,且其發(fā)病率呈正逐年增加趨勢[1],嚴重危害人們的身體健康。探討非黑色素瘤的發(fā)病特點,尋找有效的診治方法具有重要的臨床意義。皮膚鱗狀細胞癌(cutaneous squamous cell carcinoma,cSCC)是一種常見的非黑色素瘤,尤其在老年人群中更為普遍。cSCC 源于表皮角質形成細胞,惡性程度高,其早期表現(xiàn)不典型,難以診斷,導致臨床上大部分患者確診時往往已形成侵襲性的cSCC,常常轉移至其他組織器官,患者的治療效果不佳,長期預后較差。高度轉移的cSCC 患者1 年疾病特異性存活率為44%~56%,區(qū)域淋巴結受累的患者10 年生存率降至20%以下,而發(fā)生遠處轉移的患者10 年生存率降至10%以下[1-2],嚴重危害患者的生命。目前,對這類轉移性癌癥的治療方法主要包括化學療法、靶向療法和免疫療法[3-4],不僅會給患者帶來嚴重的副作用,還會產(chǎn)生巨大的經(jīng)濟壓力,美國每年因治療cSCC 的總費用支出超過10 億美元[5]。因此,進一步探討cSCC 發(fā)病的分子機制,尋找cSCC 的早期診斷生物標志物,改善臨床治療結果具有重要的現(xiàn)實意義。
本研究中,我們利用生物信息學的方法對cSCC 相關基因芯片數(shù)據(jù)進行整合分析,篩選出cSCC 組織中的差異表達基因,并探討這些基因的生物學功能及調控網(wǎng)絡,以期為解讀cSCC 的發(fā)病機制提供新的理論依據(jù),為cSCC 的早期診斷和臨床治療提供潛在的生物靶點。
從基因表達綜合數(shù)據(jù)庫(Gene Expression Omnibus,GEO)(http://www.ncbi.nlm.nih.gov/geo)中檢索并下載cSCC 相關基因芯片數(shù)據(jù)GSE42677和GSE53462,前者包含13 例cSCC 組織以及10 例正常的皮膚組,后者包含5 例cSCC 組織以及5 例正常皮膚組織。
利用Affy 軟件包(http://www.bioconductor.org/packages/release/bioc/html/affy.html)對數(shù)據(jù)進行預處理和標準化。利用Limma 包(https://bioconductor.org/packages/release/bioc/html/limma.html) 以 |logFC|≥1.5且調整P<0.05 為標準篩選差異基因。
利用DAVID(https://david.ncifcrf.gov/)工具包對差異表達基因進行基因本體論(Gene Ontology,GO)和功能富集分析,以P<0.05 為差異有統(tǒng)計學意義。
利用 STRING 數(shù)據(jù)庫 (https://string-db.org/)分析這些基因的相互作用,結合Cytoscape 軟件構建蛋白質相互作用網(wǎng)絡,利用MCODE 插件篩選關鍵模塊,利用CytoHubba 插件篩選核心基因。
利用 Oncomine(https://www.oncomine.org/resource/login.html)數(shù)據(jù)庫中的皮膚鱗狀細胞癌相關基因表達數(shù)據(jù)對篩選的差異基因結果進行驗證,并生成熱圖。
從GSE42677 芯片數(shù)據(jù)中共獲得2 539 個差異表達基因,包括在腫瘤組織中上調表達的基因1 245 個,下調表達的基因1 294 個(圖1A);從GSE53462 芯片數(shù)據(jù)中共獲得375 個差異表達基因,其中腫瘤組織中上調表達的基因112 個,下調表達的基因263 個(圖1B)。在這些差異表達基因中,兩組芯片共同上調表達基因43 個,共同下調表達基因65 個。
低表達的差異基因主要富集在細胞增殖和皮膚發(fā)展等生物學過程、軸突和聚合物細胞骨架纖維等細胞組份、跨膜受體蛋白激酶活性和陽離子結合等分子功能。高表達差異基因主要富集在防御反應和先天免疫反應等生物學過程、細胞外區(qū)域和細胞外泌體等細胞組份、趨化因子受體結合和細胞因子活性等分子功能。高表達的差異基因主要富集在Toll 樣受體信號通路、趨化因子信號通路和癌癥中的轉錄失調等信號通路;低表達的差異基因主要富集在色氨酸代謝、精氨酸和脯氨酸代謝和p53 信號通路。
將差異表達基因導入STRING 數(shù)據(jù)庫,分析相互作用,利用Cytoscape 3.5.1 軟件構建PPI 網(wǎng)絡,其中總共包含節(jié)點72 個,邊146 條(圖2)。

圖1 差異表達基因分布火山圖

圖2 差異表達基因的PPI 相互作用網(wǎng)絡
利用Cytoscape 軟件的MODE 插件進行模塊分析,篩選代表性的模塊,根據(jù)打分高低,獲得前三個核心模塊。其中核心模塊一得分5.185,包含節(jié)點28 個,邊70 條,節(jié)點蛋白分別為KRT6B、S100A7、SERPINB3、CCL27、SPRR2B、KRT23、KRT2、 KRT31、 LYZ、 RRM2、 PI3、 KIT、DEFB4A、 SCEL、 S100A2、 S100A12、 S100A11、CTSL、SPP1、CCL3L3、PLLP、ALOXE3、PLAU、PLAUR、CCND1、CXCL1、CXCL8 和 KRT16,主要富集在外胚層發(fā)育、趨性、趨化作用、表皮發(fā)育、損傷反應和細胞因子信號通路。核心模塊二得分3.75,包含節(jié)點9 個,邊15 條,節(jié)點蛋白分別為 AIM2、OAS1、SG15、IFI6、OASL、CCND1、CXCL8、ISG20 和CYP1B1,主要富集在免疫反應、對病毒的反應和RNA 結合。核心模塊三得分3.6,包含節(jié)點 26 個,邊45 條,節(jié)點蛋白分別為CCL27、 LCE2B、 SPRR2B、 ALDH3A2、 CAT、GATA3、 DSC2、 KYNU、 PI3、 TFAP2B、 KIT、LONRF1、 ZBTB16、 AKR1B10、 CD24、 SPRY1、RORA、 NTRK2、 BTC、 GZMB、 PLLP、 DCT、SERPINB1、CLDN7、CCND1 和 CXCL8。
利用CytoHubba 插件篩選核心基因,算法采用MCC 法,按得分高低獲得排名前20 的核心蛋白 分 別 為 CXCL8、 CCND1、 KIT、 PI3、 SPP1、PLAU、 GATA3、 PLAUR、 CDKN2A、 S100A7、KRT16、 CXCL1、 DEFB4A、 ISG15、 KRT2、S100A12、KRT6B、ISG20、OASL 和 IFI6,它們彼此間的相互作用網(wǎng)絡如圖3 所示,其中包含20 個節(jié)點,53 條邊。這20 個核心蛋白中,CCND1、KIT、GATA3 和KRT2 四個蛋白在皮膚鱗狀細胞癌組織中低表達,其他16 個蛋白均在皮膚鱗狀細胞癌組織中高表達,提示異常高表達基因在皮膚鱗狀細胞癌的發(fā)生發(fā)展過程中起著重要作用。

圖3 PPI 網(wǎng)絡中前20 個Hub 基因相互作用圖
為了進一步驗證差異表達基因的表達情況,在Oncomine 數(shù)據(jù)庫中檢索皮膚鱗狀細胞癌相關基因芯片數(shù)據(jù),對在GEO 中篩選到的差異表達基因結果進行驗證。根據(jù)基因表達情況,分別對在腫瘤組織中高表達和低表達的前42 個基因做熱圖(圖4),Oncomine 數(shù)據(jù)庫所得cSCC 相關的差異基因的表達情況與對GEO 數(shù)據(jù)進行篩選所得結果基本一致,表明本研究的結果具有較好的準確性。

圖4 Oncomine 數(shù)據(jù)庫中差異表達基因的驗證
在本研究中,筆者通過對GEO 數(shù)據(jù)庫中的基因表達譜數(shù)據(jù)集GSE42677 和GSE53462 進行深度分析,獲得cSCC 腫瘤組織與正常皮膚之間的上調差異表達基因43 個,下調差異表達基因65 個。同時構建了這些差異表達基因之間的相互作用網(wǎng)絡,并篩選獲得了前20 個關鍵基因,這些差異表達基因在cSCC 的發(fā)生發(fā)展過程中很可能起著重要作用。
GO 和全基因組及代謝途徑數(shù)據(jù)庫(Kyoto Encyclopedia of Genes and Genomes,KEGG)途徑分析發(fā)現(xiàn)這些差異表達基因主要富集在細胞增殖、皮膚發(fā)育、免疫反應、Toll 樣受體信號通路、趨化因子信號通路、精氨酸和脯氨酸代謝和p53 信號通路等功能途徑。許多研究表明,機體異常的免疫反應在cSCC 的發(fā)生發(fā)展過程中起著重要作用,免疫治療也是當前cSCC 治療的研究熱點[4]。Toll樣受體信號通路在天然免疫中扮演重要角色,許多腫瘤細胞表面表達多類Toll 樣受體,參與腫瘤的生長轉移[6]。TLR4 是Toll 樣受體的重要組成部分,作為一種先天免疫受體,其在皮膚、角質形成細胞以及cSCC 中表達,而過表達TLR4 的cSCC細胞的增殖能力減弱,遷移能力增強,體內腫瘤的生長速度減緩[7]。趨化因子受體是一類跨膜蛋白,其介導的通路與多種疾病的發(fā)生關系密切,在cSCC 的組織和細胞中,許多趨化因子受體高表達,并參與介導腫瘤的發(fā)生發(fā)展[8]。精氨酸和脯氨酸代謝對于細胞的生長、增殖起著至關重要的作用,在腫瘤細胞中代謝重編程導致能量下調,需要精氨酸生物合成途徑提供能量[9]。p53 是經(jīng)典的抑癌基因,其基因突變和功能喪失在cSCC 中較為常見,且p53 信號通路與Notch 信號通路之間在cSCC 中存在密切的相互作用,很可能是導致cSCC形成和進展的關鍵因素[10]。
筆者也通過構建PPI 網(wǎng)絡篩選出了20 個在網(wǎng)絡中處于核心地位的基因,分別為CXCL8、CCND1、 KIT、 PI3、 SPP1、 PLAU、 GATA3、PLAUR、 CDKN2A、 S100A7、 KRT16、 CXCL1、DEFB4A、 ISG15、 KRT2、 S100A12、 KRT6B、ISG20、OASL和IFI6,這些基因絕大多數(shù)都在cSCC 等腫瘤的發(fā)生發(fā)展過程中扮演重要角色,如:CXCL8 是一種重要的細胞因子,肥大細胞能誘導cSCC 細胞中CXCL8 的表達,參與腫瘤的生長、侵襲和新血管形成[11];CCND1 作為 G1/S-特異性周期蛋白,研究表明約6%的cSCC 患者發(fā)生CCND1基因改變,參與腫瘤的發(fā)生和進展[12],而CCND1基因的過表達與cSCC 細胞對mTOR 抑制劑抗性密切相關,提示CCND1參與cSCC 的臨床耐藥[13];SPP1 是一種基質細胞糖蛋白,研究發(fā)現(xiàn)其在cSCC 和光化性角化病中顯著表達,能保護紫外線暴露下角質細胞的存活,促進cSCC 的發(fā)展[14]。當然也有PI3、PLAU等部分基因與cSCC發(fā)病的關系目前并不明確,值得筆者進一步深入挖掘和探討。為了評價筆者篩選結果的準確程度,筆者利用Oncomine 數(shù)據(jù)庫中的cSCC 相關表達譜數(shù)據(jù)對GEO 中的篩選結果進行驗證,發(fā)現(xiàn)兩者的一致性很好,提示本研究篩選的結果可靠性較高。
總之,本研究中筆者對cSCC 組織與正常皮膚組織芯片數(shù)據(jù)進行分析,獲得了cSCC 相關的關鍵差異表達基因及生物途徑,主要涉及細胞增殖、皮膚發(fā)育、氨基酸代謝、免疫反應、Toll 樣受體信號通路、趨化因子信號通路和p53 信號通路等生物學過程。筆者的結果可為解讀cSCC 的發(fā)病機制提供新的實驗依據(jù),為cSCC 的診斷及預后評估提供潛在的新生物標記。但是,筆者的結果僅停留于初步的數(shù)據(jù)分析階段,鑒于方法學的限制,存在一定的假陽性和假陰性,需要進一步的分子生物學實驗進行驗證。