陳妹妹,梁瑜禎,李爭(zhēng)明,夏 寧△
(1.廣西醫(yī)科大學(xué)第一附屬醫(yī)院內(nèi)分泌科,南寧 530021;2.廣西醫(yī)科大學(xué)第二附屬醫(yī)院內(nèi)分泌科,南寧 530007)
未分化型甲狀腺癌(anaplastic thyroid carcino‐ma,ATC)由《內(nèi)分泌器官腫瘤WHO 分類》定義為由未分化的濾泡性甲狀腺細(xì)胞組成的高度侵襲性甲狀腺惡性腫瘤[1]。ATC 是一種極其罕見(jiàn)的惡性腫瘤,占甲狀腺癌的1%~2%。它具有侵襲性強(qiáng)、惡性程度高、治療效果及預(yù)后極差和生存率低等特點(diǎn)[2]。該病通常發(fā)生在老年人身上,平均年齡在60歲左右,女性居多[3]。目前尚無(wú)有效的治療方法可以治愈或延長(zhǎng)ATC 患者的生存。近年來(lái),隨著基因芯片、高通量測(cè)序、基因微陣列等技術(shù)的發(fā)展,為尋找ATC 發(fā)生發(fā)展相關(guān)差異表達(dá)基因提供了充分的條件。目前,關(guān)于ATC 的分子機(jī)制研究較少,因此,本研究旨在通過(guò)生物信息學(xué)方法來(lái)挖掘與ATC 發(fā)生發(fā)展相關(guān)的關(guān)鍵基因及其信號(hào)通路,以期為ATC的診斷及其治療提供依據(jù)。
1.1 數(shù)據(jù)來(lái)源 從GEO 數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/geo)中檢索種屬是人的與ATC 相關(guān)的基因芯片數(shù)據(jù)庫(kù),共檢索出GSE85457、GSE65144和GSE53072 3 個(gè)基因芯片。GSE85457 包含4 個(gè)ATC 組織樣本和3個(gè)正常組織樣本,GSE65144包含12 個(gè)ATC 組織樣本和13 個(gè)正常組織樣本,GSE53072 包含5 個(gè)ATC 組織樣本和4 個(gè)正常組織樣本。
1.2 差異表達(dá)基因的篩選及數(shù)據(jù)處理 GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r)是GEO 數(shù)據(jù)庫(kù)的一個(gè)在線分析工具,它可以直接對(duì)GEO數(shù)據(jù)中兩個(gè)或兩個(gè)以上的樣本數(shù)據(jù)進(jìn)行差異表達(dá)基因分析。以P<0.01、logFC(fold change)>1 或log‐FC<-1為篩選條件,篩選得到ATC組織樣本與正常組織樣本對(duì)比后的差異表達(dá)基因,然后進(jìn)一步用韋恩圖在線分析工具(http://bioinformatics.psb.ugent.be/webtools/Venn/),得到3 個(gè)數(shù)據(jù)集中都包含的差異表達(dá)基因,即共同差異基因同時(shí)得到繪制的Venn圖。
1.3 共同差異表達(dá)基因的GO 富集分析和KEGG通路分析 DAVID(http://david.ncifcrf.gov)(版本6.8)是一個(gè)在線生物信息數(shù)據(jù)庫(kù),它結(jié)合了生物學(xué)數(shù)據(jù)和分析工具,并提供一套全面的基因和蛋白質(zhì)的注釋信息。GO 是一個(gè)重要的用于注釋基因和分析這些基因參與的生物學(xué)過(guò)程的生物信息學(xué)工具。KEGG 是一個(gè)用于了解高級(jí)功能和生物系統(tǒng),由大型分子數(shù)據(jù)集生成的基因組測(cè)序和其他高通量實(shí)驗(yàn)技術(shù)的實(shí)用程序數(shù)據(jù)庫(kù)資源。利用DAVID對(duì)共同差異表達(dá)基因進(jìn)行GO 富集分析,包括分子功能、細(xì)胞組成和生物過(guò)程3個(gè)方面,以及KEGG 通路富集分析,P<0.05認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
1.4 共同差異表達(dá)基因的蛋白質(zhì)互作(PPI)網(wǎng)絡(luò)分析和顯著基因模塊分析 利用在線分析工具STRING(http://www.string-db.org/)(版本11.0),構(gòu)建共同差異表達(dá)基因的PPI 網(wǎng)絡(luò)圖。進(jìn)而應(yīng)用Cyto‐scape(版本3.6.1)軟件進(jìn)行可視化分析,并應(yīng)用其中的插件MCODE 篩選顯著基因模塊。MCODE 插件設(shè)置參數(shù)為:Degree Cut-off:2,Node Score Cut-off:0.2,K-Core:2 and Max Depth:100。
1.5 關(guān)鍵基因的篩選和分析 應(yīng)用Cytoscape(版本3.6.1)軟件的插件cytoHubba 對(duì)共同差異表達(dá)基因篩選出節(jié)點(diǎn)度(node degree)>10 的關(guān)鍵基因。基因節(jié)點(diǎn)度越高表示該基因與ATC 的關(guān)系越密切。應(yīng)用DAVID 對(duì)關(guān)鍵基因進(jìn)行GO 富集分析,包括分子功能、細(xì)胞組成和生物過(guò)程3 個(gè)方面,以及KEGG 通路富集分析,P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。應(yīng)用UCSC 癌癥基因組數(shù)據(jù)庫(kù)(http://genomecancer.ucsc.edu)構(gòu)建層次聚類圖。
2.1 差異表達(dá)基因的篩選結(jié)果 通過(guò)對(duì)基因芯片數(shù)據(jù)對(duì)比篩選過(guò)后,GSE85457、GSE65144 和GSE53072分別獲得1941、4653 和3052 個(gè)差異表達(dá)基因。然后用Venn 圖取交集獲得328 個(gè)共同差異表達(dá)基因(圖1)。其中上調(diào)基因有103個(gè),下調(diào)基因有225個(gè)。

圖1 Venn圖
2.2 共同差異表達(dá)基因的GO 富集分析和KEGG通路分析結(jié)果 通過(guò)DAVID 在線工具分析,GO 富集結(jié)果中分子功能主要包含金屬離子結(jié)合、ATP 結(jié)合、蛋白質(zhì)同源二聚活性、氧化還原酶活性和激酶活性等(圖2A);細(xì)胞組成主要包含細(xì)胞質(zhì)、等離子體膜、原生質(zhì)膜的組成部分、粘著斑和細(xì)胞骨架等(圖2B);生物過(guò)程主要包括信號(hào)轉(zhuǎn)導(dǎo)、氧化還原過(guò)程、細(xì)胞粘附和細(xì)胞外基質(zhì)的組織等(圖2C)。KEGG通路分析結(jié)果表明共同差異表達(dá)基因主要參與神經(jīng)營(yíng)養(yǎng)素信號(hào)通路、結(jié)核、色氨酸代謝、賴氨酸降解和胃酸分泌等相關(guān)信號(hào)通路,見(jiàn)表1。

圖2 共同差異表達(dá)基因的GO富集分析

表1 DGEs的KEGG通路分析
2.3 共同差異表達(dá)基因的PPI網(wǎng)絡(luò)圖和顯著基因模塊分析 構(gòu)建共同差異表達(dá)基因的PPI 網(wǎng)絡(luò),其中上調(diào)基因有103 個(gè),下調(diào)基因有225 個(gè)。并使用Cy‐toscape對(duì)PPI網(wǎng)絡(luò)圖獲得最顯著的基因模塊(圖3),本模塊涉及的基因均是上調(diào)基因。
2.4 關(guān)鍵基因的篩選及分析 應(yīng)用Cytoscape(版本3.6.1)軟件的插件cytoHubba 對(duì)差異基因篩選出節(jié)點(diǎn)度>10 的關(guān)鍵基因,共篩選出19 個(gè)關(guān)鍵基因,其中上調(diào)基因有18 個(gè),分別是AURKA、CDC6、WDHD1、OIP5、MCM4、NCAPH、RAD51AP1、CEN‐PF、FEN1、CDC7、NEK2、DSCC1、PAX6、KIF18A、CASP1、ICAM1、COL1A1、COL3A1,下調(diào)基因有1個(gè),為FMOD。應(yīng)用DAVID 對(duì)19個(gè)關(guān)鍵基因進(jìn)行GO 富集分析及KEGG 通路富集分析,篩選出基因數(shù)≥5 的GO 富集分析,結(jié)果顯示關(guān)鍵基因主要富集在蛋白結(jié)合、核漿、細(xì)胞核和細(xì)胞周期、DNA 復(fù)制,見(jiàn)表2、表3。應(yīng)用UCSC 數(shù)據(jù)庫(kù)對(duì)關(guān)鍵基因構(gòu)建的層次聚類圖結(jié)果顯示,PAX6 和FMOD 在正常組織樣本中高表達(dá),CDC6 和NEK2 在腫瘤組織中高表達(dá),關(guān)鍵基因可以基本區(qū)分甲狀腺癌樣本和正常樣本(圖4)。

表2 關(guān)鍵基因的GO富集

圖3 PPI網(wǎng)絡(luò)圖中最顯著模塊圖

表3 關(guān)鍵基因的KEGG通路分析

圖4 層次聚類圖
本研究通過(guò)對(duì)3個(gè)GSE基因芯片進(jìn)行生物信息學(xué)分析,篩選得到328 個(gè)正常甲狀腺組織與ATC 差異表達(dá)基因,其中上調(diào)基因有101 個(gè),下調(diào)基因有227 個(gè)。對(duì)共同差異表達(dá)基因進(jìn)行富集分析發(fā)現(xiàn),基因主要參與金屬離子結(jié)合、信號(hào)轉(zhuǎn)導(dǎo)、氧化還原、細(xì)胞粘附等生物過(guò)程。金屬離子可影響癌細(xì)胞端粒酶活性,而高水平的端粒酶與致癌轉(zhuǎn)化相關(guān)[4]。信號(hào)轉(zhuǎn)導(dǎo)異常是參與腫瘤發(fā)生發(fā)展過(guò)程的重要環(huán)節(jié),而細(xì)胞間粘附降低則在癌細(xì)胞的侵襲過(guò)程和遷移過(guò)程中起到重要作用。細(xì)胞內(nèi)氧化還原平衡的維持是細(xì)胞存活的關(guān)鍵,而腫瘤細(xì)胞內(nèi)則因?yàn)榭寡趸傅倪^(guò)度表達(dá),從而促進(jìn)腫瘤的發(fā)生發(fā)展[5]。KEGG 富集分析表明,差異基因主要參與神經(jīng)營(yíng)養(yǎng)素信號(hào)通路和結(jié)核相關(guān)通路。有研究表明,神經(jīng)營(yíng)養(yǎng)因子參與腫瘤的增殖存活、遷移、轉(zhuǎn)移和化療耐藥等過(guò)程[6]。結(jié)核桿菌感染與惡性腫瘤的發(fā)生有一定的相關(guān)性[7]。
共同差異表達(dá)基因通過(guò)構(gòu)建PPI 網(wǎng)絡(luò)圖及分析,篩選出AURKA、CDC6、WDHD1、OIP5、MCM4、NCAPH、RAD51AP1、CENPF、FEN1、CDC7、NEK2、DSCC1、PAX6、KIF18A、CASP1、ICAM1、COL1A1、COL3A1、FMOD 19 個(gè)關(guān)鍵基因。關(guān)鍵基因富集分析顯示,基因主要參與蛋白結(jié)合、細(xì)胞分裂、DNA 復(fù)制等過(guò)程。AURKA 是一種絲氨酸/蘇氨酸激酶,通過(guò)在體內(nèi)與中心體結(jié)合來(lái)調(diào)控有絲分裂,在有絲分裂進(jìn)展的多個(gè)步驟中起著至關(guān)重要的作用,包括細(xì)胞周期G1 期的微管穩(wěn)定性、染色體排列和分離以及胞質(zhì)分裂,且經(jīng)常在各種類型的人類癌癥中異常表達(dá)[8]。有研究表明,AURKA 在ATC 中高表達(dá),提示其可能在ATC 中發(fā)揮相關(guān)作用[9]。細(xì)胞周期調(diào)節(jié)因子在ATC 中有著重要作用。其中包括主要參與細(xì)胞周期進(jìn)展或染色體不穩(wěn)定的幾個(gè)基因的表達(dá):CDC6、MCM4、WDHD1、CDC7、CENPF、NEK2、DSCC1。CDC6屬于ATP酶家族成員,有研究表明,CDC6 在甲狀腺未分化癌、髓樣癌、乳頭狀癌中陽(yáng)性表達(dá),且能反映出甲狀腺癌細(xì)胞的增生程度,可輔助鑒別甲狀腺腺瘤[10]。高水平表達(dá)的MCM4 與食管癌發(fā)生及病理分期有關(guān)[11]。抑制WDHD1 的表達(dá)可抑制肺癌和食管癌細(xì)胞的生長(zhǎng)[12]。CDC7 和MCM4 在子宮內(nèi)膜腺癌中有高表達(dá)的報(bào)道[13]。CENPF 全稱著絲粒蛋白F,與細(xì)胞周期密切相關(guān)。CENPF 的高表達(dá)與乳腺癌預(yù)后差和腫瘤骨轉(zhuǎn)移相關(guān)[14]。NEK2 屬于NEK 蛋白激酶家族,參與細(xì)胞的有絲分裂,促進(jìn)中心體成熟并維持其結(jié)構(gòu)。有研究表明,在甲狀腺腫瘤中NEK2 蛋白高表達(dá)[15]。DSSC1在結(jié)腸癌中過(guò)表達(dá),且結(jié)腸癌細(xì)胞中DSSC1的高表達(dá)可降低患者的生存率[16]。根據(jù)這些結(jié)果,筆者推測(cè)這些細(xì)胞周期調(diào)節(jié)因子可能也在ATC 的發(fā)生、轉(zhuǎn)移和預(yù)后中發(fā)揮重要作用。研究證實(shí),OIP5在膠質(zhì)母細(xì)胞瘤[17]、膀胱癌[18]、腎癌[19]等多種癌癥中高表達(dá),促進(jìn)癌癥的生長(zhǎng)和轉(zhuǎn)移,影響患者的預(yù)后。研究表明,PAX6 與惡性腫瘤的化療耐藥有關(guān)[20]。有研究發(fā)現(xiàn),CASP1 與乳腺癌、肝癌和胰腺癌的免疫浸潤(rùn)程度相關(guān)[21]。COL1A1 在乳腺癌中高表達(dá),且水平與癌癥轉(zhuǎn)移、生存率相關(guān)[22]。ICAM1,細(xì)胞間黏附分子1,可促進(jìn)甲狀腺癌細(xì)胞的增殖,且甲狀腺乳頭狀癌(PTC)和ATC 都與ICAM-1 表達(dá)增加有關(guān),ICAM-1 表達(dá)與不良預(yù)后密切相關(guān)[23-24]。NCAPH、RAD51AP1、FEN1、KIF18A、COL3A1、FMOD 目前在甲狀腺癌中尚未有相關(guān)研究。但FMOD 被認(rèn)為是淋巴瘤、白血病、平滑肌瘤等惡性腫瘤的一種新的腫瘤相關(guān)抗原[25]。
從數(shù)據(jù)庫(kù)UCSC對(duì)關(guān)鍵基因的分析結(jié)果可以看出,PAX6 和FMOD 在正常組織樣本中高表達(dá)。但層次聚類結(jié)果中顯示PAX6 屬于下調(diào)基因,與Cyto‐scape 篩選結(jié)果相反,原因可能與數(shù)據(jù)庫(kù)UCSC 沒(méi)有將甲狀腺癌分類有關(guān)。數(shù)據(jù)庫(kù)UCSC顯示的結(jié)果是所有類型的甲狀腺癌,而ATC 只占甲狀腺癌1%~2%,從而導(dǎo)致PAX6 基因表達(dá)水平與Cytoscape 篩選結(jié)果相反。其余的關(guān)鍵基因基本上在正常組織低表達(dá),在腫瘤組織中高表達(dá)。關(guān)鍵基因可以基本區(qū)分甲狀腺癌樣本和正常樣本,進(jìn)一步說(shuō)明關(guān)鍵基因?qū)TC 是有明確影響的。但目前關(guān)鍵基因在ATC 中的研究還較少,很大原因可能是該病是罕見(jiàn)病導(dǎo)致樣本數(shù)目少。但是絕大數(shù)關(guān)鍵基因在多種腫瘤中都有相關(guān)報(bào)道,與腫瘤的發(fā)生、進(jìn)展、轉(zhuǎn)移和耐藥密切相關(guān),因此我們推測(cè)關(guān)鍵基因也可能與ATC有著密切關(guān)系。
綜上所述,本研究通過(guò)對(duì)ATC 的數(shù)據(jù)芯片的生物信息學(xué)分析,初步篩選出AURKA、MCM4、ICAM1、PAX6、FMOD 等19個(gè)基因在正常與癌組織中表達(dá)有明顯差異,并探討了關(guān)鍵基因參與的信號(hào)通路,有望成為ATC 診斷和治療的潛在靶點(diǎn)。但由于本研究未對(duì)分析結(jié)果進(jìn)行實(shí)驗(yàn)驗(yàn)證,因此,在未來(lái)的工作中,需要進(jìn)一步的擴(kuò)大樣本數(shù)量并開(kāi)展實(shí)驗(yàn)驗(yàn)證這些基因在ATC中的生物學(xué)功能。