郭偉茜,高 勁,,花 蕾,鄭先斌,張洋洋,孫 斌,陶振超
鼻咽癌(nasopharyngeal carcinoma, NPC)是一種常見(jiàn)的頭頸部惡性腫瘤,起源于鼻咽黏膜,屬于上皮惡性腫瘤,主要為鱗狀細(xì)胞癌,我國(guó)南方地區(qū)高發(fā)。NPC是一種放射敏感性腫瘤,早期的NPC患者通過(guò)放射治療可使5年生存率達(dá)90%以上,然而大部分患者在就診時(shí)已是局部晚期階段,極大地影響了患者治療的療效和預(yù)后,并且NPC發(fā)病的分子機(jī)制尚不明確,因此迫切需要從分子水平研究NPC的發(fā)病機(jī)制,尋找能早期診斷、治療NPC的分子靶點(diǎn)。微小核糖核酸(microRNA, miRNA)是一類(lèi)內(nèi)源性非編碼RNA,miRNA的表達(dá)失調(diào)與NPC的發(fā)生發(fā)展密切相關(guān)。生物信息學(xué)分析為研究腫瘤發(fā)病機(jī)制提供了線索,該研究通過(guò)生物信息學(xué)方法篩選出NPC中異常表達(dá)的miRNA與mRNA,并構(gòu)建miRNA-mRNA調(diào)控網(wǎng)絡(luò),以尋找NPC潛在的分子靶標(biāo),為探索NPC發(fā)病機(jī)制提供新的思路。
1.1 芯片數(shù)據(jù)獲取
從基因表達(dá)數(shù)據(jù)庫(kù)(gene expression omnibus, GEO)中獲取鼻咽癌miRNA芯片數(shù)據(jù)GSE70970和基因芯片數(shù)據(jù)GSE12452。GSE70970包括246例鼻咽癌組織和17例鼻咽正常組織,其芯片平臺(tái)為GPL20699 nCounterHuman miRNA Assay (v1.0, Nanostring),GSE12452包括31例鼻咽癌組織和10例鼻咽正常組織,其芯片平臺(tái)為GPL570 [HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array。1.2 數(shù)據(jù)處理
通過(guò)R軟件3.6.1的limma程序包對(duì)原始芯片數(shù)據(jù)進(jìn)行背景校正、標(biāo)準(zhǔn)化及差異表達(dá)分析,利用差異表達(dá)倍數(shù)(fold change, FC)來(lái)進(jìn)行篩選。差異表達(dá)miRNA(differentially expressed miRNAs, DEMs)的篩選標(biāo)準(zhǔn)設(shè)置為|logFC|>2,矯正后P
值<0.05。差異表達(dá)基因(differentially expressed genes, DEGs)的篩選標(biāo)準(zhǔn)設(shè)置為|logFC|>1,矯正后P
值<0.05。利用R軟件及其pheatmap程序包繪制火山圖及熱圖。1.3 功能富集分析
基因本體論(gene ontology, GO)從3個(gè)方面對(duì)基因的功能進(jìn)行注釋?zhuān)ㄉ飳W(xué)過(guò)程(biological process, BP)、細(xì)胞組分(cellular component, CC)、分子功能(molecular function, MF)。京都基因與基因組百科全書(shū)(kyoto encyclopedia of genes and genomes, KEGG)對(duì)基因可能參與的信號(hào)通路進(jìn)行富集分析。利用FunRich 3.1.3軟件對(duì)DEMs進(jìn)行GO功能注釋?zhuān)ㄟ^(guò)R軟件的clusterProfiler程序包對(duì)DEGs進(jìn)行GO和KEGG富集分析。P
<0.05為差異有統(tǒng)計(jì)學(xué)意義,將富集程度顯著的前10個(gè)條目進(jìn)行可視化。1.4 DEMs轉(zhuǎn)錄因子及靶基因預(yù)測(cè)
通過(guò)FunRich軟件對(duì)DEMs的轉(zhuǎn)錄因子及其靶基因進(jìn)行預(yù)測(cè)。P
<0.05為差異有統(tǒng)計(jì)學(xué)意義,并對(duì)前10個(gè)富集顯著的轉(zhuǎn)錄因子進(jìn)行可視化。1.5 miRNA-mRNA調(diào)控網(wǎng)絡(luò)構(gòu)建
考慮到miRNA與靶基因之間的負(fù)向調(diào)控關(guān)系,通過(guò)在線工具(https://bioinfogp.cnb.csic.es/tools/venny/)將上調(diào)miRNA的靶基因與下調(diào)DEGs取交集,同時(shí)將下調(diào)miRNA的靶基因與上調(diào)DEGs取交集,將交集基因定義為核心基因,并且繪制韋恩圖。把結(jié)果導(dǎo)入Cytoscape 3.6.1軟件將網(wǎng)絡(luò)圖可視化。1.6 生存分析
Kaplan-Meier plotter數(shù)據(jù)庫(kù)(http://kmplot.com/analysis/)包含了多種腫瘤的芯片數(shù)據(jù)及高通量測(cè)序數(shù)據(jù),該數(shù)據(jù)庫(kù)通過(guò)在線生存分析為探索腫瘤的分子靶標(biāo)提供了依據(jù)。利用Kaplan-Meier plotter數(shù)據(jù)庫(kù)中的頭頸部鱗狀細(xì)胞癌數(shù)據(jù)對(duì)調(diào)控網(wǎng)絡(luò)中的核心基因進(jìn)行生存分析,進(jìn)一步篩選可能影響鼻咽癌患者預(yù)后的核心基因。數(shù)據(jù)庫(kù)采用log-rank檢驗(yàn),并且計(jì)算風(fēng)險(xiǎn)比(hazard ratio, HR),P
<0.05為差異有統(tǒng)計(jì)學(xué)意義。本研究的基本工作流程見(jiàn)圖1。2.1 差異表達(dá)miRNA和差異表達(dá)基因的篩選
從miRNA芯片數(shù)據(jù)GSE70970中一共篩選出47個(gè)DEMs,其中上調(diào)的miRNA有31個(gè),下調(diào)的miRNA有16個(gè)。從基因芯片數(shù)據(jù)GSE12452中一共篩選出797個(gè)DEGs,其中上調(diào)基因有291個(gè),下調(diào)基因有506個(gè)。利用R軟件繪制熱圖及火山圖,見(jiàn)圖2、圖3。
圖1 基本工作流程
2.2 功能富集分析
通過(guò)FunRich軟件對(duì)DEMs進(jìn)行GO富集分析顯示,DEMs主要參與信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞通訊、核苷酸代謝調(diào)節(jié)等生物學(xué)過(guò)程,富集在細(xì)胞核、細(xì)胞質(zhì)、溶酶體等細(xì)胞組分中,影響轉(zhuǎn)錄因子活性、轉(zhuǎn)錄調(diào)節(jié)活性、RNA結(jié)合等分子功能,見(jiàn)圖4。通過(guò)R軟件的clusterProfiler包對(duì)DEGs進(jìn)行GO及KEGG富集分析表明,DEGs主要參與纖毛組裝、微管運(yùn)動(dòng)、有絲分裂等生物學(xué)過(guò)程,富集在微管、纖毛、紡錘體等細(xì)胞組分中,影響酶抑制劑活性、微管蛋白結(jié)合、肽酶調(diào)節(jié)活性等分子功能,DEGs主要富集在細(xì)胞因子受體相互作用、阿米巴病、細(xì)胞周期、IL-17信號(hào)通路、小細(xì)胞肺癌等信號(hào)通路中。GO富集氣泡圖見(jiàn)圖5A,點(diǎn)顏色越紅代表富集越顯著,點(diǎn)越大代表富集基因的數(shù)目越多,KEGG富集圈圖見(jiàn)圖5B。
圖2 GSE70970數(shù)據(jù)的差異miRNA表達(dá)分析
2.3 DEMs轉(zhuǎn)錄因子預(yù)測(cè)
利用FunRich軟件預(yù)測(cè)DEMs的轉(zhuǎn)錄因子,富集顯著的前10個(gè)轉(zhuǎn)錄因子分別為EGR1、POU2F1、SP1、SP4、TCF3、E2F1、FOXA1、NKX2-1、RREB1、NKX6-1。見(jiàn)圖6。
圖3 GSE12452數(shù)據(jù)的差異基因表達(dá)分析

圖4 DEMs的GO富集分析 A:生物學(xué)過(guò)程;B:細(xì)胞組分;C:分子功能

圖5 DEGs的GO及KEGG富集分析A: GO富集氣泡圖;B: KEGG富集圈圖;紅色:上調(diào)基因;藍(lán)色:下調(diào)基因

圖6 DEMs轉(zhuǎn)錄因子預(yù)測(cè)藍(lán)色:DEMs百分比;紅色:P值
2.4 DEMs靶基因預(yù)測(cè)
利用FunRich軟件對(duì)DEMs的靶基因進(jìn)行預(yù)測(cè),47個(gè)DEMs中有12個(gè)miRNA能預(yù)測(cè)出靶基因,預(yù)測(cè)出的靶基因數(shù)目為1 606個(gè)。2.5 miRNA-mRNA調(diào)控網(wǎng)絡(luò)構(gòu)建
由于miRNA與靶基因之間是負(fù)向調(diào)控的關(guān)系,將上調(diào)miRNA靶基因與下調(diào)DEGs取交集得到9個(gè)下調(diào)核心基因,下調(diào)miRNA靶基因與上調(diào)DEGs取交集得到14個(gè)上調(diào)核心基因,韋恩圖見(jiàn)圖7。將結(jié)果導(dǎo)入Cytoscape軟件構(gòu)建miRNA-mRNA調(diào)控網(wǎng)絡(luò),網(wǎng)絡(luò)中miRNA有6個(gè)。網(wǎng)絡(luò)圖見(jiàn)圖8,相應(yīng)的miRNA及核心基因在鼻咽癌中的表達(dá)情況見(jiàn)表1。
圖7 靶基因與DEGs的韋恩圖

表1 網(wǎng)絡(luò)圖中miRNA與核心基因在鼻咽癌中的表達(dá)情況
2.6 生存分析
利用Kaplan-Meier plotter數(shù)據(jù)庫(kù)對(duì)23個(gè)核心基因進(jìn)行生存分析發(fā)現(xiàn)4個(gè)基因?qū)Ρ茄拾┗颊叩念A(yù)后有影響(P
<0.05),其中有2個(gè)上調(diào)基因,包括多聚磷酸肌醇磷酸酶1(multiple inositol-polyphosphate phosphatase 1, MINPP1)、鋅指環(huán)指蛋白3(zinc and ring finger 3, ZNRF3),MINPP1和ZNRF3高表達(dá)時(shí)患者的總體生存率降低,HR均為1.44。有2個(gè)下調(diào)基因,包括纖毛頂結(jié)構(gòu)蛋白(sentan,SNTN)、β微管蛋白2A(tubulin beta 2A, TUBB2A),SNTN和TUBB2A低表達(dá)時(shí)患者總體生存率降低,HR分別為0.74、0.65。生存曲線見(jiàn)圖9。4個(gè)基因相對(duì)應(yīng)的miRNA分別為hsa-miR-199b-5p、hsa-miR-520e、hsa-miR-107、has-miR-421。NPC的預(yù)后與腫瘤分期密切相關(guān),有研究發(fā)現(xiàn)早期NPC患者的5年生存率可達(dá)80%左右,但隨著腫瘤分期的進(jìn)展,NPC患者的5年生存率逐漸降低,然而由于NPC早期癥狀不明顯導(dǎo)致患者就診時(shí)的分期晚,再加上易發(fā)生轉(zhuǎn)移等因素均顯著影響了患者的預(yù)后,因此從分子水平探索NPC的發(fā)病機(jī)制,尋找能早期診斷、治療及預(yù)測(cè)預(yù)后的分子靶點(diǎn)至關(guān)重要。
miRNA作為一種內(nèi)源性非編碼RNA,其通過(guò)構(gòu)建沉默復(fù)合體靶向下游基因,從而阻斷該基因的表達(dá),因此miRNA與mRNA具有負(fù)向調(diào)控關(guān)系。本研究利用生物信息學(xué)方法對(duì)NPC的miRNA芯片數(shù)據(jù)和基因芯片數(shù)據(jù)進(jìn)行綜合分析,根據(jù)負(fù)向調(diào)控規(guī)律,將上調(diào)miRNA預(yù)測(cè)的靶基因與下調(diào)基因取交集,下調(diào)miRNA預(yù)測(cè)的靶基因與上調(diào)基因取交集,構(gòu)建miRNA-mRNA調(diào)控網(wǎng)絡(luò),從而獲得23個(gè)核心基因,結(jié)合生存分析顯示其中4個(gè)核心基因?qū)PC患者預(yù)后有影響(P
<0.05),包括2個(gè)上調(diào)基因MINPP1、ZNRF3,2個(gè)下調(diào)基因SNTN、TUBB2A。4個(gè)基因相對(duì)應(yīng)的miRNA分別為在鼻咽癌組織中下調(diào)表達(dá)的hsa-miR-199b-5p、hsa-miR-520e,以及在鼻咽癌組織中上調(diào)表達(dá)的hsa-miR-107、hsa-miR-421。這4對(duì)miRNA與mRNA之間的調(diào)控關(guān)系雖然尚未被研究報(bào)道過(guò),但本研究通過(guò)TargetScan、miRDB、miRTarBase數(shù)據(jù)庫(kù)進(jìn)行驗(yàn)證,顯示僅has-miR-107與SNTN之間的關(guān)系未得到驗(yàn)證,而其他3對(duì)在不同數(shù)據(jù)庫(kù)中分別預(yù)測(cè)到了具有相互作用的可能性,為下一步實(shí)驗(yàn)驗(yàn)證這些miRNA與mRNA的相互結(jié)合進(jìn)一步提供了理論依據(jù)。hsa-miR-199b-5p參與了多種腫瘤的調(diào)控過(guò)程,比如在乳腺癌中作為一種抑癌因子,通過(guò)抗血管生成作用成為一種潛在的治療靶點(diǎn),而hsa-miR-199b-5p在宮頸癌組織中表達(dá)上調(diào),具有促進(jìn)腫瘤生長(zhǎng)、轉(zhuǎn)移的作用,與宮頸癌的不良預(yù)后相關(guān)。在NPC中,有研究通過(guò)miRNA芯片技術(shù)檢測(cè)不同階段鼻咽癌miRNA的表達(dá),顯示hsa-miR-199b-5p在Ⅰ期NPC組織中的表達(dá)下調(diào),但對(duì)其中具體的調(diào)控機(jī)制沒(méi)有進(jìn)一步的研究。hsa-miR-520e也是一種癌癥相關(guān)的miRNA,其在結(jié)直腸癌中通過(guò)調(diào)控靶基因星形細(xì)胞上調(diào)基因-1(astrocyte elevated gene-1, AEG-1)影響Wnt信號(hào)通路進(jìn)而抑制結(jié)直腸癌細(xì)胞的增殖和侵襲。hsa-miR-107抑制多種腫瘤的發(fā)生發(fā)展,在口腔鱗狀細(xì)胞癌中hsa-miR-107通過(guò)靶向凋亡抑制因子減弱了腫瘤細(xì)胞的增殖及遷移能力。hsa-miR-107不僅僅作為一種抑癌因子,其在胃癌中通過(guò)活化PI3K-AKT信號(hào)通路促進(jìn)了胃癌的發(fā)生。多個(gè)研究表明hsa-miR-421促進(jìn)多種腫瘤進(jìn)程,在NPC中也發(fā)揮著促癌作用,有研究顯示hsa-miR-421可以促進(jìn)NPC細(xì)胞增殖,抑制細(xì)胞凋亡,hsa-miR-421可能通過(guò)靶向調(diào)節(jié)相關(guān)轉(zhuǎn)錄因子促進(jìn)NPC的發(fā)生發(fā)展。4種miRNA中僅hsa-miR-421有研究報(bào)道在NPC中發(fā)揮促癌作用,而hsa-miR-199b-5p、hsa-miR-520e、hsa-miR-107與NPC的關(guān)系尚未被研究過(guò),需要進(jìn)一步探索。

圖8 miRNA-mRNA調(diào)控網(wǎng)絡(luò)紅色:高表達(dá);黃色:低表達(dá)

圖9 部分基因的生存分析
MINPP1即多聚磷酸肌醇磷酸酶1是一種組氨酸磷酸酶,可在體內(nèi)外水解多種多聚磷酸肌醇,在細(xì)胞應(yīng)激時(shí)MINPP1的表達(dá)增加,該基因可能參與了腫瘤細(xì)胞模仿人類(lèi)成熟紅細(xì)胞的葡萄糖代謝過(guò)程,與腫瘤細(xì)胞的無(wú)限增殖能力相關(guān)。ZNRF3是一種跨膜E3泛素連接酶,其通過(guò)抑制Wnt信號(hào)通路在多種腫瘤中發(fā)揮著抑癌作用,其中也包括NPC。ZNRF3的過(guò)表達(dá)阻礙了NPC的上皮-間質(zhì)轉(zhuǎn)化過(guò)程,抑制NPC細(xì)胞的生長(zhǎng)、轉(zhuǎn)移,但是本研究表明ZNRF3在NPC組織中表達(dá)上調(diào)且與患者的不良預(yù)后相關(guān),與報(bào)道內(nèi)容不一致,可能有更深的機(jī)制影響了ZNRF3對(duì)NPC的調(diào)控作用,需要進(jìn)一步的研究。SNTN編碼纖毛頂結(jié)構(gòu)蛋白,該蛋白有助于遠(yuǎn)端纖毛清理呼吸道異物,有研究通過(guò)對(duì)卵巢癌芯片數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn)SNTN在卵巢癌組織中表達(dá)上調(diào),可能參與了卵巢癌的發(fā)生發(fā)展。TUBB2A即β微管蛋白2A,在神經(jīng)元中高度表達(dá),該基因發(fā)生突變可導(dǎo)致復(fù)雜性皮質(zhì)發(fā)育不良。TUBB2A在結(jié)直腸癌組織中過(guò)度表達(dá)且與患者的不良預(yù)后相關(guān)。基因MINPP1、SNTN、TUBB2A在NPC中的作用未被報(bào)道過(guò),為進(jìn)一步研究提供了新方向。