李 瑞 應(yīng)彥祺 張文藝 魯笑欽
宮頸癌(cervical cancer,CC)的發(fā)生率和病死率居高不下,在女性腫瘤中位居第4位,且多數(shù)集中在發(fā)展中國家和地區(qū)[1]。大規(guī)模推進(jìn)HPV疫苗注射、宮頸癌的早篩早診,在一定程度上減輕了患者的疾病負(fù)擔(dān)。早期宮頸癌患者主要采用手術(shù)治療,其5年生存率為88%~97%[2]。中晚期及復(fù)發(fā)性宮頸癌的預(yù)后更差。我國于2019年公布了《健康中國行動(dòng)——癌癥防治實(shí)施方案(2019-2022年)》,其主要目標(biāo)要求總體癌癥5年生存率比2015年提高3個(gè)百分點(diǎn)[3]。
近年來,隨著基因芯片和高通量測序蓬勃發(fā)展,生物信息學(xué)技術(shù)為疾病研究提供了新手段[4]。因此筆者通過GEO數(shù)據(jù)庫篩選正常宮頸組織與宮頸癌組織的基因表達(dá)數(shù)據(jù)集,分析兩組樣本間的差異表達(dá)基因,構(gòu)建蛋白質(zhì)互作(protein-protein interaction, PPI)網(wǎng)絡(luò)。通過Cytoscape可視化PPI網(wǎng)絡(luò),然后篩選出CDK1、CCNA2、CCNB1、CDC20和TOP2A等5個(gè)核心基因。通過分析核心基因的甲基化水平、拷貝數(shù)變異、免疫浸潤等,探索其在宮頸癌中的潛在作用機(jī)制,為宮頸癌的診斷、治療提供新的研究基礎(chǔ)。
1.數(shù)據(jù)集獲取:以“cervical cancer”為關(guān)鍵詞在GEO數(shù)據(jù)庫中檢索與宮頸癌相關(guān)的基因表達(dá)數(shù)據(jù)。數(shù)據(jù)集納入標(biāo)準(zhǔn):①同一數(shù)據(jù)集包含正常宮頸組織和宮頸癌組織;②組織樣本對(duì)HPV感染無限制;③患者術(shù)前未接受過放化療;④數(shù)據(jù)集包含mRNA數(shù)據(jù)。最終選擇了5個(gè)基因芯片數(shù)據(jù)集(GSE63514、GSE64217、GSE6791、GSE89657和GSE9750),共計(jì)宮頸癌樣本85例,正常宮頸樣本61例。
2.差異表達(dá)基因的獲取與分析:利用在線工具GEO2R分析每個(gè)數(shù)據(jù)集中宮頸癌組織與正常宮頸組織之間的差異表達(dá)基因(differential expressed genes,DEGs)。DEGs需滿足2個(gè)標(biāo)準(zhǔn):①校正后P<0.05;②|log2FC|>1.0。利用Venn diagram網(wǎng)站找出不同數(shù)據(jù)集DEGs的交集。
3.PPI網(wǎng)絡(luò)構(gòu)建及核心基因篩選:利用STRING在線工具進(jìn)行DEGs的PPI網(wǎng)絡(luò)構(gòu)建,設(shè)置最低關(guān)聯(lián)度為0.90。利用Cytoscape軟件(v3.8.2)將PPI網(wǎng)絡(luò)進(jìn)行可視化,通過MCODE插件篩選PPI中的緊密連接的基因模塊。利用Degree算法對(duì)模塊涵蓋的基因進(jìn)行排序,選排名前15%的基因作為核心基因。
4.核心基因的表達(dá)驗(yàn)證及機(jī)制探索:利用GEPIA2在線工具分析基因的mRNA表達(dá)水平,該網(wǎng)站收錄了宮頸癌樣本306例,正常宮頸樣本13例。使用UALCAN數(shù)據(jù)庫分析基因的甲基化水平;使用cBioPortal數(shù)據(jù)庫進(jìn)行基因拷貝數(shù)變化分析;使用TIMER數(shù)據(jù)庫對(duì)基因進(jìn)行免疫浸潤分析;使用TISIDB數(shù)據(jù)庫對(duì)基因進(jìn)行免疫分型分析。
1.差異基因的確認(rèn):本研究選取了5個(gè)數(shù)據(jù)集GSE63514、GSE64217、GSE6791、GSE89657和GSE9750,利用GEO2R對(duì)其進(jìn)行差異基因的篩選(表1)。利用Venn在線工具分析5個(gè)數(shù)據(jù)集差異基因的交集,最終得到90個(gè)差異表達(dá)基因,包括67個(gè)上調(diào)基因和23個(gè)下調(diào)基因。

表1 GSE基本信息(n)
2.構(gòu)建PPI網(wǎng)絡(luò)并確認(rèn)核心基因:將90個(gè)差異表達(dá)基因?qū)隨TRING工具,進(jìn)行PPI分析。預(yù)測DEGs之間的蛋白質(zhì)相互作用。該P(yáng)PI網(wǎng)絡(luò)共涉及90個(gè)節(jié)點(diǎn)與1036條邊(圖1 A)。在Cytoscape中,利用MCODE算法篩出PPI中3個(gè)基因模塊,涵蓋35個(gè)基因(圖1中B、C、D)。利用Degree算法對(duì)模塊中35個(gè)基因進(jìn)行排序,選排名前15%的基因作為核心基因,分別為CDK1(Degree=46)、CCNA2(Degree=38)、CCNB1(Degree=36)和CDC20(Degree=36)和TOP2A(Degree=34)。按照納入的數(shù)據(jù)集分析,以上5個(gè)核心基因在宮頸癌中均為高表達(dá)。

圖1 蛋白質(zhì)互作網(wǎng)絡(luò)圖
3.核心基因的表達(dá)驗(yàn)證:為了驗(yàn)證5個(gè)核心基因的表達(dá)水平,筆者用GEPIA2在線工具對(duì)其進(jìn)行表達(dá)分析。與正常宮頸組織比較,5個(gè)核心基因的mRNA水平在宮頸癌組織中均呈現(xiàn)高表達(dá)(圖2)。

圖2 驗(yàn)證核心基因表達(dá)水平
4.核心基因拷貝數(shù)變異影響其mRNA表達(dá)水平:為探索核心基因CDK1、CCNA2、CCNB1、CDC20和TOP2A在宮頸癌中高表達(dá)的原因,筆者使用UALCAN數(shù)據(jù)庫進(jìn)行啟動(dòng)子甲基化分析。結(jié)果表明宮頸癌樣本中CCNA2啟動(dòng)子甲基化水平高(P=0.004,圖3中B),CDK1、CCNB1、CDC20和TOP2A啟動(dòng)子的甲基化水平無顯著異常(P均>0.05,圖3中A、C、D)。使用cBioPortal分析基因拷貝數(shù)變異,主要包括擴(kuò)增、輕度擴(kuò)增、二倍體、輕度丟失、深度丟失等5種改變。結(jié)果提示,隨著核心基因拷貝數(shù)值增加,其mRNA水平增加(P<0.05,圖4)。

圖3 宮頸癌中核心基因的甲基化分析

圖4 核心基因拷貝數(shù)值與mRNA表達(dá)水平的關(guān)系
5.核心基因的免疫相關(guān)分析:使用TIMER在線工具對(duì)核心基因進(jìn)行免疫浸潤分析,分析內(nèi)容包括腫瘤純度、B淋巴細(xì)胞、CD8+T細(xì)胞、CD4+T細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞、樹突狀細(xì)胞。結(jié)果顯示核心基因的表達(dá)與腫瘤純度有關(guān)(P<0.05),與CD8+T細(xì)胞、CD4+T 細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞、樹突狀細(xì)胞浸潤有關(guān)(P<0.05)。其中CDK1的表達(dá)與巨噬細(xì)胞浸潤呈負(fù)相關(guān)(圖5 A);CCNA2的表達(dá)與CD4+T細(xì)胞、中性粒細(xì)胞、樹突狀細(xì)胞浸潤呈正相關(guān),與巨噬細(xì)胞浸潤呈負(fù)相關(guān)(圖5 B);CCNB1的表達(dá)與所分析的免疫細(xì)胞無顯著關(guān)聯(lián)(圖5 C);CDC20的表達(dá)與CD8+T細(xì)胞浸潤呈負(fù)相關(guān)(圖5 D);TOP2A的表達(dá)與CD4+T細(xì)胞浸潤呈正相關(guān)(圖5 E)。使用TISIDB在線工具對(duì)核心基因進(jìn)行免疫分型分析,免疫分型主要分為C1(創(chuàng)面愈合)、C2 (IFN-γ顯性)、C3(炎性)、C4(淋巴細(xì)胞消耗)、C5(免疫沉默)和C6 (TGF-β顯性)等6種亞型。結(jié)果顯示,宮頸癌主要包含C1、C2、C4等3種亞型,僅CCNA2的表達(dá)與免疫分型的相關(guān)性比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。CDK1、CCNA2、CCNB1和CDC20在C2型中表達(dá)水平相對(duì)較高,TOP2A在C1型中表達(dá)水平相對(duì)較高(圖6)。

圖5 核心基因在宮頸癌中的免疫浸潤分析

圖6 核心基因與宮頸癌免疫分型的關(guān)系
對(duì)于大多數(shù)發(fā)展中國家和地區(qū),CC發(fā)生率、病死率居高不下,其診斷與治療仍具有局限性。因此急需拓展新的生物學(xué)標(biāo)志物協(xié)助宮頸癌的診治,探索宮頸癌的發(fā)生機(jī)制。隨著高通量測序技術(shù)的發(fā)展,生物信息學(xué)技術(shù)為癌癥的研究提供了新的思路。
本研究通過生物信息分析篩選出CDK1、CCNA2、CCNB1、CDC20和TOP2A等5個(gè)基因可作為宮頸癌候選生物學(xué)標(biāo)志物。CDK1(cyclin dependent kinase 1)即細(xì)胞周期依賴性激酶1,對(duì)細(xì)胞分裂和DNA復(fù)制至關(guān)重要,幾乎可以促進(jìn)所有類型細(xì)胞的細(xì)胞周期進(jìn)展,在多數(shù)腫瘤中為高表達(dá)。敲除肝癌小鼠模型的CDK1基因,發(fā)現(xiàn)腫瘤生長顯著受到抑制[5]。研究表明,CDK1可以通過磷酸化人端粒酶反轉(zhuǎn)錄酶影響細(xì)胞分化和癌癥進(jìn)展[6]。CCNA2(cyclin A2)即細(xì)胞周期蛋白A2,可以影響細(xì)胞的G1/S期轉(zhuǎn)換和G2/M期轉(zhuǎn)換,與多種腫瘤預(yù)后相關(guān),如前列腺癌、胰腺癌等[7~9]。CCNB1(cyclin B1)即細(xì)胞周期蛋白B1,是CDK1的主要激活劑,二者協(xié)同促進(jìn)G2/M期轉(zhuǎn)換[10]。在胰腺癌中,沉默CCNB1可激活p53信號(hào)通路進(jìn)而抑制細(xì)胞增殖并促進(jìn)細(xì)胞衰老[11]。CDC20(cell division cycle 20)即細(xì)胞分裂周期蛋白20,是細(xì)胞周期檢查點(diǎn)調(diào)節(jié)蛋白,影響細(xì)胞分裂、染色體分離,在多種惡性腫瘤中上調(diào),包括肝癌、胰腺導(dǎo)管癌和胃癌[9, 12~14]。抑制CDC20的表達(dá)可抑制膠質(zhì)瘤耐藥細(xì)胞系的上皮間充質(zhì)轉(zhuǎn)化并影響其增殖[15]。TOP2A(DNA topoisomerase Ⅱ alpha)即DNA拓?fù)洚悩?gòu)酶2A,影響DNA合成和轉(zhuǎn)錄、染色體分離[16]。TOP2A可作為S期、G2期、M期時(shí)細(xì)胞增殖的特異性標(biāo)志物,其高表達(dá)與癌癥預(yù)后不佳有關(guān)[17]。
癌癥本質(zhì)上是一種基因組疾病,隨著體細(xì)胞的突變累積而發(fā)展,包括拷貝數(shù)改變(copy-number alterations,CNA)和結(jié)構(gòu)變異(structural variants,SV)以及伴或不伴有遺傳性的表觀基因組改變。基因拷貝數(shù)改變是癌癥基因組最常見的標(biāo)志之一,可導(dǎo)致癌基因的激活和抑癌基因的失活[18]。DNA甲基化是人類基因組最主要的表觀遺傳變異,細(xì)胞癌變的過程總是伴隨著廣泛的DNA甲基化改變[19, 20]。為進(jìn)一步探討5個(gè)核心基因CDK1、CCNA2、CCNB1、CDC20和TOP2A在宮頸癌中的潛在機(jī)制,筆者選擇從啟動(dòng)子甲基化及基因拷貝數(shù)兩方面入手。與正常宮頸組織比較,宮頸癌組織中CCNA2啟動(dòng)子高甲基化,而CDK1、CCNB1、CDC20和TOP2A的啟動(dòng)子甲基化差異無統(tǒng)計(jì)學(xué)意義,因此核心基因高表達(dá)并非源于啟動(dòng)子甲基化。值得注意的是,5個(gè)核心基因的拷貝數(shù)值與mRNA表達(dá)水平均呈正相關(guān),因此推測宮頸癌核心基因高表達(dá)源于基因拷貝數(shù)的改變。有研究表明,在放射抗性的前列腺癌細(xì)胞中,CDK1基因拷貝數(shù)和表達(dá)量均增加[21]。在膠質(zhì)母細(xì)胞瘤中CUL2基因通過拷貝數(shù)變異調(diào)節(jié)其表達(dá)量,可預(yù)測腫瘤進(jìn)展及放射敏感度[22]。在膀胱尿路上皮癌中,TOP2A基因拷貝數(shù)變異是癌癥復(fù)發(fā)的獨(dú)立危險(xiǎn)因素[23]。未來探索基因拷貝數(shù)變異的機(jī)制有助于推動(dòng)宮頸癌的診治。
腫瘤進(jìn)展需要克服的主要障礙是免疫系統(tǒng)。免疫系統(tǒng)將腫瘤視為新出現(xiàn)的病原體,并意圖消除腫瘤[24]。了解腫瘤免疫對(duì)于完善當(dāng)前的免疫治療方案至關(guān)重要。本研究發(fā)現(xiàn)核心基因與宮頸癌免疫浸潤有關(guān)。在腫瘤微環(huán)境中涉及多種免疫細(xì)胞,如自然殺傷細(xì)胞、調(diào)節(jié)性T細(xì)胞、肥大細(xì)胞等,本研究僅分析了B淋巴細(xì)胞、CD8+T細(xì)胞、CD4+T細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞和樹突狀細(xì)胞等6種免疫細(xì)胞。結(jié)果表明5個(gè)核心基因的表達(dá)與B淋巴細(xì)胞浸潤均不相關(guān),CCNA2涉及較多免疫細(xì)胞浸潤,包括CD4+T細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞、樹突狀細(xì)胞。可能由于分析種類不全,所以本研究未見CCNB1與免疫細(xì)胞浸潤關(guān)系。2018年,Thorsson等[25]開發(fā)了新的免疫分類,包含6種免疫亞型,分別為C1型(創(chuàng)面愈合)、C2 型(IFN-γ顯性)、C3型(炎性)、C4型(淋巴細(xì)胞消耗)、C5型(免疫沉默)和C6型(TGF-β顯性)。在不同的腫瘤中,不同的免疫分型預(yù)后不同,C4型和C6型的腫瘤患者預(yù)后較差。在結(jié)直腸癌中免疫分型主要是C1型和C2型,不同的免疫亞型造成不同的生物學(xué)差異,這可能是患者對(duì)傳統(tǒng)細(xì)胞毒性藥物和免疫療法存在藥物異質(zhì)性的原因[26]。
本研究中核心基因與宮頸癌免疫分型有潛在關(guān)系,主要涉及C1(創(chuàng)面愈合)、C2 (IFN-γ顯性)、C4(淋巴細(xì)胞消耗)等3種亞型,其中C2型與核心基因的表達(dá)關(guān)系較為密切。已有研究顯示C1型表現(xiàn)出血管生成基因高表達(dá)、高增殖性、與適應(yīng)性免疫相關(guān)的Th1/Th2比值低;C2型表現(xiàn)出腫瘤細(xì)胞高增殖性、最高的腫瘤異質(zhì)性、巨噬細(xì)胞M1/M2的高極化狀態(tài)、CD8 T細(xì)胞群占比最大,T淋巴細(xì)胞多樣性最大。C4型表現(xiàn)為腫瘤細(xì)胞適度的增殖性及異質(zhì)性、伴Th1抑制和高M(jìn)2反應(yīng)的巨噬細(xì)胞顯著特征[26]。核心基因與C2型免疫亞型關(guān)系密切,代表其與宮頸癌高增殖性、高腫瘤異質(zhì)性、巨噬細(xì)胞不同的極化狀態(tài)密切相關(guān)。CDK1、CCNA2、CCNB1、CDC20和TOP2A不同的表達(dá)水平可能與宮頸癌患者免疫細(xì)胞水平有關(guān),甚至在一定程度上影響癌癥免疫分型,影響患者對(duì)傳統(tǒng)抗腫瘤藥物的反應(yīng)及免疫療法的效用。
綜上所述,CDK1、CCNA2、CCNB1、CDC20和TOP2A可作為宮頸癌新的生物學(xué)標(biāo)志物,其拷貝數(shù)改變影響基因表達(dá)水平,其mRNA表達(dá)水平與患者的免疫狀態(tài)相關(guān)聯(lián),可能成為免疫治療的新靶點(diǎn)。未來仍需進(jìn)一步研究予以證實(shí)核心基因的作用機(jī)制,為宮頸癌的診斷及治療帶來新的機(jī)遇。