尤文挺 何 龍 王 灑
1.溫州醫(yī)科大學(xué)附屬溫嶺醫(yī)院藥劑科 (浙江 溫嶺, 317500) 2.溫州醫(yī)科大學(xué)附屬溫嶺醫(yī)院醫(yī)學(xué)檢驗(yàn)科 3.溫州醫(yī)科大學(xué)附屬溫嶺醫(yī)院神經(jīng)內(nèi)科
肝細(xì)胞癌(HCC)是常見(jiàn)的惡性腫瘤之一[1],為降低其發(fā)病率采用了多種方法,其中包含早期檢測(cè)和診斷[2,3],這些方法雖然效果良好,可降低死亡率和發(fā)病率,然而10年生存率仍不理想[4]。因此,應(yīng)探索更可靠的預(yù)后生物標(biāo)志物來(lái)改善治療效果和了解其潛在機(jī)制。近年來(lái)進(jìn)行了許多有關(guān)HCC的生物信息學(xué)研究[5,6],證明了集成的生物信息學(xué)方法可以幫助進(jìn)一步研究和探索其潛在機(jī)制。
1.1 微陣列數(shù)據(jù) 從數(shù)據(jù)庫(kù)(http://www.ncbi.nlm.nih.gov/geo)中檢索了3個(gè)基因數(shù)據(jù)集(GSE19665、GSE41804和GSE84402),其中各包括10個(gè)HCC組織和10個(gè)正常組織,20個(gè)HCC組織和20個(gè)正常組織以及14個(gè)HCC組織和14個(gè)正常組織。
1.2 DEG的數(shù)據(jù)處理 HCC組織和正常組織之間的DEG通過(guò)GEO2R在線工具使用|logFC|> 2和調(diào)整后的P值(adj.p)<0.05確定[7]。然后,在Venn軟件中(http://bioinformatics.psb.ugent.be/webtools/Venn/)檢測(cè)3個(gè)數(shù)據(jù)集中常見(jiàn)的DEG。log FC<0的DEG被認(rèn)為是下調(diào)基因,而log FC>0的DEG被認(rèn)為是上調(diào)基因。
1.3 功能和途徑富集分析 基因本體(GO)廣泛應(yīng)用于基因、基因產(chǎn)物和序列的注釋[8]。京都基因和基因組百科全書(KEGG)是一個(gè)全面的數(shù)據(jù)庫(kù),用于解釋基因組序列和其他高通量數(shù)據(jù)[9]。這兩種分析都可以在基因注釋、可視化和綜合挖掘功能的DAVID數(shù)據(jù)庫(kù)(http://david.abcc.ncifcrf.gov/)中找到,該數(shù)據(jù)庫(kù)是由綜合生物學(xué)知識(shí)庫(kù)和分析工具組成的生物信息學(xué)數(shù)據(jù)資源,用于提取有意義的生物學(xué)信息。利用DAVID數(shù)據(jù)庫(kù)對(duì)DEGS進(jìn)行了大量基因和蛋白質(zhì)收集的信息、Go和KEGG分析,設(shè)定截止標(biāo)準(zhǔn)P<0.05。
1.4 PPI網(wǎng)絡(luò)的構(gòu)建與模塊分析 利用String在線數(shù)據(jù)庫(kù)(https://string-db.org/)對(duì)包含直接(物理)和間接(功能)關(guān)聯(lián)的PPI進(jìn)行評(píng)估[10]。然后,利用開源工具Cytoscape 3.6.1對(duì)不同生物分子之間的相互作用網(wǎng)絡(luò)進(jìn)行可視化探索,利用分子復(fù)合物檢測(cè)插件(MCODE)來(lái)進(jìn)行模塊分析(degree cutoff=2, node score cutoff=0.2, k-core=2, and max. Depth=100)。
1.5 核心基因的生存分析和RNA測(cè)序表達(dá) 使用Kaplan-Meier繪圖儀(http://kmplot.com/analysis)分析基因的預(yù)后意義。計(jì)算對(duì)數(shù)秩P值和95%置信區(qū)間的危險(xiǎn)比(HR)并顯示在圖上。為了驗(yàn)證這些DEG,我們根據(jù)來(lái)自GTEx項(xiàng)目和TCGA的數(shù)千個(gè)樣品,使用GEPIA網(wǎng)站(http://gepia.cancer-pku.cn/)分析了RNA測(cè)序表達(dá)的數(shù)據(jù)。
2.1 表達(dá)譜中DEG的識(shí)別 通過(guò)GEO2R在線工具,分別從GSE19665、GSE41804和GSE84402提取了1006、372和472個(gè)DEG 。然后,使用維恩圖軟件來(lái)識(shí)別3個(gè)數(shù)據(jù)集中的常用DEG。結(jié)果顯示,共檢測(cè)到139種常見(jiàn)的DEG,包括HCC組織中的103個(gè)下調(diào)基因(logFC<0)和36個(gè)上調(diào)基因(logFC>0)(圖 1)。

圖1 Venn圖表軟件識(shí)別3個(gè)數(shù)據(jù)集中的常用DEG
2.2 DEG的功能和途徑富集分析 通過(guò)DAVID軟件對(duì)全部139個(gè)DEG進(jìn)行了分析,GO分析的結(jié)果見(jiàn)圖2。上調(diào)的DEG主要被富集在基于微管的運(yùn)動(dòng)、有絲分裂核分裂、紡錘體微管與動(dòng)粒附著的調(diào)節(jié)等生物過(guò)程(BP),而下調(diào)的DEG主要參與氧化還原過(guò)程、細(xì)胞對(duì)鎘離子的反應(yīng)、環(huán)氧化酶P450途徑、細(xì)胞對(duì)鋅離子的反應(yīng)、負(fù)性生長(zhǎng)調(diào)控等。對(duì)于分子功能(MF),上調(diào)的DEG富含ATP結(jié)合、微管運(yùn)動(dòng)活性、蛋白激酶活性和ATP依賴的微管運(yùn)動(dòng)活動(dòng),加末端定向;而下調(diào)的DEG主要包括鐵離子結(jié)合、氧化還原酶活性,作用于成對(duì)的供體上,并結(jié)合或還原分子氧、血紅素結(jié)合、花生四烯酸環(huán)氧酶活性和氧結(jié)合等;對(duì)于GO細(xì)胞成分(CC),上調(diào)的DEGs明顯富集在中體、細(xì)胞核驅(qū)動(dòng)蛋白復(fù)合物、細(xì)胞膜和細(xì)胞質(zhì)中,而下調(diào)的DEGs在細(xì)胞器膜、細(xì)胞外區(qū)域、細(xì)胞外空間、質(zhì)膜的組成部分、高密度脂蛋白顆粒和膠原三聚體等。

圖2 HCC差異表達(dá)基因的基因本體(GO)分析(Top 5)
KEGG分析結(jié)果見(jiàn)表1。上調(diào)的DEG在細(xì)胞周期、p53信號(hào)通路、孕酮介導(dǎo)的卵母細(xì)胞成熟和卵母細(xì)胞減數(shù)分裂信號(hào)通路中特別豐富,而下調(diào)的DEG顯著存在于咖啡因代謝、礦物質(zhì)吸收、視黃醇代謝、代謝途徑和藥物代謝-其他酶等信號(hào)通路中(P<0.05)。

表1 HCC差異表達(dá)基因的KEGG途徑分析 (Top 5)
2.3 蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)(PPI)和模塊化分析 共132個(gè)DEG導(dǎo)入到DEGs PPI網(wǎng)絡(luò)復(fù)合體中,該復(fù)合體包含132個(gè)節(jié)點(diǎn)和494個(gè)邊緣,其中包括97個(gè)下調(diào)基因和35個(gè)上調(diào)基因(圖3A)。應(yīng)用MCODE進(jìn)行進(jìn)一步的模塊分析,結(jié)果顯示在132個(gè)節(jié)點(diǎn)中鑒定出28個(gè)核心基因,均為上調(diào)基因(圖3B)。

圖3 STRING在線數(shù)據(jù)庫(kù)和模塊分析構(gòu)建的通用DEG PPI網(wǎng)絡(luò)
A:DEG PPI網(wǎng)絡(luò)聯(lián)合體,綠色圓圈表示下調(diào)DEG,紅色圓圈表示上調(diào)DEG;B:通過(guò)Cytoscape軟件進(jìn)行模塊分析(degree cutoff=2, node score cutoff=0.2, k-core=2, and max. Depth=100)
2.4 Kaplan Meier繪圖儀和GEPIA分析核心基因 Kaplan Meier繪圖儀用于鑒定28個(gè)核心基因存活數(shù)據(jù),發(fā)現(xiàn)26個(gè)基因的存活率顯著更差(P<0.05,見(jiàn)圖4)。使用GEPIA來(lái)挖掘癌癥和正常人之間的26個(gè)基因的表達(dá)水平。結(jié)果顯示,與正常樣品相比,在HCC樣品中有22個(gè)反映出高表達(dá)(P<0.05,見(jiàn)圖5)。

圖4 存活率明顯降低的26個(gè)核心基因的預(yù)后信息(P<0.05)

圖5 22個(gè)基因在HCC癌癥患者中高表達(dá)
2.5 KEGG途徑富集重新分析22個(gè)選定的基因 為了解這22個(gè)所選DEG的可能途徑,通過(guò)DAVID重新分析了KEGG途徑的富集(P<0.05)。結(jié)果表明,4個(gè)基因(CCNB1、CDK1、BUB1和PTTG1)顯著富集于細(xì)胞周期途徑中,尤其是在G2/M期(見(jiàn)表2和圖 6)。

圖6 KEGG對(duì)選定基因進(jìn)行重新分析的細(xì)胞周期途徑

表2 通過(guò)KEGG途徑分析重新分析選定基因
盡管HCC已經(jīng)被廣泛研究,但早期診斷仍然是一個(gè)難題。其原因是缺乏對(duì)分子發(fā)生、發(fā)展和發(fā)展機(jī)制的深入了解。通過(guò)新的微陣列技術(shù),可以方便和容易地發(fā)現(xiàn)疾病發(fā)展和進(jìn)展中的一般基因變化,這可以研究診斷和治療機(jī)制[5,6,11]。在這項(xiàng)研究中分析了GSE19665、GSE41804和GSE84402表達(dá)譜數(shù)據(jù)集中重疊的DEG,包括上調(diào)和下調(diào)基因。GO分析表明,上調(diào)的DEG與基于微管的運(yùn)動(dòng)、有絲分裂核分裂、紡錘體微管與動(dòng)粒附著的調(diào)節(jié)在BP水平相關(guān)。此外,我們?cè)贙EGG路徑富集分析中測(cè)試了DEG,結(jié)果表明,重疊DEG主要在細(xì)胞周期、p53信號(hào)通路、孕酮介導(dǎo)的卵母細(xì)胞成熟和卵母細(xì)胞減數(shù)分裂信號(hào)通路中。細(xì)胞周期被確定為重疊DEG主要模塊的重要途徑之一,這些豐富的途徑可能為開發(fā)新的治療提供潛在的策略。
致癌作用是一個(gè)復(fù)雜的過(guò)程,與某些特定的基因有關(guān),涉及多個(gè)信號(hào)通路。近年來(lái),生物信息學(xué)分析已被用于識(shí)別許多癌癥的新診斷標(biāo)志物和治療靶點(diǎn)[11,12]。Zou等[13]通過(guò)綜合生物信息學(xué)分析,將NRAGE確定為肝癌的潛在生物標(biāo)志物。此外,在早期HCC中,G2/M檢查點(diǎn)參與了疾病進(jìn)展[14]。本研究中確定了HCC組織和正常組織之間的4個(gè)DEG(CCNB1、CDK1、BUB1和PTTG1)顯著富集于細(xì)胞周期途徑G2/M期中。CCNB1,G2/有絲分裂特異性細(xì)胞周期蛋白B1,是有絲分裂中的一種監(jiān)測(cè)蛋白,主要在G2/M期表達(dá),這對(duì)于控制G2/M(有絲分裂)過(guò)渡的細(xì)胞周期至關(guān)重要。最近,越來(lái)越多的證據(jù)表明CCNB1在預(yù)后較差的許多癌癥中過(guò)表達(dá),包括卵巢癌、口腔鱗狀細(xì)胞癌和非小細(xì)胞肺癌等[15-17]。此外,文獻(xiàn)報(bào)道CCNB1的上調(diào)可能是垂體腺瘤侵襲性的指標(biāo),并且在細(xì)胞周期中與其他監(jiān)測(cè)分子一起參與了垂體腺瘤的病理學(xué)研究[18]。此外過(guò)表達(dá)的BUB1與幾種癌癥及其較差的臨床預(yù)后有關(guān),Wang等[19]提出BUB1的高表達(dá)與乳腺癌患者的無(wú)病生存期差有關(guān)。此外,Zhao等[20]表示BUB1蛋白陽(yáng)性率越高,子宮內(nèi)膜癌的分化程度越高,分化程度越高。先前的研究表明,CDK1可能在通過(guò)細(xì)胞周期和p53信號(hào)通路從肝硬化轉(zhuǎn)化的HCC中起關(guān)鍵作用[21],Zhang等[22]提出miR-582-5p通過(guò)抑制CDK1的表達(dá)調(diào)節(jié)肝癌的發(fā)生。近期研究表明PTTG1在肝細(xì)胞癌中明顯上調(diào),與HCC患者生存率呈負(fù)相關(guān),提示PTTG1可能是HCC治療的潛在靶標(biāo)[23]。
