王 丹 沙 巖 葛東偉
(徐州醫(yī)科大學(xué)醫(yī)學(xué)信息學(xué)院,徐州 221004)
胰腺癌是一種惡性程度很高、預(yù)后極差的消化道惡性腫瘤,且男性發(fā)病率普遍高于女性。近年來(lái),胰腺癌發(fā)病率和死亡率不斷上升,已成為威脅人類生命健康的主要原因。由胰腺癌引發(fā)的一系列轉(zhuǎn)移性疾病是導(dǎo)致患者死亡的重要原因,因此探明胰腺癌轉(zhuǎn)移的調(diào)控因子及分子機(jī)制至關(guān)重要。microRNA(miRNA)是一類長(zhǎng)約22 nt的非編碼單鏈 RNA,通過(guò)與目標(biāo)miRNA互補(bǔ)配對(duì)可以降解mRNA或抑制轉(zhuǎn)錄后翻譯進(jìn)而誘導(dǎo)基因沉默,miRNA的異常缺失或過(guò)表達(dá)與多種自身免疫性疾病的發(fā)生和發(fā)展密切相關(guān)[1]。研究報(bào)道m(xù)iR-34a 既可以作為誘癌基因參與惡性腫瘤的發(fā)生和發(fā)育,又可作為抑癌基因參與控制惡性腫瘤的形成[2]。研究表明,miR-34a在胰腺癌中作為重要的抑癌基因,在胰腺癌患者中存在異常表達(dá)[3,4],與腫瘤的轉(zhuǎn)移密切相關(guān),但其與胰腺癌發(fā)生相關(guān)的確切靶分子機(jī)制尚未清楚。本研究運(yùn)用生物信息學(xué)的分析方法預(yù)測(cè)與胰腺癌相關(guān)的miR-34a的靶基因及其分子調(diào)控網(wǎng)絡(luò),分析可能存在的生物學(xué)功能,以期為研究胰腺癌發(fā)生、發(fā)展的作用和相關(guān)調(diào)控機(jī)制奠定基礎(chǔ)。
1.1生物信息學(xué)網(wǎng)站和軟件 使用UCSC基因組在線軟件工具(http://genome.ucsc.edu/)分析has-miR-34a在人類基因組中的位置及保守性。通過(guò)miRecords數(shù)據(jù)庫(kù)(http://mirecords.biolead.org)對(duì)miR-34a進(jìn)行靶基因預(yù)測(cè)[5]。為了降低數(shù)據(jù)的假陽(yáng)性,運(yùn)用miRNA靶基因預(yù)測(cè)工具DIANA-microT、Microlnspector、miRANDA、MirTarget2、miTarget、NBmiR-Tar、PicTar、PITA、RNA22、RNAhybrid以及TargetS-can/TargertScanS按照默認(rèn)參數(shù)對(duì)miR-34a進(jìn)行靶基因預(yù)測(cè)。只有至少被5種不同算法預(yù)測(cè)的交集才作為miRecords預(yù)測(cè)的靶基因。GeneCards(http://www.genecards.org/)可查詢到與胰腺癌相關(guān)的致病基因,并將其同miRecords獲得的預(yù)測(cè)基因再次取交集,獲得同胰腺癌相關(guān)的預(yù)測(cè)靶基因。運(yùn)用Oncomine在線工具分析靶基因在胰腺癌患者中的差異表達(dá)。DAVID 6.8數(shù)據(jù)庫(kù)(https://david.ncifcrf.gov/)可以實(shí)現(xiàn)對(duì)預(yù)測(cè)的靶基因集合進(jìn)行GO分析和基于信號(hào)傳導(dǎo)通路的富集分析,通過(guò)Fisher Exect Test計(jì)算P值,篩選有統(tǒng)計(jì)學(xué)意義的生物學(xué)功能信號(hào)傳導(dǎo)通路(P<0.05)。
1.2統(tǒng)計(jì)學(xué)處理 采用SPSS16.0軟件對(duì)miR-34a RT-PCR結(jié)果進(jìn)行統(tǒng)計(jì)學(xué)處理,獨(dú)立樣本采用t檢驗(yàn)進(jìn)行組間比較,P<0.05表明差異具有統(tǒng)計(jì)學(xué)意義。
2.1miR-34a在人類基因組中的位置及保守性分析 利用UCSC基因組在線工具獲取miR-34a在人類基因組中位置(圖1),miR-34a位于人類1p36.22染色體上 chr1∶9,151,668-9,151,777 位置,長(zhǎng)度共110 bp,其核苷酸序列在人、獼猴、小鼠、狗、大象、雞、西方爪蟾、斑馬魚八個(gè)物種中呈高度保守,表明其發(fā)生突變的概率低。
2.2篩選與胰腺癌發(fā)病相關(guān)的miR-34a靶基因 使用miRecords數(shù)據(jù)庫(kù)對(duì)人miR-34a進(jìn)行靶基因預(yù)測(cè),得到5種算法預(yù)測(cè)的潛在交集靶基因有229個(gè),同時(shí)檢測(cè)得到確切的實(shí)驗(yàn)驗(yàn)證靶基因20個(gè)[5,6],分別為:AXIN2、AXL、BCL2、CCND1、CD44、CDK6、DLL1、E2F3、EPHA5、JAG1、MAP2K1、MET、MYB、MYC、 MYCN、NOTCH1、NOTCH2、SIRT1、VEGFA、WNT1,其中同預(yù)測(cè)的靶基因相同的有:AXL、BCL2、CCND1、CDK6、DLL1、E2F3、JAG1、MAP2K1、MET、NOTCH1、NOTCH2、SIRT1、VEGFA。將上述數(shù)據(jù)庫(kù)中的兩類靶基因取并集,并作為最終的數(shù)據(jù)庫(kù)預(yù)測(cè)靶基因。同時(shí),通過(guò)GeneCards在線數(shù)據(jù)庫(kù)查詢到與胰腺癌相關(guān)的致病基因共4 854個(gè)。最后將上述兩個(gè)數(shù)據(jù)庫(kù)獲得的基因進(jìn)行對(duì)比分析并取交集,篩選得到與胰腺癌發(fā)病相關(guān)的miR-34a潛在靶基因73個(gè),如:BCL2、MYC、Met、CDK6、SIRT1等,本研究將針對(duì)這73個(gè)靶基因進(jìn)行深入分析。

圖1 miR-34a在人類基因組中位置和保守性分析Fig.1 Location and conservation analysis of miR-34a in human genome
2.3miR-34a靶基因在胰腺癌患者中的差異表達(dá) 運(yùn)用Oncomine在線軟件分析所獲得靶基因在胰腺癌患者中的表達(dá)水平。以Met基因?yàn)槔?圖2),其差異結(jié)果具有統(tǒng)計(jì)學(xué)意義(P<0.01)。從圖中可以看出Met基因在胰腺癌患者中表達(dá)水平與健康人群相比顯著升高。
2.4GO功能富集分析 將miR-34a潛在調(diào)控靶基因與Genecards數(shù)據(jù)庫(kù)交集得到的73個(gè)靶基因使用DAVID進(jìn)一步進(jìn)行生物學(xué)功能分析,將獲得數(shù)據(jù)進(jìn)一步篩選(P<0.05)得到GO數(shù)據(jù)分析數(shù)據(jù)結(jié)果,見表1。分子功能項(xiàng)結(jié)果顯示,miR-34a靶基因存在于細(xì)胞過(guò)程調(diào)節(jié)、生物過(guò)程調(diào)節(jié)、生物過(guò)程負(fù)調(diào)控、器官發(fā)育、多細(xì)胞有機(jī)體發(fā)育、系統(tǒng)開發(fā)、解剖結(jié)構(gòu)發(fā)育、神經(jīng)發(fā)生、對(duì)外界刺激的反應(yīng)、細(xì)胞代謝調(diào)節(jié)、轉(zhuǎn)錄調(diào)節(jié)與DNA依賴、細(xì)胞增殖正調(diào)控、細(xì)胞表面受體連接的信號(hào)轉(zhuǎn)導(dǎo)、基因表達(dá)調(diào)控、基因細(xì)胞分化、胚胎發(fā)育等多個(gè)生物學(xué)過(guò)程中。
2.5KEGG信號(hào)轉(zhuǎn)導(dǎo)通路富集分析 采用DAVID在線工具對(duì)胰腺癌的預(yù)測(cè)靶基因進(jìn)行信號(hào)轉(zhuǎn)導(dǎo)通路分析,并篩選得到19個(gè)靶基因富集通路,見表2。分別為腫瘤通路、結(jié)腸直腸癌通路、膠質(zhì)瘤通路、黑色素瘤通路、膀胱癌通路、Notch信號(hào)通路、前列腺癌通路、子宮內(nèi)膜癌通路、非小細(xì)胞肺癌通路、Wnt信號(hào)通路、甲狀腺癌通路、胰腺癌通路、慢性髓性白血病通路、SNALL細(xì)胞肺癌通路、黏著斑通路、急性髓系白血病通路、背腹軸前移通路、細(xì)胞周期通路、黑色素生成通路,見表2。選取胰腺癌通路途徑中靶基因繪制分布圖進(jìn)行舉例說(shuō)明,見圖3。

圖3 miR-34a靶基因在胰腺癌通路中的分布Fig.3 Distribution of predicted target genes of miR-34a in pancreatic cancer pathwayNote: ★.miR-34a target genes.

表1 miR-34a預(yù)測(cè)靶基因的GO富集分析Tab.1 Gene Ontology enrichment analysis of predicted target genes of miR-34a

表2 miR-34a預(yù)測(cè)靶基因KEGG信號(hào)通路轉(zhuǎn)導(dǎo)分析Tab.2 Results of KEGG pathway of target genes regulated by miR-34a
近年來(lái),miRNA在癌癥中的作用機(jī)制已經(jīng)成為研究熱點(diǎn),基因芯片有助于探究miRNA在多種癌癥中的表達(dá)模式[7]。多項(xiàng)研究表明,miRNA參與細(xì)胞生長(zhǎng)、增殖、分化和凋亡等多個(gè)生理過(guò)程[8,9],在癌癥發(fā)生和發(fā)展中有重要作用,甚至能夠預(yù)測(cè)腫瘤分類[10]。
Calin等[11]發(fā)現(xiàn)超過(guò) 50%的miRNA 位于腫瘤相關(guān)基因區(qū)域或脆性位點(diǎn),這表明 miRNA在腫瘤的發(fā)生發(fā)展過(guò)程中發(fā)揮重要的調(diào)控作用。本研究對(duì)miR-34a在多個(gè)物種間成熟序列進(jìn)行比對(duì)分析,發(fā)現(xiàn)物種間序列呈高度保守性,表示該基因在不同物種中可能發(fā)揮重要的調(diào)控作用。此外,通過(guò)Oncomine工具分析胰腺癌患者和健康人群miR-34a的靶基因Met的表達(dá)水平,發(fā)現(xiàn)其靶基因Met顯著異常表達(dá)(P<0.01),提示其在胰腺癌的發(fā)生發(fā)展過(guò)程中可能扮演重要角色。
運(yùn)用生物信息學(xué)軟件預(yù)測(cè)miRNA靶基因,已經(jīng)成為生物學(xué)研究的一種重要手段。現(xiàn)已開發(fā)出多種miRNA靶基因預(yù)測(cè)軟件,但不同軟件的算法不同,優(yōu)缺點(diǎn)也有所側(cè)重。本研究使用miRecords在線分析軟件進(jìn)行靶基因的預(yù)測(cè),由于該軟件結(jié)合了多個(gè)靶基因預(yù)測(cè)軟件的結(jié)果,大大排除了假陽(yáng)性的影響,準(zhǔn)確性增高。近年來(lái)將Genecards數(shù)據(jù)庫(kù)查詢到的疾病相關(guān)因子的調(diào)控網(wǎng)絡(luò)與生物信息學(xué)軟件所獲基因進(jìn)行聯(lián)合,為后續(xù)實(shí)驗(yàn)驗(yàn)證提供大量非常有價(jià)值的線索[12]。本研究將Genecards數(shù)據(jù)庫(kù)中與胰腺癌相關(guān)的基因同miRecords分析出的潛在靶基因交集,共獲得73個(gè)基因,包括BCL2、CDK6、SIRT1等。Jamieson等[13]研究發(fā)現(xiàn),miR-34a在胰腺癌中具有抑癌基因的作用,它可以通過(guò)調(diào)控靶基因BCL2的表達(dá)進(jìn)而調(diào)節(jié)細(xì)胞增殖、遷移及侵襲,誘導(dǎo)細(xì)胞凋亡。Nalls等[14]發(fā)現(xiàn)在胰腺癌細(xì)胞系中,應(yīng)用甲基化抑制劑后可以使miR-34a 恢復(fù)表達(dá)并抑制下游靶基因BCL2、CDK6、SIRT1等表達(dá),以及調(diào)控胰腺癌細(xì)胞的增殖、侵襲與凋亡。這也表明miR-34a及其靶基因?qū)σ认侔┑呐R床診斷和治療具有重要的指導(dǎo)意義。
GO富集分析表明靶基因存在多種生物學(xué)功能。多種腫瘤的研究表明,miR-34a異常表達(dá)時(shí)會(huì)抑制CDK4和CDK6基因的表達(dá),從而促進(jìn)細(xì)胞周期過(guò)程[15]。miR-34a可以靶向調(diào)控BCL2,誘導(dǎo)細(xì)胞凋亡[16]。KEGG信號(hào)傳導(dǎo)通路研究發(fā)現(xiàn),miR-34a靶基因富集于Wnt、Notch等多個(gè)信號(hào)通路,同時(shí)與結(jié)腸癌、膠質(zhì)瘤、黑色素瘤、膀胱癌、非小細(xì)胞肺癌等多種腫瘤信號(hào)通路密切相關(guān)。其中一些信號(hào)傳導(dǎo)通路已經(jīng)被證實(shí)。上皮間質(zhì)轉(zhuǎn)化(Epithelial mesenchy-mal transition,EMT)在腫瘤發(fā)生過(guò)程中具有促進(jìn)作用,miR-34a直接靶向抑制EMT誘導(dǎo)轉(zhuǎn)錄因子SNAIL,進(jìn)而抑制EMT途徑[17,18]。Siemens等[19]研究表明,c-kit不僅是miR-34a的靶基因,而且對(duì)腫瘤干細(xì)胞具有負(fù)調(diào)控作用。
綜上所述,利用生物信息學(xué)在線分析軟件所獲得的信息能夠?qū)iRNA與疾病發(fā)生相關(guān)的研究發(fā)揮很好的前瞻性作用。本研究對(duì)miR-34a 進(jìn)行序列分析、靶基因預(yù)測(cè)、GO富集分析和KEGG通路富集分析,結(jié)果表明在胰腺癌發(fā)病過(guò)程中miR-34a可能通過(guò)調(diào)控多個(gè)與胰腺癌發(fā)病相關(guān)的靶基因,并可能參與多條信號(hào)通路的調(diào)節(jié),從而在胰腺癌中發(fā)揮抑癌基因的作用。本研究揭示miR-34a與靶基因信號(hào)通路可以作為胰腺癌發(fā)病機(jī)制中的重要生物學(xué)靶標(biāo),為miR-34a在胰腺癌發(fā)病中所涉及的靶基因調(diào)控網(wǎng)絡(luò)研究提供理論依據(jù),并為新藥物靶點(diǎn)的開發(fā)和應(yīng)用指明方向。