王 濤,侯潤博,潘 鑫
(錦州醫(yī)科大學(xué)醫(yī)療學(xué)院醫(yī)學(xué)系1,醫(yī)學(xué)技術(shù)系2,遼寧 錦州 121013)
Ⅰ型糖尿病作為一種慢性疾病主要是由胰島β細胞受損引起,胰腺或胰島移植可以徹底根治,但是由于供體缺乏以及免疫排斥大大限制該治療方案的臨床應(yīng)用[1,2],干細胞分化為胰島素分泌細胞(insulinproducing cells,IPCs)再行移植,有望成為Ⅰ型糖尿病治療的新策略[3,4]。miRNA 作為一類小的非編碼RNA,其長度大約在22 個核苷酸左右,能夠與靶mRNA 3’端非翻譯區(qū)互補,進而降解或阻止該mRNA 翻譯出蛋白質(zhì),實現(xiàn)轉(zhuǎn)錄后水平的基因表達調(diào)控[5,6]。生物信息學(xué)通過整合多個學(xué)科領(lǐng)域信息和知識,能夠整體層面揭示疾病或生物過程的復(fù)雜分子機制[7],而且其通過對已有實驗數(shù)據(jù)的分析,能夠減少重復(fù)實驗所帶來的資源浪費。GEO 數(shù)據(jù)庫是生物信息學(xué)研究重要的中心資源之一,其存儲大量高通量數(shù)據(jù),但是大部分數(shù)據(jù)并未被充分利用[8]。目前,運用生物信息學(xué)分析干細胞向IPCs 誘導(dǎo)分化過程中miRNA-mRNA 的調(diào)控網(wǎng)絡(luò)報道較少見。因此,本研究運用生物信息學(xué)方法分析干細胞向IPCs 誘導(dǎo)分化過程中的mRNA 表達譜,并構(gòu)建miRNAmRNA 調(diào)控網(wǎng)絡(luò)。
1.1 一般資料 通過NCBI 的GEO 數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)檢索人胚胎干細胞(human embryonic stem cells,hESCs)向IPCs 誘導(dǎo)分化過程中mRNA 表達譜的相關(guān)數(shù)據(jù),最終只有GSE42094 數(shù)據(jù)集符合要求,該數(shù)據(jù)集基于GPL10558 平臺,包含23 個樣本數(shù)據(jù)(GSM1032319-41),涉及未分化hESCs(WA09)、IPCs 分化的5 個時期、胰腺內(nèi)胰島和胎胰。
1.2 數(shù)據(jù)處理與差異表達分析 選擇GSE42094 數(shù)據(jù)集內(nèi)的未分化hESCs 和IPCs 分化的5 個時期進行研究,進入“Analyze with GEO2R”項目,點擊“Define groups”設(shè)定分組,其中,hESCs 組包含3 個樣本,Diff1 組3 個,Diff2 組3 個,Diff3 組2 個,Diff4 組2個,IPCs 組3 個,對6 組數(shù)據(jù)進行差異表達分析,篩選標準設(shè)定為adj.P<0.05。
1.3 GO 功能和KEGG 路徑顯著性分析 為分析差異表達基因的潛在生物學(xué)功能,選用DAVID(https://david.ncifcrf.gov/tools.jsp)數(shù)據(jù)庫進行功能富集分析,主要分析GO 功能以及KEGG 路徑2 個方面,以P<0.05 為差異有統(tǒng)計學(xué)意義。
1.4 蛋白互作網(wǎng)絡(luò)分析 為分析差異表達基因的相互作用及其調(diào)控網(wǎng)絡(luò),選用STRING(https://stringdb.org/)數(shù)據(jù)庫進行蛋白互作網(wǎng)絡(luò)PPI 分析,選擇Homo sapiens 作為“Organism”的條件,其余參數(shù)均為系統(tǒng)默認設(shè)置。
1.5 miRNA 預(yù)測 針對差異表達基因預(yù)測其靶miRNA,選用miRTarBase(https://mirtarbase.cuhk.edu.cn/)數(shù)據(jù)庫,選擇reporter assay、western blot、qPCR 和microarray 四種實驗驗證的miRNA-mRNA 靶向匹配作為預(yù)測miRNA 的入選標準,并應(yīng)用Cytoscape 9.1.0 軟件對miRNA-mRNA 的調(diào)控網(wǎng)絡(luò)進行可視化。
1.6 預(yù)測miRNA 的驗證 將預(yù)測的miRNA 與PMID:20 735 361[9]的Table S4 數(shù)據(jù)取交集進行驗證,該研究主要分析miRNA 在人胚胎T3 干細胞向胰腺胰島樣細胞團分化過程中的表達,其Table S4 結(jié)果顯示出胚胎T3 干細胞(hES-T3 cells grown on mouse embryonic fibroblast feeder,T3ES)、胚胎內(nèi)胚層(embryoid bodies differentiated from T3 cells,T3EB)和胰腺胰島樣細胞團(pancreatic islet-like cell clusters derived from T3 cells,T3pi)三組標準化的miRNA 表達量。
2.1 差異表達基因 通過對GSE42094 的6 組樣本數(shù)據(jù)分析,差異表達基因的前250 個被顯示,除去沒有名稱和重復(fù)的基因,共得到188 個。進一步對hESCs和IPCs 兩組數(shù)據(jù)分析得到差異表達基因,并與上述188 個基因取交集后,選取誘導(dǎo)后上調(diào)和下調(diào)的各前10 個差異表達基因進行后續(xù)研究,見表1。該20個基因代表整個hESCs 向IPCs 誘導(dǎo)過程中表達量差異最具有統(tǒng)計學(xué)意義的基因。

表1 誘導(dǎo)后上調(diào)和下調(diào)的前10 個差異表達基因
2.2 GO 功能和KEGG 路徑顯著性分析 通過對誘導(dǎo)后上調(diào)和下調(diào)的各前10 個差異表達基因進行GO 功能和KEGG 路徑顯著性分析,發(fā)現(xiàn)上調(diào)基因在“外泌體”和“胞外”比較集中,主要涉及“谷胱甘肽代謝”和“PPAR 信號通路”,而下調(diào)基因在“基因表達調(diào)控”“內(nèi)胚層的決定”以及“成體干細胞種群維持”比較集中。
2.3 蛋白互作網(wǎng)絡(luò)分析 通過PPI 分析發(fā)現(xiàn)10 個上調(diào)基因中有6 個基因所表達的蛋白質(zhì)具有相互作用,有2 個基因顯示二者間直接作用(GSTA1 和GSTA2),剩余兩個沒有關(guān)聯(lián)(圖1A)。而下調(diào)的10 個基因中LOC729860 和UCA1 在STRING 數(shù)據(jù)庫中沒有收錄,其余8 個基因中有5 個表達的蛋白質(zhì)具有相互作用,剩余3 個沒有關(guān)聯(lián)(圖1B)。將上調(diào)和下調(diào)的基因進行融合分析,發(fā)現(xiàn)下調(diào)基因KLKB1 能夠與上調(diào)基因FGG 直接進行蛋白相互作用,且上調(diào)基因蛋白互作網(wǎng)絡(luò)通過VTN 與下調(diào)基因網(wǎng)絡(luò)的POU5F1 直接作用,將兩個網(wǎng)絡(luò)相關(guān)聯(lián)(圖1C)。

圖1 蛋白互作網(wǎng)絡(luò)分析
2.4 miRNA-mRNA 調(diào)控網(wǎng)絡(luò) 通過miRTarBase 數(shù)據(jù)庫查找靶向作用于差異表達基因的miRNA,選擇reporter assay、western blot、qPCR 和microarray 4 種實驗驗證的miRNA-mRNA 靶向匹配作為預(yù)測miRNA 的入選標準,發(fā) 現(xiàn) CDH17、APOA2、FAM162B、GSTA2、LOC729860、UTF1、KLKB1 等7個基因沒有對應(yīng)miRNA 調(diào)控,而APOA1、TTR、PPP1R16B、RPL36A 4 個基因雖有相應(yīng)miRNA 調(diào)控,但不滿足設(shè)定的入選標準,因此,該11 個基因在應(yīng)用Cytoscape 9.1.0 軟件進行miRNA-mRNA 調(diào)控網(wǎng)絡(luò)可視化過程中,未有miRNA 呈現(xiàn),其余9 個基因共對應(yīng)23 個預(yù)測的miRNA。其中,DNMT3B 基因顯示有10 個miRNA 調(diào)控其表達,NANOG 基因有9個,而SPINK1 和UCA1 基因僅各有1 個miRNA調(diào)控其表達,且該2 個基因與miRNA-mRNA 調(diào)控網(wǎng)絡(luò)沒有直接關(guān)聯(lián)。進一步分析發(fā)現(xiàn)miR-335-5p能夠調(diào)控VTN、NANOG、POU5F1 和DNMT3B 4 個基因的表達(圖2),其中VTN 為上調(diào)基因(圖3A),NANOG、POU5F1 和DNMT3B 為下調(diào)基因(圖3B~圖3D)。

圖2 miRNA-mRNA 調(diào)控網(wǎng)絡(luò)

圖3 GEO2R 所示基因的表達量
2.5 預(yù)測miRNA 的驗證 將預(yù)測的miRNA 與PMID:20 735 361 的Table S4 數(shù)據(jù)取交集,得到21 個驗證的miRNA,剩余2 個預(yù)測的miRNA(miR-200b-3p和miR-144-3p)未被驗證,可見絕大部分預(yù)測的miRNA 得到驗證,亦即存在于干細胞及其誘導(dǎo)分化的過程中(表2),同時表明基于4 種實驗預(yù)測miRNA 的方法具備一定的可信度。表2 顯示miR-302a-3p、miR-34a-5p、miR-34c-5p、miR-29b-3p、miR-375 和miR-29a-3p 表達量誘導(dǎo)分化后顯著降低,而miR-134-5p、miR-335-5p 和miR-26a-5p 表達量隨著誘導(dǎo)分化進程逐漸升高,其中miR-335-5p表達量的逐漸升高與NANOG、POU5F1 和DNMT3B表達量的逐漸降低(圖3B~圖3D)形成對照,提示二者之間存在靶向關(guān)系且為負性調(diào)控。結(jié)合圖2 進一步分析發(fā)現(xiàn)上調(diào)基因與下調(diào)基因網(wǎng)絡(luò)通過多個miRNA 相關(guān)聯(lián),其中上調(diào)基因VTN 通過miR-26b-5p和miR-335-5p 與下調(diào)基因網(wǎng)絡(luò)多個基因關(guān)聯(lián),并且VTN 通過miR-26b-5p 與GSTA1 和GSTA2 的二者間直接作用相關(guān)聯(lián)。上調(diào)基因FGG 通過miR-29家族(miR-29a-3p、29b-3p、29c-3p)與下調(diào)基因DNMT3B 相關(guān)聯(lián),提示miRNA 通過靶向不同表達類型的基因進而調(diào)控干細胞的誘導(dǎo)分化進程。

表2 PMID:20 735 361 數(shù)據(jù)驗證預(yù)測的miRNA

表2 (續(xù))
2.6 miR-335-5p 的結(jié)構(gòu)和功能信息 運用miRBase數(shù)據(jù)庫(https://www.mirbase.org/)檢索miR-335-5p的結(jié)構(gòu)信息,其前體hsa-mir-335 的序列及其莖環(huán)結(jié)構(gòu)如圖4A 所示,標紅部分為成熟miR-335-5p 的序列(16-UCAAGAGCAAUAACGAAAAAUGU-38)。進一步檢索發(fā)現(xiàn)前體hsa-mir-335 在169 篇文獻中被提及,共涉及864 個詞句,其詞匯云如圖4B 所示,可見其在癌癥和腫瘤方向研究最廣泛,其次就是誘導(dǎo)和分化等方向,與本研究的方向相符。

圖4 miR-335-5p 的結(jié)構(gòu)和功能信息
本研究為分析hESCs 向IPCs 誘導(dǎo)分化過程中的mRNA 表達譜,采用生物信息學(xué)方法篩選GEO數(shù)據(jù)庫內(nèi)的數(shù)據(jù)集得到GSE42094,該數(shù)據(jù)集包含未分化hESCs、IPCs 分化的5 個時期、胰腺內(nèi)胰島和胎胰等樣本數(shù)據(jù)。本研究選擇與研究目的直接相關(guān)的未分化hESCs 和IPCs 分化的5 個時期來研究,通過數(shù)據(jù)庫自帶軟件GEO2R 對數(shù)據(jù)進行分析,得出差異表達的mRNA 共188 個,分別選取誘導(dǎo)后上調(diào)和下調(diào)的各前10 個差異表達基因作為后續(xù)研究。
通過GO 功能和KEGG 路徑顯著性分析,發(fā)現(xiàn)下調(diào)基因多涉及基因表達調(diào)控以及多能干細胞調(diào)控信號通路等與干細胞誘導(dǎo)分化機制相關(guān)的內(nèi)容,而上調(diào)基因涉及內(nèi)容則比較寬泛。進一步分析差異表達基因的相互作用,發(fā)現(xiàn)上調(diào)基因蛋白互作網(wǎng)絡(luò)與下調(diào)基因網(wǎng)絡(luò)通過上調(diào)基因VTN 和下調(diào)基因POU5F1 的直接作用而相關(guān)聯(lián),提示VTN 和POU5F1 基因可能為該蛋白互作網(wǎng)絡(luò)的核心基因。玻連蛋白(Vitronectin,VTN)是一種細胞外基質(zhì)糖蛋白,屬于整合素家族成員之一,其在傷口愈合和凝血過程中起著重要作用,進一步研究發(fā)現(xiàn)其參與多種生物學(xué)過程包括細胞粘附和遷移[10-12],也能夠通過JNK 和ERK 信號通路誘導(dǎo)INS-1 細胞的增殖[13]。本研究發(fā)現(xiàn)玻連蛋白在Diff3 組表達量開始升高,在IPCs 組達到峰值,表明其參與干細胞的誘導(dǎo)分化過程。POU5F1 又稱OCT4,是一種維持干細胞多能性的轉(zhuǎn)錄因子[14,15],其與NANOG 在胚胎早期發(fā)育中起著關(guān)鍵作用,并可作為胚胎干細胞的標志物以及干性維持[16,17]。本研究發(fā)現(xiàn)hESCs 組POU5F1 表達量最高,隨著誘導(dǎo)進程逐漸下降,在Diff3 組表達量就已經(jīng)處于較低水平。
構(gòu)建miRNA-mRNA 調(diào)控網(wǎng)絡(luò),發(fā)現(xiàn)miR-335-5p能夠調(diào)控VTN、NANOG、POU5F1 和DNMT3B 基因的表達,其中VTN 為上調(diào)基因,NANOG、POU5F1 和DNMT3B 為下調(diào)基因。有學(xué)者研究發(fā)現(xiàn)在糖尿病模型GK 大鼠的胰島內(nèi)miR-335-5p 表達量顯著增高,其能夠直接靶向抑制Stxbp1 mRNA 的表達,進一步研究發(fā)現(xiàn)miR-335-5p 在INS-1 832/13 細胞內(nèi)的過表達能夠抑制葡萄糖刺激的胰島素分泌[18]。Tang XW 等[19]發(fā)現(xiàn)在妊娠期糖尿病小鼠中過表達miR-335-5p 能夠抑制VASH1 的表達進而降低胰島素釋放的水平,并通過激活TGF-β 信號通路誘發(fā)胰島素抵抗。最近,Li G 等[20]研究發(fā)現(xiàn)miR-335-5p 能夠下調(diào)SLC2A4 基因表達進而抑制胰腺細胞的生長,與二型糖尿病的進展密切相關(guān)。但是,miR-335-5p是否參與干細胞誘導(dǎo)分化為IPCs 未見報道。
通過將預(yù)測的miRNA 與文獻PMID:20 735 361數(shù)據(jù)取交集,得到18 個驗證的miRNA,miR-335-5p包含其中,結(jié)果顯示miR-335-5p 在內(nèi)胚層階段(T3EB)其表達量升高2 倍多,至胰腺胰島樣細胞團階段(T3pi)升高接近5 倍,可見其在整個干細胞及其誘導(dǎo)分化過程中均有表達,且隨著誘導(dǎo)分化進程逐漸升高,表明miR-335-5p 不但參與糖尿病的發(fā)生進展,而且參與干細胞誘導(dǎo)分化為IPCs 的整個過程。
綜上所述,本研究共篩選得到差異表達的基因188 個,分別選取誘導(dǎo)后上調(diào)和下調(diào)的各前10 個進行分析,發(fā)現(xiàn)上調(diào)基因蛋白互作網(wǎng)絡(luò)通過VTN 與下調(diào)基因網(wǎng)絡(luò)的POU5F1 直接作用,將兩個網(wǎng)絡(luò)相關(guān)聯(lián)。miRNA-mRNA 調(diào)控網(wǎng)絡(luò)發(fā)現(xiàn)miR-335-5p 能夠調(diào)控VTN、NANOG、POU5F1 和DNMT3B 4 個基因的表達,進一步驗證發(fā)現(xiàn)miR-335-5p 表達量隨著誘導(dǎo)分化進程逐漸升高,與NANOG、POU5F1 和DNMT3B 表達量逐漸降低形成對照,提示二者之間存在靶向關(guān)系且為負性調(diào)控。因此,該miRNAmRNA 調(diào)控網(wǎng)絡(luò)顯示miR-335-5p 靶向多個基因參與hESCs 向IPCs 誘導(dǎo)分化過程。