王 道,朱洪怡,楚 毅*
(中南大學湘雅二醫院 a. 婦產科;b. 消化內科,長沙 410011)
微小RNA(microRNA,miRNA)是一類由18到22個核苷酸組成的短RNA分子[1],可以調節轉錄后基因的表達并且促進個體發育、細胞分化、機體炎癥、免疫反應和癌變[2-6]等過程。這些分子通過與相應的mRNA相互作用從而形成沉默復合體(RNA-induced silencing complex,RISC),能夠結合到3'非翻譯區(3'-untranslated region,3'-UTR)的互補序列,引起表達失調進而破壞信號傳導途徑增加人類患疾病的風險[7]。此外,許多研究報告表明miRNA是基因表達的關鍵調節劑,將可能成為生物標記物的候選者[8]。
人類miR-146a-5p(hsa-miR-146a-5p)自2006年被David Baltimore實驗室在小鼠中鑒定發現后,其功能被一些研究證實在多種類型的癌癥中起抑制基因的作用[9-10]。但是,還有研究表明miR-146a-5p在多種類型的癌癥中起癌基因作用[11-12]。目前研究人員仍然對miR-146a-5p引起腫瘤的分子機制非常感興趣,如Li等[13]對miR-146a-5p在各種惡性腫瘤中的預后價值進行全面薈萃分析,提出miRNA可能是早期預測癌癥的突破口。
本研究中我們采用多種生物信息數據庫提取hsa-miR-146a-5p的靶基因數據交集,并對其進行全面的基因本體(gene ontology,GO)注釋分析和京都基因與基因組百科全書(Kyoto Encyclopedia of genes and genome,KEGG)通路富集分析,為未來對miR-146a-5p的靶基因分類鑒定及其在疾病中扮演的角色提供新的研究線索。
利用UCSC(http://genome.ucsc.ed)等在線數據庫查找hsa-miR-146a-5p的堿基序列、染色體定位、物種保守性等基本信息;miRbase(http://www.miR-base.org/)在線數據庫搜尋hsa-miR-146a-5p在染色體的分布位置;使用Clustal Omega軟件分析16個不同物種如智人(Homo sapiens)、黑猩猩(Pan troglodytes)、小家鼠(Mus musculus)、褐家鼠(Rattus norvegicus)、青鳉(Oryzias latipes)、家兔(Oryctolagus cuniculus)等的成熟序列的堿基信息并預測其保守性(表1)。
運用miGator v3.0數據庫(http://mirgator.obic.re.kr/)檢索hsa-miR-146a-5p在人類不同組織器官中的表達量,并且進行預測分析。該數據庫的測序數據均來自已發布的腫瘤基因圖譜(The Cancer Genome Atlas,TCGA)等的多個人類miRNA數據集。
通過最新版PubMed(https://pubmed.ncbi.nlm.nih.gov/)檢索近年來發表文獻得出,hsa-miR-146a-5p在轉錄后水平上介導調控相應的靶基因,涉及參與了一系列疾病的發展和預后療效的評價(表2)。采用 Targetscan7.1(http://www.targetscan.org /vert71/)、miRDB(http://www.mirdb.org/)、mirDIP(http://ophid.utoronto.ca /mirDIP /index confirm.jsp)和DIANA TOOLS(http://diana. Imis. athena-innovation.gr/Diana-Tools/index.php)4個在線靶基因預測工具預測靶基因,并用Venny 2.1(http://bioinfogp.cnb.csic.es/tools/venny /index.html)繪制4個數據庫預測靶基因的韋恩圖,取交集作為下一步靶基因數據集。將此數據集導入String 11.0數據庫(http://www.string-db.org)進行蛋白互作預測分析,然后結合Cytoscape-v3.6軟件構建靶基因編碼的蛋白間相互作用(protein-protein interaction,PPI)網絡圖。
運用Omicshare平臺工具(http://www.omicshare.com/)對韋恩圖的交集靶基因進行GO注釋分析。基于超幾何分布計算原理,從基因功能的3個方面:細胞組分(cellular component,CC)、分子功能(molecular function,MF)、生物學過程(biological process,BP),得到具有統計學意義的GO注釋顯著性分析(P<0.05)。同時,利用KOBAS數據庫(http://kobas.cbi.pku.edu.cn)對交集靶基因進行KEGG通路相關的具有統計學意義的富集分析(P<0.05為顯著性閾值)。
在線檢索miRBase、UCSC數據庫發現hsa-miR-146a-5p基因序列號為MIMAT0000449,定位于人類基因組chr5q33.3染色體(圖1),其基因位點在chr5:160 485 373~160 485 393之間。通過miR-Base 在線數據庫檢索miR-146a-5p成熟序列,結果顯示,已知的22個不同物種中存在成熟序列。我們下載了智人、小家鼠、褐家鼠、青鳉、家兔等16個不同物種的成熟序列(圖2)。Clustal Omega軟件預測結果表明,hsa-miR-146a-5p成熟序列“UGAGAACUGAAUUCCAUGGGUU”在16個物種之間具有高度的保守性(表1),提示hsa-miR-146a-5p可能具有潛在的生物學功能。

圖1 hsa-miR-146a-5p在人類基因組中所處的位置Fig. 1 The location of hsa-miR-146a-5p in the human genome

圖2 不同物種miR-146a-5p的成熟序列Fig. 2 Mature sequence of miR-146a-5p in different species
hsa-miR-146a-5p在人體部分組織器官的表達情況見圖3,其中在淋巴細胞表達豐富程度最高,但是在其他組織中的表達量很低。
利用新版PubMed、EBSCO快速全面檢索相關文獻,納入結果的文獻表明hsa-miR-146a-5p調控相應的靶基因參與了多種疾病以及多條信號通路(表2)。選用TargetScan、miRDB、mirDIP和DIANA TOOLS 4個在線數據庫預測的靶基因個數分別為283、488、828和853。最后通過在線軟件Venny2.1對上述4個數據集合繪制韋恩圖推導靶基因交集(圖4),以備后續數據分析,具體見表3。

表1 不同物種miR-146a-5p成熟序列Tab. 1 Mature sequence of miR-146a-5p in different species

表2 hsa-miR-146a-5p調控的靶基因參與人類疾病Tab. 2 hsa-miR-146a-5p target genes involved in human disease

圖3 hsa-miR-146a-5p 在各個組織器官中的表達情況Fig. 3 Expression analysis of hsa-miR-146a-5p in organs

表3 hsa-miR-146a-5p調控的靶基因數據集Tab. 3 Target gene data sets regulated by hsa-miR-146a-5p
將4個數據庫預測到的靶基因交集導入String 11.0,分析靶基因編碼蛋白質間的相互作用。然后,將String11.0分析結果結合Cytoscape_v3.8.0軟件構建PPI圖。PPI結果顯示,hsa-miR-146a-5p的靶基因編碼蛋白質間形成了復雜的網絡互作圖。紅色連線代表比綠色打分相對較高,說明蛋白相互作用更強;藍色圓圈代表靶基因編碼的蛋白節點(圖5)。
將韋恩圖交集得到的73個靶基因格式整理后提交到Omicshare Tools平臺。GO注釋分析結果表明:hsa-miR-146a-5p靶基因主要富集于細胞,包括細胞器、細胞膜及附近區域等14個細胞組分;涉及到22個生物學過程,包括細胞合成及代謝、應激反應、信號通路、正或負調控發育等;顯著富集于染色質結合、轉錄活性激活、結構分子活性激活、催化活性激活、轉錄因子活性配體激活等9個分子功能(圖6)。

圖4 hsa-miR-146a-5p的預測靶基因個數Fig. 4 Predicted number of target genes of hsa-miR-146a-5p

圖5 hsa-miR-146a-5p 預測靶基因所編碼蛋白質間的相互作用分析Fig. 5 Protein-protein interaction network of the target genes of hsa-miR-146a-5p
以人類全基因組為背景基因,利用KOBAS數據庫進行KEGG信號通路富集分析。Top 10 KEGG結果表明,hsa-miR-146a-5p 靶基因主要富集在Toll樣受體(Toll-like receptors,TLRs)信號通路、核轉錄因子-κB(nuclear factor-κB,NF-κB)信號通路、視黃酸誘導基因I樣受體(retinoic acid-inducible gene I like receptors,RLRs)信號通路中,以及包括病毒性乙肝、丙肝、瘧疾等疾病的相關通路中(P<0.05)(圖7)。

圖6 hsa-miR-146a-5p 靶基因的GO注釋分析Fig. 6 GO function analysis of hsa-miR-146a-5p target gene

圖7 hsa-miR-146a-5p靶基因的KEGG通路富集分析Fig. 7 KEGG pathway enrichment analysis of hsa-miR-146a-5p target gene
近年來,hsa-miR-146a-5p在癌癥、炎癥中的差異表達已經得到廣泛的研究[14-19],它是一種多效調節因子,但在一系列癌癥、炎癥反應中的作用尚未完全被人們了解[20-21]。目前,也缺乏對hsa-miR-146a-5p 潛在靶點和相關功能通路的全面分析。生物信息學能夠快速預測miRNA靶基因,同時將數據庫預測的靶基因取交集,具有更好的可靠性。在本研究中,我們不僅探討了hsa-miR-146a-5p的預期靶標集,還對其相關的富集功能進行了分析研究。
本研究分析發現miR-146a-5p的成熟序列在16個不同物種之間高度保守,推測hsa-miR-146a-5p可能具有重要的生物學功能,在機體中進行相關基本生理活動。同時,韋恩圖交集得到總共73個hsa-miR-146a-5p的靶基因,靶基因富集于細胞,包括細胞器、細胞膜及附近區域等14個細胞組分中。hsa-miR-146a-5p的靶基因顯著富集在機體代謝、炎癥刺激的免疫系統反應、信號傳導、發育過程以及正向或負向調控生物學等過程;同時,其也顯著富集在TLRs信號通路、NF-κB信號通路、RLPs信號通路等通路中。TLRs和RLPs是關鍵的先天免疫模式識別受體,一些研究發現miR-146a-5p能通過TLRs通路途徑誘導炎癥反應。例如Xu等[22]發現宿主細胞的miR-146a-5p能夠通過TLR7-MyD88介導細胞因子的產生;Feng等[23]運用miRNA芯片證實miR-146a促使白細胞的遷移;Hou等[24]揭示miR-146a在病毒感染過程中被上調,通過靶向TRAF6和IRAK1/2抑制視黃酸誘導基因I(retinoic acidinducible gene I,RIG-I)依賴性抗病毒信號途徑;Zhu等[25]和Meng等[26]在口腔癌、胰腺癌等臨床研究中證實了miR-146a-5p/NF-κB軸的重要調節機制。此外,miR-146a-5p對促進乙型肝炎病毒(hepatitis B virus, HBV)和丙型肝炎病毒(hepatitis C virus,HCV)的復制有積極影響,具有誘導肝損傷和癌變的發生風險[27-28]。特別是Van Loon等[29]報道miRNA-146a參與了針對瘧疾的先天免疫,推測它具有可能成為藥物靶標的潛力。
然而,hsa-miR-146a在不同類型腫瘤中異常表達的功能機制仍然不清楚。盡管Forloni等[30]揭示了miR-146a在黑色素瘤中高度上調可以促進腫瘤發生 ;Zhang等[31]報道miR-146a-5p在肝細胞癌中被下調并起抑癌的作用;而Huang等[32]在非小細胞肺癌研究中稱miR-146a-5p過表達能夠抑制癌血管生成和腫瘤的發生。另幾項研究還表明[33-34],miR-146a能夠通過NF-κB信號途徑抑制腫瘤擴散。但迄今為止,學者對hsa-miR-146a-5p的功能仍知曉甚少,因為人類中存在超過30%的基因受miRNA調控,其中miR-146a可以靶向數百個miRNA,并且能夠影響參與功能相互作用途徑的許多基因的表達,這種影響機制還有待進一步研究。
綜上所述,本文綜合運用生物信息學數據庫,預測和分析hsa-miR-146a-5p的保守性、GO注釋分析以及KEGG通路富集分析等方面,從而進一步探討hsa-miR-146a-5p在腫瘤發生、免疫應答及炎癥等中的潛在分子機制,為治療慢性炎癥、瘧疾、惡性腫瘤等疾病開辟了新的前景,對臨床治療的新療法提供了理論基礎。