李丹輝 朱建華 樂健偉 王志宇 葉繼輝 范震
急性心肌梗死相關(guān)基因的生物信息學分析
李丹輝 朱建華 樂健偉 王志宇 葉繼輝 范震
目的 從基因水平揭示心肌梗死的發(fā)病機制,為心肌梗死的基礎(chǔ)研究和臨床治療提供新思路。方法 從基因芯片公共數(shù)據(jù)庫GEO(gene expression omnibus,GEO)中下載心肌梗死相關(guān)基因芯片數(shù)據(jù),利用GENE-E進行差異基因分析,篩選出在心肌梗死患者中具有的差異表達基因,采用Panther、String等在線分析軟件對差異表達基因進行生物信息學分析。結(jié)果 在200個差異表達基因所編碼的蛋白中,有168個存在蛋白與蛋白的相互作用關(guān)系;其生物學通路主要涉及細胞凋亡通路、表皮生長因子受體信號通路等。結(jié)論 通過生物信息學分析心肌梗死相關(guān)基因芯片數(shù)據(jù),提示心肌梗死發(fā)病是多種基因作用的結(jié)果,EPHB1,GRM6,CD2BP2在心肌梗死患者外周血中高表達,對相關(guān)基因的進一步分析有利于揭示心肌梗死的發(fā)病機制,從而為心肌梗死患者的早期篩查提供新的分子標志物。
心肌梗死 基因芯片 生物信息學
心肌梗死是由于冠狀動脈閉塞、血流中斷所導(dǎo)致的心肌細胞損傷和壞死。缺血可引起活性氧積聚,細胞膜穩(wěn)定性受到破壞,細胞內(nèi)大量活性酶釋放,最終導(dǎo)致心肌細胞凋亡、壞死。同時心肌梗死可致心肌細胞肥大增生、心室重構(gòu)和心力衰竭而引發(fā)死亡[1-2]。
近年來,隨著基因芯片技術(shù)的發(fā)展和應(yīng)用,產(chǎn)生了大量的基因表達譜數(shù)據(jù)。如何從這些數(shù)據(jù)挖掘出有價值的信息,已成為當今研究的一個熱點[3-4]。本研究通過對基因芯片公共數(shù)據(jù)庫(gene expressionomnibus,GEO)中的心肌梗死患者外周血標本的芯片數(shù)據(jù)進行生物信息學分析,以期為心肌梗死患者的早期篩查提供新的分子標志物。
1.1 一般資料 在GEO Datasets搜索框中以“heart disease”為檢索詞,獲得Suresh R等提交的GSE48060芯片數(shù)據(jù)。該研究采用的是商業(yè)化的離子通道芯片平臺GPL570,共收集52例患者外周血進行基因分析,排除既往有腫瘤、肝病、腦梗死以及風濕系統(tǒng)等疾病,其中急性心肌梗死組來自31個急性心肌梗死患者的外周血標本,對照數(shù)據(jù)來自21個非心肌梗死患者的外周血標本。其中急性心肌梗死組共31例,分別為GSM1167072、GSM1167073、GSM1167074、GSM1167075、GSM1167076、GSM1167077、GSM1167078、GSM1167079、GSM1167080、GSM1167081、GSM1167082、GSM1167083、GSM1167084、GSM1167085、GSM1167086、GSM1167087、GSM1167088、GSM1167089、GSM1167090、GSM1167091、GSM1167092、GSM1167093、GSM1167094、GSM1167095、GSM1167096、GSM1167097、GSM1167098、GSM1167099、GSM1167100、GSM1167101、GSM1167122;對照組為21例,分別為GSM1167102、GSM1167103、GSM1167104、GSM1167105、GSM1167106、GSM1167107、GSM1167108、GSM1167109、GSM1167110、GSM1167111、GSM1167112、GSM1167113、GSM1167114、GSM1167115、GSM1167116、GSM1167117、GSM1167118、GSM1167119、GSM1167120、GSM1167121、GSM1167123。
1.2 方法
1.2.1 差異基分析 采用GENE-E軟件分析GEO數(shù)據(jù)庫中的數(shù)據(jù),先將數(shù)據(jù)集導(dǎo)入GENE-E軟件,采用兩組樣本t檢驗統(tǒng)計方法,對數(shù)據(jù)進行有效過濾,篩選出差異基因后進行生物信息學分析。
1.2.2 差異基因編碼蛋白的相互作用分析 將上述差異性基因篩選后上傳至String 10.0在線分析工具(http://string-db.org),分析其所編碼的蛋白,獲得差異表達基因的蛋白相互作用圖,篩選出中心節(jié)點蛋白[5-6]。
1.2.3 差異基因的功能分析 將篩選出的差異基因上傳至Panther數(shù)據(jù)庫(http://pantherdb.org),對這些差異基因分別采用信號通路(Pathway)、生物學過程(Biological Process)及分子功能(Molecular Function)等進行分析[7-8]。

圖1 差異基因表達
2.1 兩組一般資料比較 兩組患者在年齡、性別、高脂血癥、糖尿病、心血管家族史及合并用藥方面差異比較均無統(tǒng)計學意義(均P>0.05)。兩組高血壓、吸煙史及BMI比較差異均有統(tǒng)計學意義(P<0.05或0.01)。
2.2 差異基因篩選結(jié)果 從GSE48060數(shù)據(jù)中篩選出的差異基因,經(jīng)篩選后,最終選出了13個可能和急性心肌梗死相關(guān)的基因(圖 1),其中 EPHB1、GRM6、CD2BP2在表達上調(diào),IL-2RB、PRF1、GZMB、KLRD1、YES1、PPM1L、P2RY12,ADCY7、RBM5及 PCBP2表達下調(diào)。
2.3 差異基因編碼蛋白的相互作用分析通過String 10在線分析 工具進行分析,發(fā)現(xiàn)168個蛋白之間存在相互作用(圖2)。其中,RPL38等51個基因的蛋白與其它蛋白存在相互作用關(guān)系,為此蛋白互作網(wǎng)絡(luò)的中心節(jié)點,刪除這些節(jié)點蛋白后,網(wǎng)絡(luò)結(jié)構(gòu)渙散。
2.4 差異基因的生物學功能分析結(jié)果 通過Panther生物學過程分析表明,差異表達的基因主要涉及細胞生理過程、代謝過程、生長發(fā)育過程等(圖3)。
另外,Panther分子學功能分析發(fā)現(xiàn)差異表達的基因主要涉及分子黏附、催化活性及受體活性等(圖4)。
心血管疾病是當今全球人群的首要死因,急性心肌梗死是嚴重危害人類健康的心血管急癥,目前大量研究從流行病學、病理生理學、分子生物學等方法揭示急性心肌梗死的發(fā)病機制,并取得了重大進展[9]。
基因表達譜從生物信息學方面研究急性心肌梗死的發(fā)病機制,對基因芯片數(shù)據(jù)進行后續(xù)的生物學探討,是目前挖掘基因芯片數(shù)據(jù)在急性心肌梗死機制研究中的重要方向。本研究通過生物信息學軟件對芯片數(shù)據(jù)(GSE48060)進行分析,在200個明顯差異基因中篩選出168個差異表達基因,并對這些差異基因進行篩選以及蛋白相互作用分析,篩選出了13個可能和急性心肌梗死相關(guān)的核心基因。在分析過程中,我們發(fā)現(xiàn)相對于對照組,EPHB1、GRM6、CD2BP2在心肌梗死組表達量均上調(diào),而 IL2RB、PRF1、GZMB、KLRD1、YES1、PPM1L、P2RY12,ADCY7、RBM5及PCBP2則總體上在心肌梗死組表達均下調(diào)。此外,對上述這些表達差異明顯的基因深人研究后,發(fā)現(xiàn)除P2RY12與心血管疾病的關(guān)系已有文獻報道外[10-11],其他基因與心血管疾病的關(guān)系未做類似的研究,它們的具體作用機制尚不明確。

圖2 差異基因編碼蛋白的相互作用分析

圖3 差異基因生物學功能

圖4 差異基因分子學功能
本研究發(fā)現(xiàn)EPHB1、GRM6、CD2BP2在急性心肌梗死患者外周血中高表達,EPHB1主要表達于血小板上,血小板除了表達EPHB1外,還表達EphA4及配體ephrinB1。Eph/ephrin信號增強血小板激動劑引起聚集,并提高細胞內(nèi)的Ca2+,通過激活RAP1、EPHB1、EphB2以及EphB4,進而導(dǎo)致血小板的活化、聚集,最終導(dǎo)致血栓形成[12-13]。GRM6是一種蛋白質(zhì)編碼基因,主要與夜盲癥、先天性靜止性夜盲癥等疾病發(fā)生有關(guān),其通過G蛋白偶聯(lián)受體活性和谷氨酸受體活性發(fā)揮作用。CD2BP2(CD2胞質(zhì)尾結(jié)合蛋白2)能編碼雙功能蛋白質(zhì),在細胞核中是U5小核糖核蛋白復(fù)合物的組成部分,參與RNA剪接,在細胞質(zhì)中通過調(diào)節(jié)T淋巴細胞的活化,參與免疫調(diào)節(jié)。因此,我們推測活化的EPHB1可能通過誘導(dǎo)血小板的活化、聚集,最終導(dǎo)致心肌梗死的發(fā)生,但目前相關(guān)研究仍尚無報道,因此,需進一步臨床研究對該基因進行驗證。
綜上所述,我們采用生物信息學方法通過對心肌梗死患者外周血基因芯片差異基因的篩選,以及對其分子功能、生物學功能分析,最終篩選出13個可能與急性心肌梗死相關(guān)的核心基因,其中EPHB1、GRM6、CD2BP2在心肌梗死組表達均上調(diào),IL2RB、PRF1、GZMB、KLRD1、YES1、PPM1L、P2RY12,ADCY7、RBM5 及 PCBP2在心肌梗死組表達均下調(diào),本文存在不足之處主要是缺乏體內(nèi)外大量實驗研究對上述基因進行驗證,并且得以證實,從而為心肌梗死患者的早期篩查及發(fā)病機制提供新的思路。
[1] 侍作勝,王臨光.急性冠脈綜合征的診斷和治療[M].中國礦業(yè)大學出版社,2005:2-39.
[2] Wang J C,Normand S L,Mauri LWangJ C,et al.Coronary artery spatialdistribution ofacute myocardialinfarction occlusions[J].Circulation,2004,110(3):278-284.doi:10.1161/01.CIR.0000135468.67850.F4.
[3] Turner F S,Clutterbuck D R,Semple C A.POCUS:mining genomic sequence annotation to predict disease genes[J].Genome Biol,2003,4(11):R75.doi:10.1186/gb-2003-4-11-r75.
[4] 余海浪,馬文麗,鄭文嶺.用于基因數(shù)據(jù)挖掘的基因表達數(shù)據(jù)庫GEO[J].中國生物工程雜志,2007,8:96-103.
[5] SalwinskiL,Miller C S,Smith A J,et al.The Database of Interacting Proteins:2004 update[J].Nucleic Acids Res,2004,32:D449-451.doi:10.1093/nar/gkh086.
[6] Mishra G R,Suresh M,Kumaran Ketal.Human protein reference database--2006 update[J].Nucleic Acids Res,2006,34(Database issue):D411-414.doi:10.1093/nar/gkj141.
[7] Ashburner M,BallC A,Blake J A,et al.Gene ontology:toolfor the unification of biology[J].Nat Genet,2000,25(1):25-29.doi:10.1038/75556.
[8] Carbon S,Ireland A,MungallC J,etal.AmiGO:online access to ontology and annotation data[J].Bioinformatics,2009,25(2):288-289.doi:10.1093/bioinformatics/btn615.
[9] 王泳欽,錢令嘉,姚林,等.代謝組學在心血管疾病研究中的應(yīng)用[J].現(xiàn)代預(yù)防醫(yī)學,2009,36(6):1172-1173.
[10] Kerneis M,Silvain J,Abtan J,et al.Platelet effect of prasugrel and ticagrelor in patients with ST-segment elevation myocardial infarction[J].Arch Cardiovasc Dis,2015,108(10):502-510.doi:10.1016/j.acvd.2015.04.004.
[11] Ulehlova J,Slavik L,Kucerova J,et al.Genetic polymorphisms of platelet receptors in patients with acute myocardial infarction and resistance to antiplatelet therapy[J].Genet Test Mol Biomarkers,2014,18(9):599-604.doi:10.1089/gtmb.2014.0077.
[12] Prévost N,Woulfe D S,Tognolini M,et al.Signaling by ephrinB1and Eph kinases in platelets promotes Rap1 activation,platelet adhesion,and aggregation via effector pathways that do not require phosphorylation of ephrinB1[J].Blood,2004,103(4):1348-1355.doi:10.1182/blood-2003-06-1781.
[13] Prevost N1,Woulfe D,Tanaka T,et al.Interactions between Eph kinases and ephrins provide a mechanism to support platelet aggregation once cell-to-cell contact has occurred[J].Proc Natl Acad Sci U S A,2002,99(14):9219-9224.doi:10.1073/pnas.142053899.
Bioinformatic analysis of genes associated with acute myocardial infarction
LI Danhui,ZHU Jianhua,LE Jianwei,et al.
Intensive Care Unit,Ningbo First Municipal Hospital,Ningbo 315000,China
Objective To perform bioinformatic analysis of genes associated with acute myocardial infarction. Methods The microarray data of myocardial infarction were downloaded from the Gene Expression Omnibus(GEO)database,and Qlucore Omics Explorer software was used to screen differentially expressed genes.The further analysis of differentially expressed genes were conducted by the on-line tools STRING and Panther. Results Among 200 differentially expressed genes,168 genes were related to interaction between proteins.These genes were involved in the biological process and molecular function of apoptosis signaling pathway and epithelial growth factor(EGF)receptor signaling pathway and so on.The analysis found that EPHB1,GRM6 and CD2BP2 genes were highly expressed in peripheral blood of patients with acute myocardial infarction.Conclusion Bioinformatic analysis shows that acute myocardial infarction may involve the interaction of multiple genes,which may provide useful information for studies on molecular mechanisms and potential therapeutic targets of acute myocardial infarction.
Myocardialinfarction Bioinformatics Gene microarray
10.12056/j.issn.1006-2785.2017.39.23.2016-1582
315000 寧波市第一醫(yī)院重癥醫(yī)學科
朱建華,E-mail:19132411@qq.com
2016-10-08)
沈昱平)