李自青,閆玉清*,邢雁霞,解瑯明,韓飛宇,張年萍,5*
(1.山西大同大學醫學院,山西大同037009;2.山西大同大學呼吸病與職業病研究所,山西大同037009;3.哈爾濱師范大學生命科學與技術學院,黑龍江哈爾濱150025;4.山西威奇達光明制藥有限公司,山西大同037000;5.山西大同大學中西醫結合心血管病研究所,山西大同037009)
先天性心臟傳導阻滯(Congenital Heart Block,CHB)是一種完全性房室傳導阻滯的心臟病,一般在妊娠的18~24 周之間發生,主要表現是胎心緩慢,阻斷部位多位于房室結處,并伴有系統性紅斑狼瘡或干燥綜合征的發生。目前主要治療方法是兒童期手術,手術越早治療效果就越好,手術中有超過2/3 的患兒需要置入永久性心臟起搏器。此類手術不但費用高,而且術后還要面臨并發癥、后遺癥、起搏器損壞等隱患,極大地影響患兒的生活質量。藥物治療可以避免這些麻煩,但目前缺乏特異性治療藥物,輔助性治療藥物多為化學合成藥,藥效慢且效果不明顯,而且藥物的毒副作用大。因此對先天性心臟傳導阻滯相關蛋白藥物靶點的研究對特異性藥物的研發具有重要意義。
胎兒先天性心臟傳導阻滯的發生與母體抗Ro/SSA 和抗La/ SSB 抗體陽性相關。研究發現,母體相關性抗SSAGRo52 抗體可通過胎盤轉運進入胎兒體內,與胎兒心臟細胞的交叉反應分子特異性結合,引起心臟鈣離子通道異常和心肌細胞凋亡,從而引發一系列炎癥反應,使胎兒心臟鈣化和纖維化,造成Ⅱ度或者Ⅲ度房室傳導阻滯,而La 抗體可能依賴于Ro52 抗體發揮作用[1]。CHB 是一種進展性疾病,Ⅰ度傳導阻滯是CHB 的發病早期,Ⅱ度傳導阻滯在藥物干預下可能可逆,而完全性傳導阻滯是不可逆的。糖皮質激素在早期可能阻止疾病的進展,但療效并不確切[2]。確定特定疾病的靶標分子是現代新藥研發的基礎,藥物在體內的作用位點包括蛋白質和核酸等,其中絕大多數是蛋白質。目前,有關先天性心臟傳導阻滯的藥物作用靶點蛋白研究還不夠透徹。
本研究在構建CHB 相關蛋白陽性集合和候選陰性集合的基礎上,運用語義相似性計算兩個集合的功能相似性,預測出20 個潛在的藥物靶點,并利用多個數據庫對預測的蛋白及編碼基因進行富集分析,挖掘潛在的CHB 藥物靶點的功能、通路、MicroRNA、SNP,為特異性藥物的研發奠定基礎。
本研究時間為201609—201812月。
以“Congenital Heart Block”“association study”“genetic association”為檢索詞在 NCBI 中 PubMed 數據庫查找相關文獻571 篇(圖1),論文入選標準見文獻[3],通過全文閱讀得到與CHB 直接相關的基因21個,構建CHB陽性集合。

圖1 文獻檢索流程
在 DrugBank 數據庫中以“atrioventricular block”“heart block”“cardiac conduction”或“congenial heart block”多個檢索詞進行檢索,獲取與CHB疾病相關的藥物及其作用靶點,刪除信息項和重復數據,得到601 種藥物和685 個相關蛋白。通過疾病間臨床遺傳表型的相似性對預處理過的數據進行優化和篩選,以CHB 與心律失常、心臟衰竭存在的關聯信息和疾病間信息作為篩選標準,篩選出156 個CHB 相關基因構建CHB 候選陰性集合。
通過在線網絡平臺GOEAST 富集分析GO 數據庫中的生物學過程分支,將基因集轉換為GO 節點集。通過比較兩個GO 節點集的相似性可以得出兩個基因集合的語義相似性,GO 節點集相似性算法參照Lin[4]算法,得分越高,兩個集合間功能就越相似。
在全基因組中隨機選取與所研究的基因集合容量一樣大的基因集合2 個,選取100 次,計算其相似性得分,將CHB陽性基因集合和陰性基因集合的相似性得分與隨機得分進行permutation test 檢驗,當P<0.05時,差異顯著。
Endeavour[5]是對候選基因進行優先排序的網絡資源。使用一組已知參與生物學過程的基因,即CHB 陽性基因集,選擇研究對象物種,包括小家鼠、褐家鼠、秀麗隱桿線蟲、人類,提交已知基因,選擇數據庫,包括本體和注釋、蛋白質-蛋白質相互作用、順式調控信息、基因表達數據集、序列信息和文本挖掘數據庫,作為CHB候選基因優化的參照標準,最后提交候選基因。根據已知基因的特征對候選基因進行排序,將幾個排名合并到候選基因的全局排名中,從而獲得候選基因的優化排序結果。
GeneCodis[6]是對基因進行功能注釋的網絡平臺,整合了多個數據庫包括GO、KEGG和SwissProt,可實現對候選基因的GO、通路、SNP、microRNA等富集分析,并通過統計的顯著性進行排序。使用方法與Endeavour類似。
通過語義相似性計算得出CHB 陽性基因集與候選陰性基因集的相似性得分是0.596,而兩個隨機基因集合的平均得分是0.144,P值為0,差異倍數(fold-change,FC)為4.15,相似性得分顯著高于隨機水平,差異極顯著。表明CHB陽性集與候選陰性集的功能具有相關性。
運用Endeavour 網絡平臺從已知基因間的相似性出發優化候選基因,在排序結果中抽取前20 個基因作為可能的CHB 藥物靶點進行下一步富集分析(表1)。

表1 候選基因集中排序前20的基因及編碼蛋白
通過GO 數據庫對這20 個藥物靶點的編碼基因進行注釋,從分子功能、參與的生物學過程及細胞中的定位三方面進行富集分析(見圖2 ~4)。結果表明,20 個基因的功能更多的與離子轉運通道有關,參與的過程主要集中于生理過程,蛋白主要定位于細胞和膜上。同時,以整個候選陰性集中所有蛋白的GO 功能分類為背景,這些功能活性也都排在前列。由此可見20 個基因具有代表性,有可能是潛在的與CHB 直接相關的藥物靶點。

圖2 20個基因所對應蛋白的GO主要功能分類

圖3 20個基因所對應蛋白的GO主要過程分類

圖4 20個基因所對應蛋白的GO主要定位分類
運用GeneCodis進行通路富集分析(圖5),所富集的通路信息來源于KEGG。結果表明,候選的陰性基因集中有18 個基因富集在鈣信號傳導通路(KEGG 04020),16 個基因富集在MAPK 信號通路(KEGG 04010),15個基因富集在肥厚性心肌病信號通路(KEGG 05410),14個基因富集在致心律失常性右心室心肌病信號通路(KEGG 05412)和擴張性心肌病信號通路(KEGG 05411)。這些結果進一步表明CHB與心律失常、心臟衰竭等心肌病存在關聯。

圖5 每條通路注釋的基因數
運用GeneCards 數據庫[7]對所預測的20 個候選基因進行SNP信息檢索,共檢索到4 538個SNP,其中富集次數大于100次的SNP有11對(見圖6),C/T富集次數最多為773次,其次是G/A為623次,A/G為569次。
microRNA 富集分析發現,20 個候選基因主要富集于hsa-miR-770-5p、hsa-miR-519e、hsa-miR-660 和hsa-miR-587 上。隨后對整個候選陰性集中的基因進行microRNA 富集,文章列舉富集基因數大于13 個的microRNA,其中有15 個基因富集在hsa-miR-770-5p 上,為下一步microRNA 的研究提供了方向。

圖6 20個候選基因所富集的SNP
藥物作用靶點的研究為新藥研發和疾病治療提供非常重要的依據,但目前針對CHB藥物作用靶點的研究還不系統深入,治療CHB也缺乏特異性藥物。雖然已有的研究發現SSA/Ro(52-kDa)、SSA/Ro(60-kDa)、α1-腎上腺素受體、β2-腎上腺素受體以及La/SSB 這些母體自身抗體與CHB 密切相關[8],但僅從已知數據中研究CHB 藥物作用靶點,顯然具有很大的局限性。
本研究通過CHB 與心律失常和心臟衰竭存在的疾病關聯出發,從Drugbank數據庫中檢索并初步注釋優化篩選出156 個CHB 相關基因作為CHB 的候選陰性集合。通過語義相似性計算證明CHB 陰性基因集合與CHB 陽性基因集合之間功能高度相似,進一步運用Endeavour 對候選基因進行優化排序和GO富集分析,發現其中有20個基因編碼蛋白是CHB潛在的藥物作用靶點蛋白,功能主要與離子通道轉運有關,參與的生物學過程主要是生理過程,蛋白更多定位于細胞膜中。通路富集分析也發現CHB候選基因更多參與鈣離子信號傳導通路,與功能富集分析的結果一致,而鈣信號傳導通路也是目前研究較多并且認為與CHB相關的信號通絡[9]。SNP(single nucleotide polymorphism) 是單個核苷酸的改變引起的DNA 序列多態性,已有的研究發現SNP和microRNA 的表達與心血管疾病的發病有關[10-11]。本研究對候選基因進行的SNP 及microRNA 富集分析,將為今后研究SNP 及microRNA 與先天性心臟傳導阻滯的關系提供參考。
本研究運用生物信息學方法研究CHB 相關的藥物作用靶點及其相關通路,從生物大數據出發,考慮到疾病之間的關聯和相互影響,為下一步的特異性藥物的研發提供新的研究方向。本研究運用的語義相似性和富集分析的研究方法為其他疾病相關蛋白的研究提供參考。但本實驗對研究結果沒有進行驗證,缺乏實驗數據支持,還需要進一步研究。