張麗杰,裴智勇,馬 躍,陳禹保,4△
(1.北京市計算中心 100094;2.云計算關鍵技術與應用北京市重點實驗室 100094;3.北京小湯山醫院 102211;4.北京市測序與功能分析工程技術研究中心 100094)
?
·論 著·
2型糖尿病易感基因代謝通路生物信息學研究*
張麗杰1,2,裴智勇1,2,馬 躍3,陳禹保1,2,4△
(1.北京市計算中心 100094;2.云計算關鍵技術與應用北京市重點實驗室 100094;3.北京小湯山醫院 102211;4.北京市測序與功能分析工程技術研究中心 100094)
目的 構建中國人群中2型糖尿病易感基因的代謝通路。方法 采用2型糖尿病的易感基因集合,基于商用數據庫Ingenutiy Pathway Analysis(后簡稱IPA)中的Right-Tailed Fisher′s Exact Test算法進行統計分析,找到與糖尿病相關的代謝通路,并從中篩選出15個與中國人群糖尿病相關的易感基因,根據易感基因建立代謝通路,探討中國人群易感基因之間在生物學上的關聯關系。結果 KCNQ1、PPARG、IRS1、ADIPOQ等基因位于多條代謝通路的節點位置,與多條代謝通路相關。結論 KCNQ1、PPARG、IRS1、ADIPOQ等基因在中國人群2型糖尿病的發生過程中起到了關鍵作用。該研究結果對基于代謝通路研究復雜性疾病具有很好的借鑒意義。
2型糖尿病; 易感基因; 代謝通路
2型糖尿病是1種多基因遺傳性疾病,一般認為,其發生有多源性,是環境因素和遺傳因素共同作用的結果[1-2]。群體遺傳分析表明,單個易感基因位點對患者的表型僅具有微效作用,只有多個位點協同作用才顯著影響人群糖代謝表型[3-5]。已鑒定的GWAS信號多數定位于非編碼區域(或調控區域),可能通過影響易感基因的表達調控過程導致差異[6]。在細胞內,基因或蛋白質通常彼此相互作用形成復合物或共同參與某些通路,而非單獨作用發揮生物學功能[7]。2型糖尿病作為復雜疾病,通常認為為多種因素共同作用的結果。已經證實TCF7L2是2型糖尿病的易感基因之一,它一方面參與胰腺beta細胞的功能發揮;另一方面,作為1個轉錄因子,它也參與Wnt/beta-catenin信號通路中[8]。目前,多數易感位點的功能及代謝通路機制仍不明確,因此,建立易感基因通路模型,探討易感基因的治病過程,是后期糖尿病研究的核心之一。
1.1 一般資料 2型糖尿病的易感基因集主要來自3個方面。PharmGKB數據庫(網址為https://www.pharmgkb.org)[9],該數據庫能夠顯示與文獻、通路表征、試驗方案信息整合的基因型、分子和臨床原始數據,筆者從該數據庫中搜索到與2型糖尿病直接相關的基因信息和通路信息。Ingenuity Pathway Analysis(后簡稱IPA)商用數據庫(網址為http://www.ingenuity.com),為現有的最大的基因、蛋白及通路注釋、研究互作效應的生物學知識數據庫。A Catalog of Published Genome-Wide Association Studies公開數據庫(網址:http://www.genome.gov/gwastudies)[10],可從已發表的基因組范圍關聯研究中,調查與形狀/疾病有關的單核苷酸多態性基因組特征。
1.2 方法
1.2.1 易感基因信息整理 通過上述的3種數據源共得到371個基因與2型糖尿病之間存在直接或間接的關聯關系,見表1(見《國際檢驗醫學雜志》網站主頁“論文附件”)。這些易感基因的相關報道研究主要集中在歐洲、亞洲和拉丁美洲,通過試驗得到驗證的易感基因位點數目超過200個,且涉及變異位點、效應大小、致病機制與關聯性各不相同[11-13]。
1.2.2 通路信息整理 將步驟1.2.1中整理到的糖尿病易感基因輸入IPA中,查找易感基因所對應的代謝通路信息,最終將371個基因映射于226條代謝通路。見表2(見《國際檢驗醫學雜志》網站主頁“論文附件”)。
1.2.3 構建中國人群中糖尿病易感基因代謝通路 采用IPA中的Core Analysis方法將371個基因按照代謝通路進行分類,采用Right-Tailed Fisher′s Exact Test 算法進行顯著性分析,查找這些基因中與中國人群糖尿病相關的易感基因,及已在中國人群中得到驗證糖尿病易感基因。篩選出15個易感基因與中國人群2型糖尿病相關,包括ADIPOQ、CDH13、CDKN2B、GLIS3、GRB14、HHEX、HNF1A、IRS1、KCNQ1、PAX4、PEPD、PPARG、RASGRP1、SLC30A8、TCF7L2[14-33]。將中國人群2型糖尿病易感基因作為輸入基因,于IPA中構建基因對應的代謝通路,觀察易感基因在代謝通路過程中的關聯性。
2.1 糖尿病易感基因集代謝通路分析 為將糖尿病易感基因集進行代謝通路富集分析,筆者將371個易感基因數據上傳于IPA中,并將其映射到對應生物學通路中進行代謝通路分析。最終得到了9個與2型糖尿病顯著相關的代謝通路(P<0.05),見表3。其中,糖尿病易感基因集對應代謝通路中顯著性最高為MODY Signaling信號通路,表明糖尿病的發生可能最先影響(最易受影響)的是MODY Signaling信號通路。影響顯著的通路還包括G-Protein Coupled Receptor Signaling和Insulin Receptor Signaling信號通路等。從相關信號通路中發現,有些信號通路不僅和糖尿病相關,同時還與精神分裂等其他疾病相關[34]。

表3 糖尿病易感基因集生物通路

表4 中國人群中易感基因生物通路分布
2.2 中國人群中糖尿病易感基因通路分布 將中人群中與糖尿病相關易感基因進行通路分析,15個基因中有9個基因(ADIPOQ、CDH13、CDKN2B、GRB14、HNF1A、IRS1、PPARG、RASGRP1、TCF7L2)與代謝通路相關,其余6個基因(PEPD、PAX4、KCNQ1、GLIS3、HHEX、SLC30A8)目前暫無代謝通路相關信息。見表4。

圖1 中國人群中易感基因通路分析圖
2.3 中國人群糖尿病易感基因通路關聯分析 從步驟2.2中分析可見,從中國人群15個易感基因中,有6個易感基因目前暫未發現代謝通路相關信息。為分析其與已有代謝通路易感基因間的相互關系,筆者采用IPA對中國人群15個糖尿病易感基因進行代謝通路分析,確定易感基因間是否在生物代謝過程中存在關聯關系。通過IPA的Core Analysis模塊分析,獲得代謝通路圖,見圖1(圖中實線代表直接關聯關系,虛線代表間接關聯關系)。其中,PPARG、IRS1、ADIPOQ等基因與其他的基因和通路間存在復雜關聯,處于生物通路的節點位置,并與胰島素的合成及AMPK等代謝通路之間存在直接或間接關系。雖然KCNQ1基因所在生物學通路暫無相關試驗證明,但從通路圖中可見,KCNQ1基因也與胰島素合成存在關聯。
本研究采用生物信息學和統計學方法分析了糖尿病中易感基因的代謝通路。搜集和整理目前與糖尿病相關易感基因(共找到371個基因),從中篩選出15個與中國人群糖尿病相關易感基因,確定其中有9個基因存在代謝通路相關信息。為分析15個易感基因間在代謝通路方面是否存在關聯,成功構建中國人群易感基因的代謝通路圖,并從中發現PPARG、KCNQ1、IRS1、ADIPOQ等基因間存在復雜的代謝通路相關性(如PPARG與AMPK信號通路、胰島素合成、ERK等信號通路均存在直接或間接的關系)。該結果對于基于通路分析方法破譯疾病中各種基因的協調和功能作用提供了借鑒和指導。此外,筆者所構建的通路相互作用網絡提示許多糖尿病易感基因參與不同的代謝通路,且具有多效性,其編碼蛋白可能是治療多種復雜疾病的候選藥物靶點。
[1]Risérus U,Willett WC,Hu FB.Dietary fats and prevention of type 2 diabetes[J].Prog Lipid Res,2009,48(1):44-51.
[2]Ripsin CM,Kang H,Urban RJ.Management of blood glucose in type II diabetes mellitus[J].Am Fam Physician,2009,79(1):29-36.
[3]Willer CJ,Speliotes EK,Loos RJ,et al.Six new loci associated with body mass index highlight a neuronal influence on body weight regulation[J].Nat Genet,2009,41(1):25-34.
[4]Heid IM,Jackson AU,Randall JC,et al.Meta-analysis identifies 13 new loci associated with waist-hip ratio and reveals sexual dimorphism in the genetic basis of fat distribution[J].Nat Genet,2010,42(11):949-960.
[5]Scherag A,Dina C,Hinney A,et al.Two new Loci for body-weight regulation identified in a joint analysis of genome-wide association studies for early-onset extreme obesity in French and German study groups[J].PLoS Genet,2010,6(4):e1000916.
[6]Scuteri A,Sanna S,Chen WM,et al.Genome-wide association scan shows genetic variants in the FTO gene are associated with obesity-related traits[J].PLoS Genet,2007,3(7):e115.
[7]Barabasi AL,Oltvai ZN.Network biology:understanding the cell′s functional organization[J].Nat Rev Genet,2004,5(2):101-113.
[8]Struewing I,Boyechko T,Barnett C,et al.The balance of TCF7L2 variants with differential activities in Wnt-signaling is regulated by Lithium in a GSK3beta-independent manner[J].Biochem Biophys Res Commun,2010,399(2):245-250.
[9]Whirl-Carrillo M,Mcdonagh EM,Hebert JM,et al.Pharmacogenomics knowledge for personalized medicine[J].Clin Pharmacol Therap,2012,92(4):414-417.
[10]Hindorff LA,Sethupathy P,Junkins HA,et al.Potential etiologic and functional implications of genome-wide association loci for human diseases and traits[J].Proc Natl Acad Sci USA,2009,106(23):9362-9367.
[11]丁曉慧,楊澤.2型糖尿病易感基因研究進展[J].中國糖尿病雜志,2010,18(4):311-313.
[12]王旭東,丁顯平.2型糖尿病相關基因研究進展[J].中國優生與遺傳雜志,2006,14(1):4-5.
[13]陸鳳,錢云,沈洪兵.2型糖尿病的全基因組關聯研究進展[J].中華疾病控制雜志,2012,16(11):989-994.
[14]Wang K,Li WD,Zhang CK,et al.A genome-wide association study on obesity and obesity-related traits[J].PLoS One,2011,6(4):e18939.
[15]Okada Y,Kubo M,Ohmiya H,et al.Common variants at CDKAL1 and KLF9 are associated with body mass index in East Asian populations[J].Nat Genet,2012,44(3):302-306.
[16]Fox CS,Liu Y,White CC,et al.Genome-wide association for abdominal subcutaneous and visceral adipose reveals a novel locus for visceral fat in women[J].PLoS Genet,2012,8(5):e1002695.
[17]Zabaneh D,Balding DJ.A genome-wide association study of the metabolic syndrome in Indian Asian men[J].PLoS One,2010,5(8):e11961.
[18]Freathy RM,Mook-Kanamori DO,sovio U.Variants in ADCY5 and near CCNL1 are associated with fetal growth and birth weight[J].Nat Genet,2010,42(5):430-435.
[19]Li H,Gan W,Lu L,et al.A genome-wide association study identifies GRK5 and RASGRP1 as type 2 diabetes loci in Chinese Hans[J].Diabetes,2013,62(1):291-298.
[20]Yasuda K,Miyake K,Horikawa Y,et al.Variants in KCNQ1 are associated with susceptibility to type 2 diabetes mellitus[J].Nat Genet,2008,40(9):1092-1097.
[21]Ma RC,Hu C,Tam CH,et al.Genome-wide association study in a Chinese population identifies a susceptibility locus for type 2 diabetes at 7q32 near PAX4[J].Diabetologia,2013,56(6):1291-1305.
[22]Hu C,Zhang R,Wang C,et al.Variants from GIPR,TCF7L2,DGKB,MADD,CRY2,GLIS3,PROX1,SLC30A8 and IGF1 are associated with glucose metabolism in the Chinese[J].PLoS One,2010,5(11):e15542.
[23]Hu C,Zhang R,Wang CR,et al.PPARG,KCNJ11,CDKAL1,CDKN2A-CDKN2B,IDE-KIF11-HHEX,IGF2BP2 and SLC30A8 are associated with type 2 diabetes in a Chinese population[J].PLoS One,2009,4(10):e7643.
[24]Wang C,Hu C,Zhang R,et al.Common variants of hepatocyte nuclear factor 1beta are associated with type 2 diabetes in a Chinese population[J].Diabetes,2009,58(4):1023-1027.
[25]Xiang J,Li XY,Xu M,et al.Zinc transporter-8 gene (SLC30A8) is associated with type 2 diabetes in Chinese[J].J Clin Endocrinol Metab,2008,93(10):4107-4112.
[26]Xu M,Bi Y,Xu Y,et al.Combined effects of 19 common variations on type 2 diabetes in Chinese:results from two community-based studies[J].PLoS One,2010,5(11):e14022.
[27]Wu Y,Li H,Loos RJ,et al.Common variants in CDKAL1,CDKN2A/B,IGF2BP2,SLC30A8,and HHEX/IDE genes are associated with type 2 diabetes and impaired fasting glucose in a Chinese Han population[J].Diabetes,2008,57(10):2834-2842.
[28]Liu Y,Liu Z,Song YQ,et al.Meta-analysis added power to identify variants in FTO associated with type 2 diabetes and obesity in the Asian population[J].Obesity,2010,18(8):1619-1624.
[29]Liu Y,Yu L,Zhang D,et al.Positive association between variations in CDKAL1 and type 2 diabetes in Han Chinese individuals[J].Diabetologia,2008,51(11):2134-2137.
[30]Wen J,Ronn T,Olsson A,et al.Investigation of type 2 diabetes risk alleles support CDKN2A/B,CDKAL1,and TCF7L2 as susceptibility genes in a Han Chinese cohort[J].PLoS One,2010,5(2):e9153.
[31]Ng MC,Tam CH,Lam VK,et al.Replication and identification of novel variants at TCF7L2 associated with type 2 diabetes in Hong Kong Chinese[J].J Clin Endocrinol Metab,2007,92(9):3733-3737.
[32]Ng MC,Park KS,Oh B,et al.Implication of genetic variants near TCF7L2,SLC30A8,HHEX,CDKAL1,CDKN2A/B,IGF2BP2,and FTO in type 2 diabetes and obesity in 6 719 Asians[J].Diabetes,2008,57(8):2226-2233.
[33]Chang YC,Chang TJ,Jiang YD,et al.Association study of the genetic polymorphisms of the transcription factor 7-like 2(TCF7L2) gene and type 2 diabetes in the Chinese population[J].Diabetes,2007,56(10):2631-2637.
[34]劉艷麗.基于通路分析的方法探討精神分裂癥與Ⅱ型糖尿病致病機理的關聯性研究[D].上海:華東師范大學,2013.
Metabolic pathways research of susceptibility genes of diabetes by bioinformatics*
ZHANGLijie1,2,PEIZhiyong1,2,MAYue3,CHENYubao1,2,4△
(1.BeijingComputingCenter,Beijing100094,China;2.KeyTechnologiesCloudComputingandKeyApplicationLaboratoryBeijingCity,Beijing100094,China;3.XiaotangshanHospital,Beijing102211,China;4.BeijingSequencingandFunctionalAnalysisEngineeringTechnologyResearchCenter,Beijing100094,China)
Objective To build a complicated metabolic pathway based on susceptibility genes in China and to explore the biological relationship in Chinese susceptibility genes.Methods By a set of susceptibility genes in type 2 diabetes and based on Right-Tailed Fisher′s Exact Test algorithm of Ingenutiy Pathway Analysis(IPA),diabetes-related metabolic pathways were founded.And 15 susceptibility genes which related to Chinese diabetes had been screened out.Based on these susceptibility genes a complex metabolic pathway had been built to explore the relationship between biological susceptibility genes in the Chinese population.Results KCNQ1,PPARG,IRS1 and ADIPOQ genes were located more than one biological pathway node positions,and the genes were related with a plurality of metabolic pathways.Conclusion KCNQ1,PPARG,IRS1 and ADIPOQ genes play a vital role in the occurrence of type 2 diabetes in Chinese people.The result is a good reference for research on complex diseases based on metabolic pathways.
type 2 diabetes; susceptibility genes; metabolic pathway
北科院創新團隊項目(IG201406C1);北京市計算中心萌芽計劃項目;北京市優秀人才青年骨干項目(2015400685627G238)。
張麗杰,男,生物信息工程師,主要從事慢性疾病生物信息學方面的研究。
△通訊作者,E-mail:chenyb@bcc.ac.cn。
10.3969/j.issn.1673-4130.2016.21.017
A
1673-4130(2016)21-2996-04
2016-03-15
2016-05-28)