鄭文新 劉 紅 汪 偉


摘? ?要:目的? 分析銀屑病易感基因的功能,篩選關鍵基因。方法? 結合OMIM數據庫以及近年來發表的文章收集銀屑病易感基因,利用Gather在線服務對易感基因進行富集分析,蛋白質相互作用網絡由String數據庫構建,計算節點的度數,據此篩選關鍵易感基因。結果? 銀屑病的易感基因功能主要富集在免疫應答,防御反應,生物應激反應,有機生理過程,應激反應,對害蟲寄生蟲病原體的反應,對外部生物刺激的反應,對外傷的反應,抗原表達,抗原呈遞及抗原加工等類別。我們通過計算易感基因所編碼的蛋白質相互作用網絡中節點的度數,按度數的高低,選出排在前十的10個基因,作為關鍵易感基因,功能分析和通路分析提示關鍵基因和很多功能明確與銀屑病相關的基因相互作用。結論? 易感基因分析提示,銀屑病是與環境因素密切相關,具有遺傳性的免疫性皮膚病。蛋白質相互作用網絡分析提示,關鍵易感基因可以沒有明確的功能,但是會和很多與銀屑病相關功能明確的基因相互作用。
關鍵詞:銀屑病;易感基因;蛋白質相互作用網絡;富集分析
中圖分類號:R758.63? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:B? ? ? ? ? ? ? ? ? ? ? ? ? ? ? DOI:10.3969/j.issn.1006-1959.2018.21.001文章編號:1006-1959(2018)21-0001-03
Bioinformatics Analysis of the Susceptible Genes of Psoriasis
ZHENG Wen-Xin1,LIU Hong1,WANG Wei2
(1.Capital Medical University School of Biomedical Engineering,Beijing 100069,China;
2.Central Laboratory of Capital Medical University,Beijing 100069,China)
Abstract:Objective? To analyze the functional enrichment of psoriasis susceptible genes and screen the key susceptible genes.Methods? According to the OMIM database and the published articles in recent years,the susceptibility genes of psoriasis were collected,and the susceptibility genes were enriched and analyzed by Gather online service. The protein interaction network was constructed by using the String database, and the key susceptible genes were screened. Results? The function of susceptibility gene of psoriasis is mainly enriched in immune response, defense response, biological stress response, organic physiological process, stress response, response to insect parasite pathogens, response to external biological stimuli, response to trauma, antigen expression, antigen presentation and antigen processing. By calculating the degree of the nodes in the protein interaction network encoded by the susceptibility genes, we selected the first 10 genes, as the key susceptible genes. Both the functional analysis and pathway analysis suggested that the key genes interact with the many genes related to psoriasis. Conclusion? Susceptibility gene analysis indicates that psoriasis is a hereditary immune skin disease, closely related to environmental factors. Protein interaction network analysis suggests that though some key susceptible genes do not have definite functions, but they interact with a lot of genes with specific functions associated with psoriasis.
Key words:Psoriasis;Susceptible genes;Protein interaction network;Enrichment analysis
在自然人群中銀屑病(psoriasis)的發病率為0.1%~3.0%,是一種與環境因素相關的、遺傳性免疫性皮膚病[1]。隨著全基因組關聯分析方法(genome-wide association study,GWAS)的發展,越來越多的銀屑病易感基因被發現,OMIM數據庫收錄了14個銀屑病易感位點:PSORS1-PSORS14。對于這些位點的研究有些已達到了蛋白質水平,確定了易感基因,有些位點還沒有確定易感基因。因大部分候選位點中的基因相互連鎖,很難確定真正的易感基因,而且大部分作用機制還不明確[2,3]。我們進一步分析易感基因的功能,找出關鍵易感基因。
1材料與方法
1.1候選易感基因? 銀屑病14個易感位點收錄在OMIM數據庫:PSORS1-PSORS14,查詢文獻中的相關研究內容,收集銀屑病候選易感基因如下[3]。
PSORS1(6p21.3): HLA-C、HCG9、C6orf10、HLA-A、HLA-B、MICA、CDSN、HCR。
PSORS2(17q25):CMRF35、RUNX1和RAPTOR 基因的第三內含子,CARD14 基因等。
PSORS3(4q):IRF2、IL-21。
PSORS4(1q21上):LCE3B、LCE3C、FLG。
PSORS5(3q21上):CSTA、SLC12A8。
PSORS6(19P13):JUNB、AP-1轉錄因子、MUC16、BSG。
PSORS7(1p):IL-23R、IL-12B。
PSORS8(16q):CARD15。
PSORS9(4q31):MGST2、IL15、VEGFC、TLR2、TLR3。
PSORS10(18p11):候選基因目前未見相關報道。
PSORS11(5q31.1):IL12B 及IL12R。
PSORS12(20q13):RNF114/ZNF313。
PSORS13(6q21):TRAF3IP2/CIKS/ACT1。
PSORS14(2q13):IL-36RN。
1.2富集分析? 利用Gather(http://changlab.uth.tmc.edu/gather/gather.py)在線工具,對銀屑病易感基因進行功能和通路分析。
1.3蛋白質相互作用網絡? 銀屑病易感基因所表達的產物所構成的蛋白質相互作用網絡,由String(https://string-db.org/)數據庫的在線工具構建,這些相互作用即包括了生理上的直接作用也包括了功能上的間接作用。然后把網絡數據導入Cytoscape軟件,計算節點度數,選擇節點度數高的基因作為關鍵的易感基因。
2結果
2.1 GO分類結果? 對收集到的銀屑病易感基因進行GO分類,共有97個類別(Gather在線工具),其中P<0.0001的共有12個類。在P<0.0001的類別中,有13個基因(CCRL2,CD300C,HLA-A,HLA-B,HLA-C,IL12B,IL15,IL17C,IRF2,MGST2,MICA,TLR2,TLR3)富集在以下分類:免疫應答,防御反應,生物應激反應,有機生理過程,應激反應。有8個基因(CCRL2,CD300C,IL12B,IL17C,MGST2,MICA,TLR2,TLR3)富集在以下分類:對害蟲寄生蟲病原體的反應,對外部生物刺激的反應。有6個基因(CD300C,IL12B,IL17C,MICA,TLR2,TLR3)富集在對外傷的反應。有4個基因(HLA-A,HLA-B,HLA-C,MICA)富集在抗原表達。有3個基因(HLA-A,HLA-B,HLA-C)富集在抗原呈遞及內源性抗原,抗原加工及通過MHCⅠ類的內源性抗原。
2.2 KEGG通路分析? KEGG通路富集分析提示,本文所研究的易感基因顯著富集在四條代謝通路:Toll樣受體信號通路,細胞因子-細胞因子受體相互作用,JAK-STAT信號轉導途徑,谷胱甘肽代謝。
2.3蛋白質相互作用網絡? 由String數據庫得到銀屑病易感基因的蛋白質相互作用網絡,見圖1。該網絡有34個節點對應34個蛋白質,有42條邊對應蛋白質的相互作用,節點的平均度數為2.47。與一個基因相互作用的基因數目越多節點的度數越高,下載string相互作用網絡數據,計算出節點的度數,選擇度數高的基因作為關鍵易感基因。按照度數由高到低排列排在前十的分別是IL15(9),HLA-C(9),IL12B(7),NOD2(6),CARD14(6),HLA-A(5),CDSN(4),HLA-B(4),IRF2(4),IL23R(4)。
3討論
銀屑病目前雖不能完全確定病因,但本病是與環境因素相關的遺傳性免疫皮膚病[1],受潮、感染、吸煙、飲酒、藥物等都影響著本病的發病和病程[2]。我們對易感基因的功能富集分析發現,銀屑病的易感基因功能主要富集在免疫應答,防御反應,生物應激反應,對害蟲寄生蟲病原體的反應,對外傷外部生物刺激的反應,有機生理過程,以及抗原和抗原呈遞等類別。功能富集在這些類的易感基因導致銀屑病是和吸煙、嗜酒、受潮、感染和藥物等環境因素密切相關。和免疫應答相關的基因表明銀屑病是具有遺傳性的免疫性皮膚病。我們對基因功能的分析和目前對銀屑病發病原因的理解一致,是對發病原因的一次理論驗證。
我們根據銀屑病易感基因所編碼的蛋白質的相互作用網絡中節點的度數高低,篩選出10個關鍵基因。度數最高的兩個基因是與漢族人群銀屑病顯著相關的基因IL-15位于PSORS9(4q31),和位于最主要的易感位點PSORS1(6p21.3)的基因HLA-C,經實驗證實該基因是歐美及其他人群銀屑病易感位點[4],也是銀屑病性關節炎的易感位點[5],并經過Meta分析證實[6]。在波蘭患者中HLA-Cw*06基因頻率顯著升高,證實與早發型銀屑病顯著相關[7]。由于HLA-C基因沒有功能性作用,所以不是易感基因本身只一個遺傳標記[8]。根據富集分析可知,這兩個基因富集在免疫應答,防御反應,生物應激反應,有機生理過程,應激反應,可見這兩個關鍵基因也佐證了銀屑病是和環境因素相關的免疫性皮膚病這一判斷。HLA-C這個基因是關鍵的銀屑病易位點,但卻缺少明確功能。我們所篩選出的關鍵易感基因,也是許多實驗驗證的關鍵易感基因,這是對實驗結果的一次理論驗證。實驗證明該關鍵基因無具體功能,只是易感位點,通過互作網絡發現,該基因和很多功能明確與銀屑病相關的基因相互作用,所以該基因雖無具體功能,但理論和實驗都提示該基因是關鍵易感基因。通過互作網絡分析,解釋了關鍵易感基因缺少實際功能的現象,生物信息分析提供了一個新的視角。
參考文獻:
[1]Nickoloff BJ.The immunologic and genetic basis of psoriasis[J].Arch Dermatol,1999,135(9):1104-1110.
[2]張亞南,吳閩楓,金性秀,等.泛發性膿皰型銀屑病易感基因研究進展[J].中國皮膚性病學雜志,2016,27(7):751-752.
[3]趙恬,羅權,林玲,等.銀屑病易感基因的研究進展[J].中國中西醫結合皮膚性病學雜志,2015,14(5):333-338.
[4]Ellinghaus E,Ellinghaus D,Stuart PE,et al.Genome-wide association study identifies a psoriasis susceptibility locus at TRAF3IP2[J].Nat Genet,2010,42(11):991-995.
[5]Hüffmeier U,Uebe S,Ekici AB,et al.Common variants at TRAF3IP2 are associated with susceptibility to psoriatic arthritis and psoriasis[J].Nat Genet,2010,42(11):996-999.
[6]Ellinghaus E,Stuart PE,Ellinghaus D,et al.Genome-wide metaanalysis of psoriatic arthritis identifies susceptibility locus at REL[J].J Invest Dermatol,2011,132(4):1133-1140.
[7]Rebala K,Szczerkowska-Dobosz A,Niespodziana K,et al.Simple and rapid screening for HLA-CW*06 in Polish patients with psoriasis[J].Clinical EXP Dermatol,2010,35(4):431-436.
[8]Jordan CT,Cao L,Roberson ED,et al.PSORS2 Is Due to Mutations in CARD14[J].Am J Hum Genet,2012,90(4):784-795.