孟紫媛,蔡明龍,張學軍
(安徽醫科大學第一附屬醫院皮膚性病科<安徽醫科大學皮膚病研究所> 安徽 合肥 230022)
白癜風(vitiligo)是一種臨床常見的色素脫失性疾病[1]。研究表明,遺傳因素在白癜風的發病機制中起到了十分重要的作用,然而部分基因對疾病發生發展起的作用仍未闡明。
目前,醫學研究的一個主要目的是發掘疾病的危險因素,一旦有效地識別出危險因素,就能對其進行預防或靶向治療。孟德爾隨機化(MR)研究方法是一種以孟德爾獨立分配定律為基礎進行流行病學研究設計和數據分析的方法,旨在研究暴露是否與疾病結局有因果關系[2]。
本研究通過孟德爾隨機化方法將與暴露具有強相關關系的遺傳變異作為工具,以GWAS、eQTL 的匯總數據為參考依據,通過等位基因的隨機分配在暴露上的映射實現對暴露的隨機化,旨在分析鑒定白癜風的功能相關基因。
GWAS 匯總數據來自最大的白癜風GWAS 薈萃分析數據,該數據由2853 例病例和37405 例健康對照組成(可在https://www.ebi.ac.uk/gwas/中獲得)。經過質量控制后,剩余9068712 個變體用于進一步分析[3]。在我們的研究中使用的5 個eQLT 數據(3 個血液eQTL 數據和2 個皮膚eQTL 數據)來自3 個歐洲人群研究,Westra eQTL[4],CAGE eQTL[5],GTEx 項目[6]。
基于匯總數據的孟德爾隨機化法(Summary databased Mendelian randomization method,SMR),是推斷與暴露密切相關的遺傳變異對結局的因果關系的工具[7]。SMR 的另一個優勢是可以集成兩個獨立樣本的數據。HEIDI(heterogeneity in dependent instruments)方法旨在區分多效性與連鎖性。例如,連鎖不平衡中的兩個不同變異分別獨立地影響基因表達和白癜風易感性。我們將PHEIDI >0.01 定義為不排斥多效性。
5 個eQTL 匯總數據均從http://cnsgenomics.com/software/smr/#Data-Resource 下載,其中僅包含ciseQTL 數據。經過質控,共保留了11013 個基因表達探針,將P值為4.54×10-6(0.05/11013)作為具有統計意義的臨界值。
通過使用SMR 和HEIDI 方法,我們鑒定出總共20個白癜風相關基因,其中12 個已被既往GWAS 研究報告[3,8-10]。其它8 個基因(SARNP,SPATA2L,SPG7,MAP1LC3A,MEI1,SEPTIN2,CDK10,PRRG2)為首次發現,與GWAS 相關的變體相距甚遠。然后,我們對白癜風基因表達譜數據進行分析,發現12 個基因顯示出顯著性。利用治療靶基因數據庫(http://bidd.nus.edu.sg/group/ttd/ttd.asp)[11]和Drugbank(http://www.Drugbank.ca)[12]進一步評估其在藥物治療領域的潛在價值,我們發現5 個基因(CASP7,FADS1,FADS2,IRF3,GZMB)被用作藥物靶點,其中CASP7 在白癜風患者中上調(bsmr >0),見表1。

表1 通過SMR 和HEIDI 方法分析白癜風鑒定出20 個基因Table 1 Identification of 20 genes by the SMR&HEIDI analysis for vitiligo

續表1
在本研究中,我們發現了20 個白癜風相關基因,其中12 個為既往GWAS 研究報告的,另外8 個新發現的基因主要參與細胞周期(CDK10,SARNP,SEPTIN2),自噬(MAP1LC3A),凋亡(SPATA2L)和活性氧(SPG7)。雖然我們的研究數據主要納入的研究人群來自歐美國家,研究結果是否適用于中國人群有待普遍性驗證,白癜風發病的潛在生物學機制仍未完全闡明,通過SMR 方法僅能對其作出因果關系的初步判斷。但本研究通過SMR 方法可以避免常規觀察性流行病學研究中所受的混雜作用和反向因果關聯的干擾,且我們的研究樣本量較大,通過增加統計效應可使得效果估計更加可靠。