徐 緣 蔣 益 林道潑
克羅恩病(Crohn′s disease, CD)是累及全消化道的慢性肉芽腫性透壁性炎癥。全基因組關聯研究已確定160多個炎癥性腸病(inflammatory bowel disease, IBD)易感基因位點。然而,臨床上僅7.5%的潰瘍性結腸炎(ulcerative colitis, UC)患者和13.6%的CD患者觀察到遺傳變異,提示非遺傳因素在疾病發病中發揮重要作用。表觀遺傳學是指基因的DNA序列未發生改變的情況下,基因功能發生了可遺傳的變化,并最終導致表型變化。越來越多的證據提示,表觀遺傳修飾是連接IBD易感基因與非遺傳因素(如腸道菌群、環境因素等)的重要橋梁,在IBD發病及疾病進展中起重要作用。因此,探討CD患者表觀遺傳修飾狀態或許能為探討CD潛在發病機制提供新的思路。
DNA甲基化是最普遍的表觀遺傳學修飾方式,該過程是基因轉錄過程中的關鍵調控機制之一,通常情況下,DNA甲基化程度與基因表達活性之間呈負相關。研究發現,多個基因的甲基化修飾異常與IBD的發病密切相關。采用全基因組DNA甲基化分析方法,對小兒初治IBD患者和幼年發病CD患者腸組織進行研究發現,IBD患者腸組織中多個基因位點出現DNA甲基化程度改變。另有研究發現,與健康對照者比較,CD患者腸道纖維化組織中發現17個低甲基化修飾的基因,其中miR-1225、miR-661等可能在腸道纖維化過程中發揮關鍵作用。本研究擬聯合分析表達譜芯片和DNA甲基化芯片數據,篩選與CD相關的異常甲基化修飾的差異表達基因及這些基因相關的信號通路,從而尋找CD疾病診斷和治療的潛在靶點。
1.數據來源:從 NCBI的公共基因表達數據庫(gene expression omnibus, GEO)中下載CD的表達譜芯片和DNA甲基化芯片。表達譜芯片下載編號為GSE102134、GSE75214和GSE186582、GSE102134共包含65例CD患者和12例健康對照者的人類腸組織標本,測序平臺為GPL6244(Affymetrix Human Gene 1.0ST Array);GSE75214共包含59例CD患者和22例健康對照者的腸組織標本,測序平臺為GPL6244(Affymetrix Human Gene 1.0ST Array);GSE186582共包含102例活動期CD患者和25例健康對照者的腸組織標本,測序平臺為GPL570。而DNA甲基化芯片(下載編號:GSE105798)利用GPL13534(Illumina Human Methylation 450 Bead Chip)平臺檢測了8例CD患者腸組織和3例健康對照者腸組織樣本中基因組DNA的甲基化水平。
2.數據標準化及差異表達基因篩選:GEO2R是GEO數據庫中基于R語言的在線分析工具。本研究通過GEO2R分析數據集中的差異表達基因,差異表達基因檢測條件為假發現率(false discovery rate, FDR)<0.05且|log差異倍數(FC)|>0.5。
3.甲基化芯片數據分析:應用R語言中的CHAMP包對DNA甲基化芯片數據進行CpG位點水平上的差異甲基化分析,以|delta beta vale|>0.3和FDR<0.05為閾值,尋找CD腸組織樣本相比于正常腸組織的差異甲基化位點(DNA-methylation profiles, DMP);隨后利用注釋文件將差異甲基化位點映射到基因組上。
4.異常甲基化修飾差異表達基因的功能富集分析:使用VENNY在線軟件將差異表達的基因、異常甲基化修飾基因列表進行對應的交集分析。利用R語言的ClusterProfiler包對差異表達基因進行富集,行基因本體(gene ontology, GO)分析和京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes, KEGG)分析,選取<0.05 作為顯著富集相關的閾值。
5.蛋白-蛋白相互作用網絡(protein-protein interaction, PPI)和子模塊基因構建分析:應用STRING數據庫行PPI分析,并利用Cytoscape軟件進行可視化,行MCODE分析,篩選提取子網絡,篩選條件設置為degree cut off=2,node score cut off =0.2,k-core=2,以及max depth=100。進入CytoHubba插件,根據其中的5種算法(MNC、MCC、Degree、EPC和Closeness),將每種算法獲得的前20個基因與MCODE篩選出的子網絡基因取交集后篩選出的共同基因即為核心基因。
6.核心基因驗證:使用GEO2R工具,首先查找差異基因ID,隨后通過ID號查找到差異基因在腸組織中的表達量,最后分析數據集中的差異表達基因,所有數據均輸入GraphPad Prism 5.0軟件進行繪圖,驗證核心基因在芯片集中的表達量。
1.CD差異表達基因的篩選:如圖1A所示,對GSE102134數據進行差異分析后,共得到1315個差異表達基因,其中780個基因表達上調,535個基因表達下調。
2.DNA甲基化芯片分析:對于甲基化芯片的數據集GSE105798,以FDR<0.05,|delta beta vale|>0.3為閾值篩選差異甲基化位點,如圖1B所示,一共篩選出11066個差異甲基化位點,其中8542個高甲基化位點,2524個低甲基化位點。隨后利用注釋文件將差異甲基化位點映射到基因組上,共獲得3364個甲基化修飾水平升高的基因和937個甲基化修飾水平降低的基因。

3.異常甲基化修飾的差異表達基因進行GO功能和KEGG通路富集分析:將CD的差異表達基因和異常甲基化修飾的基因導入VENNY軟件取交集獲得異常甲基化修飾的差異表達基因。如圖2所示,共得到55個低甲基化修飾下表達上調的基因,和125個高甲基化修飾下表達上調的基因。利用R語言的ClusterProfiler包對180個異常甲基化修飾的差異表達基因進行GO功能注釋和KEGG通路富集分析。表1和表2展示了前5個具有顯著意義的GO功能注釋結果,以及上述基因相關的KEGG通路富集結果。分析表明異常甲基化修飾的差異表達基因主要分子功能(molecular function, MF)與跨膜轉運蛋白活性、次級活化跨膜轉運蛋白活性和轉運體活性等相關;細胞組分(cellular component, CC)定位于細胞頂端、頂端質膜和細胞前沿等;而其生物學過程(biological process, BP)主要為有機陰離子轉運、有機羥基化合物代謝和細胞外基質的組成等。KEGG信號通路主要為磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶(phosphatei-dylinositol 3 kinase/serine-threonine kinase, PIK/Akt)信號通路、黏附斑和細胞外基質(extracellular matrix, ECM)-受體相互作用等。



4.異常甲基化修飾的差異表達基因蛋白相互作用網絡分析:如圖3所示,在STRING數據庫中分析上述180個基因編碼蛋白間的相互作用關系,接著采用Cytoscape軟件中的MCODE法分析,發現1個子網絡處于核心位置,總共包含10個關鍵基因。再采用CytoHubba插件,根據其中的5種算法(MNC、MCC、Degree、EPC和Closeness),將每種算法獲得的前20個基因與MCODE篩選出的子網絡基因取交集后篩選出5個核心基因,分別為分別為淀粉樣前體蛋白(amyloid precursor protein, APP)、Ⅳ型膠原蛋白2(collagen Ⅳ alpha 2, COL4A2)、Ⅳ型膠原蛋白1(collagen Ⅳ alpha 2, COL4A1)、血小板源性生長因子β受體(platelet-derived growth factor receptor beta, PDGFRB)、肽YY(peptide YY,PYY)。5個核心基因的甲基化程度詳見圖4。


5.GEO數據庫驗證:如圖5和圖6所示,CD患者腸組織中PYY基因表達水平低于健康對照者(GSE75214:logFC=-0.76, FDR<0.001;GSE186582:logFC=-1.09, FDR<0.0001)。與健康對照者比較,CD患者腸組織中COL4A2、COL4A1、PDGFRB表達水平均顯著升高[(GSE75214:logFC=0.82, FDR<0.001; logFC=1.17, FDR<0.001; logFC=0.96, FDR<0.001)(GSE186582:logFC=0.59, FDR<0.01; logFC=1.27, FDR<0.0001; logFC=0.75, FDR<0.001)]。而腸組織中APP基因表達在CD患者和對照組中差異無統計學意義。


在臨床中由于IBD的診斷缺乏金標準,易造成誤診和漏診。近年來,越來越多的證據提示表觀遺傳學修飾如DNA甲基化、miRNA在IBD診斷中發揮關鍵作用。研究證實DNA甲基化在IBD診斷中具有較高的敏感度、特異性及準確性。Howell等研究發現,幼年IBD患者腸上皮細胞具有特異性的DNA甲基化模式,該模式診斷IBD的敏感度為75%,而特異性高達100%。此外,進一步對UC和CD患者回腸組織進行研究發現,DNA甲基化標志物有77%的準確性對兩種疾病進行區分。上述研究提示,尋找IBD特異度的DNA甲基化模式有巨大的臨床意義。
本研究通過生物信息學方法,篩選CD中異常甲基化修飾的差異表達基因,并進行KEGG信號通路聚類分析。結果發現,差異表達基因被顯著富集到PIK/Akt信號通路、黏附斑和ECM-受體相互作用等信號通路,這與其他CD機制相關性研究一致。PIK/Akt信號通路與細胞生長和細胞程序性死亡等密切相關。研究證實PIK/Akt信號通路可能通過調控白細胞介素和免疫細胞,從而在炎癥性腸病中發揮關鍵作用。Long等研究發現,與健康對照者比較,CD患者外周血CD4T細胞和腸組織淋巴細胞中PIK、Akt及mTOR的mRNA及蛋白表達水平均上調。使用PIK抑制劑和多不飽和脂肪酸均可下調PIK/Akt信號通路,從而誘導CD緩解。黏附斑激酶(focal adhesion kinase, FAK)可以調節細胞的生長、錨定、遷移、惡變和凋亡等過程,與多種腫瘤的發生、發展相關。LEEB等研究發現,與健康對照者比較,CD患者腸組織固有層成纖維細胞中FAK磷酸化水平降低,提示CD中成纖維細胞遷移能力減弱,腸道組織修復能力下降。腸道纖維化是CD特征性表現之一,逐漸進展可形成腸道狹窄。CD發病過程中,腸道慢性透壁性炎癥及過度損傷修復,ECM蛋白異常沉積、膠原蛋白分解、ECM形成和ECM受體相互作用,最終導致腸道狹窄。因此進一步研究ECM受體相互作用可能有助于理解CD纖維化的分子機制。
本研究最終篩選出4個與CD發病密切相關的異常甲基化修飾的差異表達基因,分別為COL4A2、COL4A1、PDGFRB、PYY。PYY是一種胃腸道肽類激素,研究發現血漿PYY水平升高與多種胃腸道疾病如炎癥性腸病密切相關。在葡聚糖硫酸鈉誘導的大鼠結腸炎模型中,采用免疫組化方法對大鼠結腸組織進行分析發現,結腸炎組結腸組織中分泌PYY的內分泌細胞密度顯著增高,且PYY水平與T淋巴細胞比例密切相關,提示胃腸道激素可能與腸道免疫系統存在相互作用,通過靶向PYY等可能有助于緩解炎癥性腸病。血小板源性生長因子受體(PDGFR)是生長因子受體家族重要成員之一,對中性粒細胞、成纖維細胞具有趨化作用,并參與細胞凋亡過程。Tuller等對CD和潰瘍性結腸炎患者外周血單個核細胞進行轉錄組分析發現,血小板源性生長因子(PDGF)信號通路參與炎癥性腸病的發生、發展。此外CD腸道纖維化是ECM、成纖維細胞、細胞因子等多種因素之間復雜作用的結果,目前研究證實,PDGFR參與ECM及成纖維細胞的調控,因此PDGFR可能在CD腸道纖維化中發揮重要作用。但目前尚缺乏COL4A1、COL4A2與CD關系的研究。
綜上所述,本研究利用生物信息學分析對表達譜數據集和甲基化數據集進行聯合分析,構建PPI網絡,推測信號通路可能影響CD的發生、發展,并篩選出可能與CD發病相關的4個核心基因,為探尋CD潛在的分子機制及致病基因研究提供必要理論依據。但仍需開展體內外分子生物學實驗驗證相關基因的功能和信號通路的作用。