黃曉東,黃 銜,梁靖華,李 昂,劉琦凱,鐘秀清,肖劍偉
(1.深圳市中醫肛腸醫院<福田>外三科,廣東 深圳 518031;2.深圳市福田區風濕病??漆t院風濕免疫科,廣東 深圳 518000)
克羅恩?。–rohn'sdisease,CD)是一種慢性、節段性、不對稱分布的肉芽腫性炎癥,可累及胃腸道的任何部位,主要病變常見于回腸末端和鄰近的結腸[1]。研究顯示[2],我國CD 發病率有明顯上升趨勢。然而,目前缺乏用于診斷CD 的有效標志物。同時,在治療上,使用美沙拉嗪和柳氮磺吡啶等藥物可以在一定程度上緩解CD 的癥狀,但治療效果較差。因而,更好地了解CD 發病機制可能有助于開發新的診斷及治療方式。研究表明,長鏈非編碼RNA(LncRNA)在CD 發病中發揮著重要作用。有研究報道[3],血漿LncRNALUCAT1 與CD 患者的疾病活動度呈正相關。Haberman Y 等[4]的研究表明,CD 患者腸道組織樣本中有15 個LncRNA 存在差異表達,提示LncRNA 在CD 發病中發揮著重要的作用。m6A是RNA 中的一種核苷酸修飾方式,這是迄今為止在各類RNA 修飾中最普遍的一種,包括mRNA、microRNA 及LncRNA[5]。調節m6A 修飾的蛋白質,與腸道微生物群的改變和胃腸道癌癥的發展有關[6,7]。m6A 對LncRNA 的修飾在CD 發病中的意義仍不清楚?;诖?,本研究通過生物信息學分析確認m6A 相關基因調節的LncRNA,分析其與臨床性狀的相關性,以期為開發CD 新的診斷及治療靶點提供幫助。
1.1 數據檢索 在GEO(www.ncbi.nlm.nih.gov/geo)中以“Crohn’s disease”作為關鍵詞,檢索得到GSE94648(22 個健康對照、50 個CD 患者)數據集,該數據集包含了患者臨床數據。
1.2 數據合并及重注釋 使用Perl 軟件(版本5.30.2)對數據集進行基因注釋以區分mRNA 及LncRNA。
1.3 提取m6A 甲基化基因及LncRNA 根據當前的研究確定了21 個m6A 相關基因,包括readers(YTHDC1、YTHDC2、YTHDF1、YTHDF2、YTHDF3、IGF2BP1、IGF2BP2、IGF2BP3、RBMX、HNRNPA2B1、HNRNPC、LRPPRC)、writers(METTL3、METTL14、METTL16 RBM15、RBM15B、WTAP、VIRMA、KIA1499、ZC3H13)和erasers(FTO 和ALKBH5)。使用R 軟件的Limma 包獲數據集m6A 基因及LncRNA 的表達量。
1.4 差異LncRNA 分析 使用R 軟件4.04,通過limma包對1.3 步驟得到LncRNA 進行差異分析,取LogFC 絕對值大于0.5,adjustP<0.05。
1.5 計算m6A 甲基化基因與LncRNA 表達量的相關性 使用R 軟件的Limma 包,設置相關性大于0.5,P<0.05,獲取1.4 步驟得到的與LncRNA 相關的m6A 甲基化基因。
1.6 臨床相關性分析 對1.4 步驟得到的LncRNA 及m6A 甲基化基因,分析其與內鏡下嚴重指數(Crohn's Disease Endoscopic Index of Severity,CDEIS)的相關性,采用斯皮爾曼相關性分析計算關鍵基因表達量與CDEIS 的相關性。以相關系數絕對值大于0.5,P<0.05 為差異有統計學意義,獲取與臨床性狀相關的LncRNA 進一步分析。并通過在線網站(http://www.cuilab.cn/sramp)預測LncRNAm6A 甲基化位點。
1.7 m6A 相關LncRNA 的診斷分析及獲取共表達mRNA 對1.6 步驟得到的LncRNA,使用R 軟件survROC 包繪制ROC 曲線,以P<0.01 表示統計學意義顯著,驗證m6A 相關LncRNA 診斷價值。使用R 軟件的Limma 包,設置相關性絕對值大于0.5,P<0.05,獲取與LncRNA 共表達的mRNA。
1.8 GO 富集分析及KEGG 信號通路分析 通過R包“clusterProfiler”“org.Hs.eg.db”,對1.7 步驟獲得共表達mRNA 進行GO 富集分析及KEGG 信號通路分析,以P<0.05 表示差異有統計學意義。
2.1 差異LncRNA 分析結果 共獲得7 個LncRNA存在差異表達,其中4 個LncRNA 表達上調,3 個表達下調(圖1)。

圖1 差異LncRNA 表達熱圖
2.2 m6A 甲基化基因與LncRNA 表達量的相關性有3 個LncRNA(LINC01094、GSEC、LINC01093)和8 個m6A 甲基化酶(METTL16、RBM15B、YTHDC1、YTHDF1、YTHDF2、FTO、ALKBH5、LRPPRC)存在相關性,見表1。

表1 m6A 相關基因與LncRNA 相關性
2.3 臨床相關性分析 結果顯示,LncRNAGSEC 表達與CDEIS 呈正比,FTO、LRPPRC 表達與CDEIS 呈反比(圖2)。其余LncRNA 及m6A 甲基化相關基因表達與CDEIS 無明顯相關性。m6A 甲基化位點預測提示GSEC 存在多個高甲基化位點(圖3)。

圖2 GSEC、FTO、LRPPRC 與CDEIS 的相關性分析

圖3 GSEC m6A 甲基化位點預測
2.4 ROC 診斷曲線結果 ROC 曲線顯示,GSEC 的AUC 為0.805,P<0.001(圖4)。共有1440 個mRNA與GSEC 共表達。與GSEC 共表達的蛋白GO 富集分析顯示其分子功能(MF)主要包括蛋白絲氨酸/蘇氨酸/酪氨酸激酶活性、Toll 樣受體結合等功能,生物學過程(BP)包括T 細胞分化、淋巴細胞分化等,細胞成分(CC)顯示主要定位于分泌顆粒膜、胞質囊泡腔等(圖5)。KEGG 信號通路分析顯示其富集于Th1 和Th2 細胞分化、Th17 細胞分化、NF-κB 信號通路、炎癥性腸病等通路(圖6)。

圖4 ROC 診斷曲線

圖5 GO 富集分析

圖6 KEGG 信號通路分析
m6A 甲基化是最常見的mRNA 修飾形式,在轉錄后水平調節基因表達中起著至關重要的作用[8]。異常的m6A 甲基化通過調節許多生物過程,包括細胞分化、免疫反應等。而在炎癥性腸病中,m6A 甲基化在疾病進展中也發揮著重要的作用[9,10]。越來越多的研究關注LncRNA 在CD 中診斷及治療價值。研究顯示[11],血漿LncRNA THRIL 在CD 患者中表達升高,可以作為一種非侵入性的生物標志物來識別疾病活動度的程度。然而,m6A 相關LncRNA 在CD中的研究仍較少。本研究對CD 中m6A 相關LncRNA 的表達、相關功能及臨床相關性影響進行了分析。研究結果顯示,多個m6A 相關的LncRNA在CD 患者中存在表達異常。其中,GSEC 在CD 患者中高表達,且與CDEIS 評分呈正相關,提示其可作為評估患者病情活動的指標之一。GSEC 為位于11 號染色體的LncRNA。有研究顯示[12],GSEC 通過負調節DHX36 的活性來增強結腸癌細胞遷移。然而,其在CD 中的作用仍未有報道。為了進一步明確GSEC 的潛在生物學功能,課題組通過分析GSEC共表達的蛋白來推測其潛在功能。結果顯示其功能富集于Th17 細胞分化、NF-κB 信號通路、炎癥性腸病等通路。兩項獨立研究表明[13,14],CD 患者的外周血和腸道中存在Th17 細胞。Th17 細胞主要分泌IL-17A、IL-22 等細胞因子[15]?;顒悠贗BD 患者血漿和腸黏膜均高表達IL-17,增加局部炎癥反應[16]。有研究指出,炎癥性腸病中存在T 細胞免疫持續激活的情況[17]。在CD 患者中,TH1 細胞和TH17 細胞對抗原呈遞細胞和巨噬細胞分泌的IL-12、IL-18 和IL-23 促炎癥細胞因子產生過度反應。反之,TH1 和TH17 細胞分泌促炎癥細胞因子IL-17、IFNγ 和TNF,通過刺激其他細胞,如巨噬細胞、單核細胞產生TNF、IL-1、IL-6、IL-12 和IL-18 等多種炎癥因子,導致炎癥持續[18]。以上研究均提示Th17 在CD發病中發揮著重要的作用。NF-κB 的異常激活導致促炎細胞因子的過度產生,從而導致腸道慢性炎癥。研究顯示[19],與非IBD 患者相比,炎癥性腸?。↖BD)患者的NF-κB 表達率顯著升高。Han YM 等[20]研究顯示,在CD 患者中,與NF-κB 活性低的患者相比,NF-κB 活性高的患者回結腸受累頻率更高。NF-κB活性高的患者的總組織學評分顯著高于NF-κB 活性低的患者。Toll 樣受體(Toll-like receptors,TLR)是表達于多種細胞上的跨膜蛋白,作為NF-κB 的上游信號,可激活多種細胞因子從而引起各種炎癥反應。由TLR 介導的免疫反應可誘發及加重IBD 的發生與發展[21]。這種多個通路之間的相互作用,提示GSEC 可能通過影響多個基因來達到調控的目的。同時,本研究還發現,GSEC 具有良好的分類診斷功能,ROC 曲線下面積為0.805,提示GSEC 能作為CD 患者的診斷標志物之一。
參與m6A 調控的蛋白質包括m6A 甲基轉移酶、m6A 去甲基轉移酶和甲基化閱讀蛋白。m6A 甲基化酶與炎癥的發生和進展有關,如T 細胞中METTL14 的缺失可誘導小鼠出現自發性結腸炎[22]。而本研究發現,FTO 與LRPPRC 與GSEC 表達呈負相關。其中FTO 屬于m6A 去甲基轉移酶,其能夠識別含有m6A 修飾的mRNA,對該甲基化位點進去甲基化[23]。而LRPPRC 屬于甲基化閱讀蛋白,主要功能為參與mRNA 的剪切、剪接[24]。兩者在CD 中的功能尚未充分研究。FTO 作為“橡皮擦”基因,被認為是一種新的遺傳標記。有研究顯示[25],FTO 變異rs9939609 AA 基因型的攜帶者CD 患者風險增加。另有研究顯示[26],FTO 可用于預測噻嘌呤治療克羅恩病患者的反應或毒性。炎癥性腸病相關結直腸癌死亡率中約為2%,但在炎癥性患者中為10%~15%[27],LRPPRC 在結直腸癌組織中的表達比正常組織高1.5 倍[28]。然而,其調節CD 和結直腸癌發展的潛在機制尚不清楚。本研究發現,FTO、LRPPRC 表達與CDEIS 評分呈反比,提示其表達量與病情活動相關,同時sramp 網站預測顯示GSEC存在多個甲基化位點,提示m6A 甲基化參與了GSEC 的調控。m6A 甲基化酶調控LncRNA 存在多種機制,一是改變lncRNA 的結構并影響與蛋白質的相互作用;二是導抑制基因轉錄;三是m6A 修飾可能會改變LncRNA 亞細胞定位分布;四是m6A 修飾可以調節lncRNA 的穩定性。基于FTO 為去甲基化酶及LRPPRC 為甲基化閱讀蛋白,推測其可能通過影響GSEC 的結構或穩定性,從而調控其功能,參與了CD 的發病與發展。
綜上所述,GSEC 可能是CD 的潛在的診斷和治療靶點。然而,對于其具體的作用機制及生物學功能仍需進一步的研究來驗證。