許 思
多發性硬化(Multiple Sclerosis,MS)是一種中樞神經系統免疫介導性疾病,以炎癥性、脫髓鞘性及神經系統退行性變性為主要特征。中樞神經系統白質及灰質的炎性病變是多發性硬化的主要發病原因,也是中樞神經系統神經細胞損傷的原因[1,2],其致病原因尚不明確,研究表明多種促炎因子的釋放和免疫細胞的激活在多發性硬化的致病過程中起到了重要的作用。目前,多發性硬化的診斷是十分困難的,多發性硬化的經典診斷手段主要依賴于患者病史、臨床癥狀、體格檢查以及各種輔助檢查如核磁共振、腦脊液和血的實驗室檢查、電生理學檢查等方式的綜合判斷[3]。現應用于臨床診斷多發性硬化的生物學標志物主要有糖蛋白、趨化因子、IgG、IgM抗體以及細胞表面標志物等[4],但仍缺乏特異性好及敏感性高的生物學指標。多發性硬化疾病表現的復雜性導致了這些生物學標志物與疾病的診斷難以建立良好的關聯性以及指導意義。因此,識別多發性硬化患者中的差異表達基因,發現新的特異性標志物,從分子水平挖掘多發性硬化的致病機制,可以為多發性硬化的診治提供新的方向。
視神經炎是多發性硬化的常見臨床表現之一,約有25%的MS患者的主要癥狀為視神經炎,且約有30%~70%的MS患者可在多發性硬化的整個病程中出現此癥狀。視神經炎的病理改變包含一個與軸索丟失相關的復雜的髓鞘脫失和再生的過程,盡管疾病的機制與炎性脫髓鞘相關,但其觸發成分尚不清楚。多發性硬化的癥狀多變且不可預測,但許多MS患者由于視神經脫髓鞘而導致視力急劇下降并難以恢復,且對于此種視神經炎缺乏良好的康復方法,使得許多患者遺留下視力的殘疾,亦對患者的工作和生活產生了巨大的不便。
近年來,隨著基于基因芯片的高通量測序平臺的建立使得在癌癥、免疫系統疾病、心腦血管疾病等多種領域疾病的分子層面上的相關致病機制研究有了突破性的進展,同時成為篩選疾病發生過程中的重要遺傳物質、識別及診斷疾病預后的關鍵性生物學標志物的一種重要的方法和工具[5]。
本研究通過檢索Gene Expression Omnibus(GEO)數據庫中伴視神經炎的多發性硬化相關研究的基因數據集,進一步挖掘相關差異表達的基因,通過GEO、KEGG[6]等在線數據庫系統分析多發性硬化患者中差異表達基因的相互作用關系及調控網絡,從分子層面深入研究多發性硬化發病的生物學機制,為伴有視神經炎的多發性硬化患者的進一步診治提供依據。
1.1 資料來源 通過NCBI的GEO數據庫(https://www. ncbi. nlm. nih. gov/geo/)中檢索多發性硬化患者基因表達數據,并下載多發性硬化患者的基因芯片表達譜(GSE62584),該表達譜包括15個外周血CD19+B細胞樣本,來自于6個伴有視神經炎的多發性硬化患者以及9個正常人,所取組織為外周血CD19+B細胞,患者的外周血均取自首次發生急性脫髓鞘性視神經炎患者發病的96 h內。
1.2 基因差異表達分析 下載GSE62584后,采用t檢驗進行差異表達,P值<0.05和差異倍數|logFC|>1為差異表達基因。上述分析采用GEO2R(http://www. ncbi. nlm. nih. gov/geo/geo2r/)在線分析軟件進行,同時使用R包進行數據處理和分析繪圖。
1.3 通路富集分析和基因本體分析 通路富集分析和基因本體(Gene Ontology,GO)功能分析通過 DAVID[7](http://david. abcc. ncifcrf. gov/)數據庫中的京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集方法和GO功能富集方法進行分析,P值及錯誤發現率(false discovery rate,FDR)均≤0.5即視為具有統計學意義的生物通路和GO通路。
1.4 蛋白相互作用分析 利用STRING-DB數據庫進行蛋白相互作用分析。
2.1 基因差異表達分析 首先,我們將所得到得差異基因表達譜計算數據值分布,并將其可視化,由箱型圖我們可以看研究樣本經處理后數據均一性良好,兩組之間樣本具有可比性(見圖1)。其次,我們將所有發現的差異基因的數據利用t檢驗分析出兩樣本間顯著差異表達的基因后,以log2(fold change)為橫坐標,以t檢驗顯著性檢驗P值的負對數-log10(P-value)為縱坐標,實驗數據分布情況進行可視化繪圖,得到Volcano plot(見圖2)。選取差異表達最顯著的前50個基因繪制熱圖(見圖3),可見該基因數據具有顯著的差異性。

圖1 GSE62584基因數據集箱型圖分析(粉色代表多發性硬化患者,藍色代表正常對照)

圖2 GES62584全部基因數據集火山圖Volcano plot

圖3 GES62584基因數據集熱圖分析
在GEO2R平臺中分別對實驗組及對照組數據分組,選取P<0.05及|logFC|>1的基因,去除Gene. symbol為空白的基因,一共有561個差異基因可以納入標準,其中以logFC均呈現正值標記為上調基因:212個,以logFC均呈現負值標記為下調基因:349個,其中差異最顯著的為IL4R,P=0.00000673。
2.2 差異表達基因的通路分析 以“|logFC|>1、P<0.05”為篩選標準,共篩選出561個基因符合標準,將目標基因數據通過基因差異表達分析所篩選出的基因通過 DAVID(https://david. ncifcrf. gov/home. jsp)數據庫中的京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集方法和GO功能富集方法進行分析,發現實驗中所鑒定出的差異靶基因主要作用集中在免疫反應、炎癥反應、信號傳導調控及RNA聚合酶II啟動子轉錄的正調控(見表1)。共有20個差異基因富集于細胞因子與細胞因子受體互作通路中,P<0.05(見圖4),提示細胞因子互作在伴有視神經炎的多發性硬化中起到了重要的作用。

圖4 KEGG 通路分析結果

表1 GO生物學過程
2.3 通過 STRING-database 數據庫進行蛋白相互作用之間的分析 通過STRING-DB數據庫進行靶基因相互作用的分析,共同構成結構復雜的多中心預測差異靶基因的相互作用網絡圖(見圖5)。其中有123條邊,節點平均度為2.83,相互作用的差異靶基因主要是:RGS7、PDCL、IL4R、IL4、GNG7等。

圖5 蛋白功能性富集結果
神經系統自身免疫病種類繁多且發病機制復雜,目前的研究發現多發性硬化可能與環境、遺傳及免疫等方面有關,由于發病機制尚不明確,診斷篩查較為困難,缺乏特異性的生物標志物和特異性診斷方法[8]。本研究通過基因芯片的方法利用高通量數據,通過生物信息學方法從基因水平進一步的探尋了伴有視神經炎的多發性硬化患者中的關鍵基因,我們得到了561個顯著差異表達的基因,進一步通過DAVID進行GO與KEGG富集分析,深度從分子生物學層面挖掘關基因在疾病中的作用機制。
本研究發現GO富集分析結果顯示,這些差異表達的基因主要參與了免疫反應、炎癥反應以及細胞信號傳導的調控。大量研究表明,免疫細胞、免疫球蛋白參與的免疫調控機制在神經系統自身免疫病的發病中起到了重要的作用,是自身產生細胞免疫的重要機制[9]。伴有視神經炎的多發性硬化患者中異常表達的基因參與的免疫應答及炎癥反應,在疾病的致病中發揮了重要的作用。
通過我們的研究同時也發現KEGG信號通路富集在細胞因子與細胞因子受體互作通路(Cytokine-cytokine receptor interaction,hsa04060)。細胞因子是可溶性的細胞外蛋白或糖蛋白,是細胞間調節和動員的關鍵因子,細胞因子參與先天性和適應性炎癥的宿主防御、細胞生長、分化、細胞死亡、血管生成、發育和修復等過程,目的是維持體內的平衡[10]。因子,細胞因子與細胞因子受體相互作用的通路與自身免疫病中的免疫炎癥反應息息相關。伴視神經炎的多發性硬化患者中基因表達異常,存在大量基因表達的上調與下調,也驗證了目前的一些研究:固有免疫和適應性免疫應答均參與發病。這類患者可能同時存在免疫功能的亢進和抑制,因此炎癥反應的強弱處于不斷的變化之中。由此可見,本研究篩選的差異基因及關鍵通路在伴有視神經炎的多發性硬化患者發病的相關免疫炎癥反應扮演了重要的角色,在我們后續的研究中需要進一步驗證這些關鍵基因及通路在疾病中發揮的功能。
多發性硬化相關性視神經炎不同于視神經脊髓炎,多發性硬化相關性視神經炎多為單眼視力下降,可表現為不同程度的視乳頭水腫或球后視神經炎,視力損害嚴重程度不一,一般恢復較好。但視神經脊髓炎相關視神經炎多表現為雙眼同時或相繼出現的嚴重的視力損害,視力恢復較查,可檢測出視神經脊髓炎相關抗體,如水通道蛋白4抗體(AQP4-Ab)。目前有研究表明BTK/NF-κB信號通路在視神經脊髓炎譜系疾病中可調控B細胞分化,可能參與了疾病的發生[11]。但視神經脊髓炎仍缺乏基因分子層面相關研究,視神經炎作為多發性硬化及視神經脊髓炎的典型癥狀,基因及分子層面的研究有助于發病機制的闡明,能更好的為兩種疾病的鑒別提供依據。
多發性硬化相關性視神經炎不同于視神經脊髓炎,多發性硬化相關性視神經炎多為單眼視力下降,可表現為不同程度的視乳頭水腫或球后視神經炎,視力損害嚴重程度不一,一般恢復較好。但視神經脊髓炎相關視神經炎多表現為雙眼同時或相繼出現的嚴重的視力損害,視力恢復較差,可檢測出視神經脊髓炎相關抗體,如水通道蛋白4抗體(AQP4-Ab)。目前有研究表明BTK/NF-κB信號通路在視神經脊髓炎譜系疾病中可調控B細胞分化,可能參與了疾病的發生[11]。但視神經脊髓炎仍缺乏基因分子層面相關研究,視神經炎作為多發性硬化及視神經脊髓炎的典型癥狀,基因及分子層面的研究有助于發病機制的闡明,能更好的為兩種疾病的鑒別提供依據。
在最新一版修訂版多發性硬化Mcdonald診斷標準中提出,隨著MS治療選擇增多,精準診斷顯得格外的重要[12],應結合影像學、血清學、腦脊液及臨床特征與病史來探索疾病的診斷。因此,精準識別早期關鍵的生物學靶點,通過本研究的基因功能和基因參與的通路富集分析,有助于更加深層次的研究疾病的發病機制,同時為快速精準的診治提供依據。本研究通過生物信息學方法,整合數據庫資源,應用國際互聯網及計算機等信息技術,將伴有視神經炎的多發性硬化這一復雜且難診治的疾病的相關基因數據集進行分析研究,使得神經科醫師以及科研工作者能夠更加深刻的清楚其發病機制,為臨床診治帶來了新的希望。