徐 華, 陳 佳
(盤錦遼油寶石花醫院 a.檢驗科; b.全科醫學科, 遼寧 盤錦 124010)
原發性干燥綜合征(pSS)是一種常見的系統性自身免疫性疾病,影響著全世界約3 500萬人[1]。在我國的發病率約為0.77%,男女比約為1∶9[2]。除引起外分泌腺、腎、關節和血液等器官、系統損害外,還增加了淋巴瘤的患病風險[3-5]。但pSS初期癥狀輕微,加之缺乏敏感、特異的檢測指標,常被人們忽視,目前亦無特效治療藥物。因此,尋找能夠早期特異診斷pSS的標志物具有重要意義。近年來,隨著分子生物學的發展,對pSS進行了許多研究,并發現了許多有益于診斷和治療生物標志物,但各研究間尚存較大差異,其具體發病機制仍未闡明。本研究為避免單一研究所引起的假陽性問題,通過對基因表達綜合系統(GEO)3個基因芯片數據進行分析,獲得pSS組織與對照組織之間的差異基因,分析與pSS相關基因和信號通路,探討pSS可能的發生機制,并利用pSS相關基因篩選潛在治療藥物,為pSS的的進一步研究提供線索。
1.1GEO數據集獲取 基因表達綜合系統(GEO)下載GSE7451[6]、GSE40611[7]、GSE127952 (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE127952) 3個原發性干燥綜合征基因表達數據作為分析數據集,同時下載GSE84844[8]做為hub基因驗證訓練數據集(見表1)。所有的數據都可以在網上免費獲取,這項研究不涉及任何作者對人類或動物進行的實驗。
1.2差異基因篩選 利用GEO2R在線分析工具(https://www.ncbi.nlm.nih.gov/geo/GEO2R/)分析pSS與非pSS樣本間的差異基因。移除沒有對應基因的探針,當有多個探針對應同一個基因時,取最大表達值探針來作為基因的表達量。并以P<0.05且差異倍數|logFC|≥1.0作為差異基因的篩選條件。最后,使用韋恩圖web工具(bioinformatics.psb.ugent.be/webtools/Venn/)取3個數據集差異基因的交集作為pSS的差異基因。
1.3差異基因分析與hub基因篩選 使用Metascape[9]數據庫對所得差異基因進行GO和KEGG功能富集分析。利用STRING數據庫分析差異基因編碼的蛋白互作網絡,選取交互作用評分大于0.4,并將數據導入Cytoscape[10]軟件進行可視化。通過CytoHubba[11]插件篩選hub基因。本研究選擇MCC得分前25個且度值>20的基因作為pSS的hub基因。同時,以GSE84844作為訓練數據集,應用受試者工作特征曲線(ROC)分析hub基因表達水平與pSS發病風險的關系。用“pROC”包計算曲線下面積(AUC)值和相應的95%置信區間(CI)。
1.4pSS潛在藥物篩選與藥物通路、靶點網絡的構建 將上調和下調的差異基因映射到連接性圖譜(CMAP)數據庫[12]中,以富集分數≤-0.75和P<0.05為篩選標準,獲得針對所選差異基因的小分子藥物,作為pSS治療的候選藥物。為了進一步探討前10項藥物的潛在作用機制以及藥物與通路之間的關系,使用STITCH數據庫[13]來識別這些藥物的靶點,然后分析藥物靶點網絡,顯示前10名藥物與其對應靶點之間的相互作用。利用DRUG-Path數據庫[14]獲得前10名候選藥物的路徑,以P<0.05為差異有統計學意義。
2.1差異基因篩選 以P<0.05且|logFC|≥1.0為篩選條件,在GSE7451中篩選出2 778個差異基因,其中上調基因1 407個,下調基因1 371個;在GSE40611中篩選出2 423個差異基因,1 071個基因上調,1 352個基因下調;在GSE127952中篩選出1 973個差異基因,1 017個上調基因和956個下調基因。隨后,通過對3組差異基因取交集,得到90個最終差異基因,其中79個顯著上調基因(圖1a)和11個下調基因(圖1b)。
2.2差異基因的功能富集分析 90個差異基因導入 MetaScape進行GO與KEGG富集分析。在生物學過程中,這些基因主要參與病毒防御應答、多生物過程的調控、先天免疫應答調控、對β干擾素的反應和細胞對干擾素γ的反應等。在細胞組分方面主要與細胞質核周區、富含ficolin-1顆粒的內腔、膜筏、初級內體、三級顆粒等有關。在分子功能方面主要與半胱氨酸型內肽酶調節因子參與凋亡過程、細胞因子結合、GTP結合、酶激活劑活性、肌動蛋白結合和泛素樣蛋白連接酶結合有關。KEGG通路富集分析顯示,這些基因參與NOD樣受體信號通路、甲型流感、NF-kappa B信號通路、弓形蟲病和凋亡通路等。富集分析結果前10項(分子功能共6項)見圖2、表2。

表1 pSS患者與正常人組織芯片資料

圖1 差異基因韋恩圖與PPI網絡圖 a.上調差異基因;b.下調差異基因;c.差異基因與hub基因PPI網絡圖

圖2 GO和KEGG分析氣泡圖 a.生物過程; b.細胞成分; c.分子功能; d.KEGG途徑

表2 GO與KEGG分析結果
2.3PPI網絡構建與hub基因鑒定 將差異基因導入STRING數據庫,得到90個節點和535個邊組成的PPI網絡,將PPI網絡導入Cytoscape軟件進行可視化分析.應用cytohubba插件計算MCC評分和度值,最終確定19個基因為pSS預選hub基因,這些基因在pSS中均為上調基因(圖1c)。
用ROC曲線分析了19個基因在訓練集GSE84844中對pSS的診斷價值。這些基因對pSS診斷具有較高的敏感性和特異性,對pSS的診斷具有一定的診斷價值,尤其是IFIH1與IFIT5的AUC>0.90,可作為pSS診斷的生物標記物,見表3,圖3。
2.4pSS潛在治療藥物篩選與分析 根據CMAP數據集的預測,15種得分≤-0.75的候選藥物被認為是治療pSS的潛在藥物。對得分最高的前10種藥物進行藥物途徑和藥物靶點分析,共有81條路徑顯著相關(圖4)。其中氟替卡松和氯唑西林分別對應于嗅覺傳導、亨廷頓病、基礎轉錄因子、系統性紅斑狼瘡、格蘭特對宿主病、造血細胞系、哮喘、移植排斥反應、I型糖尿病、MAPK信號通路、抗原處理和呈現途徑。應用STITCH數據庫預測前10名藥物的靶點,然而,數據庫中未能得到Prestwick-691的靶點。因此,僅提出了9個藥物靶點網絡。見表4,圖5。

圖3 IFIHI與IFIT5 ROC曲線圖(陰影部分表示置信水平)

表4 CMAP數據庫篩選的pSS治療藥物

圖4 藥物作用通路網絡圖:紅色節點代表藥物,藍色節點代表受藥物影響的通路

圖5 藥物的靶向網絡圖 a.氟替卡松;b.氯唑西林;c.萘呋胺酯;d.利多卡因;e.多西環素;f.右普萘洛爾(R-普萘洛爾);g.噻嗎洛爾;h.2-氨基苯磺酰胺;i. 呋喃唑酮
pSS已成為世界三大自身免疫性疾病之一[15],在世界不同地區的患病率為0.5%~1.5%[16-18]。盡管在揭示pSS發生發展的分子機制方面已經取得了很多進展,但具體的機制還不清楚。已發表研究之間的不一致也很明顯[19]。因此,進一步研究對于驗證和更新所獲得的信息具有重要意義。本研究通過對3個基因表達數據分析得到了90個(79個上調,11個下調)差異基因。之后,我們進行了GO/KEGG途徑富集分析。DEGs主要富集在NOD樣受體信號通路、甲型流感和細胞因子-細胞因子受體相互作用的信號通路中。免疫調節異常和細胞凋亡異常是pSS損傷腺體的重要機制之一[20]。核苷酸結合寡聚結構域(NOD)樣受體(NLRs)是一類參與調節自然免疫應答和細胞死亡途徑的胞漿蛋白,細胞因子-細胞因子受體相互作用途徑是一種免疫相關的信號途徑,在炎癥宿主防御、細胞生長和分化中起著重要作用[21-22]。此外,病毒感染可以誘導宿主的自然免疫反應,從而激活宿主模式識別受體介導的抗病毒信號通路,如Toll樣受體(TLRs)和RIG-I樣受體(RLRs),可在多種機制的調控下誘導干擾素等細胞因子的表達[23]。這些信號通路可能有助于為pSS制定有效的治療策略。
本研究采用差異構建了PPI網絡,并篩選了19 個hub基因:STAT1、MX1、ISG15、IFIH1、GBP1、IFIT1、XAF1、RSAD2、IFIT2、SAMD9L、TRIM22、IFIT3、IFI44L、HERC5、IFIT5、IFI44、IFI6、RTP4和ISG20。與非pSS組織相比,pSS中所選hub基因的表達均上調。在驗證hub基因時,我們使用獨立的數據集通過ROC曲線進行分析。這些基因對pSS診斷具有較高的診斷價值,尤其IFIH1與IFIT5的AUC>0.90,它們可能是pSS的良好預測指標。這19個基因中有多個是干擾素誘導基因,它們與抗病毒感染、天然免疫和誘導細胞凋亡等功能相關。IFN途徑的激活提示pSS與病毒感染有關[24]。在SLE、皮肌炎、銀屑病等不同疾病中,已有I型IFN途徑紊亂的報道,pSS患者的唇腺和外周血中IFN-α的表達也明顯增高[25-27]。IFN途徑的激活可能是pSS潛在的治療靶點。
基于pSS相關的差異基因進行潛在治療藥物預測,得到15種候選藥物,以期為pSS治療提供更多思路。本研究選取前10種藥物進行靶基因和藥物作用途徑分析。其中,氟替卡松(合成糖皮質激素)和氯唑西林(苯唑西林氯化衍生物)的連接性得分相對較低。氟替卡松直接作用于NR3C1、IL5、DUSP1、CRP、PPARG、DUSP12、BDNF、GATA3、FN1和IL1B,調節嗅覺傳導、亨廷頓病和基礎轉錄因子的信號通路;氯唑西林直接作用于ABCB11和OXA1L,除調節嗅覺轉化外,還參與調節系統性紅斑狼瘡、移植物抗宿主病、造血細胞系、自身免疫性甲狀腺疾病、哮喘、移植物排斥反應、Ⅰ型糖尿病、MAPK信號通路、抗原處理和遞呈信號通路。在本研究中它們是最佳的潛在治療pSS藥物。
本研究尚存一些局限性有待解決。首先,我們需要在體外進一步驗證分析所得的hub基因,并觀察其在pSS中的特異性作用。其次,通過Cmap數據庫預測的潛在治療藥物對pSS治療的影響有待進一步的實驗研究。綜上所述,本研究不考慮上述局限性,基于GEO數據庫的3個基因表達譜數據,在pSS中鑒定出90個DEGs,并通過GO和KEGG通路分析進一步探討pSS的潛在機制。此外,我們的研究預測了15種pSS候選藥物,為pSS診斷、治療的進一步研究提供了新的線索。