梅漢瑋,何國平,趙軒竹,王華慶
(1.天津中醫藥大學 中西醫結合學院,天津 301617; 2.天津市人民醫院 腫瘤診療中心,天津 300122; 3.南開大學人民醫院 轉化醫學研究院,天津 300122)
彌漫性大B細胞淋巴瘤是最常見的非奇霍金淋巴瘤類型,約占所有非霍奇金淋巴瘤的31%。不同類型的DLBCL具有不同分子特征和預后特點[1],盡管臨床基于R-CHOP的化療可治愈大多數患者,但仍有30%~40%的患者會出現復發難治等問題。研究驅動DLBCL的發病機制,預測尋找治療DLBCL的化學藥物具有重要的實踐和理論價值。
從GEO數據庫中獲取DLBCL基因芯片GSE56315測序基因集,從ICGC數據庫中獲取DLBCL基因數據,通過R語言軟件篩選出各數據集中具有統計學意義的差異基因取交集。將兩者數據共同差異基因芯片與GSE180161芯片數據中暴露風險一致的基因再次取交集,獲得實驗集基因差異表達基因。
將實驗集DEGs基因輸入STRING11.5數據庫中,繪制出蛋白互作網絡圖;將PPI數據輸出保存,采用Cytoscape 3.9.1軟件實現可視化,基于CytoHubba插件中的MCC算法,篩選出PPI蛋白互作中排名前10的hub基因。
將預測Top10靶標作為治療靶點,在Cmap數據庫中篩選對Top10具有生物學效應的化學藥物。
為進一步驗證Top10關鍵基因對DLBCL患者預后情況的影響,采用帶有預后的芯片GSE180161作為驗證集數據,驗證DEGs中Top10關鍵基因的預后生存情況。
根據分析結果選擇具有生存意義的hub基因與預測的治療藥物進行分子對接,通過Pymol軟件構建靶點-藥物可視化結果。
通過對GEO數據庫匯總DLBCL組織芯片GSE56315進行R語言分析,得到差異表達基因,上調基因1 336個,下調基因1 257個(圖1);在ICGC數據庫中獲取的DLBCL差異基因中,上調基因3 483個,下調基因368個(圖2)。用R語言軟件取交集,共獲取上調基因456個,下調基因38個。將高表達與低表達差異基因分別與芯片GSE180161數據集中風險因素一致的基因做交集,使用R語言軟件分析芯片GSE180161數據集與高表達基因,取交集共獲得61個DEGs基因。將芯片GSE180161數據集中的基因(HR<1.0)與低表達基因取交集,得到13個DEGs基因。
圖1 組織芯片GSE56315(55個淋巴瘤組織與33個扁桃腺組織)差異基因Fig.1 Differential genes of tissue microarray GSE56315 (55 lymphoma tissues and 33 tonsil tissues)
圖2 ICGC數據庫(27個DLBCL組織樣本和7個扁桃腺組織樣本)差異基因Fig.2 Differential genes of ICGC database (27 DLBCL tissue samples and 7 tonsil tissue samples)
將上述DEGs基因導入STRING 11.5數據庫中,以圖片形式和數據格式輸出PPI關系結果。利用Cytoscape 3.9.1 軟件分析PPI數據,利用插件中的MCC算法計算出前10位hub基因,即TLR2、IL10、CCRL2、CD163、S100A9、C1QA、SIGLEC1、C5AR1、VSIG4、S100A8。
將與DLBCL發生發展密切相關的Top 10靶標導入Cmap數據庫中,從中篩選出治療DLBCL最優的靶標化學藥物Palomid-529。
為進一步驗證Top10基因是否對DLBCL發生發展及預后生存具有臨床意義,基于芯片GSE180161數據集驗證Top10基因預后生存情況,發現CCRL2、SIGLEC1、VSIG4具有顯著生存意義,而CD163基因的預后生存差異值為(P=0.05),因此將CCRL2、SIGLEC1、VSIG4、CD163靶點作為治療DLBCL疾病的關鍵靶標。
基于Cmap數據庫篩選出治療DLBCL的最優化學物質,利用Auto dock軟件,對化學藥物與關鍵的4個靶點進行治療性模擬對接,發現對接結Palomid-529能有效地與靶標結合,CD163、CCRL2、VSIG4、SIGLEC1的能量值分別為-6.79 KJ/mol、-8.99 KJ/mol、-6.12 KJ/mol、-5.17 KJ/mol。
彌漫大B細胞淋巴瘤臨床治療基于R-CHOP方案可治愈大多數患者,但仍有部分患者發生復發轉移,因此迫切需要尋找有效、特異性高、敏感的分子靶標及治療藥物。對GEO與ICGC數據庫進行分析發現,CCRL2、SIGLEC1、VSIG4、CD163基因是可能驅動彌漫大B細胞淋巴瘤疾病發生發展的關鍵基因。CCRL2又名為趨化因子誘餌受體2,是一種跨膜G蛋白偶聯受體,在人體組織和器官中廣泛分布并參與了腫瘤炎癥浸潤與免疫反應。研究表明,敲除CCRL2基因可抑制骨髓增生異常綜合征的發生發展[2]。VSIG4又名V-set和免疫球蛋白結構域包含4,是I型膜蛋白的一種,臨床上一直被認為是致癌基因。研究發現,VSIG4基因在肝癌、肺癌、卵巢癌等癌種中出現過表達且抑制招募T細胞淋巴細胞激活,從而促進腫瘤發生發展。Jin Roh等對多發性骨髓瘤患者進行研究發現,VSIG4高表達組的總生存期明顯低于VSIG4低表達組,說明多發性骨髓瘤中的VSIG4基因表達可作為預后不良的獨立指標。本研究發現,在DLBCL患者中VSIG4高表達組的總生存期明顯低于VSIG4低表達組,由此猜想VSIG4 基因表達可作為DLBCL患者預后不良的獨立指標,VSIG4靶點可作為治療靶標。CD163和VSIG4均是I型膜蛋白,研究表明,CD163的表達與DLBCL不良預后有關系。研究發現,CD163陽性乳腺癌患者明顯出現較差的總生存期和較短的無病生存率且高表達預后情況差,因此CD163基因有望作為治療DLBCL的一個重要靶標。SIGLEC1是唾液酸黏附素,又名CD169。SIGLECS蛋白廣泛表達分布于免疫細胞的表面,在維持平衡免疫與炎癥反應中起著關鍵作用。研究發現,腫瘤細胞能夠通過唾液酸化配體與抑制性SIGLECS結合,實現腫瘤免疫逃逸,這是腫瘤治療出現復發難治的重要原因[3]。而淋巴瘤出現復發難治問題很可能是因為DLBCL患者存在SIGLEC1基因的高表達情況。
通過對GEO數據和ICGC數據庫中DLBCL的基因表達譜研究發現上調基因61個DEGs、下調基因13個DEGs,將其作為靶標蛋白得到蛋白互作網絡,運用Cytoscape軟件中的算法,分析了Top10靶點(TLR2、IL10、CCRL2、CD163、S100A9、C1QA、SIGLEC1、C5AR1、VSIG4、S100A8)并對其預后生存情況進行分析,發現CCRL2、SIGLEC1、VSIG4、CD163對彌漫大B細胞淋巴瘤患者的預后有一定的臨床價值,有望成為評估預后的新指標和治療靶點。基于Cmap數據分析篩選發現,Palomid-529可能會成為新的靶向治療藥物。通過分子-靶標對接結果發現,Palomid-529能與CCRL2、SIGLEC1、VSIG4、CD163關鍵靶標結合良好,可能成為治療DLBCL的新的靶向藥物,為治療提供新思路。