常慧娟,孟夜,朱玉榕,班燕芳,章建國,王芝濤,秦慧
安徽醫科大學第二附屬醫院,合肥 230601
多發性骨髓瘤(MM)是血液系統第2 常見惡性腫瘤[1],其進展是一個多步驟的過程,起初是一個癌前狀態,如意義未明的單克隆丙種球蛋白病(MGUS)和無癥狀骨髓瘤。隨后MM 可以進展為漿細胞白血病(PCL)[2]。盡管近年來對于MM 治療已有較大進展[3],然而,目前的標準療法并未改善伴有髓外病變患者的預后[4-5]。有研究[6]表明,隨著MM患者生存率升高,PCL 發病率較前上升,但PCL 對于現有的治療方案不敏感,預后較差。因此,研究與MM 疾病進展相關的機制,尋找新的預后生物標志物和治療靶點,有助于為MM 的診斷、靶向藥物研究及預后評價提供新的思路及理論依據。目前利用生物信息學工具進行數據分析已在多種腫瘤研究中得到應用,但其在MM 中的相關應用研究較少。本研究利用可公開獲得的基因表達綜合數據庫(GEO)進行生物信息學分析,篩選MM 與PCL 的差異表達基因(DEGs),了解其生物學功能,明確關鍵基因與MM預后的關系。
1.1 數據來源 從GEO 數據庫(http://www.ncbi.nlm.nih.gov/geo)中輸入檢索詞“multiple myeloma”“extramedullary multiple myeloma”進行搜索,篩選得到含有MM 及PCL患者基因數據樣本量較大的GEO基因芯片數據集GSE66291[7]以及GSE70323[8]。GSE66291 數據集平臺為GPL19824,包括114 例MM患者和72 例PCL 患者基因數據樣本;GSE70323 數據集平臺為GPL20614,包括192 例MM 患者和62 例PCL患者基因數據樣本。
1.2 MM 與PCL DEGs 的獲取與分析 用R 軟件(v.3.6.3)對上述兩個數據集中的原始微陣列數據進行標準化及log2 轉換。基于平臺上的注釋信息,將探針IDs 轉換成相應的基因名。當多個探針對應于同一基因時,計算平均表達值來表示基因表達水平。使用R 軟件讀取上述兩個數據集,使用LIMMA包分別在上述兩個數據集中篩選DEGs,篩選標準:|log2 FC|>1 且P<0.05。FC(fold change)表示DEGs的差值倍數。使用R 軟件中的ggplot2 和pheatmap程序包分析DEGs 的差異性表達并進行可視化,使用在線工具Draw Venn diagram(bioinformatics.psb.ugent.be/webtools/ Venn /)繪制Venn 圖,找出在兩組基因芯片數據集中同時上調或者下調的交集基因,即為MM 與PCL DEGs,下簡稱為DEGs。
1.3 DEGs 生物學功能分析 在R 中使用Cluster-Profiler 包,采用基因本體論(GO)分析DEGs 的基因本體功能,包括生物過程、細胞組成和分子功能三個部分;采用京都基因及基因組百科全書(KEGG) 進行DEGs 的信號通路富集分析。以adjustP<0.05 作為篩選條件選出富集結果,將其可視化。
1.4 關鍵基因的篩選 利用String 在線數據庫(https://string.embl.de/)對上述所得的DEGs 進行分析,構建DEGs 的蛋白質間相互作用網絡(PPI),使用Cytoscape 軟件(http://cytoscape.org/)對結果進行可視化。使用Cytohubba 插件對PPI 上所有DEGs 進行評分,本研究選取相關度前20 位的DEGs作為關鍵基因,即hub基因。
1.5 關鍵基因的表達與MM 患者預后的關系分析 根據關鍵基因的mRNA 表達值,將MM 患者分為高表達組及低表達組,并在芯片數據集GSE24080[9-12]對高表達組及低表達組MM 患者進行生存預后分析。當P<0.05 時,表示該基因對于MM患者總體生存率具有顯著影響。
2.1 DEGs 及其生物學功能 總共獲得了210 例MM和57例PCL患者的基因數據,篩選得到DEGs共389 個,其中120 個(30.8%)基因表達上調,269 個(69.2%)基因表達下調。
GO 分析結果顯示:DEGs 參與表達的細胞組分主要與細胞膜外區域相關;在生物過程方面,主要參與白細胞游走、中性粒細胞聚集、體液免疫等;分子功能方面,主要與抗原結合相關。KEGG結果提示DEGs在細胞黏附分子、局灶性黏附等相關通路上富集。
2.2 關鍵基因及其與MM 預后的關系 根據MCC算法選出得分前20 的基因即為關鍵基因,分別為LYZ,MMP8,QPCT,CRISP3,MMP9,PPBP,HBB,BPI,RNASE3,MPO,RNASE2,PLAC8,CD44,ITGA6,CDH1,CXCL12,ITGB7,ITGB3,VCAM1,PECAM1。
在GSE24080數據集中分析結果表明,CXCL12、CDH1、RNASE3、LYZ、PPBP、VCAM1、QPCT、PECAM1 的高表達組(279 例)總體生存率分別為75.6%、77.8%、74.2%、75.6%、74.6%、73.8%、76.0%、78.1%,低表達組(280 例)總體生存率分別為70.0%、67.9%、71.4%、70.0%、71.1%、71.8%、69.6%、67.5%,高表達組高于低表達組(P均<0.05)。MMP8 基因、MMP9、CRISP3、HBB、PLAC8、ITGA6、ITGB3的下調對于MM 的總體生存率無顯著影響(P均>0.05)。
MM 是常見的血液系統惡性腫瘤,其髓外病變(EMD)是一種骨髓外單克隆漿細胞惡性增殖,在MM 患者診斷時的發生率為7%~17%,在疾病過程中的發生率為6%~20%[13]。PCL 是一種罕見的具有侵襲性的骨髓瘤變種,其外周血中存在20%以上的漿細胞或漿細胞絕對值大于2×109/L,占MM 患者的2%~4%[14]。盡管目前不斷引入新的治療方案[15-16],但EMD 和PCL 仍預后不良[17-18]。因此了解從MM 到PCL 發生發展的分子機制和關鍵基因對于MM EMD的診斷和治療有重要意義。
本研究選取GEO數據庫中MM和PCL樣本量較大的兩組基因芯片數據,通過生物信息學技術對其分析,從而篩選出DEGs 共389 個,其中120 個基因表達上調,269 個基因表達下調。對于DEGs 進行GO 分析的結果提示DEGs 主要參與白細胞游走、體液免疫等生物學過程。KEGG 分析顯示DEGs 在細胞黏附分子、局灶性黏附等相關通路上集中富集。這表明篩選出的DEGs 可能在干擾正常組織的免疫功能及促進腫瘤細胞侵犯正常組織方面發揮作用。對于DEGs 進行PPI分析,再通過一組基因芯片對篩選出的關鍵基因進行預后分析,共獲得CXCL12、CDH1 等8 個關鍵基因,其可能在MM 進展中起重要作用。
CXCL12屬于細胞趨化因子,其通過Wnt信號通路表達增強導致破骨細胞與成骨細胞的失衡,并導致克隆性漿細胞侵襲骨骼,促進MM 進展[19]。ZHANG 等[20]研究表明,CXCL12 在MM 患者骨髓中表達升高,其高表達提示預后較差。另外CXCL12參與的其他信號傳導途徑也與瘤細胞侵襲相關,如CXCL12/CXCR4 途徑能導致胰腺癌、乳腺癌等多種腫瘤性疾病進展,其高表達與患者生存率呈負相關[21-22]。CDH1 屬于鈣黏蛋白家族,其參與細胞增殖、細胞黏附等生物學過程[23]。BI 等[24]研究表明,單克隆漿細胞會通過CDH1 途徑影響漿細胞樣樹突樣細胞,促進MM 的發病并逃避免疫監視,參與乳腺癌、胃癌等疾病相關的過程[25-26]。陳定宇等[27]研究表明,CDH1 過表達可導致胃癌患者預后較差。但目前尚未有CDH1 表達與MM 患者預后相關性的報道。PECAM1,也稱為CD31,屬于免疫球蛋白家族,其在促進血管生成、增加血管通透性等方面發揮作用[28-29]。PECM1 高表達可增加細胞的侵襲能力,導致肝癌、胃癌等腫瘤患者預后較差[30]。VCAM1 是一種糖蛋白,參與炎癥反應、免疫疾病等過程。TERPOS 等[31]研究表明,VCAM1 水平升高的MM 患者預后較差。在胃癌、乳腺癌、肺癌等惡性腫瘤中,VCAM1 高表達會促進血管生成及腫瘤轉移。本研究篩選出來的其他關鍵基因,如RNASE3、LYZ 、PPBP 、QPCT 等在MM 與PCL 患者中雖然具有差異性表達,但與MM 相關的機制尚未明確。
本研究發現上述8 個差異基因均在MM 骨髓組織中高表達,其高表達組較低表達組總體生存率高。既往研究發現,CXCL12、CDH1、PECAM1 及VCAM1 高表達促進MM 進展,MM 患者預后較差。但本研究對其進行生存分析發現,高表達組患者生存率較高,這可能是基因檢測技術的提高、新型免疫調節藥物及造血干細胞移植等治療方案廣泛應用于臨床,導致MM患者預后較前改善。
綜上所述,MM 與PCLD 的DEGs 中120 個上調,269 個下調。DEGs 主要與細胞膜外區域相關,參與白細胞游走、與抗原結合、調控細胞黏附分子及局灶性黏附等相關通路。CXCL12、CDH1、RNASE 3、LYZ、PPBP 、VCAM1 、QPCT 和PECAM1 可能是與MM患者預后相關的關鍵基因,其高表達組MM患者預后較好,但本研究的結果還需要進一步進行基礎實驗和臨床試驗進行驗證,這些基因可能會為MM或者其他腫瘤的研究提供新的思路。