張飛飛,袁 紅,謝映春,韓潤(rùn)川
1.四川省醫(yī)學(xué)科學(xué)院·四川省人民醫(yī)院輸血科,四川成都 610072;2.陜西省中醫(yī)醫(yī)院檢驗(yàn)科,陜西西安 710003
骨髓增生異常綜合征(MDS)是一種異質(zhì)性的髓系克隆性疾病,此類(lèi)疾病患者的外周血細(xì)胞減少,且轉(zhuǎn)化為急性髓細(xì)胞性白血病(AML)的風(fēng)險(xiǎn)增加,此類(lèi)疾病好發(fā)于老年男性[1-2]。隨著測(cè)序技術(shù)的發(fā)展,已有研究證明MDS患者的基因位點(diǎn)突變(如DNA甲基化、染色質(zhì)修飾、RNA剪接、轉(zhuǎn)錄、信號(hào)轉(zhuǎn)導(dǎo)等)與正常造血的破壞,MDS的形成,MDS轉(zhuǎn)化為AML等過(guò)程密切相關(guān)[1],并已有部分突變基因被推薦為MDS的鑒別診斷和危險(xiǎn)度分層的檢測(cè)項(xiàng)目,如TP53、TET2、DNMT3A等[2-4]。得益于高通量測(cè)序的發(fā)展,研究者可從各種生物數(shù)據(jù)庫(kù)挖掘疾病相關(guān)的基因,分析其基因表達(dá)情況,為深入研究提供一定的思路。本研究通過(guò)基因表達(dá)綜合數(shù)據(jù)庫(kù)(GEO)及生物信息學(xué)相關(guān)軟件,挖掘MDS的疾病特征基因,旨在為探索MDS的發(fā)病機(jī)制、診斷、治療及預(yù)后判斷提供基礎(chǔ)。
1.1資料搜集 利用國(guó)家生物技術(shù)信息中心(NCBI)中GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo/),以“myelodysplastic syndrome”、“homo”為關(guān)鍵詞搜索目標(biāo)芯片。納入標(biāo)準(zhǔn):(1)所選數(shù)據(jù)集為全基因組的mRNA芯片數(shù)據(jù);(2)數(shù)據(jù)集中有疾病組和健康對(duì)照組,均不少于10個(gè)樣本。經(jīng)篩選后,采用以GPL570為平臺(tái)的數(shù)據(jù)集GSE4619、GSE19429、GSE58831進(jìn)行數(shù)據(jù)挖掘分析,隨機(jī)將3組獨(dú)立數(shù)據(jù)按2∶1的比例分為訓(xùn)練集和測(cè)試集,即GSE4619與GSE19429合并后的校正數(shù)據(jù)作為訓(xùn)練集,GSE58831作為測(cè)試集。在訓(xùn)練集中包含28個(gè)正常樣本(健康對(duì)照組)、238個(gè)MDS樣本(疾病組);測(cè)試集中包含11個(gè)正常樣本、159個(gè)MDS樣本。
1.2方法
1.2.1MDS的差異表達(dá)基因(DEGs)篩選 應(yīng)用R語(yǔ)言的Limma包對(duì)訓(xùn)練集中的疾病組及健康對(duì)照組進(jìn)行DEGs的篩選(校正后P<0.05、|logFC|>1),并繪制DEGs的火山圖。
1.2.2DEGs的基因本體(GO)功能富集及京都基因與基因組百科全書(shū)(KEGG)調(diào)控通路富集 使用DAVID2021(https://david.ncifcrf.gov/)在線分析工具對(duì)1.2篩選出來(lái)的DEGs進(jìn)行GO功能富集和KEGG信號(hào)通路分析,并通過(guò)ggplot2包進(jìn)行可視化。
1.2.3MDS的加權(quán)基因共表達(dá)網(wǎng)絡(luò)(WGCNA)分析 應(yīng)用R語(yǔ)言的WGCNA包對(duì)訓(xùn)練集的疾病組與健康對(duì)照組的表達(dá)數(shù)據(jù)進(jìn)行共表達(dá)網(wǎng)絡(luò)分析。該方法用來(lái)描述不同樣本之間的基因關(guān)聯(lián)模式,是對(duì)訓(xùn)練集中表達(dá)數(shù)據(jù)的另外一種分析方法。該方法首先通過(guò)對(duì)基因相關(guān)系數(shù)取n次冪的方式計(jì)算任意兩個(gè)基因之間的相關(guān)系數(shù),并通過(guò)合適的power值構(gòu)建最佳的無(wú)尺度網(wǎng)絡(luò),再將鄰接網(wǎng)絡(luò)轉(zhuǎn)化為拓?fù)渲丿B(TOM)來(lái)計(jì)算基因之間的關(guān)系;另外,再基于TOM值的相異度對(duì)基因構(gòu)建層次聚類(lèi)樹(shù),篩選出連接度高的基因并定義為模塊;再者,通過(guò)模塊與疾病狀態(tài)的相關(guān)系數(shù)及P值繪制模塊與疾病的相關(guān)性熱圖;基于基因與模塊之間的相關(guān)性(MM值)、基因的重要性(GS值)得到每個(gè)模塊中的基因重要性圖形和每個(gè)模塊的散點(diǎn)圖;最后,根據(jù)基因重要性的過(guò)濾條件(geneSigFilter=0.5)和基因與模塊相關(guān)性的過(guò)濾條件(moduleSigFilter=0.8)篩選出每個(gè)模塊的核心基因(即Hub基因)[5-6]。
1.2.4Hub基因與DEGs取交集 利用R語(yǔ)言的venn包對(duì)DEGs和模塊Hub基因取交集,得到交集差異基因。
1.2.5交集差異基因的Lasso回歸分析 該方法是一種壓縮估計(jì),對(duì)交集差異基因進(jìn)行進(jìn)一步篩選。它通過(guò)構(gòu)造一個(gè)懲罰函數(shù)得到一個(gè)較為精煉的模型,使得它壓縮一些回歸系數(shù),即強(qiáng)制系數(shù)絕對(duì)值之和小于某個(gè)固定值;同時(shí)設(shè)定一些回歸系數(shù)為零。用glmnet包對(duì)疾病的特征基因數(shù)目進(jìn)行篩選。
1.2.6訓(xùn)練集和測(cè)試集中疾病特征基因的表達(dá)量 利用limma包與ggpubr包分別將訓(xùn)練集、測(cè)試集的表達(dá)數(shù)據(jù)與Lasso回歸分析篩選出來(lái)的特征基因進(jìn)行分析,以MDS患者為疾病組,健康者為健康對(duì)照組,對(duì)每個(gè)基因進(jìn)行循環(huán)并統(tǒng)計(jì)分析,最后繪制差異箱線圖(P<0.05)。
1.2.7單樣本基因富集(ssGSEA)分析 該方法主要用來(lái)量化免疫浸潤(rùn)。運(yùn)用R的擴(kuò)展包(GSEABase包、GSVA包等)及免疫基因集文件對(duì)訓(xùn)練集中每個(gè)樣本的數(shù)據(jù)進(jìn)行免疫基因打分;利用vioplot包對(duì)免疫細(xì)胞的打分進(jìn)行統(tǒng)計(jì)分析并可視化(P<0.05);最后對(duì)特征基因進(jìn)行免疫相關(guān)性統(tǒng)計(jì)分析并繪制熱圖(P<0.05)。
1.3統(tǒng)計(jì)學(xué)處理 采用R4.1.2進(jìn)行統(tǒng)計(jì)分析。
2.1MDS相關(guān)DEGs的篩選及分析 本研究將GSE4619與GSE19429合并后的校正數(shù)據(jù)作為訓(xùn)練集,繪制疾病組與健康對(duì)照組DEGs的火山圖,見(jiàn)圖1。從中獲得88個(gè)DEGs,其中上調(diào)基因11個(gè),下調(diào)基因77個(gè)。

注:|logFC|>1,校正后P<0.05;紅色表示高表達(dá),綠色表示低表達(dá)。
2.2MDS相關(guān)DEGs的GO和KEGG富集分析 使用DAVID數(shù)據(jù)庫(kù)和ggplot2包對(duì)上述DEGs進(jìn)一步分析,GO富集分析結(jié)果顯示,DEGs在生物學(xué)過(guò)程層面主要富集于免疫應(yīng)答、信號(hào)通路傳導(dǎo)等;在細(xì)胞組分層面,DEGs主要在細(xì)胞質(zhì)膜外側(cè)面執(zhí)行功能;在分子功能層面主要是結(jié)合DNA及蛋白質(zhì)。KEGG富集分析結(jié)果顯示,DEGs主要富集于原發(fā)性免疫缺陷、造血細(xì)胞譜系、B細(xì)胞受體信號(hào)傳導(dǎo)、癌癥中的轉(zhuǎn)錄失調(diào)、Hippo信號(hào)通路、中性粒細(xì)胞細(xì)胞外陷阱形成。
2.3MDS的WGCNA分析 為了構(gòu)建最佳的無(wú)尺度網(wǎng)絡(luò)和有效的基因連接,最佳軟閾值設(shè)置為4,見(jiàn)圖2。隨后將相似基因進(jìn)行合并,共得到8個(gè)模塊并分析其與臨床性狀的相關(guān)性。結(jié)果顯示,黑色模塊的基因重要性最強(qiáng)(P<0.01),并且與MDS呈負(fù)相關(guān)(cor=-0.51,P<0.01),與HD呈正相關(guān)(cor=0.51,P<0.01),黑色模塊中一共有99種基因,根據(jù)geneSigFilter=0.5,moduleSigFilter=0.8兩個(gè)條件篩選出來(lái)5個(gè)Hub基因。該模塊的MM值與GS值的散點(diǎn)圖見(jiàn)圖3,右上角的基因即為Hub基因,分別是AKAP12、ARPP21、IGHV5-78、MME、NPY。

圖2 軟閾值的確認(rèn)

圖3 黑色模塊基因模塊隸屬度與基因顯著性相關(guān)的散點(diǎn)圖
2.4Venn圖繪制及關(guān)鍵基因的Lasso回歸分析 Venn包取Hub基因與DEGs的交集,得出Hub基因包含于DEGs;Lasso回歸分析對(duì)上述5個(gè)Hub基因進(jìn)行分析,交叉驗(yàn)證誤差最小的點(diǎn)所對(duì)應(yīng)的值為疾病特征基因的數(shù)目,最終得到4個(gè)疾病特征基因,分別是AKAP12、ARPP21、MME、NPY。見(jiàn)圖4。

圖4 Hub基因與DEGs的Venn圖及核心基因的Lasso回歸分析
2.5訓(xùn)練集和測(cè)試集中特征基因的表達(dá)量 使用limma包與ggpubr包對(duì)訓(xùn)練集及測(cè)試集中疾病特征基因AKAP12、ARPP21、MME、NPY的表達(dá)進(jìn)行循環(huán)和統(tǒng)計(jì)并可視化,在訓(xùn)練集中,疾病組上述4種特征基因的表達(dá)量下降(P<0.05),見(jiàn)圖5;在測(cè)試集中也得出了相同的結(jié)果,見(jiàn)圖6。上述結(jié)果顯示,與健康對(duì)照組相比,這4種基因的表達(dá)在疾病組中明顯下調(diào)(P<0.05)。

注:***P<0.01;HD為健康對(duì)照組,MDS為疾病組。

注:***P<0.01。
2.6ssGSEA分析 接下來(lái)對(duì)訓(xùn)練集中每個(gè)樣本的數(shù)據(jù)進(jìn)行免疫基因打分,進(jìn)一步統(tǒng)計(jì)分析并對(duì)其進(jìn)行小提琴圖的繪制。在MDS中活化的B細(xì)胞、成熟B細(xì)胞、記憶B細(xì)胞、嗜酸性粒細(xì)胞的免疫浸潤(rùn)明顯下降(P<0.01),見(jiàn)圖7。而在上述4種特征基因中,免疫細(xì)胞相關(guān)性分析結(jié)果顯示,特征基因與活化的B細(xì)胞、成熟的B細(xì)胞、記憶B細(xì)胞、嗜酸性粒細(xì)胞、Ⅱ型輔助T細(xì)胞、Treg細(xì)胞、活化的CD4+T細(xì)胞呈正相關(guān);與效應(yīng)記憶型CD8+T細(xì)胞、中央記憶T細(xì)胞(CD4+與CD8+)、成熟的樹(shù)突狀細(xì)胞,Ⅰ型輔助T細(xì)胞呈負(fù)相關(guān),見(jiàn)圖8。

圖7 疾病組與健康對(duì)照組的免疫細(xì)胞差異分析

注:*P<0.05;**P<0.01;***P<0.001。
MDS是一種常見(jiàn)的髓系異質(zhì)性疾病,此類(lèi)疾病的發(fā)生通常與AML的發(fā)生有密切聯(lián)系。此類(lèi)疾病一般發(fā)生于40歲之后,常見(jiàn)的病因有化療或放療、煙草或有毒溶劑或農(nóng)藥[7]。基因突變、基因表達(dá)失控、表觀遺傳學(xué)改變及免疫失調(diào)在此類(lèi)疾病進(jìn)程中起著重要作用[8-9]。在先天性免疫應(yīng)答方面,MDS的造血干細(xì)胞中Toll樣受體信號(hào)通路異常激活,細(xì)胞因子及炎癥小體異常表達(dá)[10];在適應(yīng)性免疫應(yīng)答方面,各類(lèi)T細(xì)胞和Treg細(xì)胞在疾病不同的階段呈現(xiàn)不同的反應(yīng)[11]。另外,有一部分基因的表達(dá)異常與免疫失調(diào)存在一定聯(lián)系。筆者運(yùn)用生物信息學(xué)方法挖掘到疾病的4個(gè)特征基因(AKAP12、ARPP21、MME、NPY),再對(duì)其進(jìn)行免疫浸潤(rùn)分析,或許對(duì)此類(lèi)疾病的發(fā)病機(jī)制和預(yù)后分析有一定價(jià)值。
AKAP12即A激酶錨定蛋白12,是蛋白激酶A與蛋白激酶C的調(diào)節(jié)劑,也是一種腫瘤生長(zhǎng)調(diào)節(jié)的負(fù)調(diào)節(jié)因子[12]。其甲基化導(dǎo)致的表達(dá)下調(diào)在肺癌、結(jié)直腸癌、肝癌、食管癌等多種癌癥中存在,與抑制癌細(xì)胞的血管生成、增殖、趨化和侵襲有密切關(guān)系。之前的研究顯示,該分子不僅在青少年粒單核細(xì)胞白血病中呈現(xiàn)DNA高甲基化,而且在髓系惡性腫瘤(如AML、慢性髓性白血病、MDS)中也顯著下調(diào)[13-14]。Gravin/AKAP12是AKAP的家族成員,其也被證實(shí)在急性白血病中低表達(dá),已有研究發(fā)現(xiàn),Gravin基因的低表達(dá)與AML的高復(fù)發(fā)風(fēng)險(xiǎn)之間存在一定聯(lián)系[15]。而B(niǎo)OULTWOOD等[16]的研究表明,10例MDS患者中有9例患者的Gravin基因呈低表達(dá),綜上所述,本研究數(shù)據(jù)分析發(fā)現(xiàn)的AKAP12在MDS患者總體表達(dá)量降低與以往研究結(jié)果一致。
MME屬于基質(zhì)金屬蛋白酶(MMP)家族(又稱(chēng)CD10),稱(chēng)為膜金屬內(nèi)肽酶,MME/CD10編碼一種常見(jiàn)的急性淋巴細(xì)胞白血病抗原,是診斷兒童急性淋巴細(xì)胞白血病的關(guān)鍵細(xì)胞表面標(biāo)志物[17]。同樣,該基因在炎癥調(diào)節(jié)、實(shí)體腫瘤的進(jìn)展中有著重要意義。PIETRZAK等[18]的研究表明,MMP2、MMP16在AML中低表達(dá),而CHUNG等[19]及ZHAO等[20]分別通過(guò)流式細(xì)胞實(shí)驗(yàn)和高通量的芯片分析技術(shù)證實(shí)MDS的骨髓細(xì)胞中的MME基因低表達(dá),以上研究結(jié)果與本研究結(jié)果相符合。
ARPP21表達(dá)cAMP調(diào)節(jié)的磷酸化蛋白21,該蛋白富集于尾狀核和小腦皮層,主要與智力發(fā)育障礙等疾病有關(guān),另外它還可以作為microRNA的調(diào)節(jié)蛋白影響靶基因的表達(dá)[21];NPY基因編碼一種在中樞神經(jīng)系統(tǒng)中廣泛表達(dá)的神經(jīng)肽,神經(jīng)肽Y受體是Gi/o蛋白偶聯(lián)受體家族,可能是各種代謝和心血管疾病的危險(xiǎn)因素。有研究表明,淋巴母細(xì)胞來(lái)源的NPY蛋白水平在兒童B細(xì)胞前體的急性白血病中增高,且與疾病的臨床分型、預(yù)后的有利結(jié)果有關(guān)[22]。NILIUS-ELILIWI等[23]使用優(yōu)于傳統(tǒng)診斷方式的“光學(xué)基因組圖譜”(一種廣泛的基因組檢測(cè)方式)檢測(cè)到急性髓系白血病的DDX3X:MLLT10基因融合及ARPP21缺失。但ARPP21及NPY與MDS疾病的具體研究鮮見(jiàn)文獻(xiàn)報(bào)道。在本研究中,ARPP21及NPY在MDS患者中低表達(dá),且在訓(xùn)練集和測(cè)試集中結(jié)果一致。
另外,本研究對(duì)訓(xùn)練集的基因進(jìn)行了免疫打分,發(fā)現(xiàn)MDS組中的活化、成熟、記憶的B細(xì)胞數(shù)量低于健康對(duì)照組。而對(duì)4個(gè)關(guān)鍵基因的免疫浸潤(rùn)分析中,筆者發(fā)現(xiàn)其與活化、成熟、記憶B細(xì)胞呈正相關(guān)(P<0.001),提示在MDS疾病中B細(xì)胞介導(dǎo)的體液免疫反應(yīng)處于抑制的狀態(tài),這與之前的相關(guān)報(bào)道相符合[24]。而在細(xì)胞免疫應(yīng)答中,之前的報(bào)道顯示低危組的免疫系統(tǒng)處于激活、促炎狀態(tài);而高危組則與之相反。具體來(lái)說(shuō),低危組MDS患者的Th1、Ts(細(xì)胞毒性T細(xì)胞)數(shù)目增高,Th1/Th2比例高,Treg細(xì)胞減少;而高危組的Th1、Ts數(shù)量逐漸減少,Th1/Th2比例降低,Treg細(xì)胞增多。這有利于腫瘤細(xì)胞的免疫逃逸,以及疾病向白血病快速轉(zhuǎn)化[11,25]。在本研究中,對(duì)關(guān)鍵基因的免疫浸潤(rùn)分析結(jié)果顯示,AKAP12、ARPP21、MME、NPY與Th2、Treg細(xì)胞、活化的CD4+T細(xì)胞呈正相關(guān),與Th1、Ts(CD8+效應(yīng)T細(xì)胞)及中央型記憶T細(xì)胞呈負(fù)相關(guān)。提示這些關(guān)鍵基因或許對(duì)疾病預(yù)后分組有一定價(jià)值。
最后,MDS中免疫系統(tǒng)的激活與否直接影響到細(xì)胞因子的水平及炎癥信號(hào)通路[10]。在差異基因的GO富集分析中,除了富集于免疫應(yīng)答,還富集于信號(hào)通路的傳導(dǎo)。WANG等[26]總結(jié)了MDS中的信號(hào)通路失調(diào),其中NF-κB信號(hào)通路可以影響造血干細(xì)胞的功能。而B(niǎo)細(xì)胞受體信號(hào)傳導(dǎo)的失調(diào)也許與B細(xì)胞活化抑制相關(guān)[27],深入探索關(guān)鍵基因與B細(xì)胞活化及免疫細(xì)胞變化的具體作用機(jī)制,或?qū)榧膊〉闹委熍c預(yù)后帶來(lái)一定思考。
本研究主要運(yùn)用WGCNA及Lasso回歸的方式進(jìn)行分析運(yùn)算,篩選了MDS的疾病特征基因并對(duì)其與免疫細(xì)胞的關(guān)系進(jìn)行了分析。本研究結(jié)果不僅證實(shí)了AKAP12及MME的水平在MDS中下降,更是發(fā)現(xiàn)了ARPP21及NPY在MDS中的水平變化,后續(xù)還需要收集臨床標(biāo)本進(jìn)行多方面的驗(yàn)證。同時(shí),在分析特征基因與免疫細(xì)胞之間的關(guān)系時(shí),本研究尚未區(qū)分4種關(guān)鍵特征基因分別在高危組和低危組MDS中的變化,也未深入了解免疫細(xì)胞變化的機(jī)制,應(yīng)該在后續(xù)研究中進(jìn)一步探索。本研究為闡述MDS的發(fā)病機(jī)制、MDS與免疫細(xì)胞之間的關(guān)系、疾病的診斷及預(yù)后提供了重要的參考價(jià)值。
國(guó)際檢驗(yàn)醫(yī)學(xué)雜志2023年17期