馬利敏,楊海平,楊學文,阮林海
免疫性血小板減少癥(immune thrombocytopenia,ITP)是兒童最常見的出血性疾病,以皮膚黏膜出血和血小板計數減少為主要表現。兒童ITP是一種良性自限性疾病,絕大多數患兒病程小于3個月,預后良好,定義為新診斷ITP。但有20%~30%的患兒病程遷延反復,持續12個月以上,發展為慢性ITP[1]。科學研究表明,ITP是一種獲得性自身免疫性疾病,免疫功能紊亂、遺傳易感背景或繼發因素引起血小板破壞增加和再生障礙在ITP的發病中起著關鍵作用,但具體機制尚未完全闡明[2, 3]。
基因芯片是一種高效的生物信息檢測技術,能夠檢測樣本中基因的表達水平,具有高通量、多參數、平行化等特點,在功能基因組學研究中發揮著重要作用。生物信息學運用信息科學的原理和技術分析基因組測序和其他高通量技術所產生的大規模分子數據集,使其更易解讀,已成為生物醫學研究領域所必需的工具[4]。本研究利用基因表達數據庫(Gene Expression Omnibus,GEO)中兒童新診斷ITP相關基因芯片,對發病期和緩解期的基因表達譜進行比較,探索兒童新診斷ITP分子特征的變化,通過生物信息學分析描述ITP相關基因的功能分布情況以及明確其所參與的主要代謝途徑和轉導通路,為深入探索兒童ITP發生的分子機制和指導早期治療提供基礎。
1.1資料來源 從在線GEO數據庫中下載GSE56232基因芯片,該數據集包含了6例新診斷ITP患者發病期和緩解期的外周血T細胞表達譜[5]。試驗共納入6例新診斷ITP患兒,年齡0.7-13.8歲。分別收集6例患兒發病期(發病一周內且未接受任何治療)和緩解期(至少12個月后且血小板計數持續> 150 × 109/l)的外周血,分離T細胞并提取總RNA,然后采用GPL570平臺,即昂飛人類基因組U133 Plus 2.0基因芯片檢測表達譜。
1.2差異基因篩選 把GSE56232數據集導入BRB-ArrayTools軟件,進行芯片信號值的預處理、過濾和標準化。以緩解期為對照組,發病期為實驗組,采用基因芯片顯著性分析方法統計每個基因的顯著水平P值和誤判率Q值。本研究中差異表達基因(differentially expressed genes,DEGs)的篩選標準定義為:P<0.05,差異倍數≥2倍,同時計算基因間的Pearson相關系數,依照先基因、后樣本的順序對差異基因進行聚類分析。
1.3功能富集分析 基因本體(Gene Ontology,GO)是基因功能的標準化分類體系,包括生物過程、分子功能、細胞組分三種類型。本研究基于GO數據庫,采用Fisher檢驗計算GO富集各條目的富集水平P值,同時用Benjamini-Hochberg法校正以控制錯誤發現率(false discovery rate,FDR),顯著富集GO條目的篩選標準定義為P<0.05,FDR<0.05。
1.4通路富集分析 通路富集分析是以KEGG數據庫中的Pathway為基本單位,向背景基因組映射,通過統計檢驗從而明確差異基因所參與的主要代謝途徑和細胞轉導通路。本研究采用Fisher檢驗統計差異基因在Pathway中的富集水平,顯著富集pathway的標準定義為P<0.05。
1.5互作網絡分析 對于差異基因的表達譜數據,首先計算出各基因間的相關系數矩陣、各節點間的連接度和不相似度,再通過基因間的相互關系擬合基因的無標度網絡關系,從而得到基因共表達網絡[6]。根據圖論原理,以Pathway為研究對象,將顯著性富集的通路基于KEGG數據庫中的相互作用關系構建通路互作網絡[7]。
2.1差異基因篩選 以新診斷ITP緩解期為對照組,發病期為實驗組,從外周血T細胞表達譜中共鑒定出582個DGEs,包含45個上調基因,537個下調基因,其中細胞周期蛋白M2(cyclin M2,CNNM2)和前列腺素內過氧化物合酶2(prostaglandin-endoperoxide synthase 2,PTGS2)分別在上調和下調基因中差異變化最顯著,部分差異基因列于表1。

表1 部分差異表達基因列表
2.2功能富集分析GO富集分析用來描述差異基因在功能分布上的情況。通過GO分類體系對差異基因注釋后發現,顯著富集的生物學過程共包括124個GO條目,主要包括DNA損傷與修復、轉錄調控、細胞周期、細胞因子、信號傳導、血液凝固、蛋白修飾、細胞粘附與遷移等,富集水平最顯著的前20個條目列于表2。另外,顯著富集的分子功能共涉及38個GO條目,主要包括蛋白結合、白介素6受體結合、整合素結合、ATP結合、微管結合、DNA結合、蛋白激酶活性等。
2.3通路富集分析 通路富集分析發現兒童新診斷ITP相關基因主要富集于細胞周期、細胞骨架調節、轉化生長因子β(transforminggrowthfactorβ,TGFβ)信號通路、白細胞遷移、絲裂原活化蛋白激酶(mitogen-activatedproteinkinase,MAPK)信號通路、細胞凋亡、Wnt通路等41個通路,富集水平最顯著的前15條通路列于表3。

表2 差異表達基因GO富集分析

表3 差異表達基因通路富集分析
2.4互作網絡分析 基于差異基因表達數據,通過基因間的相關系數擬合基因的無標度網絡關系構建基因共表達網絡,挖掘出的核心基因包括UBR3、ERBIN、KIF5B和SLK。基于KEGG數據庫中信號通路的關系,以圓點表示通路,帶箭頭的實線表示通路的上下游關系,構建顯著性通路之間的互作網絡,挖掘出核心通路包括細胞凋亡、細胞周期和MAPK信號通路。見圖1。
ITP的病因與發病機制目前尚不完全明確,隨著研究的深入,兒童ITP被逐步認為是一種免疫失耐受疾病。一般認為ITP的發病是在遺傳易感基因的基礎上,在病毒感染或者接種疫苗等誘因下,機體免疫調節功能發生紊亂,導致免疫系統在處理外來抗原或血小板抗原時不能獲得耐受。B細胞過度激活,產生抗血小板抗體而致敏血小板,單核巨噬細胞系統進而吞噬致敏的血小板,而T細胞及其亞群功能異常使B細胞異常活化產生血小板表面相關抗原抗體,加速了血小板破壞[3, 8, 9]。

圖1通路相互作用網絡分析
為了探索兒童新診斷ITP發病時基因表達水平的改變,本研究利用GEO數據庫中相關基因芯片,對發病期和緩解期的表達譜進行比較分析,結果共鑒定出582個差異基因,包括45個上調表達基因和537個下調表達基因,其中CNNM2和PTGS2分別在上調和下調基因中變化最為顯著。CNNM2主要參與鎂離子轉運和鎂離子代謝平衡過程,其突變與腎性低鎂血癥相關[10];PTGS也稱為環氧酶(Cyclooxygenase,COX),是合成各種前列腺素的關鍵酶。COX有兩種同工酶,即組成型酶COX-1和誘導型酶COX-2。PTGS2基因編碼誘導型酶COX-2,其表達受特異性刺激調節,如白細胞介素1(interleukin1,IL-1)、腫瘤壞死因子、表皮生長因子、雌二醇、藥物等,參與炎癥反應、有絲分裂、血管新生過程中前列腺素的合成,涉及NF-κB信號通路、血管內皮生長因子受體信號通路等。有研究發現PTGS2和前列腺素E合成酶共表達于成熟巨核細胞和血小板中,PTGS2基因缺失延遲骨髓巨核細胞生成,釋放高反應性血小板,增加體內血栓形成能力,表明PTGS2表達有助于巨核細胞成熟和血小板形成[11,12]。聚類分析發現發病期和緩解期的表達譜在聚類樹圖中沒有重疊,表明新診斷ITP發病期和緩解期的分子特征不同。
功能富集和通路富集分析結果表明兒童新診斷ITP相關基因主要參與轉錄調控、DNA損傷與修復、細胞周期、細胞因子、血液凝固、細胞粘附與遷移等生物學過程,涉及細胞周期、細胞骨架調節、TGFβ信號通路、MAPK信號通路、細胞凋亡、Wnt通路等信號通路。新診斷ITP患兒血清中TGF-β1水平顯著高于正常對照組,患兒治療前血清TGF-β1水平高于治療后水平;且TGF-β1水平與ITP患兒血小板計數負相關,與骨髓內巨核細胞數正相關[13]。本研究發現TGF-β1在發病期表達水平升高,表明TGF-β1參與ITP的發病過程。造血系統中的TGF-β1是由巨核細胞和血小板生成,巨核細胞及血小板α顆粒是其最終存儲點。TGF-β1通過與巨核細胞表面的受體結合,啟動相應的信號途徑發揮負性調節因子作用,使巨核細胞成熟障礙、血小板生成減少。ITP發病時,血小板壽命縮短和破壞增多使TGF-β1釋放到血液中,引起TGF-β1水平明顯增高,且TGF-β1與基質細胞中血小板生成素的增高水平正相關,從而導致巨核細胞成熟障礙[14]。新診斷ITP患兒Th17細胞比例增高,Treg細胞比例下降;ITP患兒血漿中γ干擾素水平較正常對照組明顯升高,IL-4水平較正常對照組明顯降低,表明Th17/Treg細胞亞群比例失調、γ干擾素表達上調、IL-4表達下降可能是ITP發生的重要因素[15]。γ干擾素、IL-10水平在ITP患兒血清中升高,激活細胞毒性T細胞、巨噬細胞、補體形成,進而吞噬破壞血小板。有研究報道新診斷ITP患兒血清中IL-16水平比持續性ITP和慢性ITP患兒高,持續性ITP患兒IL-16水平比慢性ITP患兒高,而且IL-16水平與血小板計數和網織血小板負相關,表明IL-16可用于預測兒童ITP的臨床病程[16]。另外,本研究網絡分析發現的核心基因包括UBR3、ERBIN、KIF5B和SLK,ERBIN參與NF-κB轉錄因子活性、腫瘤壞死因子、整合素信號通路、細胞粘附、表皮生長因子受體信號通路等,KIF5B涉及應激脫顆粒、基于微管的胞內運輸、囊泡運輸、蛋白定位、膜電位調節等,SLK主要參與細胞凋亡、細胞周期調控、應激激活蛋白激酶信號級聯反應、蛋白磷酸化等,這些核心基因在兒童新診斷ITP發病期均表達下調,其作用機制有待進一步研究。
總之,通過對兒童新診斷ITP發病期和緩解期的芯片數據集進行比較和分析,新診斷ITP的發生涉及基因表達譜的改變。兒童新診斷ITP相關基因主要涉及細胞周期、細胞因子、細胞遷移、TGFβ信號通路、MAPK信號通路、細胞凋亡等生物過程與通路,為深入闡明兒童ITP發生的分子機制和指導治療干預提供了基礎。