殷安安 陸 南 賀亞龍 章 翔 劉玉河
膠質母細胞瘤(glioblastoma multiforme,GBM)是臨床上最常見且惡性程度最高的中樞神經系統腫瘤,約占所有腦膠質瘤的50%[1]。基于替莫唑胺的標準治療方案對GBM治療效果存在巨大差異,原因主要是腫瘤內部分子特征的異質性。GBM的發生、發展伴隨著顯著的DNA 甲基化改變,其中以啟動子CpG島超甲基化介導的抑癌基因表達沉默的研究最多[2,3]。然而,人類基因組中大約有40%的基因的轉錄調控區域并不包含CpG序列局部富集的CpG島結構,只有散在分布的CpG 位點。這些基因的非CpG島DNA甲基化改變在腫瘤中作用尚不清楚,特別是GBM[4]。本研究基于課題組前期研究結果[2],選取免疫基因TRIM38及其相關非CpG島DNA甲基化位點作為研究對象,利用公共數據庫信息,探討基因非CpG島DNA甲基化與GBM臨床預后的關系。
1.1 GBM 及非腫瘤腦組織(non-tumor brain,NTB)對照組 本研究納入GBM 樣本主要來自于:美國癌癥基因組圖譜計劃(TCGA;https://tcga-data.nci.nih.gov/tcga/)[5][共354例,其中男212例,女141例;中位年齡61 歲;O6-甲基鳥嘌呤-DNA 甲基轉移酶(O6-meth?ylguanine DNA methyltransferase,MGMT)啟動子甲基化161例,未甲基化174例];美國國立圖書館基因表達數據庫(GEO;http://www.ncbi.nlm.nih.gov/geo/)中GSE22891 系列[6](共50 例,其中男25 例,女24 例;中位年齡58 歲;MGMT 啟動子甲基化29 例,未甲基化21 例);中國膠質瘤基因組圖譜計劃(CGGA;http://www.cgga.org.cn/)[7](共105例,其中男62例,女43例;中位年齡46歲;MGMT啟動子甲基化狀態未知)。納入對照組樣本來自 GSE63347 系列(25 例)[8]、GSE22891系列(4例)及CGGA(8例)數據庫。
1.2 TRIM38 基因非CpG 島DNA 甲基化及基因表達數據 基于前期研究[2],選取距離TRIM38轉錄調控區1 500 bp 范圍內的獨立CpG 位點(探針cg22502502)為主要研究對象,CpG 甲基化數據來自Illumina 公司全基因組DNA 甲基化芯片,其水平由探針β值決定。部分納入樣本亦具有全基因組表達譜數據,均經過芯片數據標準化處理,具體步驟詳見各參考文獻[5~7]。
1.3 統計學及生物信息學分析 應用GraphPad Prism及R 軟件進行數據分析;連續變量采用Mann-Whit?ney 檢驗或t檢驗;關聯性分析采用Spearman 檢驗;生存分析采用生存曲線、log-rank 檢驗及多因素Cox風險回歸模型;分組界值由R 軟件maxstat 包計算;生物信息學分析由基因簇富集分析(GSEA)比較;P<0.05為差異具有統計學意義。
2.1 TRIM38 基因非CpG 島DNA 甲基化及基因表達在GBM 中的改變模式 對比TRIM38 基因非CpG 島DNA 甲基化探針(cg22502502)在GBM 與對照樣本的數據,該探針在GBM 中β值顯著下降(P<0.05;圖1a),提示該位點在GBM中呈低甲基化改變。同時,比較GBM 與對照樣本中TRIM38 基因的表達水平,其基因mRNA表達值顯著上升(P<0.05;圖1b),提示該基因在腫瘤中呈現高表達狀態。
2.2 TRIM38 基因非CpG 島DNA 甲基化與基因表達的關系 TRIM38 基因在GBM 中呈現的低甲基化狀態和高表達狀況,提示該基因可能存在非CpG 島DNA甲基化依賴的基因表達調控機制。為進一步驗證上述可能,利用Spearman 檢驗分析甲基化與表達譜數據之間的關系,發現在不同數據庫中,TRIM38基因非CpG 島DNA 甲基化數據均與其基因表達數據呈顯著負向相關性(Spearman系數均小于-0.3,圖1c),進一步提示非CpG 島DNA 甲基化可能參與TRIM38的表達調控。
2.3 TRIM38 基因非CpG 島DNA 甲基化與病人生存時間(overall survival,OS)的關系 為了減少單因素分析中其他因素對GBM 病人OS 數據的干擾,選取TCGA及GSE22891數據庫中接受替莫唑胺聯合放化療的原發GBM進行生存分析,并利用maxstat計算最佳分組界值,將TCGA及GSE22891數據庫的GBM樣本分為兩組:TRIM38高甲基化組和低甲基化組。生存分析表明:兩組病例庫中,擁有高甲基化組OS 顯著優于低甲基化組(P<0.05;圖1d)。多因素Cox 回歸分析進一步表明TRIM38甲基化水平GBM病人預后的獨立影響因素。
2.4 基于TRIM38甲基化分組的生物信息學分析 分別將TCGA 數據庫中TRIM38 高甲基化及低甲基化組GBM 樣本的全基因組表達譜數據帶入GSEA 分析,結果顯示低甲基化樣本(預后較差組)顯著富集免疫功能調控及Toll樣受體通路相關基因簇(表1)。
GBM 內部的分子異質性是導致其臨床治療效果欠佳的主要原因之一[5]。表觀遺傳學,特別是DNA 甲基化,作為重要的分子調控機制廣泛參與腫瘤異質性的形成。早在20世紀80年代,就有學者研究DNA 甲基化異常改變在腫瘤疾病中的意義。腫瘤特異的啟動子區域CpG 島超甲基化,通過表觀遺傳機制沉默抑癌基因的表達,促進腫瘤發生發展[4]。然而,人類基因組中大約一半的基因,其轉錄調控區域并不包含CpG 序列局部富集的CpG 島結構,只有散在分布的CpG位點,被稱為非CpG島區域DNA甲基化位點[4]。目前,關于這些區域的DNA 甲基化改變在疾病特別是腫瘤中的作用及意義尚不清楚。我們的前期研究中,通過全基因組多組學數據分析,發現非CpG 島區域DNA 甲基化改變可能與免疫基因的表達及GBM病人預后廣泛相關[2]。

表1 TCGA 數據庫中富集于TRIM38 低甲基化樣本的代表性基因簇

圖1 TCGA 的腫瘤甲基化數據與GSE63347 的對照樣本進行比較分析TRIM38非CpG島DNA甲基化在膠質母細胞瘤中的改變模式以及與基因表達、臨床預后的關系
TRIM38 來自TRIM 蛋白家族中最大的C-IV 亞組 ,包 括 RING 區 、BBox 區 及 PRY/SPRY 區[9]。TRIM38 能夠通過E3 泛素化連接酶、類泛素化酶以及其他作用方式廣泛參與固有免疫及炎癥反應調控[9]。基于之前全基因組DNA甲基化數據分析結果[2],本文結果顯示TRIM38非CpG島甲基化位點在GBM中發生低甲基化改變,而基因水平發生高表達改變;關聯分析證實TRIM38非CpG島DNA甲基化水平與其基因表達呈強負向相關關系。這提示非CpG 島DNA 甲基化可能直接參與TRIM38的表達調控。因此,基因非CpG島甲基化,很可能和啟動子CpG島相似,通過調控功能基因的表達,參與腫瘤的發生、發展過程。本文生存分析結果顯示,TRIM38甲基化程度與GBM病人OS顯著相關,多因素Cox比例回歸風險模型分析進一步證實其為獨立預后影響因子。這些述結果提示基因非CpG島甲基化亦可能是用于預測腫瘤預后或治療反應的獨立生物標記物。為了尋找TRIM38甲基化預后分組背后的生物學背景,我們對GBM 樣本的全基因組表達譜數據進行GSEA 分析,結果發現甲基化分組所帶來的預后差異很可能與其亞組之間重要功能基因簇表達程度的差異有關,其中具有代表性的基因簇包括免疫功能調節及Toll 樣受體通路相關的基因簇。Toll 樣受體通路是機體重要的免疫調控通路,能夠通過識別外源性或內源性相關分子模式激活下游效應因子,參與機體炎癥反應和固有免疫反應[10]。對于腫瘤,特別是GBM,Toll 樣受體通路被認為是聯系腫瘤細胞增殖侵襲和免疫抑制活動的重要信號樞紐[10]。既往研究表明,TRIM38 能夠通過多種方式(酶依賴或非酶依賴)調控Toll 受體通路下游信號蛋白及效應因子激活狀態,從而影響Toll 樣受體通路依賴的病理生理過程[9]。因此,TRIM38 甲基化導致的預后差異很可能與TRIM38 基因異常表達和對Toll 樣受體通路的調控所帶來的腫瘤免疫活動的影響有關。
總之,TRIM38可能通過非CpG島低甲基化介導的基因異常表達上調,參與GBM 發生、發展;TRIM38非CpG島甲基化可作為指導GBM預后評價的潛在生物標記物;TRIM38甲基化導致的預后差異很可能與Toll樣受體通路及免疫調節的差異有關。