吳陳興 宋洪旺 付曉君 李守巍
1.首都醫(yī)科大學(xué)三博腦科醫(yī)院神經(jīng)外科,北京 100093;2.中國醫(yī)科大學(xué)附屬盛京醫(yī)院急診科,遼寧沈陽 110004
膠質(zhì)瘤是中樞神經(jīng)系統(tǒng)最常見的原發(fā)性腫瘤,發(fā)病率為22.52/106[1]。70%~80%的較低級別膠質(zhì)瘤發(fā)生異檸檬酸脫氫酶(isocitrate dehydrogenase,IDH)突變,且是腫瘤發(fā)生的驅(qū)動基因[2-3]。2016 年世界衛(wèi)生組織(world health organization,WHO)中樞神經(jīng)系統(tǒng)腫瘤分類首次引入IDH 突變作為膠質(zhì)瘤的重要分類指標(biāo),并明確IDH 突變型(IDH mutant type,IDH-mut)和IDH野生型(IDH wild type,IDH-wt)膠質(zhì)瘤是兩種具有不同生物特征的亞型[4],IDH-mut 膠質(zhì)瘤具有更好的預(yù)后[5]。IDH 突變的發(fā)現(xiàn)引起了對癌癥代謝的廣泛關(guān)注。
目前IDH-wt 膠質(zhì)瘤預(yù)后差,缺乏有效治療手段。本文通過差異代謝基因聚類將IDH-wt 膠質(zhì)瘤分成三種代謝亞型(C1、C2 和C3 型)。C1 型預(yù)后與IDH 突變型相似;C2、C3 型預(yù)后差。進(jìn)一步利用隨機(jī)森林法篩選C1 型前5 個最顯著特征基因,簡化C1 型診斷模型以增加臨床應(yīng)用的可行性。用此分型精確判斷不同IDH-wt膠質(zhì)瘤預(yù)后,指導(dǎo)腦膠質(zhì)瘤患者的個體化治療。
本研究使用2015 年1 月至2020 年1 月來自中國腦膠質(zhì)瘤基因組圖譜計劃(Chinese glioma genome atlas,CGGA)(http://www.cgga.org.cn)數(shù)據(jù)庫中294 例患者臨床資料及組織信使RNA(messenger RNA,mRNA)芯片(RNA-array)數(shù)據(jù),包含IDH 狀態(tài)(IDH-mut/wt)及年齡、性別、組織學(xué)分級及生存預(yù)后情況等[6]。納入標(biāo)準(zhǔn):①發(fā)病年齡≥18 歲;②病理診斷為大腦半球彌漫性膠質(zhì)瘤且符合2016 WHO 分類指南[4]。排除標(biāo)準(zhǔn):①局限性膠質(zhì)瘤;②彌漫中線膠質(zhì)瘤;③小腦或脊髓膠質(zhì)瘤。研究經(jīng)首都醫(yī)科大學(xué)三博腦科醫(yī)院醫(yī)學(xué)倫理審查委員會批準(zhǔn),并符合赫爾辛基宣言[7]的原則。
加權(quán)相關(guān)網(wǎng)絡(luò)分析(weighted correlation network analysis,WGCNA)旨在尋找共同表達(dá)的基因模塊,并探索基因網(wǎng)絡(luò)和感興趣表型之間的聯(lián)系,在共同表達(dá)網(wǎng)絡(luò)中,節(jié)點與基因相對應(yīng),連接強(qiáng)度由表達(dá)譜之間的成對相關(guān)性決定。加權(quán)網(wǎng)絡(luò)使用Pearson 相關(guān)矩陣的軟閾值來確定兩個基因之間的連接強(qiáng)度[8]。本研究對CGGA 數(shù)據(jù)庫294 例膠質(zhì)瘤RNA-array 數(shù)據(jù)進(jìn)行WGCNA 分析。相關(guān)矩陣的軟閾值定義為9 次冪,基于生成的連接矩陣,實施拓?fù)渲丿B計算[8]。通過對拓?fù)渲丿B進(jìn)行平均連鎖層次聚類,將具有高度相似表達(dá)的基因分組聚類。進(jìn)一步應(yīng)用動態(tài)混合樹切割算法來切割層次聚類樹,計算基因模塊與IDH-mut/wt 狀態(tài)之間的相關(guān)性。
應(yīng)用WGCNA 篩選與IDH 狀態(tài)相關(guān)基因,對所篩選基因進(jìn)行差異表達(dá)分析得到差異表達(dá)基因(differentially expressed genes,DEG)。參照KEGG 代謝通路的基因集(http://www.gsea-msigdb.org/gsea/msigdb/genesets.jsp?collection=CP:KEGG),對DEG 中的代謝相關(guān)基因進(jìn)行聚類分析,根據(jù)聚類分析結(jié)果將IDH-wt膠質(zhì)瘤分型。應(yīng)用Kaplan-Meier 生存分析及1 年及3 年生存率驗證新分型意義。應(yīng)用隨機(jī)森林法篩選亞型的特征基因集,簡化診斷模型以增加臨床應(yīng)用的可行性。
本研究使用R 語言(4.0.3 版)、SPSS(21.0 版)軟件和GraphPad Prism(7.0 版)軟件對數(shù)據(jù)進(jìn)行分析。WGCNA 檢測應(yīng)用“WGCNA 軟件包”。“ggplots 軟件包”繪制熱圖。使用“random Forest 軟件包”進(jìn)行隨機(jī)森林分析。Log-Rank 檢驗用于分析兩組生存時間估計值差異性。計量資料采用均數(shù)±標(biāo)準(zhǔn)差()表示,組間比較采用t 檢驗。以P <0.05 為差異有統(tǒng)計學(xué)意義。
通過WGCNA 從CGGA 數(shù)據(jù)庫的294 例膠質(zhì)瘤RNA-array 數(shù)據(jù)集中識別出10 個與IDH 狀態(tài)(IDHmut/wt)相關(guān)的基因模塊(圖1)。參照KEGG代謝通路的基因集鑒定出42 個代謝相關(guān)差異基因,其中14 個基因表達(dá)水平與IDH-mut 呈正相關(guān),28 個基因呈負(fù)相關(guān)(P <0.05)(圖2)。應(yīng)用這些基因?qū)DH-wt膠質(zhì)瘤進(jìn)行聚類,根據(jù)聚類結(jié)果將IDH-wt 膠質(zhì)瘤分成3 個亞型,分別用C1、C2 和C3 標(biāo)記(圖3)。
圖1 WCGNA 鑒定出10 個與IDH 狀態(tài)相關(guān)的基因模塊
圖2 代謝相關(guān)的差異基因
1 年及3 年生存率分析顯示,IDH-mut 膠質(zhì)瘤患者的1 年及3 年生存率分別為65.1%與62.2%,C1 型膠質(zhì)瘤患者1 年及3 年生存率分別為63.2%和60.0%,C2 型膠質(zhì)瘤患者1 年及3 年生存率分別為5.9%和3.0%,C3 型膠質(zhì)瘤患者1 年及3 年生存率分別為17.4%和9.0%。見圖4。
應(yīng)用42 個差異代謝基因構(gòu)建隨機(jī)森林預(yù)測模型(圖5A)。根據(jù)MDG 值,選擇對分類貢獻(xiàn)最大的前5 位基因(TK1、GPX8、RRM2、NNMT 和GPX7,見圖5B)。應(yīng)用前5 位基因再次構(gòu)建隨機(jī)森林預(yù)測模型。隨機(jī)選擇CGGA 數(shù)據(jù)庫中2/3 數(shù)據(jù)作為訓(xùn)練組,其他的作為測試組。新模型中TK1、GPX8、RRM2、NNMT 和GPX7的MDG 值分別為13.98、13.94、10.48、10.37 和9.54。訓(xùn)練組的分類準(zhǔn)確度為95.12%,靈敏度為93.75%,特異性為95.60%。OBB 為4.88%。測試組分類準(zhǔn)確度為97.44%,靈敏度為83.33%,特異性為100.00%。
圖5 差異代謝基因構(gòu)建隨機(jī)森林預(yù)測模型
腫瘤代謝改變被認(rèn)為是維系腫瘤細(xì)胞形成及生長的“10 大特征”之一[9]。IDH 突變是最常見的代謝酶基因突變類型,為腦膠質(zhì)瘤發(fā)生的早期分子事件,IDH活性位點突變形成一種新形態(tài)酶,催化α-酮戊二酸(α-ketoglutarate,α-KG)轉(zhuǎn)化為R-2-羥戊二酸(R-2-hydroxyglutarate,R-2HG),R-2HG 積累引起基因組廣泛超甲基化,表觀激活癌基因、致癌[10-11]。IDH-wt 膠質(zhì)瘤通常被認(rèn)為惡性程度高、預(yù)后差,且缺乏有效治療手段[12]。但I(xiàn)DH-wt 膠質(zhì)瘤包含多種亞型,“cIMPACTNOW 更新4 提出:具有H3 K27-或H3 G34-突變,MYB/MYBL 改變,BRAF V600 突變等的IDH-wt 彌漫性星形細(xì)胞瘤亞群具有較好的臨床預(yù)后,不應(yīng)列為高度惡性腫瘤[13]。2020 年歐洲神經(jīng)腫瘤協(xié)會(European Association for Neuro-Oncology,EANO)成人彌漫性膠質(zhì)瘤診斷與治療指南明確指出:IDH-wt 膠質(zhì)瘤是一組具有異質(zhì)性的腫瘤,有待通過分子生物學(xué)研究將其中具有IDH-wt 膠質(zhì)母細(xì)胞瘤分子特征的惡性腫瘤和具有生物學(xué)相對惰性生長特性腫瘤(諸如類似兒童彌漫性膠質(zhì)瘤)加以區(qū)分,并進(jìn)行個體化治療[14]。本研究采用WGCNA 方法對CGGA 數(shù)據(jù)庫的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行分析篩選出與IDH 狀態(tài)相關(guān)的代謝基因,并根據(jù)其聚類情況將IDH-wt 膠質(zhì)瘤分為C1、C2 和C3 型。生存分析表明,IDH-wt C2、C3 型的預(yù)后差,IDH-wt C1與IDH-mut 生存率相近。此分型對精確判斷不同IDH-wt 膠質(zhì)瘤預(yù)后具有指導(dǎo)意義。
本研究中經(jīng)差異表達(dá)分析和相關(guān)性分析所取得的代謝基因,在IDH-mut 和IDH-wt 膠質(zhì)瘤中具有顯著表達(dá)差異(圖2),其產(chǎn)物多數(shù)是腫瘤細(xì)胞氨基酸、核苷酸等代謝通路中的關(guān)鍵酶,例如谷氨酸脫氫酶1(glutamate dehydrogenase1,GLUD1)、支鏈氨基酸轉(zhuǎn)氨酶1(branched-chain amino acid1,BCAT1)等。理解膠質(zhì)瘤中關(guān)鍵代謝途徑將有助于鑒定更多的治療靶標(biāo),開發(fā)更有效的治療方法。
IDH-mut 膠質(zhì)瘤細(xì)胞通過GLUD1 催化谷氨酸轉(zhuǎn)化為α-KG,促進(jìn)膠質(zhì)瘤祖細(xì)胞的生長[15]。本研究中IDH-mut 膠質(zhì)瘤GLUD1 的表達(dá)水平明顯高于IDH-wt 膠質(zhì)瘤,GLUD1 表達(dá)和IDH-mut 致癌驅(qū)動機(jī)制相關(guān),谷氨酸代謝是膠質(zhì)瘤潛在治療靶點。BCAT1 是支鏈氨基酸分解代謝的酶,BCAT1 高表達(dá)是IDH-wt 膠質(zhì)瘤的特征。膠質(zhì)瘤細(xì)胞中BCAT1 的減少可阻止谷氨酸的分泌,并導(dǎo)致腫瘤細(xì)胞增殖和侵襲性降低[16-17]。BCAT1 在膠質(zhì)瘤發(fā)病機(jī)制中起重要作用,BCAT1 及支鏈氨基酸代謝成為IDH-wt 膠質(zhì)瘤患者的治療靶點。還原型輔酶Ⅱ(nicotinamide adenine dinucleotide phosphate,NADPH)作為谷胱甘肽(glutathione,GSH)還原酶的輔酶,促進(jìn)細(xì)胞抗氧化[18]。在IDH-mut膠質(zhì)瘤細(xì)胞中,NADPH 缺乏,電離輻射、活性氧造成DNA 雙鏈斷裂增加,這是IDH-mut 膠質(zhì)瘤對放化療敏感的原因之一[19]。谷氨酸-半胱氨酸連接酶催化亞基是GSH 合成的限速酶;谷胱甘肽過氧化物酶7/8 是GSH 過氧化物酶家族的成員,催化GSH 還原氫過氧化物,是生物體內(nèi)重要的氧自由基清除劑[20]。GSH 的代謝脆性可能是提高IDH-mut 膠質(zhì)瘤對放療和化療敏感性的潛在治療靶點[21]。
脫氧胞苷酸脫氨酶(deoxycytidylate deaminase,DCTD)基因編碼的蛋白質(zhì)催化脫氧胞苷一磷酸脫氨為脫氧尿苷酸,而脫氧尿苷酸是胸苷酸合成酶(thymidine synthase,TYMS)的核苷酸底物[22]。TYMS 在DNA 生物合成的早期階段起著至關(guān)重要的作用,并已成為抗代謝制劑5-氟尿嘧啶和培美曲塞化療的重要靶標(biāo)[23]。吉西他濱為DCTD 的抑制劑,吉西他濱及其代謝物二氟-脫氧尿苷具放療增敏作用,并具有良好的血-腫瘤屏障通過率,與放療聯(lián)用于IDH-wt 膠質(zhì)瘤具潛在治療效果[24-25]。
本研究進(jìn)一步利用隨機(jī)森林法篩選C1 型前5 個最顯著特征基因(TK1、GPX8、RRM2、NNMT 和GPX7),其表達(dá)水平可用于IDH-wt C1 型診斷,診斷準(zhǔn)確度為95.12%,敏感性為93.75%,特異性為95.60%,簡化C1型診斷模型以增加臨床應(yīng)用的可行性。一方面,準(zhǔn)確的預(yù)后預(yù)測可以指導(dǎo)針對IDH-wt 膠質(zhì)瘤的更合理的隨訪和更積極的治療方案的制訂;另一方面,針對IDH-wt C1 組與C2、C3 組之間的代謝差異可進(jìn)行針對性代謝缺陷靶向治療。本研究尚局限于生信分析層面,應(yīng)進(jìn)一步完善蛋白質(zhì)水平研究,以闡明蛋白質(zhì)水平各種代謝酶活性的差異,且需要進(jìn)一步的研究來解釋這種表觀遺傳差異。