王小燕, 胡溢洪, 韓語誠, 鄒先瓊
(1.桂林醫學院智能醫學與生物技術學院實驗教學中心,廣西 桂林 541199;2.廣西高校生物化學與分子生物學重點實驗室,廣西 桂林 541199;3.桂林醫學院智能醫學與生物技術學院生物醫學工程教研室,廣西 桂林 541199)
美國中央腦瘤登記處數據[1]顯示:神經膠質瘤是僅次于腦膜瘤,為第二常見的原發性顱內腫瘤,占所有原發性腦腫瘤的15.6%,占原發性惡性腦腫瘤的45.2%。腦低級別膠質瘤(lowergrade glioma,LGG)是一種起源于中樞神經系統的支持膠質細胞的高度異質性的神經膠質瘤,是中樞神經系統最常見和最具侵襲性的惡性腫瘤之一,占所有中樞神經系統惡性腫瘤的45.2%,占所有原發性中樞神經系統惡性腫瘤的80.0%[2]。目前的標準治療方法主要有最大限度的手術切除、體外放射治療和化療[3-4],但對其靶向標志物研究甚少,而靶向藥物的開發有助于LGG 患者的個體化治療,因此,識別更好的生物標志物已成為目前的挑戰之一。新的生物標志物可能有助于更好地理解LGG的分子基礎,可能在LGG 診斷、預后、膠質瘤殘余監測和治療反應預測以及靶向藥物的開發中發揮重要作用。COMM 域包含蛋白質7 (COMM domain-containing protein 7,COMMD7)是COMMD 家族成員之一,由一個保守和獨特的基序定義,稱為銅代謝基因MURR1(COMM)結構域,位于人類20q11.21 染色體上,與多種人類實體腫瘤進展有關[5]。COMMD7 基因在胰腺導管腺癌細胞中高表達,與胰腺導管腺癌患者預后不良相關;在人類胰腺導管腺癌細胞系中,抑制COMMD7 基因的表達可誘導應激條件下的抗腫瘤作用[6]。COMMD7 基因高表達促進了肝癌細胞的增殖[7],COMMD7 基因沉默可抑制肝癌細胞遷移和 侵 襲[8]。COMMD7 通 過 與 核 因 子κB (nuclear factor-kappa B,NF-κB)的調節蛋白相互作用,從而 參 與NF-κB 信 號 的 終 止[6],其 錯 誤 調 控 與 多 種腫 瘤 有 關[6,9],COMMD7 在 原 發 性 肝 細 胞 癌 的NF-κB 信號通路中發揮了雙重調控作用,一方面COMMD7 基因沉默可以抑制NF-κB p65 從而抑制腫瘤細胞增殖、遷移和侵襲,并且NF-κB 的沉默又會抑制COMMD7 基因的表達,進一步抑制細胞增殖;另一方面COMMD7 基因通過激活信號傳導及轉錄激活蛋白4 (signal transducer and activator of transcription 4,STAT4)蛋白抑制劑正向調控NF-κB[9]。此外,COMMD7 高表達還與急性髓系白血病的不良預后相關[10]。目前,COMMD7 基因在LGG 中的表達及其預后價值尚不清楚。本研究旨在分析COMMD7 基因的表達水平與LGG 預后之間的關系,以期尋找LGG 新的治療靶點,為進一步探究LGG 癌變發生和發展的潛在分子機制提供參考。
1.1 數據獲取及處理從UCSC 基因組數據庫網站(https://xenabrowser.net/datapages/)下載癌癥基因組數據庫(The Cancer Genome Atlas,TCGA)中的523 個LGG 樣本的RNA 測序數據以及基因型和基因表達量關聯數據庫(The Genotype-Tissue Expression,GTEx)中的1 152 個正常樣本的轉錄組RNA 測序數據及相應的臨床信息。將FPKM 格式的RNA-Seq 基因表達數據轉換為TPM 格式,并進行log2轉換,以進一步研究。
1.2 COMMD7 在LGG 樣本和正常樣本中表達差異及差異表達基因(differentially expressed genes,DEGs)鑒定采 用Mann-WhitneyU檢 驗 分 析COMMD7 在523 例LGG 樣本和1 152 名正常樣本中的表達差異,以P< 0.05 為差異有統計學意義。將523 例LGG 樣本分為COMMD7 低表達組和COMMD7 高表達組(以中位數為臨界值),使用R 語 言 的DESeq 軟 件 包[11]對COMMD7 低 表 達 組和 COMMD7 高 表 達 組 行 DEGs 鑒 定,以COMMD7 高表達組和低表達組間DEGs 表達量的比值,取以2 為底的對數的絕對值 |log2FC| > 1 且P<0.05 的DEGs 視為差異有統計學意義。
采用人類蛋白圖譜數據庫(The Human Protein Atlas,HPA)(www.proteinatlas.org)[12]驗證COMMD7 蛋白在LGG 組織中的表達情況。在HPA 數據庫中檢索“COMMD7”得到在LGG組織與正常顱內組織免疫組織化學檢測結果。
1.3 COMMD7 與LGG 患者預后的關系采用R語言的pROC 軟件包(1.17.0.1)對523 例LGG 樣本和1 152 名正常樣本進行受試者工作特征(receiver operating characteristic,ROC)曲線分析,以評估COMMD7 的轉錄表達在區分LGG 樣本和正常樣本的有效性,ROC 曲線下面積(area under curve,AUC)值 范 圍 在0.5~1.0 表 示50%~100%的辨別能力。
采用單因素和多因素比例風險(Cox)回歸分析COMMD7 在不同LGG 亞型中的預后價值,并采用R 語言的ggplot2 軟件包(3.3.3 版本)基于單因素和多因素Cox 回歸分析結果構建森林圖,以P< 0.05 為差異有統計學意義。采用R 語言的RMS 軟件包(6.2-0 版本)和R 語言的Survival 軟件包(3.2-10 版本),納入變量世界衛生組織(World Health Organization,WHO)分級、異檸檬酸脫氫酶(isocitrate dehydrogenase,IDH)突變狀態、1p/19q 共缺失狀態、主要治療結果、組織學類型和COMMD7,基于多因素分析結果構建預測模型的列線圖(Nomogram)和預測模型的校準圖(Calibration),患者1、3 和5 年生存率是通過從總點軸直線到結果軸繪制一條線來確定,灰色的對角線為理想情況,藍色的叉代表每個點經過分層Kaplan-Meier 校正后的結果。
采用Cox 回歸模型評價TCGA 數據中COMMD7 低表達組和與COMMD7 高表達組(以中位數為臨界值)HCC 患者預后差異,以P<0.05 為差異有統計學意義。
采用GEPIA 數據庫[13](http://gepia.cancerpku.cn/help.html)中 514 個 LGG 樣 本 的COMMD7 表達譜數據,驗證COMMD7 表達與LGG 患者預后關系(以中位數為臨界值),以P<0.05 為差異有統計學意義。采用Oncolnc 數據庫(http://www.oncolnc.org/)中510 個LGG 樣 本的COMMD7 表達譜數據進一步驗證COMMD7 表達與LGG 患者預后關系(以中位數為臨界值),以P< 0.05 為差異有統計學意義。
1.4 DEGs 的富集分析使用R 語言ClusteProfiler軟件包(3.14.3 版本)[14]對以2 為底的COMMD7高表達組和COMMD7 低表達組間DEGs 表達量比值的絕對值|logFC|>1.5 和P<0.05 為閾值的DEGs 進行基因本體(Gene Ontology,GO)功能注釋分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析,獲得DEGs 的分子功能(molecular function,MF)、生物學過程(biological process,BP)和細胞成分(cellular component,CC)等注釋分析和通路富集分析,以P<0.05 為差異有統計學意義。使用R 語言ClusteProfiler 軟件包(3.14.3 版本)[14]以從分子簽名數據庫 (MSigDB)下載C2.cp.v7.0.symbols.gmt 作為基因集富集分析(Gene Set Enrichment Analysis,GSEA)的目標集合,對DEGs 進行GSEA,獲得DEGs 顯著富集的基因集。每個分析將基因集排列1 000 次,以P<0.05 和錯誤發現率(false discovery rate,FDR)值<0.25 被認為差異有統計學意義。
1.5 免疫浸潤分析采用TISIDB 網站(http://cis.hku.hk/TISIDB)[15]評 估COMMD7 表 達 與 免疫細胞浸潤水平、免疫檢查點、免疫刺激因子和趨化因子之間的相關性。以P<0.05 為差異有統計學意義。
2.1 COMMD7 基因在LGG 樣本和正常樣本中表達差異及DEGs 的鑒定Mann-WhitneyU檢驗分析結果顯示:與正常樣本比較,COMMD7 基因在LGG 樣本中的表達明顯上調(圖1)。HPA 數據庫的分析結果顯示:COMMD7 基因在LGG 樣本中的表達明顯上調(圖2)。COMMD7 低表達組和COMMD7 高表達組中發現764 個DEGs,包括654 個上調DEGs 和110 個下調DEGs(圖3)。

圖1 COMMD7 在正常樣本和腦LGG 樣本中的表達(TCGA 數據庫)Fig.1 Expressions of COMMD7 in normal samples and brain LGG samples(TCGA Database)

圖2 COMMD7 在正常樣本和腦LGG 樣本中的表達(HPA 數據庫)(Bar=200 μm)Fig.2 Expressions of COMMD7 in normal samples and brain LGG samples(HPA Database)(Bar=200 μm)

圖3 DEGs 的火山圖Fig.3 Volcano plot of DEGs
2.2 COMMD7 與LGG 患者預后的關系森林圖結果顯示:COMMD7 基因表達水平與WHO 分級、IDH 突變狀態、1p/19q 共缺失狀態、主要治療結果和組織學類型等亞型呈明顯正相關關系(P<0.05)(圖4)。預測模型列線圖顯示:COMMD7基因表達水平越高,對預測模型的貢獻越大,患者1、3 和5 年生存率越低(圖5A),預測模型列線圖的校準圖顯示患者1、3 和5 年的實際生存率線與理想情況灰色線貼近,證實了該列線圖預測的準確性(圖5B),COMMD7 是LGG 的獨立預后因素。ROC 曲線分析結果顯示:COMMD7 用于區分癌組織與癌旁組織具有較高的診斷價值(AUC=0.835,95%CI:0.816~0.853)(圖5C)。Cox 回歸分析結果顯示:COMMD7 高表達組LGG 患者的生存率明顯低于COMMD7 低表達組(P<0.001),表明COMMD7 高表達與LGG 患者的預后不良有明顯關聯(圖6A)。GEPIA 數據庫和Oncolnc 數據庫的數據分析結果顯示:COMMD7高表達組LGG 患者的生存率明顯低于COMMD7低表達組(P=0.003,P=0.006)(圖6B 和6C)。

圖4 Cox 回歸分析結果Fig.4 Results of Cox regression analysis

圖5 預后預測模型和ROC 曲線Fig.5 Prognostic predition model and ROC curve

圖6 COMMD7 高表達組和COMMD7 低表達組腦LGG 患者生存曲線圖Fig.6 Survival curves of brain LGG patients in high expression of COMMD7 group and low expression of COMMD7 group
2.3 DEGs 的富集分析GO 功能富集分析結果顯示:與BP 關聯顯著富集的共有71 條,其中前3 條分別是模式規范過程(GO:0007389)、區域化(GO:0003002)和 前/后 模 式 規 范 (GO:0009952)(P<0.05);與CC 關聯顯著富集的共有5 條,其中前3 條分別是高密度脂蛋白(GO:0034364)、血漿脂蛋白顆粒(GO:0034358)和血漿脂蛋白粒子(GO:0034358)(P<0.05);與MF 關聯顯著富集的共有36 條,其中前3 條分別是DNA 結合轉錄激活子活性/RNA 聚合酶Ⅱ特異性(GO:0001228)、增強子序列特異性DNA 結合(GO:0001158)和增強子綁定(GO:0035326)(P<0.05)。KEGG 生物通路富集分析結果顯示:顯著富集的通路僅有1 條(P<0.05),為癌癥中的轉錄失調通路(hsa05202)(圖7A)。
GSEA 分析結果顯示:與KEGG 數據庫中細胞周期(N=1.950,P=0.012)(圖7B)、WP數據庫中細胞周期(N=1.944,P=0.012)(圖7C)、G2/M 檢查點(N=2.118,P=0.001)(圖7D)和G2/M DNA 損 傷 檢 查 點(N=1.879,P=0.012)(圖7E)密切相關的基因集在COMMD7 高表達LGG 樣本中顯著 富集(P<0.05)。COMMD7 高表達與腫瘤密切相關的p53 穩定有關(N=1.793,P=0.012)(圖7F),可以激活p53 下游通路(N=1.782,P=0.012)(圖7G)和p53 信號通路(N=1.762,P=0.012)(圖7H),激活Tp53調控細胞周期基因的轉錄(N=1.766,P=0.018)(圖7I)。

圖7 COMMD7 低表達組和COMMD7 高表達組之間的DEGs 的富集分析Fig.7 Enrichment analysis of DEGs between low expression of COMMD7 group and high expression of COMMD7 group
2.4 COMMD7 基因表達與LGG 免疫細胞浸潤的關系應用TISIDB 數據庫數據進行Spearman 相關性分析,結果顯示:COMMD7 基因表達水平與活化的CD8+T 淋巴細胞、中樞記憶CD8+T 淋巴細胞和CD56bright自然殺傷細胞等15 種細胞數量呈明顯正相關關系(P<0.05),與活化的B 淋巴細胞和記憶B 淋巴細胞數量呈明顯負相關關系(P<0.05)(圖8A~8F)。COMMD7 基因表達水平與吲哚胺2,3-加雙氧酶1(indoleamine 2,3-dioxygenase 1,IDO1)、半 乳 凝 素9 (galactin 9,LGALS9)和CD244 等11 關鍵的免疫檢查點基因表達水平呈明顯正相關關系(P<0.05),與CD274 (PD-L1)、激酶插入區域受體(kinase insert domain receptor,KDR)和帶有Ig 及ITIM 結構域的T 淋巴細胞免疫受體(T cell immunoreceptor with Ig and ITIM domains,TIGIT)表達水平呈明顯負相關關系(P<0.05)(圖8G~8M)。CD40、CD276 和CD48等8 個關鍵免疫刺激因子(圖8N~8S)及C-C 基序趨化因子配體2(C-C motif chemokine ligand 2,CCL2)、C-C 基 序 趨 化 因 子 配 體5 (C-C motif chemokine ligand 5,CCL5)和C-X-C 基序趨化因子 配 體 9 (C-X-C motif chemokine ligand 9,CXCL9)等7 個免疫趨化因子(圖8T~8Y)的表達水平與COMMD7 基因表達水平呈明顯正相關關系(P<0.05)。

圖8 COMMD7 表達與腦LGG 微環境中免疫浸潤的關系Fig.8 Relationships between expression of COMMD7 and immune infiltration in brain LGG microenvironment
COMMD7 與胰腺導管腺癌、肝細胞癌和急性髓 系 白 血 病 進 展 有 關[6,8,10]。本 研 究 結 果 顯 示:COMMD7 在LGG 樣本中明顯高表達,基于單因素和多因素Cox 回歸分析證明了COMMD7 是LGG獨立的預后因素,構建了列線圖和校準圖,證明了COMMD7 對LGG 患 者1、3 和5 年 生 存 率 預 測 的
準確性,應用COMMD7 區分癌組織和癌旁組織具有較高的診斷價值,并采用多個數據庫數據進行了驗證,COMMD7 上調是LGG 患者的不良預后因子,且與LGG 的進展呈正相關關系,可作為LGG的預后預測因子。
本研究結果顯示:在COMMD7 低表達組和COMMD7 高表達組之間明顯差異表達的有764 個DEGs。GO-KEGG 功能富集分析結果顯示:上述DEGs 的整體功能與轉錄有關,KEGG 通路為癌癥中的轉錄失調通路,提示COMMD7 可能通過影響轉錄過程中的一些重要的細胞成分和酶的功能導致轉錄失調,進而對LGG 產生影響。GSEA 分析結果顯示:與細胞周期、細胞周期中G2/M 檢查點和p53 相關通路的DEGs 在COMMD7 高表達樣本中明顯富集。細胞周期與腫瘤的發生發展密切相關[16-18],而周期蛋白依賴性激酶(cyclin-dependent kinases,CDKs)的激活和失活可調控細胞周期進程[19]。研 究[20-22]表 明:CDKs 與 膠 質 母 細 胞 瘤 進展密切相關。細胞周期G2/M 檢查點通過允許細胞在進入有絲分裂前修復DNA 損傷,在維持染色體完整性方面發揮重要作用[23]。腫瘤抑制因子p53 與細胞周期進展有密切關聯,在腫瘤中誘導G2/M 阻滯[24-25],上述結果提示COMMD7 可能通過與腫瘤發生發展密切相關的細胞周期相關通路、p53 相關通路和癌癥中的轉錄失調通路來共同影響LGG 的發生發展。
腫瘤微環境中的免疫浸潤在腫瘤發生發展中發揮關鍵作用,并影響腫瘤患者的臨床預后[26]。隨著腫瘤免疫治療的興起,膠質瘤免疫微環境的研究逐漸成為研究熱點,在該領域取得了快速的進展[27-28]。非SMC-凝聚素Ⅰ復合物G 亞單位(non-SMC condensin Ⅰ complex subunit G,NCAPG)促進膠質瘤的腫瘤進展,調節免疫細胞浸潤[29];類波多坎 1(podocan like 1,PODNL1)甲基化可作為一種預后生物標志物,并與低級別膠質瘤中的免疫細胞浸潤和免疫檢查點阻斷反應相關[30]。本研究結果顯示:COMMD7 基因表達水平與多個免疫細胞的數量呈明顯正相關關系。本研究中KEGG通路和GSEA 富集分析結果均顯示上述DEGs 在與腫瘤密切相關的通路中顯著富集,推測可能COMMD7 高表達組通過參與腫瘤信號通路誘導腫瘤細胞更容易發生免疫逃逸,從而影響LGG 的進展和預后。本研究結果還顯示:COMMD7 基因表達水平與多個關鍵免疫檢查點和免疫趨化因子表達水平有明顯關聯。COMMD7 與免疫檢查點CD274的表達水平呈明顯負相關關系,而CD274 可以促進腫瘤細胞脂質過氧化和鐵死亡[31]。鐵死亡是一種近期發現的由脂質活性氧的鐵依賴性積累引起的調節細胞死亡的形式[32]。研究[33]表明:鐵死亡是膠質瘤中最富集的程序性細胞死亡過程,可誘導免疫抑制和免疫治療抵抗,且通過聯合鐵死亡與CD274 免疫檢查點的實驗結果表明鐵死亡抑制劑鐵抑素-1 與免疫檢查點CD274 聯用效果更佳。因此,推測COMMD7 高表達組可能通過抑制免疫檢查點CD274 的表達來抑制LGG 鐵死亡,從而影響LGG的進展和預后,COMMD7 可能在LGG 患者免疫檢查點抑制劑治療(immune checkpoint blockade,ICB)中發揮關鍵作用。
綜上所述,本研究揭示了COMMD7 的高表達與LGG 患者不良預后有關。以往的研究往往局限于研究基因與癌癥相關通路,而本研究不僅分析了COMMD7 可能作用于LGG 的通路,還結合了免疫治療來共同探討COMMD7 在LGG 治療中可能作用,表明COMMD7 可能是免疫治療的一個新的靶點,并可能與LGG 鐵死亡有關,為LGG 治療提供了新的思路。然而,COMMD7 與基因改變之間的調控機制及癌癥相關的通路和免疫作用機制仍有待于進一步在膠質瘤細胞系和膠質瘤樣本中驗證確定。