[收稿日期]2023-11-14;" [修訂日期]2024-01-01
[基金項目]國家自然科學基金項目(32000795)
[第一作者]王凝瑞(1995-),男,碩士研究生。
[通信作者]溫靜(1974-),女,碩士,教授,碩士生導師。E-mail:wj952020@163.com。
[摘要]" 目的
使用無創的區域放射學相似性網絡(R2SN)方法獲取膠質瘤腫瘤組織信息,構建腦膠質瘤的預后預測模型。
方法" 使用R2SN結合基因相似性網絡,計算膠質瘤病人與健康對照間的差異基因。采用使用基因表達信息估計惡性腫瘤中的間質和免疫細胞結合加權基因共表達網絡分析,鑒定與腫瘤免疫微環境相關的基因。通過Lasso回歸篩選關鍵基因并結合臨床因素建立膠質瘤預后模型。
結果" 確定3個關鍵基因(PIWIL4、TGIF1和XKR8)建立風險標簽,以風險標簽結合臨床因素構建的腦膠質瘤預后模型預測1、3、5年生存率的受試者工作特征曲線下面積為0.870、0.888和0.800,預測效果較好。
結論" 結合影像和基因信息可以無創、準確地預測腦膠質瘤的預后。
[關鍵詞]" 神經膠質瘤;放射學;腦網絡;列線圖;預后
[中圖分類號]" R730.264
[文獻標志碼]" A
[文章編號]" 2096-5532(2024)01-0047-05
doi:10.11712/jms.2096-5532.2024.60.020
[開放科學(資源服務)標識碼(OSID)]
[網絡出版]" https://link.cnki.net/urlid/37.1517.R.20240320.1545.002;2024-03-22" 21:05:34
Establishment of a prognostic model for glioma based on regional radiomics similarity network
\ WANG Ningrui, WEN Jing
\ (Department of Epidemiology and Health Statistics, School of Public Health, Ningxia Medical University, Yinchuan 750000, China)
\; [Abstract]\ Objective\ To establish a prognostic prediction model for glioma by obtaining the information on glioma tumor tissue through noninvasive regional radiomics similarity network (R2SN).
\ Methods\ R2SN combined with gene similarity network was used to calculate the differentially expressed genes between glioma patients and healthy controls. The gene expression data were usedto estimate stromal and immune cells in malignant tumor, and the weighted gene co-expression network analysis was also performed to identify genes associated with tumor immune microenvironment. ALasso regression analysis was used to identify the key genes, and a prognostic model was established for glioma with reference to clinical factors.
\ Results\ Three key genes, i.e., PIWIL4, TGIF1, and XKR8, were identified to establish risk labels. The prognostic model for glioma established based on risk labels andclinical factors had an area under the ROC curve of 0.870, 0.888, and 0.800, respectively, in predicting 1, 3, and 5 year survival rates, suggesting that the model had a good predictive effect.
\ Conclusion\ The combination of imaging findings and genetic information can predict the prognosis of glioma in a noninvasive and accurate manner.
[Key words]\ glioma; radiology; brain network; nomograms; prognosis
膠質瘤作為腦部最常見的原發性腫瘤,其高發病率和極差的預后使之成為神經外科和神經病理學領域的研究焦點[1]。低級別膠質瘤(LGG)的平均生存時間約為7年[2],膠質母細胞瘤的中位生存時間小于2年[3]。世界衛生組織根據組織學特征對膠質瘤的分類反映了腫瘤的惡性程度和預后,給個體化治療帶來了積極的促進作用[4]。但目前獲取腫瘤組織學特征的方法依賴有創的侵入性檢查,這不僅給病人帶來風險,也影響預測的準確性[5-6]。區域放射學不受侵入性檢查的限制,并已在阿爾茨海默病、癲癇等疾病中得到驗證[7-9],但在膠質瘤領域尚未得到充分應用。本研究擬建立基于區域放射學相似性網絡(R2SN)的膠質瘤預后預測模型,旨在提供無創的膠質瘤預后預測方式,為膠質瘤的個體化治療和臨床決策提供依據。
1" 材料與方法
1.1" R2SN基因集構建
1.1.1" 數據來源" 從癌癥基因組圖譜(TCGA)數據庫中選擇腦膠質瘤病人,并在癌癥影像存檔(TCIA)數據庫中識別腦腦質瘤病人對應的影像數據,數據截止時間為2022年10月18日。共收集108例病人的術前T1加權磁共振成像(MRI)數據、臨床信息和預后信息。
1.1.2" 數據預處理" ①將T1加權MRI影像與蒙特利爾神經科學研究所提供的MNI152標準腦模板進行空間對齊,并使用線性和非線性配準的組合,將其重采樣為1 mm×1 mm×1 mm;②使用Freesurfer 6.0去除頭骨、分割腦的結構并重建大腦的皮質表面,根據Desikan-Kiliany圖譜模板,將大腦皮質分為308個區域;③為每個腦區提取47個放射學特征,包括14個強度特征和33個紋理特征,移除冗余特征(即與其他特征高度相關(r>0.9)的特征)。為每個個體得到一個308×308的最終特征矩陣用于后續分析。
1.1.3" 與基因相似性網絡的相似性" 基因相似性網絡是使用來自6個健康供體大腦的預定義基因構建的。本研究使用這6個健康供體大腦左半球的基因表達數據作為健康對照組。計算納入病人左半球各個腦區內所有基因的平均表達值,得到基因表達配置矩陣(152×15 632個基因),用于表征腦區間基因相似性的模式。采用偏最小二乘回歸來評估每個膠質瘤病人左半球的基因表達配置矩陣與健康對照組之間的關系。評估基因表達矩陣的平均連接性與健康對照組內基因相似性網絡的平均連接性之間的相關系數,用于衡量網絡之間的相似程度。差異表達的基因(P<0.05)被納入R2SN基因集,用于后續分析。
1.2" 確定與腫瘤微環境密切相關的基因
1.2.1" 數據獲取" 從TCGA數據庫中下載511例膠質瘤病人的RNA測序表達數據及其臨床信息,數據截止時間為2022年10月18日。以1∶1的比例將病人隨機分為訓練集和驗證集,訓練集和驗證集病人的年齡、性別和腫瘤分級差異無統計學意義(P>0.05)。訓練集用于建立模型,驗證集用于測試模型。
1.2.2" 使用基因表達信息估計惡性腫瘤中的間質和免疫細胞(ESTIMATE)與加權基因共表達網絡分析(WGCNA)結合分析" ESTIMATE算法計算膠質瘤RNA測序數據中腫瘤組織中的細胞比例和純度,根據臨床信息分成不同的亞組,計算每個亞組的基質分數、免疫分數和ESTIMATE分數。再將ESTIMATE算法的結果與WGCNA方法相結合,用于識別與腫瘤免疫微環境相關的基因。數據使用樣本聚類方法進行處理,以檢測和處理異常值,確保其與特征的一致性。使用Pearson相關系數量化基因共表達的相似性。網絡構建過程中創建拓撲重疊矩陣以過濾弱連接,軟閾值被設置為16,以優化網絡構建,保持與無尺度分布的一致性和平均連接性。
1.3" 兩基因集取交集
為了獲得R2SN和WGCNA基因集的交集,使用R語言中的intersect函數比較兩個集合中的基因名稱,獲取共同的基因。
1.4" Lasso篩選與模型建立
使用Lasso回歸進行基因篩選與相關性分析,模型的懲罰參數(λ)根據十折交叉驗證來確定。當λ為0.007 9(Log λ=-2.10)時,獲得性能優異但變量數量最小的模型。根據每個基因的表達水平及其相應的回歸系數計算病人的風險評分,以評分的中位數為界,將病人分為高風險組和低風險組。
1.5" 高低風險組免疫檢查點差異基因分析
使用R語言的DESeq2包識別高低風險組之間在免疫檢查點基因表達上的顯著差異。采用Benjamini-Hochberg進行多重檢驗校正。
1.6" 統計方法
應用Python 3.10和MATLAB R2021b軟件進行R2SN基因集的構建和獲取,應用R語言進行WGCNA基因集的獲取和統計分析,使用的R包包括CIBERSORT、ESTIMATE、GSVA和WGCNA等。組間比較采用t檢驗,生存差異分析采用log-rank檢驗,相關性分析使用Spearman等級相關分析。P<0.05為差異有統計學意義。
2" 結" 果
2.1" R2SN基因集的構建
計算納入的108例膠質瘤病人左半球各個腦區內所有基因的平均表達值得到基因表達配置矩陣(152×15 632個基因),顯示差異表達的354個基因(P<0.05)被納入R2SN基因集,用于后續分析。
2.2" 確定與腫瘤微環境密切相關的基因
將511例病人分別根據年齡、性別和腫瘤分級分成不同的亞組,生成相應的免疫評分結果表格,并使用散點圖展示不同組別之間的關系和差異。結果顯示,不同腫瘤分級亞組間的結果具有顯著相關性,表明免疫微環境在膠質瘤發展中起到了重要作用。見圖1。
將ESTIMATE算法的結果與WGCNA方法相結合,基因重要性(GS)是捕捉特定生物特征與模塊內基因表達之間關系的度量標準。模塊成員關系(MM)測量的是模塊內連接性,代表了基因與模塊之間的相關性。通過GS和MM確定了關鍵基因標記,隨后進行了Pearson相關性分析。選擇與免疫微環境具有強關聯性的模塊(其特征是|r|>0.50且P<0.05),總共1 776個基因作為WGCNA基因集。本研究最終選擇了green、blue和pink 3個模塊。見圖2。
2.3" 兩個基因集的交集
R2SN和WGCNA基因集取交集,共獲得了23個共同基因作為關鍵基因,對23個關鍵基因分別做了生存分析,其中有17個P<0.001,剩下的6個P<0.05。使用關鍵基因,在LGG數據庫中對膠質瘤病人進行聚類分析,觀察到數據被很好地分為兩個簇。兩個簇之間存在顯著生存差異(P<0.001)。生成了臨床相關性熱圖,并分析了兩個簇之間的KEGG通路差異。見圖3。
2.4" Lasso篩選與模型建立
Lasso回歸分析從23個關鍵基因中篩選出與膠質瘤高度相關的3個基因,即PIWIL4、TGIF1和XKR8。Lasso回歸的交叉驗證圖和路徑系數圖見圖4a、b。用這3個基因來構建風險標簽。
2.5" 基于R2SN的膠質瘤預后列線圖模型的構建及預測效果評價
根據年齡、性別、腫瘤分級和風險標簽建立膠質瘤預后列線圖模型(圖4e),模型的受試者工作特征(ROC)曲線分析顯示,訓練集1、3、5年生存率的曲線下面積(AUC)分別為0.870、0.888和0.800(圖4c),測試集1、3、5年生存率的AUC分別為0.836、0.739和0.735(圖4d),說明該模型預測效果較好。其校準曲線見圖4f。
2.6" 高低風險組免疫檢查點基因差異
免疫檢查點基因在高低風險組中存在明顯差異,說明其與免疫密切相關。見圖5。
3" 討" 論
本研究構建了R2SN基因集和WGCNA基因
集,共有23個基因同時與兩個基因集相關,具有更關鍵的預后預測意義,包括PCBP3、ARHGAP25、PNPLA3、GLIS3、FAM163B、TGIF1、SLN、HLA-DOB、EPHA10、SYT16、NMB、SLC22A18、SPRN、ITPRIPL1、ASGR2、PIWIL4、SCN2A、SPON2、INPP5D、XKR8、ECHDC2、AURKC和NPL。其中,GLIS3、NMB、ITPRIPL1和XKR8被確定為膠質瘤不良預后相關基因[10-13]。SYT16和SLC22A18則是膠質瘤良好預后相關基因[14-15]。
有研究表明,PIWI蛋白在包括大腦在內的軀體環境中發揮重要的生物功能,PIWIL4不僅可以調節對正常神經發生至關重要的神經源基因,還可以調節與膠質瘤細胞活動有關的基因[16-18]。
TGIF1作為膠質瘤的一種新型致癌基因,是膠質瘤病人個性化治療的潛在治療靶點[19]。
TGIF1在癌癥中發揮著關鍵的生物功能,其表達與腫瘤細胞的入侵、遷移和轉移增強有關[20-21]。本研究確定3個關鍵基因(PIWIL4、TGIF1和XKR8)建立風險標簽,以風險標簽結合臨床因素構建的腦膠質瘤預后模型在訓練集和驗證集中的預測能力均較強,進一步證實了
腫瘤免疫微環境在膠質瘤的發展中發揮著重要作用,這為個體化治療和生物標志物的發現提供了有力支持。
本研究存在一定的局限性。首先,公共數據庫中的影像數據質量和分辨率不統一,這對數據的分析結果有一定的影響。其次,由于疾病的特殊性,我們難以找到大量健康人的腦部基因數據來作為健康對照組。本研究確定了R2SN應用于膠質瘤的可行性,但仍需大量的實驗和數據進行佐證。
綜上所述,本研究建立了在腦膠質瘤中使用R2SN方法進行預后預測的模型,該模型在預后判斷和免疫治療反應預測方面具有一定的臨床價值,為膠質瘤的治療提供了新的視角。
[參考文獻]
[1]CHEN R, SMITH-COHN M, COHEN A L, et al. Glioma subclassifications and their clinical significance[J]. Neurothe-
rapeutics, 2017,14(2):284-297.
[2]CLAUS E B, WALSH K M, WIENCKE J K, et al. Survival and low-grade glioma: the emergence of genetic information[J]. Neurosurgical Focus, 2015,38(1):E6.
[3]GUSYATINER O, HEGI M E. Glioma epigenetics: from subclassification to novel treatment options[J]. Seminars in Can-
cer Biology, 2018,51:50-58.
[4]LOUIS D N, OHGAKI H, WIESTLER O D, et al. The 2007 WHO classification of tumours of the central nervous system[J]. Acta Neuropathologica, 2007,114(2):97-109.
[5]REIFENBERGER G, WIRSCHING H G, KNOBBE-THOMSEN C B, et al. Advances in the molecular genetics of gliomas-implications for classification and therapy[J]. Nature Reviews Clinical Oncology, 2017,14(7):434-452.
[6]NICHOLSON J G, FINE H A. Diffuse glioma heterogeneity and its therapeutic implications[J]. Cancer Discovery, 2021,11(3):575-590.
[7]ZHAO K, ZHENG Q, DYRBA M, et al. Regional radiomics similarity networks reveal distinct subtypes and abnormality patterns in mild cognitive impairment[J]. Advanced Science, 2022,9(12):e2104538.
[8]YU H Y, DING Y H, WEI Y B, et al. Morphological connectivity differences in Alzheimer’s disease correlate with gene transcription and cell-type[J]. Human Brain Mapping, 2023,44(18):6364-6374.
[9]SHI D F, REN Z D, ZHANG H R, et al. Amplitude of low-frequency fluctuation-based regional radiomics similarity network: Biomarker for Parkinson’s disease[J]. Heliyon, 2023,9(3):e14325.
[10]LI G W, LAN Q. Exosome-mediated transfer of circ-GLIS3 enhances temozolomide resistance in glioma cells through the miR-548m/MED31 axis[J]. Cancer Biotherapy amp; Radiopharmaceuticals, 2023,38(1):62-73.
[11]ZENG R J, XIONG X Y. Effect of NMB-regulated ERK1/2 and p65 signaling pathway on proliferation and apoptosis of cervical cancer[J]. Pathology, Research and Practice, 2022, 238:154104.
[12]LIU W T, ZOU J X, REN R J, et al. A novel 10-gene signature predicts poor prognosis in low grade glioma[J]. Technology in Cancer Research amp; Treatment, 2021,20:15330338-21992084.
[13]HAVRYSH K V, BOGDANOV M, KIYAMOVA R. PLSCR1 and XKR8: new markers for low-grade glioma progression and outcome[J]. Annals of Oncology, 2019,30: vii15.
[14]CHEN J F, WANG Z H, WANG W, et al. SYT16 is a prognostic biomarker and correlated with immune infiltrates in glio-
ma: a study based on TCGA data[J]. International Immunopharmacology, 2020,84:106490.
[15]CHU S H, FENG D F, MA Y B, et al. Promoter methylation and downregulation of SLC22A18 are associated with the development and progression of human glioma[J]. Journal of Translational Medicine, 2011,9:156.
[16]SUBHRAMANYAM C S, CAO Q, WANG C, et al. Role of PIWI-like 4 in modulating neuronal differentiation from human embryonal carcinoma cells[J]. RNA Biology, 2020,17(11):1613-1624.
[17]ARAVIN A, GAIDATZIS D, PFEFFER S, et al. A novel class of small RNAs bind to MILI protein in mouse testes[J]. Nature, 2006,442(7099):203-207.
[18]GIRARD A, SACHIDANANDAM R, HANNON G J, et al. A germline-specific class of small RNAs binds mammalian Piwi proteins[J]. Nature, 2006,442(7099):199-202.
[19]WANG B Y, MA Q, WANG X L, et al. TGIF1 overexpression promotes glioma progression and worsens patient prognosis[J]. Cancer Medicine, 2022,11(24):5113-5128.
[20]JIA K, WEN Q H, ZHAO X, et al. XTP8 stimulates migration and invasion of gastric carcinoma through interacting with TGIF1[J]. European Review for Medical and Pharmacological Sciences, 2020,24(5):2412-2420.
[21]SHAW E J, HAYLOCK B, HUSBAND D, et al. Gene expression in oligodendroglial tumors[J]. Cellular Oncology (Dordrecht), 2011,34(4):355-367.
(本文編輯" 周曉彬)