伍文麗,李杰文,徐勝生*
(1.重慶醫科大學附屬第一醫院放射科,重慶 400016;2.重慶大學光電技術與系統教育部重點實驗室,重慶 400044)
腦膠質瘤起源于神經膠質細胞,是最常見的原發性中樞神經系統腫瘤,約占成人原發性惡性腦腫瘤的75%。2016 年世界衛生組織(WHO)將腦膠質瘤分為低級別膠質瘤(lowgrade glioma, LGG,包 括WHO Ⅰ- Ⅱ級) 及 高 級 別 膠 質瘤(high-grade glioma, HGG,包 括WHO Ⅲ- Ⅳ級)[1]。MRI是一種非侵入性的醫學成像技術,因其具有良好軟組織對比度,能為腦膠質瘤的診斷和治療提供豐富的信息,是腦膠質瘤的評估的首選成像技術[2]。然而,隨著醫學影像技術及成像設備的發展,逐漸增多的影像圖像給放射科醫生的工作帶來了巨大的挑戰。且隨著精準醫療的提出,傳統的人工閱片等主觀的醫學圖像分析方法已無法滿足需求。深度學習(deep learning, DL)是機器學習的一個重要分支,可從大量的原始數據中自動提取圖像中抽象、復雜的深度特征,而非手工制作的淺層特征,具有快速高效,準確率高的優勢[3],使其迅速成為醫學圖像分析領域研究的熱點。近年來,DL 廣泛應用于腦膠質瘤的MRI 圖像分析處理中,其在腫瘤分割、分類、基因預測及生存期預測等方面發揮著重要作用。本文就DL 在腦膠質瘤中的應用中的進展予以綜述。
DL 是傳統的人工神經網絡技術的擴展,是通過多層非線性網絡結構從原始數據中自動提取并組合低級特征,再轉換成更高級、更抽象特征,以完成復雜任務學習的一種深度網絡[3,4]。DL 方法包含多種深度模型,其中卷積神經網絡(convolutional neural network, CNN)模型是應用最廣泛的深度學習模型,在識別、處理和分析圖像特征過程與人類神經系統處理視覺信息過程類似[3,4]。CNN 一般由輸入層、卷積層、池化層、全連接層及輸出層構成,如圖1 所示。各層之間相互聯系,共同構成復雜而精密的網絡。卷積層自動提取輸入信息的特征,且通過權值共享減低模型復雜度;池化層緊跟在卷積層之后,其通過降低特征面的分辨率獲得具有空間不變性的特征,起到二次提取特征的作用;全連接層中每個神經元與前一層所有神經元進行全連接,通過整合前期所提取的各種局部特征,達到訓練分類器及學習目標全局特征的目的。因此CNN 具有局部連接、權值共享、池化操作及多層結構等特點,使其減少訓練參數的數量,有效降低了網絡計算復雜度,同時使得網絡對輸入的局部變換具有一定不變性,如平移不變形,從而提升了網絡泛化能力[3]。

圖1 一個基本的卷積神經網絡結構
腦膠質瘤的準確分割對疾病診斷、預后和患者治療計劃具有重要作用[5]。目前,基于DL 的分割算法已實現了從多模態MRI 數據中將腦膠質瘤自動分割為壞死區、水腫區、腫瘤非增強區及腫瘤增強區等不同亞區。Pereira 等[6]提出一種基于3×3 卷積核的二維卷積神經網絡(2D CNN)自動分割算法,該方法使用的小卷積核可通過減少參數量而防止過擬合的發生?;糁怯碌萚7]提出了一種基于雙通道三維密集連接網絡的腦膠質瘤MRI 數據自動分割算法,該算法利用三維密集連接網絡加強特征傳播,減少了低級特征向高級特征傳遞過程中的損失,然后采用雙通道特征提取網絡,選取不同尺度卷積核,獲取了多尺度特征,解決了腫瘤區域大小不一致的問題。Cui 等[8]結合兩個子網絡構建了一種級聯深度卷積神經網絡,結果表明該方法分割腫瘤整體、腫瘤核心及腫瘤增強區的骰子相似系數(dice similarity coefficient, DSC)分別為0.89,0.77 及0.80,且平均在1.54 秒內快速完成了分割任務。為進一步提高腦膠質瘤分割精度,Prasanna 等[5]采用基于影像組學的CNN 分割技術,即先識別出分割腫瘤不同亞區的影像組學紋理特征,然后將這些特征輸入到三維卷積神經網絡(3D CNN)模型中,用于腦膠質瘤不同亞區的分割,結果表明相比3D CNN 分割模型,提高了腫瘤增強區和腫瘤整體的分割精度。Mlynarski 等[9]采用2D-3D CNN 分割方法對腦膠質瘤多模態MRI 數據進行分割,該方法結合了2D 和3D 卷積神經網絡的優點,捕獲了空間上下文特征,結果顯示分割腫瘤整體、腫瘤核心及腫瘤增強區的DSC 分別為0.918,0.883 及0.854,優于以上分割算法的精度。
此外,AlBadawy 等[10]研究了CNN 對來自兩個機構的膠質母細胞瘤MRI 數據的分割性能,結果顯示使用不同機構的數據的分割精度(DSC 為0.68±0.19)顯著低于使用同一機構數據的分割精度(DSC 為0.72±0.17)。由此可見,來自不同的機構的數據在成像設備、圖像采集參數和對比劑使用方面有所不同,這可能會影響圖像質量,從而影響分割精度。
腦腫瘤的病理類型及腦膠質瘤分級很大程度上決定了治療方案及整體預后[11,12],因此準確進行腦腫瘤分類及分級具有重要臨床意義。近年來,一些研究者基于CNN 方法充分挖掘對比增強T1WI (contrast enhanced T1-weighted imaging, CE-T1WI)數據集的深度特征實現了腦膠質瘤、腦膜瘤及垂體瘤分類診斷,如Abiwinanda 等[13]和Paul 等[14]的分類準確率分別為84.19%,90.26%。隨后Swati 等[15]使用預訓練卷積神經網絡模型,提出了一種基于遷移學習的分塊微調策略進行分類,準確率高達94.82%。Deepak 等[11]使用遷移學習訓練深度卷積神經網絡模型,分類準確率為92.3%,當進一步聯合CNN 及支持向量機(support vector machine, SVM),準確率提高到97.8%。
除了腦腫瘤定性診斷,DL 還實現了腦膠質瘤的分級診斷。Yang 等[16]使 用GoogLeNet 和AlexNet 模 型 進 行LGG和HGG 分類,兩種模型的分類準確率分別為94.5%、93.8%,表明GoogLeNet 具有更佳分類性能。Zhang 等[17]基于CNN模型,從擴散張量成像(diffusion tensor imaging, DTI)數據集中提取深度特征,用于腦膠質瘤分級,結果顯示區分LGG 與HGG 準確率為94%;區分WHO Ⅲ級與WHO Ⅳ級腦膠質瘤準確率高達98%,表明在腦DTI 圖像上提取的深度特征有助于區分不同級別的腦膠質瘤。為廣泛挖掘不同級別膠質瘤間的差異性,Ge 等[18]將多模態MRI 納入多流2D CNN 模型中,實現了LGG 和HGG 的分類,其中CE-T1WI 具有最高效能,其準確率為83.87%,融合多模態特征分類性能提高了約7%。Mzoughi 等[12]提出一種多尺度3D CNN 架構,基于多模態MRI 數據集進行LGG 及HGG 的分類,并采用數據增強技術對圖像進行預處理,其分類準確率從82.5%提高到96.4%,優于2D CNN 模型。上述研究結果均表明DL 有助于腦膠質瘤鑒別及分級,然而目前主要進行的是單中心研究,存在樣本量較小的問題,有待進一步進行多中心,大樣本的研究以驗證其可行性。
了解腦膠質瘤異檸檬酸脫氫酶(isocitrate dehydrogenase, IDH),O6-甲基鳥嘌呤-DNA 甲基轉移(O6-methylguanine-DNA methyltrans-ferase,MGMT)和1p19q 等腫瘤基因狀態有益于治療方案的制定和預后的評估[19]。近年來,越來越多的研究探討了DL 預測腦膠質瘤基因狀態的價值。Li 等[20]通過增加網絡深度和全連接層中的神經元數量構建CNN 模型,用于預測LGG 患者IDH1 突變狀態,其工作曲線下面積(the area under the operating characteristic curve, AUC) 為0.92。Korfiatis 等[21]采用三種殘差深度神經網絡(residual deep neural network, ResNet)模型用于預測MGMT 啟動子甲基化狀態,結果顯示ResNet50 模型優于ResNet34 和ResNet18 模型,其準確率分別為94.90%,80.72%和75.75%。Akkus 等[22]等基于多尺度CNN 模型實現了LGG 患者1p19q 共缺失狀態的預測,準確率為87.70%。此外,Chang 等[23]訓練的CNN 模型實現了腦膠質瘤的多基因預測,包括IDH1 突變、MGMT 甲基化和1p/19q 共缺失狀態,準確率分別為94%,83%及92%,提示利用CNN 可以同時預測多個基因的狀態。
為了證明基于不同MRI 模態的預測性能,有研究利用多模態MRI 數據集構建CNN 模型用于預測腦膠質瘤IDH 狀態,如Chang 等[24]基于殘差卷積神經網絡構建預測模型,結果顯示FALIR、T2WI、T1WI 及CE-T1WI 數據集的AUC 值分別為0.69,0.73,0.86 及0.92,融合多模態MRI 后AUC 為0.94。另一項研究[25]構建的3D-DenseNet 模型中T2WI 預測能力最好,AUC 為0.82,而基于CE-T1WI 的AUC 為0.75,融合多模態MRI 的AUC 達0.86。這些數據表明融合多模態MRI 數據集可以提供預測腦膠質瘤基因狀態的補充信息,其預測性能顯著優于單模態模型。然而,Yogananda 等[26]采用3D-Dense-UNets 方法分別構建基于T2WI 及多模態MRI 數據集預測腦膠質瘤IDH 狀態模型,準確率分別為97.14%±0.04、97.12%±0.09,AUC 分別為0.98±0.01、0.99±0.01,這表明僅使用T2WI 模態的信息就可以提供較高的預測性能??梢?,不同的研究基于不同MRI 模態預測基因狀態,其結果并不一致,仍需在更大樣本中進一步研究。
既往研究將患者年齡、性別、腫瘤部位、大小等作為預后因素[27],然而這些指標無法反映腫瘤內異質性,存在一定局限。DL 能挖掘肉眼無法識別整個腫瘤的的深層、抽象的特征,更有助于預測患者生存期。Liu 等[28]采用預訓練的卷積神經網絡對圖像深度特征進行篩選,再將篩選后的特征納入隨機森林算法分類模型,其預測生存期準確率達到95.45%。Nie的團隊[29]采用深度學習,從多模態、多通道的MRI 數據集中自動提取深度特征,用于預測HGG 患者的總生存期。隨后將這些深度特征以及臨床特征(如年齡、腫瘤大小和組織學類型)輸入SVM 以預測總生存期,其準確率高達90.66%,并進行了一系列比較分析,結果表明融合多模態模型較單一模態模型具有更高性能,在單模態分類性能中靜息狀態功能磁共振成像具有最佳性能,且使用3D CNN 構建的預測模型較2D CNN 具有更高性能,準確率提高了約10%;另外他們將CNN全連接層中提取的深度特征輸入SVM,從而構建CNN+SVM的聯合模型,發現其性能較單獨的CNN 模型提高了2.5%,且單獨的CNN 模型的性能優于SVM 模型。
盡管上述研究均表明DL 方法預測腦膠質瘤生存期方面具有重要價值,但大多數研究并未考慮使用與預后相關的腫瘤基因型,如IDH、MGMT 及1p19q 等。Tang 等[30]提出了一種多任務卷積神經網絡模型共同完成腫瘤基因型(IDH,MGMT,1p19q)和總生存期預測任務,具體來說從基因型預測任務中獲得的深度特征,用于指導總生存期的預測,反之從總生存期預測任務中學習到的特征也用于腫瘤基因型的預測。結果顯示與腫瘤基因型相關特征顯著提高了預測總生存期的準確性,反之與總生存期相關的特征也改善了預測基因型的準確性,表明深度特征、基因型和患者生存期之間具有密切關系。
目前,基于DL 已采用多模態、多方法對腦膠質瘤MRI 圖像進行分割、分類、基因預測及生存期預測的橫向及縱向研究,并獲得初步進展。相信隨著人工智能蓬勃發展的趨勢,借助醫學影像大數據的發展,不斷改進的深度學習方法將有助于更精確地了解腦膠質瘤的特征,在緩解放射科醫生的壓力同時提高了診斷的速率及準確率,無疑能為精準醫療的實現提供更多的解決方案。