趙慧敏,張輝
作者單位:1.山西醫科大學醫學影像學院,太原030001;2.山西醫科大學第一醫院影像科,太原030001
高級別腦膠質瘤(high-grade glioma,HGGs)約占腦膠質瘤的3/4,生存期短且易復發,根據《中國中樞神經系統膠質瘤診斷和治療指南》編寫組在中華醫學雜志2016年96卷7期發表的2015年的中國中樞神經系統膠質瘤診斷與治療指南,成人HGGs的1年和5年生存率分別約30%和13%,總體預后較差。最大范圍的手術安全切除輔以同步放化療為其標準治療方案,替莫唑胺(temozolomide,TMZ)的低毒性使其成為臨床上化療的一線藥物。有研究表明,同樣使用TMZ的HGGs患者,O6-甲基鳥嘌呤甲基轉移酶(O6-methylguanine-DNA methyltransferase,MGMT)啟動子甲基化患者的生存期明顯延長[1],因此臨床中MGMT啟動子甲基化狀態已成為判斷HGGs 患者療效的重要參考指標[2-3]。目前確定MGMT 啟動子甲基化狀態的金標準是基因檢測,需通過手術切除或活檢來獲得組織,創傷較大且費用昂貴。相比之下,影像學檢查具有一定優勢,但腦膠質瘤的高度異質性使常規的影像學評估面臨巨大挑戰,而人工智能則為腦膠質瘤的精準預測及個性化治療提供了全新途徑,其中機器學習技術已成為人工智能的核心部分,Jian 等[4]在對系統文獻的回顧中發現機器學習預測膠質瘤MGMT 啟動子甲基化時,訓練數據集的合并敏感度為81%,特異度為80%,顯示出良好的結果,而優化的機器模型可以成為一種無創、客觀的工具來為臨床決策提供重要的分子信息。
MGMT 是一種不可逆的DNA 甲基轉移酶,可迅速逆轉化療藥物引起的鳥嘌呤O6位的烷基化損傷將核苷酸恢復到其天然形式,而不會導致任何DNA 鏈斷裂,因此會導致耐藥性的產生。MGMT啟動子甲基化則會導致MGMT轉錄的沉默,從而提高化療敏感性,延長患者生存期。但MGMT 啟動子甲基化患者對放化療的高敏感性又會加重放化療介導的放射性損傷,因此在治療結束后3~6 個月左右,聯合TMZ 同步治療的患者中MGMT 啟動子甲基化患者發生假性進展的概率高于未甲基化者[5],影像上與復發均表現為異常強化,準確鑒別兩者對下一步的治療決策至關重要。此外MGMT 高水平表達是腦膠質瘤室旁復發的重要預測因子[6]。另外,據報道MGMT 啟動子甲基化狀態與HGGs 生長速率降低顯著相關[7],這可能與其介導的腦膠質瘤微環境中的免疫反應相關。因此,術前預測MGMT 啟動子甲基化狀態對于HGGs 的預后及指導其個體化治療具有很大價值。
智能影像是指基于人工智能技術的神經元數學模型,通過挖掘海量多模態醫學影像數據特征,學習和模擬影像醫生的診斷思路,進行特征挖掘、重新組合以及綜合判斷的復雜過程[8]。
影像組學是指高通量地提取大量影像特征數據,采用自動或半自動算法將所提取數據轉化為高維度可發掘的空間特征數據,并進而深層次分析和解讀這些數據[9]。突破了臨床上主觀判讀圖像的局限性,可以更好地表征疾病特征[10],為膠質瘤分子分型的預測提供了新思路。
2.1.1 基于磁共振成像的影像組學
影像學檢查,尤其是磁共振成像(magnetic resonance imaging,MRI)檢查,既可多方位成像,又具有較高的軟組織分辨力,是診斷腦腫瘤的可靠手段。Xi 等[11]發現在單一常規序列模型中,基于增強T1 加權成像(contrast enhanced T1 weighted imaging,Ce-T1WI)使用支持向量機(support vector machine,SVM)分類器在預測膠質母細胞瘤(glioblastomas,GBMs)的MGMT啟動子甲基化狀態時性能最好,敏感度、特異度、曲 線 下 面 積(area under the curve,AUC)分 別 為84.27%、79.19%、0.883,并且紋理特征可能是最重要的。而Huang等[12]基于T2 加權成像(T2-weighted imaging,T2WI)通過邏輯回歸(logistic regression,LR)放射學模型在預測膠質瘤MGMT 啟動子甲基化狀態方面的表現優于基于其他序列的模型,基于Ce-T1WI的放射學模型則在預測腫瘤等級和膠質瘤異檸檬酸脫氫酶1 (isocitrate dehydrogenase,IDH1)狀態方面表現更好。這些不同的結果可能部分歸因于不同的隊列和不同的處理方法。功能成像則能提供腫瘤的擴散、代謝及灌注特征,一些學者對術前表觀彌散系數(apparent diffusion coefficient,ADC)直方圖分析對膠質瘤MGMT啟動子甲基化狀態的預測價值進行了研究,但結果相互矛盾[13-14],Zhang 等[15]發現基于血管外細胞外容積分數(Ve)和容積轉運參數(Ktrans)的直方圖參數可用于評估MGMT啟動子甲基化狀態,其中中位Ktrans值和第90百分位的Ve值是分析MGMT 啟動子甲基化的重要生物標志物,Ve值預測性能相對較好,敏感度、特異度、AUC 分別為84.2%、75.0%、0.829。而Crisi 等[16]發現采用樸素貝葉斯、決策樹和多層感知器機器學習方法基于動態磁敏感增強(dynamic susceptibility contrast,DSC)成像建立的模型可用來預測MGMT 啟動子甲基化狀態,敏感度、特異度、AUC 分別為75%、85%、0.84,但是結果可能高度依賴于MGMT 甲基化截止值30%。另外Jiang 等[17]發現在分析MGMT 啟動子甲基化GBMs 的(amide proton transfer,APT) 直方圖參數時,平均APT 值顯示出最高的診斷準確度為83.3%。基于功能成像的影像組學預測性能并沒有顯著優于常規成像模型,這可能是由于功能成像較低的空間分辨率。由此可見單個圖像特征容易忽略腫瘤的其他組織特征,另外成像序列及分類算法的不同均會導致研究結果的差異。
不同序列的圖像往往反應了腫瘤內不同的組織特征,與單變量預測相比,融合多種序列的影像特征可以提高預測性能[18-19],目前也在不少學者的研究中得到了證實。Xi 等[11]的研究中使用SVM預測MGMT啟動子甲基化狀態的最佳分類系統來源于36 個T1WI、T2WI 和Ce-T1WI 圖像特征的組合,準確度為86.59%。Huang 等[20]對T1WI、T2WI、T2-FLAIR 及Ce-T1WI 的組合模型進行紋理分析預測GBMs 數據集MGMT 啟動子甲基化的敏感度為90.5%,特異度為72.7%。兩位學者組合模型的預測性能均高于其中任何單一序列的影像組學特征。但是Korfiatis 等[21]發現使用SVM 和隨機森林(random forest,RF)分類器預測GBMs MGMT 啟動子甲基化時,T1WI 結合T2WI 的圖像特征性能比基于單一T2WI特征差,T1WI和T2WI圖像特征的結合似乎降低了監督分類方案的性能,尤其是對于RF 模型。同樣地,Wei等[22]發現基于T2-FLAIR和Ce-T1WI序列中提取的影像特征使用LR 模型預測MGMT 啟動子甲基化的性能比ADC序列表現更好,但是將水腫程度和ADC 值添加入其中會導致預測性能的輕微降低,這表明在放射組學特征中加入臨床和放射學因素會增加復雜性,但不會增加預測準確性,并且ADC圖的低圖像分辨率影響了影像組學特征的穩定性和魯棒性。因此,關于多參數放射組學模型預測MGMT 啟動子甲基化狀態的最佳聯合方案有待深入研究。
2.1.2 基于正電子發射斷層攝影術的影像組學
正電子發射斷層攝影術(positron emission tomography,PET)是一種高靈敏度的分子成像技術,可以反映腫瘤細胞中普遍存在的腫瘤代謝改變。Kong等[23]發現使用LR模型從原發性彌漫性膠質瘤患者的18氟脫氧葡萄糖-正電子發射計算機斷層掃描(18fluorodeoxyglucose positron emission computed tomography,18F-FDG-PET)提取的放射組學特征可以用來預測腦膠質瘤MGMT啟動子甲基化狀態,在訓練集和驗證集中的準確度分別為91.3%、77.8%。與MRI及18F-FDG-PET相比,18氟-多巴正電子發射斷層掃描(18-labeled L-dihydroxyphenylalanine positron emission tomography,18F-DOPA-PET)顯示出高腫瘤背景信號和高膠質瘤檢測敏感度,Qian等[24]發現利用RF模型提取HGGs 的18F-DOPA-PET 圖像的放射組學特征可以用于預測MGMT 啟動子甲基化狀態,訓練集和驗證集準確度均為80%。但前者的特征提取是以T2-FLAIR 及Ce-T1WI 為參考,而后者是提取腫瘤異常攝取區的特征。Yu等[25]的研究則利用了PET/MRI 融合技術,表明11C-蛋氨酸-正電子發射斷層顯像(11C-methionine-positron emission computed tomography,11C-MET PET)與MRI 融合技術的直方圖特征,如偏度和峰度,可用于區分MGMT 啟動子甲基化組和非甲基化,但該研究沒有進行受試者工作特征曲線分析來衡量療效或評估患者的生存率,因此,PET/MRI融合技術的價值有待進一步驗證。
深度學習是通過組合低層特征形成更加抽象的高層類別或特征,進而從大量的輸入數據中學習有效特征,并把這些特征用于分類、回歸和信息檢索的一種技術。在其完成模型訓練后,可以實現影像全自動分析,避免了手工勾畫特征的煩瑣及觀察者之間的分歧。
目前,深度學習已經在膠質瘤領域開啟了廣泛的研究,其中卷積神經網絡(convolutional neural networks,CNN)是典型的深度學習人工神經網絡。Chen等[26]使用Ce-T1WI 及T2-FLAIR 圖像訓練的淺層CNN 預測GBMs MGMT 啟動子甲基化的準確度分別為80.4%和82.7%,T2-FLAIR 圖像似乎對腫瘤MGMT 啟動子甲基化狀態的預測性能更好。這可能是由于MGMT啟動子甲基化的GBMs更容易發生壞死,而T2-FLAIR序列對壞死更敏感[27]。在Chang 等[28]的研究中,使用基于T1WI、T2WI、FLAIR 的二維CNN 預測256 例腦膠質瘤MGMT 啟動子甲基化狀態時具有83%的準確度。而Yogananda 等[29]基于T2WI 的3D U-Net 神經網絡預測MGMT 啟動子甲基化的準確度達到了94.73%。這可能是由于該研究三維網絡架構中的密集連接更易于訓練,并且可以減少過度擬合。此外,經典的CNN 體系結構隨著網絡的加深可以一定程度提升模型的性能,但過程較復雜且卷積層的不斷增加會導致反向傳播梯度消失和過度擬合,而深度殘差網絡(residual networks,ResNet)結構則支持數百層的訓練網絡。Korfiatis 等[30]發現基于GBMs 患者T1WI、T2WI圖像的ResNet結構能夠高精度預測MGMT啟動子甲基化狀態,其中性能最好的是ResNet50,準確度為94.90%,ResNet的更深層次的體系結構似乎可以產生更好的結果。總之,選擇合適的網絡深度對于深度學習模型的性能至關重要,且深度學習需要較大的數據樣本,模型的性能可能會隨訓練數據的增多有所提高。
基于深度學習的影像組學(deep learning-based radiomics,DLR)是一種結合影像組學與深度學習的更先進的混合模型。在DLR中,高通量的圖像特征直接從深度神經網絡中提取,不涉及額外的特征提取操作,避免了因特征計算在放射組學分析中引入的額外誤差,保證了圖像特征的準確性和有效性[31]。
目前DLR模型已成功應用于腦腫瘤的基因型預測、分級及預后[32]等,Zhu 等[33]利用一種基于常規MRI 數據的性能良好的DLR模型無創預測腦膜瘤分級,AUC達0.811。Li等[34]的研究證實對于相同的低級別膠質瘤數據集,DLR 預測IDH1 時的AUC(92%)明顯優于正常放射組學方法的AUC (86%)。Zhang 等[35]整合了一種全自動化、基于深度學習的膠質瘤分割方法預測IDH突變和MGMT 啟動子甲基化共發生,Ce-T1WI 圖像特征的性能最好,特異度為94%,準確度為89.4%,且此方法在臨床環境中更具實用性。由此可見,DLR可能是從醫學圖像中提取深層信息的一種強有力的方法,目前尚無關于利用DLR 模型預測MGMT啟動子甲基化狀態的相關報道。
人工智能已廣泛應用于醫學影像領域,為影像科醫生提供了重要信息,降低漏診概率的同時也提高了閱片效率。其中影像組學為腫瘤的影像學特征和MGMT啟動子甲基化狀態建立了進一步的聯系,但其特征提取依賴手工勾畫且成像序列及分析方法缺乏標準化。相比影像組學,深度學習能夠大幅度提高分類或預測模型的準確性,但其發展受到數據集規模的限制,而DLR則充分利用了影像組學及深度學習的優勢,但這些影像研究來自多中心,且計算及分析缺乏統一標準。相信未來智能影像將克服現有不足,更好地實現腦腫瘤的精準診療。
作者利益沖突聲明:全部作者均聲明無利益沖突。