龍治豪 連海偉 邢變枝 劉仁忠
膠質瘤是最常見的顱內原發性惡性腫瘤。根據病理學特征,WHO將膠質瘤分為Ⅰ~Ⅳ級,描述腫瘤惡性程度,其中異檸檬酸脫氫酶1(isocitric dehydrogenase 1,IDH-1)基因突變和Ki-67表達水平為重要的診斷依據[1]。IDH-1 基因突變是評估膠質瘤病人預后的重要指標,IDH-1 野生型提示預后不良[2,3]。Ki-67 表達水平反應腫瘤增殖情況,對膠質瘤的診斷、治療和預后評估有指導意義[4]。術前對膠質瘤IDH-1 基因突變和Ki-67 表達水平進行評估,可為膠質瘤病人提供無創的診斷[5]。近年來,研究表明,影像組學可通過大量病人影像學資料的機器深度學習,構建疾病診斷、預后預測模型,為優化疾病的診斷、預后預測提供有價值的信息[6]。本文探討基于T2WI 序列影像組學模型預測膠質瘤IDH-1 基因突變和Ki-67表達水平的價值。
1.1 研究對象 納入標準:①行腫瘤切除術或活檢術;②術后病理診斷為腦膠質瘤,且包含完整的IDH-1或Ki-67檢測結果;③具有完整清晰可用于分析的術前MRI影像資料。排除標準:①IDH-1或Ki-67檢測結果不明確;②MRI序列不完整,所需序列不清晰或有明顯偽影,或者未滿足診斷標準;③二次或多次手術。
收集2017年1月至2021年6月經手術切除且病理診斷為腦膠質瘤的臨床、病理和術前影像學資料。根據納入排除標準最終篩選出77例,其中男41例,女36 例;年齡11~73 歲,平均(48.64±13.64)歲。72 例IDH-1 基因檢測結果完整(IDH-1 組),75 例Ki-67檢測結果完整(Ki-67組),兩者檢測結果均完整共70 例。IDH-1 組男40 例,女32 例;野生型47例,突變型25例。Ki-67組男40例,女35例;低表達48例,高表達27例。
1.2 影像學資料 選取顱腦軸位T2WI序列,均于武漢大學人民醫院放射科采集。儀器設備:3.0 T超導型磁共振掃描儀。掃描參數:TR/TE為3 000 ms/15ms,Flip角為90°,視野為230×230,重建矩陣為128×128,采樣矩陣為96×96,層距為2.0 mm,層厚為5.0 mm,激勵次數為1次等。
1.3 影像組學分析
1.3.1 感興趣區域(region of interest,ROI)的選擇 使用T2WI軸位像選擇ROI(圖1A、2A)。將MRI資料上傳至ITK-SNAP(Version3.8.0)軟件[7],先手動沿腫瘤邊緣逐層選擇ROI,再由神經外科、影像科高年資醫師各一名進行審核,有爭議時,由影像學科醫師確定。腫瘤區域選擇時,參考T1WI和T1WI+C 序列,涵蓋囊變或壞死區。
1.3.2 影像組學特征的提取和篩選 首先,進行圖像預處理,包括圖像歸一化、偏置場矯正和重采樣。然后,應用Python3.0 和Pyradiomics(https://pyradiomics.readthedocs.io/)處理影像數據和ROI數據,提取特征包括一階特征、形態特征和紋理特征,其中紋理特征包括灰度共生矩陣參數、灰度行程矩陣參數、灰度尺寸區域矩陣、鄰域灰度差矩陣參數、灰度相關矩陣參數、小波濾波特征和高斯-拉普拉斯濾波特征,共提取影像特征1 037個。
應用Python 3.0,將IDH-1野生型病例添加標簽“0”,突變病例添加標簽“1”。根據Beesley[8]報道方法將Ki-67 表達水平陽性率分為4 級:0~4%為0 級,5%~24%為1 級,25%~49%為2 級,50%以上為3 級。本文將Ki-67 表達水平分為低表達組(0~1 級)和高表達組(2~3級),并分別添加標簽“0”和“1”。然后,將影像組學特征值進行標準化、混序,先用兩獨立樣本t檢驗進行篩選,排除組間無統計學差異的特征值,再用LASSO回歸進一步篩選。
1.3.3 影像組學模型的建立及驗證 使用Python 3.0和scikit-learn機器學習算法進行影像組學模型建立和驗證。將數據按7:3的比例分為訓練集和測試集,分別用于影像組學模型的建立和驗證。使用隨機森林和參數優化后的支持向量機兩種分類器建立影像組學模型。最后,繪制受試者工作特征(receiver operating characteristic,ROC)曲線,并計算曲線下面積(area under curve,AUC)判斷模型預測IDH-1基因突變和Ki-67表達水平的靈敏度、特異度。
2.1 影像組學特征篩選結果IDH-1 組t檢驗篩選出47 個特征,再通過LASSO 回歸篩選出11 個特征(圖1B~D;表1)。Ki-67組t檢驗篩選出17個特征,再通過LASSO回歸篩選出10個特征(圖2B~D;表2)。

表1 IDH-1組特征值及其權重

表2 Ki-67組特征值及其權重

圖1 基于MRI T2WI影像組學模型預測膠質瘤IDH-1突變特征篩選結果

圖2 基于MRI T2WI影像組學模型預測膠質瘤Ki-67表達水平特征篩選結果
2.2 影像組學模型的預測效能 支持向量機和隨機森林兩種影像組學模型的敏感度、特異度與AUC 見表3,其ROC曲線見圖3。兩種模型的對IDH-1基因突變和Ki-67表達水平均有較好的預測效能(AUC>0.850),兩種模型的預測準確率均大于0.880,其中隨機森林比支持向量機的效果更好。

圖3 不同機器學習分類器的ROC曲線

表3 機器學習ROC曲線結果
IDH-1 基因突變和Ki-67 表達水平對膠質瘤病人的預后評估具有重要意義。IDH-1突變型膠質瘤病人預后優于野生型病人[9],IDH-1 突變型膠質瘤DNA 甲基化增加、生物學侵襲行為減少、總生存期延長[10]。膠質瘤Ki-67 表達水平明顯高于正常腦組織[11],Ki-67表達水平越高,腫瘤惡性程度越高、預后越差[12]。IDH-1 基因突變和Ki-67 表達水平的檢測依賴腫瘤組織病理檢查,是一種具有侵襲性的檢查,而且還存在取樣誤差、有時臨床難以獲得滿意的數據等局限性。
影像組學作為一個新興的技術,近年來被廣泛應用于腫瘤的診斷、治療及預后的評價和預測,基于T2WI、T1WI+C、ADC、PET-CT/MR 的影像組學分析、深度學習神經網絡等均表現出對膠質瘤基因型和腫瘤分級的良好預測能力,其中多序列和多臨床參數的影像組學聯合模型進一步提高了對腫瘤IDH等基因突變的預測能力[13]。MRI T2WI序列影像學特征表現為膠質瘤診斷的依據之一[14]。本文提取MRI T2WI序列影像組學特征,構建支持向量機和隨機森林兩種機器學習分類器,預測膠質瘤IDH-1 基因突變和Ki-67 表達水平,預測準確率超過88.0%。這提示MRI T2WI 序列影像組學特征對膠質瘤病理結果具有較高的預測準確率,可為臨床確定腫瘤手術方案、評估膠質瘤預后等提供依據。
值得注意的是,灰度相關矩陣參數中的大依賴高灰度增強特征表示具有較高灰度值的高相關性體素的聯合分布情況,此特征在鑒別IDH-1 基因突變中有特殊意義。此外,IDH-1 組特征值權重絕對值最大的特征為一階特征平均值,這說明腫瘤組織T2WI 序列平均灰度在鑒別IDH-1 基因突變中可能具有較高的價值。這提示對T2WI 序列信號分布均勻的膠質瘤,可以通過T2WI序列灰度預測IDH-1基因突變情況。但是對有鈣化或者囊變的膠質瘤瘤,這種評估就相對比較困難。
Ki-67 組特征值權重絕對值最大的特征為偏度特征,表明體素灰度平均值分布的不對稱性;其次是逆差歸一化特征,表示圖像局部均勻程度。這兩個特征分別從整體和局部描述灰度的不均勻程度。這提示T2WI灰度分布不均勻程度反映Ki-67表達水平的差異。
本文的局限性:①樣本相對較少;②回顧性研究,存在選擇性偏倚;③未根據膠質瘤級別進行亞組分析;④為單序列影像組學分析;⑤由于分類器原理,無法分析各特征值與基因型的具體關系;⑥未對預測結果進行交叉驗證。
總之,本文基于MRI T2WI序列建立支持向量機和隨機森林機器學習分類器預測膠質瘤IDH-1基因突變和Ki-67 表達水平,準確率均超過88.0%,具有良好的應用價值,為膠質瘤術前預測提供了新思路。