李 靜,孫靜濤*,王可欣,張耀峰,李世佳,王霄英
(1.唐山市婦幼保健院 放射科,河北 唐山063000;2.首都醫科大學基礎醫學院,北京100069;3.北京賽邁特銳醫學科技有限公司,北京100069;4.北京大學第一醫院 醫學影像科,北京100034)
腦膠質瘤是最常見的中樞神經系統(CNS)原發性腫瘤,占原發性CNS腫瘤的32%,占CNS惡性腫瘤的81%,腦膠質瘤年平均發病率為3.19/10萬[1]。世界衛生組織(WHO)將腦膠質瘤分為低級別膠質細胞瘤( LGGs,I級或Ⅱ級)和高級別膠質細胞瘤(HGGs,Ⅲ級或Ⅳ級)[2],其中30%是LGGs[3-4],盡管預后相對良好,但幾乎所有LGGs最終都會發生惡性轉化發展為HGGs,導致高發病率和高死亡率[5]。腦膠質瘤還可以引起一些并發癥,如顱內壓升高、腦水腫、腦疝和精神疾病等[6]。磁共振成像(MRI)作為一種非侵入式工具,是診斷和監測CNS惡性腫瘤的首選成像方法[7]。常規MRI序列如T1WI、T2WI、T2液體衰減反轉恢復序列(T2Flair)和T1對比增強(T1-CE)是腦膠質瘤檢查的常規方案[8],在這些序列中,T2Flair是評價腦膠質瘤主要成像序列之一,其在浸潤的腫瘤邊緣與正常腦組織間具有最佳對比[9],并可以在非強化狀態下捕捉一些特征,對腫瘤表型系統地量化[10]。
近年來,計算機視覺和深度學習[11]已經應用于醫學成像。圖像分割是圖像處理技術的基本步驟,可以手動、半自動或自動執行。腦膠質瘤的自動分割將使醫生能夠更早地發現腫瘤的生長情況,是準確評估和監測腫瘤反應的必要工具,對診斷、分期、放療計劃、手術方案和治療評估有重要影響[12]。本研究的目標是研究深度學習方法訓練模型在顱腦T2Flair圖像中自動分割腦膠質瘤的可行性,為腦膠質瘤將來的智能診斷做出初步探索。
1.1 一般資料
回顧性納入影像歸檔和通信系統(PACS)中2015年3月至2019年9月經病理證實的腦膠質瘤患者81例,均進行了T2Flair檢查,其中男44例,女37例,年齡7~78歲,平均(48.26±14.66)歲。根據WHO對神經上皮性腫瘤的分類[2],對腫瘤進行了分級,其中24例患者為Ⅱ級(12例少突膠質細胞瘤、4例星形細胞瘤、4例彌漫性星形細胞瘤、1例多形性黃色星形細胞瘤和3例節細胞膠質瘤),31例為Ⅲ級(13例為間變型少突膠質細胞瘤、11例為間變型星形細胞瘤、4例為間變型室管膜瘤和3例為間變型多形性黃色星形細胞瘤),26例為Ⅳ級膠質母細胞瘤(GBM)。患者臨床表現為頭痛、頭暈、言語不利和四肢無力等。納入標準:(1) 經手術病理確診;(2) MRI檢查前未做顱內減壓、化療或者放射治療。排除標準:MRI圖像質量不能滿足評價要求(如運動或其他偽影等)。最終獲得81位患者的T2Flair用于訓練深度學習模型(圖1)。本項目為回顧性研究,獲得了倫理審查委員會批準。

圖1 本實驗模型訓練及臨床場景應用的流程圖
1.2 MRI掃描參數
采用3.0T(飛利浦,荷蘭)MRI成像系統和頭顱8通道正交線圈。T2Flair序列掃描參數:重復時間(TR)=8000~9000 ms,回波時間(TE)=125~140 ms,顯示野(FOV)=230 mm×219 mm,層厚=6 mm,層間距=6 mm,矩陣=232×181。所有MRI圖像數據均來自同一臺MRI機。
1.3 數據標注
將T2Flair圖像導入數據管理平臺,由DICOM格式轉換為Nifty格式。由一位影像醫生(閱片經驗9年)使用ITK-SNAP軟件(Version 3.6.0,http://www.itksnap.org/)逐層標注T2Flair圖像上的腦膠質瘤。由另一名具有15年閱片經驗的影像專家進行審核。以手工標注的標簽作為評價模型分割性能的評價標準(圖2)。

圖2 標注腦膠質瘤區域
1.3.1模型訓練 訓練過程在GPU NVIDIA Tesla P100 16G上進行,軟件環境包括Python3.6、Pytorch0.4、Opencv、Numpy 和Simple ITK。使用3D U-Net深度學習網絡訓練腦膠質瘤分割模型,使用Adam作為訓練優化器。
將81例數據按照8∶1∶1的比例隨機分為訓練集(n=63)、調優集(n=9)和測試集(n=9)。模型訓練時每批次輸入數據量(batch size)設定為10,學習率(learning rate)為0.0001,模型迭代次數為300個周期(epoch)。
1.3.2模型評價 以Dice相似系數(DSC)對測試集數據的分割性能進行定量評估。基于體素自動計算腦膠質瘤手工標注體積和模型預測體積,將兩者進行比較,絕對誤差率計算方法為:(手工標注體積-模型預測體積)/手工標注體積的絕對值。
1.4 統計分析
應用SPSS 23.0軟件進行統計學分析。應用Kolmogorov Smirnov法進行正態性檢驗,符合正態分布的計量資料以均數±標準差表示,不符合正態分布的連續變量以中位數表示。應用卡方檢驗比較訓練集,調優集和測試集之間的性別組成,方差分析用于比較各數據集之間的年齡差異。P<0.05為差異有統計學意義。
2.1 數據分布
訓練集、調優集及測試集之間的患者年齡(均符合正態分布)和性別的差異無統計學意義(F=0.85,P=0.43和χ2=0.40,P=0.82),見表1。

表1 患者臨床特征及分布
2.2 模型分割性能
測試集中模型預測的DSC值為0.74~0.94,中位數為0.88(0.84,0.90)。醫生標注腦膠質瘤的體積為32.7~168.1 cm3,中位數為146.0(91.7,162.0) cm3,模型預測腦膠質瘤體積為35.8~170.9 cm3,中位數為113.0(93.7,134.0) cm3,其絕對誤差率為0.00~0.23,中位數為0.16(0.07,0.19)(圖3)。

圖3 模型分割腦膠質瘤的結果
主觀評價可見腫瘤主要區域均可被預測,分割效果基本滿意。但部分腫瘤邊緣稍有不一致,表現為:模型對病灶周圍高信號水腫帶基本可以識別,對于水腫帶邊緣識別欠佳(圖3a);對于病灶內囊變壞死區識別欠佳(圖3b)。
在MRI圖像上準確地進行腫瘤分割是通過計算方法了解腫瘤生物學的第一步[13]。腦膠質瘤由于腦組織結構復雜、病灶位置、形狀、大小各異、信號強度不均勻,直接從MRI圖像中分割腦膠質瘤是具有挑戰性的任務,并且相鄰骨骼、血管或模糊的邊緣也大大增加了分割的難度,人工分割病灶耗時耗力,并且受到很多主觀因素的影響。基于計算機輔助的自動分割為腦膠質瘤的診斷、治療及效果評估提供了一個穩定的解決方案,是減少準確檢測、定位和描繪腫瘤區域所需時間的有效工具。BI等[14]認為人工智能可以將腦腫瘤的術前分類細化到專家的水平之上。
傳統圖像分割技術包括:閾值分割、基于邊緣、區域的分割和模糊聚類法等,而以深度學習為代表的腦腫瘤圖像分割法現已成為主流的全自動分割方法。卷積神經網絡(CNN)是一種強有力的圖像識別和預測方法,在所有的深度學習方法和技術中,2D和3D CNN在圖像分割、分類和患者生存時間的預測方面都有很好的表現[15]。本研究中采用3D U-Net深度學習模型,測試集中模型預測的DSC值為0.74~0.94,中位數為0.88(0.84,0.90),與國內外研究結果相似[16-17],主觀評價分割結果也基本滿意。本研究中醫生標注腦膠質瘤的體積為32.7~168.1 cm3,中位數為146.0(91.7,162.0) cm3,模型預測腦膠質瘤體積為35.8~170.9 cm3,中位數為113.0(93.7,134.0) cm3,其誤差率為0.00~0.23,中位數為0.16(0.07,0.19)。模型預測對腫瘤的實體部分標注準確,與醫生標注的差異主要在于水腫的邊緣、水樣信號的囊變壞死區、跨中線結構非主病灶的一側以及被病灶包繞的血管的識別上。多項深度學習的研究結果表明,在模型預測準確的基礎上,AI模型對病灶分割后體積測量的準確性很高[18-19]。模型測量結果自動填寫入結構化報告中,不僅能提高工作效率,而且可以提高測量的一致性,對腫瘤負荷評估和治療后隨訪提供有益的幫助。
本研究的局限性:回顧性研究且相對較小的數據集,今后收集較大的樣本量使得性能提高;本研究中只分割整體腫瘤,今后研究中可以分割不同的腫瘤組織,如增強圖像上腫瘤的強化區域和非強化區域、水腫和壞死等;本研究只針對T2Flair一個序列進行腦膠質瘤的分割,今后應進行多模態MRI序列的分割,并將U-Net的全自動分割用于1 mm層厚的eT1W-3D-TFE-ref序列圖像,對腦膠質瘤進行更精準的分割。
總之,本研究基于3D U-Net訓練的腦膠質瘤病灶分割模型具有較高的性能,同時也可為后續腦膠質瘤全自動檢出奠定基礎。