戴薇,李華玲,王沛沛,唐媛媛,孫新臣,李金凱(通信作者)
1 南京醫科大學第一附屬醫院放療科 (江蘇南京 210009);2 南京醫科大學特種醫學系(江蘇南京 210009)
據統計,2015年我國結直腸癌發病率在所有惡性腫瘤中位于第三位,病死率位于第五位[1]。目前,放射治療是治療直腸癌患者的重要手段之一,對于可手術切除的Ⅱ、Ⅲ期直腸癌,可以通過術前放射治療來降低其局部復發的概率;術前同步放、化療是局部晚期不可切除直腸癌的首選治療方案[2]。放射治療的目標是在提高腫瘤靶區(gross target volume,GTV)劑量的同時盡量降低周圍正常組織的受照劑量。因此,GTV 和危及器官(organs at risk,OARs)的準確勾畫是精準放射治療量的重要保證。GTV 和OARs 通常由放射治療醫師根據定位CT 圖像進行手動勾畫,勾畫過程耗時費力,且勾畫結果依賴于醫師所掌握的腫瘤學及解剖學相關知識,因而主觀性較強,一致性較差。近年來,有多種自動分割方法應用于GTV 和OARs 的勾畫中,其中包括基于圖譜庫的自動分割方法[3-4]和基于神經網絡的自動分割方法[5-7]。
基于圖譜的自動分割方法是在建立參考圖譜庫后,通過形變配準對目標圖像進行勾畫,其缺點是建立圖譜庫耗時較長,且難以處理個體之間的解剖學差異[8]。目前,臨床應用最多的是基于U-Net 的自動分割方法,該方法屬于卷積神經網絡的一種,其可對較少的數據進行訓練,具備準確性較高且分割速度快的優點[9]。本研究擬通過利用基于U-Net 的自動分割模型對直腸癌GTV 和OARs 進行勾畫,并評估該模型的勾畫準確性及臨床可行性,現報道如下。
回顧性分析2018年1月至2020年10月于醫院接受術前放射治療的70例直腸癌患者的臨床資料,隨機分組,其中52例作為訓練集,6例作為驗證集,12例作為測試集。所有患者在CT 掃描前1 h 排空大、小便,飲800 ml 水后等待40 min 進行掃描;使用西門子Siemens Sensation Open CT 模擬定位系統進行圖像采集,患者體位包括仰臥位和俯臥位,體位固定方式為熱塑膜;掃描層厚及層間距均為5 mm,CT 圖像重建采用的矩陣大小為512×512;采集的CT 圖像通過DICOM 傳至醫師工作站,由同一位放射治療醫師參考磁共振圖像在CT 圖像上勾畫GTV 和OARs(包括左側股骨頭、右側股骨頭、膀胱),并由高年資醫師進行二次確認。
1.2.1 數據預處理
在建立模型之前對圖像進行預處理:將所有的數據重新取樣到(1.0,1.0,None)的體素,然后每次從單層數據中截取(320,320)大小的圖像進入訓練。
1.2.2 網絡模型結構
本研究使用的網絡模型為基于U-Net 的自動分割模型,該模型包含一個搜索路徑及一個擴展路徑。搜索路徑是一個重復的結構,每次重復包含兩個卷積層和一個池化層,卷積層的卷積核大小均為3×3,基礎卷積核通道數為32,每個卷積層的后面都有批量標準化(batch normalization,BN)和線性整流函數ReLU 作為激活函數,兩個卷積層后是一個2×2 Max pooling 層,用于降采樣,每次降采樣后特征通道數增倍;擴展路徑也是一個重復的結構,首先包含一個 2×2 反卷積,用于上采樣,每次上采樣后特征通道數量減半,上采樣后將結果與收縮路徑中對應步驟的特征圖進行拼接,拼接后的圖像連接著兩個3×3卷積層,卷積層后均有BN 和ReLU 激活函數,最后是一個1×1的卷積,其可將所有元素的特征向量映射至一個類標簽。
1.2.3 訓練流程
預處理后,從訓練集中提取GTV 和OARs 結構圖像并制作成標簽圖像;然后對原始圖像進行增強及標準化后輸入神經網絡結構,見圖1;最后采用Dice 損失函數對網絡的預測結果和標簽圖像進行損失計算并反向傳播,訓練流程見圖2。模型建立后,將驗證集用于測試及評估模型的穩定性。本研究在MANTEIA 公司的Acculearning 軟件中進行模型搭建。

圖1 網絡模型結構

圖2 訓練流程
采用戴斯相似系數(Dice similarity coefficient,DSC)及豪斯多夫距離(Hausdorff distance,HD)評估勾畫結果的準確性。
DSC 用于評價自動勾畫與手動勾畫之間輪廓的重疊性[10],其計算公式為:

式中,VA代表自動勾畫的體積,VM代表手動勾畫的體積。DSC 值的大小為0~1,且越接近1表示相似度越高,即自動勾畫的準確性越高。
HD 用于描述兩組點集之間的相似程度,是兩個點集之間距離的一種定義形式,若假設自動勾畫集合A={a1,a2,…,ai},手動勾畫的集合M={m1,m2,…,mj},則其公式可表示為:
H(A,M)=MAX[h(A,M),h(M,A)]
HD 值越小,表示自動勾畫集合和手動勾畫集合的交集越大,自動勾畫的準確性越高。
將測試集的CT 圖像輸入訓練好的自動分割模型中進行GTV 和OARs 的勾畫,待勾畫完成后將數據導入MIM Maestro 軟件,在MIM Maestro 軟件上計算兩種方法的GTV 和OARs 的DSC 值、HD 值。
表1為GTV 和OARs 的勾畫準確性評估參數。圖3為自動勾畫與手動勾畫的比較圖,其中圖3A 為GTV 勾畫的比較圖,圖3B 為OARs 勾畫的比較圖。由表1和圖3可知,自動分割模型在OARs 的勾畫中具有較高的準確性,而在GTV 的識別上還有所欠缺,仍需要進一步提高。

圖3 自動勾畫與手動勾畫的比較圖

表1 勾畫準確性評估參數
近年來,人工智能在各行各業得到了廣泛的應用,其在腫瘤放射治療中也扮演著重要的輔助角色,不僅可減輕放射治療工作者的工作負擔,并且可有效提高工作效率[11]。人工智能在放射治療中應用較多的是GTV 和OARs 的自動勾畫[12-16]、自動計劃設計[17]等。目前,已有關于盆腔腫瘤GTV 和OARs 的自動勾畫的研究。秦楠楠等[7]利用基于U-Net 的自動分割模型研究關于宮頸癌臨床靶區(clinical target volume,CTV)和OARs 的自動分割,結果表明CTV 的平均DSC 值為(0.86±0.040),平均HD 值為(13.9±5.7)mm,膀胱及股骨頭的DSC 值均>0.9,HD 值均不超過8.3 mm。Men 等[18]利用擴展卷積神經網絡訓練用于直腸癌CTV 和OARs 自動分割的模型,其中CTV 的平均DSC 值為0.877,膀胱的平均DSC 值為0.934,左側股骨頭的平均DSC 值為0.921,右側股骨頭的平均DSC 值為0.923。Song 等[19]研究對比了DeepLabv3+及ResUNet 兩個模型對于直腸癌CTV 和OARs 的自動勾畫效果,結果表明,在CTV 的勾畫中,DeepLabv3+的勾畫效果優于ResUNet(DSC值分別為0.88、0.87);在股骨頭的分割中,ResUNet 的分割效果優于DeepLabv3+(DSC 值分別為0.93、0.90)。而本研究所訓練的自動分割模型在OARs 分割中的準確性均不低于上述模型。
直腸癌病灶多為軟組織結構,形態通常具有多樣性及不確定性的特點,而CT 圖像對軟組織的分辨力較差,因此使用CT 圖像對直腸癌的GTV 進行訓練會影響最終的勾畫效果;而使用磁共振圖像作為訓練對象則可提高勾畫的準確性。目前,已有關于使用直腸癌磁共振圖像來訓練自動分割模型的相關研究[20-21]。Wang 等[21]使用磁共振T2加權圖像對自動分割模型進行訓練,其平均DSC 值為(0.74±0.14),平均HD 值為(20.44 ±13.35)mm,其分割準確性優于本研究。本研究的不足之處在于,所訓練的自動分割模型對GTV 的始末層面識別準確性較差及訓練的患者數較少,在后續的工作中將增加訓練患者數并不斷調整訓練參數來提高GTV 勾畫的準確性。
綜上所述,本研究所訓練的基于U-Net 的自動分割模型在直腸癌OARs 的勾畫中具有較高的準確性,但在GTV勾畫中的準確性還有待提高,可將該模型用于輔助臨床工作,以提高放射治療醫師的工作效率。
致謝 MANTEIA 公司謝璐及張煒工程師給予的技術支持。