李華玲,王沛沛,李金凱,李彩虹,昌志剛,顧宵寰,孫新臣,曹遠(yuǎn)東
1.南京醫(yī)科大學(xué)特種醫(yī)學(xué)系,江蘇南京210009;2.南京醫(yī)科大學(xué)第一附屬醫(yī)院放療科,江蘇南京210009
近年來(lái)隨著腫瘤放療的快速發(fā)展,接受腫瘤放療的人數(shù)逐漸上升。據(jù)估計(jì),美國(guó)每年有470 000 名患者接受放療[1]。在腫瘤放療的整個(gè)過(guò)程中,危及器官(Organs‐at‐Risk, OAR)的準(zhǔn)確勾畫(huà)是一個(gè)非常關(guān)鍵的環(huán)節(jié)[2‐3]。而醫(yī)生手動(dòng)勾畫(huà)OAR 是一個(gè)十分耗時(shí)的過(guò)程,每一個(gè)患者都有數(shù)百?gòu)圕T 圖像,而醫(yī)生需要對(duì)相關(guān)的CT圖像進(jìn)行逐張勾畫(huà)。Walker等[4]和Teguh 等[5]經(jīng)過(guò)研究發(fā)現(xiàn)與手動(dòng)勾畫(huà)OAR 相比,自動(dòng)勾畫(huà)可節(jié)省大量的時(shí)間。手動(dòng)勾畫(huà)OAR一般需要數(shù)小時(shí)而自動(dòng)勾畫(huà)則僅需數(shù)分鐘乃至數(shù)秒即可完成。近年來(lái),多種OAR自動(dòng)勾畫(huà)技術(shù)被相繼開(kāi)發(fā),其中包括基于圖譜的自動(dòng)勾畫(huà)技術(shù)[6‐7]、基于機(jī)器學(xué)習(xí)的自動(dòng)勾畫(huà)技術(shù)[8]和基于神經(jīng)網(wǎng)絡(luò)的自動(dòng)勾畫(huà)技術(shù)[9‐10]。在自動(dòng)勾畫(huà)技術(shù)提出的同時(shí),自動(dòng)勾畫(huà)技術(shù)的準(zhǔn)確度也隨之得到了重視,并且逐漸成為學(xué)者們的研究熱點(diǎn)。已有不少學(xué)者對(duì)各種自動(dòng)勾畫(huà)技術(shù)的準(zhǔn)確性進(jìn)行了評(píng)估[11‐14]。目前用于評(píng)估自動(dòng)勾畫(huà)技術(shù)的常用方法有豪斯多夫距離(Hausdorff Distance, HD)和體積重疊方法。本研究主要目的是評(píng)估基于人工智能(Artificial Intelligence,AI)的自動(dòng)勾畫(huà)軟件的準(zhǔn)確度,并研究自動(dòng)勾畫(huà)的幾何準(zhǔn)確性是否受OAR 體積大小的影響。
選取來(lái)自南京醫(yī)科大學(xué)第一附屬醫(yī)院放療科2018年1月至11月的161例患者,其中頭頸部腫瘤40例、胸部腫瘤40例、腹部腫瘤41例、盆腔腫瘤40例。所有病例均使用CT 模擬定位機(jī)(德國(guó)Siemens)進(jìn)行掃描,并將CT 圖像通過(guò)DICOM 傳至自動(dòng)勾畫(huà)軟件工作站和醫(yī)生工作站。使用經(jīng)訓(xùn)練的AccuContour自動(dòng)勾畫(huà)軟件與手動(dòng)勾畫(huà)方法對(duì)晶體、視神經(jīng)、眼球、垂體、腦干、腮腺、下頜骨、肺部、心臟、腎臟、肝臟、直腸、膀胱、股骨頭等部位進(jìn)行勾畫(huà)。通過(guò)MIM Maestro 軟件計(jì)算獲得戴斯相似系數(shù)(Dice Similarity Coefficient,DSC)、Jaccard系數(shù)、HD及體積等參數(shù)。
AccuContour 自動(dòng)勾畫(huà)軟件是由Manteia(中國(guó))公司開(kāi)發(fā)的一種基于深度學(xué)習(xí)的自動(dòng)勾畫(huà)軟件。通過(guò)建立圖像分割模型,并以多種網(wǎng)絡(luò)結(jié)構(gòu)模型、多種loss 結(jié)構(gòu)融合進(jìn)行訓(xùn)練,進(jìn)而對(duì)大量的數(shù)據(jù)進(jìn)行學(xué)習(xí),從而實(shí)現(xiàn)對(duì)目標(biāo)圖像的自動(dòng)分割和輪廓勾畫(huà)。
有經(jīng)驗(yàn)的多位醫(yī)師在Elekta MONACO‐SimⅤ5.1 工作平臺(tái)上對(duì)頭頸部、胸部、腹部及盆腔腫瘤的OAR 在CT 圖像進(jìn)行手動(dòng)勾畫(huà),其中每個(gè)部位均由同一位醫(yī)師進(jìn)行勾畫(huà)。所勾畫(huà)的OAR 包括晶體、視神經(jīng)、眼球、垂體、腦干、腮腺、下頜骨、雙肺、心臟、雙腎、肝臟、直腸、膀胱、股骨頭等部位。勾畫(huà)時(shí)均參考RTOG OAR 勾畫(huà)指南,所涉及的OAR 勾畫(huà)范圍均一致。
目前用于評(píng)估自動(dòng)勾畫(huà)技術(shù)的常用評(píng)估方法有HD 和體積重疊方法,而目前流行的重疊方法有DSC及Jaccard系數(shù)[15]。
(1)DSC 用于評(píng)價(jià)自動(dòng)勾畫(huà)和手動(dòng)勾畫(huà)之間的體積重疊性[5,16],其計(jì)算公式為:

其中,Va代表自動(dòng)勾畫(huà)輪廓的體積,Vm代表手動(dòng)勾畫(huà)輪廓的體積。DSC ∈[0,1],數(shù)值越高代表勾畫(huà)效果越好,0代表兩者沒(méi)有任何交集,1代表兩者完全重合。
(2)HD 是用于描述兩組點(diǎn)集之間相似程度,是兩個(gè)點(diǎn)集之間距離的一種定義形式,是一個(gè)點(diǎn)集中的點(diǎn)到另一個(gè)點(diǎn)集的最短距離的最大值。假如自動(dòng)勾畫(huà)的集合A={a1,a2,…,ai},手動(dòng)勾畫(huà)的集合M={m1,m2,…,mj},則兩集合的HD為:

H(A,M)越小,表示自動(dòng)勾畫(huà)集合和手動(dòng)勾畫(huà)集合的最短距離的最大值越小,兩個(gè)集合的交集越大,自動(dòng)分割越準(zhǔn)確。
(3)Jaccard 系數(shù)用于比較手動(dòng)勾畫(huà)和自動(dòng)勾畫(huà)二者之間的相似性與差異性,為自動(dòng)勾畫(huà)集合A和手動(dòng)勾畫(huà)集合M交集的大小與二者并集大小的比值,其公式可表示為:

Jaccard 系數(shù)值越大,表明自動(dòng)勾畫(huà)與手動(dòng)勾畫(huà)相似性度越高。
使用SPSS 23 軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)分析。總體的DSC、HD、Jaccard 系數(shù)為偏態(tài)分布,用中位數(shù)及四分位間距表示;各部位的DSC、HD、Jaccard 系數(shù)則用均數(shù)±標(biāo)準(zhǔn)差表示。對(duì)總體及各個(gè)部位的DSC、HD、Jaccard 系數(shù)與體積進(jìn)行Spearman 相關(guān)分析;對(duì)晶體、視神經(jīng)、眼球、雙肺、雙腎等成對(duì)OAR 的DSC、HD、Jaccard 系數(shù)進(jìn)行Wilcoxon 配對(duì)秩檢驗(yàn);對(duì)雙肺的體積進(jìn)行Wilcoxon 配對(duì)秩檢驗(yàn)。檢驗(yàn)水準(zhǔn)為0.05,P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
總體的DSC 中位數(shù)為0.896,四分位數(shù)間距為0.125;總體的HD 的中位數(shù)為5.754 mm,四分位數(shù)間距為8.380 mm;總體的Jaccard系數(shù)的中位數(shù)為0.813,四分位數(shù)間距為0.193,具體分布情況如圖1所示。

圖1 DSC、Jaccard系數(shù)、HD的分布情況Fig.1 Distribution of Dice similarity coefficient(DSC),Jaccard coefficient,Hausdorff distance(HD)
圖2為自動(dòng)勾畫(huà)與手動(dòng)勾畫(huà)的比較,從圖中可以看出兩者重合性較好,但是可以看到在肝臟的自動(dòng)勾畫(huà)中,自動(dòng)勾畫(huà)軟件將積液誤認(rèn)為肝臟組織(圖2c),自動(dòng)勾畫(huà)算法在感興趣區(qū)消失層面效果有待提高。
各個(gè)部位的DSC 均數(shù)均大于0.7,其中晶體、視神經(jīng)、垂體的DSC 均數(shù)為0.7~0.8,其他部位均大于0.8。頭頸部的HD 均數(shù)均小于8 mm,胸部均小于22 mm,肝臟為34.563 mm,腹部其他OAR 均小于19 mm,盆腔均小于16 mm。頭頸部的Jaccard系數(shù)均數(shù)為0.557~0.880,其中最低的為右視神經(jīng),最高的為下頜骨,具體數(shù)值詳見(jiàn)表1。總體的DSCall、HDall、Jaccardall系數(shù)與體積具有正相關(guān)性;其中,相關(guān)系數(shù)均大于0.7(rDSC=0.757,rJaccard=0.775,rHD=0.761;PDSC=0.000,PHD=0.000,PJaccard=0.000)。晶體、視神經(jīng)、眼球、垂體、腦干、腮腺、下頜骨、雙肺、膀胱、股骨頭等部位的DSC、Jaccard 系數(shù)與其體積具有相關(guān)性,其他部位則暫不能認(rèn)為有相關(guān)性,如表2所示。尚不能認(rèn)為各個(gè)部位的HD與體積有相關(guān)性。
雙肺之間的DSC、Jaccard 系數(shù)差異具有統(tǒng)計(jì)學(xué)意義(PDSC=0.000,PJaccard=0.000),且雙肺之間的體積差異也具有統(tǒng)計(jì)學(xué)意義(P=0.000)。左右晶體、左右視神經(jīng)、左右眼球、左右腮腺、左右顳頜關(guān)節(jié)、雙腎、左右股骨頭等部位的DSC、Jaccard 系數(shù)差異則不具有統(tǒng)計(jì)學(xué)意義,詳見(jiàn)表3。
AccuContour 自動(dòng)勾畫(huà)軟件是基于深度學(xué)習(xí)的自動(dòng)勾畫(huà)軟件,本研究顯示各個(gè)部分的DSC 均數(shù)均大于0.7,其中體積較大的部位的DSC 可達(dá)到0.9 以上,如雙肺、心臟。有學(xué)者認(rèn)為DSC>0.7 則可認(rèn)為自動(dòng)勾畫(huà)和手動(dòng)勾畫(huà)重疊性良好[17‐18]。頭頸部的Jaccard 系數(shù)均數(shù)為0.557~0.880,其中最低的為右視神經(jīng),最高的為下頜骨。頭頸部、胸部、盆腔的HD 均數(shù)分別小于8、22、16 mm;肝臟的HD均數(shù)為34.563 mm;腹部其他部位均小于19 mm。 由此可看出AccuContour 自動(dòng)勾畫(huà)軟件的總體勾畫(huà)結(jié)果良好。但是經(jīng)過(guò)分析對(duì)比發(fā)現(xiàn),自動(dòng)勾畫(huà)系統(tǒng)在頭頸部小體積器官、腹部及盆腔OAR的勾畫(huà)效果還有所欠缺,對(duì)于小體積的OAR,因?yàn)槠鋬H在幾個(gè)CT 層面出現(xiàn),所以勾畫(huà)效果偏差較大。針對(duì)這個(gè)問(wèn)題,已有學(xué)者研究針對(duì)于小體積OAR 自動(dòng)勾畫(huà)的方法。例如Zhao 等[19]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的自動(dòng)勾畫(huà)方法用于小體積器官的勾畫(huà)。對(duì)于腹部及盆腔的OAR的自動(dòng)勾畫(huà),在某些情況下,自動(dòng)勾畫(huà)系統(tǒng)會(huì)把其它組織誤認(rèn)為當(dāng)前所勾畫(huà)的OAR。例如在肝臟的自動(dòng)勾畫(huà)中,自動(dòng)勾畫(huà)系統(tǒng)會(huì)將積液誤認(rèn)為是肝組織,其可能受到兩個(gè)因素的影響:(1)腹腔、盆腔病變的電子密度及CT 值與周?chē)=M織相近;(2)呼吸運(yùn)動(dòng)及腸道蠕動(dòng)使得腹部及盆腔中OAR的位置相對(duì)不固定,說(shuō)明自動(dòng)勾畫(huà)算法在感興趣區(qū)消失層面效果還是有所欠缺。

圖2 自動(dòng)勾畫(huà)與手動(dòng)勾畫(huà)的對(duì)比Fig.2 Comparison between automatic segmentations and manual segmentations
除了評(píng)價(jià)自動(dòng)勾畫(huà)系統(tǒng)的準(zhǔn)確性,本研究還探討了自動(dòng)勾畫(huà)的幾何準(zhǔn)確性是否受體積大小的影響。從結(jié)果顯示體積大小對(duì)自動(dòng)勾畫(huà)的幾何準(zhǔn)確性存在一定的影響,但是所研究的OAR自動(dòng)勾畫(huà)中,仍有部分的OAR體積大小對(duì)自動(dòng)勾畫(huà)的幾何準(zhǔn)確性的影響不具有統(tǒng)計(jì)學(xué)意義,例如直腸、肝臟等。這說(shuō)明還有其他因素影響自動(dòng)勾畫(huà)的幾何準(zhǔn)確性,例如感興趣區(qū)消失層面的識(shí)別、對(duì)電子密度相近器官的識(shí)別及區(qū)分等。
本研究也存在一定的局限性,主要是OAR 勾畫(huà)的誤差。具體分析,誤差主要來(lái)源于3 個(gè)方面:(1)RTOG 勾畫(huà)指南理解偏差,即醫(yī)師對(duì)OAR 勾畫(huà)范圍邊界的理解不一致,這受到醫(yī)生解剖學(xué)知識(shí)掌握情況的影響;(2)人為實(shí)踐操作的差異,即同一名醫(yī)師在不同時(shí)間或地點(diǎn)勾畫(huà)同一病例OAR 之間的偏差;(3)圖像質(zhì)量的影響,本研究所使用的圖像皆為CT圖像,在CT 圖像上某些解剖結(jié)構(gòu)難以清楚識(shí)別。有學(xué)者發(fā)現(xiàn)影響自動(dòng)勾畫(huà)效果的不僅包括幾何準(zhǔn)確性還包括劑量學(xué)上的準(zhǔn)確性[11]。可進(jìn)一步研究體積對(duì)自動(dòng)勾畫(huà)的劑量準(zhǔn)確是否有影響。

表2 DSC與Jaccard系數(shù)與體積的相關(guān)性分析Tab.2 Correlations between volume and DSC or Jaccard coefficient

表3 DSC、HD及Jaccard系數(shù)之間的Wilcoxon配對(duì)秩檢驗(yàn)Tab.3 Wilcoxon pairing rank test on DSC,HD and Jaccard coefficient
中國(guó)醫(yī)學(xué)物理學(xué)雜志2020年7期