苗 語(yǔ) 豐振航 楊華民 蔣振剛 師為禮
(長(zhǎng)春理工大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院 吉林 長(zhǎng)春 130022)
目前,肺癌是發(fā)病率和死亡率最高的癌癥之一[1]。由于環(huán)境的日益惡化和吸煙人數(shù)的逐年增加,肺癌患者的數(shù)量不斷增長(zhǎng)。文獻(xiàn)[1]的研究表明,如果能及時(shí)發(fā)現(xiàn)和治療肺癌,那么肺癌患者的5年存活率將提高50%左右。肺癌早期一般表現(xiàn)為結(jié)節(jié),為了防止錯(cuò)過(guò)最佳治療時(shí)間,需要提前進(jìn)行肺結(jié)節(jié)檢測(cè),而肺結(jié)節(jié)分割是肺結(jié)節(jié)檢測(cè)中最重要的步驟。
低劑量胸部電子計(jì)算機(jī)斷層掃描(CT)是目前在肺癌檢查中最常用的方法,但僅靠醫(yī)生進(jìn)行人工檢測(cè),不僅工作量很大,而且會(huì)因假陽(yáng)性等問(wèn)題而容易出錯(cuò),因此對(duì)肺部CT等醫(yī)學(xué)圖片的檢測(cè)和分割是非常熱門(mén)的研究方向[2]。目前,對(duì)醫(yī)學(xué)圖片進(jìn)行分割的傳統(tǒng)方法很多,其中比較經(jīng)典的有支持向量機(jī)[3]、閾值分割法[4]、區(qū)域增長(zhǎng)法[5]、聚類(lèi)問(wèn)題[6]等。John等[7]使用多閾值法提取候選結(jié)節(jié),但其他組織的灰度值與肺結(jié)節(jié)的灰度值范圍重疊,提取的候選結(jié)節(jié)含有肺結(jié)節(jié)小區(qū)域,不利于假陽(yáng)性的去除。Boroczky等[8]將提取了疑似肺結(jié)節(jié)的23個(gè)特征送入SVM分類(lèi)器進(jìn)行訓(xùn)練。但SVM需要人工提取結(jié)節(jié)特征,算法的準(zhǔn)確率很大程度取決于提取方法的選擇。
傳統(tǒng)肺結(jié)節(jié)檢測(cè)方法過(guò)程復(fù)雜,結(jié)果依賴(lài)于各個(gè)階段的運(yùn)行效果,并且不能實(shí)現(xiàn)端到端的檢測(cè)。近年來(lái),深度學(xué)習(xí)的迅猛發(fā)展給肺結(jié)節(jié)分割帶來(lái)了新的可能。卷積神經(jīng)網(wǎng)絡(luò)是一種以端到端的形式識(shí)別特征的網(wǎng)絡(luò),與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比,其優(yōu)勢(shì)在于特征提取不需要人工參與,各層的特征提取都是在通用的學(xué)習(xí)過(guò)程中進(jìn)行。Ronneberger等[9]提出了U-Net網(wǎng)絡(luò)結(jié)構(gòu),極大地促進(jìn)了對(duì)醫(yī)學(xué)圖像分割的研究,并且有了一定應(yīng)用。隨后,利用深度網(wǎng)絡(luò)分割肺結(jié)節(jié)成為當(dāng)前醫(yī)學(xué)圖像處理領(lǐng)域的研究熱點(diǎn)。Hwang等[10]提出了一種多階段訓(xùn)練策略,以更少的模型參數(shù)實(shí)現(xiàn)了更先進(jìn)的分割性能。但該模型在訓(xùn)練集和測(cè)試集的分布發(fā)生變化時(shí),分割結(jié)果可能不穩(wěn)定。Setio等[11]提出了一種基于多視角卷積網(wǎng)絡(luò)的檢測(cè)算法,它對(duì)不同類(lèi)型的肺結(jié)節(jié)設(shè)計(jì)了不同的檢測(cè)器,通過(guò)融合檢測(cè)器生成的不同候選區(qū)域得到候選結(jié)節(jié),提高了檢測(cè)的靈敏度。但該模型需要區(qū)分不同類(lèi)型的肺結(jié)節(jié),對(duì)數(shù)據(jù)集要求較高,且模型所需參數(shù)較多,在實(shí)際應(yīng)用中實(shí)時(shí)性較差。
本文提出了一種改進(jìn)的U-Net網(wǎng)絡(luò),應(yīng)用于肺結(jié)節(jié)檢測(cè)的候選結(jié)節(jié)分割部分。首先在網(wǎng)絡(luò)解碼器部分加入了密度連接模塊,增強(qiáng)了特征的復(fù)用率。然后,將U-Net網(wǎng)絡(luò)與卷積條件隨機(jī)場(chǎng)(ConvCRF)端到端結(jié)合,使分割結(jié)果更好地體現(xiàn)了肺結(jié)節(jié)的邊緣特征。最后,為了緩解了正負(fù)樣本的不平衡問(wèn)題,進(jìn)一步提高分割的準(zhǔn)確度,改進(jìn)了基于focal loss的損失函數(shù)。
肺結(jié)節(jié)分割是肺結(jié)節(jié)檢測(cè)系統(tǒng)的重要步驟之一,目的是在CT圖像的檢測(cè)任務(wù)中提取肺結(jié)節(jié),并保證高敏感度和準(zhǔn)確度。本研究采用改進(jìn)的U-Net分割模型作為結(jié)節(jié)的分割方法,此模型在基本框架U-Net網(wǎng)絡(luò)的基礎(chǔ)上,為防止出現(xiàn)過(guò)擬合的趨勢(shì),在網(wǎng)絡(luò)的編碼部分添加了Batch-Normalization模塊,用Leaky-ReLU代替了ReLU激活函數(shù),使用了dropout策略。其次,為提高結(jié)節(jié)的檢出率和增強(qiáng)結(jié)節(jié)的邊緣特征,對(duì)U-Net模型做了以下幾點(diǎn)改進(jìn)。
DenseNet[12]的特點(diǎn)是可以將圖像特征進(jìn)行多次重復(fù)利用。它以前饋的方式將前面層所獲得的特征圖映射到其他傳遞的后續(xù)層,這種緊湊的結(jié)構(gòu)可以在相同的網(wǎng)絡(luò)深度下,保證了各層之間的信息流最大、較輕梯度消失的問(wèn)題,并對(duì)過(guò)擬合現(xiàn)象有一定抑制作用。圖1為DenseNet的示意圖,主要由Dense Block和Transition layers組成。

圖1 密集連接網(wǎng)絡(luò)
由圖可知,Dense Block的第l層是將前面所有層x0,…,xl-1的特征圖作為輸入,可由式(1)表示。
xl=Hl([x0,x1,…,xl-1])
(1)
式中:Hl(·)表示卷積等非線性轉(zhuǎn)化操作。由此可知,擁有k層網(wǎng)絡(luò)的Dense Block模塊中有k×(k+1)/2個(gè)連接。
本文根據(jù)DenseNet結(jié)構(gòu)特點(diǎn),在傳統(tǒng)U-Net網(wǎng)絡(luò)解碼一側(cè)將淺層特征與深層特征互連。由于淺層特征圖與深層特征圖的面積各不相同,本文通過(guò)不同個(gè)數(shù)的轉(zhuǎn)置卷積將淺層特征進(jìn)行上采樣以適應(yīng)不同尺寸的深層特征圖,結(jié)構(gòu)見(jiàn)圖2。

圖2 密集連接與U-Net結(jié)合
由于卷積神經(jīng)網(wǎng)絡(luò)沒(méi)有充分考慮空間上下文信息,也沒(méi)有考慮到因缺少平滑項(xiàng)而使圖像邊緣模糊的問(wèn)題,所以分割的肺結(jié)節(jié)邊緣比較粗糙,需要對(duì)結(jié)果進(jìn)一步處理。全連接條件隨機(jī)場(chǎng)把分割任務(wù)看作是已知觀測(cè)值求取標(biāo)記值的問(wèn)題,通過(guò)求解最大后驗(yàn)概率來(lái)確定分割結(jié)果,它既考慮了空間信息,也能夠一定程度上解決邊緣模糊和噪聲等問(wèn)題,它的能量函數(shù)為:
(2)
式(2)包含一階和二階勢(shì)函數(shù)兩部分。一階勢(shì)函數(shù)用于衡量當(dāng)像素點(diǎn)i的顏色值為yi時(shí),該像素點(diǎn)屬于類(lèi)別標(biāo)簽xi的概率,本文將U-Net網(wǎng)絡(luò)學(xué)習(xí)得到的肺結(jié)節(jié)概率圖定義為隨機(jī)場(chǎng)模型的一階勢(shì)函數(shù)。二階勢(shì)函數(shù)定義了一系列特征向量的高斯核函數(shù),計(jì)算公式為:
(3)
式中:u(xi,xj)表示兩個(gè)標(biāo)簽之間的一個(gè)兼容性度量。它考慮了相鄰像素的相互作用。肺結(jié)節(jié)分割的目的就是求得最小化能量函數(shù)。
但由于全連接條件隨機(jī)場(chǎng)訓(xùn)練速度慢、模型內(nèi)的參數(shù)學(xué)習(xí)困難等問(wèn)題,其已經(jīng)不能滿足研究的需求。而卷積條件隨機(jī)場(chǎng)(ConvCRF)[13]以條件獨(dú)立性的假設(shè)補(bǔ)充全連接條件隨機(jī)場(chǎng)。假設(shè)兩個(gè)像素i、j的曼哈頓距離為d(i,j)>k,則它們的標(biāo)簽分布是有條件獨(dú)立的,從而可以進(jìn)行高效的GPU計(jì)算和完整的特征學(xué)習(xí),將信息傳遞步驟配置為帶截?cái)喔咚购说木矸e。
一個(gè)形狀為[b,c,h,w]的輸入圖像P,其中b、c、h、w分別表示批大小、類(lèi)別數(shù)量、輸入高度和寬度。對(duì)于由特征向量f1,f2,…,fd定義的高斯核函數(shù)g,圖像的核矩陣為:
(4)
式中:θi是可學(xué)習(xí)的參數(shù)。對(duì)于一組高斯核g1,g2,…,gs,我們定義經(jīng)合并的核矩陣K為:
(5)
所有s個(gè)核的組合信息傳遞的結(jié)果Q如下:

P[b,c,x+dx,y+dy]
(6)
這種信息傳遞操作類(lèi)似于卷積神經(jīng)網(wǎng)絡(luò)中標(biāo)準(zhǔn)的二維卷積,可以將大部分推斷重新表達(dá)為可以在GPU上實(shí)現(xiàn)的卷積操作。通過(guò)反向傳播訓(xùn)練卷積條件隨機(jī)場(chǎng)的所有參數(shù),與全連接隨機(jī)場(chǎng)相比速度得到很大提升。
在肺結(jié)節(jié)分割中,CT圖像中肺結(jié)節(jié)所占的比例會(huì)遠(yuǎn)遠(yuǎn)小于肺部其他區(qū)域。在傳統(tǒng)的樣本分類(lèi)中,將肺結(jié)節(jié)和肺部其他區(qū)域分為正樣本和負(fù)樣本兩類(lèi)。由于負(fù)樣本過(guò)多,會(huì)造成它的loss太大,容易把正樣本的loss遮蓋從而不利于整個(gè)目標(biāo)函數(shù)的收斂。
圖像分割的一種常見(jiàn)的評(píng)價(jià)指標(biāo)是Dice系數(shù),其物理含義為兩個(gè)樣本之間的重疊程度的度量。度量范圍從0到1,Dice系數(shù)為1表示完全重疊。其計(jì)算公式為:
(7)
式中:|A∩B|表示集合A、B之間的共同元素;|A|、|B|表示A、B中的元素的個(gè)數(shù)。為了計(jì)算預(yù)測(cè)的分割圖,Dice系數(shù)被改為soft dice loss,計(jì)算公式如下:
(8)
式中:pi為sigmoid激活后的輸出值,取值介于0和1之間;gi為真實(shí)值,取值為0或1。
Dice損失對(duì)類(lèi)不平衡問(wèn)題會(huì)有比較好的效果,但是其在誤差反向傳播過(guò)程中梯度會(huì)產(chǎn)生大幅震蕩,所以在訓(xùn)練過(guò)程中不穩(wěn)定。而focal loss[14]是在交叉熵?fù)p失函數(shù)基礎(chǔ)上進(jìn)行的修改,不僅穩(wěn)定性好,還加大了前景和背景的過(guò)渡區(qū)等hard negative的損失值,計(jì)算公式如下:
(9)
式中:r是為減少易分類(lèi)樣本的損失,使得更關(guān)注于困難的、錯(cuò)分的樣本;α用來(lái)平衡正負(fù)樣本本身的比例不均。
本文結(jié)合focal loss和Dice損失的特點(diǎn),提出了一種改進(jìn)的focal loss損失,計(jì)算公式如下所示:
Lens=-logLDice+αLfl
(10)
式中:對(duì)數(shù)函數(shù)和α的目的是平衡兩種損失函數(shù)的結(jié)果大小。
LUNA16數(shù)據(jù)集來(lái)源于LIDC/IDRI數(shù)據(jù)集,它從LIDC/IDRI數(shù)據(jù)集中抽取層間度大于2.5 mm的CT圖像,一共獲得了888幅CT圖片,共包含1 186個(gè)肺結(jié)節(jié)。每幅圖像包含了4名有經(jīng)驗(yàn)的放射科專(zhuān)家在LIDC/IDRI數(shù)據(jù)庫(kù)上兩階段的標(biāo)注注釋[15]。圖3所示為數(shù)據(jù)庫(kù)中不同尺寸的肺結(jié)節(jié)圖像。

圖3 不同尺寸的肺結(jié)節(jié)圖像
由于CT原始圖片肺實(shí)質(zhì)部分并不突出,為突出肺實(shí)質(zhì),需要對(duì)圖像做直方圖均衡化處理;隨后因肺實(shí)質(zhì)灰度值與周邊組織差距較大,對(duì)圖像進(jìn)行二值化處理,初步分出肺實(shí)質(zhì);其次使用膨脹和腐蝕兩種數(shù)學(xué)形態(tài)學(xué)方法消除肺實(shí)質(zhì)內(nèi)部噪聲和平滑肺實(shí)質(zhì)邊緣;最后通過(guò)肺實(shí)質(zhì)掩模提取ROI區(qū)域。圖4為數(shù)據(jù)處理流程。圖5為各個(gè)階段處理后的圖像。

圖4 預(yù)處理流程

(a) 原始圖片 (b) 直方圖均衡化 (c) 二值化

(d) 膨脹腐蝕 (e) 生成掩模 (f) ROI區(qū)域圖5 各階段圖像
為了驗(yàn)證模型的準(zhǔn)確性,將數(shù)據(jù)集分成10份,運(yùn)用10折交叉驗(yàn)證法,輪流將其中9份作為訓(xùn)練數(shù)據(jù),1份作為測(cè)試數(shù)據(jù),進(jìn)行實(shí)驗(yàn)。每次實(shí)驗(yàn)都會(huì)得出相應(yīng)的準(zhǔn)確率(或差錯(cuò)率)。10次結(jié)果的準(zhǔn)確率(或差錯(cuò)率)的平均值作為對(duì)算法精度的估計(jì)。模型反向傳播采用的方法是隨機(jī)梯度下降法,學(xué)習(xí)率為0.000 1,每迭代一次衰減0.005,總共運(yùn)行50個(gè)epoch,批量大小為2。圖6所示為模型在訓(xùn)練過(guò)程中的測(cè)試準(zhǔn)確率曲線,經(jīng)過(guò)50個(gè)epoch后準(zhǔn)確率總體趨于穩(wěn)定。所用模型在GPU上使用Python的TensorFlow深度學(xué)習(xí)庫(kù)實(shí)現(xiàn)。

圖6 改進(jìn)的U-Net網(wǎng)絡(luò)的準(zhǔn)確率曲線
為了求取式(9)改進(jìn)的損失函數(shù)中參數(shù)α的最優(yōu)取值,本文進(jìn)行了4個(gè)模型的5組對(duì)比實(shí)驗(yàn),α分別設(shè)置為0.1、025、0.4、0.6、0.75,這5組實(shí)驗(yàn)分別用Dice系數(shù)進(jìn)行比較,得出結(jié)果如表1所示。通過(guò)評(píng)價(jià)指標(biāo)可看出,參數(shù)α在0.25至0.4之間模型表現(xiàn)最佳。

表1 不同參數(shù)下模型的Dice系數(shù)測(cè)試結(jié)果
為了驗(yàn)證在最優(yōu)取值下,改進(jìn)的focal loss損失函數(shù)比傳統(tǒng)的交叉熵?fù)p失函數(shù)更具有優(yōu)勢(shì),本文分析了它們的Dice系數(shù)和敏感度,結(jié)果如表2所示。

表2 不同損失函數(shù)結(jié)果比較
圖7展示了本文算法不同改進(jìn)步驟的肺結(jié)節(jié)分割效果圖,其中:(a)為肺部CT圖片;(b)為提取的肺實(shí)質(zhì)灰度圖;(c)為數(shù)據(jù)集中醫(yī)師標(biāo)注的肺結(jié)節(jié)位置分布圖;(d)為利用標(biāo)準(zhǔn)的U-Net模型進(jìn)行的肺結(jié)節(jié)分割圖;(e)為利用U-Net網(wǎng)絡(luò)和密集連接網(wǎng)絡(luò)相結(jié)合的算法進(jìn)行的肺結(jié)節(jié)分割圖;(f)算法是在E算法的基礎(chǔ)上運(yùn)用了改進(jìn)的focal loss損失函數(shù);(g)是利用本文算法進(jìn)行的肺結(jié)節(jié)分割圖。圖7(d)與圖7(g)在圖上可知,(d)與本文算法相比,因?yàn)檫\(yùn)用的特征相對(duì)較少,所以分割的肺結(jié)節(jié)相對(duì)較暗,干擾因素較為嚴(yán)重;而圖7(e)因?yàn)檎?fù)樣本比例不平衡,導(dǎo)致有較為嚴(yán)重的假陽(yáng)性肺結(jié)節(jié);圖7(f)雖然比前兩列效果好,但分割結(jié)果較粗,而本文算法分割出的肺結(jié)節(jié)含有較多的邊緣信息,更貼近CT圖像中的肺結(jié)節(jié)形狀。綜上所述,隨著對(duì)傳統(tǒng)算法的改進(jìn),得到的肺結(jié)節(jié)圖像更明顯、假陽(yáng)性更少、邊緣特征更顯著等特點(diǎn)。進(jìn)一步說(shuō)明了本文算法在保持較高精度與靈敏度的情況下,能分割出較好的肺結(jié)節(jié)結(jié)果,具有一定的臨床價(jià)值。

圖7 本文算法逐步改進(jìn)的分割對(duì)比圖
為了系統(tǒng)的分析本文算法分割結(jié)果的性能,采用ROC曲線作為衡量標(biāo)準(zhǔn)。如圖8所示,(a)為傳統(tǒng)U-Net網(wǎng)絡(luò)肺結(jié)節(jié)分割結(jié)果的ROC曲線,(b)為本文算法的ROC曲線。由ROC曲線可知,本文算法總體性能較高,假陽(yáng)性低,真陽(yáng)性高,可以更好地分割出肺結(jié)節(jié)。

(a) 傳統(tǒng)U-Net的ROC曲線

(b) 本文算法的ROC曲線圖8 不同算法的ROC曲線對(duì)比圖
最后,為了評(píng)估肺結(jié)節(jié)分割的性能,將本文算法與肺結(jié)節(jié)分割階段相同研究工作的其他算法在LUNA16數(shù)據(jù)集下進(jìn)行評(píng)估對(duì)比。主要分為以下三個(gè)指標(biāo):(1) 準(zhǔn)確性;(2) 敏感性;(3) 每個(gè)CT掃描件中檢測(cè)出的候選結(jié)節(jié)個(gè)數(shù)。性能突出的模型應(yīng)在較低的候選結(jié)節(jié)個(gè)數(shù)下有較高的敏感性。敏感性(S)和準(zhǔn)確性(A)的計(jì)算公式如下:
(11)
(12)
式中:TP是真正類(lèi);TN是真負(fù)類(lèi);FN是假負(fù)類(lèi);FP是假正類(lèi)。對(duì)比結(jié)果如表3所示。

表3 不同算法的分割性能對(duì)比
從表3可知,在使用相同數(shù)據(jù)集的情況下,本文算法在準(zhǔn)確度的指標(biāo)下優(yōu)于其他算法。相比于文獻(xiàn)[18]的算法,本文算法雖然速度較慢,但通過(guò)密集連接等方法的特征重利用,改善了特征漏檢的缺陷,識(shí)別準(zhǔn)確率提高了7%左右;而卷積神經(jīng)網(wǎng)絡(luò)+VGG模型雖然網(wǎng)絡(luò)深度深于本算法,但缺少網(wǎng)絡(luò)結(jié)構(gòu)的trick,所以準(zhǔn)確率也略微低于本算法。在敏感度方面,雖然本文算法的敏感度略低于Ding等的算法,但在每個(gè)CT掃描件檢測(cè)的候選結(jié)節(jié)的數(shù)量低于該算法。在每個(gè)CT掃描件檢測(cè)的候選結(jié)節(jié)的數(shù)量方面,U-Net雖然低于本文算法,但本文算法有較高的敏感度和準(zhǔn)確度,對(duì)下一階段結(jié)節(jié)分類(lèi)和整個(gè)肺結(jié)節(jié)檢測(cè)系統(tǒng)的性能提升都更有優(yōu)勢(shì)。
使用本文提出的肺結(jié)節(jié)分割算法,其表現(xiàn)性能在LUNA16數(shù)據(jù)集上得到驗(yàn)證。本文算法是在U-Net網(wǎng)絡(luò)的基礎(chǔ)上做了改進(jìn)和優(yōu)化。首先,結(jié)合傳統(tǒng)的U-Net和DenseNet的優(yōu)點(diǎn),獲得了高敏感度的檢測(cè)結(jié)果,原因是DenseNet結(jié)構(gòu)本身的特征再利用的性質(zhì),使得它比傳統(tǒng)的U-Net學(xué)習(xí)到更高效的特征;其次,相比于傳統(tǒng)的全連接條件隨機(jī)場(chǎng),本文模型所用的卷積條件隨機(jī)場(chǎng)不僅增強(qiáng)了肺結(jié)節(jié)的邊緣特征,提高了肺結(jié)節(jié)特征的保留度,還更有利于與卷積神經(jīng)網(wǎng)絡(luò)的端到端的結(jié)合,極大地促進(jìn)了模型的運(yùn)行速度,保證了模型的實(shí)時(shí)性。最后,與傳統(tǒng)的交叉熵?fù)p失函數(shù)比,本文改進(jìn)的focal loss損失函數(shù)不僅保留了交叉熵函數(shù)的穩(wěn)定性,還解決了類(lèi)不平衡的問(wèn)題,提高了肺結(jié)節(jié)識(shí)別的準(zhǔn)確性。
實(shí)驗(yàn)中還對(duì)Dropout和batch size兩個(gè)參數(shù)進(jìn)行多次調(diào)整,對(duì)改進(jìn)的模型進(jìn)行優(yōu)化。Dropout的作用是防止網(wǎng)絡(luò)出現(xiàn)過(guò)擬合現(xiàn)象,它通過(guò)隨機(jī)將網(wǎng)絡(luò)隱含層某一部分節(jié)點(diǎn)重置為0,使每一批訓(xùn)練樣本進(jìn)入不同的網(wǎng)絡(luò)結(jié)構(gòu)的方法來(lái)增加網(wǎng)絡(luò)的泛化能力。本文在改進(jìn)的網(wǎng)絡(luò)結(jié)構(gòu)上,多次調(diào)整Dropout的比例,尋找最優(yōu)Dropout值。表4為不同Dropout比例所求得的準(zhǔn)確率趨勢(shì),可以看出,當(dāng)Dropout取值為0.6時(shí),準(zhǔn)確率最高。

表4 Dropout對(duì)訓(xùn)練精度的影響
batch size的選擇決定了訓(xùn)練過(guò)程中梯度下降的方向。取值過(guò)大不僅對(duì)GPU的顯存是一個(gè)考驗(yàn),還容易使梯度無(wú)法修正,而過(guò)小則使梯度難以收斂。因此選擇合適的batch size值對(duì)訓(xùn)練的準(zhǔn)確率至關(guān)重要。本文在同樣的模型下,使Dropout的值固定為0.6,多次改變batch size的大小,由于GPU對(duì)2的冪次的batch size可以發(fā)揮更佳的性能,所以batch size分別取16、32、64、128來(lái)找出最優(yōu)的值。表5是不同batch size值所求得的準(zhǔn)確率趨勢(shì)。由表5可知,最佳的batch size值為32。

表5 batch size對(duì)訓(xùn)練精度的影響
本研究雖然得到了較好的結(jié)果,但也有其局限性。首先,數(shù)據(jù)集中的肺結(jié)節(jié)標(biāo)簽是以中心坐標(biāo)為圓心,一定大小為半徑的類(lèi)圓形,雖然能準(zhǔn)確地定位肺結(jié)節(jié)的位置,但對(duì)于肺結(jié)節(jié)的邊緣特征表現(xiàn)的比較粗糙,對(duì)深度學(xué)習(xí)造成一定影響。其次,在復(fù)雜情況下,直接通過(guò)卷積網(wǎng)絡(luò)定位小結(jié)節(jié)效果不理想。最后,本文算法只用到了結(jié)節(jié)的二維信息,而三維的上下文信息能為網(wǎng)絡(luò)的自主學(xué)習(xí)提供空間維度的信息,對(duì)肺結(jié)節(jié)的準(zhǔn)確識(shí)別十分重要。在以后的研究中將通過(guò)與醫(yī)院影像科洽談合作,獲得不同類(lèi)型的肺結(jié)節(jié)數(shù)據(jù)集和更能精確體現(xiàn)邊緣特征的肺結(jié)節(jié)標(biāo)簽;通過(guò)粗糙集設(shè)計(jì)出一種適應(yīng)更小尺度輸入的卷積網(wǎng)絡(luò)結(jié)構(gòu)來(lái)進(jìn)一步識(shí)別小結(jié)節(jié);最后在分割階段加入三維的圖像信息。通過(guò)這些方法,可能一定程度上對(duì)敏感度和準(zhǔn)確度的提高具有積極意義。
肺結(jié)節(jié)分割對(duì)醫(yī)生的輔助診斷意義重大。本文針對(duì)傳統(tǒng)肺結(jié)節(jié)分割算法中分割敏感度和準(zhǔn)確度低的問(wèn)題提出了基于改進(jìn)的U-Net網(wǎng)絡(luò)的肺結(jié)節(jié)分割算法。實(shí)驗(yàn)結(jié)果表明,在相同的步長(zhǎng)下,在肺結(jié)節(jié)分割上是有效的,并取得不錯(cuò)的分割效果。但本文算法也存在一定的局限性,需要在以后的研究中進(jìn)行改進(jìn)。由于肺結(jié)節(jié)種類(lèi)較多和判斷標(biāo)準(zhǔn)復(fù)雜多樣,本文數(shù)據(jù)集并不能充分體現(xiàn)肺結(jié)節(jié)的多樣性,因此還沒(méi)有應(yīng)用在臨床上進(jìn)行肺結(jié)節(jié)檢測(cè)任務(wù)。隨著技術(shù)的進(jìn)步,計(jì)算機(jī)輔助診斷系統(tǒng)(CAD)將在肺結(jié)節(jié)檢測(cè)中發(fā)揮重要作用。