劉文,亓文霞,仲國強,王佳佳,王大寒
(1.中國海洋大學 信息科學與工程學部,山東 青島 266100;2.德州市人民醫院 腫瘤科,山東 德州 253000;3.廈門理工學院 計算機與信息工程學院,福建 廈門 361024)
我國是世界上食管癌病死率較高的國家,其發病率在各類腫瘤中居第3位,病死率居第4位[1-2]。食管癌在我國不同地區的發病率有明顯差異,受某些誘導因素的影響,有高發病率地區和低發病率地區。因此,對高發病區域進行食管癌腫瘤的篩查診斷是非常有效的防控手段[3]。
食管癌的診治是醫生借助電子計算機斷層掃描(CT)、核磁共振成像(MRI)等技術對生成的醫學影像進行分析。由于人工閱片的工作量非常龐大,因此醫生可能會因長時間閱片產生疲勞感,影響對病灶的判斷,增大漏診、誤診的風險。此外,疾病的檢出率很大程度上依賴于影像科醫生的主觀經驗,易受本人生理、心理等狀態的影響,存在一定的診斷偏差,從而影響診斷結果的準確性[4-6]。因此,根據食管癌醫學影像進行腫瘤檢測和準確分割,是進行病灶切除手術的前提,同時深度學習自動化處理方式也對輔助醫生診斷治療有重要意義。
近年來,基于深度學習的醫學影像分析在醫療領域取得了一定的成果,在自動識別可疑病灶、對病灶進行量化診斷等方面取得新進展[6]。但是,受數據集大小以及數據標注準確性等因素的影響,現有研究往往將肺癌、乳腺癌等常見癌癥作為檢測目標。然而,采用深度學習診斷腫瘤的方式并不具有跨病種的泛化能力,即對某一疾病診斷效果好的深度學習網絡通常不適用于其他疾病。因此,研究人員嘗試對傳統腫瘤檢測網絡進行改進,以適用于診斷新的疾病。
本文設計基于U-Net 的圖像分割網絡,以精準分割食管癌腫瘤。通過構建Conv_concat 模塊,并引入2 個跳躍連接,增強圖像特征信息的傳遞性,在Conv_concat 模塊的每一個卷積層后都增加批量歸一化(Batch Normalization,BN)層[7],提升網絡訓練穩定性。在此基礎上,結合BCEWithLogits 和Dice損失函數的優點,改進網絡的損失函數,從而提高訓練效率和分割準確率。
圖像分割技術是能夠精確地把腫瘤從影像中分割出。早期,醫學圖像分割方法主要有基于邊緣的圖像分割[8]、基于區域的圖像分割等[9]。之后,研究人員提出基于圖論的圖像分割方法,將目標圖像映射為帶權的無向圖,進而把圖像分割問題轉換為圖的最小割(MIN-CUT)問題,因此只需保證子圖間的相似度最小,而內部的相似度最大即可[10-12]。
為了對存在不確定性或模糊性的圖像進行準確分割,研究人員將機器學習中的聚類方法應用于圖像分割問題,產生了一系列基于像素聚類的分割算法,例如,k 均值聚類算法[13]、譜聚類[14]、均值漂移[15]以及用于超像素聚類的簡單線性迭代聚類算法[16]等。這種特征空間聚類法在一定程度上滿足了研究人員對圖像分割的需求。文獻[17]提出一種基于k均值聚類的圖像分割算法,并進行腦部核磁共振圖像的分割,能較準確地分割出腦部核磁共振成像中的灰質和白質,噪聲和灰度不均勻的圖像上也能在較短的時間內得到更準確的結果。文獻[18]提出使用核函數將原始數據從低維空間映射到高維空間,并在高維空間中利用圖割理論對CT 圖像的肝區腫瘤進行分割,提取疑似腫瘤區域,以解決傳統圖割模型依賴人機交互且對復雜區域建模困難等問題。但是,對于圖像內部結構復雜的物體,僅通過圖像像素點的顏色、亮度、紋理等低層次的視覺特征進行圖像分割,實際效果往往與預期相差較大。
為了解決這個問題,研究人員結合圖像中的高層語義信息,使用語義分割來輔助圖像分割。為實現圖像像素級別的分割,研究人員對圖像的每個像素進行分類,使得每個像素都具有高階的語義信息,從而提高分割的準確率。LONG[19]等提出全卷積網絡(FCN),將目標識別網絡中的全連接層替換成卷積層和池化層,從而把分類網絡轉換成能夠進行圖像分割的全卷積網絡,不僅實現了像素級的稠密估計目的,而且能夠進行端到端的網絡訓練。TONG[20]提出一種新的分割模型,將形狀表示模型集成到FCN 中以提升CT 圖像器官分割的精度,但是FCN 本身具有一定的局限性,例如感受野太小,無法獲取全局信息,導致網絡學習性能受到限制。
針對這些問題,研究人員在FCN 編碼解碼結構的基礎上,對其局限性做了相應的改進。RONNEBERGER[21]等提出U-Net 網絡架構對醫學圖像進行分割,該網絡把編碼解碼2 個過程設計為1 個對稱的U 型結構,并在不同層之間增加跳躍連接[22]操作,實現了高維特征與低維特征的融合,使得像素定位更加準確,分割精度更高。BROSCH[23]等在U-Net 網絡下采樣的第一層和上采樣的最后一層之間加入跳躍連接操作,在一定程度上提高了分割精度,在分割腦部MRI 中的腦白質病灶中取得了較優的效果。文獻[24]使用內卷U-Net 對肺部CT 數據進行分割。內卷U-Net 使用內卷積代替傳統的卷積操作,同時該方法使用注意力機制學習圖像長范圍的依賴關系,以提高圖像分割精度。文獻[25]針對食管癌的X 射線,通過U-Net 結合圖像插值算法處理U-Net 分割輪廓圖小部分不連續的問題。
深度圖像分割網絡一般都是在FCN 的編碼解碼結構基礎上構建的。針對在FCN 的池化和上采樣過程中信息丟失的問題,CHEN 等在DeepLab 系列[26-28]網絡中使用空洞卷積,并提出ASPP(Atrous Spatial Pyramid Pooling)模塊,使其在不增加參數量的前提下擴大特征圖的視野,增強對感受野和分辨率的控制,有利于提取全局信息,提高分割準確率。LIU等[29]基于池化的全局特征,利用ParseNet實現全局特征與局部特征融合的圖像分割,從而提高分割精度。BADRINARAYANAN等[30]提出SegNet 網絡,通過引入池化層索引來提高分割精度。SegNet 和FCN 的原理相似,不同之處在于解碼器使用從編碼器傳輸的對應位置最大池化層,對其輸入進行非線性上采樣,從而使得上采樣不需要學習即可生成稀疏特征映射,通過可訓練的卷積核進行卷積操作,以生成密集的特征圖,最后使用Softmax 進行像素級別分類。ROMER等[31]提出輕量級的語義分割網絡ERFNet,ERFNet 一方面使用了1×1 的卷積核減少網絡計算參數量,從而加快網絡速度,另一方面采用與ResNet[32]主干網絡相同的殘差連接方式提升模型精度。
在醫學圖像分割領域中,U-Net 網絡具有較高的訓練效率以及能夠適用少量訓練樣本的特征,備受研究人員的關注。U-Net 的設計主要針對醫學影像的分割,其網絡結構與FCN 類似。在FCN 編碼解碼結構的基礎上,U-Net 網絡將原來的直線型網絡結構變成了一個對稱的U 型結構,只需要較小的數據集就可以完成精準的圖像分割。在U-Net 網絡中還增加跳躍連接結構,實現了圖像的低層信息與高層信息在特征提取過程中的融合,從而提高分割精度。U-Net 包括編碼結構、解碼結構和跳躍連接結構。
U-Net 的編碼結構實現了圖像特征的提取,該結構由2 種操作重復疊加組成:1)卷積操作,由2 個連續的卷積塊構成,每個卷積層的后面都要經過修正線性單元ReLU[33]激活層,用于提高網絡訓練的穩定性;2)最大池化操作,能夠降低空間分辨率,提取抽象的高維特征,以提升網絡的魯棒性。U-Net 的解碼結構與編碼結構相對應,也包含卷積操作和上采樣操作,采用ConvTranspose[23]方法進行上采樣,通過2×2 的反卷積逐步恢復圖像的分辨率,最終輸出分割結果的熱力圖。
U-Net 通過在編碼與解碼之間增加跳躍連接,對FCN 進行改進,將編碼結構每一層產生的特征圖融合到解碼結構對應層的上采樣過程中,實現低層信息與高層信息的融合。在融合過程中,編碼結構的卷積操作會導致邊界像素丟失。因此,U-Net 融合2 個特征圖的大小并不相同,對編碼結構的特征圖進行裁剪,再進行拼接。由于每次融合前都要先進行裁剪,因此最后輸出圖像的大小比原圖小很多。但是由于增加了跳躍連接操作,因此圖像的分割精度得到顯著提高。
本文以U-Net 網絡作為基礎網絡,通過改進卷積塊、損失函數,加入早停機制等方法構建適用于食管癌腫瘤分割的Concat-UNet 網絡。
與U-Net 網絡類似,Concat-UNet 網絡也包含編碼、解碼和跳躍連接3 種主要結構。Concat-UNet 網絡結構如圖1 所示。編碼結構包含Conv_concat 模塊和最大池化層,Conv_concat 可以有效融合特征,最大池化層通過保留有效特征,丟棄不明顯的特征來實現下采樣。解碼結構包含Conv_concat 模塊和上采樣,使用與U-Net 相同的上采樣方法恢復圖片的分辨率,彌補在池化過程中丟失的細節信息,1×1卷積會根據分類需求對圖片中的像素進行分類,以得到最終的結果。

圖1 Concat-UNet 的網絡結構Fig.1 Structure of Concat-UNet network
Concat-UNet 通過改進U-Net 的卷積塊,構建新的Conv_concat 模塊。改進后的卷積Conv_concat 模塊結構如圖2 所示。U-Net 網絡中的卷積塊結構如圖3 所示。

圖2 改進的Conv_concat 模塊結構Fig.2 Structure of improved Conv_concat module

圖3 U-Net 網絡中的卷積塊結構Fig.3 Structure of convolution block in U-Net network
從圖2 和圖3 可以看出,相較于原始U-Net 網絡的卷積塊,Conv_concat 模塊做了2 個方面的改進:1)將每次卷積產生的特征圖與最初輸入Conv_concat模塊的特征圖進行融合,并將融合結果作為下一次卷積的輸入,這種改進方法增強了特征的傳遞性,在訓練過程減少圖像特征損失,從而提高分割精度,但是卷積操作會損失圖像邊緣信息,導致卷積前后圖像大小不一致,因此為了使Conv_concat 模塊中卷積前后的特征圖相融合,在卷積前先對特征圖進行邊緣填充,以保證卷積前后特征圖分辨率的一致性,從而解決U-Net 最終輸出圖片比原圖片小的問題;2)Conv_concat 模塊在每一個卷積層后面都增加了一個批量歸一化層,BN 的主要作用是把每批次中的數據正態化,從而減少網絡對初始化參數的依賴。對于任意輸入的X=[x1,x2,…,xn],經過BN 層后會得到歸一化的XBN=[y1,y2,…,yn],其中,xi為X中的原始數據,yi為X中經過BN 層歸一化后的數據,n為訓練X中的圖像數量。
為了避免網絡優化受特征分布的影響,網絡還需要對正態化后的數據x*進行反變換,即通過偏移以及尺度縮放將其變回原始的分布狀態。反變換如式(1)所示:

其中:γi為方差;βi為均值。γi和βi都是可學習的參數。
為提高網絡的泛化能力,本文引入早停機制,通過找出并保存訓練過程中最優的網絡參數,無需反復訓練,從而避免網絡訓練過程中出現過擬合現象。
早停機制的示意圖如圖4 所示,當Concat-UNet網絡在訓練集上的得分逐漸增大時,在驗證集上的得分反而降低,說明該網絡有發生過擬合的趨勢。當Concat-UNet 網絡連續P次(P為耐心值,即已經等待的次數)出現此種情況,則應引發早停機制。若當前的得分S>(Smax+d),S為當前得分,Smax為驗證集上的最高得分,d為變化的閾值。在圖4 中第40 輪迭代前面的部分,則更新Smax和Vmin(驗證集上的最小損失),將P清零并保存該網絡參數,繼續訓練下一輪。否則,如圖4 中第40 輪迭代,其他參數保持不變,P值增大,繼續訓練下一輪。若在P內出現更高的得分時,如圖4 中第65 輪迭代,則更新相關參數并保存網絡,將P值清零,繼續訓練。若在P內得分沒有提高,如圖4 的第80 輪迭代,則引發早停機制,Concat-UNet網絡訓練結束。最終保存的結果是第80 輪迭代的最優網絡參數。

圖4 早停機制示意圖Fig.4 Schematic diagram of early stopping mechanism
在醫學圖像分割領域中,常用的損失函數有二值交叉熵(Binary Cross Entropy,BCE)、BCEWithLogits、Dice 等,這些損失函數都各有優點和局限性。本文結合BCEWithLogits 和Dice 損失函數的優點,設計新的的損失函數。
2.2.1 BCEWithLogits 損失函數
傳統方法使用BCE 損失函數來計算二分類交叉熵,要求樣本必須在[0,1]之間,若使用Sigmoid 函數來實現,易導致計算結果不穩定,并且存在梯度消失的問題。針對該問題,本文使用BCEWithLogits 損失函數,將Sigmoid 函數和BCE 損失函數集合到一個類中,使計算結果更加穩定,有利于梯度的穩定回傳,避免出現梯度消失的問題。BCEWithLogits 損失函數如式(2)所示:

其中:xi為訓練樣本;yi為對應的樣本標簽,yi∈{0,1},正樣本取值為1,負樣本取值為0;n為樣本數量;σ(xi)為Sigmoid 函數,將x映射到(0,1)的區間。
該損失函數會對每個類別進行平等的評估,不利于類別不平衡分割網絡的優化。前景像素(腫瘤區域)遠小于背景像素(非腫瘤區域),因此背景像素會在損失函數中占主導地位,使該網絡偏向優化背景。
2.2.2 Dice 損失函數
Dice 系數表征了2 個樣本重疊部分的情況,取值范圍為[0,1],取值為1 表示完全重疊。Dice 系數如式(3)所示:

其中:GGT為標簽圖真值;PPR為預測圖精確度;|GGT|和|PPR|分別為2 個樣本各自的元素總數,相對于分割任務就是統計每個像素(pixels)。
根據Dice 系數,可求得Dice 損失函數,如式(4)所示:

Dice 損失函數通過加大前景區域的權重來避免網絡陷入損失函數的局部最小值,即避免發生過擬合現象。因此,Dice 損失函數較適用于樣本極度不平衡的情況。
根據式(4)可求得Dice 損失函數關于PPR的梯度形式為:

當GGT和PPR的加和較小時,梯度值會發生劇烈變化,導致訓練非常不穩定,不利于網絡的優化。盡管Dice 損失函數解決了類別不平衡對網絡訓練產生干擾的問題,但是它有時會變得不可信,不利于反向傳播。
基于以上分析可知,BCEWithLogits 和Dice 損失函數都有優點和局限性,因此,BCEWithLogits 和Dice 相結合的損失函數如式(6)所示:

其中:λ為0~1 之間的浮點數。
為驗證Concat-UNet 網絡對食管癌腫瘤進行快速精準分割的有效性,本文在真實CT 影像數據集上進行實驗,并與U-Net、SegNet、U-Net_LI、ERFNet 網絡在同樣的實驗環境下進行對比。
數據集是從醫院獲取的真實CT 影像,包含原始數據以及醫生已標注的數據,數據格式為DICOM,切片大小為512×512 像素。為了便于數據讀取及網絡訓練,本文需對數據集進行預處理。
食管癌腫瘤大致位于胸部CT 影像的中間部分且所占比例很小,如果直接使用原始大小的CT 影像進行訓練,網絡易受類別不平衡的干擾,影響模型的訓練和最終的分割效果。因此,本文根據食管癌腫瘤的位置統一將圖片裁剪為256×256 像素,制作標準的數據標簽,數據標簽同樣為256×256 像素的二值化png 格式的圖片,處理后的圖片只包含食管癌腫瘤區域和背景區域,其中,腫瘤區域的值為1,背景區域的值為0。最后,將數據集劃分為兩部分,一部分用于網絡的訓練,另一部分用于網絡的測試,在訓練時按照7∶3 的比例隨機分為訓練集和驗證集。
本文實驗使用深度學習框架PyTorch在云環境中進行訓練,云環境使用Google 提供的Colaboratory。在訓練過程中為了能夠在模型收斂的情況下得到最優的模型,同時在數據量較少的情況下降低過擬合現象的發生。在實驗過程中引入早停機制,最終的迭代次數不是人為設定的而是由驗證集上的損失值決定,最大迭代次數設置為400。受數據集以及實驗環境的限制,訓練過程中的batch size 大小設定為6。本文選擇自適應參數的優化算法RMSProp,學習率初始化為0.05,早停機制中的耐心值為40。
醫學圖像分割領域有很多評價指標,它們能夠從不同的角度對網絡的預測結果進行評估。針對食管癌腫瘤的分割,本文將腫瘤區域視為正樣本,將非腫瘤區域視為負樣本,根據樣例真實類別與預測類別的組合劃分為真正例(True Positive,TP)、假正例(False Positive,FP)、真反例(True Negative,TN)、假反例(False Negative,FN)。
本文采用精確率(P)、召回率(R)、F1-Score、Dice 系數(Dice)作為評價指標。
1)精確率(P),計算所有預測結果為正(正樣本被預測為正TTP、負樣本被預測為正FFP)的樣本中預測正確的概率(正樣本被預測為正TTP),如式(7)所示:

在腫瘤分割問題中,精確率表征預測的腫瘤區域中真正腫瘤所占的比例。
2)召回率(R),計算所有預測結果正確(正樣本被預測為正TTP、負樣本被預測為負FFN)的樣本中預測為正樣本(正樣本被預測為正TTP)的概率,如式(8)所示:

在腫瘤分割問題中,召回率表征所有腫瘤區域中預測成功的樣本所占比例。
3)F1-Score,是精確率和召回率的調和平均數,如式(9)所示:

精確率主要是預測腫瘤區域中預測正確的概率,它是基于預測的腫瘤區域進行評估,而忽略了真正的腫瘤區域。召回率只關注真正腫瘤區域中有多少樣本被正確預測出來,它是基于真正的腫瘤區域進行評估,忽略了預測區域中預測錯誤的樣本。因此,精確率和召回率的評估都不夠全面。在對腫瘤圖像預測時,精確率和召回率同等重要,F1-Score 既考慮了預測的腫瘤區域,又考慮了真正的腫瘤區域,評估結果比較全面。
4)Dice 系數,將精確率和召回率相結合的評估指標。根據式(3)可知,Dice 系數既考慮了預測的腫瘤區域,又考慮了真正的腫瘤區域,評估結果比較全面,在實驗過程中將Dice 系數作為網絡評估指標。
食管癌腫瘤定位的關鍵是能夠對腫瘤區域進行精確的分割。為驗證Concat-UNet 網絡的分割效果及腫瘤區域的定位情況,本文與SegNet、ERFNet、U-Net 以及文獻[25]提出的U-Net_LI 網絡進行對比,評估基準網絡U-Net 和Concat-UNet 的網絡性能以及其他網絡的Dice 系數、精確率、召回率以及F1-Score。
3.4.1 網絡性能對比
為了更直觀地對比U-Net 網絡與Concat-UNet網絡訓練時的性能,本文分別記錄這2 個網絡在訓練過程中訓練集上的損失值和驗證集上的得分情況。隨著訓練迭代次數的增大,U-Net 和Concat-UNet 網絡訓練過程中損失值的對比如圖5和圖6 所示。

圖5 U-Net 網絡的損失值Fig.5 Loss values of the U-Net network

圖6 Concat-UNet 網絡的損失值Fig.6 Loss values of the Concat-UNet network
從圖5 和圖6 可以看出,相比U-Net,Concat-UNet網絡在訓練過程中曲線下降趨勢更加平穩,說明Concat-UNet 更加穩定,模型更容易收斂,具有較優的數據泛化性能。
隨著測試迭代次數的增大,U-Net 和Concat-UNet網絡訓練過程中Dice 系數的對比如圖7 和圖8 所示。從圖7和圖8 可以看出,Concat-UNet 的Dice 系數曲線較U-Net 的Dice 系數曲線更平穩。此外,在訓練趨于穩定時對應驗證集上的得分較U-Net也有明顯的提高,即網絡的分割效果有所提升。Concat-UNet 通過在Conv_concat 模塊中引入2 個跳躍連接,使數據在經過網絡卷積模塊后丟失更少的有用信息,有利于圖像特征的提取,在一定程度上提高了分割精度,同時在卷積模塊后引入的BN 層也使網絡訓練更加穩定。

圖7 U-Net 網絡的Dice 系數變化曲線Fig.7 Dice coefficient change curve of the U-Net network

圖8 Concat-UNet 網絡的Dice 系數變化曲線Fig.8 Dice coefficient change curve of the Concat-UNet network
3.4.2 腫瘤分割結果對比
從測試集中選取5 張不同的CT 影像,SegNet、ERFNet、U-Net、U-Net_LI、Concat-UNet網絡對影像中的腫瘤特征進行提取,提取結果如圖9 所示。圖9(a)是原始的CT 影像經過處理后得到的訓練圖像,圖9(b)中的白色位置為腫瘤。從圖9 可以看出,SegNet 對腫瘤特征的識別效果較差,這是由于SegNet 在解碼器上采樣過程中的輸入直接使用了編碼器對應位置的最大池化層輸出,沒有為網絡學習一個新的參數層,而對于食管癌的CT 圖像,腫瘤區域與周圍區域的邊界并不明顯,這是造成SegNet分割效果較差的原因。ERFNet 提取效果相對原始的腫瘤區域形狀不太貼合,檢測的腫瘤區域邊緣不平滑且出現少許鋸齒狀邊緣,并且對腫瘤的邊緣噪聲更加敏感。U-Net 提取的腫瘤區域邊緣較為平滑,相對于原始腫瘤區域更大,在第3 列的示例中還出現了誤檢的情況,表示U-Net 對數據的泛化性較差。U-Net_LI 網絡主要解決圖像分割中的輪廓圖小部分不連續問題,能更好地處理腫瘤區域的邊緣,使得分割的腫瘤邊緣更平滑,但也會損失細節信息。Concat-UNet 網絡提取的腫瘤區域與原始腫瘤區域在形狀和大小上更為貼合,并且在第3 列的示例中相對于U-Net 不會出現誤檢的情況。因此,Concat-UNet 在檢測精確度和準確度方面要優于其他網絡。

圖9 不同網絡的腫瘤分割結果對比Fig.9 Segmentation results comparison among different networks
3.4.3 評估結果對比
本文在220 個樣例的數據集上對5 種網絡均重復訓練5 次,根據同一測試集上的測試結果保存最優的網絡參數,然后分別用最優的SegNet、ERFNet、U-Net、U-Net_LI、Concat-UNet 網絡對同一個測試集進行腫瘤分割,并計算5 種網絡在評價指標Dice、P、R以及F1-Score 上的均值,評估結果如表1 所示。從表1 可以看出,SegNet 召回率最低,表示所有腫瘤區域中預測成功的樣本比例較低。ERFNet 相較于SegNet 具有較優的結果,能較好地權衡精確率與召回率,但是各項指標都低于Concat-UNet。U-Net 網絡的召回率與精確率相差很大,召回率很高,但精確率很低,這表明U-Net 網絡的腫瘤提取不夠準確。U-Net_LI 在精確率上較U-Net 有明顯提升,但效果仍不及Concat-UNet。Concat-UNet網絡在保證召回率適中的情況下相比U-Net 網絡精確度提升了11.64 個百分點,實現了精確率與召回率的平衡。因此,Concat-UNet 網絡在綜合評估指標Dice 和F1-Score上也有明顯的提升。綜合4 種評估結果,Concat-UNet 網絡的整體表現優于其他網絡。

表1 不同網絡的評估指標對比Table 1 Evaluation indexs comparison among different networks %
3.4.4 腫瘤區域的精準分割
為了更直觀地看出食管癌腫瘤在CT 影像上的位置,本文對Concat-UNet 網絡預測后的二值化圖片進行處理,通過輪廓提取與標注完成CT 影像上食管癌腫瘤的分割任務。Concat-UNet網絡的腫瘤分割可視化結果如圖10所示。從圖10可以看出,Concat-UNet網絡能夠實現對腫瘤區域的精準分割。

圖10 Concat-UNet 腫瘤分割的可視化結果Fig.10 Visualization results of Concat-UNet tumor segmentation
3.4.5 不同損失函數的影響
本文采用的損失函數L=λ×LBCEWithLogits+(1-λ)×LDice(λ=0.6)。在BCE 的基礎上,增加了一定比例的Dice 損失函數,緩解了樣本不均衡對網絡訓練的影響,但是Dice 損失函數容易使訓練不穩定。因此,本文探究Dice 損失函數的比例對評估結果的影響。
在Concat-UNet網絡上分別進行4 組實驗,將每組實驗中Dice 損失函數所占的比例逐漸增大,在同一個數據集上進行訓練,再對同一個測試集進行評估,評估結果如表2所示。當λ取0.6時,Concat-UNet網絡的Dice、P和F1-Score 的值最大,腫瘤分割效果最好。

表2 不同比例的Dice 損失函數對Concat-UNet 網絡評估結果的影響Table 2 Influence of different proportions of Dice loss function on evaluation results of Concat-UNet network %
本文提出圖像分割網絡Concat-UNet。在卷積塊中引入跳躍連接和批量歸一化層,并改進損失函數,以提高特征學習的效率和網絡的優化效果。實驗結果表明,相比傳統U-Net 網絡,Concat-UNet 能夠精準地對影像中的食管癌腫瘤進行分割標注,為今后食管癌腫瘤的診斷工作提供一種新的解決方法。下一步將CT 影像切片的2D 圖像改進為3D 影像,結合CT 影像中的3D 空間信息識別并提取腫瘤區域。此外,將本文工作應用到實際的醫學影像系統中,構建CT 影像拍片、標注、診斷一體式智能醫學影像系統也是下一步的重點研究方向。