曹心姿 梁秋源 李瑞新 蔡兆信 潘家輝
(華南師范大學軟件學院 佛山528225)
膀胱癌由膀胱組織病變得到膀胱腫瘤而來,是較為常見的病癥,其多發群體為老年男性。CA發布的2015年全球癌癥統計報告《Glob而且膀胱癌的發病率在男性腫瘤中居全球第四位al Cancer Statistics,2012》的癌癥致死率排名顯示,膀胱癌排名第九[1]。中國男性的膀胱癌發病率相對較高,須引起醫學界的重視。
目前絕大多數醫院使用CT(Computed Tomog?raphy)或者MRI(Magnetic Resonance Imaging)技術進行醫學成像,再通過主治醫生觀察圖像進行腫瘤診斷。然而,雖然上述兩種成像技術所呈現的組織細胞于惡性腫瘤有相對明顯的區別——主要體現在浸潤程度、灰度、厚度、位置等特征上,但僅僅通過肉眼進行腫瘤分期分級診斷是不夠精確的。因此,我們可以在醫學成像領域加入計算機視覺進行自動化腫瘤分割與分類,以達到更好的診斷效果,幫助病人進行腫瘤確診和輔助治療。分割后的腫瘤圖像能夠應用于多種場景,例如腫瘤組織的定量分析、特征提取、計算機指導手術等[2]。
目前的臨床醫療中,磁共振成像(Magnetic res?onance imaging,MRI)在膀胱腫瘤的檢測和治療中扮演著重要的角色。MRI技術結合多參數、多方位成像來產生最終圖片,能夠清晰地觀察生理結構,對比其CT圖更加有優勢。因此本文選用MRI圖像進行圖像自動化分割處理研究。計算機軟件的自動化圖像處理使得我們能夠定量分析腫瘤情況,并對腫瘤進行定期跟蹤比較,以確定更加適合病人的醫療方法[3]。
近年來,大量的研究學者對圖像分割技術進行了研究,傳統的分為以下幾類:1)基于閾值的分割;2)基于區域的分割方法;3)基于邊緣的分割;4)基于模糊C均值(FCM)聚類分割;5)基于神經網絡的分割等。由于MRI圖像具有較大的噪聲,閾值分割算法等容易產生過分割的現象;區域分割對均勻的連通目標有較好的分割效果。但是對噪聲較敏感,可能導致區域內有空洞,因該方法為串行算法,當目標區域較大時,分割速度慢;基于邊緣的分割不能保證邊緣的連續性與封閉性,在高細節區存在大量的碎邊緣原因限制了其在圖像分割中的應用;FCM算法對初始參數極為敏感,有時需要人工干預參數的初始化以接近全局最優解,提高分割速度。
基于神經網絡的分割中出現過VGG16,FCN,DeconvNet,DeepLab,Mask-RCNN,SegNet,U-Net等。由于深層神經網絡訓練時一般都需要標注大量的樣本,但是醫學的圖像需要專業人員進行標注,樣本的數量規模較少,而U-Net網絡剛好補充了這個缺失,幾百張的數據集就能達到比較好的效果,因此U-Net網絡備受關注。
U-Net網絡結構是2015年ISBI競賽中提出的網絡結構[4],包括一個收縮網絡和一個擴張網絡,組合構成了一個U型結構,該網絡采用了與FCN完全不同的特征融合方式——拼接。該網絡主要用于醫學圖像分割上,網絡最初提出時是用于細胞壁的分割[5],之后在肺結節檢測以及眼底視網膜上的血管提取等方面都有著出色的表現,但在膀胱腫瘤分割領域應用較少[6~10]。
原始的U-NET網絡深度略有不足,訓練時間短,訓練參數較少,隨著深度的加深,該網絡會出現退化問題,因此分割效果有待進一步提高。
本文我們將采用改進后的U-Net網絡結構來對膀胱腫瘤部分進行分割,改進后的U-Net網絡結構加入了殘差網絡(residual network)[11~12],殘差網絡是并對每一層結果進行規范化(batch normaliza?tion)處理,能夠有效防止網絡訓練過程中出現準確率退化的現象。
實驗結果表明,與傳統的U-NET網絡結構相比,雖然訓練時間略有增加,改進后的U-Net網絡的分割效果又了更好的提升。
U-Net網絡是一個全卷積的網絡,左邊為壓縮路徑(Contracting Path),右邊為擴展路徑(Expan?sive Path),壓縮路徑有4個block構成,每個block使用3個卷積和一個下采樣(Max pooling),每次采樣之后Feature Map的個數乘以2,得到32×32的Feature Map。
拓展路徑同樣包含4個block,每個block開始之前通過反卷積乘以2,并且將其個數減半并與左側對應的壓縮路徑中的Feature Map融合,補全缺失的信息,最后采用將其特征映射到某一類別中。

圖1 U-Net網絡結構示意圖
實驗中,訓練模型采用Adam函數作為模型優化函數。該函數利用梯度的一階矩估計和二階矩估計動態調整每個參數的學習率,每一次迭代學習率都有個確定范圍,使得參數比較平穩。
圖像分割采用Dice系數進行評價。它是一種集合相似度量函數,通常用于計算兩個樣本之間的相似度。

其中A是已經勾畫的膀胱癌區域,B是算法分割得到的膀胱癌區域,Dice的取值范圍是從[0,1],取值越接近于1,說明分割效果越好,模型越準確。
U-Net由于把編碼特征加入到解碼特征中,可以在小數據量下取得很好效果,但是由于U-Net網絡不夠深,對特征的表達不夠準確,分割的準確率不夠高。為此我們可以通過加深網絡的深度來提高分割的準確率,但是當網絡太深時,又會出現準確率退化的現象,為了解決這個問題,我們提出在U-Net網絡中引入殘差網絡結構。
隨著網絡層數的增加,網絡發生了退化(degra?dation)的現象:隨著網絡層數的增多,訓練集loss逐漸下降,然后趨于飽和,當再增加網絡深度時,訓練集loss反而會增大,這個退化不是由過擬合引起的。
由于在前向傳輸的過程中,隨著層數的加深,Feature Map包含的圖像信息會越來越少,但是加入了ResNet的直接映射結構后,確保了下一層的圖像信息多于上一層,由此殘差網絡應運而生。
如果深層網絡后面的層數是恒等映射,那么這個網絡便會退化為一個淺層網絡,因此問題轉換為學習恒等映射函數,為此將網絡設計為如下結構。

圖2 殘差結構單元
殘差網絡由一系列的殘差塊構成,每個殘差塊表示為

F為求和前網絡映射,H為從輸入到求和后的網絡映射,不斷擬合殘差函數,即無限逼近于0。可通過前向神經網絡與“捷徑”(shortcut connections)實現[13~15]。
殘差網絡的出現解決了深度網絡訓練過程中出現的退出問題,優化了網絡性能。
原始的U-Net網絡深度淺,過于單薄,在U-Net網絡中加入殘差結構,生成Res-U-Net網絡模型,如圖3所示。

圖3 Res-U-Net網絡結構示意圖
改進后的網絡結構加入了數據標準化與殘差結構。其中數據標準化貫穿了每一層,殘差結構為1×1的“捷徑(shortcut connections)”附加在下采樣與上采樣當中,同時對每個卷積層輸入的數據進行了規范化。
首先對各個隱藏層的輸入數據進行標準化,每一層中的數值β={x1……xm},計算均值

計算數值方差

對每個值進行歸一化處理

通過數據的標準化,令均值和方差控制在一定范圍內,使得下一層的網絡不必去適應底層網絡輸入的變化,每一層進行獨立的學習,進而加快模型的學習速度。

表1 U-Net與改進的Res-U-Net網絡結構圖

?
該網絡模型保持了原始的收縮路徑與擴張路徑,收縮過程加入了殘差結構,使得通過卷積與池化中提取到更多的特征。
每一層卷積后進行標準化操作,使得每一層的輸出結果落在敏感的區域,避免隨著網絡深度的加深出現梯度消失的問題。
在擴展路徑中對圖像特征進行還原,對邊界信息進行補充,加入了殘差結構能夠更大化地還原圖像的特征信息,進而提高分割效果的準確性。
本實驗共有900組數據集,大小為512×512,圖像深度為8,其中800組作為訓練數據,100組作為測試數據。
此次試驗以Kaggle GPU為訓練平臺,采用Py?thon3.6,深度學習框架Keras 2.24。
在訓練前均對圖像進行歸一化處理,兩個網絡構造均采用Adam函數作為優化函數,對訓練得到兩個網絡的模型進行測試。
Res-N-Uet網絡訓練過程中的損失函數與迭代次數之間的關系如圖4所示。圖4中對比了這兩個網絡模型的損失函數變化情況,從中可以看出,改進后的U-Net網絡相比于原始的U-Net網絡,損失函數更小,說明訓練效果更好。

圖4 損失函數與迭代次數的關系圖
本實驗中,U-Net模型與Res-U-Net模型的訓練epoch均為30,通過對測試示例圖得到上述分割圖像,U-Net模型分割得到的圖像模糊,而Res-N-Uet得到的掩膜圖像更加清晰,并且邊界更加明顯,模型更具有魯棒性,分割效果更好。

圖5 不同網絡對同一張MRI圖像的分割結果
通過在kaggle GPU平臺訓練得到的兩個網絡模型,分別對100張測試集進行測試,并進行評估,計算分割出的圖片的Dice系數,繪制得到圖6。
以epoch=30為例,圖6展示了原始U-Net對腫瘤的分割Dice系數與Res-U-Net的Dice系數的情況,從圖中可知,改進后的網絡模型得到的Dice系數明顯高于原始的模型,因此可改進后的模型的分割效果更加理想。

圖6 Dice折線圖
以訓練epoch=30為例,表2分別對模型的層數,訓練的參數與所需要的訓練時間進行了比對,因為加深了網絡的深度,因此網絡的訓練參數與訓練時間都略有增加,但是仍在可控的范圍內。

表2 兩種模型比對
針對原始U-Net網絡深度淺,分割效果不足的缺點,引入了殘差結構,加深網絡深度,并對每一個隱藏層輸入數據進行歸一化。實驗表明,改進后的U-Net模型的分割的Dice系數相比于原始的網絡提高了9%,分割效果優于原始的網絡。
醫學圖像對輔助醫生診斷具有重要的作用,傳統的MRI圖像通過人工進行查看操作,對人力的技術要求相對較高,需要消耗大量的精力,通過自動化分割能夠幫助醫護人員減輕工作壓力。針對U-Net網絡在膀胱腫瘤分割的準確率問題,本文提出了一種改進后的Res-U-Net網絡。該網絡結構基于原始的U-Net網絡,通過引入殘差結構,加深網絡的深度,并且對每一層輸入的數據進行歸一化。實驗結果顯示,改進后的網絡時間訓練參數更多,時間略有增加,但是這種具有更好分割效果,分割Dice系數提高了10%,具有較好的應用前景。