紀建兵 姚劍敏


摘要:為解決CT圖像中胰腺組織自動分割難題,提出基于深度學習的分割方法;對圖像數據進行預處理,采用Dice損失函數及Sgdm梯度下降法來訓練網絡;以Medical Segmentation Decathlon公開數據集進行實驗,實驗平均分割準確率為0.8469;結果表明,分割算法達到了較高的準確率。
關鍵詞:深度學習;胰腺;分割
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2020)01-0065-02
0 引言
從CT斷層掃描圖像中分割出胰腺區域并進行三維成像,對于準確制定手術方案具有重要作用。因胰腺組織在圖像上無明顯特征,與相鄰的器官的像素極為相似,且不同人的形狀、大小和位置均不一致,自動分割具有很大挑戰性。2013年Wang Xin[1]等人提出基于統計模型的胰腺分割算法,該法僅適用于正常胰腺的分割。近年來,深度學習網絡在圖像自動分割領域展現出了巨大優勢,研究以Vnet[2]深度學習網絡為基礎對胰腺進行全自動體分割,輸出分割的三維二值矩陣可用于三維可視化。
1 Vnet
Vnet是三維全卷積網絡,成左右對稱結構。左半部分為下采樣,即特征提取過程,由卷積單元和卷積池化層組成,層數為5層,每一層包含1-3個卷積單元,通道數從16按倍數增加至256。右半部分為上采樣,即特征重構過程,由反卷積層和卷積單元組成,層數為4層,卷積單元及通道數與左側對稱。卷積單元用于提取圖像特征,卷積池化用于數據降維,反卷積用于恢復圖像尺寸。
卷積單元由Conv-BN-PReLU組成。Conv為卷積,本文使用了步長s為1的5x5x5卷積核和步長s為2的2x2x2的卷積核,兩組卷積核均使用Same方式填充,當數據經過下采樣過程步長2的2x2x2卷積核的卷積單元時,其分辨率會降低一半,生成映射大小減半的更深層次的特征;BN(數據批量歸一化)將數據轉換為服從的標準正態分布,目的在于加快收斂速度;PReLU(帶參數的線性整流函數)為激活函數,輸出關系為:
a為由網絡反饋時自動計算的小常數,在保留小于0信息的同時又達到了激活函數的目的。
反卷積單元由DConv-BN-PReLU組成。上采樣過程中數據與步長2的2x2x2卷積核進行反卷積時,其分辨率會增加一倍,圖像尺寸得到恢復。
Pool(卷積池化)是以卷積方式對特征降維,降維后的尺寸關系為:其中,B為卷積層輸出,k為池化卷積核尺寸,p為填充值,s為步長。
網絡預測由兩個與原始輸入具有相同分辨率的體素組成,通過Softmax回歸模型輸出每個體素被劃分為背景區域與目標區域的概率。
2 胰腺分割
2.1 算法流程
首先,對數據集進行預處理,將預處理后的圖像數據以隨機方式劃分為訓練集和驗證集,訓練集用于網絡訓練。其次,運用已訓練網絡對驗證集進行預測分割,對分割結果進行后處理。
2.2 預處理
數據集的構成由CT圖像序列及二值標簽序列組成,首先將CT序列及標簽序列分別組成三維矩陣,再根據標簽體尺寸對xyz三個方向進行64像素外擴并裁減至8的倍數的分辨率;將各片層中灰度值減去灰階均值后除以灰階標準差后執行歸一化。
2.3 訓練網絡
使用Dice損失函數描述分割準確度,即兩個集合之間的差異程度。設為算法分割結果的三維矩陣,為真實二值標記三維矩陣,則Dice定義如下:網絡訓練的目標在于尋找損失函數的最小值以達到最優分割,通過梯度下降一步步迭代求解,得到最小化的損失函數。目前較常用的梯度下降算法是SGD(隨機梯度下降算法),本文使用SGDM(帶動量的隨機梯度下降)[3]進行求解,該法在更新梯度向量之前增加前一次的更新向量,在相同方向上進行速度累加,不同的方向上速度減小,從而達到加快收斂速度的目的。
2.4 分割及后處理
將測試集輸入已訓練網絡并對輸入進行網絡分割,輸出與輸入相同尺寸的三維二值矩陣,采用形態學閉運算進行后處理。
3 實驗
Medical Segmentation Decathlon公開數據集中共有281例有效腹部CT數據以及胰腺二值真實標記,可用于算法的訓練和測試[4]。實驗的平均分割準確度為0.8469。隨機從測試集中抽取了一例CT數據并隨機選擇一個切片,對比結果如圖1所示,分割結果和標記基本相同。
4 結語
本文提出基于深度學習的胰腺分割方法,利用公開數據集進行驗證,實驗結果表明算法具有較高的準確度,且系統結構較為簡單,易于實現。因胰腺的個體差異較大導致網絡在預測分割時仍存在一定的不確定性,分割準確度的提高需要有更多的訓練數據支撐,構建更大量級的有效訓練數據將是下一階段研究的重點。
參考文獻
[1] WANG Xin.Research and implem entation on pancreas segmentation methods based on statistical model[D].Shenyang City:Northeastern University,2013.
[2] MILLETARI F,NAVAB N,AHMADI S.V-Net:fully convolutional neural networks for volumetric medical image segmentation[C].Proceedings of the 4th International Conference on 3D Vision. Piscateway,NJ:IEEE,2016:565-571.
[3] 常永虎,李虎陽.基于梯度的優化算法研究[J].現代計算機,2019(17):3-8.
[4] TIAN Xuan,WANG Liang,DING Qi.Review of image semantic segmentation based on deep learning[J].Journal of Software,2019,30(2):440-468.