劉祥強 李 強 何多魁* 王文瑞 黃建民
( 蘭州財經大學 信息工程學院,甘肅 蘭州730020)
肝癌目前是世界第四大致死癌癥,在肝臟的臨床診斷治療中常常需要有經驗的醫生勾畫出肝臟及肝臟腫瘤的輪廓等等信息,及其耗時耗力,因此此類工作亟需一種全自動的方法能幫助醫生減少工作量。現有肝臟腫瘤分割方法中,都將肝臟分割作為腫瘤分割的前提工作,因此精準的肝臟分割可以有效的提高肝臟腫瘤的精確性。
由于肝臟在CT 圖像中與鄰近組織灰度值接近且形狀相似,精準的分割肝臟成為了十分具有挑戰性的任務[5]。傳統的基于機器學習的方法例如閾值法、區域生長法[6]及其他一些方法,并沒有完全擺脫人工參與,例如在區域生長法中的種子點選擇對最終分割結果影響往往很大[3]。與自然圖像相比,醫學圖像往往數據更難獲取尤其是金標準的獲取,解決醫學影像任務的深度學習模型缺少類似于Imagenet 那樣可供預訓練的數據集,自監督學習這種利用數據本身的結構或者特性解決一些前置任務的學習辦法可以讓模型得到一個較好的預訓練參數[9]。
2006 年深度學習理論被提出后以及計算機硬件條件的提升,由于其強大的特征學習能力,卷積神經網絡迅速發展。2015年提出的U-net[7]網絡結構將圖像分割領域的精度推到的一個新的高度,Ben-Cohen[2]將卷積神經網絡應用于肝臟與肝臟腫瘤的中,取得了不錯的效果。H-densenet[8]將三維特征與二維特征融合。以上網絡都有一個共同的特點就是都沒有權重的初始化或者采用預訓練模型,無法讓網絡從一個更優的起點開始訓練。
自監督學習屬于無監督學習方法中的一個分支,利用數據本身特有信息和結構,設置不同的輔助任務,讓模型盡可能擁有更多的知識儲備。計算機視覺當中主流的自監督學習任務主要分為兩類,生成式任務和對比式任務。
如圖1 所示,同時輸入三張相鄰切片,每一次輸入模型的圖像大小以及通道數為256×256×3,隨機打亂相鄰切片排列順序,模型通過預測被打亂的切片的順序,學習到每張切片的特征,。連續三張圖片順序打亂的方式有六種,隨機生成一種順序打亂方式并將該打亂方式對應的編號變成one-hot 編碼形式作為金標準,將被打亂順序的三張切片圖像放入分類器,這個分類器由U-net 網絡的下采樣部分以及一個MLP 層組成,MLP層的作用是將CNN 網絡學到的圖像特征映射到一維空間,代表著對于改組數據順序排列的預測結果,得到的結果與對應打亂方式的編號的one-hot 編碼求交叉熵損失之后反向傳播同時優化這個分類器,交叉熵損失函數公式如下:

其中pi表示第i 個樣本屬于正例的概率,yi表示第i 個樣本的金標準,由此可以看出當金標準為正例時,pi值越大,總體損失L 的值越小,以此達到優化網絡的目的。本文實驗中的順序預測屬于多分類問題,一共有六類,每一種連續三張圖片順序排列方式算一類。

圖1 自監督訓練流程
在分類器訓練完畢后,將該分類器的權重遷移到分割模型當中。在分割肝臟的時候,為了利用到CT 圖像數據中z 軸上的部分信息,依然采用連續輸入三張相鄰切片,金標準以中間一張切片對應的金標準為準。在將分類器參數遷移到分割模型中的時候,由于分割模型無全連接層,分類器中的MLP 層被丟棄。
本文實驗所使用的數據來自于2017 MICCAI LiTS 肝臟腫瘤分割挑戰賽公開數據集。該數據集CT 圖像數據由多部機器產生,所以CT 圖像之間的差異變化較大,層內分辨率的變化從0.55mm 到1.0mm,序列層間距離從0.45mm 到6.0mm。該數據中共有131 例數據擁有標簽,每例數據從擁有三百多張到一千多張切片不等,在數據集劃分中,我們將前106 例數據作為訓練集,將后25 例數據作為測試集。
Dice 系數是一種集合相似度度量函數,通常用于計算兩個樣本的相似度,取值范圍在[0,1]。

在本實驗中,A 代表醫生手動標注的屬于肝臟區域的像素點集合,B 屬于模型預測的屬于肝臟區域的像素點的集合。由公式可以看出,當A 與B 集合之間的誤差越小時公式中的分子越大且分母越小,從而Dice 值越大。
在本實驗中,分類器訓練使用交叉熵損失函數,優化器選擇Adam 優化器,學習率為10e-5。在分割模型訓練中損失函數選擇Dice 損失函數,優化器選擇SGD 優化器,學習率為10e-3,將驗證集上表現效果最好的權重保存用于測試。
由于加入了自監督學校過程中學到的額外語義信息,讓肝臟分割網絡從一個擁有一定知識儲備的起點開始訓練,從模型的預測結果來看如圖2,經過自監督的模型在預測結果上在一些細節的地方相對于沒有經過自監督學習的模型表現要更加優秀,模型的精度得到了一定程度的提高。其中SSU-Net 代表我們本文中所提出的模型。

圖2 a 代表輸入模型CT 圖像,GT 為該CT 的金標準
為了驗證本文提出方法的有效性,我們將不同模型分別在同一測試集上進行驗證,結果如表1,。結果表明,利用預測切片順序這種自監督方法可以有效的提升模型的性能。

表1
本文所提出的利用預測切片順序來進行自監督的方法為模型預訓練提供一種通用的思路,雖然在肝臟分割中與世界最好的實驗結果相差一段距離,但通過使用更好的網絡結構和一些數據增強操作還是可以繼續提升指標的。