周秀蓉,靳蘊瑤,柴林
(四川大學計算機學院,成都610065)
傳統的正畸診療主要依靠正畸醫生對牙齒錐形束計算機斷層掃描(CBCT)圖像和鑄造的牙齒石膏模型進行分析、診斷和治療。隨著CBCT 在臨床中應用越來越廣泛,為了更好地利用CBCT 圖像重建牙齒的三維模型以輔助醫生診斷和治療,自動分割出CBCT 圖像中的牙齒區域是關鍵步驟之一。
現有的牙齒CBCT 圖像分割方法可以大致分為兩類:基于傳統方法的二維逐片分割和基于深度學習的三維分割。第一類方法中,Akhoondali 等人[1]提出了一種基于區域增長的分割算法,劉世偉等人[2]提出了一種基于局部高斯分布擬合的分割算法,Gan 等人[3]提出了一種基于水平集的分割算法。這些方法由于沒有考慮相鄰切片的三維空間信息,都對牙齒復雜的咬合條件缺乏魯棒性,并且不能精確地分割出牙尖部分。近幾年,機器學習成功運用在了各種醫學影像分析問題上,包括塵肺檢測、肺結節檢測、心臟肝臟影像分割等,但在牙齒CBCT 圖像上的應用仍比較少。Ezhov 等人[4]提出一種基于3D FCN[5]的由粗到細牙齒CBCT 圖像分割框架,它可以從CBCT 圖像中直接分割出33 類牙齒,但其需要大量的訓練數據,標注工作量大,而且訓練33類語義分割網絡非常耗時,對計算機性能要求非常高。此外,由于牙齒和牙槽骨的強度相近,咬合狀態下CBCT 圖像中上下牙交界處結構復雜,牙髓腔較小且包含在牙齒內部,上述兩類方法均很難精確分割CBCT圖像中的單顆牙齒。
本文提出三級分割網絡高效、精確地從CBCT 圖像中分割出單顆牙齒。本文首先統計上下牙在CBCT圖像中的分布規律,據此確定包含上牙和下牙的切片范圍,然后分別訓練上牙和下牙的分割模型。以下牙分割模型為例:①首先根據統計結果提取每組數據中包含下牙的48 張CBCT 圖像,然后對其進行閾值分割(閾值設為600 亨氏單位),找到牙齒邊界,從原圖像中裁剪出牙齒部分的ROI,輸入第一級網絡進行3 類語義分割;②根據第一級網絡的輸出,用每一類牙齒部分最大的切面確定該類牙齒部分的ROI 中心,然后從原圖像中裁剪出每類牙齒的ROI,輸入第二級網絡對每類牙齒區域中的單顆牙齒進行弱分割;③根據第二級網絡的輸出,用每顆牙齒部分最大的切面確定每顆牙齒部分的ROI 中心,然后從原圖像中裁剪出每顆牙齒的ROI,輸入第三級網絡精細分割出單顆牙齒。
本文的主要貢獻有以下兩個方面:
(1)本文提出了一個基于3D U-Net 的三級分割網絡,該網絡不需要標注大量的訓練數據,并且可以有效地從CBCT 圖像中分割出單顆牙齒。
(2)本文分開訓練上下牙分割模型,能減少訓練時間、節省計算機資源。
本文使用的數據由口腔醫院提供,包含37 個人的口腔CBCT 圖像,圖像分辨率為101×565×565。本文實驗中將其中31 個人的數據作為訓練數據,其余6 個人的作為測試數據。每個訓練數據由三名醫學生標注,他們標注結果的公共部分作為最終標注結果。每個測試數據由兩名醫生標注,同樣取他們標注結果的公共部分作為最終標注結果。所有標注均使用3D Slicer[6]完成。注意,實際參與訓練數據標注的醫學生有11名,每人負責一部分數據。這樣分配數據進行標注的原因是能夠更好地反映不同人之間標注數據的差異對實驗結果的影響。
牙齒編號示意圖如圖1,為了讓第二級網絡精確定位單顆牙齒,除兩顆門牙外其余對稱牙齒標記為一類。三級分割模型如圖3 所示,包括以下幾個部分:①將預處理后的數據輸入第一級網絡對牙齒進行3 類語義分割(1、2、3 號牙齒為一類,4、5、6 號牙齒為一類,7、8、9 號牙齒為一類);②根據第一級網絡的輸出,從原圖像中裁剪出每一大類牙齒部分的ROI(裁剪中心是每一大類牙齒部分最大切面中該類牙齒的平均像素位置),輸入第二級網絡對每類牙齒區域中的單顆牙齒進行粗分割(由于牙齒具有對稱性,每一類牙齒共用一個分割網絡);③根據第二級網絡的輸出,從原圖像中裁剪出每顆牙齒的ROI(裁剪中心是每顆牙齒部分最大切面中該牙齒的平均像素位置),輸入第三級網絡精細分割每顆牙齒(對稱牙齒使用一個網絡)。其中弱分割網絡W、粗分割網絡R 和精分割網絡F 均使用3D U-Net 網絡。我們使用Adam 優化器對W 網絡進行了100 次迭代訓練,批量處理大小設為3,學習率初始值設為1e-4,在45 和75 次迭代之后以10 倍的速度衰減。R 網絡和F 網絡批量處理大小為8,學習率初始值為1e-3,其余設置與W 網絡相同。

圖1 牙齒編號示意

圖3 第一級網絡3分類結果
數據集按4:1 的比例隨機分為訓練集和測試集。為了提高模型的預測性能,通過隨機旋轉、縮放和翻轉來擴充訓練數據集,以模擬實際中可能出現的情況。例如,在某些情況下,頭部會向左或向右傾斜,且左右臉有不對稱的情況。因此,在[-10,10]度范圍內進行隨機水平旋轉來增加訓練數據。此外,每個人頭的大小是不ol 一樣的,并且每個人牙齒的大小也存在差異。因此,將圖像放大到[0.9,1.1]的尺度。此外我們還在水平方向翻轉訓練數據。
本文使用的損失函數是多分類交叉熵函數和(1-DICE(骰子損失[7]))函數,骰子系數是衡量分割質量的指標,它衡量的標準是分割結果和真實值之間的重疊部分面積占分割結果和真實值總面積的比列,骰子系數越大,說明分割效果越好,本文使用骰子系數來改善分割邊界的連續性。C.Zhao 等人[8]使用二分類交叉熵函數和(1-DICE)函數作為損失函數分割肺結節,取得了不錯的效果。骰子系數定義如下:

其中,y真實值,y1是預測值。最后的損失函數為:

其中,yi表示單個像素點的真實值,y1i表示單個像素點的預測值,N表示語義分割類別數,T表示每類樣本總數。
本文使用DSC(骰子相似系數)作為分割評價指標。如表1 所示:第一級網絡的平均DSC 值為0.889,第二級網絡的平均DSC 值為0.916,第三級網絡的平均DSC 值為0.958,這說明本文采用三級分割網絡逐步精細地分割牙齒效果顯著;第一級網絡訓練耗時90 小時,第二級網絡訓練耗時27 小時,第三級網絡訓練耗時33 小時,三級分割網絡訓練總耗時159 小時,Ezhov等人提出的模型訓練總耗時近800 小時,相比之下我們的三級分割網絡能大大減少訓練時間、節省計算機資源。第一級網絡的分割結果如圖3 所示,從圖中可以看出,第一級網絡能比較精確地分割出每一類牙齒。第二級網絡的分割結果如圖4 所示,從圖中可以看出,第二級網絡能夠粗略地分割出單顆牙齒,但由于牙尖和牙髓腔區域較小,導致分割效果并不理想。第三級網絡的分割結果如圖5 所示,可以看到單顆牙齒能夠被精確分割。圖6 是上下牙融合(首先根據第二級網絡得到單顆牙齒的ROI 中心結合第三級網絡單顆牙齒的分割結果,得到我們上下牙的最終分割結果,再根據上下牙切片位置關系融合上下牙模型,得到最終分割結果)后的最終分割效果圖,從圖中可以看出我們的單顆牙齒可以被精確分割。

表1 三級網絡分割結果

圖4 第二級網絡分類結果

圖5 第三級網絡分類結果

圖6 牙齒分割效果圖
本文采集了一個數據集用于單顆牙齒的精確分割,同時也展示了三級分割網絡的分割結果,驗證了分級網絡的有效性,該網絡可以有效地分割出單顆牙齒并標號。但牙槽骨和牙齒的關系在正畸醫生在給患者制定正畸方案牙時非常重要,所以接下來我們準備擴展實驗,實現牙槽骨的精確分割。