李秉堯,張旭杰,黃良匯,徐 揚,王雪花
(1.佛山科學技術學院 機電工程與自動化學院,廣東 佛山 528225;2.佛山科學技術學院 物理與光電工程學院 粵港澳智能微納光電技術聯合實驗室,廣東 佛山 528225)
眼角膜在視覺系統中起著非常重要的作用,角膜的屈光能力占整個眼球屈光能力的3/4,其通透性直接影響視覺觀測清晰度,對角膜內皮細胞狀況進行觀察和判斷,是眼科醫生診療眼部疾病的重要方式[1]。角膜內皮顯微圖像是角膜組織健康狀態診斷信息的重要來源,健康的角膜內皮細胞是大小均勻的、規則的,類似于蜂窩狀的六邊形。不同的病理原因會導致內皮細胞受損。由于角膜內皮細胞缺乏再生能力,某一位置角膜內皮細胞缺失會導致其他細胞不可預測伸長、變薄和尺寸增大,破壞了角膜內皮細胞六邊形的規律性[2]。內皮細胞的過度丟失會導致上皮損傷,增加患致盲性角膜水腫的風險。在出現疾病癥狀前,往往難以察覺受損角膜內皮細胞,因此需要檢測內皮細胞的幾何形狀來評估角膜內皮細胞的健康狀況[3]。
目前,檢測角膜的主要方法是由經驗豐富的眼科醫生手動提取顯微圖像中角膜內皮細胞的形態,具有一定的個人主觀性,且由于角膜內皮細胞數量龐大(每立方毫米含有數千個細胞),提取過程非常繁瑣與耗時[4]。此外,某些角膜內皮顯微圖像中還存在對比度低、鏡面反射光照不均等問題,導致專家也很難識別細胞邊界。因此,開發一種能夠自動分割角膜內皮細胞的方法具有臨床意義。
近幾年人工智能算法被廣泛用于解決各種醫學圖像分割任務,大量基于深度學習分割角膜的新方法被提出[4-9]。其中,Unet 作為生物醫學圖像分割中最有效的卷積神經網絡之一,被進一步優化性能,應用于分割角膜內皮細胞。例如,Anna Fabijanska 等[10]人利用Unet 網絡成功分割角膜內皮細胞;Juan P. Vigueras-Guillén 等[11]和Sierra, Juan S.等[12]團隊基于改進UNet 網絡解決了識別角膜內皮營養不良癥的問題。但目前的方法仍存在分割圖像邊緣不突出或圖像邊緣斷裂等問題。
本文提出一種DSE-Unet 分割角膜內皮細胞的方法。DSE-Unet 是在Unet 網絡架構上引入密集連接層(Dense)和注意力(Se,Squeeze-and-Excitation)模塊。一方面,通過Dense 模塊提取角膜細胞多尺度的特征信息,提高網絡識別細胞形態結構的能力;另一方面,通過Se 模塊來抑制無效信息,強調對分割角膜細胞有用的特征,提高網絡的分割性能。此外,通過標注角膜細胞中心的方法輔助網絡學習細胞邊界特征,保持細胞的完整形態。使用公開的Alizarine 角膜內皮圖像數據集[13]訓練和評估該模型,得到準確率、精確度、靈敏度、特異性和骰子系數分別為91.88%、82.07%、78.20%、95.49% 和80.09%。實驗結果表明該算法能自動準確地分割角膜內皮細胞,并保持細胞形態和結構完整,可以為臨床醫生診斷角膜疾病提供重要的形態信息。
本文提出的DSE-Unet 模型如圖1 所示,Unet 結構由兩條主路組成:左邊為編碼器、右邊為解碼器。編碼器通過重復采用卷積和池化操作,可以提取圖像上的分類特征。解碼器通過重復采用上采樣及與對應編碼器的特征圖進行拼接,可得到特征圖。最后用一個1×1 的卷積層對特征圖進行降維,并使用Softmax 分類器輸出像素級別的分類結果。本文將標準Unet 網絡的卷積替換成Dense 模塊,并在激活函數與池化層中間插入1×1 卷積層和Se 模塊。Dense模塊通過創建層與層之間的短路鏈接,令每一層都可以從損失函數中得到額外的監督,并減少特征的冗余,以加強提取角膜細胞多尺度的特征信息。Se 模塊可以通過學習的方式重新校準提取特征的重要程度,因此將Se 模塊插入到Dense 模塊后可以抑制無效信息,加強對分割角膜細胞有用的特征。

圖1 DSE-Unet模型的流程圖Fig.1 Flow chart of DSE-Unet model
本文采用公開數據集Alizarine 的30 張取自用茜素染色的豬眼圖像[13]。該數據集由放大200 倍的反相差顯微鏡(CK 40, Olympus)和模擬相機(SSC-DC50AP, Sony)采集,圖像分辨率為768×576,儲存為JPEG 格式,每張圖像包含平均約232 個細胞(范圍從188 到388)。此外,還提供了由眼科專家手動描繪的細胞形態邊界的標簽圖像。本次實驗使用兩種不同的標注方式對角膜內皮細胞進行標注,如圖2 所示,僅標注細胞邊界和標注細胞中心作為第三分類的標簽。在數據集中隨機挑選5 張圖像作為測試集,其余25 張圖像作為訓練集。為了增強數據,在每張訓練圖像上隨機裁剪出1000 張32×32 大小的圖像,一共制作出19200 張,其中4800 張作為驗證集。為了得到準確可靠的實驗結果,本次實驗結果采用5 折交叉驗證的平均值。

圖2 角膜內皮細胞原圖和標簽Fig.2 Original image and label of corneal endothelial cells
實驗在64 位Win10 操作系統中進行,計算機的運行內存為16G,GPU 為NVIDIA GeForce RTX 2080Ti(11GB顯存),處理器為Intel(R) Core(TM) i7-7700 CPU @ 3.60GHz。采用Python3.6 和Tensorflow1.14 中的Keras 框架,搭建、訓練和驗證模型。在實驗中,批次大小設置為128,epoch 為50,為了降低過擬合的風險,所有模型訓練過程均由Keras隨機初始化,沒有使用預訓練權重。訓練過程中使用Adam優化器,初始學習率設置為1e-4。
本次實驗采用準確率(ACC,Accuracy)、精確率(PPV,Precision)、靈敏度(SE,Sensitivity)、特異度(SP,Specificity)和骰子相似系數(DICE,Dice coefficient)參數[14]來評估角膜內皮細胞分割的性能。
為了對比各模型的性能,表1 中列出了Unet、Res-Unet、Dense-Unet、SE-Unet 以及DSE-Unet 網絡分割角膜細胞的評價指標結果。相比其他模型,DSE-Unet 分割角膜細胞的性能最好,證明了Dense 模塊可以使網絡學習多尺度特征信息,而SE 模塊強調有用的特征,從而提高分割角膜細胞的整體性能。

表1 各模型分割角膜細胞的評價指標對比Table 1 Comparison of evaluation indicators for corneal cell segmentation among different models
圖3 展示了標注細胞邊界和添加細胞中心標注的分割示例結果。圖3 第一行原圖較為清晰,僅標注邊界的二分類方法分割結果較差,但添加細胞中心標注后,可以準確地分割細胞;圖3 第二行的角膜內皮細胞圖像中存在異常陰影,二分類方法難以分割陰影區內的細胞,而中心標注方法仍可以準確地分割細胞邊界。

圖3 兩種標注方法分割角膜內皮細胞對比示例圖Fig.3 Comparative example of two annotation methods for segmenting corneal endothelial cells
為了定量評估細胞中心標注提升分割細胞的性能,表2 中對比了各網絡模型使用二分類與細胞中心三分類方法的評價指標。如表2 中數據所示,三分類比二分類標注細胞的方法性能更佳,證明了通過標注角膜內皮細胞的中心和邊界,可以提升分割細胞的準確性。

表2 定量分析比較不同模型和方法的性能Table 2 Quantitative analysis and comparison of the performance of different models and methods
本文利用DSE-Unet 網絡模型在Alizarine 公開數據集上分割角膜內皮細胞,得到準確率、精確度、靈敏度、特異性和骰子系數分別為91.88%、82.07%、78.20%、95.49%和80.09%。相比其他網絡模型獲得更好的分割細胞性能,證明Unet 結合Dense 和Se 注意力模塊能更好地提取表征角膜內皮細胞的鑒別特征。此外,標注細胞中心作為第三分類的方法能進一步提升網絡分割細胞的性能。
傳統的圖像形態學算法分割角膜內皮細胞存在細胞粘連和分割錯誤等問題,導致分割的細胞形態錯誤,角膜內皮細胞統計數目偏離真實值等狀況。眼科醫生依據分割結果分析診斷角膜疾病時,可能會錯誤判斷病情。本文方法能夠自動、準確地分割角膜內皮細胞,獲得清晰的細胞形態和結構,對協助臨床醫生診斷角膜疾病方面具有潛在的應用價值。
本文的研究還存在一些不足之處:只訓練了單一數據集,細胞形狀不具有異質性,在下一步的研究中將添加角膜病變數據集進一步驗證該網絡模型多數據集的泛化能力。