畢立新 李福進
華北理工大學電氣工程學院 河北唐山 063000
在引入深度學習技術之前,人們已經提出了解決圖像分割問題的傳統方法,如閾值分割、聚類方法和基于直方圖的方法。如今,深度學習代表了一種前沿技術,已經被存在了幾十年的神經網絡研究團體所證實[1]。深度學習通過訓練一個神經網絡模型來解決圖像分割問題。其主要優點是能夠根據訓練數據集自動學習最佳特征。這就避免了手動選擇特定任務的特征的耗時過程。在視網膜血管的分割中,由于傳統的方法在分割過程中忽略了微小血管,因此分割是一個非常困難的任務,而利用深度學習方法自動檢測視網膜血管具有更好的性能。精心設計的卷積神經網絡(CNN)可以探測到專家通常都很難分析的微小的血管并將其分割[2]。CNN模型是為了克服這個問題而提出的。將其應用到眼底視網膜血管分割中,提高血管分割的準確率。本文針對視網膜分割的主要問題,提出了一種新穎的基于深度學習的視網膜血管分割方法。
為了捕獲足夠大的接收場并獲取語義上下文信息,在標準CNN體系結構中逐漸對特征圖網格進行下采樣。通過這種方式,粗略的下采樣后的特征圖可以在全局尺度內映射特征之間的位置和關系。但是,要減小形狀變化較大的小物體的假陽性預測仍然很困難。為了提高準確性,當前的分割框架依賴于其他先前的對象定位模型,以將任務簡化為單獨的定位和后續的分割步驟。因此,通過在標準CNN模型中集成注意機制可以實現相同的目標。不需要訓練多個模型和大量額外的模型參數。與多階段CNN的模型相比,注意力門限機制(AG)逐漸抑制了無關背景區域中的特征響應,而無需在網絡之間裁剪感興趣的區域[3]。
UNet網絡模型中使用AG以突出通過跳過連接傳遞的顯著特征。在級聯操作之前執行的僅合并相關的激活。另外,AG在向前傳播以及向后傳播過程中過濾神經元的激活。來自背景區域的特征在向后傳遞過程中會降低權重。這使得較淺層的模型參數主要基于與給定任務相關的空間區域進行更新。在多維AG的情況下,對應于每個網格尺度的向量。在每個子AG中,提取并融合補充信息以得到跳過連接的輸出。為了減少可訓練參數的數量和AG的計算復雜性,執行線性變換時無需任何空間支持,并且將輸入特征圖下采樣到門控信號的分辨率。相應的線性變換將特征圖解耦,并將其映射到較低維空間以進行門控操作。在門控操作中不使用低級特征圖,即第一個跳過連接,因為它們不代表高維空間中的輸入數據。在每個圖像尺度上使用深度監督來實現中間特征圖的語義判別。這有助于確保不同級別的注意力單元具有影響大范圍圖像前景內容響應的能力。因此,防止從跳過連接的小子集中重構密集的預測[4-5]。
ACNet模型由兩個級聯的子網絡組成,前一個子網絡將原始視網膜圖像上隨機提取的圖像塊作為輸入,經過前一子網絡輸出得到的視網膜血管的概率圖,將其視為血管預測的粗提取結果,輸入到后一子網絡中,經過后一子網絡得到的概率圖作為最后的血管的分割結果,設置閾值將大于等于閾值的像素歸為血管,小于閾值的像素視為背影。閾值通常設置為0.5。兩個子網絡一個粗提取血管概率圖,另一個精細優化前一網絡得到的結果。兩個子網絡構成了整個分割模型,同樣的,網絡模型的損失函數也由兩個損失函數構成,主損失函數和輔助損失函數。
圖像分割過程可以看作是從原始圖像域到分割目標域的轉移路徑。在此過程中,不斷提取圖像的特征以接近目標。但是,此類抽象可能會導致逐步失去有用的語義和空間信息。為緩解此問題,在ACNet模型模型中,每個編碼器-解碼器主干部分都包含網絡內跳過連接,這些連接將編碼器在每個特征圖尺寸上獲得的特征圖傳輸到解碼器中的相應特征圖尺寸中,前一尺度解碼器上采樣獲得的特征圖與其進行連接作為后一尺度解碼器的輸入。如此以來網絡內跳過連接能夠補償對特征圖進行下采樣期間的信息丟失。同時,至關重要的是將前網絡提取的多尺度特征合并到后繼網絡中,以便后者可以糾正前者產生的概率血管圖的誤差。為此添加了網絡間跳過連接,以將前端網絡的解碼器在每個尺度上獲得的特征圖傳輸到后續網絡的編碼器中的相應尺度并進行連接[6]。
針對視網膜分割的主要問題,提出了一種新穎的基于深度學習的視網膜血管分割方法。通過設計卷積神經網絡模型,提出了基于注意力機制和網絡級聯的分割模型AGNet。以Unet網絡模型為基礎,將注意力門控機制應用到解碼器中的上采樣中,通過標識圖像顯著區域和修剪特征響應參數,選擇性的提取圖像特征。同時采用級聯網絡,并在網絡之間實現網絡間的跳躍連接,補償對特征圖進行下采樣期間的信息丟失。糾正單一網絡產生的血管概率圖的誤差。