賈偉
關鍵詞:結直腸癌;形態特征感知;卷積神經網絡;病理圖像分類
0 引言
結直腸癌是發生在結腸或直腸的癌癥,是我國發病率和死亡率較高的癌癥類型之一[1-2]。對結直腸癌病理圖像的準確分類有助于醫生做出準確的病理診斷和預后判斷。為對癌癥做出準確分類,一些學者圍繞深度學習對癌癥病理圖像的分類方法展開了研究,例如,NAHID 等[3]提出基于卷積神經網絡(Convolu?tional Neural Network,CNN) 和長短期記憶的乳腺癌圖像分類方法(Breast Image Classification Method Basedon Convolutional Neural Network and Long-Short-Term-Memory,BCBCL) 。DORJ等[4]提出基于深度CNN的皮膚癌分類方法(Skin Cancer Classification Method Basedon Deep Convolutional Neural Network,SCBC) 。GOUR等[5]提出基于殘差學習的乳腺癌圖像分類方法(BreastImage Classification Method Based on Residual learning,BCBR) 。HAMEED等[6]提出基于集成深度學習的乳腺癌圖像分類方法(Breast Image Classification MethodBased on Ensemble of Deep Learning,BCBED) 。
然而,由于病理切片的制作過程受到各種外部因素的影響,導致結直腸癌病理圖像中存在形態細節模糊的情況。此外,結直腸癌病理圖像中的形態特征較為復雜,現有的癌癥病理圖像分類方法難以有效提取特征信息,這些因素導致現有的分類方法無法較好地分類結果。為解決現有分類方法存在的不足,本文提出一種基于形態特征感知的結直腸癌圖像分類方法(Colorectal Cancer Image Classification Method Based onMorphological Feature Perception,CCBMF) ,使用兩階段的圖像預處理方法(Two-Stage Image PreprocessingMethod,TSIM) 對病理圖像進行增強,然后在基于形態特征注意力網絡的CNN(Convolutional Neural NetworkBased on Morphological Feature Attention Network,CNBM) 中使用形態特征注意力網絡(MorphologicalFeature Attention Network,MFAN) 獲得更準確的形態特征信息。
1 結直腸癌圖像分類方法
CCBMF 的整體結構如圖1所示,其包括兩個部分:首先,在圖像預處理部分,利用TSIM對結直腸癌病理圖像進行預處理,增強形態特征;然后,在圖像分類部分,利用CNBM對增強后的病理圖像進行特征提取和分類。
1.1 兩階段病理圖像預處理方法
為增強結直腸癌病理圖像的形態特征,本文使用TSIM對病理圖像進行預處理。TSIM的處理過程如圖1所示。預處理分為兩個階段,在第一階段:為了增強形態特征的細節信息,采用Haar小波變換對圖像進行二級分解,將圖像分解為低頻部分和高頻部分,分解結構如圖2所示,得到一個低頻子頻帶LL1和六個高頻子頻帶LH2、HL2、HH2、LH1、LH1和HH1。對于低頻部分,使用改進的直方圖bin[7]進行處理,對于高頻部分,使用約束最小二乘濾波進行處理,再對低頻部分和高頻部分進行重構;在第二階段,使用自適應震動濾波器[8]對經過Haar小波變換重構后的圖像進行去噪,從而獲得預處理后的增強病理圖像。
1.2 結直腸癌圖像的分類
為獲得更好的形態特征信息,本文使用CBMF對病理圖像進行特征提取,在CNN中引入MFAN,該注意力模塊使用空間變換網絡[9](Spatial Transformer Net?works,STN) 獲得病理圖像中的形態特征信息。MFAN的結構如圖4所示,包括兩個分支,特征圖1和特征圖2是分別從編碼器不同層獲得的特征圖,在第一個分支,上一個編碼層和下一個編碼層獲得的特征圖分別經過STN后,進行減運算,得到不同層直接的形態特征差異信息,然后經過由5×5卷積、3×3卷積和1×1卷積并行組成的卷積層,融合不同編碼層的特征形態信息。在第二個分支,下一個編碼層獲得的特征圖經過1×1 卷積、3×3 卷積、批歸一化(Batch Normalization,BN)、激活函數ReLU、3×3卷積和Softmax函數,再與第一個分支的結果進行乘運算,將乘運算的結果作為MFAN的最終輸出。
CBMF的結構如圖5所示,將ResNet50作為CNN的下采樣編碼器并將MFAN引入網絡中,在獲得更加準確的形態特征后,將其加入解碼器的上采樣中。
2 實驗結果與分析
2.1 實驗數據與評價指標
為驗證本文分類方法的準確性,在實驗中選用結直腸癌組織學數據集[10],該數據集由Aperio數字病理掃描儀獲取,包括八種結直腸癌類型。使用準確率、精確率、召回率和F1-Score四個指標對分類效果進行評價,準確率、精確率、召回率和F1-Score的計算公式分別為:
其中,TP 是分類為陽性的陽性樣本數,FP 是分類為陽性的陰性樣本數,TN 是分類為陰性的陰性樣本數,FN是分類為陰性的陽性樣本數。
2.2 結果與分析
下面通過消融實驗說明TSIM和MFAN在CCBMF中的作用。在消融實驗中,將80%的數據作為訓練數據,20%的已標記數據作為驗證集。實驗結果如表1所示,從表1中可以看出,CNN的分類效果低于其他三組分類方法,說明在CNN 中分別加入TSIM 和MFAN后,能提升對結直腸癌病理圖像的分類效果,CCBMF的分類效果優于其他三組分類方法,說明同時加入TSIM和MFAN能準確獲得形態特征信息,有助于提高分類效果。
為驗證本文分類方法CCBMF 的分類效果,將CCBMF 與現有的分類方法BCBCL[3]、SCBC[4]、BCBR[5]和BCBED[6]進行比較。表2為各分類方法的比較結果,從表中可以看出,CCBMF的分類效果優于現有的分類方法,這是因為CCBMF通過TSIM增強了病理圖像中的形態特征,利用MFAN獲取了較為準確的形態特征信息。
3 結論
本文提出了結直腸癌病理圖像的分類方法CCBMF,該方法利用TSIM增強了病理圖像中的形態特征,通過在CNN中引入MFAN,獲得了更加準確的形態特征信息,使得CCBMF能夠有效提高結直腸癌病理圖像的分類效果。