申楠,邢素霞,何湘萍,潘子妍,王瑜
1.北京工商大學人工智能學院,北京100048;2.北京海淀婦幼保健院乳腺病防治中心,北京100080
乳腺癌作為一種具有高發病率和死亡率的惡性腫瘤,已成為威脅全球女性健康甚至生命的主要殺手。乳腺癌的早期病癥在乳腺鉬靶圖像中主要表現為微鈣化點。乳腺鉬靶圖像中存在較多的乳腺纖維組織,其在圖像中表現為高亮區域,而微鈣化區域在圖像中表現為細小的高亮區域,因此乳腺纖維組織和微鈣化區域在亮度即灰度值上易混淆,增大了乳腺鉬靶圖像微鈣化區域的檢測難度。為此,很多研究在微鈣化區域檢測上做出了很多有意義的探索,如彭慶濤等[1]提出基于小波分析和灰度紋理特征相結合的微鈣化區域提取方法,微鈣化點檢出率為85%;商小寶[2]提出一種基于旋轉不變局部二值模式的早期乳腺鈣化點檢測方法,真陽性率為95.6%,假陽性率為5.6%;王科舉[3]利用周圍區域矩陣反映射乳腺微鈣化區域特征,并結合隨機森林分類器,特異性達到88%,曲線下面積達到0.922 4;Karale 等[4]提取乳腺微鈣化區域的密度特征、形狀特征、不變矩、Haralick 特征、基于方向梯度直方圖的特征,每幅圖像的平均誤報率為2.59%,并能達到100%的靈敏度;Suhail等[5]利用改進的Fisher 線性判別方法對微鈣化區域進行線性變換,平均準確率達96%。這些研究均為微鈣化點的計算機輔助診斷的臨床應用做出了貢獻。
為進一步提高微鈣化區域的檢測準確率,降低檢測假陽性率,本研究提出一種基于Adaboost-決策樹(Adaboost-Decision Tree,AB-DT)的乳腺微鈣化區域真假陽性檢測方法,并采用10 折交叉驗證確定AB-DT模型的性能。
乳腺鉬靶圖像為灰度圖像,鈣化點的形態各異,有管狀、圓形、爆米花狀、輪圈狀、桿狀、球狀、點狀和發育不良型[6](圖1)。而乳腺組織區域中微鈣化點區域相對正常區域在紋理、灰度方面差異明顯[7],因此可提取感興趣區域(Region of Interest,ROI)的紋理和灰度特征作為分類器的輸入特征。本研究提取ROI的Haralick 紋理特征和灰度游程矩陣特征建立特征集。

圖1 鈣化點類型Fig.1 Types of calcifications
Haralick 等[8]于1973年提出基于灰度共生矩陣的紋理特征統計方法。灰度共生矩陣反映了圖像灰度分布關于方向、局部鄰域和變化幅度的綜合信息,由于灰度共生矩陣的數據量較大,一般不直接作為區分紋理的特征,而是把基于它構建的一些統計量作為紋理分類特征。為簡化特征提取的計算過程,僅對ROI內每個像素與其8 鄰域所組成的像素對進行統計,對應距離d= 1,且不考慮方向角度。
利用灰度共生矩陣提取19 個特征參數,分別是[9]:能量、熵、對比度、相異性、相關性、自相關系數、突出聚類、陰暗聚類、差熵、差方差、同質性、相關信息度1、相關信息度2、逆差距、最大概率、和平均、和熵、和方差以及平方和,定義如表1所示,表2為所用到的變量定義。

表2 Haralick紋理特征的變量描述Tab.2 Variable description of Haralick texture features
灰度游程矩陣統計圖像中某個方向上同灰度值g連續的像素長度l的出現頻率,是一個二維統計矩陣[10]。設一個M×N大小圖像的統計矩陣為p(i,j|θ),即在θ方向構建的游程矩陣在(i,j)坐標下的位置,Ng為最大像素值,Nr為不同的像素沿方向θ的行走距離[11]。基于灰度游程矩陣可以計算7 個紋理特征參數[12]:短游程優勢、長游程優勢、長游程不均勻性、游程百分比、灰度不均勻性、低灰度級游程優勢和高灰度級游程優勢,詳見表3。

表3 基于灰度游程矩陣的特征定義Tab.3 Feature definition based on grey-level run length matrix
Schapire 等[13]對Boosting 算法進行改進得到Adaboost算法。Adaboost算法運用迭代的思想,在使用樣本訓練集的過程中,挑選其中的關鍵分類特征,增加前一輪被錯誤分類的樣本的權重,減小被正確分類的樣本的權重,重復多次,逐步訓練各弱分類器,并采用加權多數表決的方法調整各弱分類器的權重,最終篩選出權重系數最小的弱分類器構造成一個強分類器。
Adaboost 算法具有很強的適應性和靈活性。弱分類器可以與大多數的分類器兼容,如決策樹、支持向量機、樸素貝葉斯以及K 最近鄰等算法,可根據實際應用組合分類器,以獲得最佳的分類識別效果[14]。
決策樹是一種重要的機器學習和數據挖掘算法[15]。由于決策樹算法易于理解和實現,對噪聲數據具有良好的魯棒性,與此同時具有很好的預測性能,因此被廣泛用于各種實際領域。決策樹是一種分類樹結構的預測模型,描述了對象屬性與對象值之間映射屬性關系。學習時,根據最小化損失函數的原則,利用訓練集數據建立決策樹模型;預測時,利用決策樹模型對新的數據進行分類。其中,單層決策樹(也稱決策樹樁)是一種較為典型的簡單決策樹,只基于單個特征來做決策,僅有一次分裂的過程[16],因此處理數據非常迅速、簡單易行、實時性好,十分適合作為弱分類器。
DDSM (Digital Database for Screening Mammography)是由南佛羅里達大學于1999年提供數字化乳腺圖像庫,該數據庫是一個高分辨率的乳腺鉬靶圖像標準數據庫,含2 620 個病例[17]。每個病例包含右側頭尾位、左側頭尾位、右側側斜位、左側側斜位這4個視圖的圖像(圖2)。每個視圖的標注文件包含醫師手動標注的病灶區域、病灶類型、病灶等級等相關信息。

圖2 DDSM圖像Fig.2 Images from digital database for screening mammography
將來自DDSM 的圖像轉換格式后,從中手動截取400 幅128×128 像素的ROI,其中200 幅為醫生標注的鈣化區域圖像,另外200 幅為疑似鈣化區域圖像。如圖3所示,圖3a 為乳腺鉬靶的原始圖像,圖3b為用OVERLAY 文件生成的金標準圖像,圖3c 和圖3d 分別為從乳腺鉬靶圖像中截取的疑似鈣化區域和微鈣化區域圖像。

圖3 乳腺鉬靶圖像、對應的金標準圖像及其所含的疑似鈣化區域和微鈣化區域放大圖Fig.3 Mammography,the corresponding gold standard image and the enlarged images of suspected calcification region and microcalcification region
乳腺微鈣化區域檢測方法流程如圖4所示。提取圖像的Haralick 紋理特征及灰度游程矩陣特征,26維特征組成特征集來量化乳腺的微鈣化區域。決策樹作為弱分類器,通過Adaboost 集成算法生成強分類器AB-DT。

圖4 乳腺微鈣化區域檢測方法流程圖Fig.4 Flowchart of breast microcalcifications detection
在AB-DT 算法中,決策樹的數量k影響著分類器的性能,當k值較小時,AB-DT 算法的分類誤差較大,算法分類性能差;而AB-DT 算法的復雜性與k值成正比,k值越大,算法的復雜度越高,運行時間也越長。在400幅ROI圖像中,隨機選取80%的ROI圖像作為訓練集,剩余的20% 作為測試集。通過MATLAB 中的集成學習工具箱,搭建AB-DT 模型。設置決策樹的數量為500,繪制決策樹的數量與分類錯誤率的關系曲線,如圖5所示。橫坐標表示決策樹的數量,縱坐標表示分類錯誤率。
由圖5可知,當k≥484 時,分類錯誤率趨于穩定,圖像存在多個分類錯誤率最低點,綜合分類準確率和運算復雜度,決策樹的數量k應設置為462(即第一個分類錯誤率最低點的橫坐標)。

圖5 決策樹數量與分類錯誤率的關系曲線Fig.5 Relationship between the number of decision trees and classification error rate
為驗證和量化此分類算法的效果,采用準確率(Accuracy)、敏感性(Sensitivity)、特異性(Specificity)、陽性預測值(Positive Predictive Value,PPV)、陰性預測值(Negative Predictive Value, NPV)及F1分數(F1-score)對訓練的模型進行評價,其定義如下所示。

設陽性代表微鈣化區域,陰性表示非鈣化區域。式中,TP(True Positive,真陽性)表示測試集中被正確分類的微鈣化區域樣本個數;FP(False Positive,假陽性)表示測試集中被錯誤分類的微鈣化區域樣本個數;TN(True Negative,真陰性)表示測試集中被正確分類的正常組織樣本個數;FN(False Negative,假陰性)表示測試集中被錯誤預測的正常組織樣本個數。
采用10折交叉驗證來驗證所使用的AB-DT模型的性能,將樣本集中所有的樣本數據隨機分成10組,選擇其中9組數據作為訓練樣本,訓練出分類模型,最后1組樣本數據作為測試數據,驗證訓練的模型的準確率。
將決策樹的數量設置為462,測試結果顯示模型分類準確率為91.75%,敏感性為91.75%,特異性為91.79%,陽性預測值為92.35%,陰性預測值為91.56%,F1分數為0.918 7。實驗結果表明此模型具有較強的學習能力和泛化能力,并且具有較高的預測精度。
為進一步驗證AB-DT算法的魯棒性與有效性,將本文算法與其他文獻中所提方法進行性能比較。Cai等[18]提出基于卷積神經網絡的乳腺鈣化區域分類算法,該算法在中山大學附屬腫瘤醫院和南方醫科大學附屬南海醫院的數據庫上取得88.59%的準確率,89.32%的精準率,86.89%的特異性和88.43%的敏感性;王科舉[3]提出基于周圍區域矩陣的微鈣化區域檢測算法,在MIAS數據集上得到88.84%的準確率,90.00%的敏感性和88.80%的特異性;蔡雅麗等[19]利用局部二值模式和灰度共生矩陣特征進行乳腺鈣化檢測,支持向量機、隨機森林和Adaboost算法均可較好地區分正常樣本和鈣化樣本,檢測的準確率分別為90.0%、81.5%、87.5%,敏感性分別為83.60%、78.40%、79.30%,特異性分別為91.10%、86.00%、87.00%;Chakravarthy等[20]提出螢火蟲算法進行微鈣化區域的檢測,在MIAS數據庫中的實驗準確率為86.75%,敏感性為90.08%,特異性為83.42%,陽性預測值為86.78%,陰性預測值為90.21%,F1分數為0.874 2。比較每種算法的準確率、敏感性和特異性,本文提出的AB-DT算法在微鈣化區域檢測上具有更好的準確率、敏感性、特異性。
本研究針對微鈣化點檢查精度不高的問題,提出一種乳腺鉬靶圖像微鈣化真假陽性檢測的方法。首先提取ROI的Haralick紋理特征和灰度游程矩陣特征,然后結合Adaboost算法和決策樹算法,構建強分類器ABDT對區域進行分類,將微鈣化區域和正常組織分離開來,并通過10折交叉驗證,驗證了該分類方法的有效性,分類正確率高達91.75%。本研究提出的方法在輔助乳腺微鈣化點檢測中具有一定的臨床應用價值。