高瑋瑋,左晶
1. 上海工程技術大學 機械工程學院,上海 201620;2. 江蘇省中醫院 眼科,江蘇 南京 210029
目前,糖尿病已是一種嚴重威脅人類健康的頑疾。據預測,將來全球糖尿病患者將會占總人口的4.4%[1]。我國情況更為嚴峻,糖尿病患者已達9240 萬,位居全球之首[2]。糖尿病還會帶來一系列并發癥,其中以糖尿病視網膜病變(簡稱“糖網”,Diabetic Retinopathy,DR)發生率最高。糖網影響視力,目前已成為成人致盲的首要原因[3]。因為糖尿病患者均面臨著發展為DR 的高風險,且DR 具有進行性和不可逆性,故對于已患糖尿病的患者而言,如何在還未發生視力損傷的情況下及時準確地篩查出其是否患有DR,不僅為及早診斷、及早治療從而挽救患者視力提供先機,還可節約大量寶貴的醫療資源[4]。目前,臨床存在多種糖網篩查手段及方法[5-6],其中眼科醫生普遍認為眼底照相檢查最適合用于DR 的篩查和隨診[7]。但該方法現階段基本依靠人工閱片,這嚴重制約了DR 篩查大規模的實施。故早在20 世紀七八十年代就有研究人員提出利用計算機采用數字圖像處理與分析技術來實現這一任務,其中又以對硬性滲出(Hard Exudates,EXs)區域自動檢測的研究最為廣泛、深入。
最初,研究人員探求利用灰度級特征提取黑白眼底圖像中的EXs 區域,不過這需依據直方圖人為選擇分割所需閾值[8];Philips 等[9]也提出了基于灰度值的EXs 分割方法,但需手動圈定ROI;后來,Gardner 等[10]利用BP 神經網絡實現了EXs 的自動檢測;Sinthanayothin 等[11]提出利用與“Moat Operation”結合的循環區域增長法實現EXs 的自動檢測,但其檢測結果很大程度上依賴所選取的種子點位置和停止準則;Osareh 等[12]利用FCM 算法分別結合神經網絡與SVM 完成了EXs 的自動識別;Zhang 等[13]在Luv彩色空間利用改進的FCM 算法與SVM 完成了EXs 的自動識別;Niemeijer 等[14]運用數學形態學以及K 近鄰分類器實現EXs 的自動識別;Jaafar 等[15]提出的方法首先通過局部對比度獲取EXs 候選區域,在此基礎上利用拆分合并算法篩選出真正的EXs;Soares 等[16]提出采用尺度空間曲率以及動態閾值的方法自動分割眼底圖像中EXs;Esmaeili等[17]所提出的方法通過曲波變換方法獲取了眼底圖像中的該病灶。目前,國內在該方面的相關研究報道不多,主要有林蔚[18]提出利用基于K 近鄰圖的區域合并算法實現眼底圖像中EXs 的分割,高瑋瑋等[19]提出的基于數學形態學的EXs 自動檢測方法。
篩查意味著所要處理的數據對象數量龐大,即在臨床中要求篩查系統所使用的算法不僅具有很強的普適性,而且還得具有較高的效率。因此,糖網自動篩查系統中的算法應當具備較強的可靠性和高效性,為此充分利用訓練好的模式分類器強大、高效的識別能力,提出一種基于閾值分割及模式分類器的EXs 自動檢測方法,并結合建立基于眼底圖像的糖網自動篩查系統這一應用背景,深入對比研究多種EXs 自動檢測方法的性能,以期實現能應用于臨床的糖網自動篩查系統。
源圖像為126 幅由Canon CF-60 DSI 眼底照相機拍攝的分辨率為3504×2336 像素的JPG 彩色眼底圖像,具體來源于蘇省南京市某醫院。在實際使用時,對原圖進行了裁減并進行了壓縮,即實際處理圖像的分辨率為800×600像素。將這126 幅眼底圖像交由眼科醫師判定,其中早期DR 眼底圖像有68 幅,均有EXs(圖1)出現,其余為正常眼底圖像。

圖1 彩色眼底圖像及EXs細節
將這126 幅眼底圖像隨機分為兩組,其中,第一組(包括40 幅早期糖網病人眼底圖像和30 幅正常眼底圖像)為分類器提供訓練樣本,確定分類器結構;第二組(共56 幅,分別為28 幅早期DR 病灶圖像以及28 幅正常眼底圖像)用來評測方法的自動檢測性能。
實驗采用Intel Core Duo E7500 CPU,6GB RAM 的計算機,MATLAB R2010a 的軟件環境。
基于閾值分割及模式分類器的EXs 自動檢測方法首先利用閾值分割獲取EXs 候選區域;然后,對候選區域的特征集進行優選;最后,利用優化后的特征集及相應人工判定結果分別建立RBF 神經網絡分類器及SVM 分類器,從而實現對EXs 的自動檢測,具體如圖2 所示。

圖2 基于閾值分割及模式分類器的EXs自動檢測算法流程圖
閾值分割是一種最簡單直接的圖像分割方法,可實現對背景以及噪聲的有效濾除。目前常用的有直方圖法、最大類間方差法(Otsu)、迭代法等。其中Otsu 閾值法是基于類間方差最大的非參數、無監督的自適應閾值選擇方法,運算速度快,是一種較好的閾值分割法。但不足的是它只考慮了類間距,沒有考慮類的內聚性,故當圖像的噪聲干擾較大時,不能得到理想的分割結果,但它對類間方差為單峰的圖像能產生較好的分割結果(通過分析多幅眼底圖像G 通道灰度直方圖發現,眼底圖像G 通道的灰度直方圖都近似呈單峰狀,如圖3c 所示。波峰對應背景像素,與波峰右側相關的就是想要提取的白色區域,即EXs 候選區域),鑒于此,選用一種改進的二維Otsu 自適應閾值分割方法[20]來對眼底圖像G 通道進行粗分割并“剔除”視盤(對于視盤的分割采用前期研究[19]中提出的方法)來獲取EXs 候選區域。該方法在克服了傳統Otsu 閾值分割信息不完備的同時還具有較強的抗噪性能,故對EXs 的分割效果好,圖3a 的粗分割結果具體見圖3d。

圖3 眼底圖像G通道直方圖及粗分割結果
利用該閾值分割方法對作為訓練樣本的70 幅眼底圖像進行粗分割,并從中去除視盤從而獲取了2570 個EXs 候選區域(據眼科醫師判斷,其中1160 個為真EXs,1410個為假EXs)。
對上述獲取的EXs 候選區域而言,為利用模式分類器將其中的真、假EXs 準確區分開來,需利用這些區域的特征作為模式分類器的輸入對其進行訓練。對EXs進行識別時,眼科醫生往往會從亮度、面積、邊緣等入手,而這些方面可通過以下24 個特征進行一定程度的表述[21-22],具體見表1。

表1 EXs特征集
特征用來設計、訓練模式分類器,但隨著特征數量的增加,誤分類的可能性亦會隨之升高,故需對上述提取出的24 個特征進行選擇。常規的特征選擇算法——判別分析法(Discriminate Analysis,DA)要求數據呈多元正態分布以及滿足方差齊性的要求。而另一種特征選擇算法——邏輯回歸分析法(Logistic Regression,LR)對數據的分布限制條件較少,當數據不為正態分布或者各類的協方差差別較大時,LR 性能更優[23]。利用軟件SPSS 18.0 對粗分割階段獲取的2570 個EXs 候選區域的24 個特征進行分析,得到數據的具體情況是:對上述特征進行Kolmogorov-Smirnov 檢驗和Shapiro-Wilk 檢驗,發現均不符合正態分布;另外,Leven’s 方差齊性檢驗表明除μR、μG、、CR、CG、CP外的其它特征均不符合方差齊性要求。另外,是否為EXs 可概括為一個二分的分類變量,故此處采用LR 對提取出的24 個特征進行選擇最為合適。
對粗分割階段獲取的2570 個EXs 候選區域的24 個特征,利用二項Logistic 回歸模型采用“逐步回歸”的方法進行選擇(其中a進取0.05,a出取0.1),具體選擇結果見表2。

表2 特征選擇結果
模型建好后,采用-2對數似然值(對數似然比值乘以-2)來度量模型對數據的擬合度。經過優化的特征集與完整特征集對訓練樣本的擬合度(-2 對數似然值)為990.277,分類準確性為88.0%。可見,兩特征集的擬合度相差無幾;但就對訓練樣本的分類結果而言,明顯優化特征集性能更優。
將2570 個候選區域經過優化的特征參數與對該區域是否為EXs 的人工判定結果分別作為訓練集的輸入和輸出,對RBF 神經網絡以及SVM 進行訓練及預測。
2.4.1 RBF神經網絡分類器的訓練及預測
RBF 神經網絡分類器訓練時,隱層節點個數Num 不斷增加,直至網絡輸出誤差小于所設定期望值goal。此外,還需對參數spread 進行合理設置。在利用“newrb”命令建立RBF 網絡模型時,采用10 倍交叉驗證(將2570 個EXs 候選區域隨機分為10 組,依次將其中9 組做訓練,1組做測試)對網絡進行訓練及預測。令擴展速度spread[1,5]在間以步長0.1 進行取值,對每一個取值進行上述10 倍交叉驗證,分別得到網絡在最不理想情況下的預測結果(圖4)。圖4 表明,當spread 為2.3 時,得到的網絡在最不理想情況下的分類準確率最高,為93.27%,此時靈敏度為92.61%,特異性為95.13%。故當spread 選取此值時,無論采用何種樣本對網絡進行訓練,預測結果均可達到令人滿意的水平。

圖4 擴展速度不同取值時10倍交叉驗證情況下的網絡最不理想預測結果
當訓練結束后即可得到確定的RBF 神經網絡結構,此時當輸入新的樣本時即可進行是否為EXs 的自動判別。
2.4.2 SVM分類器的訓練及預測
在SVM 中常用的核函數中,高斯徑向基核函數具有較強的非線性映射能力、較少的超級參數、數值實現也較為簡單,故在本研究中選用基于高斯徑向基核函數作為該方法中SVM 的核,在此基礎上要得到結構確定的SVM 分類器需確定兩個參數:懲罰參數和核函數參數。為獲取分類性能最佳的SVM 模型,需得到最佳的懲罰參數和核函數參數。由于遺傳算法(Genetic Algorithm,GA)具有很強的全局搜索能力,且這種搜索能力不依賴于特定的求解模型故采用GA 對SVM 的這兩個參數進行優化,具體優化流程如圖5 所示。

圖5 GA優化C及γ的算法流程圖
利用候選區域經過優化的特征集以及相應的人工判定結果分別作為訓練集的輸入和輸出,對SVM 進行訓練及預測,具體參數分別為C=2.39,γ=1.25。尋優結果顯示SEval、SPval、ACCval 的 值 分 別 為95.13%、98.01%、96.72%。同樣,訓練完畢后即得到了確定的SVM 模型,即可對新的輸入樣本進行是否為EXs 的自動識別。
作者此前研究并發表了一種基于數學形態學的EXs 自動檢測方法[19],為探求最為滿足實際需求的EXs 自動檢測方法,有必要對包括數學形態學方法在內的多種EXs 自動檢測方法進行對比研究。
利用數學形態學方法和建立好的RBF 神經網絡分類器以及SVM 分類器分別來識別第二組眼底圖像中的EXs,具體結果是:對于病灶圖像(共28 幅),兩種方法均檢測到了EXs;對于健康眼底圖像(共28 幅),數學形態學方法在2 幅中圖像中檢測到了EXs,而閾值分割及模式分類器方法則在3 幅圖像(其中2 幅與數學形態學方法一致)中檢測到了EXs。具體檢測結果見表3,其中,同一眼底圖像的EXs 具體檢測結果如圖6 所示。此外,文獻[12]提出的FCM 結合BP 神經網絡方法、文獻[18]提出的基于K近鄰圖的區域合并算法對該組圖像的檢測結果也見表3。

表3 EXs具體檢測結果

圖6 EXs自動檢測結果
由表3 發現,所提出的兩種EXs 分割算法均已達到英國糖尿病協會(British Diabetic Association)于1997 年提出的DR 病灶自動篩查算法標準[24]:靈敏度最低80%,特異性最低95%。此外,從表3 還可發現:基于閾值分割及模式分類器(包括RBF 神經網絡分類器和SVM 分類器)方法的檢測精度優于文獻[12,18],略低于文獻[19],但檢測效率均優于文獻[12,18-19];而對于這兩種分類器之間而言,由表3 可發現(具體參見病灶區域水平評價指標),SVM 分類器的識別率明顯較RBF 神經網絡分類器更高。此外,對于糖尿病患者而言,其視網膜病變情況會受病情治療、控制與病程等因素影響,故只有保證較高的檢查頻率才能及時、有效地發現視網膜的相關病變。因此就DR自動篩查的實際應用而言,基于閾值分割及SVM 分類器的EXs 自動檢測方法性能更佳。
眼底圖像中EXs 的自動識別是構建糖網自動篩查系統的重要環節,直接影響系統的篩查性能。只有快速、有效的自動檢測方法才能滿足臨床對篩查的要求。據此充分利用訓練好的模式分類器強大、高效的識別能力,提出一種基于閾值分割及模式分類器的EXs 自動檢測方法,并與包括基于數學形態學的EXs 自動檢測方法在內的多種EXs 檢測方法進行了對比研究。實驗結果表明,與其他硬性滲出分割方法相比,基于閾值分割及模式分類器(包括RBF 神經網絡分類器和SVM 分類器)方法在保證較高檢測精度的同時效率也較高;而對于RBF 神經網絡分類器和SVM分類器之間而言,明顯SVM 分類器的性能更優。故就糖網自動篩查的臨床應用而言,基于閾值分割及SVM 分類器的EXs 自動檢測方法性能更優。該研究工作為構建基于眼底圖像的糖網自動篩查系統提供了可靠的技術支持。對糖網自動篩查系統而言,在實現了高效的EXs 自動檢測基礎上,剩下的其他早期糖網病灶,如視網膜內出血等的高效自動檢測則將是下一步的研究重點。