摘 要: 針對尿沉渣圖像中的紅白細胞,提出了一種基于組合思想的分割方法,即對圖像進行三層處理,將各層的分割結(jié)果進行融合,從而通過多信息互補的方法得到完整的分割結(jié)果。設(shè)計了兩級集成SVM分類器對紅白細胞進行識別。實驗證明,提出的整套算法簡潔高效,精度高,具有較強的普適性。
關(guān)鍵詞: 尿沉渣; 圖像分割; 多信息互補; SVM
中圖分類號: TN957.52?34 文獻標(biāo)識碼: A 文章編號: 1004?373X(2013)17?0118?04
0 引 言
尿沉渣檢查是指通過對尿液中各種有病理意義的有形成分進行分析,來檢驗一個人的腎臟及泌尿系統(tǒng)是否有疾病或者損傷。紅白細胞作為尿沉渣中最具有臨床價值的兩類細胞,是必須要進行檢查的有形成分。讓計算機代替人來完成對紅白細胞的自動分析,關(guān)鍵在于對紅白細胞的分割與識別。
目前,已經(jīng)出現(xiàn)了許多種分割和識別方法。在分割上,文獻[1?3]中提出了閾值分割、聚類、邊緣檢測以及區(qū)域提取等方法。特定地使用某種閾值分割法只能將其中的一部分紅白細胞分割出來。聚類法是通過檢測相似點的簇來對每個聚類進行標(biāo)記,其缺點是聚類數(shù)目事先不可知,而且沒有考慮到不同類別間的交叉性。邊緣檢測通過確定強度值的突變點的位置來區(qū)分不同的區(qū)域,但是僅僅通過邊緣檢測并不能取得整體上較滿意的效果。區(qū)域提取存在停止準(zhǔn)則確定困難以及計算復(fù)雜等缺點。在識別上,文獻[4?6]中提出了線性分類法、模糊聚類、神經(jīng)網(wǎng)絡(luò)以及支持向量機等方法。其中線性分類法無法解決非線性問題,模糊聚類法沒有考慮到類別間的交叉,神經(jīng)網(wǎng)絡(luò)法存在嚴重的過學(xué)習(xí)問題,無法避免局部極小值,得到的解可能是局部最優(yōu)解。
相比之下,支持向量機算法是專門為適用于小樣本學(xué)習(xí)問題而提出的通用學(xué)習(xí)算法。它基于結(jié)構(gòu)風(fēng)險最小化原理,而非傳統(tǒng)的經(jīng)驗風(fēng)險最小化原理,從而能兼顧訓(xùn)練誤差和泛化能力[7]。而且SVM不存在過學(xué)習(xí)問題,得到的解是全局最優(yōu)解,有更好的泛化性能。
綜上所述,對于復(fù)雜的尿沉渣圖像來說,單一地使用某種分割方法很難將尿沉渣中的紅白細胞全部分割出來。為此,通過研究各種分割方法的優(yōu)點,本文提出了三次組合分割算法,將圖像分三層進行處理,在每一層中使用不同的算法對尿沉渣圖像中的紅白細胞進行分割,融合各層分割結(jié)果,從而通過多信息互補的方法得到完整的分割結(jié)果。最后在特征提取的基礎(chǔ)上,對紅白細胞使用SVM方法進行分類識別。
1 紅白細胞分割
結(jié)合尿沉渣圖像的特點,本文針對紅白細胞提出的三次組合分割算法主要分為三步:頂層分割使用自適應(yīng)Canny邊緣檢測結(jié)合形態(tài)學(xué)進行處理;中層分割使用OTSU法閾值結(jié)合形態(tài)學(xué)進行處理;底層分割利用Sobel算子求取圖像的梯度,對求取的梯度圖進行OTSU閾值化,再結(jié)合形態(tài)學(xué)進行處理。最后將各層的分割結(jié)果進行融合,從而通過多信息互補的方法得到完整的分割結(jié)果。算法整體流程圖如圖1所示。
1.1 頂層分割
1.2 中層分割
OTSU法是在判決分析最小二乘原理的基礎(chǔ)上推導(dǎo)得出,計算過程簡單,是一種穩(wěn)定常用的算法。其主要思想是:在對圖像進行閾值分割時,選定的分割閾值應(yīng)使前景區(qū)域的平均灰度、背景區(qū)域的平均灰度與整幅圖像的平均灰度之間差異最大,這種差異用區(qū)域的方差來表示。
1.3 底層分割
經(jīng)過以上兩層分割,尿沉渣圖像中仍舊存在未被分割出來的紅白細胞。這主要是因為這些細胞的邊緣相對模糊,在Canny邊緣檢測或者Otsu法閾值后無法形成閉合區(qū)域,從而導(dǎo)致前兩層分割失效。針對此種情況,本文再次進行了分割,這里稱為底層分割。在底層分割中,首先利用Sobel算子求取圖像的梯度圖,然后對梯度圖進行Otsu法閾值處理,最后再結(jié)合形態(tài)學(xué)完成最終的分割。
1.4 分割效果
各層的分割效果如圖2中各子圖所示。其中圖(a)為一幅尿沉渣原始圖像,里面含有大量的紅白細胞。在頂層分割中使用高低閾值自適應(yīng)的Canny邊緣檢測后的效果如圖(b)所示。在此基礎(chǔ)上進一步采用形態(tài)學(xué)處理。主要的處理依次是:使用半徑為1的圓形結(jié)構(gòu)元素對分割結(jié)果進行膨脹處理;使用同樣的結(jié)構(gòu)元素對膨脹結(jié)果進行閉運算。這兩步處理的主要目的是封閉一些不閉合的輪廓,使其形成閉合區(qū)域。搜索圖像中的閉合區(qū)域,并進行孔洞填充。依據(jù)區(qū)域的幾何特性去除一些明顯的雜質(zhì),比如圓形度,輪廓的粗糙度,面積等。頂層分割結(jié)果如圖(c)所示。在中層使用Otsu閾值后,去除頂層分割結(jié)果得到圖(d)。再結(jié)合形態(tài)學(xué)處理得到中層分割結(jié)果圖(e)。圖(f)為底層分割中使用Sobel算子求取的梯度圖。對圖(e)進行Ostu閾值化,去除以上兩層的分割結(jié)果,并結(jié)合形態(tài)學(xué)處理得到底層分割結(jié)果見圖(g)。將三層的結(jié)果進行融合,實現(xiàn)多信息互補,即可得到完整的分割結(jié)果如圖(h)所示。從圖(h)中可以發(fā)現(xiàn),原圖中所有的紅白細胞基本都已被分割出來。
為了對整套算法的分割精度進行測試,從樣本圖像中一共選取了60幅尿沉渣圖像進行實驗。通過統(tǒng)計圖像中實際存在的紅白細胞總數(shù)和準(zhǔn)確分割后檢測到的細胞總數(shù),計算相應(yīng)的分割精度。其中分割精度是指準(zhǔn)確分割后檢測到的細胞總數(shù)與圖像中實際存在的細胞總數(shù)的比值,具體的分割精度見表1。從表1中的數(shù)據(jù)可以看出,整套分割算法的精度完全達到了醫(yī)用水平。
2 特征提取
為了對尿沉渣圖像中的紅白細胞進行分類識別,在完成紅白細胞的分割以后,要進一步提取兩種細胞的各自特征。提取的特征見表2。
3 紅白細胞的SVM分類
3.1 實驗設(shè)計
SVM的基本思路是:首先用某種非線性映射將輸入向量映射到高維特征空間,然后在這個高維空間中構(gòu)造最優(yōu)超平面,使兩類之間的間隔最大,同時保證樣本的分類誤差盡可能小。
通過對分割出的尿沉渣圖像中各有形成分數(shù)量進行統(tǒng)計可以發(fā)現(xiàn),紅細胞、白細胞以及其他有形成分的概率比為0.55∶0.3∶0.15,紅細胞占的比重過大,這就導(dǎo)致紅細胞被識別為白細胞或者其他有形成分的數(shù)目大,導(dǎo)致除紅細胞之外的有形成分的偽陽率偏高。而且如果僅用一級分類器,由于樣本極不均衡,過分的強調(diào)分類器向某幾個類別偏都會造成不好的結(jié)果。針對這種情況,為了更好地發(fā)揮SVM的優(yōu)勢,本文采用一對多SVM設(shè)計了一種兩級分類器集成的方法。第一級分類器主要識別紅細胞,將識別結(jié)果輸入第二級分類器再繼續(xù)識別白細胞。兩級SVM分類器結(jié)構(gòu)如圖3所示。
3.2 實驗結(jié)果及分析
SVM的實驗是在VC 6.0的環(huán)境下進行的,算法實現(xiàn)語言為C/C++,程序平臺為主頻2.66 GHz的Intel Pentium IV PC。所使用的照片分辨率為576×576,放大倍數(shù)為40倍,未染色,JPG格式。同時為了進行比較,對文獻[3]中的方法也進行了相應(yīng)的實驗,基本思路是:在完成特征提取的基礎(chǔ)上,采用兩級BP神經(jīng)網(wǎng)絡(luò)的方法進行訓(xùn)練和分類。實驗結(jié)果見表3。表3中評估的性能指標(biāo)主要有識別時間、識別率、分類器個數(shù)以及SVM方法中的參數(shù)、支持向量數(shù)等。這里識別時間是計算單個樣本特征的時間和用分類器對其歸類的時間的綜合,取的是大量樣本識別時間的期望。
觀察表3數(shù)據(jù)可以發(fā)現(xiàn),兩級SVM所獲得的識別率和識別所需的時間均明顯優(yōu)于其他兩個實驗,這說明本文提出的識別算法是高效的。這主要有以下幾個原因:充分利用先驗知識對紅白細胞進行分割,根據(jù)面積、圓形度等特征去除一些明顯的雜質(zhì),使分割后的成分中只含有紅白細胞和一些在形態(tài)上和紅白細胞相近的“雜質(zhì)”。這樣避免了對一些不必要的成分進行識別。使用兩級SVM分類器,第一級對紅細胞進行識別,將未被識別為紅細胞的成分輸入到第二級分類器,這樣既減少了樣本數(shù)量且節(jié)約了時間,同時由于大部分的紅細胞都已經(jīng)被識別出去,也降低了白細胞的偽陽率,一定程度上克服了樣本的不平衡帶來的不利影響。
4 結(jié) 論
本文結(jié)合尿沉渣圖像的特點,實現(xiàn)了紅白細胞的自動分割與識別。針對紅白細胞提出了三次組合分割算法,該算法按照自頂向下、逐步分割的思想,分階段、有針對性地進行分割,簡單高效,具有很強的實用性,分割精度達到了97.7%。在識別上,設(shè)計了兩級集成的SVM分類器,識別精度達到了95.8%。實驗結(jié)果表明,本文設(shè)計的整套自動分割與識別方法,處理速度快,精度高,具有很強的普適性。
參考文獻
[1] LINKO S, KOURI T T, TOIVONEN E, et al. Analytical performance of the Iris iQ200 automated urine microscopy analyzer [J]. Clinica Chimica Acta, 2006, 372(1/2): 54?64.
[2] CHIEN T I, KAO J T, LIU H L. Urine sediment examination: a comparison of automated systems and manual micros?copy [J]. Clinica Chimica Acta, 2007, 384 (1/2): 28?34.
[3] 李勇明.尿沉渣圖像自動識別算法的研究[D].重慶:重慶大學(xué),2007.
[4] 傅聰.基于支持向量機的尿液粒子識別分類研究[D].杭州:浙江大學(xué),2008.
[5] 魏宇璋.基于模糊聚類的尿沉渣有形成分分析研究[D].南京:南京信息工程大學(xué),2008.
[6] 王永福.基于神經(jīng)網(wǎng)絡(luò)的尿沉渣有形成分自動分類識別研究[D].杭州:浙江大學(xué),2006.
[7] 張學(xué)工.關(guān)于統(tǒng)計學(xué)習(xí)理論與支持向量機[J].自動化學(xué)報,2000,26(1):32?42.
[8] 唐路路,張啟燦,胡松.一種自適應(yīng)閾值的Canny邊緣檢測算法[J].光電工程,2011,38(5):127?132.
[9] BURGES C J C. A tutorial on support vector machines for pattern recognition [J]. Data Mining and Knowledge Discovery, 1998, 2(2): 121?167.
[10] 張燦龍,唐艷平.一種更高效的尿沉渣自動識別算法[J].計算機工程與應(yīng)用,2010,8(3):232?236.
[11] 沈美麗,陳殿仁.支持向量機在尿沉渣有形成分分類中的應(yīng)用[J].電子器件,2006,29(1):1?2.