張從鵬,馬 巖,毛 潭,熊國順
(北方工業大學 機械與材料工程學院,北京 100144)
血涂片白細胞顯微視覺檢驗是臨床醫學中的重要檢驗項目。利用計算機視覺技術實現白細胞檢驗的自動化和智能化是當前的熱點和發展趨勢。國內外很多學者針對如何更好地分割和識別白細胞提出了很多方法。CSEKE[1]基于Otsu算法,通過遞歸方法最大化圖像中黑色、灰色和白色區域之間的類內方差并自動篩選出分割閾值,實現白細胞的分割,但該方法無法將細胞漿分割出來。2012年,MOHAPATRA等人[2]基于范函鏈接型網絡對白細胞分割,根據各區域像素按顏色分類,將白細胞分割為細胞核和細胞質兩部分。HUANGA等人[3]利用共生矩陣和形態信息提取85個紋理和形態特征,采用主成分分析(principal component analysis,PCA)進行特征降維、K均值進行五分類,該方法對于嗜中性粒細胞的分類準確率比較低。REZATOFIGHI等人[4]首先利用Gram-Schmidt正交化增強白細胞區域顏色向量,由灰度直方圖確定分割閾值并分割出白細胞核,然后采用snake分割細胞漿。WANG等人[5]利用梯度矢量流輪廓法實現白細胞和細胞核的提取,并根據白細胞形態學等特征利用支持向量機(support vector machine,SVM)對白細胞進行分類,但在分類精度上還有待提高。LI等人[6]基于mean-shift聚類算法在細胞圖像上得到可視化紋理的區域塊,并根據區域塊的特征參量利用人工神經網絡進行白細胞識別。LIU等人[7]基于C-Y顏色空間和形態學運算得到白細胞圖像,并閾值分割對比度拉伸的G圖像,完成細胞核的提取。HUAI等人[8]將細胞核和細胞質的旋轉不變共生局部二值模式特征和常規形態學特征進行歸一化處理,并利用隨機森林分類器完成白細胞分類。上述分割和分類算法雖側重角度不同,但都是為了提高白細胞的分類識別率。
本文中搭建了面向顯微視覺檢測系統,研究血涂片自動檢驗中的關鍵技術問題,擬采用高效圖像提取方法和分類識別算法,提高檢測系統的檢測效率和精度,滿足顯微視覺平臺對白細胞臨床形態學自動檢驗的需求。
顯微形態學檢驗平臺由顯微光學成像系統、計算機視覺系統、自動控制系統等組成[9]。光學成像系統選用奧林巴斯光學顯微鏡,搭配UPLFLN100X02油鏡。利用230萬像素的彩色CCD工業相機對血涂片顯微圖像進行采集。圖1所示的玻片為血細胞涂片。

Fig.1 Micro-vision detection system for blood cell smears
白細胞圖像預處理包括:通過中值濾波器對采集到的細胞圖像進行平滑處理,去除細胞圖像上的顆粒噪聲;采用相應的濾波器進行細胞圖像邊緣的銳化。
2.2.1 RGB模型與HSI模型對比 為了提高白細胞背景剝離方法的簡易性,將預處理后的血細胞圖像采用固定閾值方法分割成像素為200×200的白細胞子圖。然后將彩色細胞子圖轉換為R,G,B三通道[10]的單通道圖像。實驗中發現,除了G通道細胞核灰度值跟背景灰度值上有較大的差異外,R通道和B通道表現不明顯。因此,RGB模型不適合用來分割圖中的白細胞。
HSI顏色模型可用作白細胞顯微圖像的分割顏色模型[11]。通過對細胞圖像的H,S,I單通道圖像灰度觀察發現,H通道表現出適合白細胞背景剝離的良好性能,與參考文獻[12]中結論基本一致。模型灰度圖如圖2所示。

Fig.2 Comparison of RGB model and HSI model of white blood cells
綜上分析,本文中采用H通道圖像進行白細胞背景剝離。
2.2.2 區域生長法背景剝離 區域生長[13]是根據一種事先定義的準則將像素或者子區域聚合成更大區域的過程。其相似性質可包括平均灰度值、紋理、顏色等信息。區域生長算法實現的步驟如下:(1)對圖像目標區域進行掃描,令R表示整幅圖像區域,根據預設相似準則,將目標圖像區域分裂成若干不重疊的子區域Ri,i=1,2,3,…,n;(2)以Ri為中心,判斷其鄰域Rj是否滿足相似準則,若滿足,則合并Ri和Rj,對任何i和j都有i≠j;(3)以合并后的Ri和Rj為中心,重復步驟(2);(4)當無法進行新的合并時,返回步驟(1);(5)重復步驟(1)~步驟(4),當無法進行新的分裂時,生長結束。
那么分割可以看成將整幅圖像R劃分為n個子區域R1,R2,…,Rn的過程,并滿足以下條件:(1)U(Ri)=R;(2)Ri是一個連通區域,i=1,2,3,…,n;(3)Ri∩Rj=空集,對任何i和j都有i≠j;(4)P(Ri)=ture,i=1,2,…,n;(5)P(Ri∪Rj)=false,i≠j。)
在血細胞H單通道圖像上,使用區域生長分割算法后,會得到很多不同的子區域[14],可以精確地將整個白細胞在圖中與其它紅細胞以及背景分割開來,如圖3所示。然后根據先驗知識,除背景區域之外,整張圖像中選取最靠近圖片中心的區域,得到白細胞圖像。

Fig.3 Cell region growth segmentation diagram
最大類間方差法是1979年由日本學者OTSU提出的,簡稱大津法[15],是一種自適應閾值確定的方法。根據圖像的灰度特性,將圖像分為前景和背景兩個部分。當取最佳閾值時,前景與背景之間差別是最大的,評價差別的標準就是最大類間方差。通常細胞核與細胞質在RGB顏色模型的B通道上灰度級別存在較大差異,在上一步進行白細胞背景剝離的基礎上,擬采用細胞核與細胞漿作為白細胞背景剝離后B通道灰度圖像的前景和背景,利用大津法進行細胞核的提取。
設背景剝離后的B通道白細胞圖像為I(x,y),細胞核和細胞漿的分割閾值記作T,細胞核區域像素比例為w1,平均灰度值為μ1;細胞漿區域像素比例為w2,平均灰度值為μ2。白細胞平均灰度值為μ0,類間方差為g。令圖像大小為M,細胞核像素數為N1,細胞漿像素數記作N2,則:
w1=N1/M
(1)
w2=N2/M
(2)
N1+N2=M
(3)
w1+w2=1
(4)
μ0=μ1×w1+μ2×w2
(5)
g=w1×(μ0-μ1)2+w2×(μ0-μ2)2
(6)
將(5)式代入(6)式得到g的等價表達式:
g=w1×w2×(μ1-μ2)2
(7)
采用遍歷的方法使類間方差最大的閾值T即為所求。通過對B通道白細胞圖像閾值為T的閾值分割,即得到細胞核圖像與細胞漿圖像。從灰度直方圖角度觀察,灰度圖橫坐標為灰度等級,取值范圍是0~255,縱坐標為每個灰度等級相應的像素個數,最大類間方差的過程其實是在尋找前景和背景兩個灰度波峰之間的波谷值,如圖4所示。圖4b和圖4c中橫坐標為灰度等級,縱坐標為像素個數,橫縱坐標均為無量綱物理量。

Fig.4 Valley threshold of channel B
圖4b為灰度圖原圖,存在較多毛刺,確定波谷值時會產生偏移。進一步采用平滑的方法對原灰度圖進行擬合,如圖4c所示。平滑后的直方圖可以清晰地找到波谷點,從而確定分割的閾值。利用波谷點閾值對白細胞B通道灰度圖像進行細胞核提取,得到細胞核和細胞漿圖像,如圖5所示。
本文中將預處理后的圖片,在H通道上采用區域生長的方法進行白細胞的背景剝離。并在提取出白細胞的基礎上,將白細胞的細胞核與細胞漿作為圖像的前景與背景,在白細胞B通道圖像上利用大津法,實現了細胞核的提取。圖6為白細胞完整分割流程。圖6h灰度圖中橫坐標為灰度等級,取值范圍是0~255,縱坐標為每個灰度等級相應的像素個數。

Fig.5 Nucleus extraction results

Fig.6 Leukocyte segmentation process
在應用反向傳播(back propagation,BP)神經網絡[16]進行分類時,訓練集數據占有重要的地位,直接影響分類器的質量。選取具有代表性且分割效果較好的白細胞子圖作為訓練集,可以避免因為過分割或欠分割造成的提取特征參量偏差,并增強分類器的魯棒性。然后對測試集中白細胞圖像進行特征提取,組建特征向量,然后傳入訓練好的BP神經網絡分類器進行分類。
白細胞圖像的分割是為了提取對細胞核和細胞漿描述的特征參量[17],擬采用形態、顏色、紋理3個方面對細胞核和細胞漿進行特征提取。
3.2.1 形態特征 提取的細胞的形態特征[18]包括細胞核的分葉數,細胞核的凸性,細胞核的偏心率,細胞核的伸長度,細胞核的圓形度,細胞的面積、周長、圓形度、核質比,以及形狀因子。
3.2.2 顏色特征 顏色特征[19]選取細胞,細胞核以及細胞漿在R,G,B這3個通道上的灰度均值,方差以及偏斜率。
3.2.3 紋理特征 紋理特征選取細胞、細胞核和細胞漿像素的灰度共生矩陣[20],求取其能量、對比度、逆差矩、熵、相關性。
BP神經網絡的工作原理是將樣本數據通過輸入層、經隱含層向網絡輸出層進行正向傳遞,傳遞過程稱為正向傳播。樣本數據經過多層網絡計算,將得到的結果與標注的分類標簽進行比較,通過損失函數計算誤差,然后再由輸出層向輸入層進行反饋調節,這種反饋調節機制稱為反向傳播。通過反饋信號,每層神經元進行自我更新,逐層反饋到輸入層。其中,反饋誤差信號就是各個神經元更新權值的依據。本文中擬采用3層網絡架構,選取sigmoid函數作為激活函數。
(1)確定網絡節點數。在白細胞的形態特征、顏色特征、紋理特征中選取了17種特征作為輸入層節點數,即m=17,輸出層節點數對應白細胞的常規分類種數,即n=5,隱含層節點數l的確定參考如下公式:

(8)
式中,a取0~10的常數,通過實驗方法確定節點數l=12。
(2)特征參量歸一化。將白細胞特征參量進行歸一化操作,避免數據量級差別帶來的計算偏差。
(3)網絡初始化和算法選擇。初始化階段,給予權重系數W一個隨機數(-1.0~1.0),學習速率為0.1,迭代次數為500次。然后采用梯度修正法和反向錯誤傳播算法。
在圖1所示的顯微視覺平臺上,完成了1075幅高質量白細胞圖像采集,其中訓練集數據是508幅,567幅作為測試集數據。實驗結果如表1所示。
由實驗結果可以看出,對5類常見白細胞的識別

Table 1 Experimental results of leukocyte recognition
率為88.2%~98.2%, 由于嗜堿性粒細胞其表面顆粒度復雜,在細胞核提取過程中容易造成過分割和欠分割的現象,導致分割方法失效。故分類過程中取得了較低的識別率。
良好的分割是識別的前提,精確的分割結果可以得到白細胞的高識別率。如表1所示,白細胞樣本綜合識別率為95.6%,在臨床應用中取得預期效果。
面向血細胞形態學臨床檢驗應用需求,研究了白細胞的顯微視覺圖像人工智能識別算法。通過實驗篩選,白細胞圖像顏色模型采用的背景分割方法具有較高的效率和精度;并在背景剝離的基礎上,利用大津法實現了白細胞細胞核和細胞漿的有效提取;設計了白細胞BP神經網絡分類器,并完成了特征向量庫訓練,實現了對白細胞的自動識別,大樣本識別準確率達到95.6%,為白細胞形態學識別的自動化和智能化奠定了基礎。