劉騰飛,劉 威,2
(1.武漢大學物理科學與技術學院,湖北武漢 430072;2.武漢大學深圳研究院,廣東深圳 518057)
腫瘤細胞的檢測對癌癥的早期診斷和治療具有重要研究價值[1]?;诳乖?抗體結合的腫瘤細胞捕獲技術[2]在腫瘤檢測方面已有多年的研究經驗,在對細胞學的研究中需要經常觀察細胞形態和對細胞進行計數。因此,腫瘤細胞研究中迫切需要自動的腫瘤細胞識別與計數系統,以輔助研究人員進行高效研究。隨著數字圖像處理技術在生物醫學領域的應用越來越廣泛,目前已有對基于圓形度特征的血細胞分類研究[3]。
文中以金納米顆粒捕獲的腫瘤細胞為例,根據被捕獲后的腫瘤圓形度明顯變小的特征,基于Matlab 2019b 平臺,利用數字圖像處理技術,為被捕獲后的腫瘤細胞提供一種高效的識別計數系統,可助力研究人員對腫瘤細胞的研究。
該系統主要由細胞圖像采集、細胞圖像處理與圓形度計算、GUI 界面顯示處理和計算結果3 部分組成。根據捕獲實驗完成后腫瘤細胞的周圍環境及被金納米顆粒捕獲后圓形度明顯降低的形態特征,文中設計了圖1 所示的系統實現流程框圖。

圖1 系統圖像預處理及識別實現流程框圖
基于USB 接口的CMOS 圖像傳感器采集系統具有傳輸速率高、兼容性好等特點[4]。文中采用CMOS圖像傳感器的工業相機搭載三目螺紋接口顯微鏡攝像頭(40X)構建圖像采集系統,通過USB2.0 與計算機建立通信,采集被金納米顆粒捕獲后的腫瘤細胞圖像。圖2 所示的細胞邊緣黏附的黑色顆粒為金納米顆粒,游離在細胞周圍的黑色斑點為多余的金納米顆粒,被視為雜質。

圖2 金納米顆粒捕獲的腫瘤細胞
首先加載攝像頭采集的細胞圖像到系統中,系統會將圖像轉化為灰度圖像,接著進行基于閾值的圖像分割實現二值化。然后利用二值圖像形態學處理消除細胞內的孔洞和剔除小面積的非細胞區域,得到不包含雜質的完整的細胞連通域圖像。再通過控制標記符的分水嶺算法實現粘連細胞分割。最后,計算圖像上連通域的總數及各連通域的圓形度,與腫瘤細胞圓形度閾值進行對比,對小于閾值的連通域判定為捕獲成功,并進行計數。
灰度變換可以將彩色圖像轉換為只包含圖像亮度信息的灰度圖像,但是同樣可以突出彩色圖像中描述的目標特征,而且還可以降低圖像數據的運算量,在醫學影像處理中有非常廣泛的應用[5]。
該系統選用加權平均法[6],即根據人眼對三基色敏感度的高低,按照式(1)對R、G、B三分量以不同的權值進行加權平均,實現灰度化。

基于閾值的圖像分割因為有很直觀的分割效果,在圖像分割中有重要的應用[7]。首先通過最大類間方差法[8-9](OTSU)對細胞灰度圖像進行閾值分割,通過Matlab 計算,得到灰度閾值T=0.396 1 的二值圖像。觀察發現,該閾值使個別細胞邊緣被破壞。然后參考灰度直方圖將灰度閾值手動設置為T=0.41 和T=0.42 分別進行閾值分割,發現當灰度閾值T=0.42時,較好地保留了細胞邊緣。最終得到的二值圖像如圖3 所示。

圖3 選取不同閾值進行分割后的二值圖像
形態學處理可以在保持圖像中目標的基本形態特征不發生明顯變化的情況下,去除不相關的區[10-11]。
2.3.1 孔洞填充
閾值分割后得到封閉的細胞輪廓,但細胞內會存在不規則的孔洞,孔洞可以看作由前景目標包圍的背景區域。令g表示二值圖像,假設gm為標記圖像,細胞邊緣部分值設為1-g,除了圖像邊緣外,其余部分都為0:就可以完成腫瘤細胞內孔洞的填充[11]。Matlab工具箱函數可以完成此過程:


2.3.2 移除雜質點
由孔洞填充后的二值圖像可以看到,雜質點所屬連通域的面積明顯小于被捕獲的腫瘤細胞的面積。通過連通域像素個數統計發現,即使較小的細胞(包含928 個像素點)也遠大于較大的雜質點(包含393 個像素點),刪除二值圖像中像素面積小于400 的對象。Matlab核心代碼如下:

形態學處理后對圖像取反得到圖4 所示的細胞特征區域。
然后根據

圖4 形態學處理后提取出的細胞區域
分水嶺分割算法是一種基于拓撲理論的數學形態學的分割方法,在分割粘連細胞方面有很好的應用效果。
由于腫瘤細胞輪廓上金納米顆粒-抗體凸起的存在,如圖5(a)所示,直接應用分水嶺分割算法的效果并不理想,可能會造成過分割而引起誤差[12],如圖5(b)所示。如果對圖像中的前景和背景進行標注之后再應用分水嶺算法,則會取得更好的分割效果。圖5(c)所示為基于控制標記符的分水嶺[13]算法分割后的結果。

圖5 分水嶺分割算法
Matlab核心代碼如下:


腫瘤細胞被捕獲后輪廓圓形度明顯下降,與未被捕獲的細胞區別明顯,如圖6 所示。

圖6 未被捕獲的腫瘤細胞(左)和被捕獲的腫瘤細胞(右)的形態對比
提取到細胞的連通域圖像后,采用圓形度計算公式[14],即

其中,S為連通域面積,即連通域包含的所有像素點的個數;L為連通域輪廓周長,即連通域輪廓上點集合的個數,以1 像素點為最小單位。當e為1 時,圖形即為圓形;e越小,與圓形的差距越大。
文中對53 個被捕獲的腫瘤細胞和43 個未被捕獲的腫瘤細胞的圓形度進行了統計計算,得到圖7所示的圓形度分布圖??梢园l現,將圓形度閾值設為0.87 可以很好地區分腫瘤細胞是否被捕獲。

圖7 被捕獲的腫瘤細胞圓形度分布
進入GUI 界面點擊讀取圖像,可調用相機獲取某一時刻圖像保存的指定位置,并加載到界面上。然后在參數設置區域設置腫瘤細胞識別的關鍵參數,包括灰度閾值、雜質點面積、細胞圓形度閾值。輸入之后點擊處理計算,系統會根據設置的參數對細胞圖像進行處理,并對被捕獲的腫瘤細胞進行識別和捕獲效率計算,處理結果會在右上方顯示,右下方的面板會顯示計算結果。識別和計算結果如圖8 所示。

圖8 腫瘤細胞識別和計數操作界面
根據文中設計的被捕獲的腫瘤識別和計數系統,對隨機選取的5 幅樣品圖片進行識別和計數,結果如表1 所示。

表1 腫瘤細胞識別與計數結果
*錯誤率計算公式為:
錯誤率=(假陽數+假陰數)/被捕獲的數量
假陽是指在系統誤識別目標的情況,假陰是指系統未識別目標的情況。在系統自動識別與計數過程中,有少量腫瘤細胞因黏附的金納米顆粒較小而被系統忽略,也有少量未全部暴露在視野中的細胞被系統誤識別。
由表1 可知,通過圓形度特征對被捕獲的腫瘤細胞識別和計數的平均誤差率在6.3%左右,識別準確率較高,證明了該系統在實際應用中的有效性。
文中利用圖像處理技術結合高速采集相機實現了對被捕獲的腫瘤細胞的快速識別和計數[15-16],并給出了GUI 界面。最后實驗結果證明,系統識別準確率能夠滿足實際需求,具有一定應用價值。相對于血細胞計數板[17-18]的細胞計數方法,該系統不用繁瑣的實驗步驟,對被捕獲的腫瘤細胞的識別速度更加迅速。相對文獻[19]中介紹的基于機器學習的圖像分割方法,該系統具有更低的開發周期和開發成本。該系統基于圓形度特征的細胞識別和計數也可用于被其他納米材料捕獲的腫瘤[20-21],通過統計樣本數據然后修改系統參數,有望繼續發掘。
文中不足之處在于對腫瘤細胞識別和計數的準確率還可以進一步提高。下一步的研究重點還可就不同生長狀態下的腫瘤細胞識別和計數進行探討。