陳 舒,陳若寒
(福建警察學院 計算機與信息安全管理系,福建 福州 350007)
腫瘤癌變細胞FISH圖像分析系統的研究
陳 舒,陳若寒
(福建警察學院 計算機與信息安全管理系,福建 福州 350007)
腫瘤癌變細胞FISH圖像分析系統中,需要解決粘連細胞核的分割問題。FISH屬于新興技術,產生的是特殊的熒光彩色細胞圖,現有細胞圖像分析方法并不適用。文章創新設計了基于深度凹陷檢測和構造自然凹陷力的方法,分離粘連細胞核。首先,針對參差不齊的實驗成像,在RGB模型下結合統計思想,將圖像分為三類,分別進行預處理。繼而,利用融合了K-means聚類算法的改進馬爾科夫隨機場(MRF)方法,將細胞核與癌變信號點進行有效提取。在此基礎上,利用幾何原理,創新設計了一套粘連細胞核分離算法。最后,給出細胞核快速計數和信號點提取方法。該系統設計基本完整,并達到預期效果。
FISH圖像;細胞核提取;MRF模型;細胞核粘連;自然凹陷力
較多研究表明,癌變細胞中都存在HER2蛋白的過表達或基因擴增現象。當前的檢測技術有很多種,其中的FISH技術雖是一項新興技術但已經被公認為業界的“黃金標準”[1-2]。
經過FISH技術處理后產生的腫瘤癌變細胞圖像中,包含三個主要成分:背景(黑色)、細胞核(藍色)、信號點(紅色和綠色)。通過統計、分析細胞核與信號點的個數,就可以實現對HER2蛋白擴增現象的檢測。
FISH圖像中,具有研究價值的區域恰好與RGB顏色模型的三個通道相吻合,不需要進行復雜的映射或者換算,所以選用RGB模型來進行設計。通過批量觀察以及相應資料的查閱,FISH技術呈現的細胞核大致具有3個特點:邊緣模糊(熒光強度不同)、核外輪廓各異(探針手工著色)、核內結構復雜(孔洞),需要進行預處理使得圖像呈現最佳效果,從而簡化算法。
1.1 FISH圖像分類
首先,根據成像的熒光效果,將圖像分為三類:(1)弱熒光信號圖;(2)暈染嚴重信號圖;(3)理想信號圖。分別如圖1(a)、(b)、(c)所示。在專家指導下進行手工分類作為訓練樣本,得出圖像在藍色通道上的分布規律,借助統計學原理,進行自動分類。

圖1 三類腫瘤癌變細胞FISH圖像示例
1.2 非理想圖片的改善
需要對弱熒光圖進行增強,對暈染現象進行去除。
1.2.1 弱熒光圖自適應增強
(1)原圖像進行疊加,I=1.5×I(這步操作的實質是對亮度進行疊加);
(2)重新判斷是否為弱熒光,如果是,則重新轉入步驟(1),否則停止。實驗效果如圖2所示。

圖2 弱熒光信號圖自適應增強的前后對比
1.2.2 暈染現象的自動去除
(1)將判別為“暈染嚴重”的原始圖像轉化為藍色亮度圖;
(2)運用Otsu法進行閾值分割,目標標記為1(白),背景標注為0(黑);
(3)填補小于閾值Pc個像素點的連通區域(孔洞);
(4)去除小于閾值Pc個像素點的連通區域(非細胞核區域);
(5)將標記為目標的區域恢復成RGB圖,其他部分保持黑色背景;
(6)重新判斷是否暈染嚴重,如果是,則重新轉入步驟(2),否則停止。實驗效果如圖3。

圖3 嚴重暈染現象去除前后對比圖
其中Pc默認為原圖總像素點的4%,這個百分比是根據多次實驗效果得出的經驗值,表示該圖片中的細小孔洞,可以自適應各種尺寸的原始圖像。
2.1 傳統方法
對細胞核提取的常用方法主要依據四類原理,分別是:閾值分割、邊緣檢測、傳統區域思想以及基于特殊算法的理論[3-4]。
閾值分割雖然快速簡便、不需要先驗知識,卻沒有考慮與鄰域像素點之間的關聯性,分割較為粗糙,容易發生誤判;邊緣檢測雖然是基于各個像素點與其鄰域的差異,但是細胞核內熒光信號產生了大量的梯度變化,給真實邊緣的檢測增加了困難;傳統區域思想需要先驗知識并對圖像有一定要求,且不考慮空間信息,容易造成過分割;而基于特殊算法的理論,則因為其特定的應用條件、復雜的參數或對圖像計算量的要求等,在FISH圖像的細胞核提取中并不適用。
2.2 本文方法
綜合以上算法的優缺點,本文考慮到像素點間的關聯,選取馬爾科夫隨機場(MRF)[5-7]與無監督的聚類算法相結合來進行圖像分割,提取FISH圖像的細胞核。
從算法計算量和精度的角度考慮,在MRF建模中,選用二階8-鄰域系統的Potts模型作為標記場模型,有限高斯混合模型(FGMM)建立觀測場,迭代條件模式(ICM)作為最優化分割算法,其中Potts模型中的勢函數β改進為可變勢函數βb。
2.2.1 可變勢函數
勢函數β的大小對分割結果影響很大。以圖4a為例進行分割,選取其中β=0.5和β=5的情況,分割結果如圖4(b)和圖4(c)。

圖4 圖像在不同勢函數作用下的分割結果
顯然,當勢函數β增大時,標記場就越占主導,區域性就越好,分割結果細節也就越差;當勢函數β變小時,標記場的影響就弱了,觀測場占的比重變大,分割結果細節信息豐富,區域性差。由此引入可變勢函數βb,符合“前期著重在區域性的控制,后期集中在細節信息的判斷”的規律,勢函數應該是逐漸變小的。
綜上所述,設計可變勢函數如下:
令初始勢函數β=1,總迭代次數限制為maxIter,當前迭代次數為Iter,則當Iter (1) 上式保證在迭代次數Iter增加時,勢函數βb是緩慢變小的,并且不會偏離最初由經驗確定的β值太多。 2.2.2FISH圖像細胞核的提取具體步驟 (1)將原始圖像轉化為藍色亮度圖; (2)設定實驗圖像分類數K=2,初始勢函數β=1,最大迭代次數maxIter=10; (3)應用K-means聚類算法得到初始分割; (4)估計觀測場參數μ和σ2; (5)計算FGMM模型建立的觀測場能量; (6)計算Potts模型建立的標記場能量; (7)根據能量最小原則,估計新的分割; (8)判斷是否滿足迭代終止條件(MAP準則和最大迭代次數),滿足則算法停止,得到最佳分割,否則更新勢函數βb的值,并重新轉入步驟(3)。 2.2.3 實驗效果 分別用Otsu自動閾值法、傳統的K-means聚類算法以及本文算法對FISH細胞圖像進行分割,效果如圖5所示。可以看出,本文算法比前兩種產生的分割結果更加連續,且錯判產生的孔洞現象更少。這說明:融合了MRF模型的K-means聚類分割方法,在兼顧了區域完整性的同時較好地保有了細節信息。而引入可變的勢函數βb的優勢,在前文已有分析。在判定為細胞核的一些區域內,仍然存在一些細小的孔洞,用前文處理暈染圖片時使用的方法修復,效果如圖6所示。 圖5 三種算法對細胞核提取效果比較 圖6 本文算法對細胞核提取并修復 對粘連細胞核分離的常用方法主要依據三類原理,分別是:基于數學形態學、基于形狀特征以及特定理論的方法。 3.1 傳統方法 當目標粘連緊密時,應用基于數學形態學的方法通常得不到理想的種子點個數。 基于形狀特征原理,主要是采用尋找凹點進而分離的方法。將細胞核的粘連方式分為串聯和并聯兩類,根據每個區域凹點奇偶性或者其他準則,來判斷屬于哪一類粘連。然后運用不同的凹點匹配策略,進行凹點連線劃分。但大部分的方法并沒有考慮更加復雜的串并聯混合情況,FISH細胞核恰屬于復雜粘連情況,同時,FISH細胞核邊緣不規則,容易出現“假凹點”。 基于特定理論的方法中,比較適合FISH圖像復雜結構的是文獻[8]中提出的基于水平集和隨機霍夫圓檢驗方法來分離原生質細胞核。但該算法融入了水平集算法,需要設定的參數非常多,隨著粘連細胞核個數的增加和粘連情況的復雜,相應的參數也更加難以全面設置,并且需要用到統計學的霍夫投票法決定區域的分割歸屬問題,計算量較大,影響了總體分析效率,故不采用。此外,其他文獻中基于主動輪廓模型[9-10]和圖論[11-12]等方法的改進,都因計算量比較大,不予采用。 3.2 本文方法 在Harris和Susan算法的基礎上,改進設計出“深度凹陷點”的檢測方法,尋找因粘連造成的真正凹陷,同時判斷出粘連現象的存在與否。接著,創新引入“自然凹陷力”的概念,令深度凹陷點的凹陷有規律有方向地加深,并逐漸產生區域斷裂,最終實現粘連的分離。 3.2.1 深度凹陷點檢測 本文將角點分為以下4種點情況:鈍角凸點、銳角凸點、輕微凹陷點、深度凹陷點。本文定義的深度凹陷點必須滿足以下條件:以該角點作為圓形模板的中心,角點的兩條線段在目標區域內構成的夾角必須大于225°。 本文設計的深度凹陷檢測方法: (1)設FISH細胞核二值圖I中,目標(細胞核區域)標記為1,背景標記為0,同時構造半徑R=5的圓形模板M,模板內標記為1的像素點總個數為MMAX; (2)利用Harris角點檢測算法對I進行掃描,得到一個角點集合J(j1,j2,...,jn); (3)將圓形模板M的中心與J(j1,j2,...,jn)逐點重合; (4)借鑒Susan算法的思想,得到每一個角點位置上的USAN值MUSAN; (5)當MUSAN>5/8×MMAX時,該角點判定為深度凹陷點,存入集合H中,用于下一階段運算。 3.2.2 粘連判斷 當某個目標連通區域內存在深度凹陷點時,該區域存在粘連現象,需要實現細胞分離,否則是獨立細胞核。 3.2.3 自然凹陷力 設想:在現實世界中,要讓這些粘連的細胞核產生分離,可以對每一個深度凹陷處施加作用力,要求該作用力的大小一致,方向順應每個凹陷處的凹陷方向,這樣在凹陷處就會不斷地加深凹陷程度,粘連的細胞核們也會逐漸被擠壓得分離開。當某幾處作用力匯集到一點時,該局部的粘連區域就被分離;當圖像中所有深度凹陷處施加的作用力都匯集到某一處時,則粘連部分被完全分離。 為了滿足實時性的需求,本文采用純幾何的線性思想來模擬自然凹陷力的作用,如圖7所示。 圖7 本文設計的自然凹陷力作用示意圖 本文設計的自然凹陷力具體作用過程為: (1)取深度凹陷點集合H(H1,H2,...,Hn); (2)定位至其中一點Hi(i=1,2...,n),以該點為圓心、R=8(多次實驗的經驗值)為半徑構造一個圓,設該圓交Hi兩條邊的交點分別為J1和J2; (4)逐個定位至H中的其他點,重復步驟(2)和(3),遍歷一輪后,將產生的集合H′作為新的凹陷點集合H,完成一輪自然凹陷力作用; (5)定位至更新過的Hi點,重復步驟(2)~(4),直至新產生的Hi′不再在目標內時,停止Hi點的繼續凹陷,跳至H中的其他點繼續操作,直至所有的H′都在背景中時(表示粘連產生的凹陷區域都完成分離),停止所有操作。 3.2.4 本文粘連分離方法 (1)讀取一張原始FISH細胞核圖Iy; (2)利用前文設計的方法,將Iy分類并預處理為理想圖I,使用前文設計的細胞核提取方法,將I中的細胞核提取出來,并將圖像轉化為二值圖I0; (3)對I0做邊界提取,記錄目標初始邊緣ED0; (4)利用半徑R=3的近圓形結構元素SE,對I0圖像做腐蝕運算,分離輕微粘連的細胞核; (5)利用前文設計的“深度凹陷檢測方法”,檢測出當前圖中深度凹陷點,存入集合H; (6)利用前文“自然凹陷力”,逐點加深H點處的凹陷,最終使得細胞核粘連區域全部得以分離; (7)對分離后的各個區域進行連續粗化運算(保持不連通性),使各個區域復原成原始大小,直至區域邊緣達到ED0的極限,且結果不再變化為止; (8)對當前二值圖I0做邊界提取,記錄當前目標的邊緣ED,則ED為細胞核的分離界線; (9)將分離界線轉化為紅色,疊加于圖像I上,作為輸出結果。 3.2.5 實驗效果 分別選取“簡單粘連”和“復雜粘連”的FISH細胞核圖像進行分離實驗,結果如圖8、圖9所示,實驗效果理想。 圖8 簡單粘連的分離效果 圖9 復雜粘連的分離效果 4.1 細胞核計數 讀取一張經過粘連分離后的細胞核二值圖I0,繼而計算標記為目標(標記為1)的連通區域數,即為細胞核個數。 4.2 信號點提取 紅色信號點的提取方法:先將G和B的值減為0,得到R-紅色熒光圖,再通過閾值分割和極限腐蝕法得到幾何中心,用于后續分析。同理,可用于綠色信號點的提取。 系統主要實現4個功能:(1)FISH圖像預處理;(2)FISH細胞核的提取;(3)粘連細胞核的分離;(4)細胞核技術和信號點提取。上述設計,都在滿足精確度和視覺效果要求的范圍內,盡可能構造計算量小、直觀性強的方法。但仍存在著不足:無法實現某些特殊情況下的粘連分離,比如在細胞核嚴重團簇、細胞核發生多層粘連時,內層細胞核相互擠壓,沒有形成凹陷,使之無法分離。這有待進一步改善。 [1] 柳威, 謝鳳, 陳臨溪. C-Abl在腫瘤發生及治療中的重要作用[J]. 臨床與病理雜志, 2012, 32(6):516-523. [2] 唐磊. 基于腫瘤分類與生長建模的癌癥藥物療效預測平臺設計與應用[D]. 合肥:中國科學技術大學, 2012. [3] 楊澤新.基于顏色和形狀的圖像檢索技術研究與實現[D].武漢:華中科技大學,2006. [4] 許新征,丁世飛,史忠植,等 .圖像分割的新理論和新方法[J].電子學報,2010,38(Z1):76-82. [5] 劉國英. 基于Markov隨機場的小波域圖像建模及分割[M]. 北京:科學出版社, 2010. [6] 白雪. 基于三馬爾可夫場的SAR圖像分割[D]. 西安:西安電子科技大學, 2012. [7] 段汕, 陳曉惠, 鄭晨. 基于區域特征的模糊多尺度Markov模型在紋理圖像分割中的應用[J]. 中南民族大學學報(自然科學版), 2010, 29(3):93-99. [8] 王曉飛, 龐全. 基于圓形約束快速水平集的原生質體細胞分割[J]. 中國圖象圖形學報, 2013, 18(1):55-61. [9] 涂云霞. 基于Snakes模型的圖像輪廓提取算法的研究[D]. 哈爾濱:哈爾濱工業大學, 2009. [10] 王科俊, 郭慶昌. 基于粒子群優化算法和改進的Snake模型的圖像分割算法[J]. 智能系統學報, 2007, 2(1):53-58. [11] 侯葉. 基于圖論的圖像分割技術研究[D]. 西安:西安電子科技大學, 2011. [12] 李軍俠. 基于顯著性的圖像分割研究[D]. 南京:南京航空航天大學, 2012. Research on the FISH image analysis system of tumor cell Chen Shu,Chen Ruohan (Department of Computer and Information Security Management,Fujian Police College,Fuzhou 350007, China) In FISH image analysis system, the segmentation of the cell nucleus is needed. FISH is a new technology, it is a special fluorescent color cell image, the existing cell image analysis method is not applicable. In this paper, we design a method based on deep depression detection and constructing the natural sag force to separate the adhesion nucleus. Firstly, according to the different experimental imaging, the images are divided into three kinds according to the RGB model, and the images are preprocessed. Then, using the improved Markov Random Field (MRF) method with the integration of K-means clustering algorithm, to extract nuclei and carcinogenesis signal points. On this basis, using geometric principles, a set of adhesion cell nuclear separation algorithm is designed. In the end, the method of nuclear fast counting and signal point extraction is presented. The design of the system is basically complete, and achieve the desired results. FISH image;nucleus extraction;MRF model;nucleus adhesion;natural depression force R857.3;TP391 A 10.19358/j.issn.1674- 7720.2017.01.015 陳舒,陳若寒. 腫瘤癌變細胞FISH圖像分析系統的研究[J].微型機與應用,2017,36(1):48-51,55. 2016-10-20) 陳舒(1988-),女,碩士研究生,助教,主要研究方向:圖像處理,模式識別。 陳若寒(1987-),男,碩士研究生,助教,主要研究方向:圖像處理,模式識別。

3 粘連細胞核的分離



4 細胞核計數和信號點提取
5 結論