胡卉 蔡金清
摘 要:本文重點研究宮頸細胞圖像分類識別問題,結合宮頸細胞病理學等方面知識,利用基于深度卷積神經網絡ResNet50的遷移學習,對實驗數據集進行模型訓練和特征提取。實驗結果表明,通過基于深度神經網絡的遷移學習,可以獲取較優的病變與正常細胞的分類結果。
關鍵詞:卷積神經網絡;遷移學習;宮頸癌
中圖分類號:TP391.4 文獻標識碼:A
1 引言(Introduction)
在互聯網發展迅速和計算機技術不斷成熟進步的今天,計算機技術中的圖像處理技術得到廣泛的應用,并且取得了不凡的成就。隨著在機器學習方面的進一步研究,其在生物醫學工程領域的醫學圖像中的應用顯得越來越重要。
宮頸癌癥發病率的逐年增加,引起了人們利用計算機圖像處理中的圖像分類對宮頸癌癥病理學進行研究的熱潮。宮頸癌細胞相較于正常細胞有較為突出的特點,不管是形態上還是在色彩紋理上都有明顯表現,利用這些特征,分類學習算法可以通過不斷迭代修正分類器,最終實現細胞圖像的分類[1]。
本文采用基于深度卷積網絡ResNet50的遷移學習實現對宮頸癌細胞涂片照片的自動分類,利用訓練好的神經網絡所提取的圖像特征對正常和有病變細胞的涂片自動分類。遷移學習可以實現在小規模數據集合上的模型訓練,利用預訓練深度神經網絡提及的廣義圖像特征,并結合新的數據集進行特征的進一步抽象和組合,進而產生新的數據集特征,試驗結果表明其具有較短的訓練時間和較高的分類精度。
2 相關工作(Related work)
關濤等人增強宮頸癌細胞特征,去除雜質,提取細胞核的周長,并使用K-means算法對圖像進行分類。Edwin等人提出了一種基于特定紋理的宮頸細胞分類系統,為宮頸細胞分類指定了七個宮頸細胞組織特征,包括細胞核和細胞質的相對大小,局部二值模式直方圖,細胞質核的相對位移,直接邊緣方向圖、Tamura特征、灰度共生矩陣,以及細胞核和細胞質的密度比與動態范圍。Thanatip等人提出了一種基于塊的模糊C均值圖像分割算法,對宮頸核進行分割,然后根據分割宮頸核利用最小平均相關能量(Minimum Average Correlation,MACE)濾波器來確定宮頸細胞的病變情況。盧磊提出了基于聯合特征PCANet的宮頸細胞圖像分類識別方法,事先用基于塊的組的非局部自相似先驗學習圖像去燥對宮頸細胞圖像去噪,將PCANet網絡中間層提取的特征和最后輸出層提取的特征聯合,減少特征的流失,結合SVM分類器分類,最終對宮頸細胞的二類識別及三類識別準確率分別達到了95.71%和85.4%。
3 宮頸細胞病理學基礎知識(Basic knowledge of
cervical cytopathology)
宮頸癌是最常見的女性婦科疾病惡性腫瘤之一,發病率居高不下,一直威脅著女性的健康,且80%的病例來自發展中國家。我國宮頸癌的發病率占全球的28%,位居第二。如果在病變初期,得到及時治療,很大程度上可以治愈。發病年齡日趨年輕化和擴大化。宮頸癌具有較長病變期的特點,一般需要10—15年時間,篩查年齡相應提前5—10年,可更早發現宮頸癌前病變期。
如今的細胞學檢測主要采用傳統的巴氏涂片或者液基細胞涂片,分析細胞特征,判斷細胞是否有病變趨勢,一般通過肉眼觀察來判斷,檢測費用昂貴,嚴重影響了宮頸癌的早期防治。近年來,國產的細胞病理制片技術已接近國際水平,然而閱片技術仍停留在需要病理醫生閱片階段,且細胞涂片數量巨大,細胞分布繁復,整個過程消耗巨大,準確率難以保證[2]。至今為止,美國FDA已經研制出四臺具有代表性的宮頸細胞涂片自動化檢測設備,但是這些設備檢查費用較高,對于一年一次的普查來說是一般人無法承受的[3]。所以迫切需要開發出較為完善的宮頸細胞分類系統。在病理學上宮頸癌主要分為鱗癌、腺癌和鱗腺癌。
3.1 病變細胞分類及特點
病變細胞中LSIL(低風險鱗狀細胞病變)細胞特征:核擴大,是正常細胞的三到五倍,染色質粗,核質比高,中央空泡出現。HSIL(高風險鱗狀細胞病變)細胞特征:核質比非常高,核膜形狀不規則,分布不均且深染(細胞核顏色深),染色質粗,分布不均勻,胞質疏松透明。癌癥屬性的鱗狀細胞癌(SCC)細胞特征:細胞大小形狀可變,細胞核大小形狀可變,核質比可變,深染,染色質分布不均,可能出現嗜橘色細胞質,背景可出現腫瘤特性。腺癌(ADENOCAICINOMA)細胞特征:可看見核仁,出現乳頭狀腺體,除出現嗜橘色細胞質外,其他特征同鱗狀細胞癌類似。正常宮頸細胞最顯著的特征:核質比正常。
3.2 細胞識別的困難點
一張細胞圖片上不僅僅有宮頸細胞,還有皮膚組織細胞等其他細胞的存在,且細胞之間相互重疊,顯微鏡里光線不足也可能造成視線模糊,無法清晰分別細胞類型和細胞特征。
4 深度卷積神經網絡(Deep convolution neural
network)
卷積神經網絡(Convolutional Neural Network,CNN)提供了一種端到端的深度學習模型,模型中的參數可以通過傳統的梯度下降方法進行訓練,經過訓練的卷積神經網絡能夠學習到圖像中的特征,并且完成對圖像特征的提取和分類。而且不再需要復雜的圖像預處理,數據量小也可以訓練出圖像特征。
典型的卷積神經基本網絡結構主要由輸入層、卷積層、下采樣層(池化層)、全連接層和輸出層組成[4]。其中卷積層占主要的部分,可以從輸入圖像中提取特征,包含了若干參數的用于自主學習的卷積核(濾波器),參數是卷積神經網絡訓練的核心內容。不同的濾波器可以檢測出圖像的不同特征,需要根據訓練測試的對象特征修改參數,達到分類的最好效果。下采樣層(Spatial Pooling),用于降低每個特征映射的維度,且保留重要信息,類型有最大值、平均值、和等。完全連接層直接使用激活函數根據訓練數據集將輸入的圖像分為不同的類。
21世紀初,卷積神經網絡的廣泛研究階段,由Krizhevsky[5]等提出的AlexNet在大型圖像數據庫ImageNet的圖像分類競賽中獲得冠軍,使卷積神經網絡成為學術界關注的焦點。在AlexNet之后,新的卷積神經網絡模型不斷涌現,例如牛津大學的VGG(Visual Geometry Group)、谷歌的GoogLeNet[6]、微軟的ResNet都刷新了ImageNet上AlexNet的記錄。
5 利用遷移學習實現對宮頸病變細胞的識別
(Identification of cervical lesion cells through
transfer learning)
遷移學習的定義是:“運用已存有的知識對不同但相關領域問題進行求解的一種機器學習方法”,其目標是完成知識在相關領域之間的遷移。對于卷積神經網絡而言,遷移學習就是要把在特定數據集上訓練得到的“知識”成功運用到新的領域之中。卷積神經網絡的遷移學習的一般流程是:(1)在特定應用之前,先利用相關領域大型數據集(如ImageNet)對網絡中的隨機初始化參數進行訓練;(2)利用訓練好的卷積神經網絡,針對特定應用領域的數據(如PASCAL)進行特征提取;(3)利用提取后的特征,針對特定應用領域的數據訓練卷積神經網絡或者分類器[7]。遷移學習基本原理如圖1所示[8]。
遷移學習使用預訓練深度神經網絡作為學習新任務的起點,并對網絡進行微調通常比從頭開始隨機初始化權重來訓練網絡要快得多和簡單。因此,可以使用較少數量的訓練圖像將學習功能快速轉移到新任務。
5.1 卷積神經網絡的遷移學習
本文使用預訓練的resNet50深度神經網絡實現遷移學習。深度殘差網絡(Deep Residual Network,ResNet)的提出是CNN圖像史上的一件里程碑事件。ResNet網絡參考了VGG19網絡,在其基礎上進行了修改,網絡深度增加到152層,并通過短路機制加入了殘差單元解決了深度網絡退化問題。
殘差F(x)=H(x)-x,所以原始的學習特征H(x)=F(x)+x,x為輸入值。當殘差為0時,此時堆積層僅僅做了恒等映射,至少網絡性能不會下降,實際上殘差不會為0,這也會使得堆積層在輸入特征基礎上學習到新的特征,從而擁有更好的性能。
MATLAB 2017b提供了ResNet50預訓練模型的支持。該模型需要安裝神經網絡工具箱,并需要下載和安裝ResNet-50支持包。
為了實現遷移學習,使用全連接層,SoftMax層和分類輸出圖層替換ResNet-50最后三個層,并轉移到新的分類任務。根據新數據指定的新的全連接層的選項。將全連接層設置為與新數據中類的數量相同。替換前后的對比如圖2和圖3所示。
6 實驗與分析(Experiment and analysis)
6.1 數據集介紹
本文采用的數據集來自皇家墨爾本理工大學(RMIT University)醫學院的檢驗醫學碩士王宗玥實驗中拍攝的宮頸涂片照片。一共20張涂片拍攝出的96張圖片,包含了54張正常(NAD)圖片和42張病變涂片樣本圖片。
6.2 實驗結果及分析
本文將進行宮頸細胞圖像的二分類仿真實驗,即對正常和病變宮頸細胞進行分類識別,試驗在MATLAB2017b平臺進行,利用MATLAB的機器學習工具箱和神經網絡工具箱進行模型的訓練。本文使用TITAN X GPU訓練遷移學習的深度神經網絡模型,TITAN X具有3072個核心。
我們對96張圖片進行90次的迭代訓練。為了防止過擬合,提高模型的泛化能力,在模型訓練的過程中,將訓練集進一步的劃分為訓練集和驗證集,訓練集和驗證集上的結果精度,如圖4所示。可以看到在驗證集上,遷移學習生成的模型的精度可以達到82%。
同時,我們通過可視化的方式顯示遷移學習生成的模型的預測結果。圖5是原始的病理圖片,圖6顯示了原始病理圖片在經過遷移學習模型上的第一個激活層后的結果。一共有70個特征被提取,其每個方塊對應一個卷積層的輸出通道(也就是一個特征)。白色像素表示圖像經過該特征后被激活的部分,也就是特征放大的部分。我們分別提取了39和40個通道(特征),以及通道作用后的結果。原始病理圖片如圖5所示,第1個激活層后的結果如圖6所示。
從圖7和圖8中可以看到,這個兩個學習到的特征分別對應圖片中的液體部分和病體部分。特征部分的灰度值較非特征部分低,在圖片中可以清晰的分辨出特征的分布。
同時,作為對比方案,從預訓練的resnet50深度神經網絡中提取學習到的圖像特征,并使用這些特征在訓練集訓練支持向量機(SVM)分類模型。Resnet50最后幾層結構如圖9所示。
更高層提取的是更加抽象的特征,更低層提取的是更低級別的特征。本文提取全連接層的1000個特征。針對圖6的病理圖片,其對應的1000個特征顯示,如圖10所示。基于這1000個特征對SVM模型進行訓練,并對訓練的模型進行測試驗證,研究結果的精度為62%。因此,從結果可以看出,利用遷移學習可以提取更加貼近訓練集的特征,并且具有更好的泛化能力。
7 結論(Conclusion)
本文針對時下癌癥診斷難的問題,對Resnet50深度神經網絡實現遷移學習,提出了基于卷積神經網絡和遷移學習的圖像分類方法,即可以自動判別圖像類別的算法。主要思想是,基于預訓練深度神經網絡模型產生基礎特征,通過在小規模數據集合上的訓練生成符合數據集合自身的更加抽象的特征,基于這些抽象特征實現對數據集的分類。主要采用基于深度卷積神經網絡利用遷移學習實現對宮頸細胞圖片的自動病理識別,選遷移學習,是因為其實現了在小規模數據集合上,并且在較短的時間內訓練生成新的深度神經網絡。實驗結果表明,相對于使用SVM模型生成的深度神經網絡對宮頸細胞圖像分類,有較高的準確率。其基于預訓練深度神經網絡模型產生基礎特征,通過在小規模數據集合上的訓練生成符合數據集合自身的更加抽象的特征,基于這些抽象特征實現對數據集的分類。
此方法不僅降低了細胞判別的主觀因素的干擾,同時也幫助提高了工作效率,提供給醫者輔助決策,未來能夠輔助醫學界病理學的科研發展,降低醫療及人力方面的資源消耗。
參考文獻(References)
[1] 張琳林,曹軍梅.一種基于卷積神經網絡的圖像分類方法[J].福建電腦,2018,34(02):46-47.
[2] 張璐.醫學圖像智能分類技術研究與應用[D].電子科技大學,2017.
[3] 范金坪.宮頸細胞圖像分割和識別方法研究[D].暨南大學,2010.
[4] 葉斌強,孫鵬飛.宮頸癌診斷及療效評價的影像學研究進展[J].中國CT和MRI雜志,2014,12(02):109-112.
[5] Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[C].International Conference on Neural Information Processing Systems.Curran Associates Inc,2012:1097-1105.
[6] Szegedy C,Liu W,Jia Y,et al.Going deeper with convolutions[J].arXiv preprint arXiv:1409.4842,2014:1-9.
[7] 李彥冬,郝宗波,雷航.卷積神經網絡研究綜述[J].計算機應用,2016,36(09):2508-2515;2565.
[8] James Le.The 10 Deep Learning Methods AI Practitioners Need to Apply[EB/OL].https://www.linkedin.com/pulse/10-deep-learning-methods-ai-practitioners-need-apply-james-le?trk=portfolio_article-card_title,2017-11-17.
作者簡介:
胡 卉(1994-),女,碩士生.研究領域:機器學習,圖像處理.
蔡金清(1976-),男,博士,副教授.研究領域:機器學習,大數據,云計算.