999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于遷移學習和支持向量機的白細胞分類

2021-08-03 06:15:14張劍飛郭笑顏崔文升
科學技術(shù)與工程 2021年19期
關(guān)鍵詞:分類模型

張劍飛,郭笑顏,王 波,崔文升

(1.齊齊哈爾大學計算機與控制工程學院,齊齊哈爾 161006;2.大慶師范學院計算機科學與信息技術(shù)學院,大慶 163712)

白細胞(white blood cell,WBC)是一種無色、球形、有核的血細胞,通過吞噬病原體來產(chǎn)生抗體,抵御和消滅入侵的病原微生物,對于機體的安全免疫發(fā)揮著重要作用[1]。不同群體不同時段血液中WBC的濃度是不同的,成年人正常情況下血液中WBC濃度為109/L。當機體出現(xiàn)急性細菌性感染、中毒、大出血和免疫系統(tǒng)衰弱等現(xiàn)象時,血液中WBC的濃度會出現(xiàn)異常,因此對于血液中WBC濃度的檢測和類別的鑒定有著重要的社會價值和臨床意義[2-3]。

人工鏡檢是WBC分類的黃金標準,但該方法效率低,準確度受檢驗人員主觀經(jīng)驗和狀態(tài)的影響,所以大量的研究人員致力于WBC自動分類研究。20世紀90年代出現(xiàn)了基于物理和化學的脈沖信號計數(shù)方法,但由于需要昂貴的醫(yī)療器械和專業(yè)的操作人員等苛刻條件導致難以系統(tǒng)的應(yīng)用到WBC分類的研究過程中[4]。張從鵬等[5]利用灰度直方圖波谷閾值分割方法實現(xiàn)了白細胞細胞核和細胞漿的提取,根據(jù)細胞的形態(tài)、顏色及紋理特征對白細胞進行了分類。Nazlibilek等[6]將RGB(red,green,blue)圖像轉(zhuǎn)換為灰度圖像,并使用Otsu算法將灰度圖像轉(zhuǎn)換為二值圖像,將單個圖像應(yīng)用于基于神經(jīng)網(wǎng)絡(luò)(neural network,NN)的分類器,將WBC分為五類。雖然這些方法經(jīng)過復(fù)雜的步驟都取得了不錯的精度,但是通過紋理和幾何特征來分類是不可靠的,因為同類細胞的形狀,大小和紋理信息有很大的差異。

近些年,深度學習在醫(yī)學輔助診斷中的應(yīng)用已經(jīng)成為模式識別和人工智能領(lǐng)域研究的熱點問題之一,特別是卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)在圖像分類識別領(lǐng)域表現(xiàn)出巨大的優(yōu)勢。鐘亞等[7]在LeNet-5的基礎(chǔ)上,設(shè)計一個六層的CNN對2萬個樣本組成的數(shù)據(jù)集進行分類,最終實現(xiàn)95%的敏感性、84%的特異性和89.5%的準確率。由于方法的CNN網(wǎng)絡(luò)模型簡單,準確率不高。Qin等[8]提出使用殘差卷積神經(jīng)網(wǎng)絡(luò)WBC顯微圖像進行了集成分類,該方法進行了80 000次迭代的集成訓練,模型在訓練過程中消耗時長約為3 611.5 min,最終測試集平均準確率接近76.84%。馬力等[9]利用矩陣變化平衡數(shù)據(jù)集,基于遷移學習利用改進用殘差卷積神經(jīng)網(wǎng)絡(luò)對白細胞圖像進行分類,最終準確率達到92%。在WBC分類識別上,仍存在分類識別率低和硬件設(shè)備要求過高等問題。

針對WBC需要復(fù)雜預(yù)處理和分類識別準確率等問題,提出一種基于遷移學習的WBC分類方法:首先,對WBC數(shù)據(jù)集進行數(shù)據(jù)增強和歸一化預(yù)處理,然后對預(yù)選遷移模型進行微調(diào)訓練,選擇分類效果最好的模型對數(shù)據(jù)集進行特征提取,將提取到的特征分別輸入至NN和支持向量機(support vector machine,SVM)中進行訓練,最后對兩者分類器分類結(jié)果進行組合和決策。

1 方法

在深度學習中,CNN在圖像分類識別領(lǐng)域中表現(xiàn)突出,被學術(shù)界廣泛應(yīng)用于病理圖像的輔助診斷研究[10-11]。大數(shù)據(jù)是深度學習的基礎(chǔ),而在實際中獲取大量有標注的醫(yī)學數(shù)據(jù)是很困難的。遷移學習將舊領(lǐng)域?qū)W習過的模型應(yīng)用在新領(lǐng)域上,可以解決傳統(tǒng)機器學習中因數(shù)據(jù)不足而泛化能力不足的問題[12]。遷移效果取決于源域和目標域之間的相關(guān)性,相關(guān)性越高遷移效果越好,否則可能會發(fā)生“負遷移”[13]。對VGG-16[14]、ResNet-50[15]和Mobile-Net[16]三種預(yù)選遷移模型微調(diào)訓練來選擇對WBC分類效果最好的遷移模型用于特征提取。如圖1所示,本文方法共分為數(shù)據(jù)集預(yù)處理、微調(diào)訓練和組合分類3個部分。

1.1 數(shù)據(jù)集預(yù)處理

1.1.1 數(shù)據(jù)增強

WBC原始數(shù)據(jù)集共347組像素規(guī)格為640×480×3的血涂片樣本,其中包括88組嗜酸性粒細胞(Eosinophil)、31組淋巴細胞(Lymphocyte)、21組單核白細胞(Monocyte)、207組嗜中性粒細胞(Neutrophil)。原始數(shù)據(jù)數(shù)量過少且各類別數(shù)據(jù)分布不平衡,為了提升模型的泛化能力和分類精度,選擇數(shù)據(jù)增強技術(shù)對數(shù)據(jù)集進行擴增操作[17]。具體的數(shù)據(jù)增強技術(shù)包括隨機左右平移5像素,以閾值為60°進行隨機旋轉(zhuǎn),將原始數(shù)據(jù)的數(shù)目擴增了約40倍。將原有的不平衡數(shù)據(jù)轉(zhuǎn)化為平衡數(shù)據(jù),有效解決由于樣本太少及其類間不平衡導致分類效果不佳的問題。

1.1.2 圖像規(guī)格調(diào)整

為了對遷移學習模型進行微調(diào)訓練,需要將原始數(shù)據(jù)圖像規(guī)格調(diào)整為遷移模型能夠輸入的圖像規(guī)格,利用Python中Opencv工具包把圖像規(guī)格調(diào)整為遷移模型的輸入規(guī)格224×224×3。

1.1.3 歸一化

數(shù)據(jù)范圍壓縮作為常見的預(yù)處理方法,能提高模型訓練尋優(yōu)的效率和分類識別的精度,利用歸一化將數(shù)據(jù)范圍壓縮至-1~1[18],即

(1)

式(1)中:X表示圖像中每個像素點的像素值。

1.2 微調(diào)訓練

由于目標域與源域之間存在差異,因此還需要微調(diào)訓練來提高遷移模型在目標域的性能。微調(diào)訓練是遷移學習中一項基本操作,對三種預(yù)選遷移模型(VGG-16、ResNet-50和Mobile-Net)采用兩種微調(diào)訓練方案來選取對于WBC分類效果最好的模型。方案1凍結(jié)遷移模型所有卷積特征提取層,只對分類層進行微調(diào)訓練操作;方案2微調(diào)訓練遷移模型所有卷積特征提取層和分類層。選取準確率最高的遷移模型作為下一步微調(diào)訓練基礎(chǔ)。然后對模型全局池化層的類型和不同凍結(jié)位置進行討論和分析,選擇表現(xiàn)效果最好的配置。基于前兩步的操作,選擇分類精度最佳的遷移模型對數(shù)據(jù)集進行特征取操作。

對兩種微調(diào)方案,分類層均把原遷移模型中1 000個神經(jīng)元設(shè)置為4個神經(jīng)元。在遷移模型微調(diào)訓練時,使用全局池化層代替原有遷移模型的全連接層。全局池化層包括全局平均池化層和全局最大池化層,將由模型中最后卷積輸出的每張?zhí)卣鲌D的平均值或最大值作為輸出[19]。原遷移模型需要將由卷積提取的特征圖進行平鋪操作,會破壞數(shù)據(jù)的空間特征并且會引入更多的參數(shù)來擬合數(shù)據(jù),易發(fā)生過擬合問題,而全局池化層一方面能保留數(shù)據(jù)特征的空間特性,另一方面又能有效降低模型擬合參數(shù)數(shù)量,提升模型泛化能力。

1.3 組合分類

在使用單分類器難以獲得更好的分類識別效果時,利用兩組或者多組分類器進行組合決策往往能獲得更高的識別精度[20-21]。利用已微調(diào)訓練完畢的遷移模型對數(shù)據(jù)集進行特征提取操作,然后將提取到的特征分別輸入至NN和SVM中進行訓練,最后通過對兩者分類器分類結(jié)果進行組合和決策,具體的組合規(guī)則為

(2)

式(2)中: predict表示組合分類器的分類結(jié)果;i表示W(wǎng)BC4類中的第i類;BPi表示NN分類器的輸出概率;SVMi表示SVM分類器的輸出概率;argmax表示概率值最大值的索引。

將NN和SVM對于4類WBC的分類閾值進行相加,將最大概率值輸出作為分類結(jié)果。

2 實驗

2.1 數(shù)據(jù)集預(yù)處理

Kaggle(https://www.kaggle.com/paultimothymooney/blood-cells)提供原始347組像素規(guī)格為640×480×3的WBC血涂片樣本。該數(shù)據(jù)集數(shù)據(jù)數(shù)量較少且各類別數(shù)據(jù)分布不均衡。通過數(shù)據(jù)增強將原始數(shù)據(jù)的數(shù)目擴增了約40倍,將347組數(shù)據(jù)擴增為12 444組。同時將像素規(guī)格轉(zhuǎn)變?yōu)?24×224×3,訓練集和測試集數(shù)目各占9 957組和2 487組,經(jīng)過數(shù)據(jù)增強后訓練集、測試集的類分布如表1所示。圖2為原始數(shù)據(jù)和增強數(shù)據(jù)的四類細胞的血涂片樣本例圖。

表1 數(shù)據(jù)集分布

圖2 四類細胞的血涂片樣本

2.2 微調(diào)訓練

2.2.1 遷移模型選擇

對VGG-16、ResNet-50和Mobile-Net模型進行兩種方案(方案1凍結(jié)遷移模型所有卷積特征提取層,只對分類層進行微調(diào)訓練操作;方案2微調(diào)訓練遷移模型所有卷積特征提取層和分類層)的微調(diào),超參數(shù)配置如表2所示。

表2 超參數(shù)設(shè)置

不同遷移模型訓練集和測試集在方案1和方案2中分類正確率的變化曲線如圖3所示。

圖3 2個方案準確率變化曲線

在方案1中,VGG-16遷移模型的訓練集和測試集具有更好的擬合效果和識別精度,其他遷移模型效果不佳主要由于遷移模型復(fù)雜度過大只對源域數(shù)據(jù)具有更強的抽象能力,而在方案2中,VGG-16訓練集和測試集在30次迭代中具有更快的收斂速度和識別精度,并且具有更強的抗過擬合能力。微調(diào)訓練的模型中測試集分類準確率如表3所示。

表3 不同遷移模型中測試集準確率

因此,方案2中VGG-16模型具有最好的性能,接下來優(yōu)化模型的研究將以VGG-16作為遷移模型展開。

2.2.2 全局池化層選擇

對上一步微調(diào)之后的VGG-16模型,用全局最大池化層替換原模型中的全局平均池化層并對方案1和方案2中的VGG-16模型進行了重新微調(diào)訓練,超參數(shù)配置與表2相同。在30次迭代后,將測試集輸入至兩種微調(diào)訓練完畢的遷移模型中進行預(yù)測,得到的分類準確率如表4所示。

表4 不同全局池化層測試集評估結(jié)果

其中,在方案2中全局平均池化層分類效果高出全局最大池化層大約8%,所以使用全局平均池化層對于該類數(shù)據(jù)具有更好適用性,接下來將在此結(jié)果的基礎(chǔ)上進行深入的研究。

2.2.3 凍結(jié)層選擇

接下來對VGG-16模型的凍結(jié)位置進行了分析和討論。VGG-16模型作為2014年ImageNet大規(guī)模視覺識別挑戰(zhàn)賽(ImageNet Large Scale Visual Recognition Challenge, ILSVRC)的亞軍在邊緣、紋理等低級特征具有良好的提取能力,但由于目標域與源域之間差異,對于高級特的提取能力還需微調(diào)操作加以提升,因此對VGG-16模型進行了如圖4所示的凍結(jié)操作。

I代表模型輸入;C代表卷積層;P代表最大池化層;A代表全局平均池化層;F代表分類層

以卷積對為基本調(diào)節(jié)單位,其中卷積對代表兩層或多層連續(xù)的卷積層與池化層的組合。分別將VGG-16模型第4、7、11和15設(shè)為凍結(jié)節(jié)點,將這4次凍結(jié)操作設(shè)為F1、F2、F3和F4。在模型超參數(shù)配置方面與表2相同,將訓練集輸入至不同凍結(jié)遷移模型中進行微調(diào)操作,訓練集和測試集的準確率變化曲線如圖5所示。

圖5 不同凍結(jié)層訓練集和測試集準確率變化曲線

其中,每種凍結(jié)方式都出現(xiàn)了過擬合問題,相比之下F2具有更好的泛化能力和收斂效果。接著對VGG-16模型在不同凍結(jié)操作中所有微調(diào)訓練的測試集識別效果進行了統(tǒng)計,如圖6所示。

圖6 測試集在不同凍結(jié)操作中上的準確率

其中,F(xiàn)0和F5分別代表上節(jié)VGG-16模型的方案2和方案1。經(jīng)過對比得出F1、F2和F4與F0相比具有更好的識別效果并且F2達到了90.43%的正確識別率,較F0提升了約7%。

2.3 組合分類

2.3.1 NN分類

利用F2微調(diào)訓練所獲得的遷移模型分別對訓練集和測試集進行特征提取操作,然后將特征輸入至網(wǎng)絡(luò)模型進行訓練、預(yù)測和評估。本文用到的NN模型結(jié)構(gòu)包括5層:輸入層、批標準化層、全連接層、棄權(quán)層和輸出層。批標準化層將數(shù)據(jù)按批量進行標準化操作,能有效地提升模型收斂速度和識別精度[22]。使用RELU作為全連接層的激活函數(shù),在輸出層中以SOFTMAX為激活函數(shù)同時通過棄權(quán)操作提升模型泛化能力。SOFTMAX函數(shù)能有效地將分類結(jié)果壓縮至0~1并且神經(jīng)元輸出總和為1。

(3)

(4)

式(4)中:w代表模型中權(quán)值的集合;b代表偏置;n代表輸入訓練數(shù)據(jù)集的數(shù)目;a表示模型預(yù)測結(jié)果;求和在所有訓練輸入x上進行;y代表帶訓練數(shù)據(jù)集的標簽;C代表損失函數(shù)輸出。

網(wǎng)絡(luò)模型結(jié)構(gòu)如表5所示。在模型訓練時的超參數(shù)配置如表6所示。將訓練集和測試集輸入至NN中進行訓練,經(jīng)過100次的迭代,訓練集和測試集的準確率變化曲線如圖7所示。

表5 網(wǎng)絡(luò)模型結(jié)構(gòu)

表6 超參數(shù)設(shè)置

圖7 訓練集和測試集準確率變化曲線

使用表6中超參數(shù)配置中對模型訓練,在40次迭代后訓練集和測試集曲線趨于收斂,并且測試集達到了92.26%分類準確率,相比于之前的F2結(jié)果提升了約1%,因此搭建NN用于WBC分類較直接微調(diào)訓練分類具有更高的準確率。

2.3.2 NN與SVM組合分類

為了獲得更高的分類精度,采用NN和SVM組合對微調(diào)訓練提取到的特征進行預(yù)測和評估。將提取到的特征輸入至SVM中進行分類,使用Sklearn機器學習工具對SVM算法進行實現(xiàn)并對SVM中懲罰系數(shù)C的選擇進行了實驗對比。如圖8為不同C在測試集的識別正確率對比。

圖8 不同C的準確率

當C=1時,模型具有更好的識別效果,接下來使用核函數(shù)為徑向基函數(shù)、C=1的SVM模型與2.3.1節(jié)所訓練的NN對測試集進行組合預(yù)測,對單一和組合識別精度對比結(jié)果如表7所示。

表7 準確率對比

單一決策的NN和SVM在WBC的分類準確率具有明顯的差異,通過將兩者進行組合來對測試集預(yù)測,分類精度得到了提升。綜上,通過將NN與SVM進行組合對測試集的進行預(yù)測,能有效地提升了原有單一模型決策的泛化能力。

3 結(jié)論

基于遷移學習的思想,使用NN和SVM融合的方法對WBC病理圖像分類問題進行了深入的研究。本文方法將WBC分類精度進行了逐步的提升,分類準確率由最初微調(diào)訓練的83.26%,隨著遷移模型的優(yōu)化提升為90.43%,最后通過NN和SVM組合分類器,再次提升為93.52%。通過實驗得出以下結(jié)論。

(1)遷移學習方法提高了特征提取強度和模型泛化能力,避免了自搭建模型和高迭代訓練問題。

(2)通過NN和SVM融合提高WBC病理圖像分類精度。

在今后的研究中,將嘗試對更多種類WBC進行分類識別,提升模型訓練效率和識別準確度。綜上所述,本文中提出的基于遷移學習的NN和SVM融合的白細胞分類方法,可以在臨床診斷中幫助醫(yī)生提高診斷的效率和準確性,具有一定的臨床意義。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 成人一区专区在线观看| 亚洲中文无码av永久伊人| 国产精品亚洲专区一区| 婷婷午夜天| 在线精品视频成人网| 制服丝袜一区二区三区在线| 性视频久久| 丁香六月激情婷婷| 国内视频精品| 波多野结衣无码中文字幕在线观看一区二区| 日本精品视频一区二区| 华人在线亚洲欧美精品| 国产在线无码av完整版在线观看| 小13箩利洗澡无码视频免费网站| 国产白浆一区二区三区视频在线| 最新国产在线| 久久大香香蕉国产免费网站| a免费毛片在线播放| 毛片大全免费观看| 久热精品免费| 欧美精品v日韩精品v国产精品| 在线观看网站国产| 亚洲天堂自拍| 丝袜亚洲综合| 国产高清在线精品一区二区三区| 在线播放国产一区| 人妻无码AⅤ中文字| 欧美日本在线| 日韩一区精品视频一区二区| 久久视精品| 538精品在线观看| 真实国产精品vr专区| 国产精品亚洲五月天高清| 亚洲国产AV无码综合原创| 久久久成年黄色视频| 国内a级毛片| 国产精品福利尤物youwu| 无码高潮喷水在线观看| 欧美亚洲国产精品久久蜜芽| 亚洲AⅤ波多系列中文字幕| 免费无遮挡AV| 午夜日本永久乱码免费播放片| 不卡视频国产| 国内精品小视频在线| 久久99国产综合精品女同| 国产手机在线ΑⅤ片无码观看| 久久精品亚洲中文字幕乱码| 国产在线专区| 亚洲最大福利视频网| 一级一毛片a级毛片| 亚洲成人精品| 四虎成人免费毛片| 国内精品伊人久久久久7777人| 国产九九精品视频| 国产男女免费完整版视频| 国产97视频在线观看| 欧美成人区| 久久精品国产免费观看频道| 亚洲婷婷在线视频| 成·人免费午夜无码视频在线观看 | 色屁屁一区二区三区视频国产| …亚洲 欧洲 另类 春色| 1769国产精品视频免费观看| 日本a∨在线观看| 欧美亚洲日韩中文| 97超碰精品成人国产| 99久久精品久久久久久婷婷| 怡红院美国分院一区二区| 999精品视频在线| 亚洲视频三级| 色妞永久免费视频| 国产成人喷潮在线观看| 亚洲最大综合网| 亚洲伊人天堂| 毛片免费在线视频| 午夜无码一区二区三区在线app| 亚洲精品手机在线| 国产99热| 成人国产小视频| 99视频国产精品| 九九精品在线观看| 超碰免费91|