999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于自監督聚類算法的小樣本醫學圖像分類

2022-03-12 18:19:38馬修玉何良華
電腦知識與技術 2022年3期
關鍵詞:深度學習

馬修玉 何良華

摘要:基于深度學習的醫學圖像分析是智慧醫療的一個重要方向。但是通常情況下,醫學圖像數據集數據量很小,而且由于醫學圖像的標注困難,耗費大量人力物力,所以帶標簽的訓練數據很難獲取。如何使用極少的帶標簽數據和無標簽的數據得到一個較好的網絡模型是本文的主要研究內容。該文提出基于深度聚類的自監督網絡模型作為特征提取器,并且使用標簽傳播算法對特征進行分類,解決了只有極少量標簽(例如1張,5張或者10張)即小樣本情況下的醫學圖像分類問題,在BreakHis數據集上取得了比傳統機器學習算法更好的效果,并且接近于全監督學習方法。

關鍵詞:深度學習;深度聚類;自監督學習;小樣本學習;標簽傳播算法;醫學圖像分類

中圖分類號:TP311? ? ?文獻標識碼:A

文章編號:1009-3044(2022)03-0078-03

開放科學(資源服務)標識碼(OSID):

1 概述

深度學習算法,尤其是卷積神經網絡在醫學圖像分析領域的廣泛使用使得診斷的準確性有了很大提升。雖然基于深度學習的方法能在這些任務上取得比傳統機器學習方法更好的效果,但是這些方法通常都需要大量已標注的數據集作為訓練數據。因此如何在已標注樣本很少的情況下(即小樣本情況),利用僅有的已標注數據以及無標簽數據解決醫學圖像分類成為一個很重要的問題。

最近,很多對標注數據需求量小或者不需要標注數據的方法受到人們關注,出現了很多無監督學習的方法,自監督學習就是其中最具代表性的一種。自監督學習的思想非常簡單,就是輸入的是無標注的數據,但是通過數據本身的結構或者特性,人為構造標簽出來。有了標簽之后,就可以類似監督學習一樣進行訓練。傳統機器學習算法中,聚類算法是一種涉及數據點分組的機器學習技術,不需要數據標簽,屬于無監督學習算法的一種。結合兩種思想本文主要做了以下工作:

1)提出基于深度聚類的自監督網絡模型,利用無標簽數據訓練出較好的特征提取模型。

2)提出改進的標簽傳播算法,利用上述特征提取模型和有限的帶標注樣本進行分類,在BreakHis數據集上取得了很好的分類效果。

2 相關工作

2.1 自監督學習

自監督學習作為無監督學習方法的一個子集,可以從大規模未標記數據中學習一般圖像和視頻特征,而不使用任何人為標注標簽。自監督學習的方法通常是設置一些前置任務(如圖像上色、圖像修補、圖像拼接等),訓練網絡去解決前置任務,在完成這些任務的過程中,網絡就學習到了相應的特征。

何凱明在2019年提出了MoCo(Momentum Contrast)[1], 使用動量的方式更新encoder參數,解決新舊候選樣本編碼不一致的問題;Chen Ting在2020年提出了SimCLR[2],在encoder之后增加了一個非線性映射

[ghi=W* ReLU (W* hi)]

效果直接比MoCo高出了7個點,并直逼監督模型的結果;何凱明在改進自己的方法加入相同的非線性層后提出MoCov2,效果反超SimCLR;近些年來人們開始把自監督學習用于醫學圖像分析,例如谷歌提出了大型自監督模型改進醫學圖像分類[3]。

2.2 深度聚類與標簽傳播

聚類的目標就是根據某一相似性度量準則,將相似的數據分到同一類,盡管人們提出了很多的聚類算法,但是這些方法在高維數據上表現得很差。由于深度學習的發展,以及神經網絡內在的非線性變換的特點,深度神經網絡可以將數據轉化成更易于分類的特征表示,通常把使用深度學習的聚類方法稱之為深度聚類(deep clustering)[4]。

標簽傳播算法[5]是一種基于圖的半監督學習算法,它以一種迭代的方法通過帶標注數據推測無標注數據的標簽,其基本思路是用已標記節點的標簽信息去預測未標記節點的標簽信息,經常被用于社區發現。

2.3小樣本學習

機器學習在數據密集型的領域取得了巨大的成功,但是在數據集比較小的時候通常效果更不太理想,最近人們提出了小樣本學習來解決這個問題。基于度量學習的小樣本學習方法比如MathingNet[6],ProtoNet[7]等都取得了不錯的效果。

3 自監督聚類模型

3.1 自監督聚類模型

傳統的自監督學習算法通常以大量的自然圖像比如ImageNet,作為訓練數據集,構造前置任務,模型能夠在訓練過程中學到底層的圖像特征。自監督模型能夠使用無標簽數據進行訓練,從而得到很好的特征提取器。傳統的網絡自監督訓練以每一張圖為一類,進行實例區分來訓練網絡。由于自然圖像分類通常類別數量很大,無法利用類別信息,而醫學圖像分類任務通常類別已知(比如乳腺癌可以分為良性和惡性),因此可以設計基于聚類的自監督網絡模型。

本文提出基于深度聚類算法的自監督網絡模型,如圖1所示。設計一個聚類隊列,在模型訓練的同時,以聚類算法更新隊列,使模型不僅能學習區分不同實例,而且能學習同類別的相似性。網絡采用兩個分支,其中一個分支以動量方式更新參數,并且將輸出用來更新聚類隊列,同時設計一個隊列存儲C個類別的均值向量,在迭代訓練過程中采用k-means算法不斷地更新均值向量,具體步驟見算法1。自監督訓練分支采用InfoNCE損失函數。

[LossNCE=-logexp (q?k+ / T)i=0Kexp (q?ki / T)]

[Loss=LossNCE+λ?Losssim]

結合聚類損失函數得到最終損失函數([λ]為平衡因子):

算法1: 自監督聚類

輸入:特征向量 [q,? k]

輸出:聚類隊列[ q] ,? 訓練損失 [Losssim]

開始 :

[for q,? k in DataLoaer : ]

[j=argmax{ k ? avgi }Ni=1]

[enqueuej,? k ]

[avgj=? 1Kj i=1Kjkj, i]

[d=q?avgj]

[Losssim+=Id>thresold*d]

[return Losssim]

結束

3.2 標簽傳播算法

標簽傳播算法的基本理論是:每個節點根據相似度將自己的標簽傳播給相鄰的節點,對于傳播的一個節點,它通過計算與周圍節點的相似度,根據相似度大的節點的標簽來更新附近的標簽,最終相似度大的節點的標簽都會被分為同一標簽。本文先將輸入的特征向量進行正則化,映射到球面空間,再進行標簽傳播,詳細過程見算法2,其中[Xl= x1,? y1 …? xl,? yl] 為已標注數據集,[Yl=y1, … , yl ∈{1 … C}] 為類別標簽, 類別數量 [C] 已知,并且所有類別在已標注數據集中都有展示。[Xu= xl+1,? yl+1 …? xl+u,? yl+u] 為未標注數據集,[Yu=yl+1, … , yl+u ∈{1 … C}] 為待預測數據,通常情況下,[l << u]。要解決的問題就是根據 [Xl] ,[Yl] ,[Xu] 預測 [Yu] ,具體算法步驟見算法2。

算法2:? 標簽傳播

輸入:特征向量矩陣 [X],? 實標簽矩陣[ Yl∈l × C] , 軟標簽矩陣 [Yu∈u × C]? ,傳播矩陣 [ T∈l+u × (l+u)]。

輸出 :? 標簽矩陣 [Y ]。

步驟:

1. 正則化輸入特征向量 :?; ? ? ? [xi= xixi]

2. 計算相似度權重矩陣:? ? [wij=exp- dijσ2=exp (- d=1D(xdi - xdj) σ2)]

3. 計算標簽[ j] 傳播到標簽 [i] 的概率 : [Tij=? Pj →i= wijk=1l+uwkj]

4. 傳播:? ? ? [Y=cat(Yl, Yu)]? ? ? ? ? ? [Yt=? T × Yt-1]

5. 重置? [Y ]中已標記樣本的標簽: [Fl=? Yl]

6. 重復步驟 4 和 5 直至 [Y] 收斂。

筆者將第一階段訓練好的模型作為特征提取器,將支撐集(support set, 有標簽), 查詢集(query set,無標簽)同時送入模型作為輸入,得到其在特征空間的映射,然后再將其歸一化到球形特征空間,通過標簽傳播算法進行預測分類,整個流程如圖2所示。

4 實驗與結果分析

4.1 實驗數據集

實驗主要在BreakHis數據集上進行,BreakHis (Breast Cancer Histopathological Image) 包括82個病人,一共7909張乳腺癌病理圖片。數據集包含了四種放大倍數(40x,100x,? 200x, 400x)的顯微圖片,分為良性腫瘤,惡性腫瘤兩個大類。

4.2 實驗流程

本文主要以ResNet50 和 MoCo作為基線模型和提出的自監督聚類模型MoCo + simLoss 作為對比。本文實驗基于Python3.7環境和PyTorch1.0框架,使用2塊NVIDIA GEFORCE 2080Ti GPU進行訓練和測試。所有實驗的輸入圖像長寬固定為224,batchsize 設置為64,訓練50 epoch,采用分類準確率來衡量算法的效果,數據增強方面則使用了隨機水平翻轉,隨機 HSV 變化,隨機縮放和隨機剪切。優化算法采用動量為 0.9 隨機梯度下降(SGD)。

4.3 實驗結果

實驗結果表1表明,基于MoCo的自監督網絡模型比ResNet50預訓練模型有很大的性能提升,說明自監督在醫學圖像特征提取任務上的有效性并且加入自監督聚類simLoss模塊能有效提升模型的性能;表2 驗證了標簽傳播算法的有效性,實驗結果表明標簽傳播算法比基于歐式距離的ProtoNet 和基于余弦距離的MatchingNet效果要好很多。

最后與傳統分類算法相比,實驗結果表3表明模型在 5-shot 以及 10-shot 的情況下已經比傳統算法有更好的分類效果, 并且隨著每個類別的有標簽樣本的增多,模型分類效果越來越好。

5 總結

本文提出了基于自監督聚類算法的醫學圖像分類模型,通過對比和消融實驗證明了本文提出的方法在小樣本情況下的醫學圖像分類問題上比傳統的機器學習算法和全監督算法具有更好的效果。

參考文獻:

[1] He K, Fan H, Wu Y, et al. Momentum contrast for unsupervised visual representation learning[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 9729-9738.

[2] Chen T, Kornblith S, Norouzi M, et al. A simple framework for contrastive learning of visual representations[C]//International conference on machine learning. PMLR, 2020:1597-1607.

[3] Azizi S, Mustafa B, Ryan F, et al. Big self-supervised models advance medical image classification[J]. arXiv preprint arXiv:2101.05224, 2021.

[4] Min E X,Guo X F,Liu Q,et al.A survey of clustering with deep learning:from the perspective of network architecture[J].IEEE Access,2018,6:39501-39514.

[5] Zhu X.Learning from Labeled and Unlabeled Data with Label Propagation[J]. Tech Report, 2002.

[6] Vinyals O, Blundell C, Lillicrap T, et al. Matching networks for one shot learning[J]. Advances in neural information processing systems, 2016,29: 3630-3638.

[7] Snell J, Swersky K, Zemel R S. Prototypical networks for few-shot learning[J]. arXiv preprint arXiv:1703.05175, 2017.

【通聯編輯:梁書】

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 亚洲国产成人久久精品软件| 欧亚日韩Av| 中文字幕在线欧美| 国产香蕉在线视频| 日本免费高清一区| 国产一区二区三区在线观看免费| 国产成人精品2021欧美日韩| 国产精品xxx| 亚洲无码不卡网| 欧美午夜在线播放| 曰AV在线无码| 青青青视频免费一区二区| 国产一级片网址| 国产精品欧美日本韩免费一区二区三区不卡 | 国产欧美日韩精品第二区| 最新国产成人剧情在线播放| 精品国产99久久| 中文字幕人妻av一区二区| 欧美a在线看| 毛片网站免费在线观看| 在线观看无码a∨| 色有码无码视频| 香蕉视频国产精品人| 操美女免费网站| 91精品人妻一区二区| 国产精品夜夜嗨视频免费视频 | 女人18毛片一级毛片在线| 青青久久91| 亚洲第一天堂无码专区| 精品人妻无码区在线视频| 久久黄色小视频| 欧美一区二区福利视频| 88av在线| 午夜福利亚洲精品| 久久久久青草线综合超碰| 重口调教一区二区视频| 欧美成人影院亚洲综合图| 亚洲成人在线免费| 97久久免费视频| 99精品高清在线播放| 免费毛片a| 九九视频免费在线观看| 中文字幕有乳无码| 一级毛片免费不卡在线| 亚洲成a人在线播放www| 国产一级片网址| 国产成人精品一区二区不卡| 40岁成熟女人牲交片免费| 韩国v欧美v亚洲v日本v| 亚洲欧美另类视频| 亚洲午夜国产精品无卡| 欧美翘臀一区二区三区| 国产理论最新国产精品视频| 亚洲欧美不卡| 亚洲欧美极品| 手机永久AV在线播放| 久久久噜噜噜久久中文字幕色伊伊 | 色综合久久88色综合天天提莫| 尤物成AV人片在线观看| 就去色综合| 免费a在线观看播放| 国产综合精品日本亚洲777| 亚洲日本www| 美女高潮全身流白浆福利区| 国产精品极品美女自在线网站| 亚洲日本中文字幕乱码中文 | 亚洲av无码牛牛影视在线二区| 久久精品无码国产一区二区三区| 重口调教一区二区视频| 91www在线观看| 国产91高跟丝袜| 欧美日韩高清在线| 国产剧情无码视频在线观看| 精品国产中文一级毛片在线看 | 在线免费a视频| 国产高清在线观看91精品| 欧美在线三级| 91成人试看福利体验区| 国产91透明丝袜美腿在线| 国产夜色视频| 欧洲免费精品视频在线| 91无码网站|