





DOI:10.3969/j.issn.10001565.2024.04.013
摘要:為解決監督學習皮膚癌診斷模型的訓練需要大量數據標注,且醫學專家標注工作成本高、耗時長、易疲勞等問題,提出了一種基于自反饋閾值學習 (Self-Feedback Threshold Learning, SFTL) 的半監督皮膚癌診斷方法.在標注數據預訓練的ResNet網絡基礎上,引入全局和局部類別間偽標簽自反饋閾值學習機制動態篩選ResNet預測概率大于自反饋閾值的無標記樣本,引入無監督閾值學習損失和分類交叉熵損失進行模型訓練,在標記樣本稀缺的情況下深入挖掘無標記數據的鑒別診斷信息,顯著降低模型在無標記皮膚病變圖像中的誤判率.選取公開數據集HAM10000的皮膚病變圖像展開實驗驗證,在僅需50%標記數據下實現了0.822 9的準確率和0.765 1的F1分數,證明所提出的SFTL模型在半監督場景下可有效解決皮膚癌診斷任務,相比其他同類方法具有更好的分類性能.
關鍵詞:半監督皮膚癌診斷;自反饋閾值學習;卷積神經網絡;半監督學習
中圖分類號:U492.2;TP301.6文獻標志碼:A文章編號:10001565(2024)04044108
Semi-supervised skin cancer diagnosis based on
self-feedback threshold learning
HAN Shuo1, YUAN Weicheng1, DU Zeyu2
(1.College of Basic Medicine, Hebei Medical University, Shijiazhuang 050017, China;
2.School of Health Science, University of Manchester, Manchester M139PL, UK)
Abstract: To address the challenges associated with the need for a large amount of annotated data in supervised skin cancer diagnosis models, such as the high cost, time consumption, and fatigue experienced by medical experts during annotation, this study proposes a semi-supervised skin cancer diagnosis method based on Self-Feedback Threshold Learning (SFTL). Building upon the ResNet network pre-trained with labeled data, a global and local class pseudo-label self-feedback threshold learning mechanism is introduced to dynamically select unlabeled samples with ResNet prediction probabilities exceeding the self-feedback threshold. Unsupervised threshold learning loss and classification cross-entropy loss are incorporated for model training, thereby deeply mining the diagnostic information from unlabeled data when labeled samples are scarce and significantly reducing the misdiagnosis rate in unlabeled skin lesion images. Experimental validation was conducted using the publicly available HAM10000 skin lesion dataset, achieving an accuracy of 0.8229 and an F1 score of 0.7651 with only 50% of the data labeled. The results demonstrate that the proposed SFTL model effectively addresses the skin cancer diagnosis task in semi-supervised scenarios and outperforms other compared methods in terms of classification performance.
收稿日期:20240108;修回日期:20240523
基金項目:河北省自然科學基金資助項目(H2019206316)
第一作者:韓碩(1974—),男,河北醫科大學講師,博士,主要從事腫瘤及神經退行性疾病相關的基礎研究及人工智能醫療應用.E-mail:hanshuo@hebmu.edu.cn
Key words: semi-supervised skin cancer diagnosis; self-feedback threshold learning; convolutional neural network; semi-supervised learning
皮膚癌是一種全球普遍存在的癌癥類型,其診斷對減少公共健康負擔至關重要[1-3].據世界衛生組織(WHO)的數據顯示,皮膚癌的早期識別和治療能夠顯著提高患者的生存率.然而,皮膚癌的發病率在全球范圍內正以驚人的速度增長,尤其是在紫外線照射強度高的地區,皮膚癌的發病率和死亡率之高令人震驚.值得注意的是,皮膚癌的治療費用也在持續上升,使得部分患者難以得到及時有效的治療[4-5].因此,準確及時地識別和診斷皮膚癌具有重大的臨床意義.
在實際診斷中,專家面臨著多種挑戰.首先,皮膚癌的病理形態多樣,需要醫生具有豐富的經驗和精準的判斷能力.由于皮膚癌的早期癥狀通常較為隱蔽,患者可能會忽視其重要性,從而錯過治療的最佳時機[6-7].因此,提高皮膚癌的早期識別準確率成為了重要的研究方向.人工智能(AI)技術在皮膚癌診斷領域的應用顯得尤為重要[8].研究已經證明,AI在許多疾病的診斷中都展現出了相當高的精確度,其中就包括皮膚癌[9-10].盡管AI技術在診斷皮膚癌方面有著巨大的潛力,但目前的應用仍然面臨一些挑戰.一方面,AI模型的訓練通常需要大量的標注數據,而這些數據的獲取過程往往需要經驗豐富的醫生進行手動標注,既耗時又費力,成為實際應用中的一大瓶頸.另一方面,部分算法雖然通過引入偽標簽在一定程度上利用未標注數據與標注數據共同訓練模型,但這些算法大多采用固定閾值來確定樣本的偽標簽.這種策略容易引入大量野點即錯誤標注數據,從而對模型的分類效果產生負面影響,限制了其在復雜醫學任務中的適用性.因此,在實際臨床應用中,需要一種能夠充分利用已有資源,既能處理標注數據,又能充分有效利用未標注數據的人工智能模型.
為解決皮膚癌診斷中遇到的難題,本研究提出了一種基于自反饋閾值學習(self-feedback threshold learning,SFTL)的半監督皮膚癌診斷模型.此模型聚焦于半監督問題,利用標記數據和無標記數據共同訓練網絡,從而緩解當前有監督AI模型需要大量數據標注的問題.同時,本模型通過設置自反饋閾值學習模塊,動態調整篩選無標記樣本時的閾值,以篩選出更可靠的無標記樣本幫助模型進一步訓練.具體來說,模型在每輪迭代訓練過程中,會根據未標注數據的平均置信度以及在各類別中的預測期望值,動態地調整篩選閾值,從而根據已有數據的分布和特性,逐步自我調整,增加偽標簽的質量.此機制顯著降低了模型在無標記數據上的誤判率,提升了模型的鑒別能力和診斷準確性,從而有效解決了標注數據稀缺所帶來的挑戰.通過更有效地利用現有的醫學圖像資源,本模型不僅提高了診斷準確性,還能顯著提高診斷過程的效率.
1自反饋半監督學習模型
1.1模型概述
以解決標記數據稀缺問題為出發點,提出的基于SFTL的半監督皮膚癌識別模型,旨在最大化利用未標記醫學圖像數據.首先,構建基于深度學習的ResNet[11]網絡并訓練為初始識別模型;然后,對未標記的皮膚鏡圖像進行預測并生成偽標簽.由于偽標簽具有一定的噪聲和不確定性,因此,設計了SFTL模塊,它能有效篩選掉噪聲樣本,以提升模型的訓練效果.
本模型的算法框架如圖1所示,從圖1可看出,模型的訓練過程主要分為2個階段.第1階段,模型利用標記數據對分類器進行若干輪次的訓練,使其獲得初步的分類能力.第2階段,模型引入無標簽數據,通過自反饋閾值計算模塊篩選出置信樣本,并生成相應的偽標簽,然后將這些帶有偽標簽的置信樣本與原有的標記數據共同輸入分類器進行聯合訓練,從而進一步提升分類器的性能.在階段過渡時,僅需將置信樣本與原有的標記樣本一同輸入分類器,并在損失函數中加入無監督學習損失,而無需進行其他額外操作.2個階段的訓練均完成后,模型訓練即告終止.通過這種訓練方式,模型能夠充分利用未標記數據中的潛在信息,有效提升皮膚癌診斷的準確性和可靠性.圖1基于SFTL的半監督算法框架
Fig.1Semi-supervised algorithm framework based on SFTL model
1.2問題定義
在半監督皮膚癌診斷任務中,訓練數據包括已標記和無標記2類皮膚圖像數據.本文將標記樣本定義為Xl={xl1,xl2,…,xlNl},其中Nl代表標記樣本的數量,對應樣本的病變類別標簽集合定義為Yl={y1,y2,…,yNl},其中每個標簽yli∈Yl均取自[1,Nc]之間的整數,Nc代表類別個數.無標記皮膚病變圖像集合定義為Xu={xu1,xu2,…,xuNu},Nu代表無標記樣本的數量.對于特征提取,本文采用ResNet50作為主干網絡f(·)提取圖像特征,定義分類層p(·)預測特征的類別.
1.3基于標記樣本的模型預訓練
為了確保主干網絡對皮膚病變圖像的特征提取能力,本模型首先基于標記樣本Xl及其類別標簽Yl,引入交叉熵損失(Lce)訓練網絡的特征提取能力.損失定義如下:Lce=-Exli∈Xlyilogp(f(xli)).(1)經過上述監督損失函數的初步訓練,特征提取器具備了一定的皮膚病變特征提取能力,可用于預測無標記樣本的概率分布,基于此實現對無標記樣本的偽標簽生成過程.給定未標記的皮膚病變圖像樣本xuj∈Xu,可以得到每個可能類別的預測分數quj=p(f(xuj)),該分數代表了模型對樣本屬于每個類別的置信度,而預測值最大概率對應的類別即為預測類別.
1.4基于SFTL的無標記樣本選擇模型
在為無標記皮膚病變圖像生成偽標簽的過程中,不可避免地會產生一些帶有錯誤標簽的噪聲樣本.因此,在本模型中,移除這些帶有噪聲的偽標記樣本變得至關重要.本文主要通過全局自反饋閾值學習和局部自反饋閾值學習2個部分完成樣本選擇.
為了克服傳統固定篩選閾值所帶來的局限性,提出了一種新穎的無標記樣本模型選擇策略,這種策略基于自適應反饋閾值學習,并涵蓋了全局自適應反饋與類別特定自適應反饋2種機制.本研究受到相關文獻[12]的影響,認為在半監督學習(SSL)中確定閾值的關鍵在于閾值應能夠反映出學習的狀態.通過評估一個校準精準的模型預測置信度,可以有效地判斷學習效果.SFTL方法利用訓練過程中模型的預測結果,自動地為每個類別定義并動態調整置信度閾值.SFTL方法起初會估算出一個全局閾值,作為模型置信度的指數移動平均值(EMA)[13],接著利用模型對各個類別概率的EMA進行評估,調整全局閾值.
SFTL算法主要分為全局自反饋閾值和局部自反饋閾值2個模塊.首先,全局自反饋閾值模塊在模型迭代過程中,根據未標注數據的平均置信度進行逐步優化.具體而言,該模塊在每次迭代時,通過計算所有無標記樣本的平均置信度,確定一個全局閾值,用于整體控制樣本篩選過程.其次,局部自反饋閾值模塊則更加細致地考慮了無標記數據對每個類別的診斷概率,全面評估各個類別的閾值.局部閾值依據每個類別的無標記樣本的分類概率進行計算,確保對不同類別的樣本進行差異化處理,從而更加全面地評估和篩選置信樣本.最后,SFTL算法對全局自反饋閾值和局部自反饋閾值進行綜合計算,得到最終的自反饋閾值.這種動態、自適應的閾值調整機制,使得模型在利用無標記數據進行訓練時,能夠顯著提升分類性能和預測精度.
全局自反饋閾值學習:在SFTL方法中,全局閾值的設定需要與模型對未標注數據的置信度緊密相關,以便準確反映出整體的學習情況.此外,為了有效排除那些錯誤的偽標簽,這一全局閾值在訓練過程中應逐漸提升.在本研究中,將全局閾值定義為模型在第t次迭代時對未標注數據的平均置信度,全局閾值的優化依據文獻[14]方式進行迭代更新Tg(t)=1Nc,if t=0λTg(t-1)+(1-λ)1Nu∑Nuj=1max(quj),otherwise,(2)其中,λ是EMA的參數,quj=[quj(1),quj(2),…,quj(Nc)]代表無標記數據中第j個樣本在各類別中的預測分數.
局部自反饋閾值學習:在SFTL方法中,局部自反饋閾值的目的在于以類別特定的方式調整全局自反饋閾值,以此來考慮類內多樣性和潛在的類別鄰近性.通過計算模型對每個類別的預測期望值,以評估該類別的具體學習狀態.Tr(t,c)=1Nc,if t=0λTr(t-1,c)+(1-λ)1Nu∑Nuj=1quj(c),otherwise,(3)由此,得到每個類別的自反饋閾值Tr(t)=[Tr(t,1),…,Tr(t,c),…,Tr(t,Nc)].式(3)中,quj(c)代表無標記數據中第j個樣本對第c個類別的預測分數.
通過全局自反饋和局部自反饋閾值學習,可以得到最終的自反饋閾值TT(t,c)=MaxNorm(Tr(t,c))·Tg(t)=Tr(t,c)max{Tr(t,c):c∈[Nc]}·Tg(t),(4)其中,MaxNorm的計算形式為x′=xmax(x).根據上述計算的自反饋閾值計算公式,可以獲得篩選后更為可靠的無標記樣本集合,即X^u.
最終,第t次迭代過程中用于無監督學習的閾值學習損失定義如下:LT=-Exuj∈Xu1(max(quj)>T(t,arg max(quj)))·(yujlog p(f(xuj))),(5)其中,1代表樣本超過固定概率閾值的指示函數,yuj代表無標記數據中第j個樣本的偽標簽,由此,LT中只保留預測概率大于自反饋閾值的無標記樣本用于模型訓練.
通過引入公式(5)中的閾值學習損失,本文模型的最終損失函數定義如下:L=λ1Lce+λ2LT,(6)其中,λ1和λ2是損失函數中平衡系數.
2實驗與結果分析
2.1皮膚病變數據來源
實驗驗證基于公開的HAM10000皮膚癌診斷數據集[15],這是目前最大的公開皮膚病變圖像數據集,包含了奧地利維也納醫學大學的皮膚科和澳大利亞昆士蘭的Cliff Rosendahl皮膚癌診所,跨越20年時間收集的10 015張涵蓋7種皮膚病變的圖像.針對本研究的半監督自反饋閾值學習模型,將數據集隨機劃分為5 000張訓練集和5 015張的測試集,其中訓練集再細分為標記和未標記的子集,進行不同標記樣本量下的學習實驗.
2.2實驗設計
實驗選擇了深度殘差網絡ResNet50作為特征提取器,利用在ImageNet大規模視覺識別挑戰賽上預先訓練得到的模型參數對其進行初始化,為模型的訓練提供了良好的基礎[16].模型的訓練采用了隨機梯度下降優化器,共進行150個迭代周期(Epoch)的訓練.在訓練過程中,模型的批處理大小設定為64,初始學習率定為0.001,平衡系數λ1和λ2分別設置為1和0.3.將所有輸入圖像統一調整為224×224的分辨率,并通過隨機水平翻轉等數據增強技術,提升了模型的魯棒性.本研究基于Pytorch框架進行開發,并在NVIDIA Geforce 4090 GPU上進行模型的訓練和驗證.為了全面評估模型的性能,本文采用了包括準確率(Accuracy)、精確度(Precision)、靈敏度(Sensitivity)、特異性(Specificity)、Kappa系數以及AUC(area under the curve)值在內的多種評價指標.
2.3實驗結果
2.3.1結果分析
通過在HAM10000數據集上進行一系列深度實驗,充分驗證了基于半監督自反饋閾值學習的皮膚癌診斷模型的效率和健壯性.如表1所示,在不同數量的標記樣本上進行了詳盡的性能評估和對比研究.值得注意的是,當僅使用500個標記樣本時,模型已經展示出顯著的預測能力,準確率高達0.752 8,Kappa系數為0.624 1,F1分數達到0.731 9,召回率和精確度分別為0.752 8和0.731 1,這表明模型在標記數據稀缺的情況下仍具有強大的泛化和學習能力.隨著標記樣本數量增加至1 000~5 000,模型的性能顯著提升.在5 000個標記樣本的情況下,各項性能指標達到了最高值:準確率為0.855 4,Kappa系數為0.813 6,F1分數為0.851 8,召回率和精確度分別為0.851 8和0.851 0.這些高效的性能指標,特別是準確率和Kappa系數的顯著提升,有力證明了本文提出的模型在皮膚癌診斷中的準確性和一致性.此外,F1分數、召回率和精確度的高水平表現,進一步突顯了該模型在平衡誤診與漏診方面的出色性能.這些實驗結果表明SFTL模型在皮膚癌診斷任務中具有魯棒性,并為未來半監督皮膚癌研究提供了新的方向.
同時,為了深入揭示無標記樣本在模型訓練過程中的影響,設計了一系列對比實驗,對比了在監督學習和半監督學習框架下模型的表現.如表2所示,在去除SFTL模塊后,模型的整體性能呈現出一定程度的下滑.以500個標記樣本為例,模型的準確率由0.752 8下降至0.747 8,Kappa系數由0.624 1微降至0.641 0,同時其他指標也都出現了相應的降低.這一趨勢形象地揭示了SFTL模塊在提升模型性能方面的重要作用.這一發現再次強調了SFTL模型的優勢,即能夠有效地利用未標記樣本中的隱含信息,顯著提升皮膚癌診斷的準確性和可靠性,凸顯了該模塊在標簽資源有限場景中的巨大優勢.
2.3.2對比分析
根據CSDA(class-specific distribution dignment)[17]中匯報的多種先進半監督算法(包括FixMatch[18]、Bis[19]、CSDA)在HAM10000數據集上的表現,系統地對比了不同方法的效果,并將結果匯總在圖2中.為了保證實驗條件的一致性,所有算法均在600個標記數據的基礎上進行訓練.結果顯示,本文提出的基于SFTL模型取得了令人印象深刻的成績,準確率達到了0.753 6,AUC得分達到了0.879 7.這一結果顯著超越了其他對比方法的表現,與對比方法中性能最好的CSDA模型相比,準確率提高了0.309 3,AUC提高了0.076 1.因此,SFTL模型在少量標注數據情況下表現出卓越的診斷能力,顯著優于其他先進半監督方法,表明SFTL模型在皮膚癌診斷領域的半監督學習中實現了實質性的進步,展示了其在臨床應用中的巨大潛力.a.不同類型準確率對比;b.不同類型AUC效果對比
2.3.3ROC可視化分析
在模型性能評估階段,使用接受者操作特性曲線(ROC)衡量模型在皮膚癌診斷中的表現.如圖3所示,使用僅500個標記樣本訓練的模型在識別不同類型皮膚病變任務中展示了優秀的診斷性能,具體包括非色素性角化病(AKIEC)、基底細胞癌(BCC)、良性角化病樣病變(BKL)、皮脂腺瘤(DF)、黑色素瘤(MEL)、黑色素痣(NV)和血管性病變(VASC).這些疾病的識別任務中,模型分別獲得了0.93、0.94、0.87、0.83、0.82、0.91和0.92的AUC值.整體病種的宏觀平均ROC曲線AUC值達到0.89,進一步證明了模型在多元化和復雜皮膚癌診斷中的強大魯棒性和穩定性,驗證了自反饋閾值學習模型的卓越性能,特別是在標簽稀缺情況下,其獨特的半監督學習策略有效挖掘未標記樣本信息,顯著提升了模型的學習效果.
2.3.4t-SNE可視化分析
為了更直觀地展示本研究所提出的半監督皮膚癌診斷模型在特征空間中對不同皮膚病變類型的類別劃分,在圖4中,采用t-分布隨機鄰域嵌入(t-SNE)算法將模型生成的高維特征空間映射到二維平面上進行觀察和分析.從可視化結果中可以清楚地看到,不同類型樣本在二維空間中形成了清晰的簇.這表明本文模型在高維特征空間中能夠有效區分并識別不同的皮膚病變類型.特別值得注意的是,基底細胞癌(BCC)和黑色素瘤(MEL)在特征空間中的分布較為分散,這可能揭示了這些病變在臨床特征表現上的異質性.而黑色素痣(NV)的樣本在圖中聚集成一個顯著區域,展示了模型對黑色素痣與其他類型皮膚病變的明確區分能力,這在降低診斷過程的假陽性率上具有重要價值,進一步突顯了本文模型在特征抽取和分類任務中的卓越性能.
2.3.5損失函數中平衡系數的消融實驗分析
為了驗證損失函數使用不同平衡參數比例下模型的效果,設置了一系列消融實驗,并將結果匯總在圖5中.消融實驗過程中,本文分別將其中一個平衡參數固定為最優值的情況下對另一個參數進行一系列實驗來驗證最優參數.圖5中的結果表明,當且僅當λ1和λ2的參數分別設置為1和0.3時,模型的結果達到最優.這一結果表明用于有監督學習的交叉熵損失仍然需要在模型訓練過程中占據較大比重,但用于無監督學習的閾值學習損失的比例同樣不能過低,否則都會影響模型診斷皮膚癌的能力.該實驗結果進一步說明了自反饋閾值學習這一無監督學習過程在模型中占據著不可替代的作用.因此,SFTL模型不僅能夠幫助減少醫療人員在數據標注方面的工作壓力,還能推進皮膚癌診治研究的進一步發展,從而顯著改善皮膚癌患者的治療效果.a.平衡系數λ1;b.平衡系數λ2
3結論
提出了一個創新的半監督學習框架——SFTL模型.這一模型聚焦半監督學習任務,使用少量標記數據與大量的未標記數據共同訓練,有效緩解了當前皮膚癌診斷任務中經常遇到的標記數據不足的問題.SFTL模型的創新在于其在每次迭代過程中,能夠根據數據的全局置信度和類內預測期望動態地調整篩選置信樣本時的閾值,從而增加了對無標記數據的利用效率和篩選置信樣本的精確度.這種機制不僅提升了模型的訓練效果,同時顯著提高了其皮膚癌診斷能力.在HAM10000數據集上的實驗結果表明,即使在標注樣本稀缺的情況下,SFTL模型依然能夠達到較高的準確率,從而驗證了其在標簽稀缺環境下的強大診斷能力和魯棒性.綜合來看,本研究所提出的SFTL模型為解決醫學圖像分析中標注數據不足的問題提供了新的思路和方法,對提升皮膚癌早期診斷的準確性和效率具有重要參考價值.
參考文獻:
[1]蔡桂月,李思銳,劉穎,等.皮膚腫瘤患者外周血循環腫瘤細胞與循環腫瘤血管內皮細胞檢測的臨床價值[J].皮膚性病診療學雜志, 2023, 30(3): 198-204. DOI: 10.3969/j.issn.1674-8468.2023.03.003.
[2]ZENG L, JASWANTH GOWDA B H J, AHMED M G, et al. Advancements in nanoparticle-based treatment approaches for skin cancer therapy[J]. Mol Cancer, 2023, 22(1): 10. DOI: 10.1186/s12943-022-01708-4.
[3]KING C, FOWLER J C, ABNIZOVA I, et al. Somatic mutations in facial skin from countries of contrasting skin cancer risk[J]. Nat Genet, 2023, 55(9): 1440-1447. DOI: 10.1038/s41588-023-01468-x.
[4]WU Y H, CHOU C L, CHANG H C. Risk of skin cancer after ultraviolet phototherapy in patients with vitiligo: a systematic review and meta-analysis[J]. Clin Exp Dermatol, 2022, 47(4): 692-699. DOI: 10.1111/ced.15010.
[5]唐洪波,梁俊琴.紫外線致非黑色素瘤皮膚癌的作用機制研究進展[J].腫瘤預防與治療,2019, 32(10): 940-944. DOI: 10.3969/j.issn.1674-0904.2019.10.014.
[6]崔燦,張芳,孫圓圓,等.Sirtuins在皮膚惡性腫瘤發病機制中的作用及研究進展[J].皮膚病與性病, 2023, 45(4): 238-241. DOI: 10.3969/j.issn.1002-1310.2023.04.003.
[7]萬春雷.皮膚癌的發病機制及在不同種群的發病差異[J].皮膚科學通報, 2022, 39(3): 173-176.
[8]TSCHANDL P, RINNER C, APALLA Z, et al. Human-computer collaboration for skin cancer recognition[J]. Nat Med, 2020, 26(8): 1229-1234. DOI: 10.1038/s41591-020-0942-0.
[9]ESTEVA A, KUPREL B, NOVOA R A, et al. Dermatologist-level classification of skin cancer with deep neural networks[J]. nature, 2017, 542(7639): 115-118. DOI: 10.1038/nature21056.
[10]GULSHAN V, PENG L, CORAM M, et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs[J]. jama, 2016, 316(22): 2402-2410. DOI: 10.1001/jama.2016.17216.
[11]HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). June 27-30, 2016, Las Vegas, NV, USA, IEEE, 2016: 770-778. DOI: 10.1109/cvpr.2016.90.
[12]KLINKER F. Exponential moving average versus movingexponentialaverage[J]. Math Semesterber, 2011, 58(1): 97-107. DOI: 10.1007/s00591-010-0080-8.
[13]WANG Y D, CHEN H, HENG Q, et al. FreeMatch: self-adaptive thresholding for semi-supervised learning[EB/OL]. 2022: arXiv: 2205.07246. http://arxiv.org/abs/2205.07246.
[14]WANG Y, CHEN H, HENG Q, et al. Freematch: Self-adaptive thresholding for semi-supervised learning[J]. arxiv preprint arxiv:2205.07246, 2022. DOI:https://doi.org/10.48550/arXiv.2205.07246.
[15]TSCHANDL P, ROSENDAHL C, KITTLER H. The HAM10000 dataset, a large collection of multi-source dermatoscopic images of common pigmented skin lesions[J]. Sci Data, 2018, 5: 180161. DOI: 10.1038/sdata.2018.161.
[16]AMARI S I. Backpropagation and stochastic gradient descent method[J]. Neurocomputing, 1993, 5(4/5): 185-196. DOI: 10.1016/0925-2312(93)90006-o.
[17]HUANG Z, WU J, WANG T, et al. Class-specific distribution alignment for semi-supervised medical image classification[J]. Computers in Biology and Medicine, 2023, 164: 107280. DOI: 10.1016/j.compbiomed.2023.107280.
[18]SOHN K, BERTHELOT D, CARLINI N, et al. Fixmatch: Simplifying semi-supervised learning with consistency and confidence[J]. Advances in neural information processing systems, 2020, 33: 596-608. DOI:https://doi.org/10.48550/arXiv.2001.07685.
[19]HE J, KORTYLEWSKI A, YANG S, et al. Rethinking re-sampling in imbalanced semi-supervised learning[J]. arxiv preprint arxiv:2106.00209, 2021. DOI:https://doi.org/10.48550/arXiv.2106.00209.
(責任編輯:孟素蘭)