999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學(xué)習(xí)的乳腺癌分子亞型分類(lèi)研究

2020-09-18 09:13:30黃軍豪廖天馳
現(xiàn)代計(jì)算機(jī) 2020年22期
關(guān)鍵詞:乳腺癌分類(lèi)深度

黃軍豪,廖天馳

(1.四川農(nóng)業(yè)大學(xué)信息工程學(xué)院,雅安 625014;2.四川農(nóng)業(yè)大學(xué)理學(xué)院,雅安 625014)

0 引言

乳腺癌是危害女性健康最常見(jiàn)的一種癌癥[1]。在全球范圍內(nèi),2018 年新診斷的女性乳腺癌病例約210萬(wàn)例,占女性癌癥病例的近四分之一[2]。乳腺癌是一種異質(zhì)性疾病,可以細(xì)分為不同的乳腺癌亞型,不同亞型的異質(zhì)性是影響治療手段的關(guān)鍵因素之一[3]。因此,乳腺癌分子亞型的鑒定成為了推進(jìn)乳腺癌精準(zhǔn)診斷和治療的重要需求[4]。隨著免疫組織化學(xué)物(IHC)的興起,在醫(yī)學(xué)上將乳腺癌分子亞型分為L(zhǎng)uminal A、Luminal B、Her2-enrich 和 Basal-like 4 個(gè)類(lèi)型,每種不同的分子亞型都與疾病進(jìn)展趨勢(shì)相關(guān)[5-6]。乳腺癌分子亞型的高效診斷是分子醫(yī)學(xué)領(lǐng)域一個(gè)尚未滿足的需求,盡管使用IHC 識(shí)別乳腺癌分子亞型具有一定的精準(zhǔn)度,但其識(shí)別周期較長(zhǎng),于是需要更高效的診斷來(lái)幫助制定個(gè)體化的治療方案[7-10]。

近年來(lái),日益精化的醫(yī)學(xué)圖像和快速發(fā)展的深度學(xué)習(xí)技術(shù)給計(jì)算機(jī)輔助診斷技術(shù)提供了良好的發(fā)展平臺(tái)和契機(jī)[11]。深度學(xué)習(xí)模型能夠自動(dòng)進(jìn)行特征抽象,隨著卷積網(wǎng)絡(luò)的不斷加深,更加抽象且高維度的特征也不斷地被提取,這很好地突破了傳統(tǒng)機(jī)器學(xué)習(xí)算法的性能瓶頸,因此,深度學(xué)習(xí)在圖像識(shí)別、圖像分割、語(yǔ)義分析等多個(gè)領(lǐng)域都有著廣泛的應(yīng)用[12-13]。在生物醫(yī)學(xué)領(lǐng)域,深度學(xué)習(xí)也為高效準(zhǔn)確的計(jì)算機(jī)輔助診斷提供了一種新的思路。

乳腺癌分子亞型的智能分類(lèi)是一項(xiàng)非常有挑戰(zhàn)性的研究。在國(guó)內(nèi),利用深度學(xué)習(xí)技術(shù)進(jìn)行乳腺癌分子亞型分類(lèi)的研究較少。在國(guó)外,已經(jīng)有不少研究將深度學(xué)習(xí)技術(shù)應(yīng)用于乳腺癌分子亞型的智能分類(lèi)中。Zhu 等人[14]將乳腺癌分子亞型的分類(lèi)進(jìn)行簡(jiǎn)化,將Luminal A 型單獨(dú)作為一類(lèi),其他3 種亞型作為一類(lèi),利用乳腺的核磁共振成像圖(MRI)作為數(shù)據(jù)集,采用VGG16[15]、GoogLeNet[16]等多種經(jīng)典模型進(jìn)行乳腺癌分子亞型分類(lèi),最終將所有的測(cè)試結(jié)果取平均值,得到的平均AUC 為0.64。Ha 等人[17]提出了一種定制的14 層卷積神經(jīng)網(wǎng)絡(luò)用于乳腺癌分子亞型的分類(lèi),他們采用的數(shù)據(jù)集是216 例乳腺癌患者的MRI,并按照醫(yī)學(xué)上的亞型分類(lèi)進(jìn)行預(yù)測(cè),最終在四種亞型的分類(lèi)上,取得了70%的準(zhǔn)確率。

本文提出了一種基于深度學(xué)習(xí)的乳腺癌分子亞型分類(lèi)模型,該模型針對(duì)乳腺癌病理圖像數(shù)據(jù)的特征,定制了一種深層次卷積神經(jīng)網(wǎng)絡(luò)(DCNN),在一定的精度下,實(shí)現(xiàn)乳腺癌分子亞型的高效分類(lèi)。

1 方法與材料

1.1 數(shù)據(jù)集

本文使用TCGA-BRCA 數(shù)據(jù)集作為乳腺癌分子亞型分類(lèi)研究的樣本集,該數(shù)據(jù)集包含1098 位乳腺癌患者的乳腺病理圖像數(shù)據(jù),該數(shù)據(jù)集可以通過(guò)TCGA 數(shù)據(jù)庫(kù)獲得[18]。

每位患者平均含有3 張乳腺的病理圖像數(shù)據(jù),病理圖像是彩色圖片,包含了紅綠藍(lán)(RGB)三個(gè)通道,每張病理圖像數(shù)據(jù)的平均像素約為80,000×50,000。本文按照8:1:1 的比例隨機(jī)地將病理圖像樣本分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,在隨機(jī)分配的同時(shí),本文也考慮了四種分子亞型所對(duì)應(yīng)樣本數(shù)量本身的不均衡性,例如Luminal A 型樣本數(shù)量大約是Her2-enrich 型樣本數(shù)量的6 倍,為了保證測(cè)試效果的公平性,本文對(duì)四種分子亞型的樣本采用比例不變的分層采樣。詳細(xì)的數(shù)據(jù)劃分如表1 所示。

表1 全尺寸病理圖像的具體數(shù)據(jù)劃分

1.2 數(shù)據(jù)預(yù)處理

每一張?jiān)疾±韴D像像素點(diǎn)數(shù)量的計(jì)量單位上億級(jí),像這樣的大尺寸、超高分辨率的圖像,無(wú)法直接作為DCNN 模型的輸入。為了解決這個(gè)問(wèn)題,本文在盡可能保留原始圖像特征的情況下,對(duì)全尺寸圖像進(jìn)行了分塊處理。

圖像分塊就是將全尺寸圖片按照一定的尺寸進(jìn)行切割,最終將一個(gè)全尺寸圖片切割成為若干小尺寸圖片,以適應(yīng)深度學(xué)習(xí)模型的輸入。本文按照2,048×2,048 的像素區(qū)域?qū)θ叽绮±韴D像進(jìn)行分塊處理,每一子塊的標(biāo)簽與子塊所屬的全尺寸病理圖像的標(biāo)簽保持一致。

由于全尺寸病理圖像的表現(xiàn)特征具有區(qū)域性,圖像的局部區(qū)域是由特征信息非常少的毛細(xì)組織構(gòu)成,如圖1 所示。這部分區(qū)域整體偏向于無(wú)色和白色,本文稱其為“白色”噪音圖像。這些“白色”噪音圖像在圖像分塊的處理過(guò)程中,會(huì)被當(dāng)作有效信息切割下來(lái),成為圖像分塊的產(chǎn)物。如果將這部分“白色”噪音圖像作為深度卷積神經(jīng)網(wǎng)絡(luò)模型的輸入,會(huì)干擾模型的自優(yōu)化,影響模型的特征識(shí)別,最終降低網(wǎng)絡(luò)的性能。因此,為了解決這個(gè)問(wèn)題,本文采用了一種基于灰度值計(jì)算的圖像過(guò)濾技術(shù),對(duì)“白色”噪音圖像進(jìn)行過(guò)濾,具體的步驟如下:

以一張小尺寸病理圖像數(shù)據(jù)的處理過(guò)程為例,利用浮點(diǎn)算法計(jì)算該病理圖像每一個(gè)像素點(diǎn)的灰度值:

圖1“白色”噪音圖像示意圖

在計(jì)算出每個(gè)像素點(diǎn)的灰度值后,取得整張圖片的平均灰度值。平均灰度值越大,即其值越接近255,證明圖片所包含的信息越少,則這類(lèi)圖片可以歸類(lèi)為“白色”噪音圖片,不宜被選用。

基于此思想,對(duì)于一張全尺寸圖像分塊后的若干小尺寸病理圖像,本文選取其中信息含量最多的50 張圖像作為最終的數(shù)據(jù)集,最終的數(shù)據(jù)集劃分如表2所示。

表2 小尺寸病理圖像的具體數(shù)據(jù)劃分

除此之外,為了提高訓(xùn)練效果,打破小樣本的數(shù)據(jù)集的性能限制,本文對(duì)每一張小尺寸病理圖像都做了數(shù)據(jù)增強(qiáng)。主要的實(shí)現(xiàn)方法是對(duì)圖像進(jìn)行隨機(jī)旋轉(zhuǎn)、鏡面翻轉(zhuǎn)和沿對(duì)角線翻轉(zhuǎn)。這樣做可以有效提高DCNN 模型的泛化能力,提高其在測(cè)試數(shù)據(jù)集上的表現(xiàn)。

整個(gè)數(shù)據(jù)預(yù)處理的流程如圖2 所示。

圖2 數(shù)據(jù)預(yù)處理流程圖

1.3 模型構(gòu)建

目前還有沒(méi)有一個(gè)較為成熟的乳腺癌病理圖像識(shí)別模型,為了提高模型的適應(yīng)性,本文定制了一種DCNN 模型來(lái)提取病理圖像數(shù)據(jù)的抽象特征。這個(gè)模型是基于VGG16[15]進(jìn)行改進(jìn)的,改進(jìn)后的DCNN 模型由28 層組成,整體架構(gòu)為:深層次局部特征提取網(wǎng)絡(luò)組合高維特征抽象網(wǎng)絡(luò)。

輸入層:負(fù)責(zé)將圖像數(shù)據(jù)輸入網(wǎng)絡(luò)進(jìn)行特征提取,并自適應(yīng)圖片大小。本文的輸入層包含3 個(gè)通道,為了進(jìn)一步提高網(wǎng)絡(luò)的提取效率,輸入層會(huì)自適應(yīng)壓縮圖像大小,聚合特征信息,以適應(yīng)DCNN 模型的特征提取。

卷積層[19]:負(fù)責(zé)更加深入地分析圖像的每一個(gè)部分,提取更加抽象的特征,通常經(jīng)過(guò)卷積層的輸入矩陣會(huì)變得更深,特征信息會(huì)更明顯。本文模型中的卷積層過(guò)濾器的大小有1×1和3×3 兩種,過(guò)濾器的移動(dòng)步長(zhǎng)統(tǒng)一設(shè)置為1。卷積層使用全零填充機(jī)制。

Inception 層:負(fù)責(zé)進(jìn)一步提取高緯度特征。本文模型中的Inception 層引用自InceptionV3 模型[19]中的倒數(shù)第六層,也是InceptionV3 模型的核心層。引用該層是為了更加深入地分析病理圖像的粗粒度信息,突破特征提取瓶頸。

池化層:負(fù)責(zé)縮小矩陣的尺寸,減少網(wǎng)絡(luò)中的參數(shù)。池化層可以有效防止過(guò)擬合,也能夠加快網(wǎng)絡(luò)的優(yōu)化速度[19]。本文模型的池化層均采用Max Pooling。池化層的過(guò)濾器尺寸統(tǒng)一為2×2,移動(dòng)步長(zhǎng)為2,全部采用全零填充機(jī)制。

為了進(jìn)一步防止過(guò)擬合問(wèn)題,本文在訓(xùn)練網(wǎng)絡(luò)時(shí)也引入了Dropout 技術(shù)[20],并將Dropout 技術(shù)用于第一個(gè)全連接層。

本文DCNN 模型的激活函數(shù)全部采用ReLU 激活函數(shù)[21]。該激活函數(shù)非常適合DCNN 模型,它能減輕梯度消失的問(wèn)題[21]。

本文使用的參數(shù)初始化方法為:Xavier 初始化[22]。該方法可以保證每一層輸出的方差盡量相等,可以一定程度上減少收斂時(shí)間,是一種很高效的DCNN 初始化方法[22]。

本文定義的損失函數(shù)如下:

Lt表示樣本的正確標(biāo)簽,其中表示網(wǎng)絡(luò)輸出的結(jié)果,λ為正則化項(xiàng)的權(quán)重。

本文DCNN 模型的初始學(xué)習(xí)率設(shè)置為0.1,使用Gradient Descent Optimizer 進(jìn)行誤差修正。

本文DCNN 模型的具體結(jié)構(gòu)見(jiàn)圖3。

圖3 DCNN網(wǎng)絡(luò)的具體結(jié)構(gòu)

2 實(shí)驗(yàn)結(jié)果

本文模型在 Intel Core i7 CPU,NVIDIA GeForce RTX 2080 GPU 上進(jìn)行訓(xùn)練,使用 TensorFlow 框架[23]。DCNN 模型的訓(xùn)練時(shí)長(zhǎng)約為8 小時(shí)14 分鐘。

本文將訓(xùn)練好模型在測(cè)試集上進(jìn)行性能驗(yàn)證,DCNN 模型的分類(lèi)準(zhǔn)確率為70.08%,除此之外,本文還統(tǒng)計(jì)了DCNN 模型在損失函數(shù)上的損失值,DCNN 模型的損失值為0.48633。

上述準(zhǔn)確率是在原來(lái)的測(cè)試數(shù)據(jù)集上進(jìn)行一次測(cè)試得到的,不具有普適性,不能作為評(píng)判模型優(yōu)劣的結(jié)果,為了更進(jìn)一步地得到更為準(zhǔn)確可靠的模型性能結(jié)果,本文對(duì)DCNN 模型進(jìn)行了十次十折交叉驗(yàn)證[24],其結(jié)果如圖4 所示。在十次交叉驗(yàn)證中。DCNN 模型的最高分類(lèi)準(zhǔn)確率為76.49%,平均分類(lèi)準(zhǔn)確率為71.97%。

圖4 十次十折交叉驗(yàn)證的具體結(jié)果

為了評(píng)估多模態(tài)融合模型對(duì)某一種乳腺癌分子亞型作預(yù)測(cè)的性能,本文分別對(duì)每一種分子亞型作了ROC 曲線,也計(jì)算了模型在每一種分子亞型預(yù)測(cè)工作上的AUC 值。ROC 曲線是反應(yīng)二分類(lèi)模型性能的一種曲線。對(duì)于一個(gè)二分類(lèi)問(wèn)題,實(shí)例可以分成Positive或者Negative,但在實(shí)際分類(lèi)問(wèn)題中,會(huì)出現(xiàn)四種情況:True Positive(TP)、False Negative(FN)、False Positive(FP)和 True Negative(TN)。ROC 曲線的橫軸是 True Positive Rate(TPR)、縱軸是 False Positive Rate(FPR),它們的計(jì)算公式如下:

ROC 曲線上的每個(gè)點(diǎn)對(duì)應(yīng)一個(gè)閾值,ROC 曲線下的面積即為AUC 值,AUC 值越大,則證明當(dāng)前模型的分類(lèi)性能越出色。

由于分子亞型的預(yù)測(cè)工作本身是多分類(lèi)問(wèn)題,ROC 曲線的繪制和AUC 值的計(jì)算需要在二分類(lèi)問(wèn)題上進(jìn)行,本文對(duì)某一種分子亞型的預(yù)測(cè)作性能評(píng)估時(shí),將其他種類(lèi)的分子亞型分為一類(lèi),例如:判斷模型對(duì)Luminal A 型作預(yù)測(cè)的性能時(shí),將其他三個(gè)種類(lèi)的分子亞型標(biāo)注為一類(lèi)。不同分子亞型預(yù)測(cè)性能評(píng)估的ROC曲線如圖5 所示。

圖5 不同分子亞型的ROC曲線

3 與其他模型對(duì)比

為了進(jìn)一步驗(yàn)證本文針對(duì)乳腺癌病理圖像數(shù)據(jù)所構(gòu)建的DCNN 模型的性能優(yōu)越性,本文選取了經(jīng)典的3 種深度學(xué)習(xí)模型作為對(duì)照模型,進(jìn)行性能對(duì)比。

本文選取三種經(jīng)典的深度學(xué)習(xí)模型分別為AlexNet[25]、VGG16[15]和 GoogLeNet[16],對(duì)照模型在相同的數(shù)據(jù)集下進(jìn)行復(fù)現(xiàn)實(shí)驗(yàn),實(shí)驗(yàn)的對(duì)比結(jié)果如表3 所示。

表3 與其他模型對(duì)比的結(jié)果

通過(guò)廣度上的對(duì)比,可以發(fā)現(xiàn)本文構(gòu)建的DCNN模型不論是在分類(lèi)準(zhǔn)確率上還是AUC 的得分上都要優(yōu)于其他三種經(jīng)典的深度學(xué)習(xí)模型。

4 結(jié)語(yǔ)

本文提出了一種改進(jìn)的深度學(xué)習(xí)模型,用于有效地提取乳腺癌病理圖像數(shù)據(jù)的特征信息,解決乳腺癌分子亞型的智能分類(lèi)問(wèn)題。本文利用訓(xùn)練好的模型進(jìn)行十次十折交叉驗(yàn)證,在四分類(lèi)問(wèn)題上取得了71.97%的預(yù)測(cè)準(zhǔn)確率;分別對(duì)每種亞型進(jìn)行AUC 檢驗(yàn),四種亞型的平均AUC 值為78.47%。如果將來(lái)能在更加優(yōu)質(zhì)、豐富的數(shù)據(jù)集上進(jìn)行模型訓(xùn)練,本文DCNN 模型的性能可能會(huì)進(jìn)一步提升。綜上所述,本文的模型可以成為未來(lái)乳腺癌分子亞型智能分類(lèi)的一個(gè)潛在選擇。

猜你喜歡
乳腺癌分類(lèi)深度
絕經(jīng)了,是否就離乳腺癌越來(lái)越遠(yuǎn)呢?
中老年保健(2022年6期)2022-08-19 01:41:48
分類(lèi)算一算
深度理解一元一次方程
乳腺癌是吃出來(lái)的嗎
分類(lèi)討論求坐標(biāo)
深度觀察
深度觀察
胸大更容易得乳腺癌嗎
深度觀察
數(shù)據(jù)分析中的分類(lèi)討論
主站蜘蛛池模板: 一级在线毛片| 国产91高清视频| 欧美、日韩、国产综合一区| yjizz视频最新网站在线| 99在线视频免费| 欧美人与动牲交a欧美精品| 国产a网站| 午夜电影在线观看国产1区| 欧美日韩在线成人| 中文字幕调教一区二区视频| 国产精品久久久久无码网站| 色综合a怡红院怡红院首页| 成人在线欧美| 国产成在线观看免费视频| 国产日韩av在线播放| 国内精品91| 亚洲另类国产欧美一区二区| 欧美日韩导航| 免费在线国产一区二区三区精品| 欧美69视频在线| 又黄又湿又爽的视频| www中文字幕在线观看| 欧美综合在线观看| 免费观看国产小粉嫩喷水| 一级毛片基地| 99中文字幕亚洲一区二区| 久久免费视频播放| 亚洲va在线观看| 免费福利视频网站| 亚洲天堂网2014| 国产九九精品视频| 91热爆在线| 天天综合网在线| 国产午夜无码片在线观看网站| 婷婷亚洲视频| 欧美在线综合视频| 欧美成a人片在线观看| 全部免费特黄特色大片视频| 国产玖玖玖精品视频| 国产成人福利在线视老湿机| 国产精品丝袜视频| 成人在线不卡| 又黄又爽视频好爽视频| 内射人妻无套中出无码| 97成人在线视频| 国产h视频免费观看| 97成人在线视频| 国产又色又爽又黄| 亚洲一区二区三区国产精品| 在线精品欧美日韩| 亚洲成人在线免费| 色老二精品视频在线观看| 狠狠综合久久久久综| 中文字幕资源站| 四虎永久在线视频| 国内精自线i品一区202| 精品国产免费观看| 精品亚洲欧美中文字幕在线看| 亚洲精品成人福利在线电影| 亚洲精品天堂在线观看| 精品一区二区无码av| 国产极品嫩模在线观看91| 日韩在线永久免费播放| 国产在线精彩视频二区| av尤物免费在线观看| 久久99这里精品8国产| 中国精品自拍| 欧美午夜小视频| 亚洲国产无码有码| 天天摸夜夜操| jijzzizz老师出水喷水喷出| www亚洲天堂| 亚洲欧美在线看片AI| 亚洲日产2021三区在线| 人妻中文久热无码丝袜| 狠狠亚洲婷婷综合色香| 国产精品永久久久久| 亚洲综合九九| 高潮毛片免费观看| 不卡国产视频第一页| 日韩av资源在线| 高清欧美性猛交XXXX黑人猛交|