張?zhí)壹t,范素麗,郭徐徐,李倩倩
1) 北京科技大學(xué)計(jì)算機(jī)通信與工程學(xué)院,北京 100083 2) 材料領(lǐng)域知識工程北京市重點(diǎn)實(shí)驗(yàn)室,北京 100083
為了對圖像分類,研究人員提出了卷積神經(jīng)網(wǎng)絡(luò)(CNN). CNN通常用于分析視覺圖像,它將圖像的每個(gè)像素作為特征,是一種類似于人工神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型或多層感知器. 第一代CNN是由LeCun于1998年提出的LeNet[1]. LeNet是為了解決手寫數(shù)字的識別任務(wù)而提出的,是早期CNN中最具代表性的結(jié)構(gòu)之一. 此后,CNN最基本的體系結(jié)構(gòu)被確定為卷積層、池化層和全連接層. 在 2012年,Krizhevsky提出了 AlexNet[2]卷積神經(jīng)網(wǎng)絡(luò),并提出新的激活函數(shù)(ReLU)、局部響應(yīng)歸一化(LRN)、DropOut和數(shù)據(jù)增強(qiáng)方法以提高網(wǎng)絡(luò)的泛化能力. AlexNet贏得了ILSVRC2012[3]的第一名,從此,CNN受到了研究界的廣泛關(guān)注.在AlexNet之后,出現(xiàn)了許多優(yōu)秀的CNN模型,這些CNN主要有三個(gè)發(fā)展方向:(a)更深:網(wǎng)絡(luò)層更深,代表網(wǎng)絡(luò)是 VggNet[4]、ResNet[5];(b)模塊化:模塊化網(wǎng)絡(luò)結(jié)構(gòu),代表網(wǎng)絡(luò)是GoogleNet[6]、Inceptionv2[7]、Inceptionv3[8]和 Inceptionv4[9];(c)更快:適用于移動設(shè)備的輕量級網(wǎng)絡(luò)模型,代表網(wǎng)絡(luò)是 SqueezeNet[10]、MobileNet[11]、ShuffleNet[12]、MobileNetv2[13]、ShuffleNetv2[14]和 MobileNetv3[15].
在醫(yī)學(xué)領(lǐng)域,為了更高效、更方便地診斷患者的病情,圖像分類已經(jīng)得到了廣泛關(guān)注. Li等提出了一種基于注意的卷積神經(jīng)網(wǎng)絡(luò)(AG?CNN)用于青光眼檢測[16]. Yang等提出了一種用于乳腺癌組織病理學(xué)圖像分類的注意力引導(dǎo)卷積神經(jīng)網(wǎng)絡(luò)[17].Xu等提出了一種用于檢測肺結(jié)節(jié)性惡性腫瘤的卷積神經(jīng)網(wǎng)絡(luò)(MSCS?DeepLN)[18]. Mobiny等提出了一種有效的膠囊網(wǎng)絡(luò)變體(Caps net)作為CNN的替代[19]. Zhou等基于先驗(yàn)知識,提取相應(yīng)的特征對白內(nèi)障進(jìn)行分類[20]. Wang等提供一種創(chuàng)新的3D卷積網(wǎng)絡(luò),用于自動乳腺超聲檢……