999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度多分支模型融合網(wǎng)絡(luò)的胡蘿卜缺陷識別與分割

2021-04-02 09:10:02謝為俊鄭招輝楊光照楊德勇
農(nóng)業(yè)工程學(xué)報 2021年2期
關(guān)鍵詞:特征模型

謝為俊,魏 碩,鄭招輝,楊光照,丁 鑫,楊德勇

(中國農(nóng)業(yè)大學(xué)工學(xué)院,北京100083)

0 引言

胡蘿卜(Daucus carotaL.)是世界上主要的塊根塊莖類蔬菜,富含胡蘿卜素、多酚及多種微量元素。中國胡蘿卜產(chǎn)量最大且出口最多,2018年產(chǎn)量達(dá)2000萬t,接近世界總產(chǎn)量的一半[1]。及時剔除缺陷胡蘿卜有助于提高胡蘿卜的市場競爭力,因此對胡蘿卜的外觀品質(zhì)評價十分必要。傳統(tǒng)的胡蘿卜缺陷識別分揀具有勞動力消耗大、成本高、主觀性強(qiáng)等缺點,而機(jī)器視覺識別技術(shù)具有快速無損、客觀標(biāo)準(zhǔn)等優(yōu)點,越來越多地應(yīng)用于農(nóng)業(yè)生產(chǎn)中,提高了農(nóng)業(yè)生產(chǎn)現(xiàn)代化水平與生產(chǎn)效率[2]。

20世紀(jì)末,有學(xué)者開始利用機(jī)器視覺技術(shù)對胡蘿卜外觀進(jìn)行評價。但限于當(dāng)時的技術(shù)條件,機(jī)器視覺僅能識別胡蘿卜的肩部與根部位置[3]、表面顏色缺陷[4]、部分形狀缺陷[5]、根尖形狀特征[6]等,且識別準(zhǔn)確率低,魯棒性差。隨著機(jī)器視覺技術(shù)的飛速發(fā)展,研究人員開始利用先進(jìn)的軟硬件條件對胡蘿卜分級進(jìn)行深入研究。Hahn和Sanchez[7]開發(fā)了一種簡單的算法,僅使用相距90o的兩幅圖像,就可以在不旋轉(zhuǎn)相機(jī)的情況下準(zhǔn)確預(yù)測胡蘿卜的體積。許多學(xué)者設(shè)計了特定的圖像處理算法對胡蘿卜不同外觀缺陷進(jìn)行檢測。韓仲志等[8]和Deng等[9]針對胡蘿卜青頭、須根、開裂、彎曲等不同缺陷分別設(shè)計了圖像處理算法,平均檢測準(zhǔn)確率90%以上;Xie等[10]和謝為俊等[11]根據(jù)胡蘿卜青頭、彎曲、斷裂、分叉和開裂等不同缺陷特點設(shè)計不同的圖像處理算法,總體識別率達(dá)90%以上。上述圖像處理算法可實現(xiàn)胡蘿卜缺陷的檢測,但存在準(zhǔn)確率較低、算法復(fù)雜、魯棒性差等缺點。

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)在圖像分類領(lǐng)域獲得巨大成功,在農(nóng)業(yè)生產(chǎn)領(lǐng)域也得到了大量應(yīng)用[12],越來越多學(xué)者將其引入胡蘿卜分級領(lǐng)域。Xie等[13]提取正常胡蘿卜的12個特征作為反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network, BPNN)、SVM、極限學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)的輸入,將正常胡蘿卜分為4個等級,分級準(zhǔn)確率達(dá)96.67%,但該方法未涉及缺陷胡蘿卜的分級研究。Zhu等[14]和倪建功等[15]利用深度學(xué)習(xí)對胡蘿卜的黑斑、須根、彎曲缺陷進(jìn)行檢測,平均識別準(zhǔn)確率達(dá)95%以上,但對胡蘿卜外觀影響更大的機(jī)械損傷、斷裂、分叉、畸形和開裂等缺陷識別研究還未涉及。

缺陷胡蘿卜通常用作動物飼料或直接丟棄,降低了胡蘿卜種植效益。而分叉、開裂等缺陷胡蘿卜可作為深加工原料,制作胡蘿卜汁、胡蘿卜粉等。但開裂胡蘿卜開裂處會藏有泥土,清洗不徹底會影響胡蘿卜制品質(zhì)量,甚至導(dǎo)致食品安全問題,因此在深加工前對胡蘿卜開裂區(qū)域進(jìn)行修整十分必要。胡蘿卜開裂區(qū)域的精準(zhǔn)分割是實現(xiàn)開裂胡蘿卜自動化修整的必要條件。韓仲志等[8]、Deng等[9]和謝為俊等[11]利用胡蘿卜開裂區(qū)域與正常區(qū)域的顏色、紋理差異提取開裂區(qū)域,但提取精準(zhǔn)度較差。因此對胡蘿卜開裂區(qū)域的精準(zhǔn)提取研究十分必要。

為更加全面地評價胡蘿卜外觀品質(zhì)和開裂胡蘿卜的自動化修整,本研究提出一種集缺陷識別與分割為一體的深度多分支模型融合網(wǎng)絡(luò)(CS-Net)。該網(wǎng)絡(luò)由胡蘿卜缺陷識別分類網(wǎng)絡(luò)C-Net和開裂區(qū)域分割網(wǎng)絡(luò)S-Net組成,C-Net將ImageNet數(shù)據(jù)集上預(yù)訓(xùn)練的ResNet-50作為胡蘿卜圖像特征提取器,將提取的特征作為SVM的輸入,得到不同的分類模型,再利用模型融合思想將不同分類模型融合得到最終的分類模型;S-Net將預(yù)訓(xùn)練的ResNet-50作為編碼器,根據(jù)不同的分割網(wǎng)絡(luò)構(gòu)造思想設(shè)計解碼器,構(gòu)造胡蘿卜開裂區(qū)域分割提取網(wǎng)絡(luò)。該網(wǎng)絡(luò)為胡蘿卜外觀品質(zhì)評價和開裂缺陷修整奠定了基礎(chǔ)。

1 材料與方法

1.1 試驗材料

試驗用胡蘿卜購自綠龍食品加工有限公司(山東省濰坊市)。試驗共包括7203幅胡蘿卜圖像,包括正常胡蘿卜2109幅、斷裂1424幅、開裂998幅、畸形665幅、機(jī)械損傷1029幅和分叉978幅,胡蘿卜形態(tài)種類如圖1所示。對于分類網(wǎng)絡(luò)C-Net,每種形態(tài)胡蘿卜隨機(jī)選取80%作為訓(xùn)練集,20%作為測試集。訓(xùn)練集共包含5765幅圖像,其中斷裂、機(jī)械損傷、開裂、分叉、畸形和正常胡蘿卜圖像分別為1140、824、799、783、532和1687幅。因不同形態(tài)胡蘿卜的圖片數(shù)量不平衡,本研究在訓(xùn)練時采用分層5折交叉驗證,保證每次劃分中包含類別比例與原數(shù)據(jù)相同。測試集共包含1438幅胡蘿卜圖像,其中斷裂、機(jī)械損傷、開裂、分叉、畸形和正常胡蘿卜圖像分別為284、205、199、195、133和422幅。對于分割網(wǎng)絡(luò)S-Net,隨機(jī)選取543幅開裂胡蘿卜圖像,按照6∶2∶2劃分訓(xùn)練集、驗證集和測試集。

1.2 圖像獲取及預(yù)處理

胡蘿卜圖像由彩色CCD相機(jī)(DFK-33UX265)采用8 mm鏡頭(The Imaging Source,Germany)獲得。胡蘿卜圖像采集系統(tǒng)[11]如圖2所示,該系統(tǒng)在光照箱中配置了兩塊互成120o的平面鏡,胡蘿卜放在兩塊鏡子中間,上方的相機(jī)可同時捕捉到3幅胡蘿卜圖像,以盡可能多地獲得胡蘿卜表面圖像,圖像尺寸為1920×1080像素。圖像處理算法和卷積神經(jīng)網(wǎng)絡(luò)(CNN)搭建基于Python 3.7、計算機(jī)視覺庫OpenCv4.0.0和深度學(xué)習(xí)庫Keras 2.3.1、Tensorflow 2.0.0。電腦配置為Intel corn Xeon 3.70 GHz CPU,128 GB運行內(nèi)存,NVIDIA Quadro P2000(5 G)GPU,Windows 10.1操作系統(tǒng)。

圖像預(yù)處理中,利用灰度直方圖雙峰法提取胡蘿卜區(qū)域圖像并刪除背景[11]。為使胡蘿卜圖像不變形,將圖像用0填充為尺寸1024×1024×3的圖像,再利用線性插值算法將圖像統(tǒng)一調(diào)整為適合CNN輸入的尺寸(224×224×3)。為去除圖像邊緣高頻噪聲,提出一種基于圓形區(qū)域的均值濾波器,如圖2a所示。

對于給定中心點(xd,yd),其鄰域像素位置(xp,yp)由式(1)計算得到。

式中R為圓形濾波器半徑,P為采樣點總數(shù),p為采樣點序號。通過此操作得到的采樣點坐標(biāo)可能均不是整數(shù),因此通過插值獲得其位置的像素值,本研究采用雙線性插值法,數(shù)學(xué)表達(dá)式如式(2)

式中f(xp,yp)為點(xp,yp)的像素值,f(ip,jp) (ip,jp=0,1)為點(xp,yp)相鄰四點像素值。則中心點(xd,yd)像素值由式(3)計算

圖像三維空間顯示是將圖像灰度值作為圖像Z軸進(jìn)行三維顯示。

由圖3b、3c使用圓形濾波器濾波前后胡蘿卜圖像的三維空間顯示圖可知,圓形濾波器對圖像的高頻噪聲有很好的抑制效果。圖像經(jīng)預(yù)處理后,既去除了背景又將胡蘿卜圖像變?yōu)檫m合CNN輸入的正方形圖像,同時保證了胡蘿卜無變形,保留了原始圖像的拓?fù)浣Y(jié)構(gòu),避免識別結(jié)果受胡蘿卜變形的影響。

2 深度多分支模型融合網(wǎng)絡(luò)

2.1 網(wǎng)絡(luò)總體結(jié)構(gòu)

本研究提出了一種集胡蘿卜缺陷識別分類與開裂缺陷區(qū)域分割提取為一體的深度多分支模型融合網(wǎng)絡(luò)(CS-Net),該網(wǎng)絡(luò)由胡蘿卜缺陷識別網(wǎng)絡(luò)(C-Net)和胡蘿卜開裂區(qū)域分割提取網(wǎng)絡(luò)(S-Net)組成,總體結(jié)構(gòu)如圖4所示。ResNet-50包含的殘差模塊能夠解決深度網(wǎng)絡(luò)訓(xùn)練退化問題[16],大量研究表明殘差網(wǎng)絡(luò)是十分優(yōu)秀的圖像特征提取器[17-18],因此本網(wǎng)絡(luò)以預(yù)訓(xùn)練的ResNet-50為基礎(chǔ),C-Net將ResNet-50作為圖像特征提取器,輸出不同層的卷積特征,將其作為SVM[19]的輸入,訓(xùn)練得到不同的分類模型,再通過不同的模型融合策略(硬投票(Hard voting)、軟投票(Soft voting)和Stacking法)將各個分類器融合為最終的胡蘿卜缺陷識別網(wǎng)絡(luò)。S-Net將ResNet-50作為分割網(wǎng)絡(luò)的編碼器,使用三種經(jīng)典分割網(wǎng)絡(luò)(U-net[20]、FCN[21]和SegNet[22-23])的構(gòu)造思想設(shè)計分割網(wǎng)絡(luò)的解碼器,構(gòu)造胡蘿卜開裂區(qū)域分割提取網(wǎng)絡(luò)。

2.2 缺陷識別網(wǎng)絡(luò)(C-Net)

2.2.1 池化方法

池化層是CNN中重要組成部分,它能夠?qū)崿F(xiàn)圖像特征下采樣、去除圖像冗余信息、簡化網(wǎng)絡(luò)復(fù)雜度從而減少模型的參數(shù)量。常見池化方法包括一般池化、重疊池化和空間金字塔池化(Spatial Pyramid Pooling,SPP)。在C-Net中采用的池化方法包括平均池化(Average Pooling,AVP)、全局平均池化(Global Average Pooling,GAP)和SPP。AVP如圖5a所示,通過計算池化區(qū)域的平均值作為該區(qū)域池化后的值;GAP是平均池化的一種特殊形式,此時池化窗口尺寸與特征圖尺寸相同;SPP將一個池化操作分成若干個不同尺寸的池化操作,用不同大小的池化核作用于上層的卷積特征,如圖 5b所示。SPP能使任意大小的特征圖轉(zhuǎn)換成固定大小的特征向量,實現(xiàn)特征圖的多尺度提取。圖像卷積特征通過池化操作再經(jīng)過全連接層后輸出4096維數(shù)據(jù),作為SVM的輸入。

2.2.2 數(shù)據(jù)降維方法

通過CNN提取的特征維度較高,維度越高的數(shù)據(jù)在每個特征維度上的分布就越稀疏,這不利于機(jī)器學(xué)習(xí)模型的訓(xùn)練,因此對高維數(shù)據(jù)進(jìn)行降維十分必要。本研究采用主成分分析(Principal Component Analysis,PCA)和Relief降維方法[24]。PCA通過某種線性映射將高維向量轉(zhuǎn)為低維空間表示,并使得在所投影的低維空間上數(shù)據(jù)方差盡可能大。PCA具有使用較少的數(shù)據(jù)維度,保留盡可能多的原數(shù)據(jù)信息。ReliefF是一種基于特征權(quán)重的特征選擇算法,其設(shè)計了一個“相關(guān)統(tǒng)計量”來度量特征的重要性,該統(tǒng)計量為向量,它的每個分量是對其中一個初始特征的評價值。特征子集的重要性就是子集中每個特征所對應(yīng)的相關(guān)統(tǒng)計量之和,因此這個“相關(guān)統(tǒng)計分量”也可以視為是每個特征的“權(quán)值”。指定閾值,選擇大于閾值的相關(guān)統(tǒng)計量分量所對應(yīng)的特征。

本研究中,PCA降維后數(shù)據(jù)維數(shù)分別為256、500、1000、2000;ReliefF方法中K近鄰參數(shù)k的取值為150,閾值選擇為0.05。

2.2.3 SVM訓(xùn)練

將ResNet-50輸出的特征向量作為SVM的輸入,使用非線性映射算法,通過核函數(shù)在高維空間中找到最優(yōu)超平面H,使樣本變得線性可分,實現(xiàn)胡蘿卜不同缺陷種類的正確識別。超平面H可用ωTx+b表示,樣本空間中任一點x到超平面的距離γ可由式(4)計算

式中ω是超平面H的法向量,b為超平面H的截距。

本研究中,選擇徑向基函數(shù)(Radial Basis Function, RBF)作為SVM的核函數(shù),懲罰系數(shù)為0.5,停止訓(xùn)練時的誤差值為10-3,多分類方式采用一對一形式(ovo)。

2.2.4 模型融合策略

模型集成學(xué)習(xí)策略已經(jīng)在農(nóng)業(yè)領(lǐng)域得到廣泛的應(yīng)用[25-26]。傳統(tǒng)CNN使用單一的分類模型[27],但不能適應(yīng)胡蘿卜的所有特征。集成學(xué)習(xí)思想則是利用訓(xùn)練數(shù)據(jù)首先得到一組基模型,再利用模型融合策略將他們組合起來。集成學(xué)習(xí)綜合各個基模型的優(yōu)點,往往可獲得比單一模型更顯著的性能[26]。本研究由ResNet-50的第1、10、22、40、49層輸出特征作為輸入訓(xùn)練得到5個支持向量機(jī)(SVM)模型作為基模型。在此基礎(chǔ)上,利用硬投票、軟投票和Stacking集成方法,得到最終胡蘿卜缺陷分類模型。本研究所采用的三種模型融合策略執(zhí)行步驟如下:

1)硬投票,又叫相對多數(shù)投票法。首先獲得5個基模型在測試集上的預(yù)測類別Ci(i=0, 1, 2, 3, 4),然后統(tǒng)計5個基模型輸出結(jié)果中每個類別的票數(shù),最終輸出結(jié)果為得票最多的類別。當(dāng)票數(shù)相同時,則隨機(jī)選擇一個類別作為最終輸出結(jié)果。

2)軟投票,又叫加權(quán)平均法。首先獲得5個基模型在測試集上的每個類別的預(yù)測概率pri(i= 0,1,2,3,4),再利用式(5)計算出每個類別融合后的預(yù)測概率。

式中N為分類器個數(shù),ki根據(jù)各分類器在測試集上的準(zhǔn)確率排序確定,準(zhǔn)確率最高的ki=5,最低的ki=1。

3)Stacking集成方法由兩級分類器構(gòu)成,其中低級別的模型稱為基模型,高級別的稱為元模型。本研究中低級別模型所用分類器為SVM,高級別模型所用分類器為梯度提升決策樹(Gradient Boosting Decision Tree, GBDT)[25]。本研究中GBDT算法的學(xué)習(xí)率為0.01,最大迭代次數(shù)為150,樹的深度為10。具體訓(xùn)練步驟如下(圖6):①將胡蘿卜圖片數(shù)據(jù)集根據(jù)4∶1劃分為訓(xùn)練集與測試集,數(shù)據(jù)集在經(jīng)過ResNe-50網(wǎng)絡(luò)特征提取,分別輸出第1、10、22、40和49層的訓(xùn)練集(it=1, 10, 22, 40, 49)和測試集數(shù)據(jù)(it=1, 10, 22, 40, 49)。②將第1層輸出的訓(xùn)練集數(shù)據(jù)利用5折交叉驗證的方法隨機(jī)均等劃分為5個子集D1、D2、D3、D4、D5,依次選取其中一個子集Div(iv=1, 2, …, 5)作為驗證集,其他4個作為訓(xùn)練子集③將D-iv作為SVM的訓(xùn)練集,Div作為驗證集并輸出驗證集的預(yù)測結(jié)果aiv,同時對原始測試集進(jìn)行預(yù)測,輸出預(yù)測結(jié)果biv。④對(3)循環(huán)5次得到{a1,a2,a3,a4,a5},將這5次結(jié)果按列合并得到和標(biāo)簽Y相同長度的向量A1,對測試集預(yù)測值{b1,b2,b3,b4,b5}取平均值得到和標(biāo)簽Y相同長度的向量B1。⑤對另外四個數(shù)據(jù)集(第10、22、40、49層輸出特征)執(zhí)行上面步驟得到由原始訓(xùn)練集(it=10, 22, 40, 49)產(chǎn)生的A10,A22,A40,A49和原始測試集(it=10, 22, 40, 49)產(chǎn)生的B10,B22,B40,B49。⑥將A1,A10,A22,A40,A49和原始訓(xùn)練集DitTrain的標(biāo)簽Y合并得到新樣本數(shù)據(jù){(A1,A10,A22,A40,A49),Y}作為二級分類器GBDT的輸入特征,{(B1,B10,B22,B40,B49)}作為GBDT測試集生成最終結(jié)果。

2.3 分割網(wǎng)絡(luò)(S-Net)

為了對胡蘿卜開裂缺陷區(qū)域進(jìn)行自動化修整,本研究將ResNet-50作為編碼器,設(shè)計分割網(wǎng)絡(luò)的解碼器實現(xiàn)對胡蘿卜開裂區(qū)域的精準(zhǔn)提取。

2.3.1 構(gòu)造方法

全卷積神經(jīng)網(wǎng)絡(luò)[21](Fully Convolutional Network,F(xiàn)CN)是最早的分割網(wǎng)絡(luò),它將CNN全連接結(jié)構(gòu)用卷積結(jié)構(gòu)代替,將原本輸出的一維向量改為二維特征圖的形式,保存了圖像的二維信息。利用反卷積操作對特征圖進(jìn)行上采樣,并將編碼器相應(yīng)尺度的特征圖復(fù)制過來與上采樣后的特征圖進(jìn)行對應(yīng)像素相加(Add),再通過卷積操作組合特征后輸入下一個反卷積層,如圖 7a所示。U-net分割網(wǎng)絡(luò)[20]為了使網(wǎng)絡(luò)在上采樣的過程中獲得更多信息,恢復(fù)圖像更多細(xì)節(jié),將編碼器對應(yīng)尺度特征圖與反卷積后相同尺寸特征圖進(jìn)行級聯(lián)(Concat),再通過卷積操作后作為下一個反卷積層的輸入,如圖7b所示。SegNet[22]為了解決網(wǎng)絡(luò)編碼器在池化操作時丟失位置信息的問題,在編碼器執(zhí)行最大池化操作時,將特征最大值的位置作為最大池化索引保存。網(wǎng)絡(luò)解碼器在上采樣的時候根據(jù)最大池化索引直接恢復(fù)圖像特征值,如圖7c所示。本研究將ResNet-50作為分割網(wǎng)絡(luò)的編碼器,分別根據(jù)FCN、U-net和Segnet網(wǎng)絡(luò)構(gòu)造思想構(gòu)造網(wǎng)絡(luò)的解碼器并將ResNet-50第1、10、22、40、49層輸出特征尺寸作為解碼器的反卷積后特征尺寸。

2.3.2 損失函數(shù)

損失函數(shù)的選擇會直接影響分割網(wǎng)絡(luò)的分割效果,交叉熵?fù)p失函數(shù)(Cross Entropy loss)[28]、骰子系數(shù)差異函數(shù)(Dice loss)[29]、焦點損失函數(shù)(Focal loss)[30]是分割網(wǎng)絡(luò)常用的損失函數(shù)。交叉熵?fù)p失函數(shù)主要是用來判定實際輸出與標(biāo)簽的差異,網(wǎng)絡(luò)即可利用這種差異經(jīng)過反向傳播去更新網(wǎng)絡(luò)參數(shù)。該損失函數(shù)在分割網(wǎng)絡(luò)中分別評估每個像素的類預(yù)測,然后對所有像素求平均,這對于類別數(shù)據(jù)不均衡時效果較差。骰子系數(shù)差異函數(shù)是一種集合相似度度量函數(shù),用于計算兩個樣本之間的相似度,適用于樣本不均的情況,但是會對反向傳播造成不利的影響,造成訓(xùn)練波動大。Lin等[30]提出焦點損失函數(shù)用于解決上述兩種激活函數(shù)存在的問題,焦點損失函數(shù)是動態(tài)縮放的交叉熵?fù)p失函數(shù),通過增加動態(tài)縮放因子,實現(xiàn)在訓(xùn)練過程中動態(tài)調(diào)整簡單樣本的權(quán)重,讓模型快速關(guān)注于困難樣本的分類,由式(6)計算得到。由于本研究中胡蘿卜開裂區(qū)域在圖像中占比較小,因此本研究選擇焦點損失函數(shù)作為分割網(wǎng)絡(luò)損失函數(shù)。

式中pr是類別預(yù)測概率,y是標(biāo)簽值,β是動態(tài)縮放因子。

2.3.3 分割網(wǎng)絡(luò)性能評價指標(biāo)

為了衡量分割網(wǎng)絡(luò)的性能,需要經(jīng)過標(biāo)準(zhǔn)、公認(rèn)的指標(biāo)進(jìn)行評估。目前常用指標(biāo)包括分割網(wǎng)絡(luò)模型尺寸、分割時間、準(zhǔn)確率[31],其中準(zhǔn)確率包括PA、MPA和MIoU。PA是最簡單的度量標(biāo)準(zhǔn),只需計算正確分類的像素數(shù)量與像素總數(shù)之間的比率;MPA是改進(jìn)的PA,按類計算正確像素的比率并取平均;MIoU是實際區(qū)域和預(yù)測區(qū)域的交集和并集之間的比率,作為分割網(wǎng)絡(luò)的標(biāo)準(zhǔn)度量。

式中k為分割目標(biāo)類別數(shù),pii表示分類正確的像素數(shù),pij表示i類被誤判斷為j類的像素數(shù),pji表示j類被誤判斷為i類的像素數(shù)。

3 結(jié)果與分析

3.1 卷積層特征、池化方法與數(shù)據(jù)降維方法對模型性能的影響

表1為ResNet-50不同層(1、10、22、40、49)輸出特征在不同池化方法和不同數(shù)據(jù)降維方法下訓(xùn)練的SVM模型的性能。準(zhǔn)確率為模型在分層5折交叉訓(xùn)練下驗證準(zhǔn)確率的平均值。

由ResNet-50不同層輸出卷積特征訓(xùn)練的模型性能各不相同。由表1可知,同樣的池化和降維方法,高層網(wǎng)絡(luò)(40、49)輸出特征訓(xùn)練的模型準(zhǔn)確率比低層(1、10、22)的高。為解釋該現(xiàn)象,將ResNet-50模型的第1、10、22、40和49層輸出特征進(jìn)行可視化,如圖8所示。由圖可知,ResNet-50網(wǎng)絡(luò)第1、10、22層輸出特征更多的是圖像的一般特征(邊緣、紋理、色彩等),而第40和49層輸出特征則是圖像高層語義特征,其將圖像特征抽象為更加容易區(qū)分的特征,因此高層網(wǎng)絡(luò)(40、49)輸出特征訓(xùn)練的模型準(zhǔn)確率要比低層(1、10、22)的高。

表1 卷積特征、池化方法與數(shù)據(jù)降維方法對模型性能的影響 Table 1 Effects of convolution feature maps, pooling method and dimensionality reduction methods on model performance

不同池化方法對模型性能影響不同。由表1可知,在低層特征下不同池化層的模型性能從大到小排序為SPP、AVP、GAP,這可能是因為SPP有3個不同尺寸的池化核對卷積特征進(jìn)行提取,因而可以在不同尺度上提取卷積特征,在某種程度上使用SPP相當(dāng)于額外增加了1層卷積層,所以在低層特征的基礎(chǔ)上可以抽象出更高層次的特征,因此采用SPP的模型性能最好,在第1層卷積特征上準(zhǔn)確率達(dá)到84.07%,比采用AVP的準(zhǔn)確率高出近10個百分點;AVP使用的池化核尺寸小于低層卷積特征尺寸,使用窗口滑動法在卷積特征上依次滑動提取特征,而GAP的池化核尺寸與低層卷積特征尺寸相同,所以在相同的低層卷積特征上AVP提取的特征要遠(yuǎn)遠(yuǎn)多于GAP,這就導(dǎo)致了使用AVP的模型性能要高于采用GAP的模型。在高層語義特征下不同池化層對模型性能影響較小,因為高層卷積特征圖尺寸較小,包含的信息數(shù)據(jù)量少,用不同的池化方法提取得到的特征差別小。在第49層卷積特征下,采用SPP的模型性能略差于采用其他兩種池化方法的,因為第49層輸出的卷積特征尺寸只有7×7,使用SPP會額外提取到冗余的信息,從而降低模型性能。此時的AVP與GAP的池化核尺寸相同,因此采用GAP與AVP的模型性能表現(xiàn)一致。

在機(jī)器學(xué)習(xí)中,對數(shù)據(jù)進(jìn)行降維處理是必要的。對數(shù)據(jù)進(jìn)行降維處理不僅能減少特征數(shù)量還會提高模型的性能。由表1可知,PCA在卷積特征上對模型性能影響比ReliefF法更明顯,可能是因為該方法能更有效地剔除經(jīng)過池化層提取后特征包含的冗余信息。從表1中也可以看出,一些模型在降維后性能下降,原因在于降維過程中不可避免地去除了一些對分類結(jié)果有積極意義的數(shù)據(jù),從而影響了模型性能。

3.2 不同分類模型的性能比較

為進(jìn)一步提升模型的分類精度,本研究采用模型融合的思想對模型進(jìn)行集成學(xué)習(xí)。根據(jù)表1,在保證融合后模型包含圖像多尺度特征,本研究最終選擇的基模型L1、L2、L3、L4、L5分別為ResNet-50第1、10、22、40、49層輸出卷積特征訓(xùn)練的SVM模型,池化方法、降維方法如表2所示。采用硬投票、軟投票、Stacking方法分別得到3個不同的元模型,各模型在測試集上的準(zhǔn)確率排序為硬投票<軟投票<Stacking方法。硬投票以簡單的少數(shù)服從多數(shù)原則,對模型的性能提升不明顯。軟投票根據(jù)各個分類器在驗證集上的準(zhǔn)確率排序給予不同的權(quán)重,使得表現(xiàn)更好的模型在最終的預(yù)測輸出中占有更大的比重,因此軟投票方法對模型提升作用大于硬投票方法。Stacking方法則是利用各模型在驗證集和測試集上的預(yù)測結(jié)果作為新的訓(xùn)練集和測試集訓(xùn)練二級分類器,它能以任意函數(shù)形式逼近真實值,因此Stacking法所獲得的模型在測試集上的精度最高,達(dá)98.40%,相比單一分類器性能提升了3個百分點以上。傳統(tǒng)的HOG+SVM和LBP+SVM模型性能僅相當(dāng)于第1層卷積層提取特征模型L1的性能,說明CNN自動提取特征優(yōu)于人工手動提取特征。

表2 模型性能比較 Table 2 Performances comparison of different models

計算由Stacking方法獲得的模型在測試集上的混淆矩陣,由圖9可知,模型共正確識別出斷裂、機(jī)械損傷、開裂、分叉、畸形和正常胡蘿卜分別為278、203、195、194、127和418幅,識別率分別為97.89%、99.02%、97.99%、99.49%、95.49%和99.05%,總體識別率為98.40%,表明融合后的模型可以正確區(qū)分各缺陷的類間差異與類內(nèi)差異,但誤識別情況依然存在,因為所有的圖片并不都是完美的,存在一些不可避免的瑕疵。

3.3 不同方法構(gòu)造的分割網(wǎng)絡(luò)性能比較

本研究以ResNet-50為編碼器,分別以FCN、U-net、Segnet思想構(gòu)造出3種不同的解碼器,得到3種分割模型Res-FCN、Res-U-net、Res-Segnet。由表3可知,Res-U-net綜合表現(xiàn)最好,在測試集上的PA、MPA、MIoU分別為98.31%、96.05%、92.81%,且模型最小,為0.24G,單幅圖像分割時間為0.72 s。Res-FCN的表現(xiàn)略低于Res-U-net,但其模型大小達(dá)到1.5 G,不適合配置較低的設(shè)備使用。Res-Segnet的表現(xiàn)最差,MIoU僅為88.68%,但其模型尺寸相比Res-FCN減少了78%,原因在于Res-Segnet復(fù)制了編碼器的最大池化索引,而Res-FCN則是復(fù)制了編碼器特征,因此在內(nèi)存占用上Res-Segnet比Res-FCN更高效。為更好地說明本研究設(shè)計的網(wǎng)絡(luò)模型的先進(jìn)性,將其與目前先進(jìn)的分割模型DeeplabV3+[32]進(jìn)行比較,Res-U-Net的PA、MIoU與DeeplabV3+的相當(dāng),而MPA優(yōu)于DeeplabV3+,模型大小僅為DeeplabV3+的一半,單幅圖像分割速度快于DeeplabV3+,說明本研究設(shè)計的網(wǎng)絡(luò)結(jié)構(gòu)可以快速分割出胡蘿卜開裂區(qū)域。

表3 不同分割網(wǎng)絡(luò)的性能 Table 3 Performance of different segmentation models

3.4 Res-U-net訓(xùn)練過程

Res-U-net模型訓(xùn)練時損失函數(shù)為焦點損失函數(shù),α,β分別為0.25和2,優(yōu)化器選擇為Adadelta,不預(yù)設(shè)學(xué)習(xí)率。Res-U-net模型在訓(xùn)練集和驗證集上的準(zhǔn)確率、損失如圖 10所示。由圖可知,Res-U-net模型在前50輪訓(xùn)練的時候,準(zhǔn)確率快速上升、損失值迅速下降,250輪訓(xùn)練以后模型準(zhǔn)確率和損失趨于穩(wěn)定,經(jīng)過300輪訓(xùn)練后,在驗證集上的準(zhǔn)確率和損失分別為98.40%和0.072,說明設(shè)計的網(wǎng)絡(luò)結(jié)構(gòu)、選擇的損失函數(shù)和優(yōu)化算法可以使模型快速收斂,達(dá)到較高的準(zhǔn)確率和較低的損失。

3.5 模型分割結(jié)果可視化比較

為更直觀比較Res-U-net、Res-FCN、Res-Segnet模型的分割效果,在測試集中隨機(jī)選取4幅面積、位置不同的開裂區(qū)域圖像,將不同模型的分割效果可視化,如圖 11所示。由圖可知,Res-U-net的分割效果最接近于原始標(biāo)記結(jié)果,Res-FCN分割區(qū)域邊緣存在明顯的鋸齒狀,Res-Segnet分割區(qū)域比原始標(biāo)記區(qū)域小,且存在空洞現(xiàn)象。原因在于Res-FCN通過上采樣卷積層生成比較粗糙的分割圖,而Res-U-net和Res-Segnet在網(wǎng)絡(luò)中引入跳躍連接生成邊緣平滑的分割圖。由Ⅰ、Ⅲ可知,Res-U-net分割效果均接近于原始標(biāo)記圖,表明Res-U-net分割效果不受開裂區(qū)域面積大小的影響。由Ⅲ、Ⅳ可知,Res-U-net對胡蘿卜不同位置的開裂缺陷均有較好的分割效果。由Ⅱ可知,Res-FCN、Res-Segnet、Res-U-net均未將胡蘿卜的周向凹陷分割為開裂,說明這些模型均很好地學(xué)習(xí)到了胡蘿卜開裂區(qū)域特征。綜上,Res-U-net模型分割精度高、魯棒性強(qiáng),可作為胡蘿卜開裂區(qū)域自動分割模型。

4 結(jié)論

1)本文提出了一種集胡蘿卜表面缺陷識別與開裂區(qū)域分割為一體的深度多分支模型融合網(wǎng)絡(luò),在自制的胡蘿卜表面缺陷數(shù)據(jù)集上,實現(xiàn)了胡蘿卜不同表面缺陷識別和開裂區(qū)域分割提取。

2)以預(yù)訓(xùn)練的ResNet-50為胡蘿卜圖像特征提取器,分別輸出ResNet-50的第1、10、22、40、49層特征作為支持向量機(jī)(SVM)的輸入,得到5個不同的分類模型。隨著網(wǎng)絡(luò)層數(shù)的增加,模型準(zhǔn)確率不斷提高,第49層輸出特征訓(xùn)練的模型準(zhǔn)確率最高,測試準(zhǔn)確率為94.71%。

3)為提高胡蘿卜缺陷識別分類模型的準(zhǔn)確率,采用硬投票、軟投票和Stacking方法對5個分類模型進(jìn)行融合得到的3個融合模型,其準(zhǔn)確率從小到大排序為硬投票、軟投票、Stacking方法,Stacking融合方法得到的模型準(zhǔn)確率最高為98.40%。

4)以預(yù)訓(xùn)練的ResNet-50為編碼器,根據(jù)FCN、U-net、Segnet網(wǎng)絡(luò)的思想構(gòu)建了多個胡蘿卜開裂區(qū)域分割模型。結(jié)果表明Res-U-net分割模型綜合性能最好,其像素準(zhǔn)確率、類別平均像素準(zhǔn)確率、平均交互比為98.31%、96.05%、92.81%,模型尺寸為0.24 G,單幅圖像分割時間為0.72 s。

本文提出的深度多分支模型融合網(wǎng)絡(luò)能夠準(zhǔn)確識別出胡蘿卜表面缺陷類型,并精確地分割提取出胡蘿卜開裂區(qū)域,為后續(xù)更加全面地評價胡蘿卜表面質(zhì)量和開裂胡蘿卜的修整奠定了基礎(chǔ)。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學(xué)特征認(rèn)識
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
如何表達(dá)“特征”
不忠誠的四個特征
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 亚洲区视频在线观看| 第一页亚洲| 999精品视频在线| 亚洲二三区| 国产高清在线观看| 亚洲欧美人成电影在线观看| 一本大道AV人久久综合| 亚洲水蜜桃久久综合网站| 热思思久久免费视频| 亚洲精品成人福利在线电影| 亚洲最大福利网站| 精品国产福利在线| 国产欧美精品一区二区| 18禁不卡免费网站| 国产激情第一页| 无码中文AⅤ在线观看| 青青青伊人色综合久久| 亚洲欧洲自拍拍偷午夜色无码| 毛片大全免费观看| 97se亚洲| 玩两个丰满老熟女久久网| 欧美国产在线看| 国产美女一级毛片| 国产99久久亚洲综合精品西瓜tv| 夜夜高潮夜夜爽国产伦精品| 国产视频a| 97在线国产视频| 情侣午夜国产在线一区无码| 色国产视频| 中美日韩在线网免费毛片视频| 亚洲色欲色欲www网| 色窝窝免费一区二区三区| 亚洲天堂视频在线播放| 久久综合色88| 日韩毛片免费| 亚洲无线观看| 日韩精品无码一级毛片免费| 国产乱子精品一区二区在线观看| 蜜臀AV在线播放| 国产成人av大片在线播放| 国产91无毒不卡在线观看| 国产乱人伦精品一区二区| 亚洲欧美另类专区| 国产丝袜91| 国产精女同一区二区三区久| 成年片色大黄全免费网站久久| 亚洲天堂久久新| 2021天堂在线亚洲精品专区| 香蕉视频国产精品人| 国产视频一二三区| 欧美国产日韩在线| 亚洲激情99| 欧美高清日韩| 国产青青操| 国产情侣一区二区三区| 国产亚洲高清在线精品99| 精品无码视频在线观看| 原味小视频在线www国产| 人妻免费无码不卡视频| 国产午夜看片| 成人小视频在线观看免费| 99视频免费观看| 99尹人香蕉国产免费天天拍| 农村乱人伦一区二区| 国产毛片一区| 4虎影视国产在线观看精品| 日本亚洲成高清一区二区三区| 在线va视频| 国产人免费人成免费视频| 欧洲熟妇精品视频| 婷婷丁香色| 99在线观看视频免费| 亚洲视频免费在线看| 亚洲一区二区视频在线观看| 无码专区国产精品第一页| 精品一区二区三区水蜜桃| 99青青青精品视频在线| 国产欧美日韩资源在线观看| 久久国产乱子| 国产污视频在线观看| 国产美女丝袜高潮| www.99精品视频在线播放|