陳善雄,伍 勝※,于顯平,易澤林,雷興華
(1. 西南大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院,重慶 400715;2. 西南大學(xué)農(nóng)學(xué)與生物科技學(xué)院,重慶 400715;3. 重慶市農(nóng)業(yè)學(xué)校,重慶 401329)
蕎麥?zhǔn)且环N重要雜糧,其營(yíng)養(yǎng)成分豐富,含有蛋白質(zhì)、纖維素、糖類(lèi)和抗氧化物質(zhì)蘆丁等對(duì)人體健康非常有益的成分,且種植適應(yīng)性強(qiáng),耐寒冷,耐貧瘠,是具有開(kāi)發(fā)潛力的優(yōu)質(zhì)作物資源。蕎麥在中國(guó)主要分布在西北、東北、華北以及西南一帶高寒山區(qū),在中西部地區(qū)居多,是這些地區(qū)的主要糧食兼經(jīng)濟(jì)作物[1]。全球其他地方主要分布在加拿大、印度、日本等國(guó)家[2]。然而,病害導(dǎo)致蕎麥的產(chǎn)量與品質(zhì)受到極大影響,使其營(yíng)養(yǎng)價(jià)值、飼用品質(zhì)等降低。蕎麥病害問(wèn)題是全世界共同面臨的農(nóng)業(yè)自然災(zāi)害之一,蕎麥病害種類(lèi)繁多、影響較大且時(shí)常爆發(fā)成災(zāi)[3]。準(zhǔn)確及時(shí)對(duì)蕎麥病害情況作出辨別,是預(yù)防和控制的重要手段[4]。現(xiàn)有的蕎麥病害識(shí)別手段主要是通過(guò)人工進(jìn)行甄別,對(duì)專(zhuān)業(yè)知識(shí)要求高,效率較低,對(duì)病害特征的判別不確定,往往錯(cuò)過(guò)最佳的控制時(shí)期。得益于人工智能與農(nóng)業(yè)領(lǐng)域的結(jié)合,機(jī)器學(xué)習(xí)、模式識(shí)別的分類(lèi)、檢測(cè)、識(shí)別的最新方法和技術(shù),在病害影像數(shù)據(jù)上的應(yīng)用,有利于提升識(shí)別效率、降低成本、提高識(shí)別精度,減輕專(zhuān)家的工作強(qiáng)度[5-7]。近年來(lái),計(jì)算機(jī)技術(shù)在農(nóng)業(yè)圖像處理方面的研究也受眾多學(xué)者的關(guān)注,研究者利用支持向量機(jī)[8]、k-均值聚類(lèi)[9]、徑向基函數(shù)[10]、遺傳算法[11]、貝葉斯分類(lèi)[12],集成學(xué)習(xí)[13],濾波分割[14]等方法開(kāi)展了農(nóng)業(yè)作物病蟲(chóng)害分類(lèi)研究,取得較多的成果。然而,傳統(tǒng)的圖像處理方法在農(nóng)業(yè)圖像應(yīng)用中存在需要人為設(shè)定特征模式,特征抽取不穩(wěn)定,受環(huán)境影響較大等問(wèn)題。隨著深度學(xué)習(xí)興起,特別是卷積神經(jīng)網(wǎng)絡(luò),遞歸神經(jīng)網(wǎng)絡(luò)等深層結(jié)構(gòu)學(xué)習(xí)不斷完善,在圖像識(shí)別上的適應(yīng)性和魯棒性有較大提升,在農(nóng)業(yè)領(lǐng)域引入深度學(xué)習(xí)開(kāi)展病蟲(chóng)害的自動(dòng)識(shí)別也成為眾多研究者關(guān)注的熱點(diǎn)。
對(duì)作物病害圖像的自動(dòng)分類(lèi)是精準(zhǔn)農(nóng)業(yè)實(shí)施定向病害防控藥物選擇,藥物噴灑的關(guān)鍵技術(shù)。而作物病害圖像的識(shí)別,其核心在于病害特征的提取。利用深度學(xué)習(xí)獲取作物病害的多尺度特征,可以更精確地實(shí)現(xiàn)不同病害的特征表達(dá),有利于作物病害的精確識(shí)別。Fan等[15]提出了一種基于深度學(xué)習(xí)的局部模糊圖像去模糊方法,通過(guò)訓(xùn)練不同結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)模型,利用基于譜圖理論的歸一化分割算法對(duì)病蟲(chóng)害圖像進(jìn)行分割,具有較好的魯棒性、泛化性和較高的精度。Qiang等[16]采用了一種具有雙重注意力和拓?fù)淙诤蠙C(jī)制的生成對(duì)抗網(wǎng)絡(luò)(DATFGAN)將不清晰的圖像轉(zhuǎn)換成清晰、高分辨率的圖像。對(duì)處理后的圖像進(jìn)行識(shí)別,結(jié)果表明該方法明顯優(yōu)于其他方法,具有足夠的魯棒性。
在深度學(xué)習(xí)領(lǐng)域,針對(duì)圖像特征提取發(fā)展出了許多學(xué)習(xí)框架,并在農(nóng)業(yè)病蟲(chóng)害檢測(cè)中得到了應(yīng)用。Rahman等[17]提出了一種基于深度學(xué)習(xí)的水稻病蟲(chóng)害檢測(cè)方法,采用了VGG16和InceptionV3的結(jié)構(gòu),并對(duì)其進(jìn)行了微調(diào)。Chen等[18]利用遷移學(xué)習(xí)機(jī)制,在ImageNet數(shù)據(jù)庫(kù)和Inception模塊上進(jìn)行預(yù)訓(xùn)練得到DenseNet網(wǎng)絡(luò),并用于水稻病蟲(chóng)害的識(shí)別。Li等[19]提出了一種基于深度學(xué)習(xí)的視頻檢測(cè)體系結(jié)構(gòu),用于檢測(cè)視頻中的植物病蟲(chóng)害。與VGG16、ResNet-50、ResNet-101和YOLOv3相比,該網(wǎng)絡(luò)結(jié)構(gòu)系統(tǒng)更適合檢測(cè)未經(jīng)訓(xùn)練的水稻視頻。在文獻(xiàn)[20]中,CNN被用于玉米葉片疾病圖像的識(shí)別,能效識(shí)別出玉米葉枯病、普通銹病(高粱銹病)和灰斑病(褐斑病)三種非洲南部地區(qū)玉米主要病變。Krishnaswamy等[21]用VGG16作為第8卷積層的特征提取器,利用多分類(lèi)支持向量機(jī)(MSVM)對(duì)茄子疾病進(jìn)行分類(lèi)取得了較好效果。Valeria等[22]在對(duì)比分析最先進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)AlexNet、GoogleNet、Inception V3、ResNet18和ResNet 50的基礎(chǔ)上進(jìn)行微調(diào),使用改進(jìn)的GoogleNet模型識(shí)別西紅柿病蟲(chóng)害。進(jìn)一步,F(xiàn)uentes[23]等還結(jié)合視覺(jué)對(duì)象識(shí)別和語(yǔ)言生成模型,產(chǎn)生關(guān)于植物異常癥狀及場(chǎng)景交互的詳細(xì)信息。在番茄病蟲(chóng)害識(shí)別任務(wù)中,該方法在番茄植株異常描述數(shù)據(jù)集中達(dá)到了92.5%的精度[23]。Xiao等[24]將病蟲(chóng)害預(yù)測(cè)歸結(jié)為時(shí)間序列預(yù)測(cè)問(wèn)題,提出了一種基于LSTM的病蟲(chóng)害預(yù)測(cè)方法。Verma等[25]利用膠囊網(wǎng)絡(luò)實(shí)現(xiàn)了對(duì)馬鈴薯疾病的分類(lèi),取得了較好的效果。
當(dāng)前利用深度學(xué)習(xí)方法對(duì)作物病害的識(shí)別大都在標(biāo)準(zhǔn)作物樣本庫(kù)下開(kāi)展研究。標(biāo)準(zhǔn)樣本庫(kù)通過(guò)專(zhuān)家的篩選往往呈現(xiàn)明顯的病害特征,沒(méi)有考慮野外采集到病害圖像的復(fù)雜性,如葉片重疊,光照不均,陰影覆蓋等,這些因素使得識(shí)別效果受到較大影響。本研究采用最大穩(wěn)定極值區(qū)域(Maximally Stable Extremal Regions,MSER)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)結(jié)合的方法對(duì)蕎麥發(fā)病區(qū)域進(jìn)行檢測(cè);然后在傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)框架上,加入了兩級(jí)inception結(jié)構(gòu)和余弦卷積,對(duì)光照不均,低質(zhì)量蕎麥圖像準(zhǔn)確地進(jìn)行特征抽取,提高病害分類(lèi)的準(zhǔn)確性。
本研究對(duì)蕎麥病害的判別包含病害區(qū)域檢測(cè)和識(shí)別2個(gè)過(guò)程,如圖1所示。
在MSER方法對(duì)病害區(qū)域檢測(cè)基礎(chǔ)上,加入改進(jìn)的Alexnet網(wǎng)絡(luò)解決病害區(qū)和非病害區(qū)的重合問(wèn)題[26],以及對(duì)背景模糊區(qū)域,葉片邊緣區(qū)域誤檢測(cè)為病害區(qū)域問(wèn)題。然后采用inception結(jié)構(gòu)和余弦相似度卷積完成對(duì)具體病害的判別。
本研究要求識(shí)別出蕎麥病蟲(chóng)害類(lèi)別,需要準(zhǔn)確地從圖像中檢測(cè)出蕎麥病發(fā)的區(qū)域[27],從而對(duì)病害區(qū)域進(jìn)行特征提取。基于區(qū)域特征的抽取,能對(duì)不同類(lèi)型的病害進(jìn)行有效判別,確保分類(lèi)精度。蕎麥病害區(qū)域檢測(cè)就是從圖像中分離出病害區(qū)域與非病害區(qū)域,然后把病害區(qū)域送入網(wǎng)絡(luò)就可完成訓(xùn)練和識(shí)別。針對(duì)蕎麥病蟲(chóng)害區(qū)域的檢測(cè),本研究提出一種MSER[28]和CNN結(jié)合的方法對(duì)蕎麥發(fā)病區(qū)域進(jìn)行檢測(cè)。
采用基于MSER的方法對(duì)病害區(qū)域進(jìn)行檢測(cè),MSER算法的具體實(shí)現(xiàn)過(guò)程如下:
1)對(duì)蕎麥病害圖像進(jìn)行灰度化處理,在灰度區(qū)間[0,255]內(nèi)的256個(gè)不同閾值對(duì)灰度圖像進(jìn)行二值化;令Qt表示二值化閾值t對(duì)應(yīng)的二值圖像中的某一連通區(qū)域,當(dāng)二值化閾值由t變成t+Δ和t-Δ時(shí),Δ為變化量,連通區(qū)域Qt相應(yīng)變成了Qt+Δ和Qt-Δ。
2)計(jì)算閾值為t時(shí)的面積比當(dāng)Qt的面積隨二值化閾值t的變化而發(fā)生較小變化,即qt為局部極小值時(shí),Qt為最大穩(wěn)定極值區(qū)域。其中|Qt|表示連通區(qū)域Qt的面積表示Qt+Δ減去Qt-Δ后的剩余區(qū)域面積。
在進(jìn)行MSER檢測(cè)的過(guò)程中有些大的矩形框會(huì)包含小的矩形框,因此要對(duì)這些區(qū)域進(jìn)行合并,將小的矩形框去除。對(duì)于兩個(gè)區(qū)域合并,設(shè)連通區(qū)域1的參數(shù)為β1,χ1,δ1,ε1,連通區(qū)域2的參數(shù)為β2,χ2,δ2,ε2,其中,χ和β分別表示連通區(qū)域最小外接矩形在y軸方向上的最小值和最大值,δ和ε分別表示連通區(qū)域最小外接矩形在x軸方向上的最小值和最大值,那么連通區(qū)域1包含連通區(qū)域2可以根據(jù)式(1)進(jìn)行判定。
通過(guò)以上步驟,對(duì)病害區(qū)域進(jìn)行選定。但是由圖2可以看出,檢測(cè)結(jié)果中仍然存在病害區(qū)和非病害區(qū)的重合與錯(cuò)誤檢測(cè)的情況,把背景模糊區(qū)域以及葉片邊緣區(qū)域誤檢測(cè)為病害區(qū)域。
為了能夠進(jìn)一步區(qū)分病害區(qū)域和非病害區(qū)域,避免檢測(cè)框重疊和誤檢測(cè),本研究在AlexNet[29]網(wǎng)絡(luò)基礎(chǔ)上設(shè)計(jì)了一個(gè)CNN的二元分類(lèi)器,其結(jié)構(gòu)如圖3所示。該網(wǎng)絡(luò)一共有兩個(gè)卷積層、兩個(gè)池化層,最后的全連接層是一個(gè)針對(duì)病害區(qū)和非病害區(qū)的二元分類(lèi)器。首先輸入一張128×128的圖像,然后再用16個(gè)3×3的卷積核提取輸入圖像的特征,進(jìn)而得到一個(gè)32×32×16的卷積層,接著用2×2最大池化的方法降低卷積層的數(shù)據(jù)維度,得到一個(gè)16×16×16像素的池化層,再用32個(gè)5×5的卷積核進(jìn)一步提取更高層的特征,最后通過(guò)2×2最大池化的方法得到8×8×32的輸出。將這些輸出特征全部連接在一個(gè)全連接層,根據(jù)特征向量進(jìn)行權(quán)重計(jì)算,輸出屬于2個(gè)類(lèi)別的概率,進(jìn)而判斷輸入的圖像是否為病害區(qū)域。該步驟實(shí)現(xiàn)了更準(zhǔn)確的病害區(qū)域定位,解決了兩個(gè)病害區(qū)域比較接近,檢測(cè)到的區(qū)域容易交叉的情況。
在訓(xùn)練CNN模型時(shí),本研究采用Adam作為優(yōu)化算法,學(xué)習(xí)率設(shè)定為0.001,學(xué)習(xí)率下降乘數(shù)因子設(shè)定為0.1,損失函數(shù)選擇交叉熵?fù)p失函數(shù)[30]。訓(xùn)練樣本從原始圖像上通過(guò)人工裁剪獲得。研究選取了124張蕎麥病害圖像剪裁出病害和非病害區(qū)域,用來(lái)構(gòu)建裁剪圖像數(shù)據(jù)集。正樣本為病害區(qū)域,如圖4a所示,共792個(gè)區(qū)域裁剪圖像;負(fù)樣本為非病害區(qū)域,如圖4b所示,共1 135個(gè)區(qū)域裁剪圖像。導(dǎo)入數(shù)據(jù)進(jìn)行訓(xùn)練時(shí),首先打亂順序,以4:1的比例進(jìn)行隨機(jī)劃分,分別作為訓(xùn)練集和測(cè)試集,然后對(duì)輸入圖像采用均值分別為0.471、0.452、0.412,方差分別為0.282、0.267、0.231的參數(shù)對(duì)導(dǎo)入圖像進(jìn)行標(biāo)準(zhǔn)化變換。
裁剪樣本的大小和CNN預(yù)測(cè)的平均準(zhǔn)確率變化情況如圖5所示。
試驗(yàn)結(jié)果表明,在訓(xùn)練第20到30輪次的時(shí)候預(yù)測(cè)的平均準(zhǔn)確率趨于穩(wěn)定,通過(guò)比較24×16、24×24、32×24、32×32、48×32幾種不同大小的裁剪樣本,最終選擇將32×32大小的裁剪樣本作為訓(xùn)練數(shù)據(jù),同時(shí)將檢測(cè)算法得到的候選區(qū)域統(tǒng)一調(diào)整為32×32大小的圖像進(jìn)行分類(lèi)。
本研究在500張蕎麥病害圖片中進(jìn)行了測(cè)試,單張葉片上病害斑塊分布最多為16塊,最少為2塊。經(jīng)過(guò)測(cè)試分析發(fā)現(xiàn),完全檢測(cè)到所有斑塊的圖片有135張,檢測(cè)率在90%~100%之間的有117張,而檢測(cè)率50%以下的有134張,表1所示。總體來(lái)看,單張葉片病害區(qū)域檢測(cè)率在70%以上的圖片達(dá)到455張,具有較好的病害區(qū)域檢測(cè)效果。
圖6為通過(guò)CNN分類(lèi)以后得到的病害區(qū)域,可以看檢測(cè)的結(jié)果更加精確,消除了交叉框和對(duì)病害區(qū)域的錯(cuò)誤檢測(cè)。由此可見(jiàn),本研究方法能夠?qū)κw麥的病害區(qū)域和非病害區(qū)域進(jìn)行準(zhǔn)確的分類(lèi)。

表1 蕎麥病害斑塊檢測(cè)統(tǒng)計(jì)Table 1 Detection statistics of buckwheat disease area
蕎麥圖像源于野外采集,成像質(zhì)量不一。對(duì)于低質(zhì)量蕎麥圖像,單純的依靠增加網(wǎng)絡(luò)深度,并不能對(duì)病害特征進(jìn)行有效提取,特別在低質(zhì)量圖像上不同病害區(qū)分度并不明顯。只有通過(guò)提升網(wǎng)絡(luò)寬度去獲取細(xì)節(jié)特征,這引起網(wǎng)絡(luò)層間的參數(shù)量增加。為了避免參數(shù)量較大,采用了2層Inception結(jié)構(gòu)。第一層提取病害輪廓特征,特征表示的維度是淺層信息表示,它丟掉了一些重要的因素,如相關(guān)性結(jié)構(gòu);第二層獲得較細(xì)節(jié)特征,這樣每層的參數(shù)量相對(duì)較少,避免了訓(xùn)練過(guò)程中的梯度消失。
Inception是一種局部拓?fù)浣Y(jié)構(gòu)的網(wǎng)絡(luò),對(duì)輸入圖像并行地執(zhí)行多個(gè)卷積運(yùn)算或池化操作,并將所有輸出結(jié)果拼接為一個(gè)非常深的特征圖。因?yàn)?×1、3×3或5×5等不同的卷積運(yùn)算與池化操作可以獲得蕎麥病害圖像的不同信息,并行處理這些運(yùn)算,并結(jié)合所有結(jié)果將獲得更好的病害圖像表征。
本研究采用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖7所示,該網(wǎng)絡(luò)在傳統(tǒng)結(jié)構(gòu)的基礎(chǔ)上加入了兩個(gè)inception,其具體處理流程為:1)首先,網(wǎng)絡(luò)的輸入是大小為64×64的蕎麥病害的圖像,接著用136個(gè)9×9大小的卷積核進(jìn)行卷積操作,得到136個(gè)56×56的特征圖。2)將特征圖送入inception1結(jié)構(gòu)中,網(wǎng)絡(luò)中所有inception結(jié)構(gòu)均采用相同的卷積操作,即不改變特征圖的大小。接下來(lái)的所有池化層中池化窗口的大小為2×2,因此經(jīng)過(guò)池化后特征圖的大小變?yōu)?8×28。3)采用200個(gè)5×5的卷積核得到200個(gè)24×24的特征圖,將這些特征圖送入inception2結(jié)構(gòu)中后,經(jīng)過(guò)池化層后再用264個(gè)5×5的卷積核得到264個(gè)8×8的特征圖。4)經(jīng)過(guò)池化層后進(jìn)入最后一層卷積層,卷積核個(gè)數(shù)為520,大小為3×3,因此會(huì)得到520個(gè)2×2的特征圖。最后是全連接層和分類(lèi)輸出層。
在網(wǎng)絡(luò)的前兩層卷積層中,分別采用了9×9和5×5的感受野,為了在更小的感受野中提取更多不同尺度的特征信息,同時(shí)擴(kuò)大網(wǎng)絡(luò)的寬度和深度,因此在這兩層卷積層中分別加入了inception1和inception2結(jié)構(gòu),它們的結(jié)構(gòu)如圖8所示。在inception1結(jié)構(gòu)中,分別使用了1×1、3×3、1×5、5×1,4種不同尺度的卷積核進(jìn)行多通道的特征提取,最后將通道進(jìn)行融合。最上層的1×1卷積可以有效降低輸入特征圖的通道數(shù),減小網(wǎng)絡(luò)的計(jì)算成本。最底層的1×1卷積是為了將輸入特征圖的通道數(shù)還原,保持輸入輸出特征圖通道數(shù)的一致性。在inception2結(jié)構(gòu)中,輸入的特征圖變得更小,因此將inception1中的1×5和5×1卷積分別替換成了1×3和3×1卷積。在第2個(gè)卷積層中,輸入特征圖的數(shù)量比第一層多,因此將結(jié)構(gòu)內(nèi)的通道數(shù)由30增加到40。
為了評(píng)估inception模塊的性能,從蕎麥斑枯病、蕎麥菌核病、蕎麥立枯病、蕎麥輪紋病、蕎麥霜霉病、蕎麥褐斑病、蕎麥病毒病、蕎麥白霉病的8類(lèi)樣本中選出1 200張樣本,同時(shí)加入800張沒(méi)有病害的蕎麥圖像,將訓(xùn)練集和測(cè)試集按照4:1劃分,對(duì)inception1和inception2進(jìn)行了控制變量的試驗(yàn)對(duì)比,同時(shí),對(duì)卷積層層數(shù)、卷積核個(gè)數(shù)、學(xué)習(xí)速率和批數(shù)量大小(Batch-size)四個(gè)主要參數(shù)進(jìn)行了調(diào)試,確定最佳參數(shù):4個(gè)卷積層,卷積核為:(136,200,264,520),學(xué)習(xí)速率:0.02,Batch-size:100。試驗(yàn)結(jié)果如表2所示。
通過(guò)表2可以發(fā)現(xiàn),在分別加入了inception1和inception2結(jié)構(gòu)以后,在相同的迭代次數(shù)內(nèi),網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率有所提升,因此證明了本研究所提出的inception結(jié)構(gòu)的有效性。

表2 Inception模塊性能評(píng)估Table 2 Performance evaluation of Inception Module
蕎麥病害圖像數(shù)據(jù)來(lái)源于田間采集,受采樣環(huán)境的限制,存在噪聲干擾。因此,為了使卷積運(yùn)算后,特征圖中只有和卷積核具有相似特征的位置取得較高的激活值,同時(shí)減小特征之間的差異性,減少想引入卷積層的運(yùn)算中,把輸入的特征圖和卷積核看作兩個(gè)向量,計(jì)算它們之間的相關(guān)性。
在傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)中,假定第l層卷積層的第j個(gè)特征圖的輸出值為:
式中g(shù)(·)表示激活函數(shù),M表示輸入特征圖的集合表示第i個(gè)特征圖和第j個(gè)特征圖之間采用的卷積核向量,為偏置。
余弦相似度是衡量?jī)蓚€(gè)向量之間相似程度的指標(biāo),它計(jì)算兩個(gè)向量夾角的余弦值,夾角越小,意味著兩個(gè)向量之間的相關(guān)性越高,計(jì)算出的余弦值也越大,其取值范圍是[-1,1]。以下是向量X和向量Y之間余弦相似度的計(jì)算方式,式中n表示向量的維數(shù):
式中r×z表示卷積核的大小,Wij和Mij分別表示卷積核與特征圖中的系數(shù)。那么,相似性度量函數(shù)可以表示為
因此,第l層基于余弦相似度運(yùn)算的卷積層的輸出值為
本研究將基于傳統(tǒng)卷積、歐幾里得距離卷積、切比雪夫距離卷積、曼哈頓距離卷積、余弦相似度卷積方式的神經(jīng)網(wǎng)絡(luò)的識(shí)別性能進(jìn)行對(duì)比分析。選取蕎麥斑枯病、蕎麥菌核病、蕎麥立枯病、蕎麥輪紋病、蕎麥霜霉病,蕎麥褐斑病、蕎麥病毒病、蕎麥白霉病的8類(lèi)圖像數(shù)據(jù)集中共計(jì)1 200個(gè)樣本,同時(shí)加入800張沒(méi)有病害的蕎麥圖像樣本,將訓(xùn)練集與測(cè)試集按照4比1的比例劃分,按照?qǐng)D7的網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)行病害和無(wú)病害識(shí)別。對(duì)幾種不同卷積方式的網(wǎng)絡(luò)在卷積核為:(136,200,264,520),學(xué)習(xí)速率:0.02,Batch-size:100的參數(shù)條件下分別就傳統(tǒng)卷積、歐幾里得距離卷積、切比雪夫距離卷積、曼哈頓距離卷積余弦相似度卷積的識(shí)別性能進(jìn)行了5次重復(fù)試驗(yàn),結(jié)果如表3所示。
從表3可以看出,采用余弦相似度運(yùn)算的卷積方式比傳統(tǒng)的卷積方式所取得的識(shí)別準(zhǔn)確率有所提高,平均準(zhǔn)確率提升了4.14%。而基于其他相似度函數(shù)卷積方式的網(wǎng)絡(luò)反而比傳統(tǒng)卷積的網(wǎng)絡(luò)得到的準(zhǔn)確率更低,這說(shuō)明其他相似度函數(shù)的計(jì)算方式放大了樣本中特征之間的差異性,使得樣本中的噪聲對(duì)特征提取的過(guò)程產(chǎn)生了較大的干擾。而余弦相似度會(huì)將輸出結(jié)果限定在-1到1之間,可以最大限度的減小噪聲對(duì)特征提取造成的影響。

表3 不同卷積方式下的識(shí)別準(zhǔn)確率Table 3 Recognition accuracy under different convolution modes%
為了進(jìn)一步分析余弦相似度卷積網(wǎng)絡(luò)性能,以第3次試驗(yàn)為例,給出了基于傳統(tǒng)卷積方式網(wǎng)絡(luò)和余弦相似度卷積網(wǎng)絡(luò)的損失函數(shù)和準(zhǔn)確率變化曲線如圖9所示。
通過(guò)圖9可以看出,傳統(tǒng)卷積的網(wǎng)絡(luò)大約在迭代5000次以后損失值逐漸收斂,而基于余弦相似度的卷積在3 000次以后就已經(jīng)收斂;對(duì)于準(zhǔn)確率而言,傳統(tǒng)卷積的網(wǎng)絡(luò)在迭代4 000次后趨于穩(wěn)定,而基于余弦相似度的卷積在2 000次以后達(dá)到穩(wěn)定狀態(tài)。因此,基于余弦相似度卷積的網(wǎng)絡(luò)收斂速度更快,更容易找到全局最優(yōu)解。主要是因?yàn)檫@種卷積方式能更好的評(píng)估卷積核與輸入特征圖對(duì)應(yīng)特征的關(guān)聯(lián)程度,使得與卷積核特征相似的位置取得更高的激活值,同時(shí)避免噪聲對(duì)特征提取的影響。受采樣的時(shí)間和環(huán)境的影響,在蕎麥病害的圖像中,有很多樣本都存在光照不均、陰暗變化明顯的情況,這種情況導(dǎo)致圖像的灰度值變化明顯,因此最終傳統(tǒng)卷積運(yùn)算所取得的激活值也會(huì)發(fā)生突變,圖10為傳統(tǒng)卷積方式和基于余弦相似度卷積方式的輸出對(duì)比。
假設(shè)圖10中的數(shù)值代表圖像的像素灰度值,它們?nèi)≈档牟煌饕怯捎诠庹詹痪鶎?dǎo)致的,將圖中的卷積核輸入特征圖分別進(jìn)行傳統(tǒng)卷積運(yùn)算和基于余弦相似度的卷積運(yùn)算。可以看出,傳統(tǒng)卷積方式得到的輸出值大小有著明顯的差異,其特征提取的能力也相應(yīng)被削弱。而基于余弦相似度卷積的輸出值大小相對(duì)均勻,這說(shuō)明這種方式能更好的適應(yīng)光照不均的干擾,更加有利于特征的提取。
圖11展示了不同光照環(huán)境下蕎麥葉片樣本采用余弦相似度的卷積運(yùn)算后輸出特征圖。從圖中可以看出,在第一層卷積特征map上,除了樣本輪廓特征,還存在一些由于光照不均引起的明顯的分界線;第二層卷積后,特征map對(duì)光照不均的表現(xiàn)較為弱化;在第三卷積層,特征map基本消除了光照影響;第四卷積層,第五卷積層,所有特征Map趨于僅保留了蕎麥葉片的高層特征。因此,基于余弦相似度的卷積得到的輸出特征圖色調(diào)相對(duì)均衡,說(shuō)明這種方式能夠減少光照不均的影響,有更佳的特征提取能力。
建立了一個(gè)蕎麥病害數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)包含了蕎麥斑枯病、菌核病、立枯病、輪紋病、霜霉病、褐斑病、病毒病、白霉病等8種蕎麥病害圖像,圖像來(lái)源于重慶市蕎麥產(chǎn)業(yè)技術(shù)體系團(tuán)隊(duì)的田間采集,經(jīng)過(guò)蕎麥專(zhuān)家篩選后,每種病害圖像500張,無(wú)病害(正常)的圖像1 000張,共計(jì)5 000張。每種病害選取400張作為訓(xùn)練集,100張作為測(cè)試集,無(wú)病害圖像選取800張作為訓(xùn)練集,200張作為測(cè)試集;用五折交叉驗(yàn)證的方式進(jìn)行。采用3.1節(jié)的inception結(jié)構(gòu),余弦相似度卷積的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別,并對(duì)最終的識(shí)別準(zhǔn)確率進(jìn)行了比較。使用召回率(Recall,R)、精確率(Precision,P)、精確率和召回率加權(quán)調(diào)和平均值(F1),作為指標(biāo)來(lái)評(píng)估識(shí)別的效果。召回率是分類(lèi)器找到所有病害樣本的能力;精確率是期望為病害的樣本中的TP與TP加FN總數(shù)的比率。
其中TP(True Positive)指正確分類(lèi)的正樣本數(shù),表示正確判斷病害的樣本數(shù);FP(False Positive)指被錯(cuò)誤標(biāo)記為正樣本的負(fù)樣本數(shù),表示判斷為病害的正常樣本數(shù);FN(False Negative)指被錯(cuò)誤標(biāo)記為負(fù)樣本的正樣本數(shù),表示判斷為正常樣本的病害樣本數(shù);
試驗(yàn)結(jié)果如表4所示。在對(duì)比主流的CNN模型的同時(shí),為了表明所提方法的性能,還引入了目前研究比較深入的人臉識(shí)別模型(DeepFace、VGGFace、FaceNet,DeepID2+、WSTFusion、SphereFace、RangeLoss、Hi ReST-9+)[31-33]在蕎麥病害數(shù)據(jù)集中進(jìn)行測(cè)試,結(jié)果表明采用本研究的方法,精確率、召回率、F1分別達(dá)到了96.82%、95.62%、96.71%,比主流的AlexNet、VGG、GoogleNet、ResNet、LeNet框架的最佳性能分別高2.59%、2.89%、2.13%。且本研究提出的識(shí)別框架FPS值為5.19,可以看出其處理速度也處于較高水平。

表4 蕎麥病害識(shí)別的結(jié)果Table 4 Results of buckwheat disease recognition
為了進(jìn)一步研究對(duì)蕎麥葉片病害區(qū)域進(jìn)行檢測(cè)后,模型對(duì)蕎麥病害識(shí)別效果的影響,這里對(duì)是否執(zhí)行區(qū)域檢測(cè)進(jìn)行了測(cè)試。在加入第2節(jié)的病害區(qū)域檢測(cè)的方法后,識(shí)別效果得到明顯的提升,如表5所示。采用了病害區(qū)域檢測(cè)的方法后,本研究識(shí)別方法的精確率,召回率和F1分別達(dá)到了97.54%,96.38%,97.82%,比使用前提高了0.72%,1.76%,1.11%。結(jié)合表4分析發(fā)現(xiàn)加入病害區(qū)域檢測(cè)后,各個(gè)識(shí)別模型平均精確率、召回率和F1分別提高了1.45%、1.67%、1.46%。同時(shí)發(fā)現(xiàn)區(qū)域檢測(cè)引入了額外的計(jì)算開(kāi)銷(xiāo),因此處理速度略有下降,所有模型的PFS值平均下降的0.46,但對(duì)整體性能影響不大。

表5 加入?yún)^(qū)域檢測(cè)后蕎麥病害的識(shí)別結(jié)果Table 5 Recognition results of buckwheat disease after regional detection
試驗(yàn)還針對(duì)蕎麥斑枯病、蕎麥菌核病、蕎麥立枯病、蕎麥輪紋病、蕎麥霜霉病、蕎麥褐斑病、蕎麥病毒病、蕎麥白霉病進(jìn)行分類(lèi)識(shí)別。表6展示的是在病害區(qū)域檢測(cè)后,用本研究所提的識(shí)別框架進(jìn)行具體病害辨別的結(jié)果。可以看出針對(duì)具體的病害識(shí)別效果有明顯的下降,對(duì)于具體病害的識(shí)別精確率,召回率和F1均值為84.86%,85.78%,85.40%。特別是對(duì)蕎麥霜霉病的識(shí)別性能較差。這是由于僅僅判別蕎麥?zhǔn)欠翊嬖诓『@是一個(gè)二分類(lèi)問(wèn)題,因此分類(lèi)效果較好,而識(shí)別的具體的病害類(lèi)型,分類(lèi)的目標(biāo)增多,識(shí)別難度增加。由于拍照設(shè)備的性能不同,拍照環(huán)境不同,成像質(zhì)量差別較大;同時(shí)識(shí)別的精度很大程度依賴(lài)于模型的訓(xùn)練和樣本的數(shù)量,本研究所采用的樣本數(shù)量源于田間采集,受條件限制,對(duì)每種病害的樣本僅500張,模型訓(xùn)練不充分,識(shí)別效果受到較大影響。但可以看出蕎麥斑枯病、輪紋病識(shí)別的精確率,召回率和F1仍然達(dá)到90%以上。這是因?yàn)檫@兩種病害在蕎麥葉片上的邊緣輪廓比較清晰,用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取時(shí)能準(zhǔn)確地得到病害的特征圖,因此在進(jìn)行分類(lèi)時(shí)表現(xiàn)出較高的精度。雖然不同類(lèi)的識(shí)別精度是不同的。從整體上看,斑類(lèi)病的識(shí)別效果好于霉菌類(lèi)病,這是因?yàn)榘哳?lèi)病在蕎麥葉片上形成的病害區(qū)域特征比較明顯,辨識(shí)度較高,能準(zhǔn)確提取特征,而霉菌類(lèi)病在蕎麥葉片上分布比較分散,邊緣比較模糊,算法對(duì)特征的提取能力較弱。

表6 各種蕎麥病害的識(shí)別效果Table 6 Recognition effect of buckwheat diseases
本研究對(duì)蕎麥病害的自動(dòng)識(shí)別進(jìn)行了分析,利用卷積神經(jīng)網(wǎng)絡(luò)的多層特征提取方式,對(duì)蕎麥病害的特征進(jìn)行抽取,然后根據(jù)特征進(jìn)行分類(lèi),最終實(shí)現(xiàn)對(duì)蕎麥病害的判別。為了提升對(duì)蕎麥病害的識(shí)別精度,進(jìn)行了病害區(qū)域的檢測(cè),把檢測(cè)的結(jié)果輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和識(shí)別;同時(shí)在傳統(tǒng)結(jié)構(gòu)的基礎(chǔ)上加入了inception結(jié)構(gòu),進(jìn)一步提升精度。為了降低采樣過(guò)程中光照的影響,用基于余弦相似度的卷積代替?zhèn)鹘y(tǒng)的卷積,使得對(duì)光照不均情況的樣本也能夠進(jìn)行較好的特征提取。通過(guò)試驗(yàn)結(jié)果分析,本研究提出的inception結(jié)合余弦相似度的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)在對(duì)蕎麥?zhǔn)欠窕疾∽R(shí)別的精確率,召回率以及精確率和召回率加權(quán)調(diào)和平均值分別達(dá)到了97.54%,96.38%,97.82%;對(duì)于具體病害的識(shí)別其均值分別為84.86%,85.78%,85.40%,高于主流的VGG、GoogleNet、ResNet、DeepID等識(shí)別框架。
本研究進(jìn)行了病害區(qū)域檢測(cè),使得處理時(shí)間有所增加,但對(duì)總體性能影響不大。然而部分病變區(qū)域與成像背景區(qū)分度較低,導(dǎo)致識(shí)別精度不高,需要進(jìn)一步改進(jìn)識(shí)別框架,針對(duì)具體病害提升識(shí)別精度。